1 模式识别
所谓的模式识别是指自动模式识别或计算机模式识别。在模式识别问题中,人们必须首先通过测量来获得数据。例如,为了应用模式识别方法识别特体表面的特征,必须先测量物体表面上多点的反射光。为了模式识别问题获得数据,不但可能通过物理测量的方式,还可有其它的方式,如经济数据。从广义上讲,测量是把现实世界的情况映射到参数域,依据这种定义,上述后一种方式获得数据也是通过测量获得的,因此可以说模式识别是从某种测量开始的,而测量一般来说又是以传感器开始的。图1是模式识别的模型。在模式识别中,有时可用常规或通用的传感器,例如,语音识别中测量声压的麦克风或反射光测量中用的光传感器等。然而,在很多情况下,必须改进现有传感器或开发新的传感器才能产生适当的模式识别信号,从这种意义上讲,模式识别刺激了传感器的开发并因此推动了仪器测量的发展。
测量的目的可以是确定某个变量的数值以验证某个物理假设,如石油综合测井中的油气显示。测量数据还可被处理并与其它数据结合和比较,以便获得一个特定的结论。这种结论也可以是简单的二元决策(是或否),如工业的质量控制或医学检查。这种结论可以划分成很多类,这种多类决策有很多,如医学诊断(哪种病?)、粒子物理(产生这种轨迹的粒子是哪种?)或石油测井(哪个深度有石油生成?)等。在这些例子中,测量的目的不仅是获得变量的具体数值,而是生成对变量有意义的解释。在较为复杂的情况下,需要使用模式识别的方法才能使测量获得这种解释,因此,模式识别是测量中的关键步骤之一。模式识别与仪器测量关系密切,模式识别依靠测量又是测量过程中的一部分。在模式识别中,除了分类外,还可给出数值估计或者把类的成员的数值或概率加到分类结果中,这更说明模式识别与仪器测量是紧密相关的。仪器测量和模式识别通常看成是两上不贩研究领域,每个领域都有自己的方法、传统、杂志和学术会议,然而在很多情况下,跨领域的方法会很有用,应加以鼓励,如某种模式识别算法需要与之匹配的测量(如合适的传感器等),这时就需要这两个领域的专家的密切配合才能获得成功。
2 模式识别中模式的可变性
通过对模式识别的问题的分析,可以把包含一至多个模式的复杂的输入数据通过系统的处理在系统的输出端映射成相应模式的类,因此输出结果相当简单。某特定模式也未必只映射成一类,可用模糊方法映射成多个类,每个类有自己特定的数值或概率。另外,一个类可以代表多个完全不同的输入情况,这是多对一的映射,可以举个明显的例子,字母A的书写方法是各种各样的,但都属于同一类,即字母“A”。属于同一类的各个模式的可变性的起源和内容是不相同的,存在于“文化”模式(如文字、汽车、房屋等)中的可变性与人类的习惯有关。“自然”模式是与生物有关的实体(如染色体、血细胞、心电图等),它们的可变性由自然界决定的。不管是自然模式还是文化模式,实验环境和方法及传感器的不同特性又为它们产生更多的可能性。人们希望测量是使这种附加的可变性尽可能小。
应注意到,类的定义通常由人的意愿或传统所左右,这就影响了哪些不同类型的输入应该结合在一起形成一个特定的类。类的定义还与具体的分类目标有关,例如,人们可能对一个景象中的动物或交通工具的识别感兴趣,等等。选择了形成一个类(具有一个特定模式)的输入集以后,这个集合就构成了所谓的“学习集”。模式识别系统必须既能识别这个学习集的一个样本还能识别所有等效的样本。与上述识别过程相反的是一种无监督模式识别问题,即对于给定的类没有学习集,因此这样的系统必须能借助“簇分析”的技术教会自己,以便在输入的数据中能识别出目标较为复杂的场合,不过这里说的复杂的场合与简单的场合之间仅存在一个“模糊”的边界,是很难明确区分的。
3 模式识别与标定测量
标定测量常常被认为是最基本的没量方式,在有关测量的教材中是在开始时就介绍的。一般来说,这是把未知的实体与参照实体的标准集比较。颜色的比较是一个传统的例子,如把下一年的小汽车的颜色作为标准集,未知颜色就可获得标准参照集中相同的(或几乎相同)颜色的名称。这个过程看起来确实很简单,只需与标准参照集比较,找出相同(或几乎相同)的实体,这种比较是无序的并且不必下具体数值映射。
可以把标定测量过程描述成一个分类过程,即把输入数据映射到参照集的某个上。如果在参照集中找不到等价的实体,那么这种映射就被放弃。这种标定测量与模式识别的相似性是显然的。不过标定测量中,比较过程是由人完成的,在模式识别中,这种比较分类过程是借助测量和很复杂的方法来完成的。并且在模式识别中,一个定义好的参照实体的标准集是不存在的,而需要使用学习集才能识别所有的类或模式。在前面描述标定时用了“几乎相同”的概念,这与模式识别中的可变性的概念是相似的。
4 模式识别方法
由于在一维、二维、三维甚至多维空间中要识别的模式的种类如此繁多,又由于可能存大很大的可变性,因此存在众多的模式识别的方法,包括一些特别的专用方法,这是不足为奇的。下面介绍两种常用的方法,两种方法都需要先确定“特征”,但关于特征性质的描述,这两种方法又完全不同。通过处理从传感器输入的数据,并尽可能地压缩数据,可以提取特征。人们希望特征的值能够反映模式的特征,依靠特征来进行数据压缩,在几乎所有的模式识别的方法是必须的,这是因为输入的传感器的数据通常很复杂且含有很多不相关的冗余数据。在模式识别的问题中常用到二维图像,假如一格含有512×512个象素,用8个比特表示每个象素,这样就是2百万个比特还多,因此必须进行数据压缩,这需要至少两步完成,即先生成特征数据,再根据特征数据通过实施决策过程找到测量数据中包含的类。
高质量的特征数据的选择要求有关于模式的大量的先验知识,如果没有这种先验知识,就需要采用尝试的方法,与统计等方法结合使用,这需要一个很大的学习集。通常模式识别方法有以下两种: 1 统计方法 它利用了作为特征的一些参数的数值,如交通工具的高度和长度、曲线上特征点的坐标、染色体的大小和位置。这些值可以通过直接测量获得,但常常需要进行大量的数据处理。如果选到了K个特征值,那么在K维维持特征空间中,要用K个值来表示一个点。模式的可变性引起了每个模式的学习集的样点的分散,这就导致每个模式拥有一个样点簇。好的特征和完全不同的模式使每个模式的样点簇分散减小,使不同模式的样点簇分散减小,并且使不同模式的样点簇之间的距离相对增大。如果样点簇间不叠加,那么就可构建判别平面,完全把样点簇分开。如果示知模式的特征空间的样点靠近样点簇,就可以做出正确的分类决策。不过,通常样点特征值扩散很大并且样点簇间的距离很小,样点簇常常是叠加的。在这种情况下,需要寻找决策算法来构建某种最优的判别平面,这需要有关于样点簇的概率密度的统计知识。 2语言符号法 这种方法是基于把模式分解成基本部分或元素,例如拼在几何图形中的直线和曲线段。元素及其位置和它们间的关系有时可用一种语法来表达,这与自然语言中的语法相似。人们为模式识别已经提出了很多不同种类的语法,包括随机过程语法,这种语法考虑了模式的可变性。在模式识别过程中,先确定元素、它们的位置和关系,然后通过决策即语法分解确定哪种模式识别语法可以通过先验知识获得,也可以从学习集中获得。根据语法的类型和现有的先验知识,人们已经开发出了很多决策算法。 5 模式识别问题求解中的传感器和处理器 由于大部分模式识别算法都采用数字法表示,因此在模拟传感器后总是跟着模/数转换器。在图象处理中,对于具有很多象素的图象,要求采用快速模/数转换器,并且要配备专用存储器和处理器。除了光学图象外,还有很多其它种类的图象,如通过核测量、X射线和超声波、核磁共振或石油测井的各种成象。
通过对这些图象的处理可以获得光学图象不能提供的不透光实体的内部结构。 模式识别问题中应用的某些光扫描器与传统的扫描器有着密切的联系,如电视、光阵列扫描器等。飞机或卫星遥感中的扫描器生成的数据的波长极窄,可以依靠这些数据识别地质、农业、地理或石油等方面的模式,通过实体视觉方法可以从一个二维图象中获得三维的信息,或通过层析成象的方法从多个以不同方向透射产生的图象中获得这样的三维的信息。对于处理有限个三维目标的机器人系统,使用与某轴平行的平面光可以在目标中产生特别的光照效果,根据目标表面反射的激光束的传播时间也可获得关于第三维的数据信息。
传感器获得测量数据的同时也带来失真,因此在进行模式识别的处理之前需要通过预处理恢复测量数据。预处理方法包括反向滤波、线形最小均方滤波和保边沿滤波等。为了使特征提取更容易,也可故意在图象中加入失真,即图象的增强,如侧面高频滤波可以增强图象的边缘,这点对于形状识别很重要。对于这样的预处理及特征提取,常规的计算机常常速度太慢,因此有些传感器常需配备专用的处理器或预处理器,并采用专用软件、更快的硬件及并行处理等。智能传感器和处理器(预处理器)的结合为实用系统构建快速经济的组件提供了广阔的前景。
传感器的发展,(预)处理、特征提取和决策算法的发展使人们可以期望看到模式识别和电子仪器在实际中的应用不断地增长。
所谓的模式识别是指自动模式识别或计算机模式识别。在模式识别问题中,人们必须首先通过测量来获得数据。例如,为了应用模式识别方法识别特体表面的特征,必须先测量物体表面上多点的反射光。为了模式识别问题获得数据,不但可能通过物理测量的方式,还可有其它的方式,如经济数据。从广义上讲,测量是把现实世界的情况映射到参数域,依据这种定义,上述后一种方式获得数据也是通过测量获得的,因此可以说模式识别是从某种测量开始的,而测量一般来说又是以传感器开始的。图1是模式识别的模型。在模式识别中,有时可用常规或通用的传感器,例如,语音识别中测量声压的麦克风或反射光测量中用的光传感器等。然而,在很多情况下,必须改进现有传感器或开发新的传感器才能产生适当的模式识别信号,从这种意义上讲,模式识别刺激了传感器的开发并因此推动了仪器测量的发展。
测量的目的可以是确定某个变量的数值以验证某个物理假设,如石油综合测井中的油气显示。测量数据还可被处理并与其它数据结合和比较,以便获得一个特定的结论。这种结论也可以是简单的二元决策(是或否),如工业的质量控制或医学检查。这种结论可以划分成很多类,这种多类决策有很多,如医学诊断(哪种病?)、粒子物理(产生这种轨迹的粒子是哪种?)或石油测井(哪个深度有石油生成?)等。在这些例子中,测量的目的不仅是获得变量的具体数值,而是生成对变量有意义的解释。在较为复杂的情况下,需要使用模式识别的方法才能使测量获得这种解释,因此,模式识别是测量中的关键步骤之一。模式识别与仪器测量关系密切,模式识别依靠测量又是测量过程中的一部分。在模式识别中,除了分类外,还可给出数值估计或者把类的成员的数值或概率加到分类结果中,这更说明模式识别与仪器测量是紧密相关的。仪器测量和模式识别通常看成是两上不贩研究领域,每个领域都有自己的方法、传统、杂志和学术会议,然而在很多情况下,跨领域的方法会很有用,应加以鼓励,如某种模式识别算法需要与之匹配的测量(如合适的传感器等),这时就需要这两个领域的专家的密切配合才能获得成功。
2 模式识别中模式的可变性
通过对模式识别的问题的分析,可以把包含一至多个模式的复杂的输入数据通过系统的处理在系统的输出端映射成相应模式的类,因此输出结果相当简单。某特定模式也未必只映射成一类,可用模糊方法映射成多个类,每个类有自己特定的数值或概率。另外,一个类可以代表多个完全不同的输入情况,这是多对一的映射,可以举个明显的例子,字母A的书写方法是各种各样的,但都属于同一类,即字母“A”。属于同一类的各个模式的可变性的起源和内容是不相同的,存在于“文化”模式(如文字、汽车、房屋等)中的可变性与人类的习惯有关。“自然”模式是与生物有关的实体(如染色体、血细胞、心电图等),它们的可变性由自然界决定的。不管是自然模式还是文化模式,实验环境和方法及传感器的不同特性又为它们产生更多的可能性。人们希望测量是使这种附加的可变性尽可能小。
应注意到,类的定义通常由人的意愿或传统所左右,这就影响了哪些不同类型的输入应该结合在一起形成一个特定的类。类的定义还与具体的分类目标有关,例如,人们可能对一个景象中的动物或交通工具的识别感兴趣,等等。选择了形成一个类(具有一个特定模式)的输入集以后,这个集合就构成了所谓的“学习集”。模式识别系统必须既能识别这个学习集的一个样本还能识别所有等效的样本。与上述识别过程相反的是一种无监督模式识别问题,即对于给定的类没有学习集,因此这样的系统必须能借助“簇分析”的技术教会自己,以便在输入的数据中能识别出目标较为复杂的场合,不过这里说的复杂的场合与简单的场合之间仅存在一个“模糊”的边界,是很难明确区分的。
3 模式识别与标定测量
标定测量常常被认为是最基本的没量方式,在有关测量的教材中是在开始时就介绍的。一般来说,这是把未知的实体与参照实体的标准集比较。颜色的比较是一个传统的例子,如把下一年的小汽车的颜色作为标准集,未知颜色就可获得标准参照集中相同的(或几乎相同)颜色的名称。这个过程看起来确实很简单,只需与标准参照集比较,找出相同(或几乎相同)的实体,这种比较是无序的并且不必下具体数值映射。
可以把标定测量过程描述成一个分类过程,即把输入数据映射到参照集的某个上。如果在参照集中找不到等价的实体,那么这种映射就被放弃。这种标定测量与模式识别的相似性是显然的。不过标定测量中,比较过程是由人完成的,在模式识别中,这种比较分类过程是借助测量和很复杂的方法来完成的。并且在模式识别中,一个定义好的参照实体的标准集是不存在的,而需要使用学习集才能识别所有的类或模式。在前面描述标定时用了“几乎相同”的概念,这与模式识别中的可变性的概念是相似的。
4 模式识别方法
由于在一维、二维、三维甚至多维空间中要识别的模式的种类如此繁多,又由于可能存大很大的可变性,因此存在众多的模式识别的方法,包括一些特别的专用方法,这是不足为奇的。下面介绍两种常用的方法,两种方法都需要先确定“特征”,但关于特征性质的描述,这两种方法又完全不同。通过处理从传感器输入的数据,并尽可能地压缩数据,可以提取特征。人们希望特征的值能够反映模式的特征,依靠特征来进行数据压缩,在几乎所有的模式识别的方法是必须的,这是因为输入的传感器的数据通常很复杂且含有很多不相关的冗余数据。在模式识别的问题中常用到二维图像,假如一格含有512×512个象素,用8个比特表示每个象素,这样就是2百万个比特还多,因此必须进行数据压缩,这需要至少两步完成,即先生成特征数据,再根据特征数据通过实施决策过程找到测量数据中包含的类。
高质量的特征数据的选择要求有关于模式的大量的先验知识,如果没有这种先验知识,就需要采用尝试的方法,与统计等方法结合使用,这需要一个很大的学习集。通常模式识别方法有以下两种: 1 统计方法 它利用了作为特征的一些参数的数值,如交通工具的高度和长度、曲线上特征点的坐标、染色体的大小和位置。这些值可以通过直接测量获得,但常常需要进行大量的数据处理。如果选到了K个特征值,那么在K维维持特征空间中,要用K个值来表示一个点。模式的可变性引起了每个模式的学习集的样点的分散,这就导致每个模式拥有一个样点簇。好的特征和完全不同的模式使每个模式的样点簇分散减小,使不同模式的样点簇分散减小,并且使不同模式的样点簇之间的距离相对增大。如果样点簇间不叠加,那么就可构建判别平面,完全把样点簇分开。如果示知模式的特征空间的样点靠近样点簇,就可以做出正确的分类决策。不过,通常样点特征值扩散很大并且样点簇间的距离很小,样点簇常常是叠加的。在这种情况下,需要寻找决策算法来构建某种最优的判别平面,这需要有关于样点簇的概率密度的统计知识。 2语言符号法 这种方法是基于把模式分解成基本部分或元素,例如拼在几何图形中的直线和曲线段。元素及其位置和它们间的关系有时可用一种语法来表达,这与自然语言中的语法相似。人们为模式识别已经提出了很多不同种类的语法,包括随机过程语法,这种语法考虑了模式的可变性。在模式识别过程中,先确定元素、它们的位置和关系,然后通过决策即语法分解确定哪种模式识别语法可以通过先验知识获得,也可以从学习集中获得。根据语法的类型和现有的先验知识,人们已经开发出了很多决策算法。 5 模式识别问题求解中的传感器和处理器 由于大部分模式识别算法都采用数字法表示,因此在模拟传感器后总是跟着模/数转换器。在图象处理中,对于具有很多象素的图象,要求采用快速模/数转换器,并且要配备专用存储器和处理器。除了光学图象外,还有很多其它种类的图象,如通过核测量、X射线和超声波、核磁共振或石油测井的各种成象。
通过对这些图象的处理可以获得光学图象不能提供的不透光实体的内部结构。 模式识别问题中应用的某些光扫描器与传统的扫描器有着密切的联系,如电视、光阵列扫描器等。飞机或卫星遥感中的扫描器生成的数据的波长极窄,可以依靠这些数据识别地质、农业、地理或石油等方面的模式,通过实体视觉方法可以从一个二维图象中获得三维的信息,或通过层析成象的方法从多个以不同方向透射产生的图象中获得这样的三维的信息。对于处理有限个三维目标的机器人系统,使用与某轴平行的平面光可以在目标中产生特别的光照效果,根据目标表面反射的激光束的传播时间也可获得关于第三维的数据信息。
传感器获得测量数据的同时也带来失真,因此在进行模式识别的处理之前需要通过预处理恢复测量数据。预处理方法包括反向滤波、线形最小均方滤波和保边沿滤波等。为了使特征提取更容易,也可故意在图象中加入失真,即图象的增强,如侧面高频滤波可以增强图象的边缘,这点对于形状识别很重要。对于这样的预处理及特征提取,常规的计算机常常速度太慢,因此有些传感器常需配备专用的处理器或预处理器,并采用专用软件、更快的硬件及并行处理等。智能传感器和处理器(预处理器)的结合为实用系统构建快速经济的组件提供了广阔的前景。
传感器的发展,(预)处理、特征提取和决策算法的发展使人们可以期望看到模式识别和电子仪器在实际中的应用不断地增长。