神经网络和模糊逻辑可以解决传统系统无可奈何的问题。这里,我们将要介绍它们是如何工作,并且使诸如高速图形处理这类的应用受益。
当控制领域的工程师们忙于从传统的电机和模拟控制转向融合了计算分析和决策算法的数字机电一体化控制系统的时候,全新的计算机技术出现了,它将引起更多的改变。神经网络和模糊逻辑已经开始应用,而且也许很快就会给机器控制系统的设计的变成带来革命。
传统的计算机采用冯·诺依曼架构,是基于串行的处理以及执行清晰的指令。人工神经网络(ANNs),则与之不同,采用非冯·诺依曼的架构,由组合在庞大并行系统内部的非常简单的单元构成,可以执行那些处理外界数据的认知模式所产生的不太清晰的指令。
类似的,模糊逻辑也颠覆了传统的模式。信息不再要求被定义的精确可以量化和测量(比如,温度是23℃),模糊信息代表了对于那些定义的不太清楚而且有重叠的数集的隶属度(比如,比温暖还要冷一点)。
在这个人工神经网络的例子里,变量包括:三维矢量h,是输入变量x的因变量;二维矢变量g,是h的因变量;
最后的输出变量%%%f,则是g的因变量。
定义
使用这些概念的计算机(或者,更准
根据维基百科的定义,人工神经网络(ANN)是“一组相互关联的人工‘神经元’,可以基于关联方法,使用数学和计算模型进行信息处理”。
在大多数情况下,ANN就是一个可以根据流入网络的内部和外部信息进行改变的自适应系统。通常,ANN构建了输入和输出之间复杂关系的模型,或者找到某种处理数据的模式,而不是基于数值输入得到一个数值结果。
简单的节点(可以叫做“神经元”、“神经节点”、“处理元素”或者“单元”)连接在一起,形成一个节点网络。它们的价值在于,可以使改变网络连接强度和权重的推导函数具体化,以得到理想的信号流。
最有意思的是学习的可能,在实际中也就是优化一些数据,这些数据通常被称为“成本”,它们代表了在给定问题环境下结果的适应度。
举个例子,经典的旅行者问题的成本就是旅行者在每一个指定地点停留、最后回到起始点完成整个行程的时间。一个更短的行程就意味着一个更好的解。
为了解决这个问题,冯·诺依曼架构的计算机必须要找出所有的可能路径,然后一步一步的计算,把时间累加起来得到一个路径的所需的总时间。在计算了所有可能路径需要的时间之后,计算机才能挑选出所需最短的时间。
ANN则有所不同,它并行的看待所有的路径,去寻找所需时间最少的模式。应用这样的模式,再去最小化结果路径。学习则是指,确定那些经验显示可以产生最优路径的模式。
在这张图中,冷、暖和热是覆盖了整个温度范围的集。范围上的每个点有三个“真值”-分别对于三
个集-数值表明了对于这个%%%集的相对“耦合度”。对于每个显示出来的温度,
三个值(0.8, 0.2, 0.0)可以描述为“相当冷”、“有点暖和”和“一点也不热”。
模糊逻辑(也是根据维基百科的描述)来自模糊集理论,用以处理大概而不是精确的问题。模糊的信息实际上是对于那些未精确定义的数集的隶属度。模糊逻辑可以基于没有精确定义但是仍然十分重要的属性,进行决策。模糊逻辑允许隶属度的值在0到1的闭区间内变化,用于解释诸如“有一点”、“十分”、“非常”这样的概念。同时,它也允许数集的部分隶属。
一个基本的应用在于描述连续变量的子域。举例来说, 一个防锁闸的温度测量可能包括多个隶属度函数,用以定义合适闸控制的温度域。每一个函数都匹配相同的温度,并且对应于0到1之间的一个真值,这些真值可以用来确定闸应该如何进行控制。
图像处理
基于模糊逻辑使用ANN进行决策可以构造一个强大的控制系统。很显然这两个概念可以合作的很好:一个基于三个模糊状态(比如冷、暖、热)的推导算法,可以使用真值(0.8,0.2,0)应用在实际当中,并且作为输入分配给三个神经元,每个又代表了三个集的其中之一。每个神经元可以施加给输入值一个函数,然后得到一个输出值,这个输出值还可以作为第二层神经元的输入,依此类推。
举例来说,虽然视频获取、光线和硬件设置都带来了大量的约束,但是神经网络图形处理器仍然可以自由应用。因为神经网络允许你通过学习过往的例子来构建机器,自由是可能的。因此,可以训练网络来识别明暗光、散射以及其他条件下好的和坏的部分。推理机开始于“评估”光线情况(换句话说,就是把耦合值分配给不同的光线条件,这些条件系统知道如何处理),然后基于这些光线条件应用准则来对图像内容做出判断。因为系统将光线条件当作模糊概念,推理机很容易的就可以从已知条件中得到插值以应对新的情况。
系统学习的例子越多,推理机的专家性就越强。它可以很轻松的通过预先将零件分类并注明相似和区别(出于学习目的),来实现学习过程自动
神经网络图像处理器也适用于依赖于操作员经验和阅历而不是模型和算法的场合。处理器可以根据操作员做的图像简单注解来建立识别机,然后从识别对象中提取特征和属性矢量并把它们发送到神经网络。特征矢量对于虚拟对象的描述可以和原始像素值、光强分布直方图图、光强分布、相关轴向梯度一样简单。更高级的属性还包括来自小波和FFT转换的元素。
泛化
经过案例训练,神经网络可以进行泛化,并且对那些从未见过的情况进行分类,把它们放在和之前所学的类似的情况下。另外一方面,如果一个推理机的自由度过大,出现过度泛化,相对应的案例可以随时对其进行训练和修正。
站在神经网络的角度,这样的操作可以降低现有神经元的影响,从而适应那些同当前决策域相冲突的新案例。
ANN被接受的关键是无监督和自适应的学习能力,这就意味着设备可以从对象学习,而且几乎甚至完全不受操作员的影响。举个例子,未来的玩偶有可能可以学习孩子的面部信息,然后问孩子的名字。对于手机的无监督学习
在无监督学习的环境下,设备必须建立自己的识别机,才能在操作环境下达到最佳的工作状态。比如,智能化的玩偶必须能够识别出它的第一个拥有者,包括它的皮肤和头发的颜色,以及购买的位置和季节。
起初,识别机必须使用它知道的全部特征提取技术,它会产生一系列子机,每一个都可以识别相同范畴的对象,但是要基于对不同特征的观察(例如色彩、粒度、对比度、边缘密度等等)。接下来,整个识别机可以对自己进行评估,选择那些可以提供最佳质量和/或准确度的子机。
案例:对鱼进行分类
Pisces VMK为岸上和离岸的用户制造用于加工鱼类的设备,它的客户都是那些终年在北海和大西洋上捕鱼并进行加工的船只。这些用户希望尽快提高质量并且使用最少的人手。
通常,渔夫们使用船上的渔网将鱼捞起,然后把它们装袋、放在传送带上送到清洗、分割和切片机。在这个过程里,异常的情况包括鱼的种类错误,鱼被损坏,每个袋子里有不止一条鱼,以及在进入分割机之前鱼的摆放位置不合适。因为鱼的大小、形状都很难进行数学建模,所以市场传统的图像处理工具很难进行相关的检测,而且随着捕获位置和季节的不同,刚才提到的那些特征还要发生改变。
Pisces安装了超过20套来自Matrox的基于Iris智能相机的系统以及General Vision生产的CogniSight识别机。照相机被安装在传送带上,这样在鱼进入切片机之前就可以经过照相机。照相机同西门子Simatic S7-224 CPU可编程逻辑控制器(PLC)以及一个局域网(LAN)连接。闪光灯安装在紧邻照相机的位置,每次一个新的袋子进入视野的时候闪光灯被触发。照相机连接局域网对于下面的三个操作是很有必要的:安装传感器以确保对焦准确、对比鲜明;训练识别机、连续生成关于鱼数量(可接受和不可接受的)的统计报告.
只有在一种情况下安装传感器:当照相机带有防水外壳的时候。训练开始每一次新的航行的开始,第一批被捕获的鱼可以当作学习案例,或者也可以使用已经存在的知识文件。
一旦照相机有了一个知识库,它就可以自动识别鱼了,而不需要连接PC。ANN将鱼分成接受、拒绝、回收以及空载等几大类,信号传给PLC,它控制两柄毛刷将合适的鱼送到拒绝或者回收箱里。PLC也可以同一个磁性传感器连接,这种传感器可以在每次检测到袋子经过照相机时生成一个获取触发信号。
Pisces现在已经在挪威、冰岛、苏格兰和丹麦的五个船队上安装了超过20套系统,每个系统可以每分钟检测360个传送中的袋子,甚至还可以更快。使用80个神经元的系统,为16吨鱼进行分类,准确性可以达到98%。渔夫们非常喜欢它,因为它的可靠性、柔性以及使用的简单。它的好处包括缩短了航行、提高了捕获质量和收入,并且减少了人手。
在离散制造的环境下,神经网络已经应用在交通工具控制、雷达系统模式识别、面部辨认、对象识别、笔迹及演讲姿势识别等诸多方面。
模糊逻辑也已经应用于控制汽车和其他交通子系统,诸如ABS、巡航控制、空调、照相机、数字图像处理、视频游戏人工智能,以及远程传感系统的模式识别。
这些“软计算”技术也已经用来制造用于呼吸机的可靠的电磁充电器。在连续和批处理工业里,模糊逻辑和神经网络是一些自整定控制器的心脏,一些微控制器和微处理器甚至也使用模糊逻辑处理进行优化,这样系统才可以运行的更快(见前面的“实时控制的模糊逻辑”)。
实时控制的模糊逻辑
尽管任何一款MCU或者计算机都可以在它的软件中应用模糊逻辑算法,这样
他说:“一般目的的模糊逻辑推理机的主程序,可以处理未赋予权重的规则,它需要57 byte的对象代码(大概24行装配代码)。”
他指出25 MHz 的HCS12可以在20微秒以内为一个2输入、1输出、每个输入输出有7个标签的系统执行整个推理过程。在8 MHz 的MC68HC11机器(没有模糊逻辑指示)上,同样的程序要占用250byte的对象代码,执行时间则需要750微秒。甚至如果MC68HC11的运转速度可以和HCS12一样快的话,模糊逻辑指示仍然可以使程序缩小12倍,运转速度快4倍。这些快速的推理允许模糊逻辑可以应用在实时控制上,不需要昂贵的计算硬件和庞大的程序。