2.5 以人为主的计算机识别
社会智能与综合集成系统
上面我们着重讨论了人的形象思维或者性智难以应用现在有计算机加以模拟的问题。人具有模式识别的能力,所谓模式指的是文字、图像、声音等物理模式,也包括人的心理过程等。人能够在一大群人中认出自己的朋友,尽管对方和自己已经多年没有见面了;人具有联想的能力,例如在看到红色玫瑰时就会自然联想到热闹的婚礼场面。按心理学的说法,人通过经验和社会实践等在大脑中形成了心理意象。心理意象大致可以分成记忆意象、意识意象和想象意象三种类型。模式识别中的识别在心理学界习惯称为“再认”,即Recognition,Cognitive是“认知”的英语原名,而识别则是再认,也就是说,人的大脑中有大量的记忆意象,当人和外界相接触,碰到的模式和记忆意象两者大致互相吻合时,就把输入的模式归之于它的记忆意象对应的类别,也就是起到把输入模式进行分类的作用。记忆意象的特征是忽隐忽现的、模糊不清的。人因为有了模式识别的能力,所以才能够正常的生活。
2.5.1 机器模式识别
现在已有了一门应用计算机来进行模式识别的学问,识别的机理和人大不相同,不是模拟形象思维而是采取了一种既简单并且又能够形式化的办法。以文字模式识别为例子,首先分析能够表征文字的一些具有关键作用的量,称为特征,这种特征不仅仅是一个而是若干个。如应用几个特征可以刻画一个文字,那么就把每个文字,应用一个相应的具有几个分量的向量加以表达。与此同时对每个文字建立一个模板,所谓的模板,也就是应用一个标准的向量加以表达,这样一来,对一个新遇到的文字,首先搜索与它对应的特征向量,然后把这个向量和模板向量互相比较,求两个向量之间的距离,和哪个模板间的距离最小,就判定为是该模板对应的文字,这样一来,文字识别的过程就变得比较简单:首先把文字进行二值化,然后抽取表征该文字的特征,构成一个向量,最后求向量间的距离。这种方法和人识别文字是大不相同的,虽然人进行识别的机理难以说清楚,但是人是从一个字的整体来想的,并不注重文字的某些细节。应用计算机进行模式识别的工作对简单的模式来说是进行分类;对复杂的模式,不但是分类并且是对模式的论述和分析。早期对模式识别技术较为重视的国家是日本,日本通产省在20世纪70年代初实施一个发展信息技术的模式情报、信息的处理的系统(PIPS)计划。这个计划的中心在于发展模式识别技术,目的是对文字、声音、图像、景物等加以处理、分析、分类、论述和理解,解决计算机和用户以方便的方式直接通信的问题。如使计算机能够自动识别字符、图形和声音信号等,把这种类型的信息直接送入计算机或者计算机直接输出这种类型的信息。1978年在京都举行的第4届国际模式识别大会(ICPR)上,日本的专家介绍了他们进行这个计划取得的成就并且组织会议参加者到东京的邮局参观邮政信函自动分拣系统:这种高度自动化的系统应用10个阿拉伯数字进行邮区编码,通过当时十分先进的数字识别技术对信函自动分拣。这是字符识别技术的有效应用,参观者对这新技术产生了深刻的印象。
2.5.2 统计模式识别
模式识别和机器智能具有紧密的联系。外国的机器智能专家中由于受以逻辑为基础的思想影响,所以把机器智能和模式识别两者分开,而有的机器智能专家则认为模式识别是机器智能的一个分支。两者最重要的相似点在于它们都致力于了解人的感知和认知过程,以便使机器具有相类似的能力。
所以应用计算机进行模式识别的技术取得了很大的成就,但是应用的过程并非是进行形象思维的模拟。但是人进行模式识别的过程可以说是形象思维的主要内容之一,并且综合集成在识别的过程中起着中心的作用。
在应用计算机进行模式识别的研究和应用过程中,人们把以往抽取模式特征为基础进行模式分类的方法称为统计模式识别,它实现从特征空间到类别空间的一个非线性映射。这由“模糊集”的创始人Zedeh确切地加以概括,“模式识别是实现由特征空间到类别空间的一个非线性映射”。人们很自然地想到,不必把模式识别的研究局限于仅仅实现一种映射的功能。如在识别的过程中引进反馈控制系统中人们已经十分熟悉的反馈机制,形成闭环系统,那就有可能获得更加好的识别性能。德国系统科学家Haken曾经以以往的观点提出过“建立一个动力学过程,应用它来进行模式识别”,即以一个动态来实现模式识别的看法。这种看法对模式识别的发展具有积极的意义,但是他没有把这种看法和计算机模式识别的研究紧密地联系起来,也没有能够建立令人信服的基础。
2.5.3 语义模式识别、句法模式识别
下面我们简单地介绍语义模式识别、句法模式识别。到现在为止应用计算机进行模式识别的工作中面对的都是十分死板的模式,对于建立模型这类重要的问题几乎完全忽略,把问题转为对样本的选择的特征。而选择的特征并没有一般的行之有效的方法。在应用计算机进行处理的前提条件下,上面谈到的关于一个模式包括两个部分的构思得到充分发挥。
一个模式也可以定义为:P=P(x,u)。u表示P的属性(应用一个向量表示)等,称为语义部分。其中x表示P的结构信息,称为句法部分。
考虑一个模式P,它由一些称为基元的基本元素组成,这些基元具有某些能够刻画基元性质的属性,属性可以应用数值表示,基元之间的相互联系应用关系属性表示;由若干基元可以组成子模式,再由若干子模式组成更加复杂的模式,依此类推,最后组成所研究的模式。如果这些构造的方法称为语义规则或者语义函数,于是就形成一个形式化的体系,可以采用一种称为“语义、句法方法”的方法来描述这一体系。这种描述也包括两个部分:一是句法部分,应用一个上下文无关文法或有限状态文法的导出式表示;二是语义部分,它包括基元、子模式的属性、基元和子模式间的关系属性和语义函数,如下表所示。
在应用计算机进行模式识别的发展过程中,最早应用的一般性的数学方法是统计法或者决策理论法,以后又提出一种以形式语言理论为基础的句法方法。这里谈到的语义方法、句法方法,作者早在1981年就提出来了,该方法实质上是把统计方法和句法方法有效地综合起来了。
另外在模式识别以前的工作中,许多情况是人们致力于研究一个识别器,应用各种方法和技巧,精益求精地来提高识别器的识别率和其他性能。这种研制单个识别器的想法是十分自然的事,以后受机器智能领域中多专家系统、多智能体(Agent)等工作的影响,开始了把若干个识别器加以集成起来的研究。人们知道,在20世纪80年代中期,Rumelhart等人提出了前向网络的BP学习算法,克服了感知器仅仅能够进行线性判断的缺点,使人工神经网络(ANN)成为实现模式识别的重要工具。但是在多层网络中要想把网络从一层到另外一层进行反馈,来实现模式识别,由于各个层变量的量纲不同,如进行反馈,则难以进行合理的解释。应用人工神经网络实现的模式仍然是一种非线性映射。
2.5.4 集成型模式识别
从定性到定量的综合集成法提出以后,人们了解到人的性智的重要性,那么在识别系统的设计过程中怎样才能够充分发挥人的作用?具体的做法是应用人工神经网络来研制识别器并且把若干个识别器加以集成。具体方法是应用一个多层次网络作为集成网络并且应用有教师的学习或者称监督学习,充分依靠人作为教师的作用来训练各个识别器,然后再训练集成网络,通过两次介入人的作用,从而提高识别率。关于应用集成网络对识别器进行集成研究,已经进行过一些工作,一个重要的事实是集成网络可以从输出层反馈到输入层,从而通过从输出层到输入层的反馈形成一个非线性动力学系统,从而整个集成网络成为一个非线性动力学系统或者称为集成型识别系统(戴汝为,1993)。
图2.5.1是集成型识别系统的模型示意图。
其核心是作为集成网络的非线性动力学系统的模型。非线性动力学系统模型的构建成功,起到把模式识别和控制系统两者沟通的作用并且可能为研制新型模式识别系统提供和以前不同的设计的作用,并且在每个识别器的设计过程中新应用教师的作用;对各个识别器,由于每个识别器的设计过程中选择的特征是不同的,所以各个识别器加以集成就起到了各个识别器互相弥补的作用。另外每个识别器的设计过程中发挥了教师的作用,再加上对集成网络的设计过程中再次发挥了教师的作用,所以是反复贯彻了发挥人的作用的构思。实践表明,集成型模式识别系统的性能优于各个识别器中任何一个单个识别器的性能。
本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。