人工智能中的形式化问题,本文主要内容关键词为:人工智能论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:B80 文献标识码:A
人工智能已经走过了约半个世纪的里程,在经历了艰苦跋涉之后,无论是成功的经验还是失败的教训,都积累得相当多了,在这种情况下,我们有可能摆脱过去那种零敲碎打式的研究,对一些具有普遍意义的问题做出反省。形式化正是这样一个贯穿于整个人工智能研究的基本问题。形式化之所以重要,是因为人工智能要以机器为载体模仿人类智能,必须找到在思维和机器两种不同特性活动之间建立联系的手段,而这个任务正是由形式化来担当的。形式化因之而在人工智能中居于方法论的重要地位。
形式化是植根于逻辑的,然而人工智能在试图把握人类多样而复杂的思维模式时,不得不打破逻辑对形式化的限定。人工智能发展了形式化方法,并起到推动逻辑发展的作用。
1 人工智能中的形式化与人头脑中的形式化
关于形式化,逻辑中的定义是:使用专门的人工符号语言,按照严格的方式建立一个演绎系统,所谓“严格的”是指,“①除初始概念外,任何概念必须由初始概念或已经定义过的概念构成定义;②除初始命题(即公理)以外,任何断言必是经过证明的,不允许引进初始命题以外的假定作为证明的根据。”[1]至于形式化的一般用法,韦氏大辞典的解释是:①给出特定的或确定的形式(外形);②使成为形式的:给出形式状态或认可之[3]。这两个说法前者严密,后者宽泛,我们分别称其为狭义和广义定义。
所谓形式化其实就是(建立)一个形式系统。这样的系统首先要对问题或对象做出形式表述,在此基础上建立对形式单元的操作规则(算法)。逻辑规定的严格性既表现在表述上:后继概念与初始概念的关系,也表现在操作规则上:演绎的推理方式。在人工智能中这两个限定都有所放宽。广义说法中仅提出赋形的要求,事实上赋形也蕴函着对表述和操作规则的要求。赋形的前提是要先有一个形式系统。对象按这一系统的模式赋形,就意味着符合该系统的表述要求,从而可以在系统中被操作。所以两种定义其实有着共同之处。
人工智能中的形式化不是单一形式的。在直接与机器发生联系的层面上采用的是图灵机模型。图灵机是典型的狭义形式化模型,它基于这样一种思想:一个可递归的形式系统是可以通过机器来实现的。“可递归的”是指按照一定的规则在有限推理步骤中完成计算。图灵机使得由离散的机器状态实现抽象的符号体系成为可能。这是计算机得以存在的前提,也是现代逻辑发展中的一个里程碑。在图灵机之上还有不同形式的高级计算机语言,用于实现人机接口。这一层面上的形式化是由人工语言和算法构成的一种确定的操作程式。人工智能在构造算法时不一定要遵循演绎方式,可以比较自由地选择前提公理,直接引进概念,而不要求概念之间必须有逻辑蕴涵关系。人工智能的形式系统体现在某种特殊的联结方式,是依它的任务性质而定的,在很多情况下是描述性质的。由于这些特点,它可以在更大的范围里更灵活地模拟人的思维。人工智能形式化的最终形式是一个由数据集合和指令集合构成的可操作的程序。
关于以程序方式模拟思维的做法,哲学家德雷福斯提出两个问题:①人在“信息加工”中是否真的像数字计算机那样遵循形式化规则?②人类行为,无论是如何形成的,能否描述为一种可由数字计算机实现的形式化系统[4]?第二个问题的回答相对容易。人工智能的性质虽然有别于人的智能,但人工智能取得的丰硕成果表明形式化模拟是有效的,人机大战中“深蓝”击败人类冠军即是一例。计算机有着比人大得多的存储系统和快得多的运算速度,这在很大程度上弥补了它在“智能”上的不足。回答第一个问题比较困难。这涉及到一个基本问题:人类智能在本质上是可以形式化(或可计算)的吗?或者说,人类智能是否可以全部形式化?
广义地说,人头脑中也存在着不同等级的形式化。从最基本的层面开始,一切物质存在都具有自身的形式,当我们经由感知接收了物质信息,最初形成表象时,已完成了第一级的赋形过程。物质信息是全方位的,生理特性使得人从中只截取了一个特定层面。可以想象,你我的表象与蝙蝠或蚂蚁的必定有很大差异。这一级形式化是由本能完成的。对人而言,决定性的一步是构造了一个摆脱依赖对象原型的符号系统——自然语言,可据此进行日常推理。这一抽象过程使人类获得了一个强有力的思维工具,从而上升到智能水平。这是人头脑中广义形式化的第二个等级。它起到呈现和保留思维对象及组织思维过程的作用。自然语言系统的重要性在于它是其它各种(语言)符号系统的元语言。从它之中派生的既有像计算机语言这样的特殊语言,也有包括逻辑在内的各种专业理论体系的专门化语言。这些符号构成的形式系统又成为一级形式化。在这一级中可以根据严格性程度的不同再细分为多个层次,其中按演绎方式构造的逻辑和数学处在最高层。这是一个抽象性不断提高的等级体系,各级之间有着本质的差别,属于不同范式。对于各个等级形式化的规则,我们只了解其中一小部分,是否能彻底认识它们,还是未知的。此外,人脑中还有如创造性这样不可形式化的部分,所以对上述问题的回答基本是否定的。然而人工智能目前定位于一门经验科学,即使不能抵达智能的内核,也并不妨碍它完成模拟智能的任务。事实上,人工智能是以局部逼近的方式实现对人类智能模拟的。(下面提及形式化时,如不专门说明,都是指人工智能方式下的形式化:一种模式确定的机械操作方式。)
2 形式化的表述和算法问题
人工智能中存在着狭义形式化模式,关于它的局限性已由哥德尔等人所论证:“对复杂到一定程度的形式系统而言,如果它是逻辑上无矛盾的,则它必然是不完全的(即并非所有的真命题都是可证的);必然是不可判定的(即不存在可以用来判定其中的任一命题是否是可证命题的算法);它的真的概念在系统中是不可定义的。哥德尔不完全性定理,丘奇图灵的不可判定性定理和塔尔斯基的真理性概念的不可定义性定理分别表达了形式系统的上述三个方面的局限性。”[2]人工智能在构造严密理论体系时必须注意这种局限性,否则将会出现逻辑上自相矛盾的结果。突破逻辑限定之后,人工智能在形式化方面发展了一些富有特色的表述和算法模式,并借助它们取得大量成果。但它们也有很大局限性,远达不到自然语言和日常推理的功能,面临着诸如“世界”过于微小、系统间不可通约、问题空间如何与背景发生联系、元素组合激增以及为日常思维建立范式等一些棘手的问题。
人工智能方法可分为两大类:符号论和联结论,其表述和算法都有所不同。符号表述属于传统方式,是将对象系统中的每一实体元素用一个计算符号来表示,再通过数组或函数关系建立它们之间的联系(结构)。每一元素都有自己固定的地址,使用时必须根据已知的线索才能提取出来。基于符号的知识表述方法有多种:逻辑系统,产生式系统,语义网络,框架方法,以及脚本等等。这种方法首先要对问题空间做出精心设计,确定各种关系,其结构一旦建立,就不再变化。这种方法的表述模式单一,不易变更,但是比较容易实现复杂的意义结构。
联结论的分布式表述是以人工神经网络为基础的。它改变了一一存储对象元素的方式,“每一实体都由一个分布在许多计算元素之上的活动模式来表示,而每一计算元素又与许多计算实体的表述有关。”[8]它的表述对象是由网络实现的,实体间的联系则由模式的相似性承担。这样就无需像传统表述那样指定地址,而可以根据已知对象的特征自动寻址。它的容错性也很强,信息不充分时也可做出相对正确的反应。这种系统会表现出某些与人类相似的特点,甚至会出现类似于人类的错误。如有的脑疾患者看到“桃子”一词时会说出“杏”,这表明病人已理解了词的意思,只是不能在义素层面上准确定位。分布式网络在学习“桃子”一词的初始阶段也会犯这样的错误[6]。分布式网络具有自发学习功能,但是学习模式只适合于事先设定的具体任务。这种系统只适于生成意义比较简单的结构。
人们把目光转向人的日常表述方式。海斯建立的日常物理世界体系即是尝试之一:“我们假定朴素物理学的形式化是存在的(它其实就存在于我的头脑中)……”。“本方案要为物理世界中大量存在的日常知识构造一个形式化。举例来说,这种形式化有可能是一阶逻辑形式体系中若干推断的集合,或是KRL单元的集合,或是一个微型规划程序,或是许多别的什么东西中的一个。”“对于整个形式化来说,应当有一个共同的形式框架(语言、系统等),这样不同部分(公理、框架)之间的推理联结才能显而易见。”[7]海斯的尝试虽有一定的启发性,却以失败而告终,因为仅从语句的表面结构中找不到日常表述的真正规律。其他尝试如框架理论、脚本等也都只是局部有效的。德雷福斯以先见者的口吻评论道:“威诺格拉德是最早认清SHRDLU程序的局限性和所有脚本及框架试图扩展微世界方法局限性的人之一。……现在他在斯坦福的计算机课程中讲授海德格尔,并指出‘困难在于把那种确定哪些脚本、目标和策略是相关的,以及它们怎样相互作用的常识背景形式化’。”[8]对日常知识表述的研究成为一个持久而艰难的课题。
算法是将各种运作规则和推理过程转换为一种运演框图,起着组织和调配系统元素的作用。算法是构造性的。同一问题可使用不同的算法,同一算法也可用于不同的问题。
逻辑关于算法的说明是:“由一个字母表A及若干条指令决定的计算过程叫做一个算法。字母表A的字是算法的运算对象,而指令则是运算的规则。……对于一个算法,它的指令必须是明确的,不允许有任何含混之处;其次,指令也必须是机械的,在执行指令的过程中不需要任何创造性,只要按照指令要求按部就班地去做,最后总能得到结果;另外,算法也必须对一类相当广泛的对象适用,即对字母表上的任何字符皆能实行运算。”[9]算法的实质是要形成具有组织、调配和控制作用的指令体系,通过这一体系实现所要完成的任务。人工智能专家玛尔曾专门讨论过问题的清晰程度与算法的关系,将演绎关系清楚的问题称为1型问题,只能从经验角度说明的问题为2型问题,两者之间的则是1.5型问题[10]。
人工智能在算法上遇到的难题仍与日常思维有关。日常推理规则显然不是纯逻辑的:人们根据经验做出判断和推理,结果可能不是最佳的或惟一的,甚至还会出错。人工智能发展了一些模仿人类的有效策略,启发式搜索即是其中之一。启发式搜索是以已有经验作为搜索路径替代按递归方式进行的全问题空间搜索。“为了解题,物理符号系统必须使用启发式搜索,因为这种系统具有的加工资源是有限的——在数目有限的步骤中,同时在有限的时间区间内,它们只能执行数量有限的加工。”“智能的任务就是防止搜索中始终存在的由指数激增造成的威胁。这一点如何才能实现呢?首选的途径就是将选择性植入生成程序。”[11]这种方法只适用于有完整问题空间的任务。
非单调逻辑是模仿人类思维的另一个例子。其思想是,在推理过程中可因加入新信息而取消某些原先的结论。如缺省推理:如果不知道X,那么Y就成立;例如,命题Y是“鸟是会飞的”,对于一只鸟,只是不特意指出它不会飞,“它会飞”的前提就成立;如果遇到一只鸟,同时有信息说明它不会飞,这时“它会飞”的前提就要被取消。严格说来非单调逻辑并不属于逻辑,演绎总是单调的,后继结论只能从前在结论中推出,而不能推翻之。除此而外还有一些别的方法。这些方法具有较大的灵活性,使人工智能可以在此逻辑广泛得多的范围里有效地描述人类的思维。但是不难看到,这种模仿仍是局部的,还不能从本质上达到对日常推理的把握。
3 形式化:人工智能的界限
人工智能在不断发展,它的智能水平也在不断提高,但是,它的发展是否有限度呢,是否会超过人类呢?这是一个有争议的问题。有这样一种观点:机器既然具备了学习和创造能力(如证明人所无法证明的定理),那么,机器完全可以凭借这种能力无限制地自我发展,最终超过人类。笔者的观点与此不同,人工智能的发展无疑是有界限的,这个界限正是形式化为其划定的;人工智能可能在某个局部方面超过人类,但在总体上是决无可能的。
分析哲学家曾提出:语言的界限即为(可认识)世界的界限。因为无法用语言表述的对象是不能进入意识的,因而是不可思维的。同样,凡是不能被形式化的任务,都无法转化为机器的运作方式,因而是不能实现的。所以形式化圈定了可能的机器智能范围。语义的形式化是不能由机器自身完成的,所以机器无法摆脱对人的依赖,而超过人类。下面从学习和定理证明与形式化的关系进一步说明这一看法的根据。
机器学习和人的学习有很大不同。机器学习没有自主性,学习什么,怎样学习,都必须由设计者事先为它规定好。有学习能力的程序与一般程序的不同之处是它的运行指令是可以修正的,指令本身有一个变化空间。联结论系统的学习能力虽然是固有的,但它的学习范围取决于每一系统的构造,十分狭窄,也是事先确定好的。至于在人类学习,尤其在学习抽象理论时表现出的创新性和认识能力发生的质变,是机器望尘莫及的。不难看到,凡是学习中可以形式化的部分,机器也能去做;凡是不能形式化的,机器就无能为力了。但是在学习中非形式化的因素占据了主导地位,所以同人相比,机器的学习能力是很低下的。
至于定理证明,虽然机器可以完成人类无法胜任的工作,但这不是由机器独立完成的。人必须先将证明方案形式化,设定证明步骤,然后机器才“知道”该做什么。问题是。既然有证明方案,为什么不能由人自己来完成呢?如果不考虑速度、时间因素,人当然可以完成这种任务。以解线性方程为例,人可以轻松地解三个自变量的线性方程,若方程数增加到十个就比较困难了,但是几十个甚至上百个,人还是可以胜任的;如果方程个数增至千个以上,所需的时间和精力就是个体生命所无法承受的了。机器证明并不神秘,它的难点不在于机器能做什么,而在于人怎样找到解题的形式化方案。吴文俊教授获科技重奖,正在于他完成了这样的方案设计。
关于机器的创造性,博登有过专门论述。她把机器的创造性分为三类:①对熟知的思想进行新的组合;②发掘结构化空间,产生新思想;③对(表述或问题)空间的某些维度加以转化,从而产生前所未有的结构。她认为只有第三类属于真正的创造。[12]这些创造机制是从何而来的呢?还是由人设计的。由机器对各种思想进行组合并不困难,关键是这些“新奇的思想”是否有价值,这就需要有一个评价机制。对于这一点博登不无忧虑地说,“确定人类的评价准则是相当困难的。”我们用一个简化的例子来说明这一问题:用“组合式创造”来构造莎士比亚的名句"To beor not to be"。这个句子由13个字母和5个空格组成,计算机只需少量的时间就能完成全部的字母-空格排列,关键是要在这数目巨大的排列组合中判断哪些是意义隽永的句子,哪些根本毫无意义,然后做出选择。在机器中建立这种评价机制的难度是可想而知的。由于创造模式、评价模式都要通过形式化来实现,所以人工智能的“创造性”仍在形式化的控制之中。
我们虽然将形式化看作人工智能的界限,但这并不是一种悲观和无所作为的态度。事实上形式化作为人工智能的方法论有可能在三个方面取得进展:①对人脑中广义形式化的深入认识:正如逻辑被发现一样,未来还可能有其它思维规律被发现,前述广义形式化等级中的许多方面都值得细致研究,从中提炼新的方法;②对人工智能中现有形式化的研究:随着逻辑学科的不断发展,目前的形式化工具也处在发展之中;③探讨由机器自动赋形和形成结构的可能性:形式化过程的机制是否也有可能形式化呢?机器人直接从外部世界摄取信息,并将它们转化为可操作的符号,但是符号表述和操作机制的形式化是依赖于人的。机器完成的形式化范围是否可以逐步扩大呢?事实上,我们所说的人工智能的界限并不是一成不变的,随着形式化的发展,这是一个逐步扩张着的疆界。我们相信,形式化工具的发展必将给人工智能带来深刻的变化和更大的发展。
收稿日期:2001-11-26
标签:人工智能论文; 系统思维论文; 智能算法论文; 形式化方法论文; 智能机器论文; 关系逻辑论文; 系统学习论文; 推理论文;