人工智能中知识获取面临的哲学困境及其未来走向,本文主要内容关键词为:人工智能论文,困境论文,哲学论文,走向论文,未来论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]ON31 [文献标识码]A [文章编号]1002-8862(2006)04-0045-06
一 人工智能中知识获取研究的现状
所谓知识获取(knowledge acquistion,简称KA)就是把问题求解的专门知识(如事实、经验、规则等)从专家头脑或其他知识源(如书本、文献)中提取出来,然后将之转换成计算机系统内部表示的转换过程。综合而言,KA的任务是:获取领域专家或书本上的知识,在对其理解、选择、分析、抽取、汇集、分类和组织的基础上,转换成某种形式的系统内部表示;对已有的知识进行求精;检测并消除已有知识的矛盾性和冗余性,保持知识的一致性和完整约束性;通过某种推理或学习机制产生新的知识,扩充知识库。由于KA在人类智能活动中的重要性和长期性,KA在整个专家系统的开发过程中所消耗的人力、物力最多,时间也最长。
根据系统所具有的推理能力的不同,KA大体有三种方法:即人工获取、半自动获取或自动获取方法。①(1)人工获取。即知识工程师和领域专家合作搜集有关领域知识和专家知识,并通过分析、综合、整理、归纳后以某种表示形式存入知识库。这种方法的研究主要从认知心理学及思维的角度提供指导性原则和工具。(2)半自动获取。此法是利用专门的KA系统,采取提示、指导或问答的方式,把专家描述的内容翻译成所需的知识形式,并记入知识库。KA系统一般采用交互式对话的方式,帮助专家提取、归纳有关知识,并将其存入知识库中。(3)自动获取。这种方法具有从已有知识获得新知识的能力,又称为具有推理能力的KA方法。自动获取可以分为两种形式:一是系统本身具有自学习能力,使系统在运行过程中自动总结经验,修改和扩充自己的知识库;另一种形式是开发专门的机器学习系统,让机器自动从实际问题中获取知识,并填充知识。
迄今为止所建立的专家系统大多数仍不具备良好的KA能力,因此,领域知识的获取通常总是循环反复的过程,贯穿专家系统的整个生命周期。专家系统KA效率低的主要原因在于过多依赖知识工程师以人工方式向领域专家获取专门知识。提高专家系统KA效率的根本途径是实现自动获取。随着知识处理技术的发展和实用化,机器学习和KA已引起普遍关注。目前已开发出不少机器学习的方法,如示例学习、解释学习、类比学习、发现学习等。近年来,人们将人工神经网络用于KA和知识求精,也为KA和机器学习开辟了新的途径。②
KA并非易事,无论是人工学习还是机器学习,KA一直是专家系统开发的一个“瓶颈”。 KA的主要困难在于难以恰当地把握领域专家所使用的概念、关系以及问题求解方法。通常专家所采用的语言与日常用语之间存在很大的差异,而且在脱离具体环境时,专家在问题求解过程的描述与他们实际采用的方法之间也有一定的区别,这一现象称为知识畸变(distortion)。③其原因主要是:(1)每一领域都有自己特定的语言,专家很难用日常语言表达这些行话并让知识工程师真正领会。在大部分情况下,这些行话缺乏相应的逻辑和数学基础,要真正理解这些概念,知识工程师必须具备相应的领域基础知识,并对专家所处的环境有较深入的了解。(2)大部分情况下,专家处置问题靠的是直觉和经验,很难采用数学理论或其他决定论的模型加以精确刻画。(3)专家为了解决领域问题必须懂得比领域的原理和事实多得多的东西,其中有很大一部分是关于日常生活中的常识,这类知识专家往往在解题过程中下意识地使用,在其表述过程中却容易忽略。(4)由于信息表示形式的影响、问题表达的需要以及其他心理学上的原因,专家对领域知识的表达可能会与实际经验不一致。(5)源于多个信息道的知识元之间存在相互冲突。由于表示和使用不当,使得知识发生畸变。
尽管近年来机器归纳学习的水平一直在不断提高并得到应用,但随着专家知识不确定性信息和不完全信息在归纳过程中复杂度的增加,以及对归纳产生的知识的理解障碍的增加,不仅显现出早期的从样本自动构造生成规则的尝试没有前途,而且先前的归纳获取机理愈加暴露出逻辑基础上的薄弱和匮乏,缺乏对不确定与不完全信息处理的有效手段。解决这些问题的关键是必须在内在机理和获取技术上有所突破。问题的焦点在于只有将专家的深层知识,特别是存在于形象思维过程中的具有潜意识的知识提取出来,机器才能自动获取专家知识。因此,深入研究潜在知识向显性知识转化与表示的具体方法和技术,深入研究没有抽象符号却包含许多形象思维的推理机制将成为归纳获取研究中的基本主题。
二 KA面临的哲学困境及挑战
对于专家系统来说,KA是一个通过实验解决的纯实践问题,与哲学是无关的。然而,某个人选取什么实验并怎样去操作,受他个人内隐或外显的知识观的影响,因此,一个认识论方面的考虑对于发展合适的KA工具是很重要的。而且,我们认为一个好的认识论将会发展更好的KA方法。
1.KA面临的哲学困境
在人工智能(artificial intelligence,简称AI)的发展过程中,曾经盛行的认识论是符号主义、联结主义和行为主义。
(1)符号主义(physical symbolic system hypothesis),又称逻辑主义和物理符号系统假设,这种假设本质上认为知识是由客体的符号和这些符号之间的关系组成的,智能是这些符号和它们之间关系的适当操作。大量传统的AI研究就是在此种思想的推动下进行的。但是,在符号主义指导下的专家系统在发展过程中遇到三大难题:首先,在研制专家系统时,知识工程师要从领域专家那里获取知识,这是一个非常复杂的从个人到个人的交互过程,没有统一的办法。其次,知识工程师在整理、表达从领域专家处获得的知识时,用产生式规则表达局限性太大,知识表达又成为一大难题。最后,人类专家的知识是以拥有大量的常识为基础的,常识的运用成为第三大难题。
德雷福斯批评符号主义的强有力证据是:符号处理将不能解决“常识知识问题”。④他甚至断言:常识知识问题将引起AI的崩溃。他论证说:常识知识问题似乎总体上抵制AI处理它的企图,即如果我们把所有这样的知识输入计算机,我们会不知道怎样提取它。而且甚至没有人知道它是什么或怎样输入。香克多年来也一直认为常识知识问题是一个大问题,并试图编写专门解决此问题的程序,但并没有导致什么结果。德雷福斯认为,目前的问题是,我们怎样才能提取这种巨量知识并存入超大存储器。对此,他表示怀疑,因为常识知识的最重要问题不是“知识”,而是处理事情和人打交道的“技能”,这种技能随着人的长大而获得。
德雷福斯对符号主义的批评还集中在“专家系统”上。专家系统是一个(或一组)在某特定领域中使用该领域专家的知识来做出判断推理,解决至今只有人类专家才能解决的问题的计算机软件系统。某些专家系统的工作比最优秀的专家干的还出色,如DENDRL程序能解决质谱法所得的结果,能分析出多种化合物的组成和有机结构。专家系统与使用者(通常是某一领域的专家)连续对话,从而寻求某一复杂问题的最佳解决办法。德雷福斯指出,专家知识不是以“规则”为基础的。当你询问专家的知识时,他会追溯到他不是专家不得不使用规则的时期。这就是为什么专家系统绝没有像直觉性的人类专家那样好。
总之,将人类认知和智能活动转换成抽象符号的一个主要障碍是,任何实际问题都涉及大量知识背景,背景知识本身是个不确定集合,且这些知识大部分不能基于符号逻辑推理获得,即使局限于求解小范围问题的专家系统,也仍然不能克服符号逻辑功能的固有局限。⑤
为了摆脱符号主义的困境,20世纪80年代AI发生了一场“人工神经网络革命”,联结主义研究范式诞生。
(2)联结主义(connectionism)是一种基于神经网络及网络间的连接机制与学习算法的智能模拟方法。这一方法从神经心理学和认知科学的研究成果出发,把人的智能归结为人脑的高层网络活动的结果,强调智能活动是由大量简单的单元通过复杂的相互联结后并行运动的结果。人工神经网络就是其典型代表性技术。人工神经网络是一种具有大量连接的并行分布式处理器,具有通过学习获取知识并解决问题的能力。人工神经网络与基于符号主义的处理离散符号的计算系统不同,描述认知和智力活动的单元已经不是离散符号了,而是亚符号的数值变量。显然亚符号研究模式与以往关于“离散符号的处理对于任何智能活动既是必要的也是充分的”的观念相冲突,联结主义者工作的目标也从用符号模拟大脑转变成用大规模并行计算建构大脑。
就目前来看,许多AI专家对联结主义模型及其前景充满信心,他们认为联结主义模型能够体现人脑的基本特性,是人脑功能的一种抽象和简化。值得注意的是,联结主义得到了一些极为严谨、一般不轻易表态的著名哲学家的肯定和认可,如塞尔认为,“在认知科学的硬核中,最大的变化是关于人类认知的联结主义、PDP和神经网络模型。我对这些比对传统智能更富同情,因为它们试图回答关于像人脑一样运作的系统怎样可能产生意向的和智能的行为。如果我们把它设想为弱AI——企图构造模型或模拟但不是实际复制人的认知的某些特征,它们是相当有用的。”⑥
但是,即使经历了从符号主义到联结主义范式的转变,模拟人类高级智能的目标依然遥远。其中一个重要的原因是,大脑结构是经历了长期生命进化与环境的交互作用形成的,试图通过机器程序建立一个与大脑功能类似的人工网络实在过于困难。正如德雷福斯所说,“如果分析的最小单元是同整个文化世界联系起来的有机体,那么,类似于符号化和程序化的计算机式的神经网络就仍然有很长的路要走。”⑦造成困难的另一个重要原因是,联结主义仍然难以摆脱常识知识问题。此外,尽管联结主义的研究定向有其独特之处,但到现在为止,其神经网络模型的建构还有许多技术上的限制,其对心理现象和心理过程的模拟也存在一些问题:第一,联结主义神经网络模型尽管有些与大脑神经网络表现上的相似性,但并不真正具有神经学意义上的合理性。具有少量单元的网络在处理小问题时能够工作良好,但遇到需要几百个单元去解决的大问题就会运行困难和出错,这也叫做“规模上升问题”,是联结主义神经网络的根本性限制。第二,联结主义神经网络的学习和人的学习不一样。网络经常需要大量的训练才能完成某项任务,不像人脑那样经过一两次训练就能学会,也不能像人脑一样可以通过迁移和类比轻松增加和扩展已有知识而学习。第三,如果没有大量的指导,网络的工作质量就会很差。于是,研究者又开始寄希望于行为主义范式指导下的进化计算和人工生命研究。⑧
(3)行为主义(behaviourism)是一种基于“感知-行动”的行为智能模拟方法。这一方法认为智能取决于感知和行为,取决于对外界复杂环境的适应,而不是表示和推理;不同的行为表现出不同的功能和不同的控制结构,期望认知主体在感知刺激后,通过自适应、自学习、自组织方式产生适当的行为响应。行为主义的杰出代表人物布鲁克斯教授对传统AI进行了批判和否定,提出了无需知识表示和无需推理的智能行为观点。他从自然界中生物体的智能进化过程出发,提出AI系统的建立应采用对自然智能进化过程仿真的方法。他认为,智能只是在与环境的交互作用中表现出来的,任何一种“表达”都不能完善地代表客观世界中的真实概念,因而用符号串表达智能是不妥当的。布鲁克斯这种基于行为(进化)的观点开辟了AI研究的新途径,从而在国际AI界形成了行为主义这个新的学派。
上述三种研究范式从不同侧面研究人的自然智能。在KA的方法上,它们各不相同。符号主义范式的KA是按照设计者们制定的框架、按照一定的程式学习,以“if-then-”的产生式规则形式集中存放在有一定格式的知识和规则库中;联结主义范式的KA可以在有教练或无教练的情况下接受训练,学习是通过一定步骤训练后达到的状态,知识完全分散地存放在连接权值中;行为主义范式的KA是机器自动通过行动和感知从环境中抽取特征,直接用抽取的特征修正行为准则,并将提取的知识存放在有限状态机的内部寄存器中,不必有统一格式。
2.KA面临的挑战
(1)生态学的挑战。生态学的研究范式来自于一些人工智能专家、认知科学家、心理学家与人类学家的共同信念,这些信念在许多方面与符号加工范式、联结主义范式相对立,认为认知过程不是发生在每个人头脑或智能机内部的信息加工过程,否定在人为环境中研究认知现象的价值,认为认知不会发生在所处的文化背景之外,即所有的认知活动都是由文化背景塑造的。生态学的挑战对KA的意义在于:它使我们从单纯的内部表征和计算的抽象世界中走出来,更多地考察与生态环境的相互作用,重视认知主体真正的生存活动,关注更现实性的认知现象,使研究尽可能地贴近人们的实际生活,减少研究情境的人为性。正如“常识知识”所提出的问题那样,为什么对人是轻而易举的事情对计算机是如此困难甚至不可能做到,但运用生态学的观点可以解释得通。正如罗林斯精辟地指出:“我们是生存机器,而不是逻辑机器,这是KA的重要问题。”⑨
(2)社会学的挑战。KA倾向于忽视认知或知识的社会方面。伽德纳在1985年指出,几乎所有的KA、认知科学专家都千方百计地避免考虑某些不可忽视的因素,诸如环境背景、经验情感、文化和历史因素对人的行为和思维的影响等。他认为,“认知个体所处的社区环境至关重要,不可忽视。我们从周围人那里得知,什么观点可以接受,什么观点是错误的或危险的、有理由或无理由的。这样的判断最初不可能出自个体,一定是出自集体;正因为我们都处于社区,我们做这种判断才有其意义。”⑩知识工程师发现专家的知识,但并没有足够地提取出来,而是在或大或小的程度上受他当时所处的情境的影响。专家提供的知识随情境而变化,其有效性与专家解释数据和在上下文中能否正确判断的技能有关。
(3)现象学的挑战。时下的KA没有适当考虑人类思维或认知中意识经验的作用。就认知科学的意义来说,现象学是一种把“直接经验”的科学研究作为心理学基础的哲学学说。现象学分析的基本问题是避免把注意力集中于物理事件本身,而是更多地注意这些事件是怎样被知觉到和经验到的。现象学家是通过考虑个人与这些现实世界的事件之间的关系,并对之做出反应来获得真正的意义的。KA早期不重视意识问题的研究,特别是符号主义几乎不涉及意识的现象性、意向性和内省性等问题,这样,意识,特别是像“主观性”、“主观经验”、“他心”那样的心智的标志性特征,几乎完全在KA专家的视野之外。但即使今天的联结主义也未必是关于意识的好模型,在KA的解释模型中,也存在“本体论和现象学之分野”。因此,当前面临的现象学挑战乃是KA要解决的最困难的问题之一。
(4)解释学的挑战。KA专家大都忽视了对人类认知现象进行叙述性和解释性说明,缺乏解释学的维度。根据解释学的要求,要把“解释”与一般的“描述”区分开来,因为后者只限于对观察材料做报告,局限于对观察结果的简单概括,并没有提供观察结果背后的理由,而前者要清晰地阐明被观察到现象之间的关系。即使有的KA专家意识到解释的重要性,但在解释的标准上有分歧,显然,解释的标准不一样,则其解释力也就不同。就算是我们假设某些KA专家在解释的标准上达成一致,但他们在解释的目标和侧重点上也是有差异的。如当一个专家在解释什么时,他的解释依赖于其解释的对象而变化,如:是外行?新手还是同行?对本领域一无所知的外行,专家会提供最详细的信息,而向本领域了解颇多的同行提供较少的信息。事实上,相反的事也会发生,外行得到的是最肤浅、最表面的解释,因为一般来说他们只需要一点点知识来证明专家的假设比他们天真的假设更好就行了,而对于同行专家,正由于他们是专家,他们在证明中要求更严格,因此所需的信息也更为详细精确。这种现象很容易用GAR VAN-ESI(一个小型的医学专家系统)证明,如果知识工程师分别给两个专家不同的案例,他得到的反馈将会是两个公平简单、但有时稍有不同的规则,这两个规则显然都会在专家系统中良好地被执行。此后,如果知识工程师把两位专家召集在一起,询问他们哪个规则是正确的,那么一场非常复杂的讨论将会发生,因为每个专家都试图证明自己的规则要比对方的好。事实上,在GARVAN-ESI的研究中,肯定会有不同的专家和知识工程师参与了进来,但相同领域不同的专家具有不同的知识结构,且其所提供的知识也会随着上下文要求的改变而改变。
三 KA的未来走向
结合前面的分析,AI和KA领域所面临的各种挑战构成了其在今后一个时期所要解决的迫切问题。无论是生态学还是社会学的挑战,都表明KA应关注社会方面。如心理学家不断谈到“分布式认知”(distributed cognition),即认为认知不是在单个个体的心智中发生,而是通过多个个体的相互合作共同解决问题,知识被各种个体所共有。同样,在AI领域,人们也在关注“分布式AI”,认为智能是一起工作的复合计算的结果。“分布式AI”有些类似于联结主义,都涉及多个处理器的并列加工,所不同的是一个分布式人工智能系统中的每一个处理器本身都是一个拥有某些智能的高级系统,相反,联结主义系统中的单元则非常简单,只能向其他单元传递激励,而不能像分布式人工智能系统中的计算机那样传递复杂的消息。
从分布式AI观点看待科学的优点之一就是,这样可以设想通过实验来检验不同的社会战略的有效性,由相互协作解决问题者组成的集团能比独立工作者或由彼此独立工作者组成的集团更快地完成一项任务,并做出更快更好的解答。
同时,哲学领域也日益关注“社会认识论”,唐斯批评西蒙等人的认知个体主义,主张在认识论中加入一个“社会”的维度,认为:(1)理论是共有的财富,它可以跨越时间在科学共同体中流传;(2)社会的相互作用直接导致认知成果;(3)应从更大的社会背景上看科学问题。(11)萨伽德也指出,认知科学(AI)要解释:科学家为什么获得新信念,时而又放弃旧信念?当然,可以提供非常不同的解释模式类型来回答这个问题。人们一般不仅仅是相信他们想要相信的东西,而且,他们想要相信的东西能影响他们的结论,但不充分决定他们的结论,这种更微妙的方式影响他们对证据的检索和使用。赫希菲尔德和格尔曼主张心智“与其说是一个通用目的的问题求解者,不如说是针对各种与环境相关任务的、稳定且独立的子系统的集合”(12)。这些任务可能与稳定的文化相关,因而问题求解会呈现出文化上的多样性,如对情绪和意识的获取,应随文化的不同而不同。
各方面的论证要求KA不应当理解为发生在社会的真空中,而应视为内在的、动态的交互式的过程。对KA的社会性过程的研究,应当依靠心理学、计算机科学、神经科学、哲学、语言学和人类学等学科研究的整合,这是AI中最富成效的研究方针。有志于探究KA的人,如果局限于单个学科的理论和方法,所失去的不仅仅是对KA的更广泛的理解,而且还可能丧失从跨学科的交流中激励他们在本学科中取得创造性成果的可能性。
在专家知识的获取中,今后研究的可能途径是:(1)基于机器学习的知识获取研究。此研究同机器学习的总体研究一样地经历神经元模型与自组织系统符号概念获取——符号学习——联结学习与符号学习并行阶段,现仍方兴未艾;(2)基于现代归纳逻辑的背景,研究能处理不确定性信息(包括模糊的与随机的)与不完全信息的归纳推理和获取机制;(3)基于当代计算机科学和技术,加强对知识获取的算法(结合并行、遗传算法)、环境与自动获取技术的研究(当然要与较强的应用背景相联系);(4)专家知识的归纳获取与基于KDD(knowledge discovery in database)的知识发现的研究相结合。开展多学科交叉性的知识获取的研究,已成为当今AI前沿研究中的一项顺应发展趋势而又殊为紧迫的任务。
注释:
①李陶深:《人工智能》,重庆大学出版社,2004,第201页。
②杨炳儒:《知识工程与知识发现》,冶金工业出版社,2000,第402页。
③吴泉源、刘江宁:《人工智能与专家系统》,国防科技大学出版社,1999,第156~157页。
④熊哲宏:《认知科学导论》,华中师范大学出版社,2002,第160页。
⑤刘晓力:《认知科学研究纲领的困境与走向》,《中国社会科学》2003年第1期。
⑥Peter Baumgartner and Sabine Payr(ed.),Speaking Minds:Interviews with Twenty Eminent Cognitive Scientists,New Jersey,Princeton University Press,1999,p.205.
⑦博登:《人工智能哲学》,刘西瑞、王汉琦译,上海译文出版社,2001,第451~452页。
⑧高华:《认知主义与联结主义之比较》,《心理学探新》2004年第3期。
⑨罗林斯:《机器的奴隶:计算机技术质疑》,刘玲等译,河北大学出版社,1998,第50页。
⑩伽德纳:《心灵的新科学:认知革命史》,张锦等译,辽宁教育出版社,1995,第97页。
(11)S.唐斯:《从社会的观点看自然化的科学哲学》,王政挺译,《哲学译丛》1994年第4期。
(12)L.A.Hirschfeld and S.A.Gelman(ed.),Mapping the Mind:Domain Specificity in Cognition and Culture, Cambridge:Cambridge University Press,1999,p.4.