科学创造力的机器发现研究述评,本文主要内容关键词为:述评论文,创造力论文,机器论文,发现论文,科学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:N031 文献标志码:A 文章编号:1000-8934(2007)11-0039-05
打开科学创造力的“黑箱”,揭示科学创造力的发生机制是诸多领域学者的愿望。一些科学家纪录自身科学研究过程,对创造性思维过程进行内省。科学史家通过对信件、论文、实验室纪录等原始材料的个案分析,从整体上考察科学家的创造过程。心理学家借助问卷调查、心理测试、文献计量等方法,试图发现科学创造思维的一般规律。针对这些研究进路在材料或方法上的限制,认知科学家提出了一种科学创造力研究的新方法和途径——机器发现(machine discovery)研究,也即科学发现的计算模拟。这是一种用计算机程序表征科学发现的思维过程,用算法对创造性思维进行建模研究的途径,是结合科学哲学、科学史、人工智能和认知心理学进行科学发现研究的新领域。
以科学发现为对象的机器发现研究是认知科学的子领域之一。20世纪50年代中期,信息结构开始用于表达认知中的信息。认知心理学则强调计算机具有更一般的符号处理能力,从而把计算机和人从本质上联系起来。随着计算机的发明和人工智能研究的出现,心智哲学中功能主义的确立,心理学和语言学中认知革命的发生,探索人类心智及其活动的,连接哲学、心理学、人类学、语言学、脑神经科学与计算机科学等学科的新领域——认知科学诞生和发展起来。大部分认知科学研究的指导原则是把人脑视为像计算机一样处理符号、进行信息加工的系统,因而可以构造计算模型来模拟心智的运作。认知科学研究诞生后,其基本理论和假设也迅速渗透到创造力研究领域,机器发现研究就是创造力研究中这一发展趋势的体现。
1 跨学科的机器发现研究方法
机器发现研究充分体现了认知科学的跨学科研究特点。它以科学哲学的思辨为理论前提,结合科学史研究中对科学家发现的详细个案分析以及科学家的日记、实验室笔记等原始资料,使用计算机程序来模拟科学家在科学发现中的思维过程,并基于认知心理学理论和实验寻求计算模拟的心理学合理性。
机器发现研究在哲学上继承和吸收了科学发现可以理性重建并试图恢复它为科学哲学合法研究主题的思潮。20世纪上半叶科学哲学的主流观点并不重视科学发现的研究。例如,赖欣巴赫(S.Reichenbach)虽然肯定归纳推理是获取新知识的工具,但他两分地对待发现的前后关系和证明的前后关系,而把发现排除在认识论研究范围之外。波普尔(K.Popper)强调不存在科学发现的逻辑,只存在证伪的逻辑。库恩(T.Kuhn)也认为没有发现的逻辑只有发现的心理学。机器发现研究与上述这些观点不同,而是接受如培根(F.Bacon)、皮尔士(C.S.Peirce)、汉森(N.R.Hanson)等哲学家的影响,并从他们认为存在能产生关于自然界理论的法则的论述中得到许多启示。
科学史上关于重要的科学发现和科学革命案例的考察,给机器发现研究提供了切入点。探究人类科学家如何作出科学发现是机器发现研究的目标,重要的科学史案例分析自然成为其研究的首选。机器发现研究者吸收了科学史学家的具体研究成果,甚至结合科学家本人的著作和相关一手资料进行分析,尝试还原重要科学发现的历史细节,考察科学家在发现过程中使用的思维策略和事件的先后顺序,并以此为基础设计可在计算机上运行的程序,再现这些历史过程,研究科学创造力的发生机制。
计算模拟是机器发现研究的核心方法。1956年,西蒙(H.A.Simon)等学者最早提出使用计算机程序研究创造性思维的想法[1],即利用来自人工智能的观念阐明创造性思维如何运作的理论,并将人工智能模型视为这些理论一致性和效力的检验。这种人工智能研究不以追求计算机解题的计算效率为目的,而是追求对人类思维的精确理解。这种方法的基础是认知科学研究所共同拥有的中心假设,即将思维视为心智中的表征结构以及在这些结构上进行操作的计算程序,也即对心智的计算表征理解[2]。认知科学将人的心智与计算机进行类比,从上述中心假设推出,心智的表征结构类似于计算机程序的数据结构,表征的计算程序类似于计算机程序的算法。从而,可以按照人的思维过程来编制计算机程序,以程序的运行模拟人的认知活动。
认知心理学为计算模拟中程序使用的发现策略和思维机制提供实验证据和检验。在实验中,可以给人类被试提供与机器发现程序相同的初始条件,纪录他们在解决发现任务的问题时思考过程的口头报告,进而分析人类被试和程序在任务执行中,成功和失败时使用的思维机制细节的异同。也可以将程序中的启发式①策略使用于各种人类思维实例,考察其实用性。
2 机器发现研究的主要方向
机器发现研究的思想在20世纪50年代被提出后,到70年代末80年代初开始得到较为广泛的实际应用。回顾机器发现研究近30年来的发展,它主要有4个研究方向:对科学发现中认知机制的考察,对科学发现过程的重建,对科学发现结果的评价和在具体学科领域中作出新发现。
在对认知机制考察方面,类比思维和顿悟体验被认为是科学发现过程中的重要认知机制。达尔文(C.R.Darwin)进化论的提出,麦克斯韦(J.C.Maxwell)电磁场理论的建立,都是应用类比思维的典范。一些计算模型即致力于研究类比思维发生的机制和过程。例如,弗肯海纳(D.Falkenhainer)等提出了类比思维的结构对应工具(structure-mapping engine),强调结构相似性在类比中的重要作用[3]。霍利约克(K.J.Holyoak)等的类比约束映射工具(analogical constraint mapping engine)运用多重约束条件判断类比的强度[4]。有时,科学发现是伴随着顿悟的产生而出现的。著名的例证有阿基米德(Archimedes)对浮力定律的发现,凯库勒(F.A.Kekule)对苯环的发现和彭加勒(H.Poincare)对富克斯函数的发现等。早期的心理学研究中一般强调科学发现的顿悟体验的无意识特性。而奥尔森(S.Ohlsson)、西蒙和兰利(P.Langley)各自建立了顿悟的计算模型,对顿悟发生的机制给出了计算的说明[5]。
对历史上重要科学发现过程的模拟或重建,有助于解释科学家在发现过程中所使用的方法,以及探究科学发现成功和失败的思维机制。这方面研究作出的是科学再发现活动,相应的研究程序也被称为再发现程序。西蒙团队研制的BACON系列程序是经典的数字定律再发现程序,重新发现了波义耳定律、开普勒行星运动第三定律、理想气体定律等多种定律和函数关系。他们的研究还涉及定性定律的再发现,结构模型的再发现和过程模型的再发现[6],以及实验过程设计的再现[7]等方面。他们设计的GLAUBER程序能再发现酸和碱的概念,涉及定性定律的再发现;DALTON程序可以模拟多重化学反应,还可应用于粒子物理学和经典的孟德尔(G.Mendel)遗传学,是结构模型的再发现程序;KEKADA程序模拟了20世纪30年代克雷布斯(H.Krebs)发现尿素循环的活动,是对其实验设计过程的模拟。另一著名的再发现程序是列纳特(D.B.Lenat)研制的AM程序。AM能在初等数学和集合论中重新发现概念和假设,产生了许多算术概念,包括加法、乘法、素数以及哥德巴赫猜想,甚至还产生了最大可分数的次要法则[8]。这些再发现程序使科学发现逻辑的研究重新兴旺起来,为思考发现的逻辑是否存在,及其能否作为科学哲学合法研究主题问题的研讨,提供了新的论域。
关于科学发现结果的评价,计算模拟主要是为科学发现中理论假设的评价问题提供了一种新的考察方法。萨伽德(P.Thagard)基于解释一致(explanatory coherence)的计算理论,设计了联结主义计算模型ECHO程序以考察相互竞争的假设[9]。它使用单元表征描述假设或证据的命题。单元之间的联结表征一致的关系。如果一个假设解释了一个证据,ECHO就在表征假设的单元和表征证据的单元之间设置一个兴奋的链接。如果两个假设冲突或相互竞争,ECHO在表征这两个假设之间的单元间设置抑制的链接。单元激活的反复调整基于其与其他单元的联结状态,从而得到活跃的单元(假设被接受)和关闭的单元(假设被拒斥)。ECHO程序对科学革命的考察显示,一系列的假设不能被单独反驳和确证,被接受和被拒斥都是全盘的,对假设的评价必须考虑相关证据的总和。ECHO模拟了许多科学革命案例中相互对立的理论之间的竞争,例如氧化理论和燃素说、进化论和神创论、哥白尼天文学和托勒密天文学等。此外,机器发现研究还证明,理论发现的前后关系和理论辩护的前后关系的两分是不存在的,对理论的辩护贯穿发现过程的始终,评价是发现过程中不可缺少的环节[10]。
在认知机制考察的基础上,除了模拟或重建科学家的思维过程,以及对理论假设的评价外,机器发现还致力于产生真正的科学发现成果,即在具体学科领域做出新发现使之成为现实中科学创造活动的一部分。机器发现程序在天文学、医学、生物、数学、化学、物理、环境科学等领域取得的一些发现成果已经通过了专业领域的同行评议,发表在专业期刊上。例如:AUTOCLASS系统通过对红外光谱的分析,扩展了原先主要基于可见光谱分析的恒星分类学;RL系统能发现有经济价值的化学药品的致癌性的定性规律;PRPGOL系统能应用于基因变异中化学因素的发现;GRAFFITI系统在数论和其他离散数学领域中产生的猜想已经引发了数学领域学者的研究兴趣;MECHEM系统自动发现了乙烷氢化裂解反应的新机理;PAULI系统得到了能解释产生守恒定律的历史数据的新守恒定律;LAGRAMGE系统发现了生态行为的时间定律等[11]。
3 科学创造力研究的新进路
以往的科学创造力研究,主要的方法包括测量法、实验法、个案分析和历史文献分析等方法。机器发现与这些研究方法都不同,它整合了多个学科领域的资源,以计算模拟方法考察科学创造力,主要关注个体在科学发现过程中的内在思维过程,对发现过程中的思维运作机制提供精确和细致的说明,从而推进了对科学创造思维过程的探索。
机器发现研究的方法,为创造力理论模型的建立和检验提供了全新的手段。心理测试和实验研究方法虽然具有标准化和可控性强的特点,但研究对象主要是一般人而非公认的天才,而且也不易具备可重复性和可检验性。个案分析法一般缺少科学的定量研究,样本数量也有限,难以从研究中得出具有普适性的规律和结论。由于科学家对自身创造过程思维模式的总结缺乏心理学理论基础和检验,及其心理机制的详细说明,使历史文献分析法容易受到材料的限制,也容易流于一种事后重建的静态说明。机器发现的计算模拟方法则要求对科学创造思维进行精确考察以产生可运行的程序。它追求程序、理论和计算模型的一致,提供关于科学发现的结构和过程假设的动态说明与检验;并将结果与心理学实验对比,以寻求心理学的合理性和理论依据。
机器发现从认知角度深化了科学创造思维的研究。一般来说,科学创造力研究的早期工作大致遵循着两条研究发展路线:一条路线侧重一般认知过程,尤其是问题解决的创造性思维过程的考察,如格式塔学派;另一条路线则侧重作为个体特殊人格品质的创造力的考察,如精神分析学派[12]。最初,认知进路的考察从一些科学家对自己科研工作的回忆或记录中对问题解决思维过程的思考和总结获得了经验基础。创造性思维的“准备期、酝酿期、明朗期、验证期”四阶段经典模式就是心理学家沃勒斯(G.Wallas)在此基础上提出的。格式塔学派对创造性思维内在机制,以及创造性问题解决的逻辑和实例分析奠定了研究创造性思维心理机制的理论基础。机器发现研究继承了这些研究成果并发展了认知进路的考察。例如,西蒙及其合作者通过机器发现研究指出:科学发现就是问题解决,是对问题空间的搜索过程。问题空间是问题解决者对一个问题所达到的全部认知状态。问题解决就是应用各种问题解决策略(启发式、算子)来改变问题的起始状态,使之转变为目标状态的过程。创造性思维与日常思维的区别在于问题解决者对问题不明确状态的容忍、坚持不懈的钻研态度,以及拥有大量的背景知识[13]。
机器发现还使科学创造思维的考察突破了单纯以人为对象的研究。传统研究以人为默认前提,将创造的范围限定在人的思维过程、行为举止、产物作品以及与社会的相互作用中。机器发现则借助新的理论假设和研究手段,以计算机为创造思维的主体,突破了仅局限于从人出发的创造力研究的范围和方法。人与计算机的类比使得计算模拟给人脑的创造思维运演机制的考察提供了独一无二的参照物。例如,博登(M.Boden)认为创造力有三种类型,即联合的(combinatorial)创造力、探索的(exploratory)创造力、和转换的(transformational)创造力。这三种创造力,与计算机通过从熟悉观念中产生新的联合、概念空间潜能的探索,以及先前不可能观念的可能性转换等三个方面进行的创造力模拟是大致对应的[14]。机器发现研究不仅为理解人类如何运用这些类型的创造力作出发现提供了基础,也为建立能辅助科学家作出发现的系统,甚至完全自动的发现系统提供了基础,还为形成科学研究活动和方法的人机联合发现新形式提供了基础。
4 机器发现研究面临的挑战
机器发现已取得了丰富的成果,但也引发一些争议,面临着挑战。挑战不仅来自创造心理学或传统的创造力研究,也来自科学社会学等不同出发点的理论观点。
近年来,传统创造力研究的发展主要围绕人格、认知、创造力培养和创造力与社会系统的关系四方面展开,呈现出多样化和综合化的趋势,其成果使人们认识到,创造力是一种包括神经的、认知的、情感的、社会的和文化的等多方面性质和关系的复杂现象。一些学者指出,机器发现仅关注创造力中的理性因素方面的考察是难以揭示创造力的真正本质的。创造心理学家西克森特米哈伊(M.Csikszentmihalyi)指出,机器发现研究仅将人的认知过程的理性因素应用于计算机模拟,忽略了创造性思维的非理性方面,例如情感、动机和好奇心等。计算机只是模拟了创造性过程的逻辑问题解决方面。他认为,西蒙等人将科学创造力视为问题解决,只关注“创造力是什么”的问题,而忽略了“创造力在哪里”这个最重要和最基本的问题。特定时间和地点的创造力不仅依赖于个体本身,也依赖于业内人士和专业领域对新颖的行动、观点或产品的承认和传播;创造力是三方面元素相互作用产生的现象。而这些都是模拟程序无法体现和解释的[15]。
与关注知识的客观性的机器发现研究不同,科学知识社会学家认为,社会因素是科学发展过程中的决定因素,并试图用社会学因素解释科学知识的发展过程。他们认为,人们的知识不是来源于认识过程,而是来自社会环境。认知科学家斯莱让克(P.Slezak)则认为,BACON等程序提供了这样一种案例,即科学发现与所有的社会或文化因素隔绝,从而构成了对科学知识社会学强纲领的社会因果信念的巨大经验挑战。他的观点引发了一场围绕“计算机科学发现与科学知识社会学”的专题讨论。再发现程序的设计者认为,应区分内部和外部社会情境;内部社会情境由科学共同体中知识的累积形成,直接作用于认知过程;外部社会情境与社会经济结构和文化特征相关,影响发现的动机等方面。社会建构论者则认为两种情境是不能区分的[16]。但不管机器发现程序对科学知识社会学强纲领的拒斥是否成功,它也的确欠缺对科学发现相关的社会因素的研究和说明。例如,科学家之间的合作互动、社会联系、利益关系、科学共同体的运作、发现的历史背景等。
机器发现也沿袭认知科学研究的中心假设,即对心智的计算表征理解。但对计算表征假设的质疑是多方面的。例如,计算表征假设忽略了情绪、意识在人类思维中的重要性,忽略了思维与自然环境和社会环境的互动;人类智能是内在地非表征的,所以形式化地表征知识不可行;程序对表征的操作是缺乏意向性的,从而心灵的计算表征根本上是错误的。将创造力视为心理计算,将创造性思维视为可计算的机器发现研究同样要面对这些质疑。数学家、物理学家彭罗斯(R.Penrose)从哥德尔(K.Godel)不完全性定理出发否定心智的可计算性,他也持有人的创造性思维不可计算的观点[17]。这个观点不是因神经元或记忆容量的有限性所引起,而是与算法的有限性相关。算法或其等价物是通向心灵的,包括迄今所有创造性计算机模型在内的数学进路的基础。如果彭罗斯是对的,即创造力不可计算的观点是正确的,那么相关的努力都是错误的。彭罗斯的反对者则认为,创造力可以被精确的认识正因为它是算法,可以写出来并输入计算机,由计算机执行。如果一定的心智过程被发现是不具备可计算性的,恰恰揭示了可计算性的概念和心灵的本质[18]。
5 应对与发展
机器发现研究取得的成就无法否认。科学发现的认知模拟避开了二元论的形而上形式,使得对科学发现的研究加入了科学祛魅的传统,证明了科学创造力是可以研究的经验问题,为揭示人类心灵的创造性何以可能提供了新的认识手段。科学发现的认知模拟作为获取创造力机制新证据的方法,推进了对科学创造思维过程的认识,提供了科学创造力理论检验的新手段,为科学发现的机器实现奠定了基础。但各种批评和挑战也表明,建立在计算表征理论基础上的机器发现研究还不完善,它并不能说明关于科学创造思维和科学创造力的所有方面。作为认知科学的子领域,它也不能避开认知科学与生俱来受到的责难。
然而,因批评和挑战即否认机器发现在科学创造力研究上取得的成就,或断然放弃机器发现研究也不足取。机器发现研究面临的问题,也是认知科学所要应对的问题。从认知科学对心智的计算表征理解的中心假设出发,要进一步发展科学发现认知模拟研究和应对这些挑战,在根本上需要对计算表征理论进行扩展和补充。一方面,可以考虑增加新的计算和表征观念,将价值、社会的相互影响、动机、情感或人格等方面的因素理论化,对计算表征理论进行扩展。另一方面,可以考虑使用非计算、非表征的观念补充计算表征理论,实现认知科学与神经科学、生物学、人类学、社会学等学科的整合。事实上,机器发现研究者已经开始涉及这些方面的工作,如吸收创造心理学、科学社会学等领域的研究成果,不仅考察历史上的科学发现案例,也观察正在进行的科学实验室活动,尝试将动机、社会评价、协作等要素融入机器发现模拟程序中。
随着认知科学的进一步发展,随着各学科领域在机器发现研究中的进一步融合、各领域学者的更多参与和关注,机器发现研究或许会给我们带来更多的收获。但这还需留待时间和实践的进一步检验。
收稿日期:2007-06-18
注释:
①启发式是提高问题解决效率的经验法则。
标签:科学论文; 认知科学论文; 创造性思维论文; 计算机模拟论文; 创造力论文; 认知发展理论论文; 思维品质论文; 系统思维论文; 科学思维论文; 认知过程论文; 基础心理学论文; 心智模型论文;