关于规范、价值和偏好的实践推理论文

关于规范、价值和偏好的实践推理

廖备水 余 喆 莱恩·范德托

摘 要: 在设计人工智能主体的社会时,可以通过定义社会价值和规范来约束主体的行为。当不同规范之间发生冲突时,主体依据他/她对价值的排序做出决定,选择违反一些规范,遵守更重要的规范。关于规范的推理具有可废止性和非单调性。为研究非单调推理,20世纪80年代以来,出现了缺省逻辑、自认识逻辑、限定推理等形式系统。这些系统在实际应用中存在不少问题,比如,计算复杂性高、缺乏动态处理机制等。针对这些问题,本文引入基于价值排序的一种抽象规范系统,给出一种基于可废止逻辑的偏好规范推理模型和一种基于论辩逻辑的偏好规范推理模型,并比较了这两种模型的优缺点。前者适合于持谨慎态度的主体的认知推理,但在实践推理中可能导致某些规范系统的外延为空。后者不仅支持怀疑性推理,也支持轻信推理,在实践推理中具有优势。此外,基于论辩逻辑的偏好规范推理模型还能够发挥其抽象框架的优势,对不同论证之间的动态关系进行推理和研究。

关键词: 实践推理; 社会规范; 社会价值; 可废止逻辑; 形式论辩; 社交网络

一、引 言

随着人工智能的飞速发展,自动驾驶汽车、医疗机器人、家庭服务机器人等设施不断增加,由此引发人工智能的伦理问题。① Virginia Dignum,Ethics in Artificial Intelligence:Introduction to the Special Issue,Ethics and Information Technology,vol.20,2002,pp.1-3. 为了使得人工智能主体的行为符合人类社会的预期,需要建立有效途径来约束主体的行为。现有的主要手段可以粗略地划分为硬性约束和柔性约束两类。前者给机器指定硬性的条件,当这些条件不满足时,主体不能实施特定行为;后者通过定义(社会)价值和规范,当不同规范发生冲突时,主体可以依据它对价值的排序,选择违反某些规范,遵守较为重要的规范。考虑下面的伊索寓言故事——蚂蚁和蚱蜢。② 伊索:《蚂蚁和蚱蜢》,米歇尔·沃克改编,吴永生译,北京:清华大学出版社,2004年,第1—30页。

为了储备冬天的食物,蚂蚁在炎热的夏天里辛勤工作,而蚱蜢却坐在树枝上弹着吉他,嘲笑蚂蚁。冬天如期而至,蚂蚁躲进屋子里过冬,有暖暖的窝,充裕丰富的粮食,过得很安稳,而贪玩的蚱蜢却既没有粮食也没有房屋,寒冷和饥饿侵蚀着他。饥寒交迫的蚱蜢向蚂蚁要食物。为了公平,蚂蚁本来不想给蚱蜢食物,但又觉得蚱蜢很可怜。于是她走到厨房里帮他拿了一些面包。

可是当她回来时,蚱蜢和他的吉他已经结冻成冰了。

这则寓言蕴含着几个十分重要的价值理念,如生存、快乐、公平、怜悯等。蚂蚁和蚱蜢对这些理念的重要性有着不同的排序,从而决定了不同的行为选择。

N1:为了快乐,夏天应该不劳动。

N2:为了生存,夏天应该劳动。

本研究根据垃圾填埋场的特点,建立了沼气产气模型,并进行了相应沼气发电机组的设计;根据沼气机组的余热特点,提出了利用余热进行发电的方案。利用沼气发电机组发电,不仅解决了沼气的去处问题,还通过发电产生了一定的效益。利用机组余热,通过ORC循环进行发电,进一步提高了沼气发电的效率,具有节能环保高效的特点。

N3:出于公平,应该不要把食物送给不劳动者。

注重塑料包装的个性化设计。人性化设计要求产品包装拥有方便、舒适、灵巧等优势,而随着消费者变得愈加理智和客观,包装已经不能再局限于装饰美化的功能,更多是要体现产品包装的本质要求,并站在消费者的角度考虑产品本身及包装设计。随着消费者的审美水平和文化修养不断提升,讲究文化品位、满足心理需求才是如今的重头戏,从合理性和环境保护角度出发,综合考虑生活的需求,将设计与实用性、情感、舒适度完全融合,设计师们敢于别出心裁,独树一帜,人性化设计将成为未来包装设计的主要设计理念[2]。

在炎热的夏天,对蚂蚁而言,长远的生存考量优先于短暂的快乐,N2优先于N1;对于蚱蜢来说,即时的快乐优先于长远的生存考量,N1优先于N2。在寒冷的冬天,对于拥有食物的蚂蚁来说,当她认为公平优先于怜悯时,N3优先于N4;反之,N4优先于N3。这个例子尽管简单,但可以折射出一系列的理论问题。

首先,在一个由多主体组成的社会网络(social network)中,不同的主体对价值的优先性的排序不同,导致他们具有不同的偏好、做出不同的决策。关于优先性与偏好关系的逻辑理论,可参考刘奋荣的《关于偏好动态性的推理》一书。① Fenrong Liu,Reasoning about Preference Dynamics,Dordrecht:Springer Netherlands,2011.

同时,锦鲤式营销利用的网络营销平台,大多为微博或者微信等社交网站,可以充分发挥病毒式营销的“让内容带来客户、让用户带来更多用户”的营销功能以及低成本、传播速度快的营销方式,最终有利于实现企业的经营目标。

其次,在多主体的情境下,一个主体的价值排序不仅决定他/她自己的行为,而且影响到其他主体的行为。在上述例子中,对于蚱蜢来说,如果他相信蚂蚁会出于怜悯给他食物,那么,他就会选择夏天不劳动,以实现自己“快乐”的价值,同时也不会牺牲“生存”的价值。为了刻画主体之间的信念、价值排序和决策的相互影响,需要在社会层面上开展研究。譬如,建立主体之间的信息互动和博弈的模型。刘奋荣和谢立民提出了一种刻画主体选择的认知模型,并利用该模型对主体未来的行为和状态进行推理与预测;② 参见刘奋荣、谢立民:《关于社交网络中主体行为的推理与预测》,《暨南学报》2018年第12期。 范本特姆(van Benthem)和刘奋荣则通过图博弈来表示主体间互动的场景,从而可以使用模态逻辑及其扩展来研究图博弈的各种性质。③ 参见约翰·范本特姆、刘奋荣:《图博弈的设计与模态逻辑的发展》,《清华大学学报》2019年第2期。

最后,由于价值的多样性、主体行为的不确定性、规范的可废止性等现实情况,难以把价值和规范建模为硬性的约束条件,强加给主体。在现有文献中,提出了各种主体模型以实现主体的自主决策。其中,BDI(信念—期望—意图)模型用信念、愿望和意图这三种态度来刻画主体的结构,通过规划库来研究该模型的抽象性质和推理过程;④ Nicolás D.Rotstein,Alejandro J.García and Guillermo R.Simari,Defeasible Argumentation Support for an Extended BDI Architecture,in I.Rahwan,S.Parsons and C.Reed eds.,Lecture Notes in Artificial Intelligence,Berlin,Heidelberg:Springer Berlin Heidelberg,Vol.4946,2008,pp.145-163. BOID是一种基于义务的模型,用于刻画规范对主体行为的约束;⑤ Jan Broersen,Mehdi Dastani,Joris Hulstijn and Leon van der Torre,Goal Generation in the BOID Architecture,Cognitive Science Quarterly,Vol.2,No.3-4,2002,pp.428-447. AATS,称作“基于动作的交替转移系统”,用于建模多主体的联合行动及系统状态转移。⑥ Michael Wooldridge and Wiebe van der Hoek,On Obligations and Normative Ability:Towards a Logical Analysis of the Social Contract,Journal of Applied Logic,Vol.3,Iss.3-4,2005,pp.396-420. 为了反映主体的价值排序对规范及主体行动的影响,阿特金森(Atkinson)等人将价值引入了AATS。⑦ Katie Atkinson and Trevor Bench-Capon,States,Goals and Values:Revisiting Practical Reasoning,Argument&Computation,Vol.7,No.2-3,2016,pp.135-154. 这三类模型都涉及认知推理和实践推理,对主体的行为决策进行探讨。

在小型农田水利工程管理过程中,要有效解决建设期间的资金短缺问题,最佳解决办法是通过多种渠道开展资金筹措工作。首先,政府部门应积极在该方面划拨一定的支持资金,重视小型农田水利工程建设管理工作,加强财务投资力度,在财政资金分配方面,加大对该方面的划拨比例。其次,政府部门应在工程施工开展前,在社会中积极寻找融资渠道,然后使小型农田水利工程参与融资项目中,借以拓宽工程建设的筹资渠道。

他重新振作起来,继续前进,心里又产生了一种新的恐惧。这不是害怕他会束手无策地死于断粮的恐惧,而是害怕饥饿还没有耗尽他的最后一点求生力,他已经给凶残地摧毁了。这地方的狼很多。狼嗥的声音在荒原上飘来飘去,在空中交织成一片危险的罗网,好像伸手就可以摸到,吓得他不由举起双手,把它向后推去,仿佛它是给风刮紧了的帐篷。

为了建模推理的可废止性问题,20世纪80年代以来,出现了一系列非单调推理系统,如缺省逻辑、② Raymond Reiter,A Logic for Default Rasoning,Artificial Intelligence,Vol.13,Iss.1-2,1980,pp.81-132. 自认识逻辑、③ Robert C.Moore,Semantical Considerations on Nonmonotonic Logic,Artificial Intelligence,Vol.25,Iss.1,1985,pp.75-94. 限定推理、④ John McCarthy,Circumscription——A Form of Non-monotonic Reasoning,Artificial Intelligence,Vol.13,Iss.1-2,1980,pp.27-39. 可废止逻辑、⑤ Donald Nute,Defeasible Logic,in Bartenstein O.,Geske U.,Hannebauer M.and Yoshie O.eds.,Web Knowledge Management and Decision Support,Berlin,Heidelberg:Springer Berlin Heidelberg,2001,pp.151-169. 回答集编程、⑥ Vladimir Lifschitz,Action Languages,Answer Sets,and Planning,in Apt K.R.,Marek V.W.,Truszczynski M.and Warren D.S.eds.,The Logic Programming Paradigm,Artificial Intelligence Series,Berlin,Heidelberg:Springer Berlin Heidelberg,1999,pp.357-373. 形式论辩⑦ Phan Minh Dung,On the Acceptability of Arguments and Its Fundamental Role in Nonmonotonic Reasoning,Logic Programming and N-Person Games,Artifical Intelligence,Vol.77,Iss.2,1995,pp.321-357. 等。这些非单调推理系统在实际应用中存在不少问题,比如,计算复杂性高、缺乏动态处理机制、难以建模多主体交互中的推理等。鉴于此,本文采用范本特姆和刘奋荣等人提出的优先性排序与偏好的关系理论,同时选取可废止逻辑和形式论辩(也称为“论辩逻辑”⑧ 廖备水,黄华新:《不一致问题与论辩逻辑》,《学术月刊》2013年第6期,第64—69页。 )作为理论基础,建立关于价值、规范和偏好的实践推理模型,并利用新模型进一步研究实际的问题。

本文的结构如下:第二部分介绍基于价值的抽象规范系统,用于表示价值、规范以及偏好关系;第三部分给出基于可废止逻辑的偏好规范推理;第四部分讨论基于论辩逻辑的偏好规范推理;第五部分介绍相关研究;第六部分是结论与未来工作。

减少VOC对人造板行业意味着什么?可持续建筑产品联盟的Simon Corbey和邦戈大学的生物复合材料中心的Ceri Loxton结合了他们的专业知识来解释一个将越来越重要的问题。

二、基于价值的抽象规范系统

关于规范的推理与道义逻辑密切相关,是逻辑学领域的一个重要研究方向。由于本文主要关注主体如何根据价值排序处理规范推理中的可废止性问题,我们采用输入/输出逻辑的抽象规范系统(简称为HANS)。⑨ Beishui Liao,Nir Oren,Leendert van der Torre and Serena Villata,Prioritized Norms in Formal Argumentation,Journal of Logic and Computation,https://doi.org/10.1093/logcom/exy009,2018. 在这个系统中,规范被表示为一个有序对(a,c)。其中,a表示情况或条件,代表规范的输入;c是在a情况下根据规范主体有义务做的事情,代表规范的输出。我们把a和c分别称为规范(a,c)的前提和结论。对于u=(a,c),我们用A(u)表示前提a,用C(u)表示结论c。给定一组规范集合S,C(S)={C(u)|u∈S}表示S的所有结论的集合。依据最新文献,① 参见Silvano Colombo Tosatto,Guido Boella,Leendert van der Torre and Serena Villata,Abstract Normative Systems:Semantics and Proof Theory,Principles of Knowledge Representation and Reasoning:Proceedings of the Thirteenth International Conference(KR 2012),California:AAAI Press,2012,pp.358-368. HANS被定义为一个四元组H=<L,N,C,r>,其中:

● L=E∪{¬e|e∈E}∪{丅}是全体元素集合;E是原子元素集合;

● N⊆L×L是有穷的规范集合;

我化妆成小厮混在人群中,在城头找到了他,他看是我来,非常吃惊,“你一个女子,在这里太危险,我不能保护你周全,你快走吧。”他决然地看着我,不容一丝商量。

● C⊆L称为情境,使得丅∈C且对所有的e∈E,{e,¬e}⊈C;

我们一起坐在池边。微笑中开始闲淡。我已经二十四岁了,长得绝不算丑陋,因而并不缺少与女孩约会的经验。与女人闲聊更是我的拿手好戏,我曾为此颇为自鸣得意。虽然我出生在乡下,但读过很多书,因而了解罗马的历史,尤其了解罗马的神话传说。

● r:N→IN是一个从规范到自然数的函数。

比较 PAC吸附和 Fenton试剂降解对 HHCB与AHTN的去除效果可以发现,在适宜的条件下,Fenton试剂比PAC吸附对HHCB与AHTN的去除效果更好,但Fenton试剂反应受pH值的影响更大。

对于所有a∈L,如果a∈E,用~a表示¬a;如果a=¬e,用~a表示e。对于规范(a,c),本文把r((a,c))简写作r(a,c)。考虑如下HANS的一个实例。

设L1={s,w,¬w,g,¬g,丅},C1={s,丅},N1={(s,w),(s,¬w),(¬w,g),(¬w,¬g)},r(s,w)=1,r(s,¬w)=2,r(¬w,g)=1,r(¬w,¬g)=2。其中,s,w,¬w,g,¬g分别表示“夏天”“应该劳动”“应该不劳动”“应该给食物”和“应该不给食物”。由此得到的一个HANS,记作H1,表示为图1。

图1 一个HANS的例子:H1

在HANS中,函数r对规范的排序是固定的,且未指明排序的缘由。在基于价值和规范的实际推理中,规范的排序取决于与之关联的价值排序。不同的主体有不同的价值排序,从而对规范有不同的排序。基于优先性与偏好的关系理论,② 参见Fengrong Liu,Reasoning About Preference Dynamics,Dordrecht:Springer Netherlands,pp.115-120. 本文把HANS扩展成一种基于价值的理论,简称VHANS。

一个VHANS是一个六元组HV=<L,N,C,V,Ag,ρ>,其中V是一组价值集合,ρ:N→V×Ag×IN把每条规范映射到一个由价值、主体和自然数组成的三元组。

每个VHANS代表一个可能的决策情境:每条规范对应于一个价值;同时,实施该规范的某个主体给这个价值指派一个优先级。为简单起见,在每个决策情境中,对于每条规范,仅考虑一个行为实施者。对于规范(a,c),本文把ρ((a,c))简写作ρ(a,c)。

下面结合图1的例子进一步说明VHANS的概念。设V={H,L,F,P},其中H、L、F和P分别表示价值“快乐”“生存”“公平”和“怜悯”;Ag={ant,grs}。设ρ(s,w)=(L,grs,1),ρ(s,¬w)=(H,grs,2),ρ(¬w,g)=(P,ant,1),ρ(¬w,¬g)=(F,ant,2)。由此得到的一个VHANS,记作H1V,如图2所示。

图2 一个VHANS的例子:H1V

图2表示的是与“蚂蚁与蚱蜢”的故事相对应的情节发展:夏天里,在“应该劳动”和“应该不劳动”的两条互相冲突的规范之间,蚱蜢对快乐价值和生存价值给出了一种排序;此后在冬天,在“应该给食物”和“应该不给食物”两条互相冲突的规范之间,蚂蚁对公平价值和怜悯价值给出了一种排序。这样,对于特定的规范系统,在不同的主体对各条规范进行价值排序后,形成了一个决策情境。显然,每当主体改变对价值的排序,就会得到一个新的决策情境。可以看出,给定一个VHANS,当不关注排序的缘由时,可将它规约为一个HANS。

三、基于可废止逻辑的偏好规范推理

在一个HANS中,由于规范之间可能存在冲突,因此关于规范的推理是非单调的或可废止的。使用非单调逻辑的术语,本文把一个HANS称为一个可废止理论。在一个可废止理论中,如果可废止规则(规范)的优先性排序不是全序的,那么,它可能存在多个外延。对于一个HANS H=<L,N,C,r>,如果一个文字① 本文把literal翻译为“文字”。它是离散数学中的一个术语,指的是一个原子命题或者原子命题的否定。 a∈L在所有的外延中,我们说它被怀疑地(skeptically)推出;否则,它被轻信地(credulously)推出。这里的推出关系的定义取决于不同的逻辑系统。本文将介绍两种不同类型的偏好规范推理系统。

第一种方法基于可废止逻辑。该逻辑于1987年由纽特(Nute)首先提出。② Donald Nute,Defeasible Reasoning,Proceedingsof the20th Hawaii International Conferenceon System Scienc,University of Hawaii,New York:IEEE Press,1987,pp.470-477. 一个可废止理论由五种不同的知识组成:事实、硬性规则、可废止规则、废止者和规则上的偏好关系。事实是不可辩驳的陈述,例如“蚂蚁是动物”。规则由前提、箭头符(“→”,“⇒”和“”分别表示硬性规则、可废止规则和废止者)和结论组成,其中前提是一组文字的集合,结论是一个文字。由于在HANS中所有规范都可以理解为可废止规则,我们只需要箭头符“⇒”。

作为一种非单调的方法,可废止逻辑采用怀疑论的观点来构造结论。我们把H=<L,N,C,r>的结论定义为一个带标签的文字,并有如下两种形式:

+∂q:指q∈L在H中是以可废止的方式可证的;

-∂q:指我们已经证明q∈L在H中是以可废止的方式不可证的。

在这里,一个证明是H中的一个推导,它是由规范构造的带标签文字的有限序列,表示为P=(P(1),…P(n))。对应于上述两种结论,当采用模糊阻止型(ambiguity blocking)③ Guido Governatori,Micheal J.Maher,Grigoris Antoniou and David Billington,Argumentation Semantics for Defeasible Logic,Journal of Logic and Computation,Vol.14,Iss.5,2004,pp.675-702. 可废止逻辑时,有如下两种推理规则分别说明推导是如何展开的。其中,N[q]表示N中结论为q的规范集合;P(1..i)表示序列P的长度为i的初始部分。

对于肥料的染色问题,汪洪表示,“本色”就是肥料的“内涵”,肥料的无效人为染色,仅美化了肥料的外观,并没有带来和增加养分,不会改善肥料施用效果,反而增加了产品成本,同时还为肥料造假埋下了隐患。他表示,目前肥料染色问题的解决还需要不断行动,对市场上的肥料染色剂种类、使用量等进行统计,评估肥料染色对土壤、农产品的影响,推动肥料染色剂在产品包装上的标注。

+∂:可以添加P(i+1)=+∂q,如果

基于论证之间攻击关系和优先关系的定义,击败关系可以被定义为:

(2)∀v∈N[~q],

(2.1)∃a∈A(v):-∂a∈P(1..i),或者

(2.2)∃w∈N[q]使得∀a∈A(w):a∈C或者+∂a∈P(1..i),并且r(w)>r(v).

-∂:可以添加P(i+1)=-∂q,如果

(1)∀u∈N[q]∃a∈A(u):-∂a∈P(1..i)或者

(2)∃v∈N[~q]使得

晚期肿瘤患者及照顾者的心理健康状况密切相关,针对引起心理问题的不同因素采取干预措施,能有效降低照顾者的负担,缓解晚期肿瘤患者情绪,使两者都能以健康积极的心态面对疾病,有助于提高家庭的生活质量。

(2.1)∀a∈A(v):a∈C或者+∂a∈P(1..i)并且

对于一家企业而言,盈利是发展的基础,慕俄格酒店扎根方城,更在方城勇当酒店运营的标兵。今年8月,酒店积极联系毕节市、大方县婚庆公司,以合作的形式推出国庆黄金套餐,以市场为基准,不断优化酒店经营,为顾客提供优质的服务。不仅如此,酒店凭借优越的地理位置,积极拓展互联网渠道,与包括国内知名的旅游平台美团网、携程网、去哪儿网等达成酒店客房部业务合作,网上综合评分达到了4.8分,如今慕俄格酒店在整个毕节地区已家喻户晓,云南建投集团的影响力也随之节节攀升。

(2.2)∀w∈N[q],∃a∈A(w):-∂a∈P(1..i)或者r(w)≤r(v).在上述推导中,为了说明q是以可废止的方式可证明的,不仅需要有一个可以应用的结论为q的规范(1),而且还要考虑可能的“攻击”,即支持~q的推理链。具体来说,为了可废止地证明q,必须说明:对于那些结论为~q的所有规范,它们或者前提不可证(2.1),或者被优先级更高的规范所反驳(2.2)。用于-∂的推理规则是用于+∂的推理规则的结构上的补,具体解释略。

依据比林顿(Billington)等人的工作,对于一个可废止理论,一个文字是否可证明是唯一确定的。① David Billington,Grigoris Antoniou,Guido Governatori and Michael Maher,An Inclusion Theorem for Defeasible Logics,ACM Transaction on Computational Logic,Vol.12,Iss.1,2010,pp.1-25. 严格地讲,有如下性质:

对于一个HANS H=<L,N,C,r>,对于任意的q∈L,要么+∂q成立,要么-∂q成立,但不可能+∂q和-∂q同时成立。

由于+∂q成立与否是唯一确定的,每个H有唯一的外延,即有唯一的一组以可废止的方式可证的文字集合。因此,对于每个+∂q,可以说q被怀疑地推出。

本文进一步讨论图1的例子。依据H1,可以构造如下推理序列:P(1)=+∂¬w,P(2)=-∂w,P(3)=+∂¬g,P(4)=-∂g。因此,¬w和¬g可以被怀疑地推出。另外,若把r(s,¬w)=2修改为r(s,¬w)=1,可以得到另一个HANS,记作H1′,如图3所示。依据H1′,可以构造如下推理序列:P(1)=-∂¬w,P(2)=-∂w,P(3)=-∂¬g,P(4)=-∂g。这时,所有4个文字(w,¬w,g和¬g)既不能被怀疑地推出,也不能被可废止地推出。从这个例子可以看出,如果一个主体对两条互相冲突的规范在优先性的排序上是相等的,那么,他无法做出决策。回到蚂蚁和蚱蜢的故事中,如果蚱蜢对夏天“应该劳动”和“应该不劳动”两条规范的排序相等,那么,在两种行为选择之间他会左右为难。

图3 另一个HANS的例子:H1

依据这个例子,可以直接得到如下性质。

N4:出于怜悯,应该把食物送给不劳动者。

存在某些HANS H=<L,N,C,r>,对于所有的q∈L/C,+∂q不成立,即-∂q成立。

本文不深入研究优先性与偏好的关系、不同主体之间的相互影响和互动的推理。相反,本文着重研究在给定规范和价值排序的前提下,如何建模实践推理。这里涉及两个问题:价值的优先排序如何与规范推理相结合?如何处理规范推理的可废止性和非单调性问题?对于第一个问题,范本特姆等人把关于优先性排序的双层结构模型应用在道义逻辑中,实现了优先关系图(priority graphs)与道义世界之间不同排序(betterness ordering)的结合。① Johan van Benthem,Davide Grossi and Fenrong Liu,Priority Structures in Deontic Logic,Theoria,Vol.80,Iss.2,2014,pp.116-152. 就第二个问题而言,规范推理的非单调性与其可废止性有着密切的关系:在多主体社会中,不同的规范之间常常存在潜在的冲突,如上述例子中N1和N2,以及N3和N4。由此带来的问题是,使用此类规范进行的推理具有动态性和可废止性。换句话说,一条涉及某个行动的规范是否可接受,取决于与之冲突的其他规范的状态以及这些规范之间的优先级。在上述例子中,假定初始系统中只有一条规范N1,那么可以推出“夏天应该不劳动”;若新的规范N2加入,并且N2优先于N1,则可以推出“夏天应该劳动”。这样,之前“夏天应该不劳动”的结论就需要被撤回。

依据这个性质,在可废止逻辑系统中,某些HANS的外延为空集。该特性适合于持谨慎态度的主体的认知推理。不过,对于必须对可能的行动做出选择的实践推理,外延为空集往往不能满足现实要求。在上述例子中,当某个主体对规范(s,w)和(s,¬w)有相同的偏好时,仍然需要做出选择。

四、基于论辩逻辑的偏好规范推理

与可废止逻辑通过构造推理链的证明过程不同,论辩逻辑则通过构造论证、比较论证和评估论证来实现推理。

● 一个论证α∈A可被E防御,当且仅当对于所有β∈A,如果(β,α)∈R,那么,存在γ∈E使得(γ,β)∈R;

给定一个HANS H=<L,N,C,r>,H上的一个从a1到an的路径是一个规范序列[(a1,a2),(a2,a3),…,(an-1,an)],使得{(a1,a2),(a2,a3),…,(an-1,an)}⊆N,n≥2,且序列中的所有规范都不相同。路径[(a1,a2),(a2,a3),…,(an-1,an)]是一致的,当且仅当{a1,a2,…,an}是一致的,即在该集合中不存在ai和aj使得ai=~aj,其中1≤i≤n,1≤j≤n。为简便起见,把路径[(a1,a2),(a2,a3),…,(an-1,an)]记作[a1,a2,a3,…,an]。给定一个HANS H=<L,N,C,r>,我们把H上的一个从a1∈C到某个an∈L的一致的路径[a1,a2,a3,…,an]称为论证,记作α。把Concl(α)=an称为α的结论。给定一个论证α,把[a1,…,ai](1≤i≤n)称作α的子论证。把由H构造而来的所有论证集合记作arg(H)。

为了切实提高患者服务,医院每个月要组织一次改进服务联席会议,分管副院长主持,朱鹏立院长参会,医院服务中心大部分职能科室、相关临床医技科室都要参加。这一会议的第一个议程,一般都是由医院服务中心汇报工作,满意度调查、投诉、服务窗口患者等候数据等;分析数据背后的问题,提出整改建议;等等。

第二,论证的比较涉及两个方面:论证之间的攻击关系和击败关系的识别。论证之间的攻击关系定义:给定一组论证集合arg(H),对于α,β∈arg(H),α攻击β,当且仅当存在β的子论证β’,使得Conl(α)=~Conl(β’)。我们把arg(H)中论证之间的所有攻击关系集合记作att(H)。

不同的论证经常有不同的强度(通常称为优先关系)。论证的优先关系取决于用于构造论证的各个元素的优先关系。在本文中,由于每个论证均包含一组非空的规范集合,为了获得两个论证的优先关系,需要比较两个由规范组成的集合之间的关系。这就涉及如何从论证元素之间的优先关系提升到论证之间的优先关系,存在不同的选择。一方面,可以考虑如何选择用于比较的元素,有最弱链(weakest link)原则和最后链(last link)原则;另一方面,要比较集合之间的优先关系,有民主(democratic)方法和精英(elite)方法。① Sanjay Modgil and Henry Prakken,A General Account of Argumentation with Preferences,Artificial Intelligence,Vol.195,2013,pp.361-397. 这与把集合元素之间的偏好关系提升到集合之间的二元关系,在技术上有类似之处,可参考刘奋荣的工作。② Fenrong Liu,Von Wright’s“The Logic of Preference”revisited,Synthese,Vol.175,Iss.1,2010,pp.69-88. 这里采用如下定义:

设α=[a1,…,an]和β=[b1,…,bm]是arg(H)中的两个论证。令Φ1={a1,…,an},Φ2={b1,…,bm}。根据最弱链原则,α优先于β,记作αwβ,当且仅当存在b∈Φ2\Φ1,使得对于所有a∈Φ1\Φ2,r(b)≤r(a)。根据最后链原则,α优先于β,记作αlβ,当且仅当an≥bm。当忽略下标时,αβ意指αwβ或αlβ。③ Beishui Liao,Nir Oren,Leendert van der Torre and Serena Villata,Prioritized Norms in Formal Argumentation,Journal of Logic and Computation,https://doi.org/10.1093/logcom/exy009,2018.

(1)∃u∈N[q]∀a∈A(u):a∈C或者+∂a∈P(1..i);并且

对于两个相互攻击的论证α和β,对于某种排序原则w或l,如果α优先于β,那么,α击败β。本文把arg(H)中论证之间的所有击败关系集合记作defeatw(H)或defeatl(H)。当不含下标w或l时,defeat(H)指其中任何一种。给定一个HANS H=<L,N,C,r>,本文把FH=(arg(H),defeat(H))称作由H构造而来的抽象论辩框架,简称AAF。

图1中的H1可以构造如下论证集合:x1=[s,¬w],x2=[s,w],x3=[s,¬w,g],x4=[s,¬w,¬g];论证之间的攻击关系集合:att(H1)={(x1,x2),(x2,x1),(x2,x3),(x2,x4),(x3,x4),(x4,x3)};论证之间的优先关系集合:x1x2,x4x3。因此,defeat(H1)={(x1,x2),(x4,x3)}。令F1=(arg(H1),att(H1)),F2=(arg(H1),defeat(H1))。图4为论辩框架F1和F2

图4 抽象论辩框架F1(左)和F2(左)

第三,论证的状态评估在AAF中进行。给定一个AAF,依据特定的评价标准,把一组集体可接受的论证集合称为一个外延。① Phan Minh Dung,On the Acceptability of Arguments and Its Fundamental Role in Nonmonotonic Reasoning,Logic Programming and n-Person Games,Artificial Intelligence,Vol.77,1995,pp.321-357. 通常,我们把依据特定评价标准,从一个AAF到一组外延集合的映射关系称为论辩语义。令F=(A,R)是一个AAF,E⊆A是一组论证的集合。下面列举论辩语义中的一些重要概念:

● E是无冲突的,当且仅当不存在α,β∈E,使得(α,β)∈R;

首先,论证的定义和构造有不同的方法,如ASPIC+、② Sanjay Modgil and Henry Prakken,The ASPIC+framework for Structured Argumentation:A Tutorial,Argument&Computation,Vol.5,No.1,2014,pp.31-62. ABA、③ Francesca Toni,A Tutorial on Assumption-based Argumentation,Argument&Computation,Vol.5,No.1,2014,pp.89-117. DeLP④ Alejandro J.García and Guillermo R.Simari,Defeasible Logic Programming:An Argumentative Approach,Theory and Practice of Logic Programming,Vol.4,Iss.2,2004,pp.95-137. 等不同的形式论辩理论。在本文讨论的HANS中,一个论证可以被看作是一个一致的路径,具体定义如下:

● E是可相容的,当且仅当E是无冲突的,且E中的所有论证都可被E防御。

● E是一个完全外延,当且仅当E是可相容的,且A中所有可以被E防御的论证都在E中;

● E是一个优先外延,当且仅当E是集合包含意义上极大的完全外延;

● E是一个基外延,当且仅当E是集合包含意义上最小的完全外延;

● E是一个稳定外延,当且仅当E是无冲突的,且对于所有α∈A\E,存在β∈E使得(β,α)∈R。对于每个外延E,我们用Concl(E)={Concl(α)|α∈E}表示E的结论集合。

依据上述概念,在完全语义下,F1的外延为:E1={},E2={x1},E3={x1,x3},E4={x1,x4},E5={x2}。其中,E3、E4和E5既是优先外延,也是稳定外延;E1是唯一的基外延。对于F2,它只有一个唯一的优先外延E4={x1,x4}。同时,E4也是唯一的稳定外延和基外延。

对于E4={x1,x4},有Concl(E4)={¬w,¬g}。因此,在基语义下,¬w和¬g可以被怀疑地推出。这个例子表明,在基语义下,基于论辩逻辑的方法与基于模糊阻止型可废止逻辑的方法有相同的外延。值得注意的是,这种对应关系并非总是成立。下面就是一个反例。② Guido Governatori,Micheal J.Maher,Grigoris Antoniou and David Billington,Argumentation Semantics for Defeasible Logic,Journal of Logic and Computation,Vol.14,Iss.5,2014,pp.675-702.

设H2=<L2,N2,C2,r>,其中L2={a,¬a,b,¬b,丅},C2={丅},N2={(丅,a),(丅,¬a),(丅,b),(a,¬b)},r(丅,a)=r(丅,¬a)=r(丅,¬b)=r(a,b)=1。依据阻止型可废止逻辑,有-∂a,-∂¬a,+∂b和-∂¬b。因此b可被怀疑地推出。另一方面,由H2可以构造如下论证:y1=[丅,a],y2=[丅,¬a],y3=[丅,b],y4=[丅,a,¬b]。相应的论辩框架,记作F3,如图5所示。由于在基语义下,F3的外延为空集,a、¬a、b和¬b均不可被怀疑地推出。

图5 抽象论辩框架F3

上述讨论表明,对于相同的可废止理论,不同的非单调推理系统可能输出不同的结果。除此之外,与基于可废止逻辑的方法相比,基于论辩逻辑的方法还具有一些优点:它不仅支持怀疑性的推理,而且支持轻信的推理;它更便于处理系统的动态性。具体来说,

第一,在论辩逻辑中,通常有多种论辩语义可供选择。对于图5中的F3,有三个外延:{y1,y3}、{y1,y4}和{y2,y3}。因此,a、¬a、b和¬b均可以被轻信地推出。

第二,在可废止逻辑中,为了证明一个命题成立,必须构造一个推理链。当系统中发生知识变更时,需要重新构造所有的推理链,效率低。在论辩逻辑中,由于论证之间的冲突处理在抽象的论辩框架进行,可以利用论证之间的可达关系来区分受影响和不受影响的论证,为处理系统动态性提供了便捷途径。① Beishui Liao,Li Jin and Robert C.Koons,Dynamics of Argumentation Systems:A Division-Based Method,Artificial Intelligence,Vol.175,Iss.11,2011,pp.1790-1814.

五、相关研究

与本文工作相关的研究包括基于优先级的非单调逻辑、基于优先级的论辩系统、基于价值的论辩理论等方面。在基于优先级的非单调逻辑方面,布鲁卡(Brewka)等人提出了一个为扩展逻辑编程附加优先性的方法。② Gerhard Brewka and Thomas Eiter,Preferred Answer Sets for Extended Logic Programs,Artificial Intelligence,Vol.109,Iss.1-2,1999,pp.297-356. 他们考虑了提供优先性信息的程序——来自对规则的严格偏序补充。这些附加信息用于解决潜在的冲突。他们认为,结论应该是那些包含在至少一个回答集中的文字。他们给出使用规则上的偏好来选择回答集的子集的方法,称之为首选回答集。根据这一方法,除非一个规则的假设被更优先级的规则击败,否则该规则就可应用。在基于优先级的论辩系统方面,杨(Young)等人运用结构化论辩框架(ASPIC+)来刻画布鲁卡的基于优先级的缺省逻辑(PDL),③ Anthony P.Young,Sanjay Modgil and Odinaldo Rodrigues,Prioritised Default Logic as Rational Argumentation,in Proceedings of the 15th International Conference on Autonomous Agents&Multiagent Systems(AAMAS 2016),Singapore:ACM 2016,2016,pp.626-634. 把缺省规则上的优先排序提升到论证层面上。这种优先排序方法可以刻画可废止规则在论证建构过程中的可应用性。他们证明了PDL中的推理结论和ASPIC+的实例化在稳定语义下的论证结论之间总是存在对应关系。在我们的前期工作中,结合HANS和形式论辩,构建了一种基于论辩的优先性抽象规范系统。④ Beishui Liao,Nir Oren,Leendert van der Torre and Serena Villata,Prioritized Norms in Formal Argumentation,Journal of Logic and Computation,https://doi.org/10.1093/logcom/exy009,2018. 该工作主要关注规范推理的三种典型分离方法:贪心方法、规约方法和最优解方法。本文证明了在全序条件下:1.根据最弱链原则提升的论证优先性在稳定语义下等价于贪心方法;2.根据最后链原则提升的论证优先性在稳定语义下等价于规约方法;3.使用最弱链原则和稳定语义,并在引入一些刻画论证之间的隐含攻击关系的击败关系后,最优解方法也可以用论辩系统来表达。在HANS中,对规范分离的定义和布鲁卡等人的初始形式体系不同。HANS不使用缺省否定来表示例外——即规则的可废止性;相反,使用可废止规则和规则的可应用性概念。此外,莫吉尔(Modgil)等人基于ASPIC+框架,构建一个带偏好的通用论辩框架。⑤ Sanjay Modgil and Henry Prakken,A General Account of Argumentation with Preferences,Artificial Intelligence,Vol.195,2013,pp.361-397. 他们用基于偏好扩展的塔尔斯基逻辑实例化ASPIC+,并证明了这一实例化结果满足论辩系统的理性假设。他们还强调对偏好的合理运用需要考虑论证的结构。

六、结论和未来工作

本文以构建一个能够反映社会价值,并可以根据优先级处理规范冲突的实践推理系统为目标,先介绍了一种基于价值的抽象规范系统,并将其分别与可废止逻辑和形式论辩两种非单调推理相结合,提出了两种不同的实践推理模型。

基于可废止推理的模型可以构建一个可废止理论,并且根据可废止规则的优先性排序,得出某个命题或行为以可废止的方式可证或不可证。

基于形式论辩的模型将抽象规范系统HANS中从一个元素到另一元素的非环路径可以看作是一个论证。根据规范的优先级,采用最弱链原则或最后链原则,提升论证之间的优先关系,从而可以比较论证并确定论证之间的击败关系,得到抽象论辩框架图;然后根据论辩语义得出可接受的论证外延,继而得到结论外延。基于形式论辩的模型的优点是可以发挥论辩方法能使推理过程更直观、易于为推理过程提供自然的解释,帮助用户理解应该遵守哪条规范。此外,论辩方法对动态性的处理比较灵活,在一些情况下,相比其他非单调推理手段计算复杂性较低。

比较两种方法,可以发现,如果在基于形式论辩的方法中采用的优先关系提升方式是最弱链原则,那么论辩系统的结果与基于可废止逻辑的方法具有对应关系:当规则之间的优先级关系是全序时等价。

由于实践推理要求根据不同的偏好得到不同的结论,而可废止逻辑只能得到一个可能为空的外延,不太适合于实践推理;基于论辩逻辑的方法则不仅支持怀疑性的推理,也支持轻信推理。此外,论辩逻辑可以通过局部评估论证状态,更简单地处理系统动态性问题。

抽象规范系统的推导形式有多种选择,除可废止逻辑和形式论辩两种方法外,还有其他非单调推理方法,如缺省逻辑、回答集编程等,在具体情境下使用何种逻辑应当考虑系统对动态性的处理能力、冲突关系的处理方式、计算复杂性、推理过程刻画的自然性与推理结果的合理性等多种因素。

现有工作还处于初步阶段,许多开放性问题尚待解决。对于偏好规范系统中规范的排序问题,现有的逻辑系统仅研究全序条件下的逻辑关系。在偏序条件下,可进一步研究基于形式论辩的推理系统的构成及其性质。① Beishui Liao,Nir Oren,Leendert van der Torre and Serena Villata,Prioritized Norms in Formal Argumentation,Journal of Logic and Computation,https://doi.org/10.1093/logcom/exy009,2018. 关于规范、价值和偏好的推理,本文仅关注特定情境下的推理问题。对于不同情境的形成和演化,则涉及多主体的联合决策和联合行动的问题。

基金项目: 国家社会科学基金重大项目“基于社交网络的信息流逻辑研究”(17ZDA026);国家社会科学基金重大项目“汉语隐喻的逻辑表征与认知计算”(18ZDA290);欧盟科研创新框架计划(Horizon 2020)项目“MIREL-MIning and REasoning with Legal texts”(690974)

作者简介: 廖备水,浙江大学语言与认知研究中心(杭州 310028);余喆,浙江大学语言与认知研究中心;莱恩·范德托(Leon van der Torre),卢森堡大学计算机科学与通信实验室(Esch-sur-Alzette,4364)

(责任编辑:王丰年)

标签:;  ;  ;  ;  ;  ;  ;  ;  

关于规范、价值和偏好的实践推理论文
下载Doc文档

猜你喜欢