哲学研究
图博弈的设计与模态逻辑的发展
约翰·范本特姆 刘奋荣
摘 要: 图博弈是一种主体间互动的场景,可以使用模态逻辑的语言描述。模态词用来描述博弈玩家的行为,博弈的均衡和玩家的必胜策略则通常用模态逻辑的公式刻画,这些公式具有特定的模式。取决于博弈目标的设定、对玩家互动机制的设计,图博弈有着各种不同的版本。与之对应,模态逻辑的语言不断发展和扩展,新的逻辑系统也呈现不同的性质。逻辑学一方面作为分析现有图博弈的一种方法,另一方面,逻辑学也是设计新博弈的灵感来源。图博弈与逻辑学之间的相互渗透为研究博弈提供了新的视角,也是对博弈论和计算理论方法的重要补充。
关键词: 图博弈; 必胜策略; 蓄意破坏博弈; 博弈逻辑; 模态逻辑
一、图博弈与模态逻辑
图博弈指的是在有向图或无向图上展开的博弈。其中,图中的顶点可以有标注,顶点之间的边可以是各种各样的关系。这种博弈应用非常广泛,常常用来模拟计算、辩论、信息交流、社交网络、战争情境等。例如,就社交网络而言,图中的顶点可以是主体,顶点之间的边可以表示社会关系,也可以是主体之间信息交互的通道。① Fenrong Liu,Patrick Girard and Jeremy Seligman,Logical Dynamics of Belief Change in the Community,Synthese,191(11),2014,pp.2403-2431. 就论辩而言,图中的顶点是论证(argument),顶点之间的关系是论证之间的攻击关系。换句话说,图博弈能够在理论上为社交网络或论辩提供一个模型。② 在图博弈的研究中,均衡(equilibrium)、必胜策略(winning strategy)等概念常常被用来研究玩家的推理和行为。另一方面,逻辑学作为研究主体推理的一门重要学科,通过形式语言、语义、公理化等手段对其展开研究。模态逻辑是20世纪60年代开始兴起的一门新的逻辑学分支,克里普克的可能世界语义学的模型与图博弈有着众多的相似点,每个顶点是一个可能世界,可能世界之间是基于主体认知的可及关系。这一部分将通过两个实例和现有的研究成果展示图博弈与模态逻辑之间的密切关系。②参见最早的文献Phan Minh Dung,On the Acceptability of Arguments and Its Fundamental Role in Nonmonotonic Reasoning,Logic Programming,and N-person Games,Artificial Intelligence,77(2),1995,pp.321-357。本期同一栏目下的另一篇论文也是以论辩逻辑为形式工具对社交网络中的实践推理展开研究,参见廖备水、余喆、莱恩·范德托:《关于规范、价值和偏好的实践推理》,《清华大学学报》2019年第2期。
可是,真的跟那些新毕业的小姑娘们去争工作吗?想想也还是算了。在家里睡到自然醒,买菜、做饭,看书、上网,一期不漏地看《百家讲坛》。
(一)旅行博弈
先介绍一个图上的旅行博弈。如图1所示,两名玩家A和E中的一位从图G的某个顶点开始沿着G的边旅行到另一个顶点,另一位玩家接着从新顶点出发旅行,如此轮流。如果轮到某个玩家,但没有边可以移动,那么,该玩家就输了博弈。如果博弈可以无限进行下去,则玩家E赢。
具体而言,假设玩家A先出发。考虑图中左边的部分。玩家A从顶点1出发,从1旅行到3,玩家E接着旅行到4,因为从4出发没有边,A输。当然,若E选择移动到1,然后A旅行到3,如此不断重复,博弈一直进行下去,E赢得博弈。有趣的是,A在这个图博弈中有一个必胜策略:A从1出发先旅行到2,然后E旅行到3,而这时,A旅行到4,这样可以确保E无路可走,A赢得博弈。如果旅行的出发点在其他顶点,可以采用类似的方法进行分析,见图1。
图1
接下来,考虑图1右边的部分。注意边的细微变化,即顶点2上有一个自返的边。这就意味着,玩家在顶点2的地方可以在原地旅行。我们仍然考虑玩家A从顶点1开始旅行,则在这个博弈中,E有一个必胜策略。我们考虑可能的几种情形:首先,假如A从1旅行到3,E可以不停地回到1,从而获得胜利。其次,如果A旅行到2,E走自返的边、停留在顶点2。最后,如果A想要防止E通过自返的边无限地停留在2而获胜,他必须移动到3,随后E可以移动到4而获胜。
旅行博弈还有其他的变种。譬如,获胜的条件可能不同于上面的例子,将在本文的后面进一步探讨。就目前的旅行博弈版本而言,根据盖尔-斯图尔特定理(Gale-Stewart Theorem),旅行博弈是“可确定的”(determined)。这就是说,给定任意的图G和起始位置s,记作(G,s),玩家A或者玩家E一定有一个必胜的策略。这样的形式结果能够帮助我们更好地理解图博弈中主体的行为规律、博弈的结果趋向。
这里的动态算子事实上是一种本地赋值,即让某一原子公式在当前位置上变成真的。以上逻辑语言的扩展看起来非常简单,但是,可以证明这个逻辑可以嵌入到已知的不可判定(undecidable)混合逻辑(hybrid logic)中去。② Declan Thompson,A Modal Logic of Local Graph Change,Department of Philosophy,Stanford University,2018. 因此,加入[+p]模态算子的模态逻辑是不可判定的。
我们每个人小时候都玩过捉迷藏的游戏,这里考虑只有两个玩家的情形。博弈的输赢直接与玩家之间的接触或互动有关。当藏起来的玩家听到对手说“我找到你啦!”的时候,就意味着后者已经赢得了博弈。在很多国家,类似的游戏也很常见。譬如,有一个叫做“追捕游戏”(games of‘Catch’),两个玩家A和E在同一点相遇,则A赢得博弈。这种博弈所对应的逻辑可以像前面一样使用二维模型和模态算子。不过,要表达此类博弈的目标,需要特别引入一个新的命题常元I,
这个不动点公式刻画了图中顶点的最大子集P。它的意思是,不论玩家A如何旅行,玩家E都可以一直在P点集中移动。① 这里实际上涉及“稳定性”的概念,譬如,社交网络中主体的行为在什么条件下能够达到稳定状态。最新的讨论,参见刘奋荣、谢立民:《关于社交网络中主体行为的推理和预测》,《暨南学报》2018年第12期。
以上的分析表明,关于旅行博弈的基本逻辑理论都包含在模态逻辑的理论中。由此,我们可以直接利用模态逻辑的相关结果得到一些关于旅行博弈的推论。譬如,可以在多项式时间内完成图的模态性质的模型检测(model checking)。模态语言对于博弈所使用的图是互模拟(bisimulation)不变的,这就使得通常的模态逻辑结论在图的变化下保持不变。还有旅行博弈的模态逻辑的有效式是可判定的。
(二)蓄意破坏博弈
与旅行博弈不同的是,蓄意破坏博弈的模态理论没有那么简单;相反,有一些让人吃惊的结果。基本的蓄意破坏模态逻辑的模型检测复杂度是多项式空间(Pspace)而非多项式时间(Ptime)。这意味着,在包含干扰的博弈算法中出现了复杂性的跳跃。此外,虽然这类模态逻辑仍可以有效地翻译为一阶逻辑,但它不是可判定的;尽管原则上它是可公理化的,比如说使用适当修改的表列系统(tableaux)方法,但简单的公理化结果仍然没有找到。对于蓄意破坏μ-演算,情况更为复杂。对不动点逼近的估值很可能需要跨越不同的图。这里存在很多开放的问题需要进一步研究。
对这些博弈设计参数的讨论,引发了一系列的理论问题。在第二部分中,本文讨论了如何将博弈本地化的问题,那样的改变直接影响到玩家在博弈中新的游戏方式。问题是,能否对所有可能的改变方式有更好的理解?譬如,能否建立一个标准,用它来衡量这些改变对博弈带来的影响。譬如,在计算复杂性方面,哪些设计的改变会对复杂性产生影响?另一方面,博弈的逻辑性质有没有随着博弈参数的变化还能以某种方式保持的性质?例如,获胜条件通常是“单调的”:当扩大目标区域,之前某个玩家的获胜条件仍然是他的获胜条件。还有没有类似的性质?
图2
在这个博弈中,恶魔有必胜策略:恶魔首先切断3和4之间一条边,之后适当回应旅行者的移动就可以赢得博弈。这里需要注意的是,恶魔的能力是全局性的,可以切断图中任何一条边。如果规定恶魔只能切断旅行者所在点连接的边,那么,恶魔就没有必胜的策略了。这些不难看出,本文不再赘述。
硬件设计主要针对系统设计中的定位系统及监测系统反馈记录元件而言,按照系统应用的需求,在整个系统的监控运行中,其对应的硬件设计中,借助PCL智能记录芯片,将整个系统运行中的监控信息进行监督反馈,通过PCL芯片的记录,能够将监控系统运行中的记录信息及时的反馈给地面监控中心,并且能够将对应的监控信息以数字化信号传输形式转换,借助信号转换中的芯片记录功能记录下对应的监控信息,保障在监控信息的监督管理中,能够为整体的系统监控功能优化提供保障,并且能够发挥出系统设计中的记录单元控制[4]。
同样,蓄意破坏博弈可以对很多有意义的情境进行建模。譬如,受干扰情况下的计算或信息获取过程,或迫使玩家进入图的某一子目标区域的学习过程。蓄意破坏博弈也满足盖尔-斯图尔特定理的条件,即此类博弈是可确定的。因此,旅行者或者恶魔总是有必胜策略。
就模态逻辑而言,范本特姆及其合作者们给出了新的模态逻辑对蓄意破环博弈中主体的行为进行研究。① Guillaume Aucher,Johan van Benthem and Davide Grossi,Modal Logics of Sabotage Revisited,Logic and Computation,28(2),2017,pp.269-303. 这个逻辑在基本的模态逻辑之上添加了新的非标准模态算子来刻画图的更改,即,描述当一条边(或一个有序对(x,y))从当前的可及关系中被删除后,在当前点上哪些句子为真。旅行者的必胜策略与下面的模态算子模式相关
上一部分讨论的蓄意破坏博弈中,两个玩家的能力非常不对称。旅行者只能沿着图上的点和路行走,即所谓的“本地化”。但恶魔的能力却是“全局的”,因为他可以在图的任何地方实施破坏、切断旅行路线。而在现实中,容易想象旅行博弈中两个玩家的能力对称的情形。譬如,在战争博弈中,旅行者代表战争的一方,恶魔代表他的敌人。恶魔只能在任何旅行者所在的位置上进行破坏——当然恶魔也可以在图上移动,到达某一位置再进行破坏。下面考虑几个具体的情境:例:本地化的双目标蓄意破坏博弈
蓄意破坏博弈有两个玩家,一个是旅行者,一个是恶魔。旅行者从图G中的某一顶点s出发开始旅行,一次沿着一条边进行。恶魔D每次可以切断图中任何一条边。两者轮流进行。当旅行者达到目标顶点或目标区域时,赢得博弈;当旅行者在某个点无法移动时,就输了博弈;当没有边可以切断时,恶魔输了博弈。与前面的旅行博弈最大的区别在于,在蓄意破坏博弈中,由于恶魔不断切断边,初始的图会随着博弈的进行而发生变化。
本文希望通过上面的两个例子说明图博弈与模态逻辑之间的关系。图博弈的规则可以不同,图本身可以发生变化,相应的,在逻辑学领域,可以利用基本模态逻辑或其扩展去刻画博弈中主体的行为,必胜策略,并研究与博弈相关其他问题和规律。逻辑学与博弈之间的这种关联也是本文要重点讨论的。本文主要关心这种关联如何成为可能,能提供什么思考和启发。
振动流化床气固两相流动是一个复杂的流动问题,目前大都是基于普通气固两相流数学模型,引入外力作用,还没有基于动力学原理建立的、物理意义明确的振动流化床气固流动模型,未来应在以下方面开展研究。
二、博弈的本地化
这一部分考虑上面博弈的几个具体变种,讨论与之匹配的逻辑理论。
(一)旅行博弈的本地化和占位博弈
首先,考虑在旅行博弈中两个玩家本地化的情形。所谓本地化,指的是两个玩家都在图中旅行,有自己的出发点和路线。也就是说,博弈的起始位置由(G,s,t)表示,其中G是博弈图,s是玩家A的起点,t是玩家E的起点。可以让A先旅行,也可以让两个玩家同时旅行。这里考虑前者,即所谓的序列博弈,一个玩家旅行一步之后另一个玩家接着旅行,两者轮流进行。① 序列博弈(sequential games)是玩家选择策略有时间先后的博弈形式。与之相对的是两个玩家同时选择策略,叫作共时博弈(simultaneous games)。 此外,我们规定获胜条件或设定一个目标。假定两个玩家的目标都是永远移动下去。这样的博弈不再是零和博弈了,因为两个玩家都能无限移动的结果是平局。尽管可以说,当一个玩家被卡住而另一个仍可以继续移动,则前一个玩家输了博弈。
这样的简单修改颠覆了旅行博弈的博弈特性,因为玩家的行为不再直接影响到其对手。当然,从长远的角度看,两位玩家的行为还是互相影响的。即便如此,与模态逻辑的联系仍然存在。此时,模态逻辑的模型是图(G,s,t),其中s和t是两个不同的顶点;模态语言是“二维的”,命题变元在单个顶点上为真。需要添加下面两个“旅行模态算子”(travel modalities):
观察组1、2的腓总神经、胫后神经CSA、D1、D2等数值与对照组相比均较高,且P<0.05;而观察组2各数值与观察组1相比较高,且P<0.05。见表。
利用这两个模态算子,可以更严格地表述前面的一些结果。比如,在起始位置为(s,t)的有限图中,如果存在自然数k使得[left]k在s上为真,且[right]k在t上为假,则第一个玩家就会输掉博弈。② Krister Segerberg,Two-Dimensional Modal Logic,Journal of Philosophical Logic,2(1),1973,pp.77-96. 此外,玩家的无限移动路径的存在性也可以用μ-演算公式来刻画。③ 然而,在基本模态语言中,甚至在模态μ-演算中,似乎没有一个公式可以表达首先到达目标这样的性质。 二维模型的基本模态逻辑仍然是可判定的,它与标准的极小模态逻辑没有太大的差别。这是因为这个新的模态语言可以翻译到只包含两个变元的一阶逻辑片段,而这个片段是可判定的。
与上述情景稍有不同,可以给两个玩家设定各自所要到达的不同目标区域。出现的新问题是图上的两个玩家是否能够真正互动。一个玩家的行为会必然改变或限制其他玩家的行为么?这涉及对博弈中主体之间互动如何理解的问题。下面的这个例子更能体现这一问题。
据悉,今后三方将在重大项目联合申报、核心产品研发、通用平台构建、行业标准制定和技术集成示范等方面加强合作,充分挖掘各自潜力,推动大数据技术在植保领域的研发与应用,将大数据、人工智能转化为实实在在的科技生产力。
换句话说,常元I表示图G上的等同关系。下面的逻辑公式刻画的是E的获胜位置:
相信添加常元后的二维模态逻辑仍然是可判定的。但是,目前尚不清楚如何将上述语言翻译到只含两个变元的一阶逻辑片段,最主要的问题在于需要在三个点上作比较:初始点s和t,以及到达的目标点s’。① 相遇博弈(meeting game)和模态互模拟之间有一个有趣的类比。如果两个模型M,N上的点s,t之间满足如下条件,则它们之间具有互模拟关系:从s到M中s的某个后继点s’的每一步,都存在t到N中t的某个后继点t’的某一步与之相匹配(即s’Zt’成立)。博弈的互模拟很像相遇/回避博弈。众所周知,互模拟是不能用只包含三个变元的一阶公式来刻画,因此,它的元理论比较复杂。
以下接着讨论另外一种博弈,叫做占位博弈(occupation game),玩家在图上要占据某个部分。可以设定“玩家到达各自所指定的目标区域”为决胜条件,考虑下面的具体例子,见图3。
图3
假设玩家A从顶点1开始移动。三步后A可以达他的目标点4,但这样会给玩家E足够的时间到达他的目标点10。所以,即使不是A到达其目标点的最短路径,A应该先移动到5,从而使E不能到达他的目标点10。
为了刻画一步步的占位产生的动态变化,需要在相应的逻辑语言中增加至少一个动态模态算子
这个算子可以用来刻画使得原子公式p在当前点上为真时,在当前点上成立的所有公式:
对逻辑学而言,旅行博弈有太多的启发意义。正如上面所提到的,图与模态逻辑的可能世界语义学有着惊人的相似性:图上的旅行是逻辑学家们所熟识的可能世界之间的可及关系,完全可以用模态算子(modality)来刻画。具体来说,玩家E的必胜策略通常涉及一个迭代的全称-存在模态算子□◇,它的意思是,对于A的任何选择E都有一个相应的移动策略。形式化而言,E在图博弈中的获胜位置可以由下面的模态μ-演算公式刻画:
面对这种情况,他俩毫不犹豫地蹲下身子,两只手齐下,用手指抠土。重新填沟的泥土并不太坚硬,但由于翻填时把地表面的碎石子、碎玻璃等杂物掺入土中,不大一会儿,手指就划破了,渗出了血。划破的指头又搅在湿潮、冰冷的泥土里,十指连心,直痛得额头滴下汗珠。他俩却咬紧牙关,不肯停手,直到找出没有缠绕胶带的管线,把它缠绕好,并经检查合格,方才罢手。
广西是一个多民族的以壮族为主体,地处我国西南边陲的地区,在民族迁徙和千百年的融合中,广西地区形成了具有自身特点的耳聋基因突变谱。因此对广西地区耳聋高危人群、患病人群进行分子筛查,查找新致病突变、丰富耳聋突变分子谱,有助于本地区制定相应的耳聋基因筛查策略;指导人群筛查、遗传咨询和临床诊断,并帮助高风险家庭进行产前诊断和医学干预,才能达到提高出生人口素质的目标。
与占位游戏类似的还有许多十分流行的棋盘游戏,比如“卡坦岛拓荒”(Settlers of Catan)。每个玩家都有自己独特的颜色,如果玩家所在的某个点还没有被着色,他会用自己的颜色来着色这个点。当玩家到达一个其他玩家着色的点时,他就输了。还有已有文献中所讨论的“投毒博弈”(poison game)也与着色非常类似,③ Pierre Duchet and Henri Meyniel,Kernels in Directed Graphs:A Poison Game,Discrete Mathematics,115,1993,pp.273-276. 近年不少学者也开始从逻辑学的角度对投毒博弈开展研究。④ Chris Mierzewski and Francesca Zaffora Blando,The Modal Logic(s)of Poison Games,Department of Philosophy,Stanford University,2016.
(二)蓄意破坏博弈的新版本
具有这种模式的句子可以解释为,无论恶魔怎么切边,旅行者都可以继续旅行。要想刻画旅行者在图博弈中的获胜位置,仍然需要进一步扩展逻辑的语言,把算子加入到模态μ-演算中。例如,假设蓄意破坏博弈的目标区域是所有满足公式γ的顶点的集合,可以用下面这个公式刻画旅行者的获胜位置:
考虑第一部分中最初的蓄意破坏博弈的四点图。现在,玩家T和D在不同的初始位置,T的目标点在右下角,D的目标点在左上角。首先规定哪些行为是允许。我们采取“移动—切除”模式:玩家先沿着某条边移动,然后,如果他愿意的话,切断某条边。
有趣的是,无论允许什么样的行为,这一设定显然会产生输赢之外的更为细化的目标分层:两个玩家自然都希望到达自己的目标区域而对方没有到达,稍差一点的情形是他们都到达各自的目标区域,更差一点的是他们都没有到达各自的目标区域,最坏的情况则是对方到达他的目标区域,而自己没有。在博弈论中,通常的做法是使用效益函数对这几个目标达成的不同程度进行刻画,通过两个玩家获得的效益体现。在研究玩家的推理和选择时,最常用的一个概念是逆向归纳法(Backward Induction)。假设每个主体都是理性的,即他们会选择自己获得的效益最高的策略。这样,自然以利用纳什均衡(Nash equilibria)的概念找到博弈的解决方案(solution)。
这里,同样有一个图博弈和逻辑匹配的理论问题。什么样的逻辑可以分析不同程度的目标达成,以及主体在博弈中的选择等问题呢?考虑玩家的选择使用偏好逻辑,而且若目标需要在逻辑语言中表述的话,可以使用基于优先性的偏好逻辑。① Fenrong Liu,Reasoning About Preference Dynamics,Dordrecht:Springer Science Publishers,2011,pp.87-122. 当然,也可以提出新的博弈逻辑语言,直接在新语言中使用特别的常元表示目标点等,在博弈逻辑中研究博弈,研究新的逻辑的语言和语义等问题。② Johan van Benthem,Logic in Games,Cambridge MA:The MIT Press,2014,pp.85-102. 用逻辑学研究最大的优点在于,可以考虑主体的高阶推理,一个玩家的选择是基于他自己的知识、他关于对手选择的判断,等等。逻辑学的形式语言为研究这样的推理提供了非常方便的工具。这里提到的技术细节,留给感兴趣的读者去探讨。
三、图博弈设计的参数
在讨论了图博弈和一些新版本之后,针对图博弈的结构特点作一个总结。因为图博弈的结构特点直接影响到博弈本身的设计,也影响到对应的逻辑的提出。③ Fenrong Liu,Choice Points for Graph Games,Seminar Note,Department of Philosophy,Tsinghua University,2017. 图博弈可以从两方面进行分类:博弈的一般结构(移动、回合、目标),以及图的结构——即博弈所在的棋盘的结构。
(一)玩家移动的方式
在选择图博弈的移动方式时,一般的区分是本地移动和全局移动。换句话说,就是玩家在图中是否被本地化的问题。具体而言,玩家是像蓄意破坏博弈的旅行者只能在图中移动,还是像恶魔一样可以全局随意地切断路线。第二种区分是,玩家的每一步移动是任意的,还是可定义的。到目前为止,我们讨论的恶魔切断图中的边,是完全随意的。但是,完全可以想象,要切断的边需要满足逻辑语言所定义的性质。与这种区分相关的问题是,一旦确定要切断的边的性质,恶魔是一次切断一条边,还是一次切断满足性质的所有的边?这些不同的选择直接影响到博弈的不同玩法,同时影响到不同逻辑的语言和性质。④ Dazhu Li,Losing Connections:Modal Logics of Definable Link Deletion,Department of Philosophy,Tsinghua University,accepted and presented at LOFT 13,Milano,2018.
(二)输赢条件的设定
在简单的图博弈中,玩家的目标点可以规定好,因此可以说是能独立定义的顶点。根据定义,玩家要么必须避开某个或某些点,要么需要进入图中的一个区域。然而,在类似捉迷藏的博弈中,玩家的目标常常相互影响。在此类博弈中,藏起来的一方一旦被发现,他就输了,同时,他的对手赢得了博弈。这类目标不再是旅行者或恶魔的独立定义的目标或其布尔组合,而是他们的位置之间的一种二元关系。此外,还可以做更细致的规定来影响玩家输赢的条件。譬如,玩家不能两次访问相同的顶点。在占位博弈中,一个玩家不能访问他对手已经访问过的路径。目标的设定是否足够一般化,也直接影响到能否采用逆向归纳法或其他方法来求得纳什均衡。
2.20世纪60年代“伟大社会”计划——社会运动的助推。计划开展的背景是老人、黑人、单亲家庭的女性等弱势群体的权益得不到保障,南部诸州大约80%的黑人依然生活在通过地方性立法(吉姆克劳法)和恐怖主义白人暴力强制施加的种族隔离制度之中,当时有大量的黑人走上街头进行游行示威并采取较为激烈的暴力方式来表达自己的不满(最著名的是伯明翰斗争)。
(三)博弈棋盘的设定
到目前为止,本文讨论的图博弈,顾名思义,是在图上展开的博弈。博弈的图就像其他室内博弈的棋盘。但是,除了单纯的顶点和边外,博弈的进行需要更多的关于图的结构的信息。当玩家在图上移动时,至少需要显示玩家的周边环境;在更复杂的占位博弈中,需要在节点上添加更多的用命题描述的信息,从而可以讨论这些节点是否已被访问过,甚至访问有多频繁的问题。一般而言,博弈的棋盘不仅仅是图,而是带很多“标注”的图。
一种新技术的出现,必定影响医学图书馆的服务,医学图书馆主要是医学知识存储,如何将每年海量增长的医学数据合理存储,是馆员思考的问题,对于用户的需求也会随着服务的创新而改变。数字图书馆的发展,使数据来源更加结构化和复杂化,智慧图书馆=大数据+馆员知识服务,所以医学院校图书馆不仅要为用户传播知识,更多的要学会管理知识,将数据存储有序化,让大数据在数字图书馆中发挥更大优势,使知识服务在医学院校的大数据环境下能换位。一定程度上大数据给图书馆提供了新的视角,为图书馆注入了新鲜血液,知识服务理念在大数据影响下为医学图书馆寻求了新的服务框架。
分析下面一个具体的博弈。假设旅行者从顶点1出发,希望到达目标顶点4,见图2。
本文一直在讨论通过各种方式改变博弈,问题是:新博弈的设计背后有隐藏的归约吗?真正称得上不同博弈的到底有多少种?两个图博弈何时等价?这些问题都涉及博弈之间关系的研究,特别是对博弈之间等价的概念如何界定和理解的问题。已有文献对类似的问题进行讨论,但是,需要拓展到本文研究的不同博弈中来。
四、图博弈的逻辑谱系
了解图博弈的各种设计选择后,以下着重讨论与它们相匹配的逻辑语言和逻辑系统。
首先讨论模态逻辑。模态逻辑的语言具有足够的表达力,可以描述简单的博弈。前面提到,可以把基本的模态逻辑扩张成二维模态逻辑,从而可以表示两个玩家在图博弈中从不同的点出发的情形。然而,并非所有这些表达力更好的新逻辑语言都是标准的逻辑,这就为逻辑学本身的发展提出许多具有挑战性的问题。图博弈的逻辑基本上都包含基本的模态算子,需要重点理解的是其动态模态算子。然而,有时动态模态算子的表达力往往可以通过静态的混合模态逻辑来实现。① Carlos Areces,Raul Fervari and Guillaume Hoffmann,Relation-Changing Modal Operators,Logic Journal of the IGPL,23(4),2015,pp.601-627. 更极端地说,一阶逻辑本身就能用于刻画图的变化。当前已知的模态语言还不能一般地刻画博弈论的某些概念,比如说获胜的位置,因此,不得不求助于不动点模态语言,像μ-演算。最后,当目标变得比输赢更复杂时,博弈论真正关心的是均衡问题,而强调图的逻辑性质就达到了它的极限。
定义1.2[1] 设(X,τ)为T0空间,定义X上的偏序关系≤τ如下:对任意x,y∈X,x≤τy当且仅当x∈cl{y}。≤τ称为由拓扑τ所诱导的特殊化序。特别地,关于其特殊化序,空间X中的开集都是上集,闭集都是下集。
此外,也可以用标准的“博弈逻辑”来分析博弈结构,从而刻画图博弈。这种语言表达力丰富,可以刻画玩家在图中的移动,他们的偏好和所能采取的策略。这种语言的表达式通常可以在博弈中获得解释,无论是扩展型博弈还是策略型博弈。在某些情况下,这些表达式也可以在刻画博弈玩家能力的相关模型中进行解释。① Johan van Benthem and Dominik Klein,Interfaces of Logic and Games,Stanford On-Line Encyclopedia of Philosophy,2018. 评价博弈逻辑的标准是看它们是否可以刻画标准的博弈论求解方案,比如逆向归纳法或重复删除严格受限策略法(Iterated Removal of Strictly Dominated Strategies)。我们相信,具有复杂偏好的图博弈最终需要使用博弈逻辑来进行研究。本文的目的不在于给出图博弈的模态逻辑或博弈逻辑的所有技术问题,而是激发这两个领域联手合作,一方面设计出具有趣味性的博弈,另一方面给出理论上具有挑战性的逻辑语言和系统。
使用逻辑学的手段描述博弈具有很多优势。逻辑学可以描述博弈所刻画的交互式情景中主体的推理模式,还可以使用模型检测等技术手段来验证博弈是否具有某些特定的性质。而对于逻辑学家而言,也许更有挑战的是推动博弈论领域的学者研究相关的问题。譬如,其中一个问题是关于图博弈的一般策略:在博弈中,是开场的玩家还是回应的玩家具有绝对的优势?对于很多博弈都可以问这样的问题。下面用更为精确的方法阐述。
在蓄意破坏博弈中,随着有限图趋于无穷大,玩家的获胜位置会发生什么变化?这个问题与逻辑学密切相关。一阶逻辑的“零一律”(Zero-One Law)表明,当图趋于无穷大时,每个包含二元关系的一阶句子为真的概率变为0或1。给定一个公式,可能行地判定是两种选择中的哪一种。“零一律”已经被推广到带不动点算子的一阶逻辑(LFP(FO))中。② Yuri Gurevich and Saharon Shelah,Fixed-Point Extensions of First-Order Logic,Annals of Pure and Applied Logic,32,1986,pp.265-280. 前面的讨论表明,可以在蓄意破坏μ-演算中描述蓄意破坏博弈的获胜位置,而这样的描述也可以翻译到LFP(FO)中。因此,能够用这种语言描述的任何内容都符合“零一律”。这个结果还不能立即应用于获胜位置,因为这些描述一般涉及包含特定点的图,而不仅仅是一般的图。对于前者,“零一律”是失效的。然而,基于LFP(FO),仍然可以得到如下论断:两个玩家都有获胜的位置,旅行者的每一个获胜位置必须与他的另外的获胜位置中的至少一个相连。相信这个例子提供了一个全新的视角,也是到目前为止关于图博弈的逻辑研究尚未涉猎的问题。
准确切取并称取5份相同的厚度和相同质量的紫菜置于相同玻璃器皿中,控制室内温度为常温,设定微波功率分别为100,200,300,400,500 W,微波干燥9 min,测定其水分含量和感官特征。
需要说明的是,本文并非在声称逻辑学的每一个属性都能立即导入图博弈的讨论中去。举例来说,虽然对逻辑学家而言,逻辑系统的计算复杂性是很重要的问题。但是,就图博弈而言,这仅仅告诉我们某些图博弈的理论可能很复杂,而不是解决这些博弈的算法很复杂。③ Johan van Benthem,Logical Dynamics of Information and Interaction,Cambridge UK:Cambridge University Press,2011,pp.250-252.
雾化法制取的粉末已占当今世界金属 3D 打印粉末的80%以上,其原理是以快速运动的流体(雾化介质)冲击或以其他方式将金属或合金液流破碎为细小液滴,随之冷凝为固体粉末的粉末制取方法,其原理结构图如图1所示[5],根据雾化介质不同,雾化法主要分为水雾化和气雾化。
从博弈到逻辑学的方向上,一个显然的问题是:是否存在自动方法将前面那些图博弈的定义转换为与之相匹配的逻辑?从前面的讨论可以看出,有一个系统方法来创建这样的匹配,但还没有看到更为普遍的一般性结果。从逻辑学到博弈的方向,则有着非常悠久的历史,有为各种逻辑概念或推理而设计博弈的传统。这种传统可以追溯到20世纪50年代的数理逻辑,还有根植于几个世纪之前逻辑的对话辩论传统。④ Erich Grädel,Wolfgang Thomas and Thomas Wilke,eds,Automata,Logics,and Infinite Games:AGuide to Current Research,Lecture Notes in Computer Science 2500,Berlin:Springer Science Publishers,2002.
一般而言,“博弈的逻辑”和“逻辑作为博弈”这两种观点的联系十分微妙,其中还有许多未解的问题。⑤ Johan van Benthem,Logic in Games,Cambridge MA:The MIT Press,2014,pp.495-506. 从第一部分中就已经注意到,图博弈对这两种观点都有所涉及,一方面图博弈可以很好地用逻辑学的语言进行刻画,而对这些逻辑学本身的评估又可以使用图博弈。这是以下一般性问题的特例:当追求“博弈,博弈的逻辑,博弈的逻辑的博弈”或者“逻辑,逻辑的博弈,逻辑的博弈的逻辑”之类的循环时,究竟会得到什么?这种循环不一定能趋于稳定,但一旦稳定下来,图博弈很可能是一个极具吸引力的研究平台。本文希望将图博弈看作是博弈逻辑和逻辑博弈之间的张力消失的一个自然场所。
五、结 语
本文重点研究了图博弈,将其看作是博弈与逻辑交汇的一个自然选择。文章的贡献在于提供一种全新的思考方式。当然,图博弈在其他领域,譬如博弈论、计算机科学等领域都有研究。本文企图表明,逻辑学能够提供独特的研究视角。为了支持这样的思维方式,我们讨论了一系列的博弈实例,并分析了可能的图博弈的设计变化。与之平行,本文讨论了如何使用模态逻辑及其扩展表达图博弈的一些性质。这种博弈和逻辑学之间的平行观点不仅带来了新的启发,也有助于设计新的有趣的博弈。另一方面,由于新的博弈的新特点,也为逻辑学的表达力和推理等提出了挑战性的理论问题。文章讨论了一般的博弈与逻辑学的联系后,最终认为图博弈是理想的工具,既可以作为逻辑学的研究对象,又可以作为评估逻辑学的工具手段。
本文的研究才刚刚起步,已经在前面提出了很多开放的问题。这里再给出几个未经提及的问题,希望有兴趣的读者可以继续讨论和研究。文章假设的博弈都是所谓的完全信息条件下的博弈,即假设玩家掌握博弈的所有信息。更为有趣的是存在不确定性的情形。用专业的术语说,就是在不完全信息条件下的博弈。这时,主体的推理依赖他们的信念,不完全信息博弈的均衡一般是概率的,并涉及混合策略。在逻辑学的层面需要使用认知逻辑、概率推理对博弈进行研究。或者,可以从玩家的视域出发进行研究。① Chanjuan Liu,Fenrong Liu and Kaile Su,A Dynamic-Logical Characterization of Solutions in Sight-Limited Extensive Games,Proceedings of PRIMA,2015,pp.467-480. 另外,社会实际上是一个大型实验室,新的博弈不断被设计出来。对本文讨论的一个自然补充和挑战是把理论上的博弈和真实世界的博弈联系在一起。真实世界的博弈显然不像我们所描述的博弈那样,因为实际的博弈往往是在固定的平台上进行的,其中的变化来自于其他的因素,比如偶然移动或玩家的认知局限等。但这并不意味着它们之间没有联系,只是现阶段的研究还没有讨论到此类问题罢了。
对破坏后的样品进行HPLC分析,结果(见表5)表明:盐酸度洛西汀肠溶胶囊在酸、氧化破坏中有明显降解,在碱、光照和高温条件下表现较稳定;各破坏条件下物料守恒,产生的杂质峰能与主峰有效分离,经破坏后的空白辅料溶液均不干扰样品中杂质的检测。说明该色谱条件专属性较强,可有效检出各破坏的杂质。
基金项目: 国家社会科学基金重大项目“基于社交网络的信息流逻辑研究”(17ZDA026);清华大学自主科研计划项目“博弈视域中的社交网络逻辑”(2017THZWYX08)
作者简介: 约翰·范本特姆(Johan van Benthem),斯坦福大学哲学系,阿姆斯特丹大学逻辑、语言和计算研究所,清华大学金岳霖逻辑学讲席教授;刘奋荣,清华大学哲学系、清华大学—阿姆斯特丹大学逻辑学联合研究中心(北京100084)
致谢:本文的部分内容在清华大学、牛津大学和斯坦福大学报告过,感谢听众给予的宝贵意见。特别感谢Julian Gutierrez、David Grossi、Valentin Granko、Rineke Verbrugge、Michael Wooldridge、李大柱和陈钰提出的建议和意见。十分感谢邢锟将论文的英文早期版本翻译成中文。
(责任编辑:王丰年)
标签:图博弈论文; 必胜策略论文; 蓄意破坏博弈论文; 博弈逻辑论文; 模态逻辑论文; 斯坦福大学哲学系论文; 阿姆斯特丹大学逻辑论文; 语言和计算研究所论文; 清华大学哲学系论文; 清华大学—阿姆斯特丹大学逻辑学联合研究中心论文;