论侦查制度与政策建设的基本路径--以博弈论为视角_博弈论论文

论侦查制度、政策构建的基本路径——以博弈论为视角，本文主要内容关键词为：视角论文,路径论文,制度论文,政策论文,博弈论论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：D918

文献标识码：A 文章编号：1673-1565(2012)02-0091-05

侦查是众多博弈参与者相互竞争的是非场，但它本质上仍属于侦查机关为公众提供的一种公共服务和公共产品。“警察服务要有效，警察需要公民积极的协作生产。”[1]如果没有外部规则设下框架，致使侦查主体内部以及侦查主体与其他博弈参与者在有限的侦查时效内因过度竞争消耗而导致侦查任务失败，那么侦查博弈会否变成一种“公地悲剧”？所谓“公地悲剧”，即完全依靠牧民自己的理性去决定各自放牧的羊只数量，在纳什均衡状态下的总饲养量倾向于大于社会最优饲养量，最终的结果将是草地毁坏，牧民无法从放牧中得到更高收益。改变“公地悲剧”的可能性就在于能否改变其前提性因素或制度性因素。[2]

经济学上的“理性经济人”或政治学、法学意义上的“理性利益人”是博弈分析的前提性因素，是难以改变的。①或者说，依托博弈参与者的理性提升，对于决策者来说并不可靠。因而，以制度或政策来约束身处“公地悲剧”或类似处境下的博弈参与者，就成了走出这类悲剧和困境的重要条件。现行刑事诉讼法即将修订，侦查制度的改革是争议的焦点，牵扯各种利益。而面对新的犯罪形势，侦查机关自身也在不断酝酿和出台新的侦查政策。在这一背景下，从新的研究视野探讨侦查制度、政策构建的一些基本问题，无疑有其现实意义。

一、博弈论与侦查制度、政策的构建

侦查制度是指有关侦查活动的组织、程序、人事等方面的规则体系的总称。有关侦查政策的定义较少。科尔巴奇认为，被人们称为政策的东西，可以看到三个核心的要素，即秩序、权威和专门知识。[3]以此解释为基础，政策通常都和政府或其他组织的统治或管理秩序有关，是政府或其他组织为影响其决议、行动或为其他目的而采取的行动计划或过程，是指导其管理职能范围内事务的一般原则，如政府对公共事务管理适用的一般原则或策略，即所谓公共政策。在这个意义上，侦查政策主要是指侦查机关指导侦查工作的一般原则或策略。国内有关侦查制度的研究较多，有关侦查政策的研究则尚未浮上水面。②但不管怎样，制度和政策的本质都是一种规则，旨在通过为人们提供规则来减少行动中的不确定性。

博弈论主要研究理性的个体在相互依存时如何作出决策。从博弈论视角来观察侦查制度和侦查政策，可以让我们看到深藏在博弈参与者互动背后的制度、政策建设的原动力。博弈论包括合作博弈论和非合作博弈论。即便是非合作博弈论，其研究人类行为的根本目的也在于促进人类内部的合作。

然而，或许有些令人沮丧的是，作为博弈论主轴的囚徒困境以及曼瑟尔·奥尔森提出的“搭便车困境”都揭示了人类在合作与协调问题上的令人沮丧的前景。[4]

囚徒困境式的纳什均衡已经是众多论著经常引用的经典案例，本文不再赘述。这种均衡显然不是顾及团体利益的帕累托最优解决方案。

至于搭便车博弈，又称“智猪博弈”：猪圈里有一头大猪和一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一头猪去踩踏板，另一头猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。两头猪各会采取什么策略？答案是：小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强，所以只好亲力亲为了。[5]“智猪博弈”给了竞争中的弱者以等待为最佳策略的启发。但是对于社会而言，因为能力较弱的一方未能参与竞争，其搭便车时的社会资源配置并不是最佳状态。特别是在公共服务领域，由于公共产品的非排他性，不为公共产品做出贡献的人也可以获得公共产品。搭便车心理的存在可能导致公共产品最终得不到提供，从而无“便车”可“搭”。

从囚徒困境中我们可以明白，合作是有利的“利己策略”。在囚徒困境中的最佳策略取决于对方采用的策略，特别是取决于这个策略为双方合作留出多大的余地。根据合作博弈论，合作的一个很重要的原因在于博弈是重复进行的。在囚徒困境中，参与者会受到背叛(坦白)的短期诱惑，但是通过与对方建立长期合作的模式，可以获得更多的长期的好处。侦查中的关系大多是一次性用尽的(侦查主体内部关系是例外)，双方要达成合作，更多地靠有约束力的双方协议，而协议的约束力来源于双方的信任和外部制度的约束。③所以，要破解囚徒困境，就要跳出这个模型本身，从更高的层面上给予制度性的约束。

智猪博弈式的搭便车现象，在实践中也不鲜见。目前一些地区侦查资源共享方面即已出现类似困境，特别是资源投入较大、情报信息工作扎实的地区，对于和落后地区的信息共享并无积极性。再如，人们有时会批评某些侦查机关内部人浮于事，特别是有些专案组成员工作极不认真，消极怠工，但等到案件破了之后，奖励照样少不了他的一份。这种现象对其他侦查人员的工作积极性杀伤力极大。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的食物数量和踏板与投食口之间的距离。为了寻求更公平的方案，博弈论上对规则进行了一定程度的修改：1.减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。2.增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板，反正对方不会一次把食物吃完，所以竞争意识却不会很强。3.减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近，结果小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。[6]三种不同方案得出的是不同的结局。

修改方案折射的是游戏设计者的最初意图。但不论设计者倾向于哪一种方案，都足以说明，通过修改博弈参与者行动的共同规则，以不同方式规范其行为，是能够取得良好的激励效果的。诚然，在没有外设规则的情形下，如果小猪和大猪之间可以达成一个协议，如大猪向小猪承诺：“你去踏踏板，我保证只吃7单位，给你留下3单位。”如果大猪确实遵守承诺，那么小猪去踏而大猪不踏，小猪将得到3单位，扣除劳动耗费2单位，实际上净赢利1单位。但是，大猪是否能信守承诺，小猪如何确保大猪信守承诺，同样需要制度或政策来加以保障。

由囚徒困境和搭便车困境及其解决，我们可以看到以制度或政策来加以制约的必要性以及可行性。④正如前述关于合作博弈的阐述所指出的，合作博弈要求博弈各方达成一个稳定协议。如果将约束参与人行为选择的协议变换为不由参与人自主决定的法律规则，则法律规则可以起到促进合作、实现集体理性的作用。[7]制度或政策提供了一种社会稳定机制，使得人与人之间产生基于这一稳定机制基础之上的信任和预期，从而使非合作博弈转向合作博弈，并使这种合作博弈稳定下来，在社会类似博弈事件中起到相同的引导和控制作用。

二、侦查制度、政策构建的基本路径

制度和政策在促进合作上具有重要作用，但这里需要解决的一个问题是制度、政策是如何形成的。从制度的生成上讲，制度是社会成员共同同意的结果，是一种契约行为。参与决策者在达成协议时，清楚地知道自己在契约中的利益和主体位置不同，但是当在社会中就某项法律规则进行表决时，人们并不知道自己将来在该规则约束下的利益和主体位置。人们将来在规则约束下的位置具有不确定性，规则可能对自己不利，也可能有利。处于“无知的铁幕”下，人们会以集体理性的立场来讨论和选择规则。[8]

因此，虽然博弈论对囚徒困境、公地悲剧和智猪博弈等的描述是高度抽象的，通过较为简单的比较，得出了理性个体难以自发实现合作最终无法获得帕累托最优结局的结论，但是，从动态博弈的角度，充分考虑博弈参与者行为的相互牵制和约束，我们也能发现，在具备一定的条件下，囚徒会采取合作，牧民会自觉限制羊的饲养量，小猪也会更积极地参与劳动，由此形成一种博弈规则，它能够自觉实施，成为人们的共同信念，从而走出这些困境和悲剧，此即所谓“博弈内生规则”。“在一切社会，从最原始的直至最先进的，人们无不在自己身上施加种种约束，以此来为自己与他人的联系提供结构”。[9]进一步说，“一个稳定的社会契约中的规则，对于生活中的博弈，可以成功地基于均衡来协调我们的行为。”[10]

然而，“自生自发的路径，可以但不一定产生出有效率或者说高效率的社会秩序”。[11]而且，“在社会经济秩序的驻存和演化的历史中，如果任由各社会内部的自生自发力量和秩序在那里生长和发育，一个社会可能会由于秩序变迁中的‘路径依赖’和‘锁入效应’而在同一个秩序层面上不断地自我复制和‘内卷’，从而可能在很长的时间中甚至永远也不可能自生自发地生发出哈耶克所理解的那种‘人之合作的扩展秩序’来”。[12]换言之，依靠需要长期演化甚至因为社会秩序的“路径依赖”和“锁入效应”而遥不可及的博弈内生规则，将使人们走出囚徒困境、搭便车困境和摆脱公地悲剧的愿望也相应变得遥不可及。因此，在博弈中完全依靠博弈内生规则来制约博弈参与者之间的无效率行为，是不太现实的。

在侦查博弈中，除了相对固定的侦查搭档、相对稳定的犯罪集团外，博弈参与者彼此之间的互动时间极为短暂，更无动力去自发形成规则。由此可见，对博弈参与者加以有效制约的规则来自博弈参与者之外。侦查是公共服务之一种，因此，为其设置外部制度和政策的主体应是公权力机构——国家及其代理人。

侦查制度来源于法律法规，由于侦查属于刑事诉讼的一个环节，因而其来源主要局限在广义上的刑事诉讼法。至于侦查政策，其受国家和执政党政策的影响较大，稳定性比侦查制度稍弱，但也因其较高的灵活度而能够迅速反映社会公共政策的调整意图。但不管制度和政策的来源如何，至少在形式上，它们都是外部有权主体强加于博弈参与者的规则，而非自博弈参与者之间自发产生。

一项法律规则会引申出一套博弈规则。有意思的是，外加于博弈参与者的制度或政策，其本身也被认为是不同利益主体博弈的结果。博弈参与者各方所在的利益群体，往往都会加入到这些制度或政策制定的博弈过程当中，争取有利于自己的规则系统。其中的竞争、合作与妥协，同样精彩纷呈。如果一个阶层尽管意识到规则对己不利，但由于缺乏立法参与渠道，而不能成为立法博弈中的一方，不能将自己的利益主张反映在法律中，那么制度和政策也可能是阻碍合作的因素，在这样的规则约束下，利益没有得到制度和政策支持的阶层与其他阶层的合作成本就可能高到了使合作无法进行的程度。在侦查制度、政策的制定过程中，如何避免完全被部门利益化，避免只体现某一方的声音，以使制度、政策更具公信力，同样是摆在人们面前的难题。⑤

侦查制度和政策构建的同时，还涉及一个如何对待以往制度和政策的问题。“要面对这样的事实，必须要认识到，有时如果一个社会还没有预备好就急着变革的话，那是毫无意义的，甚至会起到相反的效果。如果有人在古希腊时期就提出废除奴隶制的话，会有什么成效吗？在那个时候，连亚里士多德都认为野蛮人天生就是做奴隶的料……我认为改革家们需要思考一系列的问题，而不是向这些风车挑衅。这些问题包括，运行于当前社会的社会契约的本质是什么——改革家们需要对此做一个准确而讲求实际的评估。以及，如果可以使用目前手上不同程度的权力来推动改良，这个社会契约有可能会向哪些契约转化。只有当这些可行性的问题经过严肃思考后，要问什么是最优的社会契约这个问题才有意义。”[13]因此，在分析一项现行制度的时候，我们需要明确，制度变革的意义在哪里，重建一项新的制度是否有价值。

正如郑也夫先生指出的，“即使你真切地认识到现存事物中的缺陷，今天就破除它也绝非意味着必能有更好的东西应运而生。树立不起新的(真正有生命力的而非乌托邦式的计划)东西，却急于破坏传统，要么是做无用的功——传统像孙行者的脑袋砍掉一个又复生一个，要么是新的未产生，旧的规范也丧失了，甚至导致更糟糕的东西出场”。[14]为此，侦查制度和政策的制定一定要经过严格论证，充分考虑出台的时机和可以预见的执行力，而不能盲目出台。也正因为如此，在制定过程中应有广泛的相关利益群体的民主参与。

三、侦查制度、政策构建的核心问题

制度和政策的约束包括两个方面：有时它禁止人们从事某种活动，有时则界定在什么样的条件下某些人可以被允许从事某种活动。在此意义上，制度或政策乃是一种人类在其中发生相互交往的框架。

那么，制度和政策又是如何构建社会互动的呢？“一个简单的回答是，通过建立规则来引导规则的社会行为者进行策略决策。这意味着，如果制度成功地构建了我们之间的互动，它们必须有一些机制以确保我们遵守它们。制度通过如下两个机制，来共同构建社会互动和保证行为人遵守规则：(1)提供关于其他行为人选择的信息；(2)其他行为人对不遵守规则给予制裁的威胁。”[15]换言之，在制度和政策构建的规则体系下，博弈参与者彼此之间具有关于规则内容的共同知识，能够期待其他参与者会以符合规则之方式行事，并且当有人违反规则时，其他博弈参与者有能力找到对违规者进行惩罚的办法，即存在救济渠道。

上述两个机制，特别是后者，也反映出了侦查制度、政策构建的核心问题，即制度和政策必须能够对博弈参与者形成有效制约。制度和政策的有效性主要来自于惩罚机制，规则明示的惩罚内容以及惩罚的决心，才是制度和政策实施贯彻的真正保障。

博弈论上曾阐述过一种边缘政策。博弈参与者为对手制造风险，如果风险足够大，大到让对手难以承受的地步，从而迫使他按照施策者的意愿行事，以化解这个风险，则这种策略可称为边缘政策或悬崖策略。在个案中，对对手实施边缘政策时，要使对手能够被迫遵守施策者的意图，则施策者必须展现出“可置信的威胁”，即让对手感受到如果不遵守施策者之意图，则一定会有“威胁”自己的不利后果发生。而在制度和政策层面，同样地，“制度必须具有可置信的足够的威慑力和强制力，才可促使博弈各方选择合作策略”。[16]

诚然，在某种亚文化状态下，例如犯罪团伙内部也会形成一些非正式的规则，即“在自我实施制度里，也可能会建立非正式的制裁来惩罚那些不遵守规则的行为”[17]。后者显然是不利于侦查的，因此，“基于降低社会总成本的目的，运用制度安排手段，克服公共权力代理人的寻租策略选择，构建用于权力制约的‘囚徒困境’也是必要的，这种制度设计的要点就在于降低可置信的各种威胁的力度甚至使其成为无效威胁。在现实的政治法律实践中，犯罪集团成员之间攻守同盟的形成问题、面对犯罪行为的‘沉默的大多数’现象以及被侵害人保持沉默进而倍遭侵害的现象等，从博弈论角度来看，是因为现行制度或机制未能有效降低可置信的各种威胁的威胁力度，未能使其成为无效威胁。”[18]据此，侦查制度和政策的设置中，也应安排瓦解那些促进不利于侦查的非正式协议。

“可置信的威胁”是多种多样的，视具体情况而有所不同。证人的伪证，侦查人员的暴力取证，都可能带来牢狱之灾。有的惩罚，可能是加重原先就无法避免的惩罚，如“抗拒从严”的侦查政策所设立的罚则。

“可置信的威胁”必须是制度化或政策化的，才具有可期待性。而在现实中，在有些情况下，那些阻止我们违背社会契约的惩罚，可能相对是比较轻微的，可能只是其他专案组成员对那些怠于行使职责的侦查人员的冷漠相对，就足以让后者为改变自己在他人心目中的地位而有意识地去控制自己的消极行为。诚然，后一种惩罚机制难以形成对侦查人员积极侦查、协力合作的稳定支撑，因此谈不上是一种“可置信威胁”。“可置信的威胁”应是看得到责任的。例如对于作案人负案在逃的一些恶性案件，公安机关负责人在下达社区清查任务时，往往会强调，清查工作必须细致认真，如果警方清查期间作案人曾在本地停留而负责清查该社区的民警未能发现线索的，必须承担一定的具体责任。清查工作以及警方的摸底排队工作往往都是分工协作，指挥人员难以监督一线民警是否执行任务，因此以事后责任来提供“可置信的威胁”，不失为一种比较好的博弈规则。

①即便设定为最贴近社会现实的复杂人假设，只要不能得出所有人都具有利他主义本质的结论，那么对于解决“公地悲剧”并无多大助益。以上各种人性理论假设，参见刘为军.侦查中的博弈[M].北京：中国检察出版社，2011.113-117.

②这或许与理论上对侦查领域的一贯态度有关，即认为侦查领域无理论或者研究层次太低，或许和刑事政策的研究往往以刑法的修改为终结点有关，而侦查领域似乎与此目标无关。然而，无论何种政策定义，都必然包含着政策同时也是一个动态过程的意义。虽然刑事责任的最终实现依赖于审判和刑罚执行活动，但是审前的案件事实调查过程同样也是奠定法律适用效果的支柱。特别是在我国刑事诉讼程序尚具有浓厚职权主义色彩的背景下，侦查的质量在很大程度上决定了案件的结局。为此，在重视刑事政策，关注刑法的修订的同时，有必要同时关注侦查政策的基本结构、政策过程和具体侦查政策的制定等问题。

③合作博弈理论设定了合作博弈的几个要点：其一，存在共同利益是合作博弈的前提；其二，存在必要的信息交流；其三，博弈参与者之间自愿、平等和互利；其四，存在经谈判后缔结的强制性契约。参见侯光明，李存金.管理博弈论[M].北京：北京理工大学出版社，2005.14.

④如果从比较纯粹的法学视角出发，侦查制度和政策的完善也是完全必要的，它是执法规范化的必要保障。详细论述，可以参见何家弘，刘为军.论侦查行为的规范化[A]郝宏奎.侦查论坛：第4卷[C].北京：中国人民公安大学出版社,2005.

⑤不同利益群体如何在博弈中生成制度或公共政策，公共管理学领域已经做了大量细致深入研究，本文不再涉及。

标签：博弈论论文; 囚徒困境论文; 合作博弈论文;

论侦查制度与政策建设的基本路径--以博弈论为视角_博弈论论文

猜你喜欢