大数据时代下我国犯罪数据公开研究
——以中美比较研究为视角
阮重骏
(吉林大学法学院,吉林 长春 130012)
摘要: 在大数据时代,犯罪数据分析与挖掘已成为犯罪学研究以及现代犯罪治理的基础手段。犯罪数据在揭示犯罪模式、犯罪原因以及评估犯罪防治效果等诸多方面拥有不可替代的作用。由于我国当前犯罪数据公开面临一些问题,直接导致犯罪学领域实证研究的匮乏,严重掣肘了大数据时代下犯罪数据价值的释放。通过国内外比较研究可知,我国目前需要公开更多样的更加全面的犯罪统计数据,建立交互式的犯罪数据公开平台,切实发挥犯罪数据在犯罪学研究和犯罪防治中的作用。
关键词: 犯罪数据;犯罪数据公开;大数据;犯罪学;比较研究
一、问题的提出
自从达尔文将着重于测量和观察的实证研究方法引入研究之中,科学的研究方式逐渐得到认可,数据也随之成为研究的基本要素。犯罪学作为解决现实犯罪问题的学科,尤其重视犯罪数据背后所反映的现实问题。许多犯罪学研究成果的取得以及犯罪学研究领域的拓展都与犯罪数据密不可分。在犯罪防治领域,犯罪数据已成为评估犯罪防治成功与否的关键指标所在。
随着大数据时代的来到,犯罪数据价值得到进一步释放。犯罪数据与大数据所准确刻画的公民生活行为、社交网络、社会实时变化等信息的结合,能够极大地拓展犯罪学的研究视野与领域。同时,大数据“快速处理”(1) IBM(国际商业机器公司)将大数据的特点归纳为“4V”,即海量性(Volume)、多样性(Variety)、快速性(Velocity)、真实性(Veracity)。 的特点,也使得实时的犯罪数据分析得以借助犯罪地图这样的方式向社会公布,以提升社会公众自发参与犯罪防范的可能。依托大数据,犯罪数据揭示犯罪模式的作用将会得到最大限度的发挥,犯罪数据的犯罪预防价值也会被最大限度地挖掘出来。
然而,现实中,犯罪数据公开的不完善,正在严重掣肘大数据时代下犯罪数据价值的释放。除了国家统计局网站的犯罪数据和公开的司法文书中的司法数据,公众很难通过其他途径快捷简便地了解我国犯罪的现实状况。司法数据侧重司法,无法全面反映犯罪问题,国家统计局网站的犯罪数据又不够详尽,难以反映犯罪的现实情况,这极大地制约了犯罪数据的价值体现。在犯罪学研究方面,犯罪数据的缺乏直接影响了实证研究的开展,更进一步导致我国犯罪学研究趋于理论化、逻辑化,从而在理论与现实之间形成了断层。而美国的犯罪数据公开已经多年,积累了丰富的经验。那么,我国到底应该如何完善犯罪数据的公开?如何平衡数据公开、共享与公民隐私权的关系?这是摆在我们面前急需解决的问题。理性分析这些问题,需要我们先从犯罪数据公开的价值评估入手。
二、大数据时代下犯罪数据公开的价值评估
(一)何为犯罪数据
在界定犯罪数据之前,我们应先理解犯罪数据中“犯罪”的含义。我国《刑法》第13条规定:“一切危害国家主权、领土完整和安全,分裂国家、颠覆人民民主专政的政权和推翻社会主义制度,破坏社会秩序和经济秩序,侵犯国有财产或者劳动群众集体所有的财产,侵犯公民私人所有的财产,侵犯公民的人身权利、民主权利和其他权利,以及其他危害社会的行为,依照法律应当受刑罚处罚的,都是犯罪,但是情节显著轻微危害不大的,不认为是犯罪。”这是刑法学中犯罪的概念,“刑法学将犯罪认定为具有严重社会危害性, 触犯了刑法并应受刑法处罚的行为。”[1]但是“犯罪学不研究如何依法处罚犯罪,只专注为什么人们会实施犯罪以及如何防治犯罪,这两项内容都不必也不应局限于现行法律”[2]。轻微违法行为以及其他一些越轨行为在犯罪趋势、犯罪特点、犯罪原因等方面的研究中也有着不可忽视的意义,例如,破窗效应就揭示了早期的轻微违法行为与之后的犯罪行为之间的联系。因此,犯罪数据中的犯罪应该从更广义的角度进行解读。笔者以为,凡是故意侵害刑法所保护的法益,而客观上又没有违法阻却事由存在的行为,都应该予以考量,同时应排除犯罪人的年龄、犯罪情节严重程度等问题的干扰。
从微观经济个体的角度来看,中美贸易摩擦给中国出口企业带来了严峻的挑战,相关行业出口企业感受到了阵阵倒春寒。
(2)要进一步完善有关的法律法规。目前,《招投标法》仅对违规招标和虚假招投标提出了处罚措施,对邀请招标等其他违法违规行为因缺乏明确的法律、行政法规处罚条款而难以查处。
基于此,犯罪数据则应该是包括“犯罪”行为的时间、空间和属性的数据以及其他一切与“犯罪”行为直接相关的数据的总称。公安机关掌握的接报警数据和刑事、治安案件数据、检察机关的起诉数据、法院的司法数据、纪委部门的反贪及廉政建设数据都是犯罪数据。同时,犯罪数据不仅指犯罪的原始数据,还应该包括基于原始犯罪数据所产生的各种分析结果,如犯罪统计数据、犯罪地图、犯罪人社会网络结构图谱等。
(二)犯罪数据公开的价值
1. 保障犯罪学研究的科学性与实用性
犯罪数据是认识犯罪模式的基础,失去犯罪数据的支撑,犯罪学研究者就失去了了解现实世界犯罪模式的最基本途径。这迫使他们以自身经验、域外经验、自身对犯罪学的认识与理解来设定问题、开展研究。而这又进一步导致犯罪学研究难以把握时代变迁、发现问题所在。同时,犯罪学一直是一门务实而严谨的学科。随着环境犯罪学的兴起,如今的犯罪学更加要求研究的科学性,要求所提出的理论能够在现实世界中被印证。犯罪数据的公开为犯罪学研究提供了犯罪数据的支撑,从根本上保障通过研究问题的客观性,实验理论的可能性,也避免犯罪学研究过于理论化、缺乏实践的问题。
2.保障公民知情权以及监督政府的权利
犯罪人是否会借助公开的犯罪数据进行分析,从而回避热点空间与时间,发现合适的犯罪目标,减少被打击的风险?我们无法否定这一现象存在的可能,但是可以肯定的是,这种情况即使存在,其影响也是微乎其微的。首先,大多数犯罪人不需要进行犯罪数据分析。例如,实施激情犯罪、偶然犯罪的犯罪人, 他们不可能也没有必要进行犯罪数据研究以支持自己的犯罪行为。而对于那些以轻微侵财犯罪为生的犯罪人来说,考虑投入与产出比,犯罪数据的研究并不能产生更好的经济效益。但这一问题很可能发生在实施有预谋的重大犯罪和白领犯罪的犯罪人上。不过,一般而言,这些犯罪的数据量极少,研究难度大,这些非专业分析人员难以获得足够的情报。其次,就技术层面而言,犯罪数据的分析与挖掘需要一定的技术支撑,大多数犯罪人难以有足够的时间来研究犯罪数据分析技术。如果选择犯罪数据分析的外包,则又会陷入投入产出比的经济效益问题以及风险的防控问题。最后,犯罪的时空转移并非轻而易举,而合适的被害人也并不好判断。犯罪时空热点的产生并不是犯罪人主观意愿的结果,更多地是来自周围环境和条件的影响。日常行为理论告诉我们,犯罪的产生离不开“合适的目标”、“犯罪防范缺失”和“潜在犯罪者”。[12]所以,时空热点的产生是这三者聚集的结果,而非某些人的意愿,避开犯罪的时空热点只会令犯罪更加难以实施。现实中,对于热点警务是否会导致犯罪转移的研究似乎提供了很好的佐证。早期的一些研究指出,犯罪人会因为情景预防措施的存在而转移实施犯罪的地点,[13-16]但是如果仔细回顾这些研究以及其他的一些发现,反而会得出,犯罪转移是少量的,一般来说无足轻重。[17-21]Wesiburd教授在分析了一些有关犯罪转移的研究后指出,“在有关犯罪转移的犯罪控制评估报告中,常见的发现就是,所谓的犯罪转移并无证据支持”[22]。可见,犯罪人想要避开犯罪时空热点的可能性非常低。同时,犯罪数据虽然能够揭示易被害人群的特点,但是若要运用于实施犯罪之上,在现实信息相对缺乏的情况下,寻找合适的被害人也并非易事。
(5)加强猪场的清洁和消毒措施,对粪便、尿液等废弃物要及时清理,对食槽、水槽、用具等定期冲洗、消毒。对外来人员以及出入养殖场的工作人员要严格执行消毒制度。另外,养猪场内不能饲养宠物[6]。
3.鼓励公民参与犯罪防控
在社会网络分析中,社会网络是行动者在互动中形成的相对稳定的关联体系,在共享信息、汲取和控制资源等方面具备优势[1]。城市网络是社会网络在城市领域的具体呈现。Camagni较早提出城市网络概念,认为城市网络是由城市间水平和垂直的频繁互动合作所形成的有机整体[2]。本研究将城市网络定义为由于主办国际重大体育赛事而产生相互联系的城市之间的,既包含垂直分工联系、也包含水平分工联系的相互依赖的网络结构。
众所周知,政府打击犯罪的能力是有限的,警察部门没有能力时时刻刻关注到每一个街角。随着网络技术的发展,犯罪打击更是需要延伸到网络世界之中,使得这一问题更为显著。要想进一步加强打击犯罪的能力,公民参与打击犯罪的重要性不容忽视。1967年,美国总统犯罪委员会报告中就强调了公民参与打击犯罪和减少产生犯罪的社会条件和环境条件的必要性。[3]1975年美国FBI的统一犯罪报告也强调,缺乏公民的参与,美国的执法部门将没有更多的人力、技术、资金来肩负打击犯罪的重任。[4]有学者甚至提出,最有效的打击犯罪的方法,必定要令居民参与到那些旨在减少他们所居住街区内的犯罪发生机会的主动干预措施和参与性项目中。[5]而若要使公民充分参与到犯罪防控之中,单纯地让他们服从安排并不是一个有效途径。犯罪数据的公开让公民了解当地的犯罪情形,关心自己所在社区的问题,能调动其积极性,发挥出其参与犯罪防控的价值。同时,公开犯罪数据也使身处犯罪时空热点的公民,自发地提高防范意识,从而提高犯罪人的犯罪风险,降低犯罪的可能。
所有胎儿血流动力学指标检测均由本科室高年资超声医师检测,检测内容包括子宫动脉以及大脑中动脉的收缩期峰值流速(PSV)、舒张期流速(EDV)、阻力指数(RI)、搏动指数(PI)及收缩期血流峰值速度/舒张末期血流速度值(S/D值)。每项指标均检测3~6个规律心动周期血流频谱,取质量最好的图像测量3次,取平均值。对两组的检测结果进行比较,并对影响因素与不良妊娠的相关性进行分析。
4.减少政府部门打击犯罪的资源投入
政府部门打击犯罪能力的局限性,更多来自于其资源的有限性。打击犯罪并非政府部门的唯一任务,因此政府部门只能在十分有限的人、财、物的条件下,承担打击犯罪的重任。优化资源配置,充分利用社会资源,是解决资源有限性问题的可行方案。犯罪数据的公开就起到了这一作用,它允许更多拥有专业技术与知识的研究人员参与到犯罪的分析与防控当中,降低了人力成本的需求;允许非政府部门的研究机构利用已有的系统与软件进行犯罪数据分析,降低了物力成本的需求。人力物力的降低,令政府部门缩减开支,从而降低了财力成本的需求。不仅如此,专业、科学、全面、及时的犯罪数据分析,还能够帮助政府部门制定出更有针对性的犯罪防治措施,实施精细化的防控策略,提升打击犯罪的效率,从而进一步降低打击犯罪的资源投入。
(三)大数据时代下犯罪数据公开缘何必要
1.大数据时代下警察机关难以兼顾打击犯罪与犯罪数据分析
作为打击犯罪、维护社会稳定的主要力量,警察部门掌握有大量的犯罪数据,如接报警数据、刑事案件数据、治安案件数据等。但随着犯罪数量的增长以及各种新型犯罪手段的出现,警察部门面临着越来越大的犯罪打击压力。而大数据时代下,庞大的数据体量以及数据分析的即时性要求,又使得犯罪数据的分析与预测也需要占用大量的人力物力资源。在资源有限的情况下,警察部门往往不得不在鱼和熊掌之间进行取舍。为了满足现实的、最直接的需要,毫无疑问,打击犯罪、维护社会稳定必然成为首要目标,而犯罪数据的分析就只能被置于次要位置。但现实的情况是,由于边际收益递减规律(2) 边际收益递减规律,是经济学术语,指“相对于其它不变投入量而言, 在一定的技术水平下, 增加某些投入量将使总产量增加。但是, 在某一点之后, 由于增加的投入量而增加的产出量多半会变得越来越少”。参见[美]保罗·萨缪尔森.经济学(上册)[M].北京:商务印书馆,1979.41.之所以引入这一概念,是因为警力的增加与犯罪打击效果也存在这样的特点。当警力投入逐渐增大时,每一单位所增加的警力能够产生的打击犯罪的效果会逐渐降低,甚至导致最终增加警力对于打击犯罪无所作用的结果。所以在我国警力投入已经巨大的当下,更加重要的是对打击犯罪的手段的优化。 的存在,单纯地增加警力再难收获与之匹配的犯罪打击效果。已有的研究表明,相比于增加警察数量,良好的防治策略才是打击犯罪更为有效的手段。[6]而作为防治策略的产生基础,科学的犯罪数据分析不可或缺。
经护理后,两组患者生活质量指标相较于护理前已有明显改善,但研究组患者各项指标改善幅度均明显优于对照组(P<0.05)。经护理后,两组患者生活质量指标均有明显提升,但研究组患者各项指标提升幅度明显优于对照组(P<0.05),见表 1。
③对于那些建成在年以下的建筑区域,其负荷在短时间内不会发生太大的变化,也可以参照5年以上的建筑区域进行电力负荷的预测。对工业负荷的预测需要注意的是,工业负荷的预测应根据该城市截止到预测年份的工业规划来进行,要充分结合城市中的工业规划分布。如果在未来几年城市的工业没有明显的增加,那么,就可以采用工业用电用户上报的装容量数据对工业电力负荷进行预测。
考虑到在不同的单位网格内会员分布情况不同,因此每一个单位网格内会员的平均完成能力也存在差异,这种差异将影响到该网格区域内任务的定价,对于每一个任务所处的单位网格,我们计算其会员的平均完成能力,具体方式如下:
与UCR相比,NIBRS所涉及的犯罪信息更全面也更详细,在数据种类以及计算方式上都有了明显的提高。但是由于NIBRS创设较晚,在时间跨度上无法与UCR相提并论。
UCR提供了国家、州、县以及当地机关等不同层面的犯罪汇总信息,其犯罪数据涉及多种犯罪类型,包含犯罪人、被害人的性别、种族、年龄段等信息。但是,UCR不提供犯罪人的个人信息以及单独犯罪事件信息。根据数据获取渠道的不同,UCR将犯罪统计数据分为执法机关已知的犯罪和逮捕数据。由于并非所有犯罪人都能够被逮捕到案,所以逮捕数据往往在量上小于执法机关已知的犯罪。而由于执法机关已知的犯罪仅是执法机关确认存在的犯罪,所以常常缺失犯罪人信息,无法得出有关犯罪人种族、性别、年龄等的准确统计。
3.大数据时代下犯罪学研究专业性的需要
运用大数据主要是通过归纳的方式对海量数据进行分析,找出事物之间的相互联系,但这种分析方式难以判断各因素之间的因果关系。所以有学者指出大数据探求的不是因果关系而是相关关系。[7]虽然,相关关系分析本身具有重大意义,是研究因果关系的基础,[8]但在因果关系不明的情况下,我们难以通过发现并控制影响因素来达到降低犯罪的目的,使研究失去实践价值。因此,有学者提出了从相关分析到因果分析的研究思路。[9]一般而言,两个变量间存在因果关系需要满足三个条件:(1)在时序上,因先于果;(2)两者间有实证的相关性;(3)因果关系不是第三个变量的结果。[10]可见,从相关到因果还需满足时序性和真实性的要求,而这需要充分的犯罪学学理支撑。唯有在理论与逻辑上进行严谨的分析与判断,才能在众多的相关关系中找到与犯罪具有直接因果关系的事物,从而令研究成果发挥出现实价值。一个科学可信的犯罪学研究不会降低对研究人员的犯罪学理论要求,相反,它更需要研究人员在理论、经验与逻辑上对犯罪问题有一个准确的认识与把握,它需要的是更加专业的犯罪学研究者。要满足这一点,就必须要允许这些专业的研究者拥有获取犯罪数据的资格,因此数据公开格外重要。
三、犯罪数据公开的风险评估
任何事物都是利弊共存的,考虑犯罪数据能否应用,需要进行综合的判断,既不能因噎废食,也不能盲目自信。犯罪数据公开带来的可能性风险也应如是。
(一)个人信息泄露的风险
这是对犯罪数据公开最为普遍的担忧,也是犯罪数据公开陷入困境的关键所在。毋庸置疑,不论犯罪人还是被害人,其个人信息都属于公民的隐私,受到法律的保护。但问题是,我们能否将犯罪数据公开和个人隐私的侵犯划上等号呢?笔者以为不可。不否认,犯罪数据的公开确实会增加公民隐私被侵害的风险。但只要有完善的制度与措施的保证,这种风险就是完全可控的。我国司法文书的公开情况就为此提供了佐证。在司法文书公开伊始,对公民个人信息泄露的担忧成为反对者的主要理由之一。但是这些年的实践情况证明,这种担忧并不必要,司法文书的公开并不必然导致公民个人信息泄露的问题。于此同时,美国多年的犯罪数据公开实践也证明,这种风险完全可控。
(二)引发犯罪恐惧的风险
犯罪数据的公开可能导致民众意识到犯罪热区、犯罪高发时段、犯罪高发人群和高风险被害人群的存在。那么这些新的知识是否会令民众对特殊地点、时段和人群产生犯罪恐惧,并陷入被害的妄想之中,从而给社会运行带来问题呢?这种担忧有一定道理,但是也不尽然。以犯罪热点为例,事实上,只要是在当地生活过一定时间的人,都会对该地区的犯罪情况有着或多或少的认识,虽然这种认识大体准确但不精确。有研究指出,如果将选定的研究区划分成数个较大网格,让当地居民从中选出10个网格作为盗窃犯罪热点时,他们大都能选对6个网格,准确度达到60%,而当该研究区被划成更多较小的网格后再让他们选择时,其准确度一下子就降低到了20%。[11]可见,居民对于犯罪热点的判断只是停留在一个相对模糊的层面。这种对犯罪热点相对准确却不精确的认识也可能带来犯罪恐惧,而又由于模糊性的存在,普通市民的犯罪恐惧只会波及到更大面积的区域。其他的情况也是如此,所以从这个角度来思考,公开犯罪数据,让普通群众对犯罪的认识更加准确,反而能够降低犯罪恐慌的范围。
(三)犯罪人利用犯罪数据的风险
首先,公民应该对与其个人有密切相关的事件享有知情权,这是一个民主国家的基本要求。其身边的犯罪情况应当包含其中,因为这直接关系公民的生活质量以及安全感,与其密切相关。因此,犯罪数据的公开是保障公民知情权实现的内容之一。其次,宪法规定为人民监督权力提供了依据。《宪法》第3条第2款、3款规定:“全国人民代表大会和地方各级人民代表大会都由民主选举产生, 对人民负责, 受人民监督。国家行政机关、监察机关、审判机关、检察机关都由人民代表大会产生, 对它负责, 受它监督。”治理犯罪也是政府工作的内容之一,理应受到公民的监督,而犯罪数据是公民监督政府治理犯罪的基础。保障犯罪数据的公开才能保证公民真正行使宪法赋予他们监督政府工作的权利。
四、域外经验:美国犯罪数据公开情况简介
他山之石可以攻玉,国外的经验亦可成为我们前进的路引。作为犯罪学发展最好的国家,美国的犯罪数据公开制度应有其可取之处。了解美国犯罪数据公开或许能为我国的犯罪数据公开带来启示。
(一)统一犯罪报告(Uniform Crime Reports,简称UCR)
UCR数据是美国最常用的犯罪数据来源之一。其数据来自于美国当地的执法机关,由美国联邦调查局进行统一编制与维护。最早的统一犯罪报告可以追溯到1929年,由国际警察局长协会(International Association of Chiefs of Police,简称IACP)组织的统一犯罪记录委员会完成并发表。(3) https://ucr.fbi.gov/data-quality-guidelines-new,最后访问时间:2018年9月3日。 之后,UCR经历了一系列的拓展,在犯罪数据的种类和可靠性上有了巨大提升。1958年,UCR报告改名为“美国犯罪”(Crime in the United States)。如今,向FBI进行数据报告的执法机关已经超过18000个。(4) https://ucr.fbi.gov/crime-in-the-u.s/2016/crime-in-the-u.s.-2016/resource-pages/about-cius,最后访问时间:2018年9月3日。 UCR数据涵盖美国绝大部分执法机关的犯罪记录,完整地展示了美国的犯罪情况。
大数据既带来了巨大的机遇也带来了巨大的挑战。首先,面对大量来源不同、结构不同、形式不同的数据,如何进行数据的搜集与整理已成为一个严峻的问题。其次,面对海量、实时变化的大数据,如何在短时间内计算并加以分析,已成为新的挑战。再次,海量数据的存储与管理也是一个不能回避的问题。最后,由于大数据技术的不断进步,新的技术与方法层出不穷,如何不断更新知识也是摆在每个研究者面前的难题。而大数据又同时涉及统计、计算机、数学等多个领域,不仅握有犯罪数据的各个部门,甚至于大多数非专业的研究机构或个人,都难以应对这些挑战。因此,不完善的犯罪数据公开制度,将导致犯罪数据的价值被大大浪费。
UCR将执法机关已知的犯罪分为暴力犯罪和财产犯罪。其中,暴力犯罪包括谋杀与误杀、强奸、抢劫、严重故意伤害四种;财产犯罪包括入室盗窃、盗窃、机动车盗窃和纵火。为了拓展执法机关已知的犯罪的信息量,UCR还提供了完结犯罪数据报告和拓展的犯罪数据报告。完结的犯罪数据包含了所有犯罪人被逮捕的案件,以及因一些执法机关不可控的因素使得犯罪人无法被逮捕或被控诉的案件。(5) https://ucr.fbi.gov/crime-in-the-u.s/2016/crime-in-the-u.s.-2016/topic-pages/clearances,最后访问时间:2018年9月3日。 拓展的犯罪数据报告对犯罪数据进行了拓展,提供有各类犯罪的趋势、犯罪人所使用的武器情况、每十万居民的犯罪率以及被盗财物的种类和价值等。在拓展的犯罪数据报告下还专设有拓展的杀人数据报告。该报告对谋杀案件的各种细节进行了补充,如受害者和罪犯人的年龄、性别、民族和种族,杀人中使用的武器等。
为了监督政府表现、改善服务质量、提高透明度、推动政府创新以及促进有创造性的问题解决方案的提出,辛辛那提展示与数据分析办公室(The Office of Performance & Data Analytics,简称OPDA)在全市范围内进行了数据的搜集,并将这些数据上传到其建立的交互式网站CincyInsights之上,以便市民可以方便、清晰地了解本市的各种情况。访问者可以通过访问CincyInsights主页和辛辛那提市数据公开(Open Data Cincinnati)页面上的安全街道(safer streets)版块来获取犯罪数据。这些犯罪数据每日会进行更新。公开的犯罪数据主要包含在以下三个版块当中:报告的犯罪数据、报警数据、辛辛那提减少暴力计划。
(二)全国事件导向报告系统(The National Incident-Based Reporting System,简称NIBRS)
由于UCR搜集的犯罪数据只包含一些基本的犯罪信息,没有包含每个犯罪案件的详细信息,所以能得出的结论非常有限。而且,在统计犯罪信息时,UCR遵从“等级规则”,即当一个犯罪事件涉及多个犯罪人、被害人和犯罪行为时,只按最重的罪行进行计算。例如,犯罪人强奸、抢劫了一位妇女并对她进行了殴打,那么他事实上实施了抢劫、强奸、故意伤害三个犯罪行为,但是按照UCR的规则只有强奸会被收录并计算。[23]正是以上两个问题促使了NIBRS的产生。NIBRS被认为是新版UCR,是最有希望取代UCR的数据源。
NIBRS是在UCR的基础上发展起来的,但正如它的名字一样,是以事件为导向的报告系统。在该系统中,执法机关会搜集每个犯罪案件的各种相关信息,然后进行汇总与统计,最后给出犯罪统计报告。NIBRS不存在“等级规则”,一个犯罪涉及多个罪名时,该犯罪行为会被纳入多个犯罪的统计数据中。NIBRS将犯罪数据分为A、B两组,A组包含24类共52种犯罪,B组包含10种犯罪。(7) A、B组具体包含的犯罪种类见,https://ucr.fbi.gov/nibrs-in-brief,最后访问时间:2018年9月3日。 而所有这些犯罪又都被分到侵害人身的犯罪、侵害财产的犯罪、侵害社会的犯罪这三大类之下。(8) https://ucr.fbi.gov/nibrs/2016/tables/data-declarations/dd_incidents_offenses_victims_and_known_offenders_by_offense_category_2016.pdf,最后访问时间:2018年9月3日。 NIBRS报告统计有被害人、犯罪人、被逮捕人的年龄、性别、种族信息,犯罪人与被害人的关系,犯罪地点与时间信息,犯罪所使用的工具信息,犯罪的环境信息等等。此外,NIBRS还提供了犯罪地图以便读者快速查找某一地区的犯罪情况。
从新媒体在2016年美国总统大选及在特朗普阵营发挥的作用看,特朗普现象不应仅解读为民粹主义本身的再度崛起,而是民粹主义结合新媒体取得成功的例证。民粹主义的出现既有历史文化原因亦有受政治机会主义者煽动利用因素。如今,民粹随经济危机再度回归,公众不再跟随精英的观点成为2016年大选的背景(Gelman&Azari 2017),这一态势为特朗普成功利用并进一步塑造。民粹和民主的界限本身也颇为微妙,“服务人民”即便未曾出自每个美国总统竞选者之口,也毫无疑问是不可否认的命题。呼唤“多数人的统治”本身既是政治理念又是政治策略,这赋予民粹主义在美国政治生态中顽强的生命力。
2.大数据时代下数据挖掘与分析技术的需要
(三)国家犯罪被害调查(The National Crime Victimization Survey,简称NCVS)
UCR和NIBRS均源自政府机关核实确认的犯罪数据。然而,由于犯罪黑数的存在,实际的犯罪数量要远远多于政府机关所核实确认的。因为大量未被发现或报告的犯罪的存在,所以不论UCR还是NIBRS都存在低估犯罪数量的问题。这种低估尤其容易发生在轻微犯罪上,如盗窃少量财物、较轻微的人身伤害等。为了弥补这一不足,获得更接近事实的犯罪数据,研究者认识到,需要转换视角,从被害人的角度来统计犯罪数量。NCVS由此诞生。
NCVS可追溯到1973年,最早被称为国家犯罪调查(The National Crime Survey,简称NCS),由美国人口普查局(隶属于美国商务部)代表司法统计局(隶属于美国司法部)进行管理。NCVS调查一年进行两次,在全美抽取具有代表性的大约49000户家庭共计100000人作为样本,以获取美国刑事受害的频率、特征和后果等犯罪数据。NCVS调查主要有以下四个目标:(1)识别被害人以及犯罪行为结果的详细信息;(2)估算未向警方报告的犯罪数量和种类;(3)对所选的犯罪类型提供统一的测量标准;(4)提供时间和区域类型的比较。(9) https://www.icpsr.umich.edu/icpsrweb/NACJD/,NCVS/,最后访问时间:2018年9月4日。
NCVS采用了复杂的抽样设计和人口权重,受访者的回答会被集中并加权后用以估计美国的犯罪和受害情况。NCVS将犯罪分为两大类:侵害人身的犯罪和侵害财产的犯罪。其中侵害人身的犯罪包括强奸及其他性侵害、抢劫、严重的和一般的攻击行为、抢夺钱包和扒窃;财产犯罪包括盗窃、入室盗窃、机动车盗窃和破坏公物。NCVS不仅搜集被害人的性别、种族、年龄、受教育程度、收入等信息,还会搜集犯罪人的特点、犯罪时间、地点及使用的武器情况。NCVS的价值不仅在于估计犯罪的数量和趋势,更在于对犯罪黑数的估算。
在统一犯罪报告之外,NCVS还提供受调查家庭的家庭档案,受调查个人的个人档案以及受害信息的事件档案。这些档案都提供有各种统计软件的数据集格式,比如SAS、SPSS、STATA、R等,用户可以根据自己使用的软件下载相关的数据集。但是出于尊重当事人隐私的考虑,这些档案数据并不与对公众公开,只与大学间政治与社会研究联盟(Inter-university Consortium for Political and Social Research,简称ICPSR)的成员机构内的老师、学生、研究者共享。
当然,NCVS也有自身的问题。首先,因为源自被害人视角,NCVS往往缺少犯罪人的信息。其次,NCVS难以统计对于非个人和住宅的侵害,如盗窃商店、抢劫银行等。最后,存在过度报告的问题,因为受害人总是容易夸大自己的损失。
参考刘文惠等[4]的方法,并稍作修改。准确称取肌苷酸标准品1 mg,用流动相定容至2 mL,摇匀,逐级稀释成不同浓度梯度,绘制标准曲线。
(四)美国城市的犯罪数据公开——以辛辛那提市为例
上面谈了三个国家层面的犯罪数据公开情况,下面我们将视角转移到美国的城市。由于美国是联邦制国家,国土面积极广,城市众多,各城市之间在经济、政策、法律法规等方面存在一定差异,所以美国各地对犯罪数据公开的态度与执行状况并不统一。相较而言,辛辛那提市警察部门在犯罪数据的管理与公开方面做得尤为出色,因此我们将目光聚焦于辛辛那提的犯罪数据公开之上。
式中:表示试验点x落入估计的可行域的概率(可行性概率),记作和表示第i个约束函数Kriging模型的预测均值和标准差。CEI准则概念简单、计算容易,但该准则受PoF的影响大,收敛到可行域边界上最优解的效率不高。基于CEI准则的代理优化算法在本文简称CEI算法。
在逮捕数据中,UCR计算有28种犯罪的犯罪总数。(6) https://ucr.fbi.gov/crime-in-the-u.s/2016/crime-in-the-u.s.-2016/topic-pages/persons-arrested,最后访问时间:2018年9月3日。 除了上面提到的八种暴力犯罪和财产犯罪,该报告还包含了卖淫、毒品犯罪、赌博、酗酒、破坏公物、贪污、欺诈和伪造等犯罪数据。此外,UCR的逮捕数据报告中提供了这些犯罪人的年龄、种族、民族等的统计信息。
报告的犯罪数据(reported crime)来自辛辛那提市的记录管理系统(Records Management System,简称RMS),不仅包含谋杀、强奸、抢劫、严重故意伤害这样的暴力犯罪信息,还包含入室盗窃、私闯住宅、盗窃、无权使用等财产犯罪信息。该版块提供有多种犯罪统计图表,如包含被害人性别、年龄、种族的被害人统计表;包含犯罪嫌疑人性别、年龄、种族的犯罪嫌疑人统计表;犯罪时间统计表;犯罪类型统计表;社区犯罪统计表以及犯罪地图。这些统计图表拥有交互功能,访问者可以通过参数的设置来展示特定的统计结果。更为可贵的是,不同于上述的全国犯罪报告,报告的犯罪数据版块还提供了各个犯罪事件的详细信息,包括报案时间,犯罪起止时间、星期,犯罪的武器,犯罪的地点和经纬度,犯罪嫌疑人、被害人的年龄、种族、性别等关键信息。当然,这些数据也依照美国隐私法的要求进行了匿名与修改,比如针对犯罪地点,以“XX”替换地址的最后两位数字,在地址只有一个数字的情况下,用“X”替换整个地址号码;对经纬度进行模糊处理,使犯罪定位到大概的区域,而不提供准确的位置。正如该模块的名称一样,报告的犯罪数据版块只包含了被报告的犯罪数据,报警数据、逮捕信息、案件的最终情况都不会被包含在内。
报警数据(police calls for service)来自辛辛那提市的计算机辅助调度(Computer Aided Dispatch,简称CAD)系统。该系统记录了警察的事件响应活动,包括所有向紧急操作员寻求帮助的呼叫,如911、警报、警察无线电和非紧急呼叫。和报告的犯罪数据一样,报警数据版块也展示有许多具有交互功能的报警数据统计图表,比如报警时间统计图、各社区报警数量统计、报警地图、报警类型词云图,以及各个报警事件的详细信息,包括地点和经纬度、涉及的机关部门、报警时间、报警意向种类、报警事件种类、所在社区、优先等级等信息。当然,这些信息也都经过了匿名处理。
辛辛那提减少暴力计划(The Cincinnati Initiative to Reduce Violence,简称CIRV)仿效了20世纪90年代中期的“波士顿枪支项目”,于2007年启动,旨在迅速和显著地减少枪支暴力及与之相关的杀人案件数量。CIRV数据涉及所有的枪击事件,包括致命和非致命的,特别是那些涉嫌暴力群体成员参与的枪击事件。CIRV数据也来自CAD系统,并最终储存在RMS中。CIRV版块也有大量的互动式枪击事件统计图表,包括枪击时间统计表、各个社区枪击数量统计表、枪击位置地图、致命性和非致命性枪击数量对照图,以及各次枪击事件的详细信息,包括枪击地点以及经纬度、枪击案件发生的社区、枪击是否致命、被害人数量、被害人的性别和种族等等。同样地,CIRV数据也进行了匿名处理,不会显示任何嫌疑人或者被害人的个人信息。
总的来说,相比于国家层面的犯罪数据公开,辛辛那提市公开的犯罪数据内容更加详细,涉及的犯罪信息、犯罪嫌疑人信息、被害人信息也更为丰富。而且由于其不仅仅展示犯罪的统计数据,还展示了各个犯罪事件的详细信息,对于犯罪分析与研究有着极大的助益。
五、我国犯罪数据公开的进路思考
(一)我国犯罪数据公开现状
我国完全公开的犯罪数据,除了司法文书网上的司法数据,就要数国家统计局网站的犯罪统计数据。公开的犯罪数据集中在国家统计局年度报表的公共管理、社会保障及其他栏目之中,涉及的犯罪数据有:历年各类刑事案件、治安案件的总数;历年公安机关每万人受理的案件数量;历年在押犯罪人的数量和变动情况,以及其中女性、未成年人的数量;历年检察院、法院的各类案件的立案数、受理数、结案数;历年检察院各类案件的立结案人数;历年检察院批捕、决定逮捕、决定起诉的案件数及人数等。国家统计局网站提供犯罪数据的可视化展现,目前有柱状图、条状图、饼状图三种统计视图可以选择。
国家统计局的犯罪数据涉及公、检、法三部门的犯罪数据的统计信息,这一点颇具研究价值,但在犯罪信息的全面性和详细程度方面还存在着不足。比如,虽然给出了在押服刑的未成年人数量,但是并没有给出在押服刑人员的年龄分布;所有犯罪数据都是全国性的统计数据,缺少各个省、市、地方的犯罪统计;财产犯罪只给出犯罪的数量没有给出合计的犯罪数额;暴力犯罪没有给出犯罪工具、受害人数量、伤害程度等信息;犯罪时间统计缺失等等。
(二)我国犯罪数据公开的进路思考
结合美国犯罪数据公开的情况以及辛辛那提市犯罪数据公开的经验,笔者认为我国的犯罪数据公开可以有以下几点改进:
1.多层级的犯罪统计数据的公开
我国是一个地缘广阔的国家,各地区的经济发展与人口结构等情况都存在巨大的差异,犯罪分布也有很大的不同,全国的犯罪统计数据过于宏观,无法反映各地区的现实与差异。以全国数据来推测地区情况,不仅不合适,还容易产生误判。为了准确把握当地的犯罪情况,研究地区间犯罪的差异,公布地方的犯罪数据十分必要。
笔者以为,可以在国家犯罪统计数据下,进一步区分省级、市级、区级的犯罪统计数据。依托国家统计局网站,对于全国各级犯罪统计数据进行汇总,允许浏览者自主选择所需要访问的层级与地方的犯罪统计数据,从而给研究者和一般市民提供更加准确的有关当地犯罪情况的描述。
2.扩展犯罪统计数据所包含的信息
正如上文笔者指出的那样,国家统计局的犯罪统计数据涵盖的信息种类不够全面,在犯罪空间、时间、犯罪人情况、被害人情况上都存在关键的信息缺失。仅仅统计各类犯罪的数量,只能反映该类犯罪的趋势,并不能够为我们提供更多的信息。简单地统计在押人员中女性和未成年人的数量,或许能够为女性犯罪和未成年犯罪的研究带来一定的帮助,但是在没有其他数据配合的情况下,所提供的信息依旧只有比例和趋势。所以,笔者认为要想进一步挖掘犯罪数据的价值,提供更多的犯罪信息是当务之急。
结合美国公开的犯罪数据情况,笔者认为下列信息很有添加的必要:
(1)犯罪的时间分布,包括犯罪发生的日期、星期、具体时间段等。时间对于任何一个案件来说都是十分关键的因素。日常行为理论指出,犯罪的发生与人们的日常行为息息相关,而人的日常行为具有一定的时间规律,所以犯罪也常常具有时间特征。我国学者很早以前就对犯罪的时间分布进行了研究,指出犯罪具有季节性的特征。[24]但之后的研究比较零散,未成系统,而且多数研究时间跨度较短,没有对犯罪时间分布进行持续的关注。在公开的犯罪统计数据中,加入相对具体的时间分布描述,不仅有助于揭示犯罪的时间分布规律,还能够探知犯罪时间分布的变迁,从而探索犯罪时间与人们生活规律的关系。
(2)犯罪情节信息。即便犯罪种类相同,犯罪情节也可能千差万别。一些情节虽不能决定犯罪的类型,但是对于犯罪性质、社会危害程度等方面有着巨大的影响。比如,同样是故意杀人,以徒手杀人、日常生活工具杀人、刀斧武器杀人、枪杀等不同的工具使用,就会影响到犯罪的严重性、社会危害程度,单纯地统计故意杀人的犯罪数量很难客观反映当下社会故意杀人犯罪的严重程度,而且还可能存在这种情况:两个故意杀人犯罪数量差异不大的地区,却在工具的选择上拥有巨大的差异,这时故意杀人的犯罪总数就无法区分这两地区故意杀人犯罪的严重程度。类似的例子也会出现在盗窃、抢劫、故意伤害、强奸等犯罪中,因此犯罪情节的展示能够更加准确地揭示、预判犯罪的趋势。笔者认为,相对重要的犯罪情节信息有:暴力犯罪的工具使用情况、受害人数量、伤害程度;财产犯罪的犯罪手段、数额、涉及的物品种类;犯罪地点及周边环境信息等。
(3)犯罪人、被害人信息。犯罪人和被害人是犯罪事件的亲历者,也是犯罪学中的重要研究对象。但是这些信息在国家统计局网站中却几乎没有涉及,只在在押服刑人员统计中对总人数、女性数量和未成年人数量进行了统计。这样的统计数据太过粗略,甚至连不同的犯罪中的男女比例与未成年犯数量也无法确定。而现实告诉我们,男女比例和未成年犯数量在不同的犯罪之间有很大的差异,比如强奸犯罪中,男性的犯罪数远远大于女性。而未成年人实施的犯罪也应与成年人实施的犯罪有很大差异。这些差异无法在该统计数据中予以呈现。此外,其他一些犯罪人和被害人信息也有着十分重要的研究价值,如受教育程度、社会背景、社会地位等。因此,年龄结构、文化程度、社会背景、社会地位、性别等犯罪人和被害人信息也有必要加入犯罪数据公开的范围。
在一些关于地理区域和地理内容的知识中经常会有学生了解的历史故事和人文作品。这些带有故事趣味和色彩的内容,在地理知识教学中赋有一定的感染能力,既能激发学生的热情和兴趣,还能够陶冶学生的性情。比如在教师教授地中海地区的内容时,教师可应用第一个代表中国参加奥运会的体育健儿的故事,从而引出地中海地区的气候内容,起到了良好的教学引导作用[3]。
3.多形式、多角度、交互式的犯罪统计报告
犯罪统计报告如果仅仅提供统计数字,很难突出重点并为浏览者带来直观、具体的感受。相比之下,犯罪统计图谱能够形象地展示我国当前的犯罪情况,给浏览者以视觉的冲击。目前,国家统计局网站已经提供了三种形式的犯罪统计图,即柱状图、条状图和饼状图,基本满足了犯罪数据可视化的需要。但是本着精益求精的态度,笔者认为,词云图和犯罪地图也有公布的必要。两者之中,犯罪地图的公开可能更为重要一些。因为犯罪地图是犯罪地理信息的图形表达,反映犯罪的空间分布情况,拥有独特的研究价值。
对各街道在早06:00—21:00的交通指数采用系统聚类方法聚类后得到图5所示聚类树. 聚类树图中各编号对应街道可见表3.
从美国的犯罪数据公开情况来看,犯罪数据与被害数据为考察犯罪现状提供了不同的视角,二者各有侧重,互有优劣。而目前,我国对被害数据的获取还留有空白。笔者以为,我国也可以开展类似的被害调查,以抽样的方式,定期开展被害调查,获取被害数据,从而对犯罪黑数进行评估。
犯罪数据包括各种不同的犯罪信息,如犯罪人年龄、犯罪类型、犯罪位置、犯罪时间等。很多研究者或者浏览者往往希望能够对自己关心的犯罪问题进行详细的多角度的研究与分析,如研究盗窃犯罪时,希望分析盗窃犯罪人的年龄分布,各年龄段犯罪人的犯罪手段选择差异,不同类型的盗窃犯罪的空间分布差异等。这就需要多种犯罪信息的交叉呈现。目前来看,美国的犯罪数据虽然在一定程度上考虑到了这些问题,如在各类犯罪中增加犯罪人性别、年龄等信息,但还远远不够。因为它仅仅提供了一个固定的框架,研究者和浏览者无法自由设定交叉的条件,这就限制了犯罪数据的应用广度。因此,笔者建议,我国可以在有条件的情况下,提供一个交互式的犯罪信息交叉展示平台,让研究者和浏览者自主选择需要交叉分析的犯罪信息,以满足特定的研究目的。
[参考文献]
[1]李明琪.对犯罪概念的再认识[J].中国人民公安大学学报(社会科学版),2005,(6):74-76.
[2]许章润.犯罪学(第3版)[M].北京:法律出版社,2007.4.
[3]Rosenbaum D P. The problem of crime control[M]. In Community crime prevention: Does it work?edited by Dennis P.Rosenbaum. Beverly Hills, CA:Sage Publications,1986.11-18.
[4]Federal Bureau of Investigation.Uniform crime reports[R].Washington, DC: U.S. Department of justice. 1975, September.
[5]Lurigio A J, Rosenbaum D P. Evaluation research in community crime prevention: A critical look at the field[M]. In Community crime prevention: Does it work?, edited by Dennis P.Rosenbaum. Beverly Hills, CA:Sage Publications,1986.19-44.
[6]Lee Y J, Eck J E, Corsaro N. Conclusions from the history of research into the effects of police force size on crime—1968 through 2013: a historical systematic review[J]. Journal of Experimental Criminology,2016,(3):431-451.
[7][8][英]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.67.88.
[9]单勇.犯罪热点成因:基于空间相关性的解释[J].中国法学,2016,(2):280-302.
[10][美]艾尔·巴比.社会研究方法(上)[M].邱泽奇,译.北京:华夏出版社,2000.100.
[11]单勇.犯罪地图的公开[J].国家检察官学院学报,2016,(3).
[12]吴宗宪.西方犯罪学史(第2版)[M].北京:中国人民公安大学出版社,2010.914-916.
[13]Chaiken J M, Lawless M W, Stevenson K A. The impact of police activity on crime: Robberies on the New York City subway system[R]. New York: Rand Institute, 1947.
[14]Lateef A B. Helicopter patrol in law enforcement: An evaluation[J]. Journal of Police Science and Administration,1974,(1):62-65.
[15]Mayhew P, Clarke R V, Sturman A, Hough M. Crime as Opportunity, Home Office Research Study No.34[R]. London:Home Office, 1976.
[16]Press S J. Some Effects of an Increase in Police Manpower in the 20th Precinct of New York City[R]. New York: Rand Institute, 1971.
[17]Barr R, Pease K. Crime Placement, Displacement, and Deflection[J]. Crime and Justice: A Review of Research, 1990,(12):277.
[18]Clarke R V. 1992. Situational crime prevention: Theory and practice[J]. British Journal of Criminology,1992,(20):136-147.
[19]Eck J E. The threat of crime displacement[J].Criminal Justice Abstracts,1993,(3):527-546.
[20]Gabor T. Preventing crime: Current issues and debates[J]. Canadian Journal of Criminology, 1990,(1):1-212.
[21]Hesseling R. Displacement: A review of the empirical literature[M]. In Crime Prevention Studies, vol.3, ed. Ronald V. Clarke. Monsey, NY:Criminal Justice Press., 1994.
[22][美]大卫·威斯勃德,等.“地点”在警务活动中的重要性:实证性证据与对策建议[A].刘建宏.国际犯罪学大师论犯罪控制科学[C].北京:人民出版社,2012.102.
[23]Walker J T, Drawve G R. Foundations of Crime Analysis: Data, Analyses, and Mapping[M]. Routledge,2018.81.
[24]马晓.犯罪时间研究[J].青少年犯罪问题,1994,(5).
Abstract : In the era of big data, crime data analysis and mining has become the basic means of criminology research and modern crime control. Crime data play an irreplaceable role in revealing crime patterns, causes and evaluating prevention and control effects. At present, China faces some problems in opening crime data, which directly leads to lack of empirical research in the field of criminology and seriously restricts release of the value of crime data in the era of big data.Through comparative studies at home and abroad, it can be seen that China needs to open more diverse and comprehensive crime statistics, establish an interactive crime data disclosure platform, and give full play to the role of crime data in criminology research and crime prevention.
Key words : crime data,disclosure of crime data, big data, criminology, a comparative study
收稿日期: 2019-06-15
作者简介: 阮重骏(1990-),男,浙江杭州人,吉林大学法学院刑法学专业博士研究生,主要研究方向为犯罪学。
基金项目: 本论文得到国家留学基金委资助。
中图分类号: D917
文献标识码: A
文章编号: 1673-1565( 2019) 04-0109-10
[责任编辑 董士昙]
A Study on Crime Data Disclosure in China in the Era of Big Data
—From the Perspective of Comparative study between China and America
RUAN Chongjun
(School of Law, Jilin University, Changchun, Jilin 130012)