构建算法时代的司法规制模式
文/刘哲 北京市人民检察院
(图/IC photo)
基于AI技术的“深度伪造”不但会产生骚扰、网络诈骗的花样翻新,而且通过对重要政治人物的“深度伪造”可能引发颠覆性舆情,对国家安全构成威胁。因此对“深度伪造”不能再按照传统司法规制模式——以线下调查为主,而应该充分将线下和线上的工作深度结合,构建算法时代的司法规制模式体系,从而第一时间追踪“深度伪造”的传播路径和发布源头。
“深度伪造”虽然貌似具有权威性,但其发布平台往往不具备权威性,信息被扩散之后,有关部门很难辨别信源出处,即使要追查也需要耗费大量的时间,因此必须第一时间有效应对。如果能够快速查找到源头和传播路径,就能够对“深度伪造”的制造者和主要传播者一网打尽,并对其他的“伪造”者产生足够的心理震慑。对算法的规制不是压制算法的研究,而是避免算法被滥用,只要没有侵犯法律,“深度伪造”只是对“深度学习”技术的研究而已,而一旦逾越法律的边界,变成骗取钱财、制造恐怖和颠覆政府的工具,那司法必须予以坚决打击。在这个方面要做到保护创新与打击犯罪的平衡,对“深度伪造”违法性质的预判变得格外重要。因此,笔者认为有必要完整构建一个针对“深度伪造”的预判预防、及时处置的快速司法规制体系。
具体来说就是参考杀毒软件的原理,整合现有经过人工确认的“深度伪造”数据资源,对“深度伪造”进行逐个标识,为每个涉嫌违法的“深度伪造”视频建立身份信息,从而形成集“深度伪造”比对辅助识别、网上追踪、网上预警、数据深度挖掘等多种功能于一体的“反违法深度伪造”数据库。
综上所述,通过虚拟共享实训平台,在变速箱拆装实训课程教学中采用先虚后实、虚实融合的方法进行,最后通过虚拟考核的方式结束课程的学习。
具体可从以下四个方面入手:
“反违法深度伪造”数据库不是一个颠覆性的技术,只是对技术性进行颠覆性的利用,它在前期必须依托于大量的人工识别资源的整合。这个工程看起来浩大,但由于标识是系统自动完成的,而标识一批影像后,可以利用已经掌握的标识数据资源对新入库数据进行比对处理,比对一致的就可以直接复制标识,只有比对不一致的才进行标识处理,因此运算量达到一个峰值后会逐渐降低。这样做就像在建立一个杀毒软件的病毒库,它的样本越大,它的杀毒能力也就越强。
▲识别机制
(3)足球课教学应转向学生体育能力、习惯和终身意识的培养,课程设置应以学生需要为依据,重视过程与方法,重视学生的情感、态度与价值观,保证学生的主体。教学内容、方法的选择要人性化,以满足大学生身心健康发展、主体性体现为原则。
▲基本原理
“反违法深度伪造”数据库的基本原理非常简单,基本与现在流行的指纹识别、人脸识别技术一致,并无高深之处。即在一个动态的影像中随机抽取若干帧画面,比如10帧画面,这10帧画面就是这段“深度伪造”的指纹或者身份,是它特有的、独一无二的标志,这组画面就将动态的影像静态化了。静态化比对两帧画面的原理就与指纹识别几乎完全一样了,通过查找一些特定的影像点,如果达到一定的数量就是一致的。如果另一个影像也具有一模一样的1到2幅画面,那么就说明两个影像高度相似,当然单一画面的比对可能存在一定的误差,但随着相同画面的增加,两个影像同一性的概率就会不断增加,如果10幅画面完全相同,那误差将趋近于零,即这是两段完全相同的画面,从而将另一个影像自动的标识为违法“深度伪造”视频。纵然有些违法“深度伪造”视频被拆分若干片段,也可以通过增加标识画面的数量,从而增加辨识的概率。因此,“反违法深度伪造”数据库的基本原理就是影像同一性的识别,将平面识别技术进行立体化的利用,即建立违法深度伪造的“立体指纹”系统。
这是第一位的工作,但是鉴于具有很强的法律判断需求,建议由最高人民检察院牵头组建。先根据已经流行的“深度伪造”视频,归纳总结出一些特点,比如名人出镜、非权威平台发布、与相关新闻报道不相吻合、攸关重大公众利益等。至于属于一般的违法行为,还是构成刑事犯罪,或者可能危害国家安全,可以由专业人员再作进一步判断。在判断研究的过程中,对于具体的识别点都可以不断的算法化,并形成识别涉嫌违法的“深度伪造”视频的一套预警算法,与网络热搜的重要视频进行识别判断,并分级别及时发布预警警报——类似于网络免疫系统。
▲技术特点
下面以边缘被固定的柔韧矩形板为例来分析变形薄膜的应变。分别用a、b表示板两个边的长度,h表示板的厚度,如图1所示。
“深度伪造”的辅助识别方式,就是在一批新近查获的“深度伪造”内容收录后,直接输入“反深度伪造”数据库进行自动识别,数据库将最大限度地收集现有的转码软件和视频播放软件,一般来说无须人工转码,全部由计算机自动完成。依托大运算量的计算机,“反违法深度伪造”数据库将在尽可能短的时间内完成影像的比对工作,并对比对完成的影像自动提供标识目录,包括深度伪造的类别、名称等。对于没有比对成功的影像数据,将由人工继续进行比对识别,人工比对确认为不良信息后,将向“反违法深度伪造”数据库提供一份备份,以便不断丰富“反违法深度伪造”数据库的数据资源。经过大量的数据比对和人工补给之后,“反违法深度伪造”数据库的智能化将不断提高,从而不断提高对新影像的识别能力,进而不断降低人工识别的工作压力,从整体上提高违法深度伪造数据的识别效率。
▲主要功能
识别比对、同一性鉴定,只是“反违法深度伪造”数据库的基本功能。通过大数据的深入挖掘,“反违法深度伪造”数据库还将实现很多主动性的功能。“反违法深度伪造”数据库将要求新入库影像同时提供影像的来源、提取时间等辅助数据,通过对这些辅助数据的分析,数据库将对同一影像的传播历史和传播路径进行记录和绘制。“反违法深度伪造”数据库的数据来源除了办案查获的数据资源,还可以与主流的搜索引擎、视频网站、即时通信工具提供商等互联网公司合作,通过主动比对违法深度伪造信息实现对违法深度伪造的网上追踪,从而能够绘制违法深度伪造动态的传播地图和时间轨迹,通过不断地追索,将发现不良影响的传播源头,并逐渐形成对违法深度伪造的源头追溯能力,从而有利于提高风险防控的治本能力。依据动态的数据,对于违法深度伪造激增的一些网站将提出预警,对违法深度伪造的源头可以及时防控,从而真正实现风险防控的关口前移。这些关口前移对于政治敏感、暴恐影像等高度危险信息的防控将发挥更加明显的作用,从而增强整体的司法应急反应速度。
算法时代的问题,只有算法思维才能有效解决。建立“反违法深度伪造”数据库是司法机关应对算法时代的必然选择,由预防和规制相互分离向预防与规制相互融合的转变是无法回避的趋势,司法与算法的深度融合将是这个时代的需要完成的法治命题。
编辑:黄灵 yeshzhwu@foxmail.com