大数据分析训练模式在法学教学中的构建研究论文_刘萍

大数据分析训练模式在法学教学中的构建研究论文_刘萍

(电子科技大学成都学院 611731)

摘要:“法律+大数据分析”是未来法学研究的重要发展方向,本文以教改项目为依托,探讨大数据分析训练模式在法学教学中的构建方法和实践,跨系合作建设法律案件预判系统和引导学生撰写法律大数据分析报告是本次教学改革的重点步骤,该训练模式能够帮助学生建立法律大数据分析思维,学会搜集预判系统中需要的关键信息,以及撰写有一定市场指导价值的大数据分析报告。

关键词:法律预判;大数据分析;训练模式;法学教学

一、研究背景

全国各级人民法院的裁判文书公开上网,诉讼案件的大量文档蕴藏的数据对此后同类型案件的代理和审判具有很高的参考价值,也为法学研究提供了丰富的案例素材,法律业大数据时代已经到来。

法律智能预判系统研究是通过将法院判决书数据信息如:案件耗时、提供材料、胜诉概率、律师费用等进行提取、归类、筛选,运用科学的计算方法对各项数据进行分析,利用数据处理端提取关键信息,机器学习模型进行数据挖掘,得到初步成果,SVM技术生成模型文件,建立起一个互联网用户搜索的数据库,并通过可视化方式进行呈现,得出一个有迹可循的判案参考,达到对诉讼案件结果的预测要求的研究。

什么是法律行业大数据分析报告?目前没有一个标准的或者有说服力的定义。我们提出一个法律行业大数据的定义雏形,所谓法律行业大数据报告,就是用适当的司法数据收集方法、统计分析方法,对数据进行整理分析,并以法律人的视角筛选、归纳、提炼,最终以可视化方式将历史的或者现实的客观数据呈现给用户,帮助用户预测方向与路径,做出尽可能正确的决策,这里的用户,可以是法律案件当事人,也可以是法律从业者。

二、研究步骤

1.法律智能预判系统建设

(1)web前端

我们做出了关于法律预判系统前端的web设计。从Web标准出发,通过HTML代码实现网站前台的内容和结构,通过CSS代码实现相关内容的样式,通过Java Script代码实现页面的动态效果。并且考虑到法律工作者和非法律工作者的使用习惯,设计出一个简洁、大方的web界面,还兼顾合理的布局、协调的页面颜色搭配和较好的用户体验。

对大量的民事案件的裁判文书进行分析,提取关键字段,寻找各种字段在不同的民事案件裁判文书中的规律和逻辑。以这些提取的关键字段为核心做一个web端的民事案件预判的前端。重难点在证据分类上,及实现前后端的数据交互。通过对裁判文书的分析,挖掘其中的数据段和规则,让计算机也能够读懂文书。如果计算机能够理解我们的规则,它就能根据自身所理解的规则推导出新的规则,或者至少依据规则对新出现的事物。

这次预判系统网站布局的重构既要能够鲜明准确的展现其主题,又要确保网页各元素存在的必要性以避免冗余从而提高效率,要以适合主题为条件的同时追求网页的形式美,才能使我们的网页设计简单、立体又智能。作为法律大数据预判系统前端的web设计,为了众多用户考虑,其对效率的要求必然也不能过低。为此我们要尽量减少用户操作界面的时间从而提高使用效率。

(2)web后端

本智能预判系统分为了三个模块:自然语言预处理模块、机器学习分类器、Web应用前端。本系统输入源是法院的判决书,因为判决书是没有任何规律的人类语言所写,所以这里需要使用到自然语言处理计算来解决这个问题(目前因为这个实现难度高,所以老师说暂时先人工处理,这里面至少会用到法律文书语料库构建、ansj分词算法、指代消解技术、Word2Vec和自然语言语义分析技术)。这就是项目的自然语言预处理模块。

期刊文章分类查询,尽在期刊图书馆

判决书经过处理之后将变成“特征向量”,包含了数据的特征信息,例如:

基层法院|中级法院,|高级法院|最高法院,是一项特征,那么如果是中级法院,特征向量就会在这里就会表示为:0,1,0,0,也就是说1代表“是”,0代表“否”,那么通过自然语言处理模块的分析,判决书将会被分解成这些由1和0代表的向量,每一项代表了这条数据在这个维度是否符合这个特征。

特征向量将会被输入到机器学习模块之中,目前我们采用的机器学习分类算法为“SVM支持向量机”算法,这是一个监督学习的分类算法,通过对大量特征向量的训练后将会得到一个模型文件,这个模型文件可以用于预测未知数据的结果。

离线训练和在线预测:训练是产生模型的过程,也是十分消耗计算量和时间的过程,本项目训练为离线进行,而预测则是在线进行的,它们的含义是:用户使用和训练模型是完全分开进行的,用户使用预测功能将直接通过已经训练好的模型文件来预测,这个称之为在线过程(即预测功能永远在线);而产生模型文件的训练过程为背后服务器集群离线进行,即“这个模型文件可能是历经了千难万险产生的,但是这个过程对前台是不可见的,前台只知道直接拿成果去预测即可,至于对成果是如何产生的并不关心”。这样做可以保证修改模型不影响在线运行,同时也能保证在线预测功能的效率。

2.法律大数据分析报告撰写

大数据分析报告服务群体除了案件当事人,同时也能为律所服务,能够帮助律师在细分

领域积累更多数据化的经验。通过民事辩护率、辩护意见的采信情况等维度进行深入大数据分析后,一方面能够帮助律师感性认知数据化,另一方面,数据的对比能够引发法律从业者更多的思考,这些数据高低背后的原因是什么?可以将这些思考直接融入律所发展战略和市场策略的制定及产品研发,力争做更接地气的决策。如何制作大数据报告?要完成一份有质量的法律大数据分析报告,必须注意以下指导步骤:

(1)固定数据库:优选可用Excel批量下载的数据库。目前市面上有很多的案例数据库,包括裁判文书网、律商、北大法宝、威科先行、聚法案例。各案例数据库各有优劣。

(2)案例检索:目前案例检索的方法主要有3种:全文检索、标题检索和案由检索。

在做大数据报告时,优先推荐使用案由检索,检索效率高,降低人工筛选成本。

(3)案例筛选:必须确保有100份以上的文书,检索完案例后,必须对案例进行筛选,剔除无效案例。这个阶段的工作质量好与否直接会影响后期统计的工作量,应确保无效案例得到最大程度地删除。

(4)解构文书:结果倒推法,以报告目标为起点确定解构要素。在开始这一步前,我们必须清晰制作大数据报告的目标,而目标主要分为两部分:受众目标和内容目标。目标直接影响要素的解构,必须在解构之前清晰报告目标,才可保证不遗漏、不浪费。

(5)区分一二审文书,按照法院分配。为什么要按法院分配?因为集中某一家法院的文书给某一个人研读,有助于对某个法院的审判习惯、风格和规律进行全面的了解,提高学习效率。

(6)汇总数据:精读特殊案例,注重一般性与特殊性对比研究。

汇总统计数据,项目中我们用Excel进行统计,主要依赖对Excel的掌握程度,这一步中最重要的是核对数据,避免因数据统计错误而造成的误导。

除此之外需要精读特殊文书,改判幅度比较大的案例,找出这些案件的特殊性,并与一般性进行对比统计,多角度研读数据。既能考证一般性,又能兼顾个性化和特殊性,最终确保报告的全面性和科学性。

三、研究结论

本文所述大数据分析训练模式的构建,涉及学科融合,专业交叉,学生可以从实践中获取更多的法律知识和信息,学习目标非常明确,同时改变了教师一味讲解的局面,让学生在跨专业融合的环境下,以大数据思维的方式学习法律知识,教学相长,因此这种训练模式对法学教学的效果也有很大的提升作用。

参考文献

[1]大数据时代的法学教育及其变革[J]. 冯果. 法学教育研究.2018(4)

作者简介:刘萍(1980-),成都人,副教授,电子科技大学成都学院,研究方向:经济法学。

论文作者:刘萍

论文发表刊物:《知识-力量》2018年10月下

论文发表时间:2018/10/15

标签:;  ;  ;  ;  ;  ;  ;  ;  

大数据分析训练模式在法学教学中的构建研究论文_刘萍
下载Doc文档

猜你喜欢