基于大数据的统一证据标准
时下有一种流行说法,认为冤假错案产生的主要原因之一是公检法的证据标准不统一。如果推行统一的、数据化的证明标准,就可以避免冤错案件的发生。这种观点并非无可挑剔,但基于大数据技术改造证明标准缺失是一个方向。现行法律对证明标准的规定是诉讼法中的“案件事实清楚,证据确实充分”,即认定罪与非罪的标准,是给全案证据下结论的标准。这一标准如何进行大数据改造呢?
我国司法大数据的先行地区如贵州、上海进行了宝贵的探索。贵州的做法是,针对故意伤害罪等罪名,按照犯罪构成的四要件、三阶层,转化为十个证明要件,再进一步看每一个证明要件中通常需要哪些证据(下图中标绿的部分)来证明。这一做法的关键是构建犯罪构成知识图谱(图8),将案件信息数据化,从而形成一个统一的标准。
上海政法系统研制了“刑事案件智能辅助办案”系统,其核心内容同样也是证据的认定。在其证据指引标准中,对于立案、侦查、初查、审查起诉等每个阶段需要哪些证据,就嵌入进系统,将证据规则的软要求,变为平台的硬约束,达不到要求就无法进入到下一步。通过这种方法,可以解决取证不规范的问题。
这两个系统的效果如何,值得特别关注。从目前的情况来看,他们研发的是统一的数据化的证据标准(即应该有什么样证据、证据是否有效的标准),还不是统一的数据化的证明标准;他们取得的成绩主要是在证据的数据及合法性规范方面,也遇到了如何教会机器审查判断证据的关联性、真实性的挑战;他们在证据合法性自动审查方面取得的进步是形式审查方面,在实质审查方面还有一些障碍。
我们的研究表明,基于大数据的证据审查应当以全案证据的审查评断为主,重点突破反向审查而非正向审查,即什么情况下案件中的证据还不足以支持做出肯定性裁判。这就需要转变一下思路,。比如通过对最高法院不予核准死刑或者高级法院未判死刑立即执行的案件,进行机器学习,确定出一个不会被判处死刑的公式。通过这样机器学习得来的辅助办案系统,可以在很大程度上给办案人员做出提示、进行预警。
基于大数据的辅助定罪量刑
基于大数据辅助定罪量刑是借助文本相似度分析等技术,挖掘隐藏在历史司法文书中的法官、检察官定罪量刑集体经验,计算出各定罪量刑情节对刑罚的影响程度,赋予各情节不同的影响系数,从而使定罪量刑方法更具个性化、合理化。我们当前做过对重点罪名裁判文书的辅助定罪量刑研究,得出的初步经验如下。
——关于盗窃罪与诈骗罪的大数据定罪。我们做了一个实验,选择“盗窃罪”和“诈骗罪”这两个罪名,各找两万个案件来进行机器学习,截取从关键字“经审理查明”到关键字“本院认为”之间的文本交给机器,通过分词的技术进行学习。机器在学习了这些样本案件之后,对测试案件(1000个)做出的判断结果和人工的结果基本是一样的,准确率分别达到98.4%和97.6%。这是通过实验数据测试后对训练效果进行验收,只要与法官做出的结论相比达到90%以上相同,就可以用于辅助定罪了。还有另一种验收方法是将这一系统放在某一检察院内办案三个月,再与实际的办案结果做对比,也能发现其效果如何。
——关于破坏公用电信设施罪的大数据量刑。我们做了一个实验,通过对1767份破坏公用电信设施罪判决书进行初步处理,抽取出其中触犯相关刑法并判刑的判决书372份,并提取以下3个特征:造成财产损失数额(x1)、造成通信中断用户数(x2)、造成网间通信中断时间(x3),上述特征均体现出了社会危害性,接着计算这些特征与判处刑期(y)之间的关系。在机器学习了这部分判决书后,输入各变量值x1:85000(元);x2:1365(人);x3:48(小时)。结果输出判决期限39.83(月)。从而,我们可以利用这一方法提供辅助的量刑建议。在这一基础上,还可以实现量刑偏离度分析。
此外,大数据司法还可以通过搭建所需文书的基本框架模板,从数字化的案件卷宗数据中抽取构成文书的基本要素,填入到模板中。从而能够形成自动生成的法律文书;通过对社交网站上、论坛或12309网站上提出的法律咨询问题进行归纳后,开发出自动法律咨询回答系统等等。
如何面对未来?
总的来看,目前国内在大数据司法方面处于初步尝试的阶段,科研也处于初步探索阶段。我们应当清醒地认识到,还有许多问题需要在未来加以解决。
在大数据时代,我们必须预见未来,才能够预见未来的变化。关于当前检察机关如何开展大数据司法工作,笔者有以下四个建议:
一是在大数据司法时代,我们应该在坚持“四统一”的原则下,积极鼓励地方创新。过去的大统一软件建设是采取“由上到下”的一统模式,四级检察院建成“一张网”,这体现了全国检察机关战略决策的智慧。而今天的大数据司法,主要不是建设问题而是应用问题。这就需要一线办案的三级地方检察院发挥创新精神,积极拥抱大数据,探索出成熟可用的产品,然后由最高检统一决策全国推广。
二是适当开放“大统一”系统的数据。当前各地检察系统在大数据应用方面,主要是依靠法院的数据而较少使用自己的大数据。今后应当有序开放检察机关的大统一系统积累的办案数据。