提升司法数据治理效能 助力智慧法院建设

2020-04-14 ken

     人工智能和互联网技术发展的新阶段产生了大数据技术平台和应用模式,未来智慧法院的建设离不开司法大数据的建设,必须以充实完善司法大数据系统为基础,提升数据治理的效能。

  日前,周强院长在最高人民法院网络安全和信息化领导小组2020年第一次全体会议上指出,“要更深入学习贯彻习近平总书记关于网络强国的重要思想,更好运用大数据、云计算、区块链、人工智能、5G等前沿技术加强审判执行工作”“提升司法大数据分析服务能力,拓展大数据管理和知识服务平台资源范围”。人工智能和互联网技术发展的新阶段产生了大数据技术平台和应用模式,大数据技术平台通过与生产生活的深度融合,呈现出数字化、网络化、智能化的发展态势。面对新形势,人民法院正积极应用大数据和人工智能技术深入拓展大数据应用系统,为智慧法院建设提供有力的数据和技术支持,以提高审判体系和审判能力现代化。

  在智慧法院建设中,数据治理具有必要性和紧迫性。数据治理是指将数据作为组织资产而展开的一系列具体化工作, 它以数据为核心,实现数据处理与数据规范的有机融合,达成对数据全生命周期的管理。数据治理包含了数据采集、数据加工、数据应用等多个阶段,涵盖诸多环节,同时还要充分考虑数据安全问题。随着大数据技术的日趋完善,其在司法领域的应用也越来越深入。司法大数据是指在大数据技术基础上,应用人工智能等新的处理技术和方法,对司法工作中出现的结构复杂、形态多样的数据进行识别、采集、分析和处理,形成系统、全面、科学、准确的并具有一定规律和价值的,能够作用于司法审判活动的全部集合。

  大数据在司法领域的应用带来了一场巨大的变革,推动大数据在司法领域的应用是我国司法改革的现实需求。只有实现大数据技术和理念与司法审判领域的深度融合,才能解决当前司法改革面临的诸多现实问题。然而,大数据的挖掘分析技术可能涉及经济运行、社会治理、国家安全等敏感信息,大数据存储、计算、分析和应用等关键技术的创新演进,导致数字信息技术的各种软件、硬件、规则体系等方面引入未知的漏洞,数据和信息安全的隐患明显膨胀,数据治理成为当前司法大数据运用中亟待解决的现实问题。

  随着智慧法院的加速推进,各级人民法院积极全面推广网上立案,依托中国移动微法院、诉讼服务网、12368诉讼服务热线,使“指尖”立案、“云端”办案、“智慧”执行成为工作新常态。最高人民法院构建了跨层级、跨地域、跨系统、跨部门、跨业务的大数据管理与服务平台,支持全国法院审判数据实时汇聚,动态更新,构建形成全球最大的司法审判信息资源库;实现统计报表网络化、自动化生成,规范数据质量,司法统计工作实现革命性跨越;引入HDFS等hadoop组件,实现海量存储和复杂计算,采用实体识别、检索引擎、OCR等前沿技术,在裁判文书、卷宗中提取争议焦点、作案手段等信息,挖掘非结构化案情信息,有效扩展数据分析维度,极大提升数据资源的可用性。

  但是,由于司法数据专业性强,数据的多源异构性显著,导致数据深度运用存在阻碍;数据涉及面广、敏感度高,数据隐私和安全的保障亟待加强。司法数据包含各种结构化和半结构化数据,由于审判主体的差异,在撰写文档过程中可能使用不同的表述,而造成相似案件的裁判文书在表达方式上存在明显的区别,大量的案件信息隐藏在非结构化的办案文件中。同时,数据关联性的确立必须结合具体分析对象的专业知识来识别,如人工智能要对类案裁判规则进一步提炼识别,需要借助语义的模糊分析和机器学习确立更加细致、灵活的关键词识别标准。又因为关联性指标本身具有推测性成分,因此关联性往往又会与准确性出现对立。例如,在以案由为识别标准的情形下,有些案件的文书所填写的案由本身并不十分准确,有些案件的争议焦点可能包含多个法律关系,而案由的规范写法一般使用一个案由,复杂案件至多不得超过两个并列式表述的案由。

  此外,由于2017年1月出现的全球范围针对大数据基础软件的大规模勒索攻击,有效治理数据安全问题的紧迫性日益彰显。智慧法院建设中的数据治理亟待围绕数据治理的领域、数据治理的框架、数据治理的法律规范等问题开展深入研究,从多个方面勾勒司法大数据治理的全貌。为提升数据治理效能,智慧法院建设中应不断优化司法数据质量,着力减少因数据统计和收集方式落后而导致效率低、不准确、应用范围小等问题。在不断提升数据采集智能化的同时,未来的智慧审判体系应具备智能信息纠错、即时性信息分类整合、噪点信息清洗等后续加工处理能力,在司法大数据平台中实现一体化整合处理。

  一是要实现司法数据统计的精细化运作。司法统计工作主要是通过对海量信息的处理、分析,针对司法管理工作和社会管理中的问题,提示法院领导和办案法官采取有针对性的措施,有效提高审判工作的效率,更好地服务国家和社会治理。例如,在调撤率的指标上,通过调整司法指标,区别对待调解不能的案件和调解未成功的案件,更好地反映调撤情况。这两种情况主要是分母有所区别,调解不能案件其分母需剔除一方当事人下落不明的情况。

  二是要提升审判数据的应用效能。司法数据统计之后,重在应用。通过审判信息储存、提取、应用一体化,有效避免司法审判中出现“数据孤岛”现象,更深层次地发挥数据应用的潜能。例如,以一个省或一个市为基础,建立司法数据管理中心,打造集中储存、提取、管理全地区案件受理、审判、结案以及队伍管理等多方为一体的数据应用平台。该应用平台中,案件质量评估、工作业绩考核等可以在网上统一进行。

  三是要支持统计数据开放对接,确保系统功能拓展。我国目前司法统计的模式仍具有一定的封闭性,主要表现在信息反馈滞后、数据信息片面,这导致无法根据审判工作的形势发展需要及时实现审判信息的全方位覆盖。要实现法院信息化系统建设的开放性,就应该注重多方联动。例如司法统计系统与法院审判委员会会议系统、执行联动机制信息系统、执行管理系统等实现对接,多方联动使得司法统计工作实现从“单一数据库运行”到“审判信息全面聚合”的飞跃,司法统计职能作用效益实现倍增。

  四是要转型思维建立相关关系。以往应用中,是将司法大数据作为审判决策依据,通过计算获取相应结果,以计算结果为重点应用对象,忽略了这些数据的规律,导致数据价值未能全部发挥出来。应将结果思维转换为预测思维,通过司法数据分析建立相关关系,掌握各个数据量之间的关系,进而在司法办案中挖掘事件之间的关联,为决策提供参考依据。

  司法大数据是智慧法院建设中人工智能技术应用的基础,法院工作中对司法数据的收集、整理、分类、管理以及应用能力直接决定着各类人工智能在法院工作中的应用是否能够正常运行和升级。这就决定了未来智慧法院的建设离不开司法大数据的建设,必须以充实完善司法大数据系统为基础,提升数据治理的效能,结合人工智能技术的应用,以符合司法运行规律的司法大数据生产和研发技术平台为智慧法院的建设夯实基础。