NLP自然语言处理技术在人工智能法官中的应用

人工智能法官机器人

图片:SHEN ZHENGYI – IMAGINECHINA

近来,关于人工智能法官断案准确率高达79%的新闻成为人工智能领域最热门的话题。

据Gardian等国外媒体报道,伦敦大学学院(UCL),谢菲尔德大学和宾夕法尼亚大学的科学家刚刚发表的最新研究表明,人工智能已经可以分析法律证据与道德问题,进而预测审讯结果。这项研究的成果可以帮助人们提高法庭审判的准确性。

开发人工智能法官技术的科学家们表示,在测试阶段,人工智能法官程序通过法院的电子数据库HUDOC检索处理了584个通过第一阶段进入立案程序的案件资料(欧洲人权法院的数据集:https://figshare.com/s/6f7d9e7c375ff0822564。)。案件类型涉及有关「人权公约」中的第 三条(涉及酷刑或侮辱虐待的案件,250 个),第六条(保护公平审判权,80 起),以及第 八条(隐私和家庭生活,254 起)。

image

从上图可以看出,人工智能法官在审理「人权公约」第六条(保护公平审判权)类案件中的准确率最高,超过了84%,第三条的准确率最低(75%),平均准确率高达79%。(编者按:这里的准确率仅以人类法官的判决为标准,而人类法官是有误判率的)

对预测第六条案件判决结果最有相关性的话题关键词如下(每组20个):

image

虽然人工智能法官的NLP自然语言处理框架在有限的训练数据和短时间内就取得了令人震惊的判案准确性,研究人员表示,计算机法官不大可能很快取代人类法官,但是可以用来帮助他们来自英国伦敦大学的首席研究员Nikolaos Aletras博士说:“我们并不认为人工智能将很快取代法官或律师,但我们认为这些人将会发现人工智能非常有用,可以帮助在案件中快速识别模式。它还能用来突出最有可能违反欧洲人权公约的案件。”

虽然“取代人类法官”会引发经典的人工智能伦理话题,但是人工智能法官的断案准确性真的没有可能超过人类法官吗?科学家们发表在计算机科学杂志上的论文“预测欧洲人权法院的司法裁决:自然语言处理的观点”中提及的几个事实也许对我们的判断有所帮助:

  • 人工智能法官实验程序仅仅使用了欧洲人权法院ECtHR的公开数据库中的文本数据,如果未来将训练数据的数据源范围扩大,将来自个人、国家机构、律师事务所的多个数据源的信息综合处理,将进一步提高断案准确率(编者按,甚至帮助人类法官提高断案准确率)
  • 法律数据的封闭性是数据科学家们开发人工智能法官技术的最大障碍,本次实验选择欧洲人权法院的数据库(HUDOC)是因为:这是唯一可公开免费访问的大型法务数据库,但这仅仅是判例法数据库,如果能够访问其他类型数据和数据库,对法律科学和人工智能领域的研究者来说将至关重要。

 

论文标题:预测欧洲人权法院的司法裁决:自然语言处理的观点

作者:Aletras, N, Tsarapatsanis, D, Preo?iuc-Pietro, D, Lampos, V

摘要:自然语言处理和机器学习近期的发展为我们提供了工具,可以建立预测模型用以揭开法庭审判的原理。这项研究可以让律师和法官受益,他们可以利用我们的模型作为工具快速审案,或从已知信息中获取要点帮助判断。本文中,我们第一次系统性地研究了仅通过分析文本内容来预测欧洲人权法院的司法判决。我们制定了一个二元分类任务,在分类器中输入从案例中提取的文本内容,目标输出是关于是否存在违反人权公约的条款的实际判断。文本信息使用连续字序列(contiguous word sequences),即 N-gram 和话题来表示。我们的模型可以准确预测(平均 79% 正确率)法院的判决。我们的实证分析表明,案件的形式事实是最重要的判决因素。这与法律现实主义的理论一致,这表明司法决策受到事实情况的显著影响。我们同时发现,事件的话题内容是这种分类任务的另一个重要特征,我们通过定性分析进一步探讨了这种关系。(本段摘要的翻译来自“机器之心”)

获取论文原文请关注IT经理网微信号:ctociocom, 后台回复:人工智能法官+邮箱地址。

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者