基于自然语义处理的裁判文书推荐系统设计与实现

被引量 : 0次 | 上传用户:willing_6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息的公开化,社会对一些法律案件的审判结果越来越重视。社会关于每一个案件审判结果的舆论也越来越多,让法官及时的看见类似案件的舆论,也是对审判过程的一个重要参考。在法官建立一个新的裁判文书的时候,如果可以给其及时推荐相似的裁判文书,无疑可以给其一个非常好的参考。所以,需要一个裁判文书推荐系统,为法官推荐相似的裁判文书。在中国裁判文书网上,聚集了大量的裁判文书,在其中,法官也可以按关键词进行全文检索,但其无法进行语义上的检索。比如检索“毒豆芽”,却无法为其检索出“无根豆芽”这样的相似案例。所以,需要一个从语义上来判断相似度的系统。要全面的了解一个裁判文书的核心内容,就是要从裁判文书中提取出“案件事实和证据”、“双方当事人的争议焦点”、“适用法律”等内容,而“案件事实和证据”可能因为一些描述词的不准确,从而无法只是进行简单的词匹配来比较两个案件是否相似,需要从语义的层次来进行比较。利用自然语言处理技术,经过中文分词、词性标注、依存关系分析等技术可以从语义的层次来解决一个句子的具体结构,比如“种植毒豆芽”和“种植无根豆芽”都是一个关于“种植”的VOB结构,通过结构和锚点词的分析,提取出裁判文书的关键词“毒豆芽”和“无根豆芽”,然后建立向量模型,通过向量的余弦相似性来计算两篇裁判文书的相似性。相比一个通用的自然语言处理系统,本系统专注于裁判文书领域的中文语句处理。利用领域内的一些特性,经人工干预构造一个裁判文书领域内的语料库,用来给机器学习模型学习,之后将学习出来的模型应用于本系统。在中文分词、词性标注、依存关系分析的准确率上面,均超过了使用通用语料库训练出来的模型,应用在本系统提取语义层次的关键词也是更加准确。利用语义层次的关键字来进行相似度计算也取得了非常不错的效果。
其他文献
近年来,我国人口老龄化进程速度加快,已对经济及社会发展形造成日趋严重的影响。做好老龄工作、发展老年事业,让老年人享有健康幸福的晚年生活,不仅是弘扬传统美德的重要体现
对公立高校的行政行为进行适度司法审查,既是必要的,也是可行的。司法审查应当充分秉承法治精神和大学自治理念,以适度为原则,在准确界定高校行政权范围的前提下,主要审查其
<正>正确处理好人才引进与内部人才培育挖潜的关系 在当前我国人才流动竞争激烈的热潮中,高校面临着人才稳定和短缺的严峻挑战,对此各高校在千方百计采取各种措施大量引进人
<正>一、引言自进入21世纪以来,多种新兴的信息技术快速融入人类社会的工作、学习、生活等各个领域,尤其是教育领域,从而对各级各类教育的深化改革产生了重大而深刻的影响。
文章结合电力企业具体实际和工作经历,从加强管理的角度入手,对工作沟通的内涵与外延和重要性、工作沟通的方式方法与技巧进行了阐述和探讨,并对如何利用工作沟通的方式方法
空间观测科学卫星一般会有多种观测模式,不同观测模式对卫星提出不同的构型布局需求。硬X射线调制望远镜(HXMT)卫星在轨能够实现巡天、小天区、定点、伽马暴等4种主要观测模
在近20年的教育技术事业发展过程中,中国教育技术经过对西方教育技术的分析、借鉴、批判、吸收,逐步形成了结合中国国情并且自主创新的中国特色教育技术理论。在这个过程中,
目的通过检测幽门螺杆菌相关性胃炎患者血清降钙素原及白介素-6的水平,以探讨不同类型临床菌株幽门螺杆菌的致病作用及可能的致病机理。方法用免疫应迹法检测245例幽门螺杆菌
旅游商品开发是促进旅游业发展的重要途径。Y县通过社会交换、社会合作、社会强制等互动形式激励民众在开发旅游商品方面自主创业。为推动旅游商品开发良性发展,应通过制定相