基于刑事案件要素的文本挖掘系统研究与实现

来源 :长安大学 | 被引量 : 2次 | 上传用户:baslove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新时代依法治国的理念已经成为中国特色社会主义的基本战略,而人工智能正冲击着法律服务的基本模式,司法智能化建设势在必行。目前国内外该领域的众多专家已经使用文本挖掘技术对法律案件分析进行了一定程度的局部探索,但尚未形成系统应用,大量工作仍以人工为主。为此,本文以文本挖掘技术为基础,在某市检察院项目的支持下,深入研究犯罪数据在司法领域中的应用,设计和开发了基于刑事案件要素的文本挖掘系统。主要研究内容包括:(1)通过分析法律案件的文本特点,设计出适用于刑事案件文本的分词算法,然后提出基于案件词性和互信息的综合文本特征提取方法。在此基础上实现了案件命名实体识别和要素信息的提取,经实验验证提取效果较好。(2)结合哑变量和属性约简理论,引入以案件属性为基础的权重,设计了基于加权案件文本的K-means算法,实现对案件的聚类分析,并以入室盗窃案为例进行分析。(3)对刑事犯罪行为进行关联分析。首先建立多维关联规则模型,进行离散化和概念分层,在此基础上设计多维频繁谓词集Apriori关联规则算法;然后在多维关联规则基础上进行冗余规则检查,设计了基于多层频繁谓词集的Apriori算法;最后将算法应用到实际案例中验证了模型效果,并对结果进行了分析。(4)对刑事案件文本挖掘系统原型进行了设计和开发,实现了数据录入存储、案件数据查询和犯罪趋势预测等功能。并对系统进行全面测试,测试结果表明系统能较好实现预期目标。
其他文献
机载脉冲多普勒雷达常采用中等脉冲重复频率,N/M检测准则工作方式,在该方式下对重复频率的要求主要是能解距离及速度模糊,且能使距离与速度遮蔽区域尽量小。因而对重复频率的选择
<正>适用年龄:4~6岁设计来源"蛋塔"的设计灵感源于幼儿自然发生的建构行为。在一次复活节"护蛋"活动中,有人不经意间把鸡蛋带到了建构室,圆溜溜、滚来滚去的鸡蛋一出现在建构
目的:观察脑安胶囊联合尼莫地平治疗偏头痛的临床疗效。方法:30例偏头痛患者随机分为2组,治疗组30例应用脑安胶囊配合尼莫地平治疗,对照组30例单纯应用尼莫地平治疗。2组一疗程均
随着教育事业的不断改革,在校园以及学习当中不仅注重对学生知识的传授,更加重视培养学生健康体魄。因此,高校篮球受到越来越多人的关注。文章阐述了将核心力量训练在高校篮
将生态种群密度的概念引入群体智能计算,提出一种基于生态群竞争模型的粒子群优化模型.该模型的动力学特征可较全面地描述个体与环境及相互之间的协同行为,在一定程度上脱离
介绍了淮南矿区煤矿生活污水的水质特点及处理现状,对比分析了现有氧化沟、生物接触氧化以及SBOT三种污水处理工艺的处理效果。结果表明,SBOT工艺的出水CODcr和NH4^+平均质量
航空发动机技术的发展,要求热障涂层用陶瓷材料应具有更低的热导率和更高的相稳定性能。由于稀土氧化物陶瓷材料在热障涂层上的广泛应用,综述了稀土氧化物涂层、镧铝氧化物及
目的探讨阿尔茨海默病患者生活质量的影响因素。方法选取2016年4月至2017年4月该院收治的阿尔茨海默病患者139例,采用问卷调查形式分析患者一般资料、社会支持情况、认知功能
对湖北省五所高校大学生学费问题问卷调查结果表明,当前大学生的整体缴费率不高,学校之间、地域之间、学科之间、男女生之间、个体之间、年级之间学生缴费差异很大.学生的来