保险条款文本结构化系统设计与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户：jxx168jxx168

【摘要】

：

【作者】

：

曾子豪

【出处】

：

湖南大学

【发表日期】

：

2020年07期

【关键词】

：

保险条款保障责任文本结构化命名实体识别条件随机场

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,自然语言处理技术的不断发展使得文本结构化系统在不同知识领域得到了广泛应用。诸如医疗、新闻等领域的文本结构化研究已经取得了较大突破,而在保险领域尚未出现较成熟的文本结构化系统。由于专业知识的不同以及文本内容描述形式的不同,目前还不具备一个通用的文本结构化系统满足各个领域信息抽取的需求。保险文本独特的语言风格,使得面向保险领域的文本结构化系统研究仍存在着新的挑战。保险条款是保险购买人以及保险公司双方确立的有关权利与义务的条文,其核心内容保障责任描述了保险公司承担的责任范围,以及被保险人发生保险事故时保险公司应负的赔偿责任。将该非结构化的文本进行结构化处理有助于实现用户对保障责任内容的快速阅读以及有效理解。本文提出了面向保险领域的保险条款文本结构化方法,并以此作为支撑构建了保险条款文本结构化原型系统,模拟提出的算法在实际的保障责任条件查询过程中系统的应用场景。本文主要内容包括以下几个部分:(1)通过网络爬虫采集各个保险公司的保险条款原始PDF文件,并针对不同文本格式的PDF文件设计不同的文件解析策略以获取保险条款中保障责任文本内容;(2)本文提出了应用于非结构化的保障责任文本数据的结构化方案,即通过保障责任长文本语义分割、保障责任短文本分类、保障责任实体信息抽取以及短文本结构化结果融合的多阶段文本处理方法,最终实现人寿险、意外险、重大疾病险、理财险和医疗险五大类中包含的共98524条保障责任文本的结构化;(3)基于所提的方法,设计并实现保险条款文本结构化系统。测试结果表明,本文所提出的多阶段文本处理方法有效的实现了保险条款中文本的结构化,达到了系统预期设计的要求。

其他文献

个体化视角下日本福利模式变迁研究

福利制度与国民的日常生活息息相关,是人生中不可忽略的重要一环,对于国民来说,福利制度可以作为其最后的生活依靠。因此,对于国家来说,福利制度也起着收缩贫富差距的重要功能,是社会公平不可缺少的最后底线。自20世纪90年代以来,对于福利制度的研究又开始一波热潮,起点是丹麦学者艾斯平·安德森发布的《福利资本主义的三个世界》,安德森从去商品化的角度进行了划分,但是很多国家并不完全符合安德森的体系,并且出现了

学位

福利模式个体化去家庭化

淡紫拟青霉TD16色素的富集、纯化、表征及染色性能研究

本文以淡紫拟青霉TD16液态发酵所产红色素为研究对象,研究了表面活性剂对生物量和色素产量的影响,色素的分离纯化方法及结构的初步鉴定、色素的染色性能及抑菌性能。主要研究

学位

淡紫拟青霉 TD16色素表面活性剂结构染色性抑菌性

荷载-环境耦合作用下硅烷复合乳液对混凝土的防护效果及机理研究

处于海洋环境中的混凝土结构其耐久性问题十分重要,特别是因荷载、氯离子、硫酸根离子等物理、化学作用造成的混凝土内部钢筋锈蚀与表层损伤,在整个海工混凝土结构耐久性中尤

学位

荷载硅烷复合乳液氯离子硫酸根离子裂缝宽度

床栽鸡腿菇的技术及病虫害防治

鸡腿菇又名鸡腿蘑，学名叫毛头鬼伞，是新兴的食用菌品种，在山东省栽培时间为春三月、秋八至九月为宜．栽培方式多种多样，现介绍床栽技术。

期刊

床栽技术鸡腿菇病虫害防治毛头鬼伞栽培时间栽培方式鸡腿蘑食用菌

玉米空秆形成的原因及其防止方法

玉米果穗是由茎秆中上部叶腋的腋芽分化而成。玉米的果穗数与品种的特性及栽培条件有关。栽培条件好,茎秆上有1～2个或更多的腋芽发育成果穗,若栽培条件不好,影响果穗分化和籽

期刊

防止方法玉米原因秆形栽培条件腋芽分化籽粒发育上部叶

温室黄瓜八种劣态苗的管理方法

黄瓜幼苗对水、肥、气、温、光反应敏感，极易产生病苗、弱苗、伤苗和劣苗。怎样视苗情，找原因，综合天气土壤等诸多因素进行管理，以获得适龄壮苗，是日光温室生产的重要问题。以下是

期刊

温室黄瓜管理日光温室生产黄瓜幼苗光反应补救法病苗弱苗

保险条款文本结构化系统设计与实现

其他学术论文