大数据背景下机动车辆保险欺诈风险及其防范研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户：hardstar

【摘要】

：

【作者】

：

陈思迎

【出处】

：

西南财经大学

【发表日期】

：

2020年07期

【关键词】

：

大数据车险欺诈风险风险防范机器学习 kNN算法 K-Means算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着我国机动车保有量快速上升,车险保费由2000年的400余亿元增长至2018年的预计7860亿元,19年间增加了18倍,占财产险保费收入的75%以上。受2018年汽车消费减速影响,2018年车险保费增幅首次低于10%,为2000年来车险增幅的最低点;同时2018年全国承保机动车辆商业保险保单保费为6149亿元,同比增长仅2.6%。2019年初国家发展改革委出台政策促进新能源汽车、农村商用车和二手车的消费,必将推动汽车销量增长,从而带动车险发展。车险作为财险公司的支柱险种,是保费收入的重要来源,但一直处于“高赔付、低收益”的状态。2018年,车险行业综合成本率为99.86%,综合费用率为43.16%,综合赔付率为56.7%。由于车险业务占比巨大,财险公司因车险欺诈而支出的高额费用使得车险综合赔付率居高不下。据统计,车险欺诈占保险欺诈案件的近八成。车险欺诈不但妨碍了车险市场的正常发展,还扰乱了社会公共秩序,必须对车险欺诈进行防范和打击。随着反欺诈力度的加大,欺诈表现形式日益多样化、隐蔽性越来越强,凭借传统的识别方法已经难以高效地防范车险欺诈。借力大数据技术实现车险欺诈识别与防范,是突破车险反欺诈瓶颈的重要渠道之一。我国财产保险公司和监管机构对防范车险欺诈都十分重视,已经建立并利用车险信息共享平台设立反欺诈系统,但由于缺乏整体性规划,行业标准与数据安全规范仍待完善,大数据与车险欺诈识别模型结合仍处于探索阶段。因此,本文基于大数据背景利用监督和无监督机器学习方法来研究机动车辆保险欺诈风险及其防范,具有一定创新性和较为重要的理论及现实意义。本文采用规范分析和实证分析相结合的方法,首先从机动车辆保险和保险欺诈相关理论方面入手,界定车险欺诈的概念,并与道德风险进行比较,根据机动车辆保险的特征分析了车险欺诈风险的特征;对大数据的含义、特征及关键技术进行简要介绍;其次按照欺诈实施主体分析车险欺诈风险的类型、表现、成因、危害及防范必要性,并简要概括防范车险欺诈风险的传统和新型措施,基于大数据特征对大数据与防范车险欺诈风险的融合点进行深入剖析;接着比较识别车险欺诈的传统常用模型和新兴模型的优势与不足,基于大数据背景选取机器学习中的监督学习kNN算法和无监督学习K-Means算法进行车险欺诈识别的实证研究并对实证结果进行比较;然后通过对应用大数据防范车险欺诈的美国经验与中国实践进行比较分析,得出符合我国国情的启示借鉴;最后总结归纳研究结论,针对大数据在我国车险反欺诈领域应用存在的问题提出一些对策建议,并作出研究展望。笔者根据上述思路,将本文分成六个部分:第一部分绪论阐述了论文的选题背景、研究目的及意义,对国内外关于欺诈风险和车险欺诈识别的研究成果进行梳理,发现学者们一般从信息不对称、保险合约、博弈论以及法学等角度进行研究,而我国对保险欺诈研究多集中于保险欺诈特征和欺诈防范相关理论层面,针对车险欺诈识别与防范的实证研究较少;而国外学者对保险欺诈的实证研究较丰富,尤其是车险和医疗保险欺诈识别,大多使用Logit、Probit、SVM、决策树、朴素贝叶斯等模型,近来开始使用神经网络、梯度提升决策树等更加复杂的方法。因此,本文基于大数据背景利用美国AIB模拟数据集采用监督和无监督机器学习方法研究车险反欺诈是具有探索意义的。第二部分对机动车辆保险的概念、特征、市场主体及其特殊性作概述;并对与保险欺诈相关的信息不对称理论、行为经济学、制度经济学和经济伦理学进行梳理,为本文奠定理论基础;通过与道德风险比较界定车险欺诈的概念,分析其特征;简要介绍大数据的含义、特征和关键技术,为后文将大数据引入车险欺诈风险防范做铺垫。第三部分从车险欺诈实施主体角度概括了机动车保险欺诈的主要表现和类型,并分析车险欺诈风险的成因、危害及防范必要性,并简要概括防范车险欺诈风险的传统和新型措施,基于大数据特征对大数据与防范车险欺诈风险的融合点进行深入剖析。由于车险数据本身的性质与大数据特征契合且使用大数据技术可以提升车险反欺诈精度和效率,所以结合大数据防范车险欺诈风险是可行的,但实际应用中从数据收集到处理整个流程都存在困难,并且数据安全与隐私保护问题不容忽视。第四部分比较识别了车险欺诈的传统常用模型和新兴模型的优势与不足,基于大数据背景选取机器学习中的监督学习kNN算法和无监督学习K-Means算法进行车险欺诈识别的实证研究并对实证结果进行比较,发现两种算法的欺诈识别正确率不相上下。但在基于大数据背景的车险反欺诈领域中,无监督机器学习能实现更准确和广泛的欺诈检测,更具发展潜力。而最优的反欺诈方法是将反欺诈领域专家规则和机器学习模型结合。第五部分为介绍了应用大数据防范车险欺诈风险的美国经验与中国实践,通过比较分析发现国内的反欺诈系统服务商在人工智能技术方面和美国等发达国家差距不算很大,但在数据来源及质量、数据平台搭建、数据信息共享和数据安全保护上仍有相当距离。此外,美国在专业反保险欺诈机构建设、反保险欺诈法律制订和反保险欺诈宣传方面的经验值得我国借鉴。第六部分是对本文研究结果进行总结,在此基础上提出对策建议和对未来研究的展望。本文的创新之处有两点。一是选题及研究视角具有创新性。笔者尝试基于大数据背景来探讨机动车辆保险欺诈风险及其防范,既分析比较了传统常用车险欺诈风险识别模型和新兴模型的优势与不足,又对大数据与防范车险欺诈风险的融合点进行深入探讨,并通过比较分析中美两国应用大数据反车险欺诈的案例得出符合我国国情的启示借鉴,对大数据在我国车险反欺诈领域的应用与发展具有一定的理论和现实意义。二是采用前沿的机器学习方法进行实证研究。笔者通过自学Python及机器学习的基础知识,尝试采用大数据框架下的机器学习方法来进行车险欺诈风险识别的实证研究,选择监督学习kNN分类算法和无监督学习K-Means聚类算法分别对美国AIB模拟数据集进行车险欺诈识别,并比较分析结果,得出大数据背景下利用无监督学习方法反车险欺诈更具优势的结论。

其他文献

丹参内生镰刀菌HBG16多糖的发酵提取及其生物活性初步研究

目的从丹参植株的根部分离出具有抗氧化、抗凝血活性的镰刀菌菌株HBG16,为了提高镰刀菌HBG16胞内、胞外多糖的产量,分别优化其发酵、提取工艺,把镰刀菌HBG16代谢产物多糖分离

学位

丹参内生真菌多糖抗氧化抗凝血

2009年深圳市居民健康素养状况调查

目的了解深圳市居民健康素养状况,为制定卫生政策和干预策略提供依据。方法采用多阶段随机抽样的方法,在全市抽取6258名18周岁以上居民,进行健康素养的问卷调查。结果居民具

期刊

居民健康素养调查

射频能量收集系统中双频整流天线的设计与分析

近年来,射频(RF)能量收集技术作为一种人工成本低、对环境友好、可持续的供电方式,已经成为解决能量问题的新途径。该技术在诸如物联网(IoT)、无线传感器网络(WSN)等领域有着

学位

射频能量收集整流天线双频天线转换效率物联网

导学案对高中英语阅读课有效性的研究

《高中英语新课程标准》明确指出,语言技能是语言运用能力的重要组成部分。英语阅读是学生获取信息,提高英语运用能力的重要途径。然而传统的英语阅读教学以教师授课、学生听

学位

导学案克拉申“输入假说”高中英语阅读教学

高中学生和教师对英语课堂上母语使用所持态度的研究

尽管国内外已经有很多学者对外语课堂上的母语使用问题做过调查,但有关学生和教师对母语使用的态度问题,国外的一些研究大多集中在理论方面,缺乏课堂观察(Asmari,2014;Debreli,2016),研究对象一般是普通高校,很少涉及高中(Shuchi&Islam,2016),而国内很少把这两者结合起来进行对比研究。作为课堂上使用目标语的两大主体,对学生和教师使用母语的态度有何差异以及造成这种

学位

目标语学生和教师母语使用态度英语课堂

自媒体时代的消防突发新闻舆情引导及应对

传统的新闻报道方式有一定的局限性,通常以报纸、杂志、电视等传统媒介进行报道,从而实现向大众传播新闻信息的目的。传统媒体虽然公信度高,但在传播形式和传播渠道上还有些

期刊

自媒体时代消防突发新闻舆情引导应对

应用型人才培养背景下环境工程专业综合性基础实验的改革和优化

在应用型人才培养目标背景下,嘉兴学院环境工程专业将环境监测和环境化学实验整合为环境工程基础实验,并进行了优化。整合后的综合性基础实验,避免了单独开设实验的弊端,开设项目更加合理,呈递进互补的关系,同时将地表水的采集和分析评价有机地融入到实验过程中。实践证明,环境工程专业基础实验的改革和探索,提高了学生做实验的积极性和参与度,得到了广泛认可。

期刊

环境工程环境监测实验环境化学实验专业基础实验environmental engineeringenvironmental monitoring expe

集装箱配备总量的确定——班轮公司国际集装箱管理研究之二

集装箱班轮公司除了必须拥有准确的班期、快速的船舶、合理的挂靠港序、优质的服务,还应准备足够数量的符合国际标准的各类海运集装箱.在集装箱班轮公司的国际集装箱管理中一

期刊

集装箱配备总量确定班轮公司国际集装箱管理

基于测距的多AUV编队控制方法研究

针对基于测距的多AUV编队控制问题,提出两种根据测距信息完成编队的控制策略。一种策略将编队视为有阻尼的弹簧质量块模型,模拟其振动过程得到控制规则。该方法的参数均有特

期刊

多AUV系统编队控制领航者-跟随者结构粘滞阻尼振荡模型Multi-AUVsformation controlleader-follower constr

基于改进离散萤火虫算法的二维排样问题优化研究

板材下料优化属于典型的组合优化问题,广泛应用于各类制造业,增加板材利用率,加强余料板材的再次利用,能够降低企业的生产成本,带来显著的经济效益。因而,对板材的优化下料与

学位

二维排样问题萤火虫算法离散化改进空间距离余料利用程序设计

大数据背景下机动车辆保险欺诈风险及其防范研究

与本文相关的学术论文