论文部分内容阅读
随着我国机动车保有量快速上升,车险保费由2000年的400余亿元增长至2018年的预计7860亿元,19年间增加了18倍,占财产险保费收入的75%以上。受2018年汽车消费减速影响,2018年车险保费增幅首次低于10%,为2000年来车险增幅的最低点;同时2018年全国承保机动车辆商业保险保单保费为6149亿元,同比增长仅2.6%。2019年初国家发展改革委出台政策促进新能源汽车、农村商用车和二手车的消费,必将推动汽车销量增长,从而带动车险发展。车险作为财险公司的支柱险种,是保费收入的重要来源,但一直处于“高赔付、低收益”的状态。2018年,车险行业综合成本率为99.86%,综合费用率为43.16%,综合赔付率为56.7%。由于车险业务占比巨大,财险公司因车险欺诈而支出的高额费用使得车险综合赔付率居高不下。据统计,车险欺诈占保险欺诈案件的近八成。车险欺诈不但妨碍了车险市场的正常发展,还扰乱了社会公共秩序,必须对车险欺诈进行防范和打击。随着反欺诈力度的加大,欺诈表现形式日益多样化、隐蔽性越来越强,凭借传统的识别方法已经难以高效地防范车险欺诈。借力大数据技术实现车险欺诈识别与防范,是突破车险反欺诈瓶颈的重要渠道之一。我国财产保险公司和监管机构对防范车险欺诈都十分重视,已经建立并利用车险信息共享平台设立反欺诈系统,但由于缺乏整体性规划,行业标准与数据安全规范仍待完善,大数据与车险欺诈识别模型结合仍处于探索阶段。因此,本文基于大数据背景利用监督和无监督机器学习方法来研究机动车辆保险欺诈风险及其防范,具有一定创新性和较为重要的理论及现实意义。本文采用规范分析和实证分析相结合的方法,首先从机动车辆保险和保险欺诈相关理论方面入手,界定车险欺诈的概念,并与道德风险进行比较,根据机动车辆保险的特征分析了车险欺诈风险的特征;对大数据的含义、特征及关键技术进行简要介绍;其次按照欺诈实施主体分析车险欺诈风险的类型、表现、成因、危害及防范必要性,并简要概括防范车险欺诈风险的传统和新型措施,基于大数据特征对大数据与防范车险欺诈风险的融合点进行深入剖析;接着比较识别车险欺诈的传统常用模型和新兴模型的优势与不足,基于大数据背景选取机器学习中的监督学习kNN算法和无监督学习K-Means算法进行车险欺诈识别的实证研究并对实证结果进行比较;然后通过对应用大数据防范车险欺诈的美国经验与中国实践进行比较分析,得出符合我国国情的启示借鉴;最后总结归纳研究结论,针对大数据在我国车险反欺诈领域应用存在的问题提出一些对策建议,并作出研究展望。笔者根据上述思路,将本文分成六个部分:第一部分绪论阐述了论文的选题背景、研究目的及意义,对国内外关于欺诈风险和车险欺诈识别的研究成果进行梳理,发现学者们一般从信息不对称、保险合约、博弈论以及法学等角度进行研究,而我国对保险欺诈研究多集中于保险欺诈特征和欺诈防范相关理论层面,针对车险欺诈识别与防范的实证研究较少;而国外学者对保险欺诈的实证研究较丰富,尤其是车险和医疗保险欺诈识别,大多使用Logit、Probit、SVM、决策树、朴素贝叶斯等模型,近来开始使用神经网络、梯度提升决策树等更加复杂的方法。因此,本文基于大数据背景利用美国AIB模拟数据集采用监督和无监督机器学习方法研究车险反欺诈是具有探索意义的。第二部分对机动车辆保险的概念、特征、市场主体及其特殊性作概述;并对与保险欺诈相关的信息不对称理论、行为经济学、制度经济学和经济伦理学进行梳理,为本文奠定理论基础;通过与道德风险比较界定车险欺诈的概念,分析其特征;简要介绍大数据的含义、特征和关键技术,为后文将大数据引入车险欺诈风险防范做铺垫。第三部分从车险欺诈实施主体角度概括了机动车保险欺诈的主要表现和类型,并分析车险欺诈风险的成因、危害及防范必要性,并简要概括防范车险欺诈风险的传统和新型措施,基于大数据特征对大数据与防范车险欺诈风险的融合点进行深入剖析。由于车险数据本身的性质与大数据特征契合且使用大数据技术可以提升车险反欺诈精度和效率,所以结合大数据防范车险欺诈风险是可行的,但实际应用中从数据收集到处理整个流程都存在困难,并且数据安全与隐私保护问题不容忽视。第四部分比较识别了车险欺诈的传统常用模型和新兴模型的优势与不足,基于大数据背景选取机器学习中的监督学习kNN算法和无监督学习K-Means算法进行车险欺诈识别的实证研究并对实证结果进行比较,发现两种算法的欺诈识别正确率不相上下。但在基于大数据背景的车险反欺诈领域中,无监督机器学习能实现更准确和广泛的欺诈检测,更具发展潜力。而最优的反欺诈方法是将反欺诈领域专家规则和机器学习模型结合。第五部分为介绍了应用大数据防范车险欺诈风险的美国经验与中国实践,通过比较分析发现国内的反欺诈系统服务商在人工智能技术方面和美国等发达国家差距不算很大,但在数据来源及质量、数据平台搭建、数据信息共享和数据安全保护上仍有相当距离。此外,美国在专业反保险欺诈机构建设、反保险欺诈法律制订和反保险欺诈宣传方面的经验值得我国借鉴。第六部分是对本文研究结果进行总结,在此基础上提出对策建议和对未来研究的展望。本文的创新之处有两点。一是选题及研究视角具有创新性。笔者尝试基于大数据背景来探讨机动车辆保险欺诈风险及其防范,既分析比较了传统常用车险欺诈风险识别模型和新兴模型的优势与不足,又对大数据与防范车险欺诈风险的融合点进行深入探讨,并通过比较分析中美两国应用大数据反车险欺诈的案例得出符合我国国情的启示借鉴,对大数据在我国车险反欺诈领域的应用与发展具有一定的理论和现实意义。二是采用前沿的机器学习方法进行实证研究。笔者通过自学Python及机器学习的基础知识,尝试采用大数据框架下的机器学习方法来进行车险欺诈风险识别的实证研究,选择监督学习kNN分类算法和无监督学习K-Means聚类算法分别对美国AIB模拟数据集进行车险欺诈识别,并比较分析结果,得出大数据背景下利用无监督学习方法反车险欺诈更具优势的结论。