增量式异常就医聚集行为的频繁模式发现及Spark上的实现

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:ososxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济社会的不断发展,人们的生活质量不断提高,我国的社会保障制度不断完善,在人们遇到医疗困难时,医疗保险基金发挥的作用越来越大,为我国的社会稳定,人民的健康生活提供有力的保障。然而许多不法份子开始关注人民这部分救命钱,利用医疗保险制度中的漏洞或缺陷,套取医保基金,损害国家资源,造成极大的医疗不公平,不利于社会的稳定。骗保人员骗取医疗保险基金的形式多样,例如分解住院、重复医疗、私留医保卡等,目前常见的反欺诈手段主要依靠监察人员的经验以及人工蹲点守候等方式进行判别,这些手段在面对大数据量的情况时,显然并不合适,因此利用技术手段进行骗保行为的甄别势在必行。本文将骗取医保基金行为中的病人异常就医聚集行为作为研究重点,利用数据数挖掘算法对病人的聚集行为进行挖掘,并对挖掘结果进行病人和医院维度的深层次分析,在此基础上构建欺诈行为的监测系统,主要内容如下:1.医保数据处理。梳理目前病人的就诊数据中存在的问题,进行数据处理工作,主要包括缺失值处理、重复值处理等。对病人和医院进行画像,为后续深层次分析提供数据准备,同时为系统及模型的构建奠定基础。2.提出基于支持数的增量式频繁模式挖掘算法EFUFP。针对数据批量更新以及病人聚集就医行为的欺诈场景,提出EFUFP算法,并引入Spark编程模型,在Spark平台实现EFUFP算法,实现大规模数据下频繁模式的快速高效挖掘。在结果相同,空间复杂度近似的情况下,时间效率EFUFP本地测试较FUFP提高10.7%以上,在Spark平台较FP-GROWTH算法提高26.8%以上。3.构建异常聚集就医行为监测系统及提出基于时间序列相似性分析的在院人次异常检测方法。利用监测系统实现对就医聚集人群的发现、分析及效果展示,主要包括对聚集就医人员及其医院的分析。对患者主要是利用规则对患者的患病、花费等进行异常甄别。对医院提出基于时间序列相似性分析的在院人次异常检测方法,动态检测在院人数异常。
其他文献
3,4-二甲氧基苯胺(2)与5-(甲氧基亚甲基)-2,2-二甲基-1,3-二噁烷-4,6-二酮发生取代反应,再经环合、氯代,与对硝基苯酚反应制得6,7-二甲氧基-4-(4-硝基苯氧基)喹啉,再经过Pd/C
本文就酵母培养物(简称YC)作为天然饲料添加剂在养殖业生产中的应用进行了简述.
进士宴会是唐代的重大宴饮活动,名目繁多,政治色彩浓厚.在这些宴饮活动中,各色美味佳肴集于一桌.在唐代的宴会中烧春酒、酴糜酒、乳酪、樱桃和红绫饼等饮食占有重要地位,为人
我院自1987年以来,为17例患者行PBPV,男11例,女6例,年龄3~39岁(平均12.5±9.2岁),诊断为单纯肺动脉瓣狭窄,轻度狭窄5例,中度7例,重度5例.采用单囊法13例,双囊法4例.随访10例
本文从社会医学视角入手,分析新医改以来医生行为问题及其成因。近年来随着医疗技术和社会经济的发展,各国的医学模式已经从只关心病人身体健康的生物医学模式转向了关注病人
对 10 4例云锡冶炼工尘肺进行了调查 ,发现 6 0至 90年代期间尘肺发病工龄非常接近 ,而且与不同生产环境中粉尘浓度密切相关。尘肺病人累积死亡 2 4例 ,病死率为 2 3 0 8%。
酉阳县位于渝、黔、湘、鄂结合部的褶皱地带,境内多河谷山地。该地处于温带地区,雨水较充足,利于植物生长,造就了丰富的有机肥源。近年来,由于工业的发展和农业技术的推进,化学肥料
目的了解我国居民医院门诊就医行为,提出针对性的医疗改革政策建议。方法利用协整回归模型进行实证分析。结果门诊诊疗人次与医院级别呈正相关,部分居民愿意购买高质量的诊疗
在我国新农村建设过程中,农村经济的快速发展对农村金融产生了越来越强烈的需求。然而,我国现阶段农村的金融现状却不能有效满足农村金融的需要。本文立足于这个现实,分析农村金
育人是高校的使命与职责,实践育人作为育人的一种重要形式,是着力提高高等教育质量的必然要求,更是高校发展的重要任务。加强高校实践育人具有重大的时代意义。本文以北京联