基于规则挖掘的肿瘤大数据的DRGs分组系统

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:whfbbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对于人口老龄化及肿瘤高发病率造成医疗保险收支失衡的问题,本文提出基于规则挖掘的肿瘤大数据的DRGs分组系统的解决方案。系统基于Spark on Yarn分布式平台和Spring Boot框架,融合机器学习、大数据分析技术、Drools规则引擎、自然语言处理、正则表达式等技术,依据国家疾病诊断相关分组CHS-DRG的分组规范,对DRGs分组所涉及的关键问题及技术进行研究。本文先对DRGs分组的国内外发展现状与版本更迭进行分析,提出本文的研究目标和内容;再对相关理论和技术进行研究;根据用户需求与CHS-DRG分组规范对分组系统进行需求分析;对DRGs分组系统进行总体设计,包含总体架构、技术路线、系统功能模块、数据库的设计;然后对系统关键模块的设计与实现进行详述,包括基于Spark on Yarn的肿瘤数据预处理、基于Drools规则引擎与文本相似性匹配算法的肿瘤智能编码方法、基于回归分析相关算法的模型比对与选择;最后对编码结果与分组结果进行测试与评估。本文的主要工作内容如下所述。1、基于Spark并行计算特点,运用正则表达式、拉格朗日插值法对原始肿瘤病例信息进行数据清洗,运用独热编码、归一化等方法对肿瘤编码后的病例信息进行数据变换。2、将数据清洗后的肿瘤病例信息,结合肿瘤智能编码的建设需求,基于Drools规则引擎建立主要诊断选择规则,将规则处理后的诊断和手术名称,分别与国家医保版编码标准:ICD-10疾病诊断编码和ICD-9-CM-3手术操作编码,采用基于Gensim的TF-IDF方法和Levenshtein中的Jaro方法,进行文本相似性匹配后返回准确度较高的编码结果,再对准确度较低的编码进行人工修正。3、将智能编码后的肿瘤数据,依据国家医疗保障疾病诊断相关分组CHS-DRG分组方案,根据肿瘤病人主要诊断确定主要诊断大类MDC,再结合主要手术操作及性别确定核心疾病诊断相关组ADRG,最后综合考虑合并症和并发症、离院方式等病例的个体特征,得到DRG编码分组。4、运用机器学习回归分析相关算法,建立DRGs编码及肿瘤病人个体特征与费用之间的关联,对住院总费用进行预测;再对预测后的总费用根据其费用分布规律与组间变异系数CV的判定,得出最终DRGs分组结果。并基于Spring Boot框架和Vue框架,开发肿瘤编码、DRGs分组的数据服务交互接口与界面。
其他文献
1饲养杂交猪猪的生产性能的高低受双亲遗传性能和环境因素的双重影响。据许多试验表明,饲养二元或三元杂交猪,比纯种猪日增重提高10%~30%,饲料利用率提高10%~15%,发病率降低30%左右;
随着4G技术的革新以及5G时代的到来,得益于网民移动端社交习惯的养成,移动短视频APP已经有了强大且坚实的用户基础。在互联网时代,网红城市作为一种火爆的文化现象,短视频的崛起改变了社交形式、消费习惯、媒介生态等等,同时,城市的既定意象也是悄然变化的一方面。因此本文将网红城市品牌资产作为研究对象,主要通过定量研究来探讨城市短视频传播的公众态度对网红城市品牌资产与口碑传播的影响,希望根据相关研究结论对
1植物学特征苦荬菜为菊科山莴苣属一年生或越年生草本植物。植株高1.5~3.0m,直根系,主根纺锤形,有分枝,入土达2m以上。2生产环境条件2.1气候条件苦荬菜喜温暖湿润气候,既耐寒
基于多因子模型研究股票收益与资产定价一直是金融学术界探索的热点,大量学者基于公司基本面因素构建多因子模型进行实证检验并取得了丰硕的成果。但市场异象频繁出现,传统有效市场理论和理性投资人的假设常常与现实不符。因此越来越多的学者将行为金融理论加入资产定价模型,基于行为和情绪挖掘新因子,探索投资者情绪对股票收益的影响。本文采用理论分析加实证研究的方法,理论分析部分给出了投资者情绪的定义,并梳理国内外有关
不同于产品专利,方法专利的侵权行为表现为一种内部的生产实施过程,权利人不能深入其生产经营过程直接取证。同时该过程又不能通过最终生产的产品所体现,因此侵权行为具有无形性与隐蔽性。正因为此,现行专利法在新产品制造方法中引入了举证责任倒置,以解决在实践中出现的举证难问题。但即使适用了举证责任倒置,制造方法专利纠纷中的举证困境依然没有得到解决,主要表现在:“新产品”领域,专利权人难以完成初始证明,证明“新
本文通过对ERP的实质进行探讨,针对目前各方对ERP的理解和现实中所存在的实际问题,提出一些建议。