基于LASSO的整合临床和组学特征构建疾病风险预测模型的方法比较及应用

来源 :山西医科大学 | 被引量 : 1次 | 上传用户:a341104361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:通过模拟和实例研究对四种基于LASSO的可用于整合临床和组学特征构建疾病风险预测模型的方法——Naive-LASSO法,Separate-LASSO法,IPF-LASSO法和Priority-LASSO法的性质进行探讨和比较,为临床建立疾病风险预测模型提供建议。方法:首先,介绍Naive-LASSO法,Separate-LASSO法,IPF-LASSO法和Priority-LASSO法的原理。其次,模拟产生六种稀疏性和变量强度不同的临床和组学数据,并通过改变协方差矩阵改变各数据内部以及它们之间的相关关系,本研究考虑以下三种相关关系:(1)临床数据和组学数据内的变量相互独立,两数据间不相关,协方差矩阵设为单位矩阵;(2)临床数据和组学数据内的变量呈复合对称相关,两数据间不相关,协方差矩阵设为块对角矩阵;(3)临床数据和组学数据内的变量相关,两数据间也相关,协方差矩阵设置更复杂。通过以上操作共形成18种模拟场景,然后使用上述四种方法针对各模拟场景建立预测模型,并通过AUC、Brier score和变量筛选个数对四种方法在不同模拟场景中的表现进行比较。最后,分别用这四种方法对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者的临床和lncRNA表达数据进行分析,建立新的DLBCL预后评价系统,按照模拟研究的评价标准对各方法在实例中的表现进行评估。结果:模拟研究显示,无论在哪一种模拟场景下,四种方法中均是IPF-LASSO法和Priority-LASSO法表现最好,Separate-LASSO法所筛变量数最多。其中IPF-LASSO法的预测准确性比Priority-LASSO法还要好一些,它的AUC值总高于Priority-LASSO法,Brier score低于Priority-LASSO法。而且四种方法在满足后两种相关关系的数据中的预测准确性要高于它们在完全独立的数据中的预测准确性。但无论临床和组学数据满足何种相关关系,当临床数据的稀疏性和变量强度一定时,组学数据的稀疏性和变量强度的变化对四种方法的预测表现的影响均不大,但当组学数据的稀疏性和变量强度一定时,临床数据的稀疏性和变量强度的变化对四种方法的预测表现的影响均较大。实例研究结果和模拟结果一致,也是IPF-LASSO法和Priority-LASSO法所建的DLBCL预后模型的预测准确性较高,且包含的变量个数较少。而且二者有7个变量是相同的。结论:Naive-LASSO,Separate-LASSO,IPF-LASSO和Priority-LASSO四种方法相比,IPF-LASSO法和Priority-LASSO法所筛变量个数较少,它们构建的疾病风险预测模型通常具有较高的预测准确性和临床实用价值。因此在整合临床和组学数据建立疾病风险预测模型时,可以优先考虑使用这两种方法。
其他文献
不同于西方国家集中于资本市场且高度证券化的影子银行体系,我国影子银行业务基于资本市场的金融创新成分较少,主要行使了类似于商业银行的融资功能,不但具备传统银行的期限错配、流动性和信用转换特征,其迅速扩张也使得我国的社会融资体系发生了重大变化。影子银行对于传统信贷体系的补充已然影响了以银行体系为主的信贷传导渠道,本文试图通过探讨影子银行对货币政策信贷传导效率的影响,更力图聚焦于影子银行在信贷传导过程中
钛合金在汽车关键结构件中的使用迎合了汽车设计注重高性能、轻量化、低噪音振动的发展趋势。然而,钛合金表面硬度低、耐磨性差的缺点严重制约了其作为关键耐磨构件的应用。
房价的快速上涨和居民收入差距日益扩大的现象并行,严重影响了居民生活质量,影响了经济的健康发展。房价在很大程度上预示了国民经济的繁荣程度,而房价的过度上涨往往预示着
投影仪自问世以来,便受到社会和消费者的青睐,其在办公、影音娱乐等方面的地位是不可替代的。而随着社会现代化的不断进步和互联网及物联网技术的不断升级,人们的日常生活需求也在不停的发生着变化,不同的客户需求在新的时代背景下如雨后春笋,不断的挑战着市场。传统的投影仪功能及造型已不能满足用户所有的实质需求。因此,新型的微型投影仪重新定义了传统投影仪,更加小巧化、便携化、娱乐化,并且更加具有实用性,不仅代替传
目的:认识和分析BMP及其受体与口腔鳞癌发生、发展的可能关系.方法:用免疫组织化学方法分析BMP-2/4,BMP受体(BMPR-IA)在口颊部粘膜正常上皮、慢性炎症和鳞癌上皮中的表达,标
夜光虫是一类生活在海水中的原生动物,在分类学上隶属于鞭毛纲、腰鞭毛目。它们在夜间由于海水波动的刺激能发光,因而得名。夜光虫的身体为圆球形,直径为1毫米左右,颜色发红,细胞质密集于球体的一部分,其内有核,其他部分由细胞质放散成粗网状,网眼间充满了液体。夜光虫有两根鞭毛,一根较大,称为触手,另一根则较小。它的繁殖有分裂法和出芽法两种,后者是在身体表面生出很多小的个体,脱离母体后发育成新的个体。例如,闪
近年来由于修复技术的不断发展,尽可能地保留患牙残根,并对其修复是目前临床上提高修复质量的有效手段之一.桩核是目前残冠修复中最为普遍选择的一种方法,其优点是固位好,可
自由刑中应然的自由是犯罪人为实现其自身需要不受他人阻碍地进行选择性行为的状态。由于社会的发展,自由刑被纯粹化,自由刑中的“自由”经过不断的分化最终限定为狭隘的人身自
1材料和方法1.1病例及适应证选择据传统的牙髓病分类法,诊断为急、慢性牙髓炎,牙髓坏死、坏疽的门诊患者,共158例.其中男性86例,女性72例;年龄1 6~67岁.因冬双糊剂含有色素,患
本文提出了一种符合OSI标准的数据国家码(DCC)编码方案,以解决互连网际的全网编址问题。这种方案不仅适用于X.25广域网和各种局域网的网络互连,而且也适用于任何使用OSL_CLNP协议的网络互连系统。