基于机器学习算法和生物信息学技术构建的肺癌与肺结核鉴别诊断模型及其初步评价

来源 :山东医药 | 被引量 : 0次 | 上传用户:lamm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的 采用机器学习算法结合生物信息学构建肺癌与肺结核鉴别诊断模型,并对其诊断准确度进行初步评价。方法 通过GEO数据库筛选并下载肺癌与肺结核数据集GSE42834,运用R软件的limma包筛选肺癌与肺结核差异表达基因(DEGs),对筛选出的DEGs进行GO生物过程和KEGG作用通路分析。使用STRING工具和Cytscape软件构建蛋白质相互作用网络(PPI),筛选肺癌与肺结核核心DEGs并使用t检验验证;将筛选出的核心DEGs输入R软件caret包,使用留一交叉验证法(LOOCV)结合8种机器学习算法构建肺癌与肺结核的鉴别诊断模型,包括支持向量机(SVM)、自适应提升算法(Ada Boost)、C5.0决策树(C5.0)、随机森林(RF)、朴素贝叶斯(NB)、神经网络(NN)、线性判别分析(LDA)及逻辑回归(LR)模型,筛选模型的最优参数。使用Bootstrap法对模型进行内部验证,采用准确率、Kappa值、敏感度及特异度初步评价鉴别诊断模型的诊断准确度。结果 GSE42834数据集中共筛选出325个DEGs,其中上调基因205个,下调基因120个。GO生物过程分析结果显示,肺癌与肺结核DEGs主要富集的生物过程为对病毒的反应、对病毒的防御反应、干扰素γ反应等;KEGG作用通路分析结果显示,肺癌与肺结核DEGs主要富集的作用通路为甲型流感、EB病毒感染、抗原处理和呈递等。PPI网络显示,具有最高连通性的前10个核心DEGs分别为STAT1、CXCL10、MX1、ISG15、IFIH1、OASL、IFIT3、GBP1、IFI44和IFIT1,经验证10个核心DEGs在肺癌患者中的表达水平均低于肺结核患者(P均<0.05)。8种肺癌与肺结核鉴别诊断模型的最优参数分别为SVM(Sigma=0.157,C=0.25)、Ada Boost(nIter=50,method=Real adaboost)、C5.0(trials=10,model=rules,winnow=TRUE)、RF(mtry=2)、NB(laplace=0,usekernel=FALSE,adjust=1)、NN(size=1,decay=0.1)、LDA(dimen=1)、LR(NA);内部验证结果显示,所有鉴别诊断模型准确率、Kappa值、灵敏度及特异度均较高,其中Ada Boost、RF、NN和LR准确率为1.000。结论 通过机器学习算法结合生物信息学方法建立了8个肺癌与肺结核早期鉴别诊断模型,其中Ada-Boost、RF、NN和LR准确性较高,具有良好的鉴别诊断能力。
其他文献
随着时代发展,我国乡村经济发展速度不断加快,对乡村人才的要求越来越高、乡村人才的拓展越来越受重视。党的二十大精神全面推进乡村振兴,坚持人才是第一资源,在乡村振兴战略下要深入实施乡村人才发展战略。该战略为乡村人才培养提供政策性指导,各地区乡村要结合当地发展情况和外部环境,及时有效恰当地培养乡村人才,为乡村经济发展提供更多的动力。该文在前期对惠州市博罗县杨侨镇进行乡村人才现状调查的基础上探讨乡村振兴人
研究背景:肝豆状核变性(HLD)又称为威尔逊氏病(WD),是由于常染色体ATP7B基因突变引起铜代谢障碍导致铜沉积于身体多个脏器引起相应器官损害。如未及时诊断、合理治疗,可进行性加重导致残疾甚至死亡。但目前的诊断依据尚有不足之处,铜蓝蛋白水平易受多种因素影响;肝铜检测为有创检查且受检测方法和技术的限制难以开展;ATP7B基因检测相对昂贵而不能普及。因此在临床工作中需要更加灵敏特异的诊断标志物。WD
文章以2013—2020年湖南农村居民的收入构成为基础,采用份额—分析法得出,湖南农民收入来源中,工资性收入是农民收入的主要来源,在结构上有一定的优势,但在竞争上处于弱势地位;家庭经营性收入在收入结构上处于明显劣势,但竞争优势已经初露端倪;财产性收入较低,结构优势不明显且具有竞争劣势;转移净收入结构有较大劣势,但其竞争优势十分显著,带动农民增收最为明显。
<正>随着城镇一体化的发展与乡村振兴战略的快速推进,乡村产业发展及规划设计研究成为提升乡村土地利用率、丰富乡村产业业态、加快乡村集体经济发展的重要因素。由龙岳林著、湖南科学技术出版社出版的《乡村产业发展及建设规划研究与应用》一书按照城乡统筹一二三产业融合发展的总体思路和乡村规划多规合一的编制要求,以服务当地产业发展需求为目的,提出了乡村产业发展及规划的理论和方法,对引导从事乡村产业规划者具有重要的
期刊
在教学中,教师应善于从结构的视角,引导学生用整体的、联系的、发展的眼光看问题。本文以苏教版小学数学六年级下册教材中《数的认识总复习》一课为例,从结构化的视角进行设计和教学,在磨课过程中反思总结出促进知识结构化生长的有效措施,即从“零散要素”走向“结构呈现”,从“静态呈现”走向“动态建构”,从“表层逻辑”走向“内在关联”,从“结构经验”走向“自主建构”。
<正>十八大以来我国社会主义新农村建设取得了很多成果,但总体发展较慢,主要原因是资金缺口较大,而PPP(Public-Private Partnership)模式正是有关公共产品与服务供给的一种投融资建设模式,以较少的财政资金拉动社会资本跟进投资,有效缓解地方财政压力。欧纯智博士是财政部财政科学研究所原所长贾康所带的博士后,是致力于公共管理与公共政策研究的学者,关注公共性、公共利益和公共价值,积极
期刊
2019年6月,“大下姜”乡村振兴联合体正式成立,但目前学者对乡村振兴联合体这一新的经济形态尚未进行深入研究与分析。杭州市开始着手尝试与探索乡村振兴联合体共富模式,文章通过分析与研究富阳区正在开展的乡村振兴联合体创新实践案例,明确乡村振兴联合体的基本理念,梳理乡村振兴联合体实践的经验总结,并提出相应的意见和建议。
随着乡村振兴战略的发展,我国农村经济水平得到了较大的提升,农民的人均收入和生活质量大大提升。在国土空间规划的背景下,做好土地管理工作十分关键。在新的规划背景下,如何进行乡村振兴的高质量发展尤其关键。本文对国土资源背景下的乡村振兴策略做出分析,提出了一部分意见,旨在为乡村振兴事业做出贡献。
本文针对文旅融合下乡村振兴发展机制与模式进行研究,详细阐述了乡村振兴与文旅融合的概念和内涵,并且说明文旅融合下乡村振兴发展的价值,在此基础上分析文旅融合下乡村振兴发展的机制和模式,通过研究为乡村振兴找到合适的发展道路,全面深化乡村振兴战略的实施效果,有效提升乡村地区经济发展水平。