基于深度森林和DNA甲基化的癌症分类研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:chen17981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为人类基因组重要的表观遗传现象,DNA甲基化对基因的表达发挥着重要的调控作用,与癌症的关系密切。针对癌症基因组图谱(TCGA)庞大数据的类不平衡和高维度,致使假阴率大幅增加的问题,提出了一种混合采样的不平衡数据集成分类算法,使用合成少数过采样(SMOTE)算法生成新的少数类样本,得到扩充后的数据集,通过Tomek Link算法剔除样本扩充过程中引入的噪声,得到相对平衡的数据集。在此基础上,利用深度森林(gcForest)算法的级联森林结构,每一层选取两种随机森林结构,以增强模型的泛化能力,得到最终的分类
其他文献
<正> 一、覆盖件冲压工艺方案设计工艺方案设计是根据一定的工艺设计标准、用户工艺要求和生产技术条件,对覆盖件的冲压工艺性进行分析,确定冲制零件应需采用的工序。其过程
本文分析在UGⅡ基础上开发的基于特征的板材折弯件参数化展开软件的概况。该软件采用C语言编,基于特征的零件描述方法,调用U-FUNC库,通过菜单选择,参数化地绘制典型折弯件的三维图形,并可在
以摇枕为例,简要阐述了在芯盒设计时,如何通过工装模具来保证铸造工艺的实现。
在掺烧准东煤电站锅炉试验中,通过改变SOFA风率和准东煤掺烧比,研究了SOFA风率和掺烧比对膛内火焰温度场分布及炉膛内结渣情况的影响。结果表明,一次燃烧区域火焰平均峰值温
针对传统的矩阵分解算法,仅利用评分信息作为推荐依据,当评分数据稀疏时,不能准确获取隐式反馈,影响推荐的准确性,充分利用辅助信息进行隐式特征的提取成为研究热点之一,提出
文章在广泛调查的基础上,分析了上海市机械行业CAD技术应用的现状,并深入探讨了CAD技术推广应用中存在的问题,提出了应采取的对策。
目的分析CT诊断肺结核合并真菌感染(TBFI)的影像特点及应用价值。方法选择2017年1月至2019年6月本院确诊的TBFI患者71例为观察组,以同期收治的TB未合并真菌感染者100例为对照
目的分析消化道息肉应用内镜注射配合高频切除术的完整率、治愈率及并发率。方法筛选2016年5月至2018年5月我院消化道息肉患者282例为研究对象,依据采用的不同疗法进行分组,
我公司与国内某著名上市公司签定了一条自主设计生产的10型/小时四工位辊道式V法铸造生产线,该生产线由四工位造型单元、辊道式砂型在线浇注及解箱单元、旧砂砂处理单元组成,
针对研制并改进新一代汽阳极多管碱金属热电转换装置(AMTEC)需要准确计算汽阳极多管AMTEC内的辐射和导热损失,以PX-3A型装置为分析对象,利用RadCAD软件计算了装置内各辐射面