基于流形学习的肿瘤基因表达数据分类研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:simyhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肿瘤是影响人类健康的主要疾病之一,然而目前的肿瘤诊断方法和治疗效果都不是很理想。基于基因表达谱的肿瘤分子诊断方法是一种全新的快速而准确的诊断方法,它还能检测肿瘤的进展、恶化程度以及抗癌药物的耐药性等,为临床医生诊断肿瘤分型、提供治疗方案以及分析预后提供一种重要参考。目前,具有“高维,小样本”特征的微阵列数据不断积累,如何有效地从这些高维数据中获取有用信息或规律已成为当今信息科学与技术所亟待解决问题之一。从基因表达谱的成千上万个基因中选择分类能力强,数量少的特征基因极具复杂性。通常情况下,在如此大的基因空间中进行穷尽搜索是不可能的。因此选择合适的特征提取方法是非常重要的。本论文中,我们在总结流形学习算法成果的基础上,我们应用一种新的特征提取方法和一些流形学习算法对两类和多类分类问题进行了研究比较,最后我们利用CMVM(Constrained Maximum Variance Mapping, CMVM)和局部线性判别嵌入算法(locally linear discriminant embedding, LLDE)算法对跨平台肿瘤数据进行了分类比较研究。本文主要作了以下研究工作:第一,把一种肿瘤基因表达数据特征提取方法——基于约束最大差异投影的特征提取方法(Constrained Maximum Variance Mapping:CMVM)应用于肿瘤样本基因特征提取,然后我们用K-NN分类器进行分类:在两类分类实验中,我们对前列腺癌数据集和乳腺癌数据集进行了特征提取及识别率的分析;在多类分类实验中,我们对白血病数据集和中枢神经系统肿瘤数据集进行了特征提取及识别率的分析。通过对不同的肿瘤样本基因特征提取及识别率的分析实验验证了该方法的可行性和有效性。第二,把流形学习算法用于跨平台肿瘤样本基因表达数据的特征提取,然后用K-NN分类器进行分类,从而比较它们的识别效果。本文最后指出了目前肿瘤基因表达数据特征提取及分类研究存在的一些问题以及今后需进一步开展的研究工作。
其他文献
美术艺术是学前教育专业学生必备的基本技能,而民间美术作为美术课不可或缺的重要组成部分,对传承民间优秀美术艺术,推动现代艺术的发展具有重要作用。本文从民间美术的相关
文章对第十届世界武术锦标赛散打比赛情况进行统计和分析,旨在探究武术散打发展格局的新趋势。研究结果表明:参赛规模宏大,不平衡性发展特点明显;奖牌分布较广,竞争格局已成
大学校园仪式是在大学文化的规范体系下,为了实现共同的价值取向和行动目标,师生共同参与的校园文化活动。它对于融洽和谐校园人际关系,促使道德行为认同,形成独特大学精神,都有着
墨西哥农畜乡村发展渔业食品部(SAGARPA)于2016年3月30日发布了G/SPS/N/MEX/299号通报,标题为:陆生及水生动物疫病法规。
借助"记录成长脚印",鼓励学生学会自主管理,帮助班主任提升班级日常管理能力;创设班主任节,借助班主任联盟和能力大赛等活动,为班主任提供交流互动平台,实现综合素质提升;通
目的:探讨新辅助化疗(neoadjuvant chemotherapy, NACT)在局部晚期宫颈癌治疗中的近期临床治疗效果及其对宫颈癌根治性手术的临床及预后不良病理因素影响。方法:回顾分析2001
日本健康、劳动和福利部于2017年5月16日发布了G/SPS/N/JPN/514号通报,标题为:拟定杀虫剂草甘膦最大残留限量。
目的分析三叶因子3 (trefoil factor 3, TFF3)在不同胃黏膜病变中的表达及其与间质微血管密度(microvessel density, MVD)值的关系,探讨其在胃癌、癌前病变及胃腺瘤发生、发
本文从集群创新的特征出发,描述了集群创新的优势,并从外部规模经济和外部范围经济两个角度分析了集群创新优势产生的机理,并进一步论述了集群创新优势与科技型中小企业创新
目的研究恶性黑色素瘤组织中线形程序性坏死(linearly patterned programmed cell necrosis, LPPCN)的分布及其形态学特点,并探讨其临床病理意义。初步分析LPPCN发生的相关分