基于分类机制的唾液中胃癌标志物的筛选

被引量 : 0次 | 上传用户:bailiankk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
唾液中包含着大量的蛋白质分子,其中很多异常表达的蛋白与疾病检测相关,而且唾液样本相对于其它体液比如血液和尿液更容易获取,因而唾液逐渐成为进行无损检测疾病标志物的重要体液。幸运的是,飞速发展的分子生物学中的组学技术,例如基因组学、蛋白质组学、代谢组学、转录组学等,以及计算机科学中的机器学习、模式识别等算法在研究工作中的渗透,为标志物的发掘提供了新的思路和科学方法,使得在多种生物大分子中检测出重要所需标志物的过程变得简洁和高效。本文主要应用基于分类机制的挖掘方法,来识别那些由于过度表达而可能分泌到唾液中的蛋白分子。首先通过Sys-BodyFluid和Pfam两个数据库筛选出机器学习算法需要的训练集和测试集的数据,结合血液和尿液中疾病标志物挖掘的计算方法所选用的属性集以及通过唾液蛋白基因本体功能富集分析确定的关键词属性,本文构建了唾液蛋白的原始属性集,并提出了结合EBD离散化方法以及FCBF#属性选择的特征选取算法,构建了基于支持向量机(SVM)的分类器。分类器在1183个蛋白的测试集分类准确率在85%。然后将分类器用于来自Oncomine和ArrayExpress两个数据库中由于胃癌而过度表达蛋白的分析和判断。结果判断出320个过度表达的蛋白具有唾液蛋白的特性,即有可能分泌到唾液中。经过GeneCards和iHOP两个数据库的文献查询和分析,进一步明确32个蛋白可以作为唾液中胃癌检测的专一性标志物。本文对结果进一步进行了分析,通过对这些专一性蛋白的路径富集分析,寻找到与癌症细胞增长和扩散有关的蛋白,并基于这些蛋白构建蛋白质相互作用(PPI)网络图,结合网络图的拓扑分析,寻找到具有更高优先级作为唾液中胃癌标志物的蛋白。最后,本文结合文献查询和分析的方法,对其中几个挖掘出的标志物进行了确认、解释和说明。综上所述,本文将生物信息学中的标志物挖掘问题转化为数据挖掘中的分类问题,这是一种综合的以及实验友好的挖掘唾液中胃癌标志物的方法。
其他文献
目的:探讨中医辨证治疗原发性痛经的临床研究。方法:选择原发性痛经患者150例,随机分为对照组和观察组,对照组选用一般治疗、西医治疗;观察组选用一般治疗、中医辨证治疗治疗
<正>紫苏,唇形科植物Perilla frutescens(L.)Britt,紫苏全株包括老茎(苏头)、茎(紫苏梗)、宿萼(紫苏苞)、果实(紫苏子),一年生草本,野生或栽培,分布几遍全国。紫苏因其来源广
《红楼梦》第五回中的判词是一种独特的艺术形式,作者使用了谐音、拆字、藏字、典故、寓言和暗示等表现形式来隐喻人物命运,富有浓厚的中国文化特色。那么,富有中国文化特色
比较文学在欧洲和美国都是博学之士的专业性行为,是一项要求很高、具体成果的学术水平容易判别的学术研究。按钱钟书先生的意见,比较文学研究者需要至少掌握两门外语、读通至
2010年10月16日晚,威卢克斯国际建筑学生设计大赛颁奖典礼在法国古老的港口城市拉罗谢尔隆重举行,聚光灯下,频频走上领奖台的亚洲学生成为了本次大赛的一大亮点。 On the ev
中职学生在英语学习过程中普遍存在英语基础差、学习能力弱、对英语缺乏兴趣等不利因素。因此,在中职英语教学中,如何激发学生的兴趣、增强英语课堂教学效果是一个值得中职英
小学英语作为小学课程的重要组成部分。伴随着素质教育的不断深入,提高小学英语课堂教学效率成为了每一位教育者所关心的问题。因此,笔者结合自身经验,提出相应的措施:培养学
选取了枯水期鄱阳湖10~13m高程共14个出露表层沉积物样品,通过研究其总磷(TP)及各形态磷含量与分布特征,试图揭示江湖关系变化导致的水位下降对鄱阳湖沉积物磷潜在释放风险的
<正>江苏省电力公司坚持以科学发展观统领全局,以国家电网公司建设"电网坚强,资产优良、服务优质、业绩优秀"现代公司为目标,紧紧围绕"两个转变",以集约化、流程化、精益化管
凡事预则立,不预则废。这句话是说做什么事都要提前有所准备。表现在教学中,就是在学习新课之前要学会先预习,才能对所学知识有一个大体的了解,并学会建立新旧知识之间的联系