基因芯片分析中的特征提取方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yt2099
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的顺利完成,基因芯片技术越来越完善,癌症研究开始进入了新的时代。基因芯片技术具有划时代意义的特点是能同时监测成千上万条基因的表达,并能在同一阵列上对每一条基因进行定量表示;解决了特定物种细胞中在某一特定的时间、特定的条件下基因表达谱测量问题。当前,基因芯片技术不仅是基因组信息学研究的主要支撑技术,而且为在基因组水平上进行癌症研究提供了最基本和必要的信息及依据,在生物学和医学研究中正受到越来越多的重视和应用。 癌症基因芯片数据分析使得在大规模基因水平上深入研究癌症的发生、扩散和转移等病理特征成为可能,并被公认为癌症研究与治疗的强大工具。在临床表现上,癌症往往复杂多样并具有极强的隐蔽性和高复发率,从而导致较低的临床诊断与分类成功率。然而,癌症的成功治疗却往往在于可靠而有效的特征提取和选择方法。为此,本文主要研究和探索了基于基因芯片数据分析的特征提取和选择技术。全文的主要工作包括以下两个方面: 1)提出了一种新的特征提取方法——判别主分量分析。众所周知,主分量分析(PCA)方法和线性判别分析(LDA)是两种常用的特征提取方法。PCA和LDA各有其缺点:PCA提取得到一组互不线性相关且能量较大的特征,但这些特征的分类性能不佳;LDA提取得到一系列有利于分类的特征,但是这些特征间不是线性无关的。因此我们提出一种新的方法——判别主分量分析(DPCA)。判别主分量分析方法能够结合PCA和LDA的优点,克服彼此的缺点,提取到一组既线性无关又有利于分类的特征集。 2)将判别主分量分析方法用于癌症基因芯片数据分析。由于基因芯片“高维、小样本”的特点,现有的统计分析方法不能获得令人满意的结果。因此本文针对基因芯片数据的特点,在判别主分量分析中使用更有效的判别函数。该方法在模拟实验中获得令人满意的效果。
其他文献
目前,国内许多企业为了保证连铸机的正常运转和多炉连浇,大都采用高温出钢法。这会增加炼钢炉的热负荷,降低炉龄,增加成本。如何建立合理的温度制度、精确控制钢液温度,是一个迫切
本文介绍了环境工程水处理的现状,阐述了曝气设备的工作原理和优势,重点对环境工程水处理常见曝气方式及应用要点进行了详细分析与探讨,以供参考.
期刊
采用自对准工艺制备了1.2 kV 4H-SiC平面型和沟槽型MOSFET器件,并在90~490 K的温度范围内对4H-SiC MOSFET器件的静态和动态特性与商用1.2 kV Si IGBT器件的性能进行了对比研究
设计了一台微电子机械系统(MEMS)电子听诊器,并应用于冠心病心音的检测中.首先,介绍了MEMS电子听诊器核心敏感单元微结构设计原理,并得出了ANSYS仿真环境中的应力和谐振频率
目的研究人C组轮状病毒SZ272 VP8*蛋白与组织血型抗原的结合特征。方法利用原核表达系统表达并纯化人C组轮状病毒SZ272的VP8*蛋白,通过唾液结合实验分析SZ272 GST-VP8*融合蛋白与A、AB、B、O和O-(非分泌)型唾液的相互作用;通过寡糖结合实验分析SZ272 GST-VP8*融合蛋白与不同的组织血型抗原(histo-blood group antigens,HBGAs)寡糖的
在石油化工生产中,实施优化控制能带来可观的经济效益和社会效益。优化控制模型的可组态性是解决优化控制软件产品适应生产过程变化的关键。针对上述需求,本课题提出了优化控
期刊
期刊
GaSb热光伏电池结构中的p-GaSb层是主要的光子吸收区.为了改善p-GaSb层的性能从而提高电池的转换效率等指标,首先研究了不同衬底温度和电池前电极对p-GaSb薄膜材料性能的影响