基于统计方法的癌症特征基因提取

来源 :云南大学 | 被引量 : 0次 | 上传用户:fengjintao1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是当前困扰现代医学的一种严重的致死性疾病,现在一般将癌症作为各种恶性肿瘤的统称。目前临床上对于肿瘤的诊断主要是借助形态学上的方法,但这种方法并不精确。癌症的发生往往包含着生物体内基因的变化,因此从基因层面对癌症的致病机理进行研究更具有科学性。DNA微阵列技术可以在短时间内获得大量生物基因表达谱数据,这使得从基因层面分析癌症的发生成为可能,同时该方法对于癌症病患的早期诊断和后续相关治疗有着非常重要的意义。但是基因表达谱数据往往具有维数高、小样本、噪声大的特点,这使得对数据分析的难度大大增加。癌症致病基因的数目一般比较少,大量无关基因夹杂在表达数据中增加了分析的难度。鉴于此,预先选取一定的标准对无关基因进行剔除,使得数据维数降低,并通过选择的最优特征基因来取得较高的分类准确率,成为利用DNA微阵列技术研究癌症的基本思路。本文选取结肠癌基因表达谱数据,通过采用Chernoff距离和Bhattaacharyya距离相结合的方法,滤除掉无关基因,找到了136个代表性的候选特征基因,随后采用Lasso方法对数据进行进一步降维分析,最终选出了21个关键的特征基因。用支持向量机的方法对所选特征基因的分类效果进行了检测,得到87%的分类准确率。其中几个特征基因己被生物学实验证实与结肠癌有关。
其他文献
本文提出了指定相对精度的反scaling and squaring算法来计算矩阵对数。本算法采用DB迭代逐次计算矩阵近似平方根,运用对角Padé逼近估计逐次开方后的矩阵的对数。通过设立适
肝癌是世界上最常见的恶性肿瘤之一,一般发现的时候都是晚期且常规治疗手段如切除、移植肝脏等效果十分有限,导致这种疾病没有很好的治疗疗效,预后差。microRNA是一种短链非
第一部分18F-FMISO PET/CT评价治疗前非小细胞肺癌的乏氧状态目的通过对治疗前的非小细胞肺癌患者行18F-FMISO PET/CT显像,探讨18F-FMISO的最佳显像时间,探测非小细胞肺癌原
新纲要指出,家园共育是幼儿素质教育的立足点。家庭作为幼儿园教育的重要延伸基地,对幼儿社会性的培养起着举足轻重的作用。作为较为常见的问题行为,幼儿攻击行为受到诸多因
<正>《中国诗词大会》是中央电视台科教频道(CCTV-10)自主研发的一档大型演播室文化益智节目。节目于2016年春节期间播出,迄今已播出三季。无论是诗歌本身还是节目赛制,乃至
报纸办新媒体,容易出现"两张皮"现象,只相"加"不相"融"。楚天都市报成立全媒体指挥集成中心,从组织结构、运行机制、考核办法等多方面系统性地解决先网后报、移动优先等问题
中小保险企业是保险市场竞争的重要主体。本文以葫芦岛市为例,分析其保险市场发展现状和中小保险企业发展存在问题,并提出中小保险企业提升竞争力的具体对策,旨在推动其可持
从选择作品到阅读体验再到欣赏结果,儿童文学的整个欣赏过程都表现出追求快乐自由、充满幻想的游戏精神。成人在儿童文学的欣赏指导中应守护这种游戏精神。
1稳定同位素地层学研究进展稳定同位素地层学是利用碳、氧、硫、锶等的稳定同位素组成在地层中的变化特征来研究地层的划分和对比,以及研究相应时代的古生态、古地理、古构造
目的:探讨急性心源性前循环大血管闭塞行血管内治疗的疗效及其影响因素。方法:回顾性分析常州市第一人民医院神经外科自2014年6月至2016年6月收治的83例采用血管内机械取栓术