基于随机森林的基因表达数据分类强度研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:movax
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用DNA微阵列技术产生的基因表达谱数据,进行疾病诊断、治疗、药物研制和药物筛选是当前的一个研究热点。由于疾病诊断和药物研制直接关系到人类的健康,因此研究基因表达数据的分类结果的可信度有着特别重要的意义。   针对基因表达谱数据的分类可信度问题,本文利用随机森林的分类强度对其研究,其主要工作有:   1.详细介绍了基因表达谱数据分类问题的研究现状和随机森林技术的算法原理。   2.针对随机森林现有工具包的缺点,开发并实现了C语言版的随机森林工具包,并给出了MATLAB的接口,使其亦能在MATLAB平台运行。该工具包简便实用,有利于随机森林的应用推广。   3.针对基因表达谱数据的分类可信度问题,提出了基于随机森林的票数差和Proximity矩阵接近度之差的两种可信度度量。四个基因表达谱数据集的实验显示,两种可信度量都能准确表征了基因表达谱数据分类的可信度,可信度大的样本很少出现误判现象,而可信度小的样本常会出现误判现象,表明了这两种可信度度量的有效性。
其他文献
学位
战场监视是军事侦察的一个重要部分,随着航天技术的不断发展,遥感图像在军事侦察在得到越来越广泛的应用。本文以彩色卫星遥感图像为研究对像,分析遥感图像中地物的特征,在战
随着我国经济的发展,服装产业尤其是网上购衣也取得了迅速发展。线上的B2C模式C2C模式现在更为年轻的消费群体所青睐。现在越来越多的顾客选择在一些购物网站如淘宝,京东等购
移动通信作为国民生活的重要工具之一,需要时刻确保网络稳定与安全,网络优化是完成这一任务的重要手段,而网络预测则是网络优化的前提条件。本文针对传统网络预测方法缺乏用
随着USB技术的广泛应用与发展,USB技术急需要运用到便携式设备中,USB OTG技术满足了这种需求。本文通过对单片机技术相关知识、USB通信协议以及USB OTG技术等理论知识进行研
伴随着科技的进一步发展,电力能源在社会生活的各个领域承担着十分重要的任务和角色,作为变电站内重要的电气设备,高压开关柜内经常出现局部关键触点温度过高的状况,若不及时处理,会对国民造成巨大的经济损失。由于开关柜内空间狭窄,电磁干扰强,传统的温度监测方式受到了极大的限制。光纤光栅传感器抗电磁干扰能力强,绝缘性能佳,可直接安装于带电物体表面,十分适合变电站高压开关柜这种强电磁干扰环境,非常适用于高压开关
随着中国的飞速发展,中国城市化进程也急剧加速,城市轨道交通工程建设和越江越海隧道的快速发展,中国城市地下空间的总体规模跃居世界前列。目前,城市地下空间的开发利用已成
随着我国电力市场改革的深入,为增强自身的竞争力,降低发电成本,从根本上提高运行效率和管理水平,发电企业都在积极探讨、研究、开发火电厂厂级监控信息系统。   厂级监控系统
随着高速公路的快速发展和汽车的日益普及,机动车辆相撞事故频繁发生,对国民生命及财产安全构成严重的威胁,预防或降低汽车相撞事故的发生已成为汽车安全领域的重大课题,引起了各
本文针对某车载随动装置检测过程中测试周期长、精度低、无法动态测试等问题,设计了一种基于PC104的随动装置检测系统。本系统是以PC104主板为核心,通过电量取样板、驱动板、