基于SVM的基因表达谱分析和函数集VC维研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:liuguoqiangswu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是影响人类健康的主要疾病之一,有着极高的死亡率,对癌症的预防和治疗已成为全球科学家关注的焦点.研究表明,癌症是一类复杂的基因疾病,因此研究癌症基因表达谱、选取信息基因是我们寻找癌症相关基因、发现癌症基因表达特征的直接手段.本文第一部分主要针对基因表达谱数据维数高而样本少、噪声冗余而信息基因少的特点,首先利用离散度分析对结肠癌基因表达谱数据集进行特征的筛选.其次通过对基因之间相关性的分析,设计出向量分类算法,进一步提取特征基因,使得用于分类的基因数目进一步缩小.最后,分别利用支持向量机分类方法和势函数分类方法在上述特征提取的基础上对结肠癌数据集进行分类.通过对分类结果正确率与分类所用时间的统计,可以看到支持向量机方法对于结肠癌数据集的分类具有较好的效果.文章第二部分对函数集vc维这一描述学习机器复杂性的重要概念进行探讨,对于n维空间中性指示函数集合的VC维是n+1这一结论,本文在文献[1,2]的基础上对证明方法进行了改进,给出了一个完整的更具一般性的代数方法的证明.
其他文献
我国人口老龄化问题正在日益严重,由于人口结构的老化,各种社会问题开始显现;由于老龄人口的比例的持续增加,使得青壮年劳动力的比例持续下降,对国家和社会的发展产生了影响
学位
可靠性数学理论起源于20世纪30年代,最早被应用的领域是机械证明,维修问题。另一个重要应用是将更新问题应用于更换问题。在30年代,威布尔,龚贝尔和爱泼斯坦等人研究了材料的
随机延迟微分方程作为一种重要的数学模型在物理学,生物学,金融学,控制论以及医学等诸多领域具有广泛的应用。这一类方程既考虑了滞后对系统的作用,同时考虑了外界环境对系统性质
粒子群优化算法是通过对鸟类群体觅食行为的研究和观察提出的一种群体智能优化算法。该算法思想简单、需调整的参数少、收敛速度快且易编程实现,因此受到广大学者的关注和青睐