对液相质谱数据集的数据降维

被引量 : 0次 | 上传用户:Chinaxfhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要描述了在一个具有极高维度的液相质谱型宫颈癌数据集中进行数据挖掘的过程。此项目的目的是通过对具有区分一种特定疾病状态,即患癌或非患癌的对应于生物标记的某种蛋白质或肽的发掘来降低数据集的维度。数据降维的两种主要方法——特征选择和特征提取在本项目中都得到利用。我们既整合了一些经典的特征选择算法,又采用了一些较新的算法,比如像CLaNC,One_by_One,T检验,Gram-Schmidt等,同时也尝试了几乎所有的特征提取算法,包括主成分分析,Autoencoder network等等。最近邻分类法和交叉验证被分别用作分类器和生成训练样本集和测试样本集的数据分割法。大多数的算法都是在MatLab的平台下编程实现的,我们还引入了WEKA作为补充工具。实验是在两种方法学的指导下进行的,即特征选择分别位于交叉验证之前和之后。在分析和对比了由各种算法产生的结果之后,我们能够得出如下结论:尽管对于患癌症者或非患癌者的区分上,Group_I中第391个特征并不是具有0分类错误率的完美
其他文献
7月20日,新联地产办公室,简约朴素的陈设,安静典雅的氛围,环顾四周,映入眼帘的是各式的企业文化展示牌。在这里,我们近距离接触了河北新联房地产开发有限公司董事长高伟先生
通过单因素实验和正交实验,对葡萄皮多酚的浸提工艺进行了优化,确定最佳浸提条件为:浸提温度80℃、乙醇体积分数50%、浸提时间30 min、料液比1∶9(g∶mL)。在此条件下浸提2次
经济全球化带来文化全球化,面对中外文化的融合、碰撞与交流,我们必须充分认识创新并发展民族传统文化、保持文化自主性的重要性。当代大学生是传承中华文化的先进青年群体,
本文研究了垃圾堆放场引起的地下水污染,以典型垃圾堆放场为例,结合研究区水文地质条件,建立研究区浅层地下水污染物运移的模拟和预测模型,对地下水中的污染物的运移规律进行模拟
根据多年服务于一线窗口的经验积累,着眼于业务受理员一天的服务工作全过程,总结出可操作性较强的"一日服务运营管理模式"。此模式旨在把"让每一位客户满意"作为终极目标,将
客户关系管理(Customer Relationship Management)是为了适应以“客户为中心”的商业模式而发展起来的一种新型的管理理念。它强调企业生产销售中各个环节必须以提高客户满意
在知识经济时代,无形资产成为企业价值创造的重要因素,对高新技术企业尤为重要。对外部利益相关者或潜在的资金提供者而言,无形资产信息能更好地展现当前企业的真实价值。尽管中
儿童的绘画是儿童感知世界的一种方式,他们感知世界是一种非逻辑思维的方法,同时也是自我表达的一种语言。通过美术教育可以使幼儿把自己的想象、愿望变成可见的作品表达出来
根据旅游线路规划与导游的需求,面向遥感景观优美程度评估,综合相对坡度、观景距离、可视情况和景观类别等因素,改进了景观敏感度的概念;并基于改进的景观敏感度概念提出了一
为得到燃用生物质颗粒燃料锅炉的燃烧和排放特性,建立了燃烧模拟实验台,进行了一次风量及二次风量不同配比、不同位置及不同料层厚度等参数对燃烧和排放性能影响的实验,为生