非负矩阵分解及其生物信息学应用

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:asd_012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今信息时代,采集获取的生物数据种类繁多,如脑电波、基因微阵列数据、人脸数据、虹膜数据、指纹等等。随着生物科学和信息科学的发展,人们致力于从数据中寻找问题的解决方法,例如疑难病症的基因微阵列数据分析,脑机接口的脑电波数据分类,刑侦破案中的DNA比对、视频追踪中的人脸识别等。非负矩阵分解是近年来发展迅速的数据分析方法,在生物信息学中有着广泛的应用前景。  非负矩阵分解(NMF)通过将一个高维非负数据矩阵分解成两个低维的非负矩阵,并最小化它们之间的距离,从而将数据投影到低维空间进行分析。本文研究非负矩阵分解,提出了三种各有特点的非负矩阵分解方法,并在一些生物信息学数据上进行了实验应用。本文主要工作包括:  1)提出基于高斯赛德尔方法的非负矩阵分解——GSNMF。GSNMF通过对数据进行预投影再分解,最终得到两个低维非负矩阵。该模型不仅分解速度优于传统非负矩阵分解方法,并能有针对性地处理维度不平衡的基因微阵列数据。  2)提出基于一致信息熵度量的图正则非负矩阵分解——CGNMF。CGNMF通过链接图保留原数据的几何性质,并最小化一致信息熵度量得到低维矩阵。该模型能够鲁棒地学习数据的特征并应用于聚类,其相应的人脸识别实验和脑电波分类实验表明了其良好的鲁棒性。  3)提出基于一致信息熵度量的有监督非负矩阵分解——CSNMF。CSNMF添加了标签信息,结合CGNMF模型框架进行有监督地学习得到两个低维非负矩阵。该模型能够更有效地进行数据分类,脑电波分类实验表明其能大大提高识别率。
其他文献
在市场竞争日趋激烈的情况下,在建筑工程建设中,精细化管理是一项降耗提效的重要工作,施工企业必须重视施工过程中出现的种种弊端,在切合实际的基础上实施科学有效的管理,才
2015第十六届国际木工机械及家具生产设备展览会及国际木工机械配料展览会(简称2016北京木工展),将于2016年6月1—4日在北京中国国际展览中心(老展馆)盛大举行。该展会由中国
众所周知,腐蚀失效在金属领域占据失效的重要比重,而玻璃态合金因其长程无序、短程有序的结构特点,在物理化学方面具有着优异的性能,尤其在耐蚀性方面表现出突出的优势。铝合金在
铂族金属具有许多独特的物理、化学性能,在国民经济中有着十分重要的作用。与一次资源相比,铂族金属二次资源贵金属含量高、组成相对较为单一,尤其对铂族金属矿产资源十分有限的
我国铝土矿资源多为中低品位的一水硬铝石矿。因此在氧化铝生产中,烧结法占有相当的比例。烧结法熟料溶出过程中2CaO·SiO2会与铝酸钠溶液发生二次反应,造成Al2O3和NaOH的大量
快速准确地建立牙及颌骨的数字化三维几何模型是进行口腔正畸、修复等手术的仿真和生物力学评价的基本前提。为了在三维模型中对每颗牙独立地进行移动、排列和去除等操作,需要
当前,高炉炼铁面临着高产、低耗、低污染的巨大挑战。因此,一些革新的高炉炼铁技术已被提出或实际应用。热压含碳球团是具有热塑性的煤与含铁物料的热压产物,具有还原性高、高温
铸造铝硅合金由于具有优良的铸造性能,而成为目前应用最广的铝合金之一,在国民经济中占有重要的地位。但在常规铸造Al-Si合金的组织中,存在针状的共晶硅和粗大的形状复杂的初晶
近年来,造船业不断发展,传统的船板钢已不能满足实际的工业发展需求,尤其在焊接工艺方面,主要表现为传统的小线能量焊接施工效率低,而大线能量焊接时,焊接热影响区出现严重的
白云鄂博铁精矿以其成分复杂,难以冶炼而著称,由于其中碱金属氧化物及氟含量较高,给包钢高炉炼铁造成了不小的麻烦。同时由于我国钢铁工业近年来蓬勃发展,对铁矿石的需求也大幅增