基于非线性降维的合成生物元件可视化及其聚类研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:boge66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可视化是表达数据的直观且有效的手段,受到许多领域的重视,如信息学领域、生物学领域、合成生物学领域等。这些领域的迅猛发展为可视化带来机遇与挑战。例如合成生物学是用标准化生物元件构建生物设备的新兴领域,当前标准化元件数量多、种类杂,使得构建生物设备时难以选择标准化元件。将这些标准化的生物元件进行可视化及聚类后将有助于提高生物设备构建效率。为了达到这个目的,本文的进行了以下研究工作:1)降维可视化。要对合成生物元件进行降维可视化分析,首先要确定两个合成生物元件之间相似度,相似度的计算方法对后续的聚类结果会有很大的影响。考虑到合成生物元件为长度不一的基因短序列,本文通过编辑距离来计算生物元件的相似度,再结合高斯核函数的对获得的距离矩阵进行归一化处理。进一步使用改进后的拉普拉斯非线性降维方法将生物元件序列降为二维或三维数据,再通过图形化展示。表明降维后的数据具有良好的区分度,说明合成生物学者通过降维可视化可以显著提高标准化元件选择效率。2)聚类分析。聚类是把抽象或者物理的对象集合分成多个具有相似性对象的集合。通过对降维后的生物元件序列采用K-means算法进行聚类分析,最终得到功能类似的合成生物元件可以进行有效地聚类,功能差异大的合成生物元件可有效地区分,且对降维后数据聚类显示二分类精度达到91.6%,三分类精度达到82.4%。通过以上研究,本文提出了一种可以提高合成生物设备构建效率的可视化方案,并通过聚类分析证明了该方法的有效性,解决了合成生物元件数量多、种类杂、难以选择的问题。
其他文献
随着经济趋于发达、智能化水准的不断提高,人们对于个性化定制的需求和高质量服务意愿更加突出;与此同时,工业化的高度普及,生产成本的大幅降低,制造行业面对的竞争环境愈加激烈。大规模定制因具有效率高,成本低,支持高度定制化,生产流程灵活等特点,成为目前制造业领域追逐的热点。本文针对大规模定制下的生产调度问题进行了研究和优化,主要内容包括以下几点:(1)对大规模定制模式下的生产调度问题进行研究分析,制定大
体绘制技术是三维数据场可视化技术的一个重要分支,在医学、地质勘探、流体力学等领域均有广泛应用。研究者们提出了多种体绘制算法,其中光线投射算法是现有体绘制算法中图像
微电子技术的进步,推动了低功耗多功能传感器技术的快速发展。无线传感器网络就是由部署在监测区的大量廉价微型传感器节点组成的,通过采取无线通信的模式采用多跳的方式形成
分布式拒绝服务(Distributed Denial of Service,DDoS)攻击已经成为网络服务甚至是网络本身的一个巨大威胁。它利用TCP/IP协议的缺陷和网络带宽资源的有限性,向受害端恶意发
近年来,乳腺癌已成为当今女性发病率最高的疾病之一,严重危害女性健康。医学超声成像因其有效、安全、便携及低成本等特点成为乳腺癌诊断中的一种重要手段。基于乳腺超声图像
随着互联网在全世界范围内的不断发展和普及,越来越多的网络服务要求在互联网上传送三维模型,特别是Web3D技术的出现,使得三维技术在网络上的应用得到普及。然而目前的高精度
作为网络管理的核心功能之一,故障管理可以快速准确地检测、定位故障,减少因网络故障造成的损失,保证网络的可用性和可靠性,并且在一定程度上预防故障的发生。当前的故障管理
信息技术的飞速发展,计算机的广泛应用,使得人们的生活越来越便捷。计算机通过文件、文件夹的方式来存储、管理数据的方式也使得人们对自己资料的保存和更改变得越来越方便。
人机博弈是人工智能的一个重要研究领域,而大型角色在线扮演游戏将是人机博弈新的研究方向,游戏的复杂性,交互性,实时性等都比其他媒介更能模拟出现实复杂世界的不确定性和交
粒子滤波方法是近年提出的一种适用于目标跟踪的有效算法,但存在粒子的退化现象,导致许多状态更新的估计对目标跟踪轨迹不起任何作用,在浪费大量计算资源的同时降低了粒子滤