生物网络构建及应用研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:baoxiongwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生命过程通常复杂而精细,需要许多生物分子共同参与来完成。构建并分析生物网络有助于准确地认识生物分子的功能与作用,识别生命过程中的关键生物分子,从而辅助疾病诊断、药物研发等研究。本文研究了基于分子间关联关系的生物网络构建方法,和基于差异网络筛选潜在生物标志物的网络分析方法。具体研究内容如下:1.提出了基于加权弹性网络的基因调控网络构建算法WEN(Weighted Elastic Net)。由于基因之间的调控关系比较复杂,基因表达数据维度高、样本少的特点使得真实的调控关系难以准确推理。WEN基于加权弹性网络模型构建基因调控网络,在调控关系推理的过程中对弹性网络模型惩罚项的参数进行优化,使其能够根据当前目标基因所对应的调控关系对模型进行调整。同时,将基因之间的互信息与调控关系强度相结合对惩罚项进行加权,在迭代过程中逐步削弱基因之间弱的调控关系,减少假阳性边的产生,提高所构建调控网络的准确性。本文在DREAM基因表达数据集上将WEN算法与PCA-CMI、CMI2NI、PCA-PMI、IMBDANET、DCNTC、Gene Net、DPM、reg-DPM和DSWLasso九种基因调控网络构建方法进行了比较,并进行了多组消融实验,以分析WEN算法的性能。实验结果表明,在大多数数据集上,WEN算法构建的基因调控网络的准确性高于对比方法。2.提出了基于多角度融合差异网络的特征选择算法MIDN(Multi-angle Integrated Differential Network)。生物分子之间的关联关系复杂多样,互信息、相关系数等方法从不同的角度度量分子间的相互关系。MIDN综合考虑多个角度的相关性,从线性相关、秩相关以及非线性相关三个角度分别构建差异网络并进行融合,以构建包含丰富信息的融合差异网络,并利用融合差异网络的拓扑结构特性和分子自身的差异显著性对特征(生物分子)进行评价,筛选与研究问题相关的重要特征。本文在8个公共数据集上将MIDN算法与LC-k-TSP、IBN和INDEED三种特征选择方法进行比较,并进行了多组消融实验,以分析MIDN算法的性能。实验结果表明,在大多数数据集上,MIDN所选特征的分类准确性优于对比方法所选特征。本文提出的两种算法均基于生物分子之间的关联关系进行了生物网络的构建。其中WEN算法基于弹性网络回归模型构建了基因调控网络,MIDN算法通过度量分子间不同类型的相关性构建了融合差异网络,基于差异网络分析筛选潜在生物标志物。本文在多个数据集上进行了对比、消融实验,验证了两个算法的有效性。
其他文献
顺序回归,又称为排名学习,是机器学习领域中的一种介于分类和回归之间的监督学习问题.顺序回归的目标是从带有排序标记的样本中学习一个多分类器来预测新样本的标签.许多现实问题都非常重视对标签之间顺序关系的处理,这些问题大多可以被建模成顺序回归问题.事实上,在那些重视人类需求、行为与偏好的领域,顺序回归已经得到了广泛的应用,比如医学研究、信用评级、文本分类、人脸识别、社会科学等.支持向量机(Support
学位
随着神经网络技术的发展,机器翻译迎来了新发展浪潮。在对国内语言服务行业进行的调查中,我们可以看到,机器翻译在语言服务行业的应用越来越广泛。而所涉及的翻译服务领域中,科技类文本占比最大。研究表明,机器翻译在翻译文学类文本时具有一定的适用性。但由于受到其机械性和自动性等特征的制约,机器翻译更适用于科技文本等非文学文本的翻译。在英语科技文本中,被动句是最为常见的一类句式,在运用机器翻译处理科技文本时,被
学位
近年来,应用张量分析解决可视化数据的恢复问题越来越广泛.以矩阵补全和主成分分析的矩阵形式为基础,将其推广至张量情形.但由于张量秩的定义的多样性,产生了不同的低秩张量补全(LRTC)模型和张量鲁棒主成分分析(TRPCA)模型.目前最为广泛的是基于张量Tucker秩和张量tensor-train秩的LRTC模型和TRPCA模型.相比于张量Tucker秩,张量Tensor-train秩更能体现张量的内部
学位
数学建模,曲线和曲面的构造以及形状保留是计算机辅助几何设计(Computer Aided Geometric Design,简称CAGD)中非常重要的研究领域。传统Bézier曲线由经典Bernstein基函数和控制顶点组成,具有对称性、端点性、非负性、线性精度、积分性、凸包性等优良特性。利用经典Bézier曲线的参数和几何连续性约束,可以很容易地构造任意曲线形状,但它的缺点是,设计者不能在不改变
学位
近十年来,得益于硬件设备的升级和计算机算力的指数式增长,深度学习在计算机视觉领域取得了巨大的成功,并且在诸多行业有了实际的应用。图像领域的研究趋近饱和,以及短视频数量的急剧增长,也让作为计算机视觉的一个重要组成部分的视频,越来越受到研究人员的关注。但是,由于视频本身具有的信息冗余性,时序性强,时间范围广等特点,基于视频的分析和识别仍然是一个较大的难点。本文通过不同架构的网络结构,在多个数据集上进行
学位
手势姿态估计在增强现实、虚拟现实以及人机交互等方面存在巨大的应用前景,一直以来是计算机视觉领域的重点研究方向。随着大规模手势姿态数据集的出现,基于深度图像的深度学习方法逐渐成为了手势姿态估计领域的主流方法。当前研究主要通过构建三维卷积神经网络进行手势姿态估计,致力于单一精度的提升,但通常导致模型复杂度过高、推理速度低下,难以满足实际应用、实时运行的基本要求。因此,为追求精度和实时性之间的平衡,本文
学位
源文本节选自美国作家古德里奇19世纪50年代所著的历史文献History of All Nations:Asia,所译部分为第104章至113章,共计28000英文单词。该翻译任务由导师发起,导师已与出版社签订合同,翻译该书用于出版。该书的翻译采用“机器翻译+译后编辑”模式进行,选择了拥有良好口碑的国产机器翻译平台代表——小牛翻译作为此次实践的翻译工具,进而评估小牛翻译在翻译历史文献时的真实表现。
学位
本项目实习报告基于笔者在烟台大学学报的摘要英译审校工作,实习时间为2020年1月至2021年9月,审校内容涵盖12期,共计145篇摘要。在项目期间,笔者的工作内容主要是审校烟台大学学报(哲社版)英文摘要,领域涉及哲学、文学、法律等。在项目准备上,本报告探讨了中英文摘要写作标准并分析了摘要文本特点,并在此基础上制定了审校质量标准,介绍了平行文本阅读过程、项目所需的工具和资源以及应急预案。在项目实施上
学位
本翻译项目的材料选自Cultural China一书,书中着墨最多的是儒家的人文精神,突显儒家一脉相承的批判精神。在全球化和本土化意识均日益强烈的今天,该书对于儒家文化的继承与传播具有重要意义,可以为相关学者提供很好的参考,具有一定的翻译价值。本项目选取了书中“人文精神与全球伦理”作为源文本。作为人文精神主题演讲,全文语言流畅,虽涉及部分儒学专业术语,但整体难度适中,重点在于向听众传达思想和观点。
学位
降维是机器学习和数据科学领域的重要研究方向,其应用包括但不限于数据预处理、数据可视化等。多数现有的降维算法获得可信低维嵌入的前提是输入数据具有稠密、均匀的分布特性,但这些方法往往在稀疏数据等缺陷数据上失效。因此,提高降维算法在不同数据情况下的通用性,是一项有意义且具有挑战性的任务。本文从鲁棒降维方法的角度出发,着眼于提高降维方法在缺陷数据上的适用性。基于线性、非线性与神经网络三种降维模型,本文工作
学位