基于数据挖掘的非编码RNA预测模型设计与实现

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:propelling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物计算是计算机科学在生命科学中形成的一个研究领域,通过用计算机科学的知识和相关的算法对生物学领域内的数据进行加工、存储、检索与分析。随着生物数据的快速增长,如何运用高效的算法来处理这些数据,已经得到了越来越多的关注。 本论文进行了生物计算的研究,主要是为了解决非编码核糖核酸(non-coding ribonucleic acid,ncRNA)的预测问题。研究方法采用数据挖掘的理论和技术,目的是为了找出能够区分ncRNA的计算方法,同时编写预测软件供用户使用。 论文的重点是运用数据挖掘方法中的主成分分析和人工神经网络LM(Levenberg-Marquardt)算法实现了ncRNA的预测。首先利用生物学实验数据总结出ncRNA的特征,作为数据挖掘方法的输入;然后在MATLAB环境下用统计工具箱和神经网络工具箱对输入的特征进行主成分分析和神经网络训练,用训练好的网络去预测ncRNA;最后,为了实现通用性,运用MATCOM接口与VC实现Windows下供用户实际使用的预测程序。 研究的难点在于ncRNA特征的提取和选用恰当的数据挖掘方法。论文运用生物学知识提取了相关特征并用于主成分分析和神经网络的训练中。实际的测试结果表明特征的选择比较恰当,训练结果可以用作ncRNA的预测。 论文主要创新点如下:①提出了一种ncRNA预测方法,并且设计出了进行预测的软件;②数据运用人工神经网络快速LM算法训练,使训练和预测结果更为准确;③实现了MATLAB与VC的混合编程,充分利用了两者的优点。
其他文献
当前,手机短信引起社会各界的关注.服务提供商(目前多为短信内容提供商)作为手机短信内容的主要来源,在短信增值业务价值链条中扮演着重要的角色,短信业务的繁荣特别是今后的
针对目前语音通信软件设计中的困难,该文对通信流程形式化逻辑描述方法进行了研究.根据语音通信软件中呼叫控制过程的特点,该文使用状态推导图对通信流程进行建模,并结合人工
本文针对电信业务的需求,在项目组的共同努力下,建立了一个面向IP业务的综合决策支持系统。依据决策支持系统基本原理和数据库数据仓库技术,以及微软的.NET架构,构建了包含四库系
随着Internet日益渗入社会的每个领域,融入人们的工作、学习和生活,构建安全的电子政务、电子商务等Web应用成为当前网络安全领域研究的热点之一,其实现具有重大的实用价值和
普适计算中的上下文感知为用户提供其所在环境的上下文相关信息,其中80%的信息和位置有关,因此定位问题在上下文感知中占据举足轻重的地位。普适计算中设备的许多行为都与其所在
该文从实际出发,提出了一种任意文本的说话人识别的新方法.该方法首先采用小波包分析进行语音信号的消噪处理,然后提取说话人语音信号的静态特征和动态特征,再建立多级小波神
安全模型和安全策略是数据库安全机制实施的基础.在对现有的几种典型的数据库系统安全模型进行了分析和比较的基础上,提出了一个新的基于伪元组的多级安全数据模型.该模型通
分布式对象系统的应用范围已经扩展到Internet之上,企业之间现有的软件构件需要实现相互通信。DCOM和CORBA是两种最常用的分布式对象系统,它们在局域网内工作良好,当扩展到In
云计算是一种新兴的并行计算技术,在学术界和商业界都取得了巨大的发展,已有大量的云计算系统被投入使用。现有的Hadoop平台在异构环境下的调度效率低下,任务响应时间长,浪费
PKI作为解决网络环境中安全问题的一项优秀技术,在过去十多年间得到了迅速的发展以及广泛的关注。但由于涉及安全和网络等众多领域、系统结构复杂、难于实现和使用,导致其进