通过序列信息预测RNA的柔性

来源 :南开大学 | 被引量 : 0次 | 上传用户:maowangaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多生物进程中结构柔性发挥了非常重要的作用,它对于蛋白质的催化和变构,RNA催化剂的二级结构形成和折叠以及蛋白质-RNA识别都是必不可少的。B因子可以衡量蛋白质结构或者RNA结构的柔性,预测B因子可以帮助人们理解生物分子的结构和功能。B因子被普遍应用于蛋白质无序区域,蛋白质折叠率,蛋白质活性位点以及蛋白质热稳定性的分析。测定B因子的实验方法需要消耗高昂的时间成本,因此设计预测B因子的算法是一个具有挑战性并且有重要意义的课题。目前已经有很多算法被设计出来预测蛋白质的B因子,但是只有很少的关于RNA的B因子的研究,在本文的方法之前只有两个研究工作。本文基于随机森林算法提出一个新的预测RNA的B因子的方法RNAbval,该方法从给出的RNA序列出发,充分提取RNA的特征集,包括序列的one hot向量表示,序列进化保守性,预测的RNA溶剂可及面积以及预测的RNA二级结构。RNAbval在五折交叉检验上达到皮尔森相关系数0.5904,在第一个独立测试集上皮尔森相关系数为0.6061。与现有的方法RNAflex比较,RNAbval在两个独立测试集上取得了 9.2%~20.5%的突破,说明了本文提出的的方法的优越性。最后,我们搭建了 RNAbval的网页服务器,方便更多人使用。用户只需要输入RNA序列,就可以得到每个碱基的预测的B因子值。服务器的地址为:http://yanglab.nankai.edu.cn/RNAbval/。
其他文献
资产证券化作为20世纪60年代末的金融创新工具,最早起源于美国,目前已成为欧美国家和地区最重要的融资工具之一。中国早在2005年试点资产证券化工作,其间受金融危机的影响一
近年来,为了通过加快发展都市近郊的乡村旅游项目来提高农村发展水平,各种农业和旅游业融合发展的活动相继展开,但这些项目在发展过程中出现了同质化的现象,千篇一律,缺乏吸
目前基于有监督方法的命名实体识别技术都需要大规模的标注语料。然而在很多新领域中命名实体定义模糊,标注语料匮乏,而且构建高质量的人工标注数据费时费力。本文任务是中文
中国的邮递系统源远流长,当周之时,即有官邮,号为“邮置”,步传、马传递送简书。此后历代封建王朝为加强统治起见,对于邮驿通信都十分重视。在明清时期还出现了专门服务于民
进入到二十一世纪以来,在社会主义市场经济体制日益完善的今天,会计师事务所对企业出具的审计报告所传递出来的信息越来越能影响到投资者的投资决策。因此,市场监管部门也在
我国农产品电子商务经过二十多年的成长,已形成了多层次、体系化的农产品交易网络体系。十八大以来,党中央、国务院和地方政府出台一系列政策文件,对我国农村和农产品电子商
关联交易作为一种经济行为,本身具有中立性质。但是由于关联方的存在,再加上我国经济法律允许交易双方对自身关联交易定价,关联交易可能被上市公司高管滥用。同时,上市公司中
事件抽取任务旨在从给定的自然语言文本中抽取出指定类型的事件信息,并形成结构化表达,有助于自动文摘、自然语言生成等任务。由于在复杂的自然文本中获取事件语义信息困难,事件抽取是一个具有挑战的任务。本文主要从表示学习层面对事件抽取任务展开深入研究,主要研究内容包括以下三个方面:(1)目前,大多数事件触发词抽取方法专注于捕获序列中的长距离和局部信息,忽略了论元对触发词抽取的影响。针对这个问题,本文提出了一
价格发现是指市场吸收、处理新信息并将其反映到价格之上的过程。而衍生品市场的成立,为商品与货币这两种资本形式的跨时空价值换算提供了可能。以期权为代表的衍生品所具有
聚电解质是指主链或侧链带有可电离基团的高聚物,具有亲水性、荷电性等特性。将合适的阴、阳离子聚电解质组装成复合聚电解质(polyelectrolyte complex,PEC),可以有效调控材料的阻燃性能,在阻燃领域显示出巨大的潜力。本论文以纳米晶纤维素(nanocrystalline cellulose,NCC)及聚磷酸铵(ammonium polyphosphate,APP)掺杂的纳米复合物为阴