miRNA-靶位点配对的序列特征研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:a3470114
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对miRNA-靶位点配对的序列特征做研究,主要目的在于丰富miRNA的靶标识别方法,提升靶标识别水平,助力研究人员深入了解miRNA的调控机制和在各种活动中行使的功能,发现miRNA与其他基因、蛋白质、疾病间的联系。miRNA调控是基因表达调控的重要方式之一。基因调控是指基因的表达随着组织细胞及个体发育的阶段以及内外环境变化的不同,而表现为不同的表达模式。它是生物体内细胞分化、形态发生和个体发育的分子基础。miRNA作为影响基因表达调控的重要因素,是一种长度约为22个核苷酸的非编码小RNA分子,它广泛存在于动植物和病毒的体内,它们可以使mRNA裂解或者阻碍其翻译,积极地发挥着调节基因表达的作用。本文靶位点配对的序列特征研究的主要思路为:1)在miRNA研究的最重要数据集CLASH上提取miRNA和其配对的靶位点信息构造实验样本,通过将miRNA-靶位点配对序列二进制化并做序列化分析,根据分析结果建立并提出了多个miRNA-靶位点配对的全部和局部序列得分特征;2)根据前人所提出和认可的相关特征,引入了多个miRNA和靶位点结合的生物学和序列特征,如最小自由能、靶位点的可接入性、序列保守性等,构造整个数据集合,使用mRmR算法选出了最优的特征子集,并使用随机森林建模,通过大量的参数训练选择最优的实验参数;3)使用不同的负样本,对模型进行了大量重复训练,采用交叉验证的方式计算模型的性能,对此模型的鲁棒性进行评估与定性。并与其它多个采用同样数据集的模型进行了性能比对,以验证新提出的特征的有效性。基于生物大数据,采用机器学习的方法研究miRNA靶标识别是近年来的热点。但基于miRNA与其靶基因的作用机制十分复杂,难以提出更加合理的特征,同时样本的不确定性也阻碍了研究人员的进一步研究。而本文的实验结果则表明,论文所提出的方法构建的模型更加优于传统的方法,模型的各项指标都有大幅增长,其ROC和PRC更是超过了0.95,模型经过大量重复的实验,各项指标均无较大波动,体现了模型优秀的性能和强健的鲁棒性。相比于传统方法提出的特征,本方法增加了miRNA序列匹配的全局和局部打分,对miRNA靶标识别做了更加全面的考量,弥补了传统方法的不足。同时本文实验结果也表明,本方法提出的理论正确,可执行性和拓展性强,对于新增的特征更可以提供具体序列功能性的解释,这有利于我们进一步的研究,从而推动miRNA靶标的识别研究,助力交叉学科发展。
其他文献
偏振复用相干光正交频分复用(PDM CO-OFDM)技术作为通信领域近年来的研究热点,结合了偏振复用、相干检测以及OFDM的长处,具有信道容量大、传输距离长、传输速率快、色散(CD)及偏
输油管道的安全运行是保障我国国民经济健康平稳发展的重要因素。近年来,国内屡屡发生的输油管道泄漏事故,给我国人民带来了巨大的生命和财产损失。如果处理不当还可能给周边
近年来伴随着人们生活水平的提高,人们对室内环境的要求也逐步上升,室内空气品质的优劣对人体健康和工作效率有着重要的影响,装修过程中使用的板材、油漆等合成材料散发的大量挥发性有机物(Volatile organic compounds,简称VOC),是造成室内空气品质低劣的主要原因之一。研究VOC释放特性对改善室内空气品质有重要意义。本文采用有3m3直流环境舱进行散发关键参数的实验,获得VOC浓度数据
新场构造带位于川西坳陷孝泉-丰谷构造带西侧,自晚三叠世以来受龙门山构造带崛起及多期构造调整的影响,形成了多套生储盖组合和多套含气层系,表现出巨大的勘探潜能。本文以新
铁路是我国货运系统的重要组成,机车运行安全是铁路运输的主要研究课题之一。内燃机车载重量大,一旦发生安全事故将造成巨大的损失。排障器作为机车被动防护系统的重要组成部分,可以有效保障机车的运行安全,但现有的排障器研究大多基于性能,较少涉及其整体结构优化,肋板布置也大多基于经验设计,材料的性能未充分利用。为解决以上问题,本文以某内燃机车为研究对象,基于我国TJ/JW 102-2017标准对内燃机车进行耐
基因编码终止突变直接影响基因功能和表型,改变个体的适应度,在长期的适应性进化过程中受到环境的选择。作为疾病基因组研究寻找有害突变的补充,本研究期望通过数据分析挖掘
十九大报告指出,要加快建立多主体供给、多渠道保障、租购并举的住房制度,让全体人民住有所居。为了缓解住房市场供需矛盾,有效解决中低收入家庭安居问题,全面实现“住有所居
纳米硫化锑(Sb2S3)既是一种能有效降解海洋有机污染物的优秀光催化剂,又是海上平台中太阳能光电转化系统中的重要材料,对海洋资源开发的意义重大。然而,因为商业试剂较为昂贵
本论文以7XXX系铝合金为研究对象,通过合理调配主合金元素及复合添加微量Er等元素,设计并调配一种加工性能和耐腐蚀性能优异的中强7E19合金,一方面通过高温拉伸实验、热压缩实验、硬度、电导率、拉伸性能、剥落腐蚀性能测试获得7E19综合性能以及变化规律,另一方面通过EBSD、XRD、SEM及TEM等组织与成分表征手段对其微观组织进行分析,对7E19合金高温热变形行为与热处理工艺下组织模式与性能的变化
增量配电业务改革是新一轮电力体制改革的重要任务之一。在配电侧市场逐步放开背景下,投资者需要对增量配电网的投资收益进行测算,并在投资前明确投资收益的分配方法,政府机构则需要制定增量配电业务的监管机制。目前针对增量配电网的研究多数停留在政策、定义的探讨,而分析增量配电网的投资收益、收益分配、监管机制的研究成果较少。本文围绕增量配电网投资收益仿真、增量配电网收益分配及增量配电网投资-运营监管机制进行了一