基于RNA-Seq数据的基因预测和长非编码DNA鉴定的分析方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:lyqhaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术的快速发展,一种新的方法——RNA-Seq技术被广泛应用于生命科学研究。它主要是针对转录组进行定位定量分析,与之前的测序方法相比,可鉴定出更多的新基因和新长非编码RNA,且预测效率明显提高。在使用RNA-Seq数据之前,需要运用FASTX-Toolkit和Trim Galore!等质控软件对RNA-Seq初始数据进行质量检测,以提高RNA-Seq数据基因预测和长非编码RNA鉴定方法的准确性。然后,使用Tophat软件将RNA-Seq读段定位到参考基因组。基因预测是基因组注释的重要组成部分。我们以玉米和大鼠为研究对象,设计了一个四步预测分析模型。首先,通过整合EST和RNA-Seq信息来提高基因预测的准确度。然后,利用软件AUGUSTUS预测编码蛋白质的基因,并用liftOver或者Blast软(?)将它们与近源物种的同源基因相比较,过滤掉冗余的基因。最后在玉米和大鼠组织中分别注释出202,048个和32,197个转录子,其中新基因分别为165,820个和4,802个。通过分析基因在不同组织中的表达水平,新预测方法可检测到更多低表达量的基因。长非编码RNA是生命进程调控的另一焦点。我们使用Cufflinks软件将RNA-Seq片段组装成转录子,再根据长非编码RNA的结构、功能和位置特点,使用PhyloCSF和Blast软件,辅以近缘物种的注释基因,鉴定出大量的新长非编码RNA。最后,在大鼠组织和人肺组织中分别筛选出2,761个和40,626个长非编码RNA,并分析长非编码RNA在不同组织中的分布情况和表达水平.新方法可完善现有的长非编码RNA数据库。以上研究为生物学家利用基因和长非编码RNA研究复杂疾病或性状的遗传机制提供了有效的分析方法。
其他文献
<正>2009年3月1日,在"全民健康生活方式行动"康亦健集团启动仪上,中国保健协会理事长张凤楼对健康坊给予很高的期望,他希望健康坊成为健康领域的国际名牌。
会议
<正> 笔者应用民间验方胡椒粉饼敷脐治疗婴幼儿腹泻(单纯性消化不良)56人,疗效显著,且安全可靠.用药:胡椒粉(黑白均可)一克,大米饭饼一个. 用法:取刚蒸熟的大米饭约半两左右,
提出利用金融创新促进广东海洋高新技术产业发展的研究构想,并就研究意义与国内外研究现状进行分析与述评;接着就研究的基本思路、主要观点、目标以及拟解决的关键问题、拟采
目的分析肾囊肿介入硬化治疗的临床应用。方法选择2014年2月~2017年2月于我院就诊的单发肾囊肿患者,共30例,均给予经皮穿刺硬化治疗,现按照入院编号进行随机分组,对照组给予
随着社会经济的高速发展和科学技术的日益成熟,大量高科技手段逐渐应用在传统变电站中,其中无人值守变电站在一定程度上便是最直接的结果。无人值守变电站的应用,有助于信息
以舞台技术对舞台艺术的影响为背景,探讨旅游(主题)剧场中的舞台技术与艺术融合的现状和未来趋势。
<正>放养鸡就是把鸡放在自然的生态环境里饲养。目前,放养鸡的鸡蛋和肉品已经受到很多人追宠,但从事放养鸡惨遭失败的例子并不少见,原因主要是没有做到科学饲养。为此,本人总
随着电力企业的发展,同时在电力自动化及电力通信技术的支撑下,变电站逐步实现了无人值守的运行模式,并且电压等级由35kV低电压等级向500kV及以上的高电压等级推进,既解决了
目的:比较分析在腹腔镜去顶减压治疗单纯性肾囊肿手术过程中,联合应用囊腔酒精硬化,对减少术后囊壁渗出,降低复发率的影响。方法:选取2013年1月~2016年1月在我院行手术治疗的