基于Tiling Array的拟南芥基因结构分析

来源 :厦门大学 | 被引量 : 2次 | 上传用户:tianzhihen1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文是和美国迈阿密大学植物科学系Dr.Q.Quinn Li合作,基于该课题组提供的植物拟南芥不同的细胞类型下的野生,突变,互补,DNA四种类型的转录样本数据以及对其转录结构的研究成果,借助基因相关软件、应用计算机和数学算法对基因组再注释进行研究。在对寻找新基因算法、预测蛋白质结构与功能的算法以及数据的可视化分析和研究领域中,从大量的、不完全的、有噪声的、模糊的、随机的数据中提取有用信息和知识,找到基因组序列中代表蛋白质和RNA基因的编码区,同时阐明基因中大量存在的非编码区的信息实质,一直是一个饶有趣味并富有挑战性的课题。随着生物学与生物信息学的发展,基因片段分割作为基因结构分析重要的前期工作也越来越受到更多人的关注,对基因片段分割的精确性以及有效性提出了更高的要求。而通过比较已知全基因组注释文件判断基因编码的起止位置,以及内含子和外显子的分割边界,通过数据可视化效果来验证基因片段分割的精确性以及有效性,这在基因功能和转录本分析中有重要的应用意义。但由于生物芯片本身存在的缺陷和噪声干扰以及真核细胞基因结构表现出分散性、多样性以及复杂性的特点,所以对基因结构分析中未知元素造成的误差以及选择一个最佳的停止标准认识十分有限,以及存在序列分割或比对过程中耗损的时间过长、效率不够等问题。至今还没有看到利用Tiling Array芯片杂交反应后的数据分析拟南芥基因结构的正式文献报道。 本论文通过各种生物信息处理软件和数学算法,探索拟南芥基因结构分析的有效方法和数据可视化实现。本文首先结合Partek软件实现DNA Reference算法,对庞大的探针数据集进行预处理,使得目标序列不依赖反应寡核苷酸探针的亲合度,以实现不同的探针之间信号的定量可比性,然后针对本文的实际情况对探针数据进行精简,采用动态规划思想构建SCM模型对数据进行分割,使用大量的统计方法分析数据,估计模型中状态参数,并得到各个分割点,将探针强度,注释信息,分段信息存入MySQL数据库,提供自行设计ProbeViewer软件,展示分割效果,辅助生物学家直观分析基因结构。
其他文献
数控技术是伴随着电子计算机的发展而发展起来的一种自动控制技术,是计算机技术与传统机械学相结合并以机械学、电子学、计算机科学、控制科学四大学科为基础的综合性应用科学
随着经济建设的发展,行车的使用日益广泛,在给人们工业起重上带来便利的同时其危害也越来越明显,其中较为突出的是行车碰撞事故。因此,如何让生产工作中行车更安全高效的运行
随着“和谐型”机车运输发展,我国机车检修管理办法逐渐向实时在线迈进,传统的已不能适应新要求,同时一套科学的检修管理系统更加被企业迫切需要。在机检修人员数量不足的情
目前U盾所采用的是传统的密码验证方式,具有易失性和易忘性的缺陷,导致在安全性及便捷性方面存在着一定的不足。针对这种情况,本文设计了一种以指纹图像为支付密码的U盾,有效
在当前的电子信息技术和网络技术高速发展的后PC时代,嵌入式系统已经广泛地渗透到科学研究、工程设计、军事技术、商业文化艺术、娱乐业以及人们日常生活中的方方面面。与此
人体行为识别应用技术是机器视觉中一个重要的领域,具有极大的挑战性和吸引力,应用领域主要集中在智能安防监控(如医院、交通、家庭、学校、军事训练场、运动场等),人机交互,
Internet上数据的大量增加导致了“信息过载”和“信息迷向”问题,而个性化服务技术正好可以在一定程度上解决这些问题,缓解Internet中信息的多样化与用户需求的专一化之间的矛
模型预测控制(MPC)是当今石油、化工等工业中应用最为成功的先进控制技术之一。它是用动态模型对未知系统的未来行为进行预测,根据该模型对系统进行优化控制的一类控制策略。
随着计算机网络的普及,网络在人们工作和生活中越来越重要,网络安全成为了网络进一步发展的关键问题。相对于传统的被动防御手段,Honeypot是一种新颖的主动防御机制,它的价值
仿真转台是惯性导航系统中的关键测试设备,用来真实复现测试设备的运动情况,它的性能优劣直接关系到仿真和测试实验的可靠性和置信度,是保证航空、航天和航海产品武器精度的