DNA序列及蛋白质序列的分析与比较

来源 :大连理工大学 | 被引量 : 18次 | 上传用户:nanpingke11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA、RNA和蛋白质都是由较小的单元组成的无分枝的线性聚合体大分子。对于DNA,这些单元是A(腺嘌呤)、C(胞嘧啶)、G(鸟嘌呤)和T(胸腺嘧啶)这4种核苷酸残基;对于RNA,这些单元是A、C、G和U(尿嘧啶)这4种核苷酸残基;对于蛋白质这些单元是20种氨基酸残基,即A(丙氨酸)、C(半胱氨酸)、D(天冬氨酸)、E(谷氨酸)、F(苯丙氨酸)、G(甘氨酸)、H(组氨酸)、I(异亮氨酸)、K(赖氨酸)、L(亮氨酸)、M(甲硫氨酸)、N(天冬酰氨酸)、P(脯氨酸)、Q(谷氨酰胺酸)、R(精氨酸)、S(丝氨酸)、T(苏氨酸)、V(缬氨酸)、W(色氨酸)和Y(酪氨酸)。这样,一个DNA(RNA)序列可以看作是在一个有四个字母的字母表N={A,C,G,T(U)}上的字(word),同样,蛋白质也可以看作是一个在20个字母上的字。在相当大的程度上,DNA、RNA和蛋白质分子的化学性质编码在这些基本单元的线性序列中。因此,字上的组合学和统计学的工具和方法可以在研究生物分子单元线性序列上发挥很大的作用。 本文的主要工作包括以下几个方面: 在第一章,利用代数中同态的思想和物理学中的“粗粒化”思想,根据DNA序列中四种核苷酸A、G、C和T的化学结构分类,提出DNA序列的特征序列的概念。一个DNA序列的特征序列是一组(0,1)序列,它们中的每一个都是这个DNA序列的一个简约表示,而且用它们中的任意两个都可以重新构造出这个序列;然后,利用特征序列中所有(0,1)三元组出现的总数构造了一组2×2矩阵来表示序列。进一步,我们计算这种压缩矩阵的最大特征值并把它作为DNA序列的一种不变量。基于这些DNA序列的不变量我们分析了human,goat,gallus,opossum,lemur,mouse,rabbit,rat等八个物种的球蛋白(globin)基因序列的第一个外显子序列的相似性和非相似性;另外,我们试图通过比较特征序列来找出嘌呤-嘧啶,酮基-氨基,弱氢键-强氢键分类可能显现出的生物功能。 第二章研究DNA序列的特征序列在基因识别算法中的应用。首先,我们给出DNA序列的特征序列的一种数值刻划,利用这种数值刻划给出一个基因识别算法,并将这种算法用在模式生物酿酒酵母菌基因组的分类数据库中,准确性超过95%。反过来将算法应用到酿酒酵母菌基因组中进行基因识别,得到了一个酿酒酵母菌基因组中基因总数的估计5897,与普遍接受的酿酒酵母菌基因组中基因数目5800-6000相符。 在第三章,我们将DNA序列的特征序列推广到蛋白质序列中。根据20种氨基酸的物理化学性质,给出一种蛋白质序列的特征序列的概念来表示氨基酸的疏水性质和电价性质,并给出蛋白质序列的特征序列一种数值刻划。然后,通过比较这些特征序列的数值刻划得到一些蛋白质二级结构类全α螺旋,全β折叠,和αβ类蛋白质的一些关于疏水性质和电价性质的信息。 在最后一章,我们利用代数的方法分析DNA序列和它们的三维图表示。首先,我们给出DNA序列的三维图表示(DNA曲线)的一些代数的运算,并用对称群凡作用到DNA曲线上,从而得到DNA曲线的一些性质.其次,对于DNA曲线,我们定义了两种等价关系,并得到一些与这两种等价关系相关的计数公式.在这一章的最后我们证明一个与等价类的嫡有关的不等式.
其他文献
<正> 跆拳道是发源于朝鲜半岛的武道运动,从走上竞技体育舞台开始,就十分注重按照竞技体育特点对自身加以不断改进和完善。竞赛规则的合理改进是竞技体育项目完善的特征之一
会议
地裂缝是指地下岩土层在内外应力的作用下发生变形,当外力超过岩石的内部结合力时发生破碎,形成裂隙。又再在围岩压力下,向上部沿自由地表发生开裂,表现为裂缝。这一常见地质灾害具有隐蔽性强、发育广泛、尺度不一、勘查难度大等特点,在雨水天气下可诱发造成滑坡、泥石流等严重灾害,危及建筑基础设施和公众人群安全。因此,开展地裂缝探测,查明现有城市地裂缝的成因、形态特征等具有重要意义。到目前为止,前人已经通过InS
现代中国已经迎来了消费社会,在大众传媒的推波助澜下,人们逐渐从改革开放前的禁欲主义中解脱出来,对于物质文化消费有着极高的欲望。特别是互联网时代,媒介技术的发展使得大
模板是建筑行业的基础部件之一,传统木模板的大量使用带来了严峻的环保问题。LFT-D热塑性复合材料模板,因其质量轻、强度高、可再生利用等特点,成为了建筑模板领域以塑代木的前沿方向。LFT-D复材模板的制造,主要通过在树脂基体中添加一定比例的增强纤维进行混合,并在模具中热压固化成型;模压过程中的成型工艺参数,尤其是模具温度均匀性,很大程度上决定了复材制品最终的品质。本文基于LFT-D复合材料的制造工艺
目前,中国蛋鸡产业已经进入加速转型升级的关键期。对国际蛋鸡产业发展现状、趋势以及中国蛋鸡产业发展成就及展望的系统总结,有助于协调破解中国蛋鸡产业发展存在的难题。研
目的:分别将VAN、VAD儿童粪便移植入无菌小鼠体内,探索不同VA营养水平肠道菌群对无菌鼠肠道粘膜屏障功能的影响。方法:收集重庆渝中区幼儿园血清视黄醇水平≥1.05mmol/L(VA充足)或<0.70mmol/L(VA缺乏)的健康儿童粪便,分别移植给四周龄Balb/c无菌小鼠后,构建VAN优势菌群作用小鼠组(VAN-FMT)及VAD优势菌群作用小鼠组(VAD-FMT)。28天后,HE染色观察
胶质瘤作为最常见的颅内原发性肿瘤,具有复发率高、预后差等特点。胶质瘤免疫逃逸主要由于缺少树突状细胞的抗原提呈功能,肿瘤细胞免疫原性弱以及抑制性免疫细胞的积累等原因
改革开放后,我国生产力水平得到较快提高,经济发展水平以年平均约9.63%的速度增长,在全球经济体中居世界第二的水平。在社会生活方面,人民的生活水平与生活质量总体上得到了
以十二烷基硫酸钠为发泡剂,海藻酸钠为稳定剂和增稠剂,天然茜草和姜黄染料复配后,采用泡沫法对羊毛织物进行染色。讨论了两种染料的配比及媒染剂对染色羊毛织物染色性能的影
随着虚假信息的泛滥,会计失真现象较为严重,制定合适的会计信息质量特征体系是如今众多学者关注的焦点。影响会计信息质量的因素有许多,其中内部控制与会计信息质量紧密相连。本