生物序列的语义分析——算法与词典

来源 :南开大学 | 被引量 : 0次 | 上传用户:kxf2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生命离不开蛋白质,而所有蛋白质都足有一系列氨基酸按一定生物规则排列而成,(最常见的氨基酸种类有20种).若把这些氨基酸认为是组成蛋白质的不可分割的基本单元,那么,每一个蛋白质就成为由氨基酸(用符号表示)排列的一级序列.同时,这些生物序列也就成为生物学的语言文字,该文通过对这些语言文字的语义分析(包括词法与语法分析),得到许多有用而重要的结论.作者主要以参考文献[1]与[2]为基础,从蛋白质一级结构数据库的"信息,统计分析"和"组合分析"两个不同的方面入手,利用广泛的数学工具讨论蛋白质的词法规则和语义结构.并对swiss-prot这样的大型数据库,分别给出局部词语、核心词的有效可行算法并将其在计算机上实现.最后对计算结果《蛋白质局部-核心词词典》,进行一系列分析,并探讨它们在蛋白质演变与蛋白质工程中可能产生的应用.
其他文献
该文主要是研究三次Hamilton系统的全局拓扑结构.在文献[37]中,Llibre主要研究了二次Hamilton系统的拓扑结构,得到了29种全局拓扑相图.该文根据[19]中Llibre代数分类的思想,
在时间连续的市场模型中考虑交易费,这在金融理论和实践上都是非常重要的.该文主要研究在时间连续的市场模型中,有交易费的美式未定权益的套期保值问题.我们以鞅方法和Doob-M
令X表示特征为2的有限域F上全体n元二次型的集合,我们在X上定义图Г,它以X作为顶点集,两个顶点x和y相邻当且仅当x-y的型为i.该文应用矩阵方法,通过计算参数,讨论了图Г的一些
给出了domain上测度的一个内在刻划定理,讨论了测度上的算子,研究了子domain.此外,还引入了全有界测度的概念,讨论了Lebesgue测度与全有界测度之间的关系,同时还研究了测度的
该文主要由两部分组成:奇异线性系统的条件数与结构化矩阵Drazin逆的一些相关问题.对于奇异线性系统,我们考察了最小P-范数意义下解的扰动问题,并且给出了条件数的表达式.对
这篇论文一方面深入地研究了一类反应扩散问题的整体吸引子A和相应均匀化方程的整体吸引子A,并给出了A和A的距离估计,另一方面研究了一类退化的抛物问题的整体吸引子A和相应
在文章[3]中,Bismut对联系着非零扰率联络的Dirac算子给出了局部指标定理.在文章[9]中,张伟平通过一个新的技巧也得到了这个结果.对于Lefschetz不动点公式,Lafferty、虞言林
自动机序列,是一种介于周期序列与随机序列之间,且可以由一个有限状态的机器生成的序列.对于一个周期序列来讲,它的规律性太强,且结构过于简单,而随机序列又过于复杂,研究起