多肽结构与保留时间关系的研究

来源 :同济大学 | 被引量 : 0次 | 上传用户:chenfenglianxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着仪器和分析技术快速发展,蛋白质组学有了新的进展,并成为最重要的生命科学领域之一,其实验数据庞大,要求高通量计算来提高多肽鉴定得分,从而提高蛋白鉴定准确度。而液相色谱中多肽的保留时间信息始终没有得到很好的利用,保留时间是色谱分析中重要的参数,如果能够更好地利用此参数可以提高多肽鉴定质量,从而提高蛋白质的鉴定可靠性。本文试图利用这些信息抓住多肽保留行为的特点,运用化学计量学,化学信息学中常用的方法PLS,KPLS,SVR等建立多肽保留时间的QSAR模型,提高多肽鉴定质量,从而提高蛋白质鉴定的数量和质量。 本文研究的对象多肽与其他化合物不同,多肽是由20种氨基酸组成,反映它们结构的数据目前并没有直接显示,许多学者都是假设多肽的各种物化性质是通过组成它们的氨基酸的性质加和来反映的。本文以文献中搜集到的3个数据集为研究对象逐级深入地研究多肽结构和保留时间的关系,并提出了变量优化的方法和新的局部变量,创造性地以局部变量结合全局变量建立QSAR模型,为QSAR的研究开辟了新的研究方向,并建立了共识模型,得到0.96以上的相关性系数,远远高于文献值。 具体研究步骤如下:首先大规模的搜集20种氨基酸的物化性质,以及多肽研究中新产生的各种组合变量。以数据集1——复旦大学张祥民实验室所得136个多肽为研究对象,通过变量筛选后运用PLS,KPLS,SVR对其建模预报。同时因为单个氨基酸的保留时间来自文献,与136个多肽的保留时间的实验条件不同,所以剔除了这个变量再次建模预报,并运用共识模型预报所得的相关性系数达到0.83优于文献值0.81。但这个结果远远没有达到本文的要求,故希望寻找新的更多的多肽数据集,寻找潜在的新的变量,特别是尝试局部变量在多肽结构与保留时间关系中的应用。 接着以数据集2——346个多肽为研究对象,提出了与位置有关的变量和与性质强度有关的变量,利用PLS,KPLS,SVR,共识模型等方法建模预报,所得相关性系数0.96以上由于文献所得的0.92。 最后以数据集3——834个多肽为验证对象,用同样的方法,同样的变量,建模预报,所得相关性系数达到0.97,远远高于文献的0.93。并得出结论:局部变量和全局变量相结合的方法有效的反映了多肽结构和保留时间的关系,为多肽鉴定和蛋白质鉴定奠定基础。
其他文献
“网络语言暴力泛滥”这种误解的产生表明,互联网并不像人们所认知的那样是个缺乏管束、语言暴力泛滥的世界。虽然互联网的特性(如匿名性)会对传播内容造成一定的影响,但它可
鲁米诺,俗称发光氨,是一个经典的化学试剂,在化学发光分析、生物发光分析和免疫组化等领域应用广泛。鲁米诺的荧光和化学发光强度较高,但稳定性低,化学发光持续时间短。芳基咪唑类化合物具有独特的物理与化学性能,可作为增强剂改善鲁米诺化学发光的稳定性和延长化学发光持续时间。芳基咪唑类增强剂的合成条件苛刻,分离纯化难,收率较低,目前主要依赖进口,价格昂贵。因此,寻找性能优良的鲁米诺衍生物以及芳基咪唑类增强剂的
学位
有机-金属配合物以其丰富多彩的结构和在光、电、磁、吸附分离等性能方面的潜在应用成为当今配位化学及材料科学领域的研究热点之一。通过合理的配体设计、金属离子及反应条
随着媒体微博的逐渐兴起,它以传统媒体的新形态在公共事件中开始发挥着议程设置和舆论引导功能。本文以“4·15”幼童香港小便事件为例,通过该公共事件的微博传播过程,分析媒
树形聚合物凭借其独有的拓扑结构形式,使其拥有了独特的性质,这使其在许多领域有着潜在应用。树形聚合物重要的两个分支,树枝状聚合物和超支化聚合物受到了学者们广泛地关注