人类细胞外基质蛋白质预测工具和参考数据库的研发与应用

来源 :军事科学院 | 被引量 : 0次 | 上传用户:abcoabco1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细胞外基质(extracellular matrix,ECM)蛋白质是细胞微环境的重要组成部分,它不仅可以通过与其他蛋白质的相互作用为细胞提供机械结构支持,还可以通过信号传导对细胞功能进行调节。ECM蛋白质的结构和功能失调会导致成骨不全、软骨发育异常、马凡综合征、纤维化和癌症等严重的疾病,为了更好地研究这些疾病的发病机制并发掘潜在的诊断及治疗靶点,有必要对ECM蛋白质的组成和功能进行更加深入的研究。蛋白质组学方法不仅可以通量鉴定分泌到胞外的ECM蛋白质,还可以对ECM蛋白质的共价交联和修饰进行分析,因此是研究ECM蛋白质的有力工具。与此同时,构建ECM蛋白质预测工具和参考数据库是进行ECM蛋白质组研究的必要条件。目前ECM蛋白质预测工具和参考数据库的研发相互独立,并且它们各自存在一些不足。ECM蛋白质预测工具最大的缺点是与实验生物学特征缺乏联系,特别是在金标准数据集构建和分类特征提取方面;此外,现有预测工具均不可用也是较大的问题。ECM蛋白质参考数据库存在的问题为:ECM参考数据库与实验数据集重叠率较低;另外,现有ECM参考数据库是通过半经验和人工注释的方式构建的,所以在数据库更新和跨物种扩展等方面均存在一些问题。针对以上问题,本文结合现有ECM蛋白质预测工具和参考数据库各自的优势,研发了一个灵活和可扩展的人类ECM蛋白质预测工具——ECMPride。通过将ECMPride应用于全体人类蛋白质,我们建立了人类ECM蛋白质参考数据库ECMPride DB,并开发了应用网站ECMPride DB-web。本文主要分为4个部分,具体内容如下:(1)现有ECM蛋白质预测工具的研发基本都遵循一个通用的方法流程,包括:金标准数据集构建、特征提取、特征选择、模型构建和评估几个主要步骤。根据这一流程,我们首先调研分析了已有ECM蛋白质预测工具构建的有益经验和待解决问题。此外,我们总结了ECM蛋白质预测工具构建的原理,并针对每个待解决问题提出了对应的解决方案。最后,我们分析了这些工具的可复现性,并使用R语言对主流预测工具之一Ecm Pred进行了复现。(2)基于对已有ECM蛋白质预测工具的调研结果,我们构建了一个灵活和可扩展的人类ECM蛋白质预测工具——ECMPride。ECMPride的优点包括:金标准数据集更可信、提取的特征与生物实验相关、预测模型更加稳健等。ECMPride可以免费下载使用,是目前唯一可用的ECM蛋白质预测工具,它具有很好的敏感度和均衡准确率,比Ecm Pred实现了更好的预测性能。(3)将研发的ECMPride应用于全体人类蛋白质,构建了人类ECM蛋白质参考数据库——ECMPride DB,并对其进行注释。和现有ECM蛋白质参考数据库Matrisome进行比较,ECMPride DB不仅涵盖了Matrisome中绝大部分已知ECM,还提供了大量潜在新ECM候选蛋白。进一步将ECMPride DB上线做成参考数据库网站——ECMPride DB-web,ECMPride DB-web支持单独搜索、批量搜索和单独下载、批量下载,将为ECM蛋白质组的研究做出贡献。(4)应用ECMPride DB参考数据库对ECM蛋白质组实验数据进行验证分析。首先通过Max Quant对实验数据进行搜库鉴定,得到了鉴定蛋白质列表。之后应用ECMPride DB与鉴定蛋白质列表进行匹配,以发现新的ECM组分。最后通过DAVID进行功能注释、通过STRING进行相互作用分析、通过免疫组织化学和免疫荧光进行生物学验证,对新ECM进行了验证分析。综上,本文系统开展了人类ECM蛋白质预测算法、工具和参考数据库的研发和应用研究。自主研发的ECMPride软件是一种用于预测ECM蛋白质的灵活和可扩展的工具,它在预测ECM蛋白质方面表现优异,具有较好的均衡准确率和敏感度,并且弥补了现阶段无可用的人类ECM蛋白质预测工具的空白。基于ECMPride构建的ECMPride DB参考数据库及其应用网站ECMPride DB-web提供了具有较高可信度的人类ECM蛋白质列表及丰富的生物学注释。这个参考数据库涵盖了Matrisome数据库中的大多数已知ECM,并且当时用这个参考数据库注释实验蛋白质组数据集时,可以识别出更多潜在的ECM蛋白质。总而言之,ECMPride、ECMPride DB和ECMPride DB-web可以作为有价值的工具和资源而对未来的ECM相关研究产生帮助。
其他文献
在能源的可持续发展背景下,氢能作为一种清洁可再生的能源载体,被认为是未来能源供应的潜在替代方案,并越来越受到大家的关注。水电解作为一种从水中产生氢气的方法,环保并且
水汽观测资料对于提高数值预报的预报性能具有重要的作用。全球定位系统(GPS,Global Positioning System)的对流层信号总延迟(ZTD)能反映大气水汽含量,这对水汽观测具有重要
热带气旋强度预报一直是预报中的难点之一,尤其快速增强的预报是巨大的挑战。不断加深快速增强热带气旋内核结构变化的理解对提升热带气旋强度的预报和防灾减灾十分必要。本
关于人物纪录片的拍摄就是将所拍摄的人物通过影像的方式真实得记录下来,将生活还原于真实,客观的表现生活中人物的生存状态,表达的是作为一个独特个体的具有某方面研究价值
山柑属植物具有多种生物活性成分,本实验以新疆特色植物爪瓣山柑为原料,采用响应面法对超声波辅助提取爪瓣山柑多糖工艺进行优化,通过超滤和反复冻融的方法对其进行纯化,然后
幌骗交易或称虚假申报,是以大量、反复的申报和撤单制造市场供求假象,继而干预市场行情机制形成的违法犯罪行为。幌骗交易多发于程序化交易及高频交易环境下,其危害性和多发性在现代资本市场中日益凸显,有必要探索幌骗犯罪的刑事规制路径。资本市场较为发达各国家和地区,分别以其抽象性的反操纵条款或专门的反幌骗条款开展对幌骗犯罪的制裁,其中美国兼具上述两种模式,并形成世界上第一起幌骗定罪判罚。美国在证券市场和201
环保疏浚是治理洞庭湖流域黑臭水体重要手段,但在疏浚过程中将产生大量的疏浚余水,余水中总磷和重金属镉含量高且处理难度大,对其有效去除是防治环保疏浚二次污染的重要内容
乌铜走银工艺清代诞生自我国的云南省,是“滇味文化”的典型代表之一,素来深受人们的青睐与喜爱。乌铜走银器制造工序繁复,所用原材料昂贵,价值不菲,具有极高的欣赏价值和收藏价值。2011年,乌铜走银被列入第三批中国非物质文化遗产保护名录,让更多人认识了这门云南特有的传统民间工艺。然而乌铜走银工艺当前在生产制造工艺和产品创新方面动力不足,限制了其发展空间与未来前景,面临着诸多的困难与挑战。本文以云南乌铜走
基于卫星图像的海面目标检测任务要求标记出目标在图像中位置,并且准确给出该目标所属类别。当前目标检测方法分为两个主流方向:两步检测方法和一步检测方法。两步检测方法的优点是较高的准确率,缺点是速度慢;一步检测方法的优点是检测速度快,缺点是精度差。本文是针对卫星图像中船舶目标检测应用研究,任务实时性要求较高。所以,本文在一步检测算法方向进行研究。一步检测算法是工程应用友好型方法,但是较低的准确率依然是制
目的通过观察贝那鲁肽及利拉鲁肽对成年2型糖尿病患者的体重、腰围和内脏脂肪组织含量的影响,比较二者改善内脏脂肪堆积作用的疗效。方法按照入组及排除标准,本研究选取自2018年11月至2020年5月在大连市中心医院内分泌科就诊的二甲双胍单药或二甲双胍(每日大于等于1500mg)联合磺脲类治疗血糖未达标的成年2型糖尿病患者37例为研究对象(符合1999年WHO糖尿病诊断和分型标准),Hb A1c 7.0-