论文部分内容阅读
如何能更有效地治疗肿瘤?传统的治疗方式是依据同一肿瘤实体使用相同的药物进行治疗,而肿瘤来自相同解剖学位点被认为是同一种癌症实体。然而,因为癌症基因组学和转录组学的研究在肿瘤分子解析方面获得了实质性进展和突破,这个概念和治疗方式受到了挑战而进一步发展。随着癌症驱动事件在不同癌症类型中共享被识别和验证,使得新的治疗范式是在不同解剖学位点通过一个药物的非标签使用去靶向驱动信号通路。为了招募拥有相同分子特征的不同癌症类型病人去测试同一类治疗的疗效,所谓“basket”和“umbrella”临床实验被设计去实施药物的测试。然而,目前的研究已经表明这种药物的非标使用存在组织特异性的信号通路差异。由于癌症基因组特征(CGFs)集中反应癌症发生的背景,因此我们借助CGFs集中分析了癌症组织特异性在CGFs层面上的概况,以及癌症组织特异性的功能信号差异。此外,我们也调查了组织特异性CGFs的相关病例,执行了病例组织特异性特征分析。这些组织特异性差异的分析将有利于深入理解癌症发生的组织特异性和为癌症治疗提供建设性帮助。当前有许多资源存储常见的CGFs的信息,然而这些CGFs的组织起源和组织特征信息没有被包括或者关联到CGFs。在我们的工作中,我们提出了 一个工具资源CancerINFO,这个资源搜集来自文献及相关指南数据库的CGFs,并且规范化关联这些CGFs到相关癌症组织。此外,借助病例数据库,这个数据资源提供CGFs在实际病例中的组织特异性分析结果。这些结果将促进组织特异性肿瘤起源的分析以及精准医疗的临床实践。CancerINFO使用分层存储体系存储CGFs。当前CGFs关联的癌症治疗、诊断、预后、易感性的信息搜集来自于美国食品药品监督局药物(FDA)标签、美国国立综合癌症网络(NCCN)的指导手册以及其他公共数据库。CancerINFO包含五类CGFs:单核苷酸变异(SNV),基因拷贝数变异(CNV),基因表达变异(GEX),基因组结构变异(SV),以及基因甲基化变异(MET)。这些CGFs被关联到30个癌症组织的250种的癌症子类型,涉及1793个基因12938个CGFs和相关组织的组合,这些基因覆盖了 KEGG癌症信号通路相关基因的60%。CancerINFO webserver提供了关键的交互功能,包括特定组织的CGFs浏览和搜索、患者样本中CGFs的组织特异性分析、CGFs的病例样本搜索以及其他CGFs相关的功能分析。CancerINFO促进组织特异性CGFs连接单个癌症进展,从而帮助释放当前数据资源的价值。CancerINFO可通过其 web 界面和 API 访问,它的 URL 是 http://public.synergylab.cn/CancerINFO/。随着肿瘤在基因组特征积累和临床测序的快速发展,靶向CGFs已经为癌症干预治疗提供了一个机会,这日益被认为是癌症治疗的骨干策略。尽管临床的高通量的测序技术为高效的提供了癌症病人全面的基因组信息,但这些基因组信息很难被有效的利用和解读。即使临床医生能有效解读这个庞大的信息,它的时效性和准确性却很难得到保证。为了方便高效的为这些数据匹配有效的与治疗相关的CGFs,我们发展了一个工具,命名为OncoAnn,它提供癌症精准用药CGFs匹配和精准用药报告。我们的工具分为两个部分:基于CGFs的精准治疗知识库(命名为PMKB)和知识库匹配方法。在PMKB构建的过程中,我们收集了多个权威精准医疗知识库的2074条证据,包括FDA,NCCN,My Cancer Genome和GDSC。最终,通过一个肺癌病例为例,我们展示了我们工具的匹配结果,进一步说明了我们工具的高效性和准确性。总而言之,解释和报告癌症病人临床基因组信息仍然存在巨大的瓶颈,妨碍了精准肿瘤学的实施和发展。在这里,我们的工作在一定程度上促进了精准肿瘤学在临床上的应用实践。