面向复杂疾病诊疗的组学大数据分析方法及应用

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:wxc13439460105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以癌症为代表的复杂疾病严重威胁人类的生命健康,其形成包含复杂的分子间相互作用和调控过程。以患者临床表现出来的少数几种特征对疾病进行划分,然后对每一类辅以特定的治疗手段往往会在不同个体上有不同的反应,治疗效果难以预测。复杂疾病往往是由遗传因素、环境因素、生活习惯等多种因素之间相互作用导致的,并不遵循孟德尔遗传定律,因而家族病史和遗传相关信息只能说明个体存在患病的概率,但并不意味着就一定会患病,这些都使得复杂疾病的诊断和治疗更加棘手。随着测序技术的不断发展,测序成本呈现超摩尔定律的下降趋势,目前一个成人全基因组的测序成本在1000美元左右,组学数据的获取变得更为容易,基因组学、转录组学、蛋白质组学等数据大量出现。组学大数据的爆发使得研究人员从更为全面和准确的患者体内实际情况出发,对复杂疾病进行诊断,并在此基础上有针对性的进行特异性治疗成为可能。然而,目前对复杂疾病的诊断和治疗主体上仍然是基于传统临床特征和医生的经验来完成,几乎不会用到患者的多组学数据中所包含的信息,尤其是每一个患者所特有的组学信息。精准医疗概念的出现推动着相关研究者们对个体化医疗的研究,期望临床医生能够根据患者的实际情况,识别出对该患者更为适用的治疗靶点或作用通路,从而量体裁衣的定制最合适的治疗方案。但是,目前基于组学大数据对复杂疾病进行诊疗的相关方法的研究还尚有不足,急需根据生物学数据特点和临床复杂疾病诊疗需要,设计鲁棒、高效的机器学习方法。本文从复杂疾病诊疗过程中重要的三个环节——亚型分类、靶点识别和药物重定位出发,循序渐进地提出了相应的组学大数据分析方法来解决五个相关问题。具体来说,1.在疾病诊断方面,本文首先提出了基于多模态矩阵联合分解方法来实现对癌症的亚型分类,通过引入相似性矩阵和组稀疏约束的概念,设计了含义清晰的目标函数,推导了优化求解算法并证明了该算法的收敛性。在模拟数据和多种癌症数据上对算法的性能进行了评估,得到了比现有方法更好的亚型分类结果,并对分类相关的重要组学特征进行了分析。进一步在单一组学数据亚型分类和多组学整合亚型分类两个方面对所提出的模型的性能进行了评估。2.在靶点识别方面,提出了基于多源组学数据置信的靶点识别方法,综合考虑候选基因的差异表达、DNA甲基化水平变化、对患者生存预后影响、基因功能和药物可靶向性等多源信息,提高预测靶点的置信度,减少假阳性结果在后续实验中导致的验证失败问题。对乳腺癌的4个亚型识别出了共计11个亚型特异的高置信度靶点。3.在靶点识别方面,建立了亚型分类和亚型特异性靶点识别的统一框架,提出了新的非负矩阵三分解模型,引入正交约束和稀疏约束来适应生物学先验知识并提高模型可解释性,在肝癌数据上得到了比现有方法更好的亚型分类结果并识别出亚型特异的基因靶点,并结合药物靶标数据和KEGG信号通路数据对靶点的基因功能和可靶向性进行了分析。4.在药物重定位研究方面,针对乳腺癌等癌症存在放疗抗性的问题,结合e IF4G1蛋白在乳腺癌细胞中过量表达并可以修复电离辐射带来的DNA损伤的先验知识,从大规模细胞反应数据出发,对乳腺癌放疗增敏剂进行了药物重定位研究。细胞实验结果显示,博舒替尼可以显著抑制小鼠的肿瘤增长、减小肿瘤体积、提升小鼠生存率,并且可以显著诱导肿瘤组织的细胞凋亡,且无毒副作用,可以用作乳腺癌放射治疗的增敏剂。5.在药物重定位研究方面,对于当前药物重定位研究中,只使用少数出现显著变化的基因特征印迹,忽略大部分基因特征的情况,本文提出了可以从全基因组表达谱特征的带正交约束的非负矩阵分解方法和适用于该方法的表达谱特征印迹计算技巧,并对抗乙肝病毒药物进行了重定位研究。体外实验结果显示,西他列汀可以显著抑制乙肝病毒的复制和相关蛋白的表达水平,且是美国食品药品监督管理局批准的治疗糖尿病的药物,可以直接应用于临床实验。
其他文献
视频目标跟踪一直是计算机视觉领域的热点和难点问题,有着广阔的现实应用需求和发展前景,如视频监控、无人驾驶、精确制导和战场侦察等。本文研究单摄像机、单目标、短时和不限类别的目标跟踪问题,其定义是通过检测器或人工标注的方式给定目标在视频初始帧中的位置和尺度,估计目标在后续视频图像帧中的状态信息(如位置、尺度和运动轨迹等)。长期以来,科研工作者在视频目标跟踪的理论和应用上都积累了丰富的成果。但是,实现复
在量子信息技术的飞速发展过程中,量子成像应运而生。量子成像在分辨率、灵敏度和抗干扰等方面具有优势,引起人们极大的关注。随着研究的深入,量子成像从空间域拓展到时间域。时间域量子成像在时间信号测量和提取等方面具有潜在优势,为刻画时间信号提供了新的思路,本文主要研究利用时间域量子成像方法获取时间信号的不同信息。本文的主要工作如下:1.总结归纳了时间域量子成像的理论基础,包括波动光学和量子光学部分。在波动
随着互联网技术和数字多媒体技术的发展,数字图像的使用越来越广泛,但是它的安全性也受到了威胁。尤其是个人隐私图像、商业机密图纸、医学图像和军事图纸等涉及个人、公司、公共事业单位和军队等隐私的数字图像,在存储和传输过程中容易被截获、篡改和破坏,因此它的安全性也受到了广泛的关注。而QR码作为一种特殊符号图像,随着移动设备的发展,被广泛用于移动商务、电子商务、产品信息传递与识别和用户服务体验等方面。由于它
随着计算机网络和多媒体技术的迅速发展,数字图像变得更容易获取、传输和修改。数字图像安全随即引起了人们的广泛关注,针对军事布防图纸、产品设计图纸及个人敏感图像等重要秘密图像信息的保护变得尤其重要。相比于图像加密和信息隐藏,秘密分享技术具有无条件安全、权限控制、丢失容忍和解密简单等特性。在图像安全保护领域有不少研究者对秘密图像分享技术进行了深入的研究,并产生了广泛的应用。针对秘密图像分享的相关理论研究
导弹防御系统对维护国家和地区安全意义重大。对导弹目标的快速检测和准确识别是导弹拦截的基础和前提,同时也是现代导弹防御系统面临的最大技术挑战。本文主要围绕基于红外探测的导弹目标检测和真假弹头目标识别两个问题展开研究,具体研究内容包括:(1)针对天基预警系统在复杂背景下的红外点目标检测问题,改进了一种新的星地联合目标检测体制。该体制下,星上信息处理系统完成基于单帧图像的点目标检测和基于单帧图像的复杂背
时空轨迹的相似度计算将轨迹间相似特征进行了量化,是上游相似查询和分析应用的基础,有效而稳定的相似性度量及其高效计算方法也是众多轨迹模式挖掘的必要前提。当前数据量爆炸式增长、数据形式愈发多样、时空语义信息更加丰富的轨迹数据现状对相似性分析和相似模式挖掘提出了更高要求,而传统研究一般将轨迹视作由点序列构成的线状对象,本质上仍是基于分立的空间点的计算与分析,不能有效把握轨迹数据时序性、多粒度性、位置不确
关联成像(Correlated Imaging)又叫鬼成像(Ghost Imaging),利用光场的二阶乃至高阶关联性质,间接重构出目标,是一种间接成像技术。不同于传统光学成像技术可以利用面阵探测器直接获取目标的图像,关联成像需要通过特定的重构算法计算出目标图像。在关联成像中,照明光被分为两路:信号光照射目标后被无空间分辨力的单像素探测器探测,参考光经自由传播后被面阵探测器探测,任一路都无法单独成
关联成像是一种基于光场高阶相干获取目标信息的成像技术。和传统成像相比,关联成像在诸多方面具有优势。首先,关联成像可实现无透镜成像,在一些透镜难以加工的波段内,如X光,关联成像可更容易地获取物体图像。其次,在关联成像系统中可以用点探测器获取二维或三维物体的图像,和普通的面阵探测器相比,点探测器灵敏度高,这使得关联成像可以在极弱光条件下成像。此外,点探测器读写速度快,也使得关联成像系统可以高速采集数据
多波段光电载荷融合成像具有几何和物理特性共同识别的功能,可有效提升目标识别率和识别效率,在光电成像技术领域发挥着不可替代的作用。传统多波段光电载荷一般选用多镜头分立组合的光学结构,存在系统体积大、图像实时处理能力弱等问题,难以满足对新型光电载荷集成化和灵巧化的需求。伴随着超精密加工技术的发展,多面共体光学元件的形、位高精度加工成为可能,光线可以在不同光学面间多次反射,形成折叠式光学成像系统,并有望
随着装备的快速发展、实战化的使用要求和保障模式的变革,对装备测试诊断提出了更高的要求和更大的挑战,测试模式的变革势在必需,装备测试性工程正是顺应这一变革的产物。当前,一般工程意义上的测试性设计已趋于完善,但针对复杂系统的测试性设计仍存在一些认识上的偏差和未解决的技术流程与关键技术问题,无法满足工程实践需要,如测试性设计中未考虑集成故障和系统级测试,系统级故障诊断隔离难等,为此本文在部委级预研项目的