【摘 要】
:
蛋白质需要在正确的时间出现在正确的亚细胞位置,并与相应的分子结合才能正确行使它们的功能。因此,准确的获取蛋白质亚细胞位置对于理解蛋白质的功能、癌症靶向药研发以及癌症标记物的筛选起着不可替代的作用。早期对于蛋白质亚细胞位置的获取是采用传统的生物分子学实验得到蛋白质数据,研究人员再根据实验数据进行亚细胞位置标注。但是,此方法消耗了大量的人力、资金和时间。因此,基于已有的海量生物数据和模式识别与机器学习
论文部分内容阅读
蛋白质需要在正确的时间出现在正确的亚细胞位置,并与相应的分子结合才能正确行使它们的功能。因此,准确的获取蛋白质亚细胞位置对于理解蛋白质的功能、癌症靶向药研发以及癌症标记物的筛选起着不可替代的作用。早期对于蛋白质亚细胞位置的获取是采用传统的生物分子学实验得到蛋白质数据,研究人员再根据实验数据进行亚细胞位置标注。但是,此方法消耗了大量的人力、资金和时间。因此,基于已有的海量生物数据和模式识别与机器学习理论,研究人员致力于开发自动的亚细胞位置预测模型。尽管现有的预测模型对于人类、动物和植物蛋白质的亚细胞位置预测取得了令人鼓舞的效果,但是这些预测模型几乎是基于蛋白质序列数据,这导致无法准确捕获蛋白质在不同生化环境中的表达和分布变化,例如:当目标蛋白质所在人体组织发生癌变时。相反,蛋白质图像可以准确直观的反映蛋白质在人体组织中的表达情况,例如:组织的纹理分布、轮廓、边缘和颜色信息,使的基于蛋白质图像数据的预测模型能够精确捕获蛋白质在正常与癌症人体组织中的分布模式,从而高效的完成癌症标记物的筛选和临床医学试验。因此,本文采用了蛋白质图像数据作为研究对象,通过挖掘蛋白质图像的频域信息以及采用深度学习提高蛋白质亚细胞位置的预测精确度,本文主要的研究内容分为以下两个部分:(1)基于蛋白质图像的多尺度单演信号解析和图像强度编码策略建立多标记亚细胞位置预测模型MIC_Locator。首先,收集和整理符合最新发布的蛋白质图像亚细胞位置标注准则的免疫组织化学图像(IHC)作为基准数据集。其次,利用快速傅立叶变换(FFT)、Riesz变换、Log-Gabor滤波器和图像强度编码策略,获得基于不同频率尺度的单演信号的频域特征。最后,采用链式分类器(CC)处理多标记图像的分布模式。实验结果表明,MIC_Locator取得了60.56%的Subset accuracy指标,在整体性能方面性优于对比的单标记和多标记基准预测模型。(2)通过深度学习模型提取IHC图像的深度特征,并结合浅层特征建立预测模型AR_Locator,它的建立过程主要分为以下三个步骤。第一,图像预处理。采用多尺度Canny边缘检测算法裁剪IHC图像的蛋白质簇区域;同时,采用线性谱分离法从IHC图像中获取蛋白质与DNA通道。第二,深度特征和浅层特征的提取。采用Resnet50作为主干网络,同时嵌入多个注意力机制模块建立AR_Network卷积神经网络,将裁减后的IHC图像作为输入,并采用端到端的训练方式完成模型的参数优化,最后分别从AR_Network的注意力机制模块2和全局平均池化层(GAP)中提取深度特征;此外,从蛋白质和DNA通道中提取SLFs特征和局部二进制图像描述子(LBP)作为浅层特征。第三,决策层融合。由于深度和浅层特征分别反映了蛋白质图像的抽象和纹理信息,集成基于这两种特征和BR分类器所训练而成的预测模型,建立最终的预测模型AR_Locator。实验结果表明,AR_Locator可以取得72.09%的预测精确度,优于对比的多个基准预测模型。
其他文献
酸化是致密碳酸盐岩储层增产改造的常用措施,成功的碳酸盐岩基质酸化是在储层中形成几条主要的酸蚀孔道(即蚓孔),因此酸蚀蚓孔的精细描述对酸化的优化设计而言至关重要。储层
外浮顶储罐是国家油气资源及化工物料的重要存储设施,外浮顶储罐的罐体几何形体变化是其结构完整性检测的重要内容。外浮顶储罐的壁板形变量过大,会造成浮顶升降困难、蒸发损
发展循环经济,促进动静脉产业的协调发展,有助于从根源上缓解甚至解决粗放的经济发展模式带来的环境污染问题。如何在循环经济背景下推动动静脉产业耦合协调发展,提高废弃资源及污染物的循环利用,实现各种资源的高效利用以及污染物的减量化、无害化排放,已成为考验政府和学术界智慧的课题。在循环经济背景下对动静脉产业耦合进行研究亦成为不容回避的问题。为了能更具体深入地研究动静脉产业的耦合,需要借助耦合协调度(反映动
材料疲劳寿命的试验数据往往具有很大的离散性,表明材料的微观结构对其疲劳破坏行为有重要影响。因此,需要发展能够考虑材料微观因素的宏微观跨尺度疲劳破坏过程数值模拟新方法。本文采用约束应力区裂纹模型,对其进行解析求解。运用该模型,对板试件和圆棒试件的疲劳破坏过程进行数值模拟计算。具体工作内容如下:(1)简要介绍了疲劳破坏问题的工程背景、研究意义,以及国内外研究现状。对现有的疲劳破坏分析方法进行了文献综述
气液两相流现象广泛存在于人们生活中,其检测技术可应用于医疗、能源、化工等众多领域。在气液两相流检测中,由于相含率是表征流动行为的基础,也是预测质量、动量和能量转移
目前常用的絮凝沉降技术在处理河湖淤泥污水时,由于细粒级有机质难以絮凝而导致溢流出水水质差,同时还存在设备占地面积大、能耗高等问题。本文提出了用“水力旋流器+溢流挡板型锥盘旋流澄清器”组合工艺对河湖淤泥污水进行处理。利用水力旋流器先对污水进行预处理,其溢流与药剂混合,并加入微砂强化絮凝,然后进入锥盘旋流澄清器充分絮凝沉降。利用溢流管底部的挡板降低内旋流对沉降区域絮体的扰动作用,避免小絮体进入溢流,从
矿用电机车作为煤炭运输的主要工具之一,为了提高它的运输效率,需要提高其运行速度,但是矿用电机车制动系统的性能直接影响它的最高运行速度,进而影响其运输效率,并且制动系统性能的优劣直接关系到矿用电机车的运输安全,所以需要设计一种操作简单、制动可靠、容易实现自动化的制动系统。针对当前矿用电机车制动系统存在的操作复杂、制动空行程长、自动化程度低等问题,提出一种液压防抱死盘式制动系统,基于5t矿用蓄电池电机
研究采用选择/无选法考察了五年级数困学生在减法问题上的策略选择特点及问题难度的影响。结果发现:(1)数困学生和正常学生关于减法问题的策略选择不同:数困组更多选择借位策略,正常组更多选择分解策略;(2)数困学生解决减法问题的策略执行弱于正常发展儿童:数困组计算减法问题的正确率显著低于正常组、反应时显著长于正常组;(3)数困学生的减法问题策略选择不会随问题难度的变化而改变。在简单材料和复杂材料中,数困
高压天然气进行天然气放空,在这个过程中会产生非常强的放空噪声。原因在于放空管喷口喷出的气体流速非常大,喷出气体迅速与周围环境空气进行混合,混合过程中在主流区域发出
Q油田是我国海拔最高的油田,其主要采油气区位于青海地区,石油开采技术难度较大,要实现Q油田的稳产,需要科学技术和人才作为有效支撑。同时,Q油田远景目标是建设成为千万吨油