【摘 要】
:
蛋白质是人类生存必不可少的物质,小到细胞,大到人体的各个器官,都离不开各种各样蛋白质的参与。利用高倍显微镜可以实现人类细胞蛋白质的可视化,这些图像通常用于生物医学研究,帮助人类更深入地理解细胞的复杂性,也为未来人类战胜各种疾病提供了可能性。近年来,一方面高倍显微镜的成像技术趋于成熟,利用高倍显微镜可以大批量地获取细胞的蛋白质图像,形成以人类蛋白质细胞图谱图像数据集为代表的大样本数据集。另一方面,从
论文部分内容阅读
蛋白质是人类生存必不可少的物质,小到细胞,大到人体的各个器官,都离不开各种各样蛋白质的参与。利用高倍显微镜可以实现人类细胞蛋白质的可视化,这些图像通常用于生物医学研究,帮助人类更深入地理解细胞的复杂性,也为未来人类战胜各种疾病提供了可能性。近年来,一方面高倍显微镜的成像技术趋于成熟,利用高倍显微镜可以大批量地获取细胞的蛋白质图像,形成以人类蛋白质细胞图谱图像数据集为代表的大样本数据集。另一方面,从2012年的AlexNet开始,利用卷积神经网络处理图像问题的算法也进入了高速发展期,模型的分类效果逐年提高,利用大数据方法对人类细胞蛋白质细胞图谱进行分析,探寻数据集中种种可能的规律成为了热门,学者们借此机会使用CNN处理蛋白质问题,尤其是和蛋白质相关的图像问题。过去,蛋白质细胞图像分类集中于单分类模型的讨论,基于一组不同的细胞识别某种蛋白质,每一个分类器仅能识别一种蛋白质。而现实中,单个细胞往往由多种蛋白质构成,蛋白质之间也并不是完全独立,本文希望用多标签学习的方法对人类蛋白质细胞图谱进行建模,基于一组不同的细胞识别其中包含的不同蛋白质,即输出空间包含多个元素,那这样就需要考虑到标签间的关系逻辑和分布特征。本文先是对数据处理所应用到的方法和原理进行解释,包括数据增广、上采样、标准化等方法。其次,本文针对数据集的特点选择了几种CNN结构,从AlxetNet开始,以时间轴的顺序罗列出五种模型结构,在阐述部分囊括了每个模型的产生背景,以及对各个网络模型的特点和优势。之后,本文对多标签学习的定义、模型评估方法、常用方法、存在的问题进行介绍,选择适用于人类蛋白质细胞图谱图像数据集的多标签学习方法。在实践部分,本文利用数据增广、上采样等方法对人类蛋白质细胞图谱图像数据集进行处理,以热图、直方图等形式进行可视化分析,深挖数据集的特点。根据数据集的特点设置损失函数、优化方法及评估指标,并利用调参技巧找到效果较好的学习率、阀值等超参数,最终建立对照实验。本文创新性的针对人类蛋白质细胞图谱图像数据建模,得到的InceptionV3模型有低损失、高性能的特征,比之前的模型效果更优。
其他文献
复杂网络中普遍存在着一定的社区结构,社区结构反映了网络中节点的聚集程度,即以节点的聚集程度划分社区。近年来,随着复杂网络研究的快速发展,检测网络中的社区结构可以更好
矿山开采在促进我国经济发展的同时,也给生态环境造成了严重破坏。为了实现矿业可持续发展,矿区生态修复势在必行。植物修复因其成本低、环保等优点在矿区生态修复中展现出良
聚丙烯作为五大通用塑料之一,广泛应用在生活的各个领域,但聚丙烯存在冲击强度低、对缺口敏感、韧性差等缺点,改性聚丙烯成为研究热点。添加成核剂是最简便有效改性聚丙烯的方法之一。添加成核剂可以有效改善聚丙烯的球晶形态、球晶尺寸和空间规整度,从而提升聚丙烯力学性能和热稳定性。本文结合芳香羧酸类成核剂的分子特性对具有优异光学性能和热稳定性能的酞菁大分子进行结构修饰。制备三种酞菁类成核剂,四羧酸酞菁(TAP)
目的:通过研究槐杞黄颗粒治疗小儿哮咳稳定期(肺肾阴虚证)的临床疗效,以探索一条更优良的治疗方案,以便于临床应用和推广。方法:选取2018年9月2019年10月在长春中医药大学附属医院儿科门诊的小儿哮咳稳定期(肺肾阴虚证)的患儿进行临床研究,经排除与剔除脱落标准后纳入36例符合标准的病例。通过连续口服槐杞黄颗粒3个月,按照前后自身对照原则,观察患儿治疗前后中医症候积分量表评估变化、外周血嗜酸性粒细胞
自2018年“扫黑除恶”始,消灭黑社会性质组织的行动劲头十足,刑事案件中关于领导、组织、参加黑社会性质组织的案件相比往年有了显著的增长。然而,黑社会性质组织犯罪案件是司法实务中较为疑难复杂的案件类型之一,公检法三机关虽然联合出台了各种打击黑恶势力的指导意见,但是其指导意见的描述相对有些空泛,公、检、法三机关对于办理黑社会性质组织犯罪案件在多个环节上认识与把握的标准不尽一致,甚至有些概念没有得到精准
YF-75E发动机是在YF-75D发动机的基础上,增大喷管的面积比,以提升其工作性能。为保证火箭发动机在真空环境条件下正常工作,火箭发动机高空环境模拟试验是发动机研制中的重点
本文主要研究了一类耦合的平均场反射正倒向随机微分方程(简记MFRFBSDEs)解的存在唯一性及比较定理,以及所研究的方程的解与相应的偏微分方程粘性解的联系;进一步,还证明了一般情形的平均场反射倒向随机微分方程解的存在唯一性和比较定理,从而将所研究的MFRFBSDEs推广到一般情形,即,方程的系数此时同时依赖于解及解的分布。具体来说,论文内容可分为两个部分。第一部分:考虑如下形式的耦合的MFRFBS
光催化技术在应对环境危机和能源危机方面有广泛的应用前景,但是在实际应用中却受到了各种因素的限制。本论文主要围绕两个方面进行,一是碱处理Co0.01Zn0.99S(CZS)对Rh B染料废
土壤中微量元素的缺乏会极大的限制大部分作物产量的提高、品质的改良,缺乏微量元素的食物也可能进一步影响到人体健康。土壤缺铁是农业生产中普遍存在的一种非生物胁迫,在覆盖地球表面30%以上的石灰性土壤中不同程度的缺铁,在这种逆境中生长的作物往往表现出典型的缺铁症——“失绿症”,由其所得产品的产量和品质均有下降,因此,铁是作物产量和品质的关键决定因素之一。高粱是世界第五大粮食作物,在我国主要用作酿酒、制醋
本文中,我们主要研究了边染色图中的子图相关的问题。给定一个图G=(V,E)和G上的一个边染色φ:E→{1,2,...,k}。我们称G的一个子图H是正常染色的,如果对任意H中的两条相邻的边