基于机器学习的细胞系与药物反应预测研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:hgs061268109
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组的特异性可能会导致罹患同样疾病的个体对于同样的药物有着不同的反应。因此,以个体基因组信息为依据的个性化治疗出现,而预测不同个体特定细胞系对相同药物的不同反应是个性化治疗中的核心问题。通过临床实验验证药物反应对实验设备要求高,需要投入大量时间和资金。随着高通量测序技术的发展,基于生物学数据,利用计算机算法建立模型对药物反应进行临床前预测具有重要的现实意义。本文应用机器学习技术,结合细胞系的组学信息,药物的化学结构信息以及细胞系与药物反应信息,构建出两种不同的药物反应预测模型。主要工作如下:(1)提出一种基于最大流和随机森林的药物反应预测模型(A Drug Response Prediction model based on Maximum flow and Random Forest,Mflow_RFDRP)。Mflow_RFDRP从数据库中获得细胞系基因表达数据、药物化学结构数据以及已知的细胞系-药物反应数据,首先,对数据进行相似性度量处理,得到初始相似性网络;接着,引入最大流算法作为特征选择策略,分别得到细胞系和药物的特征,将其串联得到细胞系-药物对特征向量;最后,通过随机森林对细胞系-药物进行分类。(2)提出一种基于最大流和卷积神经网络的药物反应预测模型(A Drug Response Prediction model based on maximum flow and Convolutional Neural Networks,Mflow_CNNDRP)。Mflow_CNNDRP从数据库中获得细胞系的多组学数据,包括基因表达数据、基因突变数据、拷贝数变异数据,药物化学结构数据和已知的细胞系-药物反应数据,在此基础上重新构建了不同的相似性网络,采用最大流算法提取细胞系和药物的特征,最后建立9层卷积神经网络对细胞系-药物对的关系进行预测。(3)将Mflow_RFDRP、Mflow_CNNDRP和已有的相似药物反应预测算法进行了对比测试。和已有的类似算法相比,大量实验结果表明Mflow_RFDRP和Mflow_CNNDRP具有较好的预测性能。Mflow_RFDRP和Mflow_CNNDRP在仅使用基因表达这种单组学数据时的预测性能不相上下,但Mflow_RFDRP运行时间远短于Mflow_CNNDRP;而Mflow_CNNDRP模型在处理多组学数据时,预测性能表现更好,但所需的时间也较长。
其他文献
合成孔径雷达(SAR)是一种能够实现二维高分辨率成像的遥感设备。它借助于机载或星载的运动平台,通过发射大时宽-带宽积的线性调频信号,在接收到回波后进行二维信号处理,可以获得二维高分辨率的场景信息。干涉合成孔径雷达(InSAR)是在SAR的基础上发展而来的。通过增加一个天线,载机平台在一次飞行过程中可以使用两个天线对相同场景进行照射。利用两个天线位置的不同导致接收回波的时延不同,并结合测量几何关系,
生活垃圾分类是新时尚。上海市于2019年7月1日正式强制实施《上海市生活垃圾管理条例》,湿垃圾分出量由2018年日均4400吨增长至2020年的日均9428吨,占上海市生活垃圾总量的32%,标志着生活垃圾分类取得了初步成功。但湿垃圾分出量远超上海市规划预测量,末端处理处置存在困难,也进一步地反映出食物浪费现象较为普遍,故系统探究“从食物到湿垃圾”的过程,对减少食物浪费、减少湿垃圾量,促进湿垃圾资源
深度学习在近年来得到了快速的发展,优秀的算法更是层出不穷,在医学图像分类上已经具备很高的识别率,但是在处理多尺寸的医学图像数据集时,现有算法的识别效果还不是很好,不能满足当代智能医疗系统应用的需求。其主要原因是,深度学习算法在处理多尺寸的医学图像时,会先通过双线性插值的方法对图片进行预处理,而这会导致图片信息的丢失,进而影响分类的效果。为了提高深度学习算法在多尺寸医学图像分类上的准确性与适应性,本
数值微分是一类典型的不适定问题,其求解的本质困难在于解的不稳定性,即当函数值本身具有较小的扰动时,直接求导产生的误差可能是任意的.为此,如何构造稳定的微分算法一直是数值微分研究的重点.本文考虑了求解数值微分问题的两类稳定化算法:有限差分法和磨光化方法,给出了两种算法的构造、误差分析及数值实现.有限差分法是基于代数精度的概念,利用待定系数法构造了任意阶的有限差分格式.此外,我们还分析了差分格式的余项
在这个互联网技术日新月异的时代,社交网络技术也随之快速发展。面对快速更新迭代的软件开发节奏,IT从业者与外界交流更加频繁。他们为了满足日常工作可能需要安装多个软件,比如CSDN、企业微信、Boss直聘等,但只会用到各个软件的一小部分,然而每款软件其它功能却极少用到,占用了系统资源、桌面资源。然而目前市场却没有集招聘、交友、问答、吐槽、活动等功能为一体的专属于IT从业者的Web社交系统。此外,在传统
国家形象内涵丰富,涵盖一国政治、经济、文化、社会、外交等诸多领域的各个方面,是一个国家综合实力的外在表现。近几年来,短视频作为我国流量经济的核心板块,其用户基数之大、传播覆盖面之广、传播速度之快都成为各级政府和媒体乃至个人争相抢占的新媒体高地。同时,短视频又为国家形象提供了新的呈现方式和传播通道,因而“国家形象短视频”应运而生。从专门的国家形象宣传片到每一条短视频都影射着国家形象的一个维度,每一个
农村生活污水氮污染问题普遍存在,尤其是在人口密集的太湖流域。居民生活中产生的大量污水未经有效收集、处理排放后,导致入湖氮磷负荷超过水体环境容量,藻类爆发风险加剧。为改善农村地区水体环境,缓解太湖流域富营养化现状,寻求高效、经济的脱氮途径显得尤为重要。好氧反硝化菌可以在同一反应器内完成硝化与反硝化过程,农业废弃物作为微生物固定化载体可以提供细菌生长附着环境及碳源物质。好氧反硝化菌与农业废弃物相结合的
厨余废水具有成分复杂、有机成分高等特点,其中抗生素、内分泌干扰物及微塑料(MPs)等新兴污染物的去除具有一定的挑战性。目前,去除污水中污染物的方法主要有生物法、高级氧化法和吸附法,其中常规污水厂的生物处理一般无法彻底去除污染物,高级氧化法虽可高效快速去除污染物,但操作成本高且易引起二次污染。相比之下,吸附法因具有价格低廉、去除效率高、对环境友好等特点,已成为去除溶液中污染物最为广泛的处理方法。本研
全球气候快速和持续变化改变了降水模式,造成局部地区洪涝及干旱等极端事件发生,对生态系统的健康及生产力的产出造成损失。植物通过一系列生理生化反应来响应水分胁迫,目前,对木本植物在淹水和干旱胁迫下生理响应机理的研究较为缺乏。本研究以水杉(Metasequoia glyptostroboides)的幼苗为对象,开展不同水分梯度的处理实验(低含水量(12%)、一般含水量(25%)、高含水量(31%)、全淹
云制造为传统制造业向网络化、智能化、服务化生产模式转型升级提供了有效途径。机床装备资源是制造企业加工运行的核心资源,提升机床装备资源云服务的可靠性、稳定性对支持云制造模式的落地应用具有重要意义。如何面向复杂多变的机床装备资源云服务需求,对服务能力动态变化的机床装备资源进行优化选择,从而提供可靠、稳定的机床装备资源云服务,已成为云制造模式亟待解决的重要问题之一。因此,论文结合国内外现有研究成果,围绕