基于XGBoost的基因静态数据调控网络推断方法

来源 :集成技术 | 被引量 : 0次 | 上传用户:roubaozi320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于静态基因表达数据来说,推断基因调控网络仍是系统生物学中的一个挑战——存在大量识别难度高的直接或间接调控关系,而传统方法的准确性和可靠性还有待进一步提高.为此,该文提出一种基于Boosting集成模型的方法(XGBoost),应用随机化和正则化来解决模型过拟合问题,同时针对建模所得权重不一致的问题,对初始权重增加归一化和统计学方法处理.最终,采用DREAM5挑战的基准数据集对所提出方法进行性能验证.实验结果表明,XGBoost比现有其他方法获得更好的性能:在in-silico生成的模拟数据集中,接受者操作特征曲线面积(AUPR)和正确率-召回率曲线面积(AUROC)两个评估指标均显著优于现有方法;在E.coli和S.cerevisiae两种生物的真实实验数据中,AUROC指标均高于现有最优方法.
其他文献
神经网络学的研究目的之一是揭示物理平面和认知平面之间的映射关系,从而揭示脑神经系统的工作原理和生物智能的本质,它已经成为生物物理学研究的重要领域。神经系统的结构和
研究表明当电磁波在光子晶体中传播时,由于多层布拉格散射而形成能带结构,即光子能带,在光子能带之间存在光子带隙也称作光子禁带,频率处在光子禁带范围内的光子不能在光子晶体内传播,即光子晶体能够阻断特定频率光子的传播,而引入缺陷或者小范围内非周期排列的光子晶体,将在光子禁带范围内有透射峰存在,并且透射峰的透射率随着光子晶体外部所受应力大小的变化而变化。本论文借鉴介观压阻效应,运用等效传输矩阵方法研究了镜
本文通过对荣华二采区10
期刊
人体活动识别与检索是计算机视觉领域的前沿研究领域,在智能监控、人机交互、体育运动分析等领域得到了广泛的应用。传统视频中的人体活动分析面临着遮挡、视点变化、镜头运
磁共振声辐射力成像(Magnetic Resonance Acoustic Radiation Force Imaging,MR-ARFI)是一种超声焦点定位技术,可通过检测声辐射力作用到生物体内时在局部组织区域产生的微米
CT图像头颈分割面临着以下难点:CT图像的低对比度导致边界不清,图像扫描间距过大导致冠状面和矢状面图像分辨率低,头颈中待分割的22个器官对于神经网络构建建模的需求不同,且由于存在极小器官造成了类间不平衡。为解决上述问题,该文提出一种U-Net组合模型——由3种U-Net模型组成,分别是2D U-Net模型、3D U-Net模型及3D-small U-Net模型。其中,2D U-Net模型用于厚层图
内源性大麻素系统广泛分布于哺乳动物的中枢神经系统中,参与调节多种生理过程和行为反应.其中,大麻素I型受体(Cannabinoid Receptor 1,CB1R)大量分布在表达生长激素抑制素、
便携式电子设备朝低压低功耗方向发展,CPU、MCU等数字处理器的集成度及工作频率越来越高,需要电源对其供电的电流也越来越大。这就需要电源系统具有提供大电流和低输出电压能力。文章介绍了一种具有异相时钟控制双输出通道、工作频率可变(140KHz-650KHz)、内部设定可以选择工作频率(250KHz、400KHz、600KHz)、输入电压范围为4-40V、输出电压范围为0.8-10V、重载时电源转换效