【摘 要】
:
乳腺癌疾病相关基因筛选与药物研发是生物医学研究领域的重要课题,有效筛选相关转移基因和预测现有药物的新用途对于该疾病的治疗具有重要的科学意义。然而,如何挖掘和利用疾
论文部分内容阅读
乳腺癌疾病相关基因筛选与药物研发是生物医学研究领域的重要课题,有效筛选相关转移基因和预测现有药物的新用途对于该疾病的治疗具有重要的科学意义。然而,如何挖掘和利用疾病与药物相关的特征信息一直是目前该领域的难点。随着数据挖掘技术的发展,通过特征整合与数据模型算法的结合,为以上问题提供新的解决途径。本文利用数据挖掘的特征筛选算法及分类算法研究乳腺癌相关基因筛选问题和药物重定位问题。主要研究内容如下:1.提出了一种基于随机森林分类算法和病人基因特征信息的乳腺癌转移标志基因筛选方法PPIRF。该方法的特点在于不仅考虑到基因表达值在疾病分类预测问题中的重要性,而且把蛋白质-蛋白质相互作用信息作为先验知识融合到基因挑选过程。通过与其它方法进行对比,结果表明PPIRF筛选出的基因组合具有更好的预测能力和生物可解释性。2.提出了一种基于药物多类特征信息的重排序算法Ranking-based KNN用于乳腺癌等疾病的药物重定位。Ranking-based KNN方法的特点在于不仅融合了化学结构信息、靶标信息、副作用信息以及拓扑相关性信息多种药物特征,而且通过Ranking-SVM算法得到了待测药物的最可信近邻的排序以使用加权打分策略来预测该药物的新用途。实验结果表明该方法可以帮助寻找治疗乳腺癌等类疾病的药物新用途。3.开发了名为DREP的药物重定位可视化预测工具。该工具共包含了两种药物重定位方法:第一种是基于Ranking-based KNN算法的药物重定位;第二种是基于逻辑回归分类的药物重定位。该工具可以对KEGG数据库中1387种药物与1514种疾病的未知关系进行预测,并根据预测出的药物-疾病对分值数给出所查询药物可能治疗的疾病名称列表。DREP工具界面友好,操作简单,便于生物学研究人员的使用。
其他文献
公路建设工程项目投资规模大、施工周期长,劳动力、技术及资金投入的密集性较大,是一个系统工程。从目前来看,制约公路建设发展的瓶颈是资金供给问题,其实质在于有效控制公路
[研究背景]Hedgehog-Smoothened(Hh-SMO)信号通路是一条高度保守并且在胚胎发育时期起关键作用的信号通路。在正常人体内,组织Hh配体表达关闭,PTCH与SMO结合抑制SMO的活性,导
要实现马克思主义中国化,必须先实现马克思主义哲学大众化。毛泽东在领导革命和建设的过程中,提出了善于转化、善于融合和善于表达的马克思主义哲学大众化的实现路径,为推进
目的深入了解临床护理人员对职业风险感知的体验和现况。方法分别从西安市三级甲等医院、二级甲等医院和社区卫生所选取临床护理人员31名,采用半结构式访谈法收集资料,根据质
服务型制造是传统制造业延长和提升产品价值链的重要发展方向,而故障诊断服务是服务型制造的核心共性内容。目前,国内外在通用设备及产品的故障诊断服务技术及方法方面开展了
在20世纪上半叶,傅斯年通过自己的研究和领导工作,对中国现代学术的发展做出重要贡献。对于他的同学顾颉刚掀起的疑古思潮,傅斯年起初给予了很大支持和极高评价,但后来则逐渐
目的:本实验初步探讨自噬对肿瘤坏死因子凋亡相关诱导配体(tumor necrosis factor-related apoptosis inducing ligand,TRAIL)诱导宫颈癌Hela细胞凋亡的影响,为将TRAIL应用于
目的了解工作场所暴力对护理人员工作倦怠的影响。方法抽取上海市宝山区3所二级以上医院护理人员904人,应用护理人员工作场所暴力问卷、Maslach工作倦怠问卷和领悟社会支持量
攀钢集团四川长城特殊钢公司在30t电炉安装2套PTI JetBox集束射流氧枪和1套EBT氧燃烧嘴系统后,取得了平均冶炼周期降低30min/炉,电耗降低84kwh/t,电极消耗降低0.78kg/t,提高
目的探讨亲情化延续护理对脑卒中患者日常生活能力(ADL)、遵医行为及满意度的影响。方法将105例临床治愈出院的脑卒中患者随机分为观察组(54例)和对照组(51例),均于出院后第7