【摘 要】
:
环状RNA(Circular RNA,circRNA)是一种不含有5’端的帽和3’的尾的新型非编码RNA。大量研究表明circRNA与许多人类重大疾病的发生和发展,息息相关。有报告称circRNA具有组织特异性、稳定性、和高度保守性的特点,所以,circRNA是理想的疾病标志物。因此,对circRNA与疾病的关联研究,对于开发相关的分子靶标药物和理解疾病的发病机制具有重要意义。验证circRNA与
论文部分内容阅读
环状RNA(Circular RNA,circRNA)是一种不含有5’端的帽和3’的尾的新型非编码RNA。大量研究表明circRNA与许多人类重大疾病的发生和发展,息息相关。有报告称circRNA具有组织特异性、稳定性、和高度保守性的特点,所以,circRNA是理想的疾病标志物。因此,对circRNA与疾病的关联研究,对于开发相关的分子靶标药物和理解疾病的发病机制具有重要意义。验证circRNA与疾病是否存在关联的生物实验方法有外切酶酶切法,聚丙烯酰胺凝胶电泳和RNA印迹法(Nothern blot)等,但是目前仅有少数circRNA与疾病的关联被实验证实。考虑到生物网络的复杂性,circRNA会参与各种生物学过程,因此,这些circRNA必定会参与疾病的发生和发展。然而,通过分子生物学实验来发现circRNA与疾病是否存在关联,需要较长的实验周期,且需投入大量的资源。数据挖掘技术和人工智能方法的发展为从计算的角度来发现circRNA与疾病的关联提供了算法基础。关于circRNA和疾病的关联数据库预测的算法方兴未艾,开发更高效可行的预测算法尤为必要。现存的方法大多数都是基于circRNA的相似性和疾病相似性信息而忽略了circRNA序列中的海量信息,而且没能提出一种可靠的负样本选择方案,所以本文提出了第一种预测模型,即基于circRNA序列特征和疾病相似性并使用可靠负样本来构建预测模型。首先,从circRNA和疾病关联数据库Circ R2Disease数据库和circ Base数据库中收集相关数据,经过数据清洗后,采用k核苷酸组分算法提取circRNA的序列特征,并使用疾病的语义相似性结合高斯互作相似性表征疾病的特征,基于越不相似的疾病越不可能与同一种circRNA存在关联的假设下,选择出可靠的负样本,最后采用支持向量机(SVM)构建预测模型,并通过五折交叉验证的方式和ROC来评估模型的性能。通过其他分类算法的比较说明了该模型的优越性。由于第一种模型仅仅利用了circRNA的序列特征而没有考虑到关联网络的拓扑结构信息,所以本文又提出采用图自编码器提取原始关联网络的拓扑结构信息,将网络中每个节点的特征表示出来后采用链路预测的思想,将circRNA和疾病组合成一个样本用SVM构建模型。最后我们将该课题的相关数据和代码上传到了github上:https://github.com/yizhishagua/circRNA-disease-project4。
其他文献
本文研究Bose-Einstein粒子模型的量子Boltzmann方程(BBE)。对于这类方程,3维(N=3)的硬位以及硬球模型曾被广泛研究,并得到了重要的结果。本文将研究一般维数下(N≥2)具有量子碰撞核的BBE。此类方程最早由物理学家Nordheim, Uehling和Uhlenbeck等人在二十世纪初引入。方程的数学推导在进入二十一世纪后取得了重要进展。本文的主要结果为, N维均匀BBE有一
随着智能安防设备的不断发展,智能监控摄像头在公众场所得到了越来越多的应用,基于监控摄像头的智能视频监控系统研究领域在迅速地成长。行人重识别作为近年来比较火热的研究方向,在计算机视觉领域和智能视频监控领域都受到了广泛的关注。2012年以来,深度学习取得了重大的进展,在图像检测和分类的各个分支都得到了应用。通过引入深度学习理念,行人重识别也迎来了新的进展。现有的行人重识别模型,都是基于对监控视频进行预
大脑是最为复杂的系统,它由许多神经元共同作用,完成大脑各种初高级认知功能。到目前为止,应用最广泛的方法是基于血氧水平依赖信号的功能磁共振成像,它可以无创非侵入性地观察大脑各脑区活动的变化。动态功能连接分析能够反映人脑活动的微小时变,为相关脑疾病的病理研究提供重要生物标记物。此外,白质占据着人脑体积的一半,越来越多的研究证实白质区域的血氧水平依赖信号能够反映大脑的神经活动,然而白质在时空方面的动态特
随着我国市场经济的繁荣,汽车不再是少数人的专属,拥有驾驶资格的人也越来越多,驾驶汽车以及乘坐汽车成为了当代人生活方式中的一部分。伴随而来的是,交通事故的发生频率也在不断提高。其中有很大一部分交通事故是驾驶员在驾驶车辆进行变道、超车、起步、被超车的过程中忽略了侧后方来车或行人导致的。车辆的驾驶员盲区问题已经成为了不容忽视的安全隐患,威胁着行人、乘客、驾驶员的生命安全。汽车盲区监测(Blind Spo
通过总结本科室本专业住院医师培训的工作来提高管理质量。住院医师培训工作每个专业都基本涵盖教学计划、阶段考核、教学阅片、小讲课、疑难病例讨论、教学比武、绩效考核、师资培训等方面,涵盖范围较广。另外放射医学专业住院医师专业内容就涉及临床各个专业,且还涉及X线、CT、MR以及DSA相关设备的内容,所涉及的内容如此广,学员如何着手?在管理过程中面临的问题层出不穷。每个教学单位的教学方法各异,各有各的优缺点
背景与目的局部中晚期食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)患者的长期存活与新辅助放化疗(neoadjuvantchemoradiotherapy,NCRT)后的病理反应有关。但是,缺乏有效的生物标志物预测NCRT后ESCC患者的病理反应是一个长期存在的问题,故对ESCC放化疗疗效相关基因和多基因相互作用进行全面而系统的分析将为了解其中的分子
随着我国经济社会的快速发展,过程中也在日益涌现出发展不平衡不充分的问题。作为一双“看得见的手”,政府往往会出台一系列相关经济政策,来确保经济能够向平稳、健康的趋势发展。但对于企业来说,他们并不能正确地辨别经济政策发展的方向与执行力度,其决策很容易受到经济政策不确定性的影响。在全面深化改革的重要时期,创新作为引领国家高质量发展的第一驱动力,不仅是我国经济发展的重要战略支撑,也是企业在激烈的全球竞争浪
多项式系统全部孤立解的理论与算法,是现代数学与应用数学的重要研究课题,也是理论物理等基础学科以及电力系统、机器人控制等工程技术学科的重要模型问题。同伦连续方法是求解多项式系统全部孤立解的一种可靠而有效的数值方法。但经典同伦算法中需要跟踪解曲线的数目等于Be′zout数,对实际应用中出现的规模较大且退化的多项式系统,经典的同伦连续方法效率很低。多齐次同伦方法利用多项式系统的齐次结构,可以大幅地减少退
传统上干细胞主要以胚胎干细胞(ES)作为医学上干细胞的来源。然而,ES使用中除了可能因生物体不同产生的免疫排斥反应外,还存在伦理方面等问题。因此,另一种与ES特征相似的诱导多能干细胞(i PSc)应运而生。i PSc是向已分化的体细胞导入特定的转录因子(TF)使其转变为具有多能性的细胞。尽管目前i PSc的研究已经取得进展,但人们对i PSc的诱导机制仍需要近一步探索。本文对血液、皮肤和尿液三种体