基于距离的支持向量机预测DNA 6mA修饰算法

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yanyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA甲基化是人们最早观测到的表观遗传调控装置之一。最能够体现原核生物中DNA修饰的则是N6-甲基腺嘌呤(6mA),其最关键的作用发挥在限制-修饰系统中,在外来DNA入侵时保护自身DNA。近20年来的研究在真核生物,甚至包括哺乳动物和植物基因组中鉴定到了 N6-甲基腺嘌呤,并指出了其对于多细胞真核生物的基因调控,疾病免疫等方面的基础性作用。这些研究掀开了真核生物表观遗传修饰的新篇章。作为这一研究最初始也最为关键的一步,N6-甲基腺嘌呤的鉴别就显得尤为重要,具有很强的理论和现实意义。本文针对一类DNA N6-甲基腺嘌呤数据集,这类数据难以通过传统的机器学习方法提特征。于是本文提出了一种新的分类预测方法——基于距离的支持向量机预测DNA N6-甲基腺嘌呤修饰算法。该算法避免了传统机器学习中的特征提取选择的问题,转而获取序列间的距离矩阵。首先采用基于后缀树的中心星比对算法来对数据集进行序列比对得到相似性矩阵,然后将相似性矩阵进行巧妙地取对数变换得到关键的距离矩阵,接着通过一个高斯变换将距离矩阵转换为符合训练条件的核矩阵,最后在支持向量机中采用核方法对数据进行分类预测。同时本文针对提出的算法进行了一个改进,又提出了一种基于距离的支持向量回归机预测DNA N6-甲基腺嘌呤修饰算法,此算法与支持向量机算法的最大不同在于所求的是离分类超平面最远的支持向量之间的距离最小而不是离分类超平面最近的支持向量之间的距离最大。本文采用了低阶评价指标:敏感度,特异性和准确率与高阶评价指标:马修斯相关系数和F1值进行了多种对比试验,包括5折交叉验证和独立实验,实验内容有与传统机器学习方法的比较,与业内其他支持向量机算法的比较,与最新研究成果的比较等,实验结果均表明本文提出的算法对于之前的算法都有着不同程度上的优势。
其他文献
在不久的未来,量子技术将极大地改变我们生活的方方面面,如通信,计算,传感的方式等。量子模拟是量子技术的重要支柱之一。随着量子系统的增大,量子态所处的希尔伯特空间将呈现指数级增长,因而经典计算机在模拟大规模量子系统的问题上通常极为缓慢。对于量子系统的模拟,一个可行的方法是利用一个较为简单可控的量子系统,即量子模拟器,去模拟另一个实际的量子系统。得益于近些年量子器件制造的发展,量子模拟器已可基于包括冷
学位
我国是农业大国,农产品期货因具有价格发现、套期保值、资产配置等功能,成为期货市场发展的重要环节,目前国内推出的农产品期货多达26种,覆盖油料、油脂、饲料等主流期货品种,农产品期货市场于快速发展中日益完善。2016年以来中央一号文件连续六年提及“保险+期货”,强调农产品期货服务“三农”领域,农产品期货发展再次受到关注。我国是全球最大的苹果以及红枣生产国和消费国,苹果和红枣产业区域特色鲜明,与贫困地区
学位
长链非编码RNA(long non-coding RNA, lncRNA)可作为致癌基因或肿瘤抑制因子在人类恶性肿瘤的发生发展中发挥重要作用,被认为是诊断恶性肿瘤和判断预后的潜在标志物。位于17号染色体17q25.1上的小核仁RNA宿主基因16(small nucleolar RNA host gene 16,SNHG16)是一种新的肿瘤相关lncRNA,在多种恶性肿瘤中表达异常。同时,SNHG1
期刊
本文引入并研究了 Besov-Morrey空间Bpλ(s)的一些基本性质。其中包括恒等算子的有界性和紧性,Volterra积分算子的有界性和紧性,在Bloch范数中Besov-Morrey空间的闭包,还研究了 Besov-Morrey空间乘子代数上的Corona定理和Wolff定理。主要分为以下四个方面:1.利用经典的Carleson测度研究了 Besov-Morrey空间上恒等算子Id的有界性和
学位
有关不确定性的建模一直是一个开放性的问题,目前已有的理论主要包括概率论、证据理论、模糊理论等。其中因为证据理论作为不确定性的前沿理论,具有良好的表达不确定性的能力,受到国内外的广泛关注和研究,这不仅促进了证据理论的完备,也探索出证据理论在各种实际问题中的应用前景。本文以直觉证据集(Intuitionistic Evidence Set,IES)为研究对象,包含了对直觉证据集的理论分析和实际应用两方
学位
近年来伴随着微纳加工技术的进步,微纳米机电系统得到了快速的发展,石墨烯纳米机械振子得益于石墨烯出众的电学和机械特性以及较高的谐振频率,在精密测量和信息处理等领域都展现出了巨大的潜力。本文选取少层石墨烯条带制备了谐振频率在几十到一百兆赫兹量级的纳米机械振子,主要开展了机械模式操控方面的研究:一方面对机械振子中的模式特性进行了探索,包括对多个独立振子之间的模式强耦合进行调控,观察到多个机械模式间的非线
学位
本文主要研究经济政策不确定性对我国跨境资本流动的时变影响。在国际环境剧烈波动和跨境资本流动日益重要的大背景下,资本的跨境流入可以缓解资金短缺的问题,这利于一国经济的发展;另一方面,短期跨境资本流动速度快、逆转性强、敏感性强等特质却极易造成一国经济的不稳定。近年,国际经济屡受冲击。尤其是2008年以来,全球金融危机、欧洲主权债务危机、中美贸易摩擦、新冠疫情等相继发生,造成导致全球经济金融环境的动荡,
学位
国外关于艺术品市场的相关研究开始于上世纪60年代,我国的艺术品市场从上世纪90年代初期才开始发展,当前已进入崭新的发展阶段。艺术品市场与金融具有很紧密的关系,宏观金融指标的短期或长期的变化都会影响到中国书画市场,因为中国书画市场份额长期在国内艺术品拍卖市场中占比最大,达到市场总额的40%-60%。因此研究金融与中国书画价格的关系,具有重要的理论价值和现实意义。本文主要探究信贷增速、国际投机性资本两
学位
迎来中国ESG体系的如火如荼的建设时期,各项国家政策牵头引导,相关机构逐步跟进实施落地,使得企业的ESG绩效倍受社会各界关注。在此环境下,上市企业按照相应地标准披露基于ESG内涵的相关信息,再由各评级机构依据不同渠道集合的与ESG相关的企业信息为其打分评级,其评级分数的高低逐渐成为投资者的判断企业优质与否的标准,进而对企业融资过程起到的影响也越来越重要。为顺应时代潮流,保障企业发展,企业提升ESG
学位
“目标导学课堂”是淅川县教体局倡导推行的课堂教学模式,这一教学模式有五个环节、十个步骤。以“电磁铁”一课为例,解读“目标导学课堂”导、学、练、展、评的五个环节和创设情境、问题生成、自主学习、合作探究、学思联动、变式训练、分享展示、质疑解难、建构总结、堂清检测等十个步骤的具体实施方法,该模式凸显学生的主体地位,是提升课堂效率的有效模式。借助“目标导学课堂”模式,能帮助学生逐步形成科学的学习方法,发展
期刊