油菜多组学数据库开发及基于Web日志的异常检测

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:beiwei72
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
油菜是我国重要的油料作物。油菜产业每年向国民提供约520万吨优质食用植物油,约占国内油料作物总产油量的50%。然而我国食用植物油产量已连续10年以上低于需求量,大量的消费缺口由国外进口来填补。据悉,2021年国内进口食用植物油超过1,000万吨,对外依存度达70%。同时,国内油菜育种技术相比国外,在优质品种育成速度和成功率方面仍存有较大差距。随着“后基因组”时代的到来,油菜基础研究领域积累了海量组学资源。如何将这些多组学数据优势转化为育种优势,是当前乃至未来很长一段时间油菜遗传育种的核心研究内容之一。为了逐步实现这一目标,本研究首先搭建了油菜转录组数据库Bn TIR和油菜变异组数据库Bn VIR;在此基础上,通过系统地整合Bn TIR、Bn VIR、油菜泛基因组数据库Bn PIR以及大规模的多组学数据,构建了全面、安全稳定的油菜多组学数据库Bn IR。主要结果如下:(1)油菜转录组数据库Bn TIR的设计与实现。系统全面的基因表达信息有助于研究者快速挖掘和分析与油菜重要性状相关的目标基因及其表达特征,为基因的功能研究提供相应的基础和支撑。本研究对涵盖油菜苗期、开花期、成熟期三个阶段、全组织的273个高分辨率样本进行转录组测序,搭建油菜转录组数据库Bn TIR(网址:http://yanglab.hzau.edu.cn/Bn TIR)。该数据库集合了基因表达信息查询、e FP可视化、基因共表达网络、基因组浏览器等功能模块,并提供基因ID转换、序列比对、序列提取、转录因子家族、转录因子调控网络以及热图绘制等工具,为研究者提供了一个方便快捷、功能全面的信息获取平台,有利于油菜功能基因组学和候选基因的定位研究,推动油菜遗传育种的发展。(2)油菜变异组学数据库Bn VIR的设计与实现。完整、丰富的遗传变异集合是遗传育种中准确定位到遗传位点和候选基因、分子标记辅助遗传育种以及种质资源鉴定的重要基础。本研究首先搜集了2,311份核心油菜种质的群体重测序数据,通过处理和分析获得10,091,900个遗传变异,并基于群体基因型、118份表型数据以及309份材料的基因表达数据等资源,构建油菜变异组数据库Bn VIR(网址:http://yanglab.hzau.edu.cn/Bn VIR)。该数据库集合了变异信息查询、种质资源查询、群体遗传学和进化分析等功能模块,并提供在线变异注释、连锁不平衡热图绘制工具,为研究者提供了一个快速、高效地挖掘油菜候选变异/基因的平台,对今后分子标记的开发、候选基因的功能研究以及油菜育种改良具有十分重要的意义。(3)油菜多组学数据库Bn IR的设计与实现。为充分利用油菜研究领域积累的海量组学数据,助力油菜重要性状相关功能基因的挖掘与定位,本研究对Bn TIR、Bn VIR与Bn PIR进行了整合,并增添11个油菜参考基因组、100,947条种子发育20天和40天的群体表达量数据、2,791个样本的转录组数据、13,343,263条种子甲基化数据以及通过全基因组关联分析(Genome-Wide Association Studies,GWAS)、表达数量性状位点定位(Expression Quantitative Trait Loci,e QTL)产生的1,431,217条GWAS结果和121,720,300个e QTL位点等多组学资源,构建油菜多组学数据库Bn IR(网址:http://bna.hzau.edu.cn/)。该系统后端存有64张数据表,前台包括10个主要的功能模块和87个功能子页面,允许用户通过基因名称、基因编号、基因索引和染色体位置等多种方式获取结果数据,实现了整合查询、可视化展示大量油菜组学数据的功能。研究人员借助Bn IR能快速地开展基于候选基因的油菜分子标记研究,对油菜种质资源的精准鉴定、评价、利用以及分子育种具有重要推动作用。(4)开展Web异常检测,保障Bn IR稳健运行。及时地检测Bn IR接收的Web异常流量,是Bn IR提供稳定、长期以及安全服务的重要保障。本研究将HTTP CISC2010公共数据集和Bn IR中1,668,668条原始Web日志记录作为实验对象,训练了13个机器学习算法模型来检测Bn IR接收的Web异常流量。并基于性能最佳的支持向量机、决策树和多层感知器的堆叠(stacking)集成模型搭建Web异常检测系统,实现了Bn IR日志数据的存储、数据预处理、异常检测、异常存储和流量分类结果展示功能。测试结果表明,Web异常检测能发挥保障Bn IR服务稳定性、数据安全性的作用,可以为数据库稳健的运行保驾护航。
其他文献
通过将太阳能吸收和转化,光合作用每年可产生千亿吨的生物质,相当于世界人口重量的100倍。同时,这一过程又十分高效,其能量传递效率(量子产率)接近1,远高于目前所有的人工光电或光热转化装置。因此,深入理解光合作用体系的能量传递和转化机制,可为人工光合系统的构建提供理论支持。本文主要研究菠菜PSII-LHCII超复合物的界面能量传递路径。近年来才得到该复合物的高分辨率结构,这为详细研究能量传递机制提供
学位
随着全球能源短缺和环境污染问题的日益加剧,发展绿色、可持续能源转换和存储装置已迫在眉睫。锌-空气电池(Zn-air batteries,ZABs)因具有比能量密度高、成本低以及安全性好等优点,吸引了研究者的广泛关注。众所周知,电化学氧还原反应(Oxygen reduction reaction,ORR)作为ZABs体系的放电反应,其缓慢的动力学过程极大地限制了器件的功率密度,需借助高性能催化剂降低
学位
随着医疗水平的提高,使用多种药物联合治疗复杂疾病的情况越来越普遍。病人同时服用多种药物可能会导致药物的药效发生改变,为防止因此产生的医疗事故,挖掘潜在的药物-药物相互作用(Drug-Drug Interactions,DDIs)受到了广泛关注。但目前已知的DDIs比较少,通过传统湿实验发现潜在DDIs又耗时耗力。近年来,机器学习被应用于预测DDIs,现有的基于机器学习的预测方法大多能准确地预测DD
学位
目前,联盟链已广泛应用于不同场景中,成为了跨公司和跨组织进行数据共享的主要解决方案。然而由于具有透明性、可追溯性的内在特性,在部署和运行区块链系统时,联盟链上数据的隐私性和机密性很容易受到侵犯。针对此问题,本文根据不同应用场景,对联盟链上数据的隐私性和安全性保护机制进行了研究,提出了以下两种方法解决链上数据的隐私性和机密性问题,具体工作如下。(1)在基于联盟链的安全监管等应用场景中,区块链成员在身
学位
为了应对当前能源需求和生态环境问题,发展可再生能源和新型储能系统已经成为各国解决能源危机、实现节能减排的共识。锌空气电池(Zn-air batteries,ZABs)因高能量密度、安全无毒、成本低廉等优点,成为具有发展潜力的新型能源转换与存储系统。然而其放电过程氧还原反应(Oxygen reduction reaction,ORR)动力学缓慢,严重影响了电池的能量转换效率。贵金属Pt基催化剂虽然具
学位
随着科技进步和社会发展,人工智能相关的应用越来越多地体现日常生活中,例如人脸识别、智能推荐系统等。跨模态语义图像生成作为图像生成领域的研究热点受到了广泛的关注,主要将文本作为图像生成条件,生成与文本描述一致的图像。在图像生成领域,生成对抗网络(GAN)通过对抗学习,近似得到真实图像的分布从而生成图像,因其卓越性能使之成为图像生成领域的主流方法。虽然文本-图像生成任务已经取得了较大突破,生成的图像也
学位
相比于传统无机半导体器件,基于有机半导体材料的有机光电器件具有成本低、半透明、便携和易于大面积柔性制备等优势,是一种极具商业化潜力的光电技术。近年来,伴随着对高性能光电材料的合成与设计、器件工作机理的深入探索以及器件制备工艺的连续优化,有机光电器件性能得到了大幅度提高。有机光电材料多种多样,根据需求可以选择不同特性的光电材料来满足器件制备。例如,高性能的光电探测器要求高的灵敏度和宽的光电响应范围,
学位
养殖鱼类是消费者获取n-3高不饱和脂肪酸(highly unsaturated fatty acids,HUFA)的主要食物来源。然而,相比于野生黄河鲤,养殖黄河鲤肌肉n-3 HUFA含量显著降低。为提升养殖黄河鲤肌肉n-3 HUFA水平,本研究开展了不同生长阶段黄河鲤肌肉n-3HUFA合成、沉积特性,以及不同营养和投喂策略提升黄河鲤肌肉n-3 HUFA含量的研究。主要研究结果如下:1.生长阶段对
学位
如何构建基因调控网络一直是生物学研究中的一个热点问题,目前已在信息论和统计学等多个学科上实现了基因调控网络构建方法的研究。基因调控存在于生命活动的各个阶段,包含了基因间复杂的非线性调控关系,互信息作为一种信息论常用方法被广泛应用于此类基因调控网络的构建。但是互信息方法不能直接测量任意多个基因影响下的间接调控关系,从而导致构建的基因调控网络准确性降低。为了构建更准确的基因调控网络,本文提出了一种基于
学位
近年来,随着基于互联网技术的新兴计算密集型应用的涌现,人们对于智能设备的连接速度和时间延迟提出了更高的要求,目前的云计算架构已经不能很好的满足大规模数据的快速处理。移动边缘计算(Mobile Edge Computing,MEC)通过把工作设备产生的复杂任务卸载到与设备物理距离较近的MEC服务器上,减少了待处理任务的数据传输距离,降低了任务的传输时延,提高了任务的处理速度。考虑到现代智能工厂的制造
学位