离散输入加性模型的构建及其基因组学的应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:nitendo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离散型数据包括标称型与计数型数据,是数据科学与人工智能领域中重要的数据类型。离散型数据作为输入构建回归模型,面临着将离散输入值映射到连续输出值上的问题。本研究基于Rademacher复杂度对离散值输入下高斯通用加性模型的误差泛化界进行了推导,在理论上探索了该类模型的估计方法与表现能力。此外,本研究还将高斯通用加性模型应用于全基因组数据中,为选择性育种提供了一种新的解决方案。本文主要阐述了以下三个方面的工作内容:(1)本文在Rademacher复杂度的基础上对离散值输入下高斯通用加性模型的误差泛化界进行了推导。在全基因组选择研究中,由于输入数据为离散值,模型假设空间的复杂度直接影响模型的泛化误差大小。为此本文分别推导了高斯通用加性模型中均值和方差的Rademacher复杂度上界,并以二项分布的输入数据为例得到了在分类和回归问题中较为紧致的误差泛化界。(2)本文阐述了针对小样本数据集高斯通用加性模型的改进及权重求解过程。本文将输出数据分布函数中的均值和方差均参数化以构建高斯通用加性模型,并将分布函数连乘得到损失函数。求得损失函数最小值时均值和方差的权重,并通过添加Bagging集成学习方法提高方差预测精度。(3)本文将高斯通用加性模型应用于长牡蛎数据集,得到其肥满度均值和方差的回归权重,为选择性育种提供了更多的参考参数。将长牡蛎全基因组数据清洗后,通过二次特征提取关联位点,并应用于高斯通用加性模型,对其均值及方差进行预测。本文经仿真实验证明所推导的高斯通用加性模型误差泛化界的正确性,为将其应用于全基因组数据提供了理论基础。并将高斯通用加性模型应用到长牡蛎肥满度的预测中,将结果与其他方法对比,得到0.994的均值拟合精度,70%以上的样本真值落在预测出的置信区间中,此结果表明本文方法在全基因组选择中能够提供更加可靠的参数参考。
其他文献
我国是一个地震灾害频发的国家。经济进步,人口增加推动了高层钢结构的发展,高层建筑集中了众多人员和大量财富,地震作用下如果发生破坏会产生巨大的损失,高层建筑抗震设防尤其重要。框架—剪力墙结构体系是中高层建筑结构中常用的结构体系,钢板剪力墙作为一种出色的抗侧力耗能构件,能够有效地提高建筑结构的抗震性能。课题组提出了一种可预制装配的新型耗能减震构件——防屈曲开斜槽钢板剪力墙,其受力机制明确,易于调节抗侧
目的:实验研究金水六君煎及其拆方对COPD阴虚痰饮证模型大鼠的影响,检测其血清IFN-γ、IL-1β、IL-4、TNF-α含量变化,观察其黏蛋白MUC5AC,MUC5B基因表达的变化,探讨金水六君煎治疗COPD阴虚痰饮证的作用机制,为金水六君煎治疗COPD阴虚痰饮证的临床应用提供实验依据。方法:从60只清洁级SD雄性大鼠中随机抽选10只作为空白组;其余50只为造模组。对造模组大鼠采用气道内滴入脂多
耕整地是秋收后或播种前最基本的作业。主要是通过翻压或者旋耕将表层板结的土壤、地表的杂草、残留的秸秆、残茬进行粉碎后埋到播种层以下,疏松粉碎板结的土壤,起到改良土壤耕层结构属性的目的,使作物更好的吸收播种层土壤的养分,促进农作物的生长发育。目前,合作社的种植模式已经得到了广泛的推广,玉米的播种和收获也已经普遍实现了全程机械化。现有的玉米收获机械会在机器后部或中部安装秸秆还田机对玉米秸秆进行粗略的粉碎
随着社会对能源开发及环境保护需求的不断提高,光热发电以及新型熔盐核反应堆技术不断发展。作为其中关键的传蓄热介质,熔盐热物性参数显得至关重要。其中熔盐的光谱辐射特性是熔盐利用中的关键参数。本研究采用双厚度透射法进行液态半透明工质的实验研究。考虑到传统的液态半透明介质测量实验需采用窗片封装,窗片间的多次反射与折射是影响测量精度的重要因素。因此本研究创新性地设计并搭建了一套测量装置,通过让液态半透明介质
[目 的]通过对肺小结节的高分辨率CT的影像学特征与病理类型、肺腺癌病理亚型、肺腺癌病理分型及淋巴结转移之间的相关性研究,探讨肺小结节的科学临床处理及手术方式的选择。
背景先天性脊柱畸形是妊娠期4-6周胚胎中胚层脊索发育异常所致,其发病率约为1‰。先天性脊柱畸形会导致脊柱不对称生长,产生侧弯、后凸等表现。先天性脊柱畸形通常分为3种类
黄瓜(Cucumis sativus L.)是重要的设施栽培作物,设施土壤盐渍化严重制约了黄瓜的生产。microRNA(miRNA)通过作用于靶基因参与调控植物对非生物逆境的抗性。课题组前期通过对高通量测序结果分析,得到了一些在盐胁迫下差异表达的黄瓜miRNAs。本研究在此基础之上,进一步挖掘响应盐胁迫的关键miRNAs的功能。主要结合转基因技术和耐盐性鉴定,筛选出一种或多种在盐胁迫中发挥作用的m
鹅肥肝是一种富含卵磷脂和不饱和脂肪酸的高档健康食品和水禽产品,在国内外均有较大的消费市场,且随着人们生活水平的提高持续扩大。朗德鹅是肥肝生产的主要品种。填饲过程中,以玉米为主体的高能量饲料,通过肠道的消化吸收,转变为脂肪后沉积于肝脏和其他组织中。肠道是营养物质直接接触的界面,也是肠道微生物直接接触的界面,可以通过肠肝轴影响机体内组织器官的生理功能。肠道除了基本的消化吸收功能外,还具有内分泌功能、多
生长素抑制蛋白基因(Auxin repressed protein gene,ARP)受到生长素(IAA)信号抑制表达,在植物的生长、发育、抗病、抗逆以及种子休眠等过程中发挥重要的作用。但有关水稻生长素抑制基因OsARP1的研究,目前还没见报道。本文采用基因过表达和CRISPR/Cas9基因敲除转基因技术,创建水稻OsARP1基因过表达及其启动子和外显子敲除转基因植株,研究这些转基因植株在种子萌发
《普通高中生物学课程标准(2017年版)》强调了对学生进行学科核心素养的培养,挖掘了核心素养的构成元素,明确了教学目标要定位于学科核心素养的新要求。为了落实核心素养教育的要求,需要从课程教学设计出发,要求课程教学的设计不能单单是某一个孤立的章节,而是注重知识的整体性和逻辑性,围绕某一个具体的主题,实现知识之间的重组,构成一个课程单元;再者,从学习方式出发,教学目标的转变也意味着学习方式要发生转变,