大豆基因组SSR分布特征和高密度遗传图谱的构建、整合与应用

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:fclhp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大豆[Glycine max(L.) Merr.]起源于中国,由一年生野生种(G.soja Sieb.&Zucc.)驯化而来,在我国已经有大约5000年的种植史。目前,我国大豆种质库中已经收集了23,587份种质资源材料,为大豆育种提供了宝贵的基因资源。大豆以其含有优质蛋白和高脂肪含量的特性,日益成为世界上最重要的豆科作物之一。近年来,大豆育种的目标不仅在于不断提高大豆的产量而且更加注重品质的改良。随着大豆基因组学研究的飞速发展,分子育种必将成为大豆遗传改良的重要途径。构建高密度的、稳定的遗传图谱将为质量/数量性状的遗传研究、标记辅助选择(MAS)、基因图位克隆、比较基因组学研究、物理图谱构建乃至全基因组的序列组装提供基本的工具。特别是构建基于我国种质材料的、高密度的大豆遗传图谱将更有效地服务于我国的大豆分子育种实践。   本研究的主要内容是:利用现有的序列信息,分析大豆基因组内SSR的分布特征和开发新的SSR标记并用于构建高密度的大豆遗传连锁图谱;在此基础上通过整合7个不同群体(NJRIKY、NJRSXG、NJRSBN、NJBIEX、NJSPNN、NJTFSX、NJRSWT)的数据构建一张高密度的基于SSR标记的整合图谱,并对大豆基因组的结构特征进行分析,主要结果如下:   1.大豆基因组SSR分布特征分析   对439,714条大豆EST进行聚类,得到包含95,637个unigene的EST-unigene数据库。其中包括62,620个contig和33,017个singleton。在重复基元的总长度为14bp以上的条件下,对大豆的95,637个unigene和40个BAC克隆序列进行SSR分析。其中,在9,844(10.29%)个unigene序列中包含有11,681个SSR重复基元(motif),包括106个复合型SSR,其中三核苷酸重复基元最多(46.57%),二核苷酸重复基元次之(37.56%)。在40个BAC序列中包含有772个SSR重复基元,其中包括8个复合型SSR,二核苷酸重复基元最多(60.47%),三核苷酸重复基元次之(25.26%)。四到六核苷酸的重复基元在unigene和BAC序列中的发生频率都小于10%,且无明显差异。由此推论在unigene序列中,SSR的频率为SSR/6.75 kb;在BAC基因组序列中SSR的频率为SSR/7.19 kb。   在SSR重复基元中,不同碱基序列出现的频率也不相同,主要分为17种不同的类型。在unigene序列中,最常见的重复基元序列是AG/TC(22.86%),其次为AT/TA(11.77%)和AAG/TTC(11.06%);在BAC克隆序列中最常见的重复基元序列均为AT/TA(41.49%),其次为AAT/TTA(13.22%)和AG/TC(11.52%)。在四和五核苷酸重复基元中,AAAN/TTTN和AAAAN/TTTTN,特别是(AAAT)n和(AAAAT)n的发生频率最高。在此基础上,开发了540对EST-SSR和231对BAC-SSR引物,同时用于NJRSXG和NJRIKY图谱的构建。BAC-SSR引物在NJRIKY和NJRSXG群体间的多态性分别为36.80%和31.17%,明显高于EST-SSR引物的多态性19.40%和13.70%。合并两个群体的数据后,来源于BAC序列的引物多态性可以达到45.45%,来源于unigene序列的引物多态性达到了28.33%。   分别随机选取定位在整合图谱中的35对EST-SSR和35对BAC-SSR引物,利用本实验室常用的6个作图群体的12份亲本材料,对新开发的SSR引物进行遗传评价。70对引物共检测到332个等位基因,其中176个等位基因来自代表非编码区序列的BAC克隆,156个等位基因来自代表编码区的unigene。每个位点检测到的等位基因数在2-8个,平均每个位点检测到4.7个等位基因。其中检测到5个等位基因的位点数最多(31.43%)。GNB128检测到的等位基因数最多(8个),而且来自于BAC序列的引物比来自于unigene序列的引物可以检测到更多的等位基因数(5.02 vs4.46)。70对引物中超过90%的引物的PIC值都大于0.5,并且有14个引物的PIC值超过了0.75。   2.大豆重组自交系群体NJRSXG的结构分析及SSR图谱构建和应用   利用447对覆盖大豆全基因组的SSR引物,对RIL群体NJRSXG的147个家系进行群体遗传结构的分析。结果表明,绝大多数SSR座位趋于纯合,所有家系基本纯合,母本先进1号及父本赶泰2-2对群体的遗传贡献分别为0.485和0.515,群体各家系基因型组成符合正态分布。利用该群体构建了一张包含400个SSR位点的遗传图谱,包括23个连锁群,图谱总的遗传距离为1,447.9 cM,标记平均密度为3.9 cM/标记。   利用NJRSXG图谱采用采用QTLNetWork2.0软件对2005和2006年的大豆种子蛋白质含量进行QTL定位,共检测到5个控制种子蛋白含量的加性效应QTL,分别位于A2-2、B2、D1a-2和K连锁群上,其中1个表现为遗传正效应,4个表现为遗传负效应,总的遗传贡献率为42.88%。另外检测到3对影响种子蛋白质含量的加性(×)加性上位互作效应的QTL,分布在F、G、K、H、L和O连锁群上,遗传贡献率为7.14%。另外还检测到3个QTL与环境存在互作,遗传贡献率为0.71%。而且3对上位效应都检测到了与环境的互作,遗传贡献率为1.22%。其中,与qPTK-1(Satt459-GNB173)连锁的标记GNB173被定位在了BAC克隆AC173960(133kb)上。   3.大豆重组自交系群体NJTIKY图谱的加密及应用   在前人研究的基础上,利用新开发的540对EST-SSR和231对BAC-SSR引物和部分其它引物对NJRIKY遗传图谱进行了加密。更新后的图谱共有834个位点,包括580个SSR位点、184个RFLP位点、44个EST位点,15个RAPD位点,7个TFs3()末端位点、3个经典标记位点和一个未知标记位点。其中新开发的引物产生的SSR位点为199个,分布在24个连锁群上。更新后的图谱覆盖大豆基因组2307.8 cM,标记间的平均密度为2.8 cM,图谱总长度减小了1288.1 cM。各连锁群上大于20 cM的gap数目由原来的42个减少到0个。   利用更新后的NJRIKY图谱将8个SMV抗性基因定位在了D1b连锁群上,增加了抗性基因间的标记数目,进一步验证了抗性基因成簇分布的现象。其中,与Rsc20连锁的2个标记GNB026(69.5 cM)和GNB053(72.1 cM)被定位在了大豆基因组序列的Supercontig_74上。利用CIM法,同时检测到了与10个性状相关的113个QTL,分布在12个不同的连锁群上。与图谱更新前相比,部分QTL的位置发生了改变,绝大多数QTL的置信区间明显缩短,与相邻标记的连锁更加紧密。同时在H、N和O连锁群上分别检测到了10、6和27个新的QTL位点。所有检测到的QTL中遗传贡献率超过10%的QTL有55个。   4.大豆整合图谱的构建及基因组结构分析   使用JoinMap3.0软件,以NJRIKY图谱为基础,整合来自7个群体的2,623个分离数据,构建了一张包含1,378个位点的整合图谱,其中包括1,124个SSR位点,占位点总数的81.6%。该图谱包含20个连锁群,覆盖了基因组2,444.2 cM的遗传距离,每个连锁群的标记密度为0.74(F连锁群)到3.59(I连锁群),平均密度为1.77 cM。每个连锁群上的标记数在33到154之间,平均每个连锁群有69个标记。每个连锁群的长度变化在83.83 cM(B2连锁群)到188.18 cM(A2连锁群)之间,平均长度为122.21 cM。每个连锁群上的SSR标记数为23个(D1a连锁群)到139个(F连锁群),平均为56.2个。仍有15个大于10 cM的gap,其中包括位于H连锁群(26.92 cM)和I连锁群(24.09 eM)上的2个大于20 cM的gap。   375个定位在整合图谱中的unigene中,具有功能的有252个。其中159个unigene被成功的进行了GO分类,包括生物进程、细胞组分和分子功能3个类型。其中,101个unigene(63.52%)参与生物进程,90个unigene(56.6%)参与细胞组分,分子功能中包含114个unigene(71.7%)。生物进程中所占比例最大的是metabolic processes(60.4%),其次是cellular process(57.41%);细胞组分中所占比例最大的是cells(98.9%),其次是cell part(93.3%);分子功能中所占比例最大的是catalysis(68.4%),其次是binding(54.4%)。为大豆的功能基因定位、图位克隆和分子标记辅助育种奠定了基础。   利用36个BAC克隆的141个BAC-SSRs位点,将15个大豆基因组的Supercontig序列定位在了整合图谱中1-13个不同的连锁群上,并在此基础上鉴定出基因组内广泛存在的部分同源区段,为大豆起源于古多倍体提供了新的遗传学证据。同时结合BAC克隆与unigene的精确匹配,估计大豆基因组内基因的数目为52,278个。   利用来自7个群体的2,623个分离数据对大豆基因组的偏分离特点进行分析,并将376个偏分离位点定位在了不同群体的遗传图谱中。每个群体中偏分离的百分率分布并不相同,最小的为NJRSWT(6.7%),最大的为NJTFSX(25.6%)。定位到图谱中的偏分离位点有的表现为成簇分布,有的则表现为随机分布。其中A2、C2、D1b、F、N和K连锁群在不同的群体中都发现了偏分离位点,由此推断在这些染色体上可能存在引起偏分离的基因。
其他文献
《义务教育语文课程标准》中指出“学生是学习的主体.语文课程必须根据学生身心发展和语文学习的特点,爱护学生的好奇心、求知欲,鼓励自主阅读、自由表达,充分激发他们的问题
会议
输电线路勘测设计是电力工程建设中的一个主要环节。通常输电线要经过不同的土地覆盖区,设计一条优化的线路需要线路跨区内的地貌、地物和地质条件等相关信息。利用遥感技术可
我国产权市场是新兴的要素市场。伴随着产权市场的发展,产权市场的统计工作也取得了很大进展。然而,从总体上看,产权市场的统计工作与我国统计法的要求,与行业发展的需要还存
信号分析与处理是国内外大地测量学和数学物理学,信号处理这儿门学科的交叉领域是理论和应用研究比较边缘的前沿课题之一。信号分析与处理是有效提取和利用客观实际信息的重要