Acr基因数据库的构建与谱系分布等进化分析

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ll05
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着CRISRP-Cas技术的普及,对CRISPR-Cas起抑制作用的Acr也逐渐得到关注和研究,以Acr为对象进行研究分析有其重要意义:(1)有研究表明Acr可以有效降低CRISPR-Cas技术的脱靶效应,针对Acr的研究有助于提升CRISPR-Cas技术的可用性和推广其应用领域。(2)虽然Acr研究较为热门,但目前已发现的Acr序列较少。基于已有的数据分析其特征,这有利于识别更多其他类型的Acr,无疑推动了对Acr的基础研究和应用研究。本文研究主要围绕Acr以及Cas与Acr的关系进行。从文献数据收集开始,截止2020年3月,Acr数据库总共有3627条序列,这包含了69条实验验证的序列和1253条预测序列,剩余的序列是我们基于验证序列同源搜索筛选得到的。这些序列属于8种不同类型,来自46个不同的Acr家族。关于序列的相关信息则统计在6张数据表格中,包含了序列编号、Acr类型、Acr家族以及相关基因信息和蛋白结构信息等。我们在这些数据信息的基础上建立了一个在线数据库网站AcrBank(http://cefg.uestc.cn/AcrBank),该网站主要帮助用户能深入全面地了解其Acr序列,同时还提供了同源比对和关键字搜索功能,方便用户查询感兴趣的内容,以上这些数据都提供打包下载。在已有数据基础上,我们进行了共进化分析和旁侧基因分析。在共进化分析中,我们发现其Cas与Acr的谱系分布并不完全一致,虽然大部分Cas的分布范围大于其对应Acr的分布范围,但有其反例,如AcrVA。同时发现自靶向能作为筛选Acr的特征,但存在Acr不含有自靶向的情况,这反映了Acr在引进时有其复杂的过程。之后我们单独研究了Acr序列,并通过同源搜索和先验准则筛选获取了Acr同源序列。在密码子分析中发现其Acr序列与非Acr序列在密码子使用偏向性上存在明显差异,这表明了Acr可能是近期引入到宿主基因组中。在旁侧保守基因分析中,我们发现在AcrIF、AcrIE和AcrIIA附近很可能存在其保守序列。经过功能域注释后,可看到HTH功能域家族存在于多个不同类型Acr的附近,另外有部分Acr家族存在其独有的功能域,如只有AcrIIA9的附近序列存在其锌指结构域。这些特定的功能域有助于识别筛选新的Acr,对研发识别Acr算法提供了理论支持。
其他文献
流域综合治理研究是当前环境可持续发展的热点问题,也是保障流域水安全、生态安全和经济社会可持续发展的重要措施和工具。近年来,中国经济的快速发展带动了中国农村的各项产
当今世界,信息技术快速发展,高新技术产业引领时代,我国未来的经济与科技建设需要大量的数学应用型人才。所谓数学应用型人才,指的是能将所学知识应用于生活,化基础知识为基本技能
中国加入WTO后,国内金融业将面临巨大的冲击和挑战。作为国有商业银行的农业银行,在国内同业竞争中尚占不到上风,如何才能在竞争主题多元化后立于不败之地?笔者认为,只有从自身寻
从峰值电流型脉冲宽度调制器原理出发,通过分析UC1846集成电路输出信号和直流母线峰值电流信号特征,提出了一种消除峰值电流取样信号前沿噪声的解决方案.
目的:探讨微创术和亚低温脑保护联合治疗高血压脑出血的临床疗效,以提高高血压脑出血的治疗效果.方法:内科保守治疗组(简称对照组)30例采用内科综合治疗,微创术和亚低温治疗
目的:探讨肺癌患者血清中肿瘤相关物质群(TSGF)水平及其临床意义。方法:用光电比色法检测210例肺癌患者、44例肺良性疾病患者及112例健康对照的血清TSGF水平。结果:与肺良性疾病组
自由支配时间的增加仅仅为扩大消费需求提供了一定的时间条件,并不能保证休闲消费得以实现。要真正刺激人们的休闲消费还须以劳动、收入、合理的假日制度安排、一定的生活方式
题目(2017年北京市朝阳区高三一模19题)已知椭圆犆:C:x^2/a^2+y^2=1(a〉1),离心率e=√6/3.直线l:x=my+1与x轴交于点A,与椭圆C相交于E,F两点.自点E,F分别向直线x=3作垂线,垂足分别为E1,
目的:观察麻醉诱导期间以不同速度静注阿曲库铵对血压和心率的影响.方法:选择80例拟行全身麻醉患者随机分为4组,每组20例,均以咪唑安定0.1 mg/kg、依托咪酯0.2 mg/kg、芬太尼
近日,由中华环保联合会、北京化工大学联合主办的“2013中华环保民间组织可持续发展年会”在京举办。本届年会以“民间力量——助力绿色新路”为主题,来自全国的300余家环保NGO