【摘 要】
:
因为使用生化实验确定蛋白功能需要耗费大量的时间和资源,所以利用计算技术自动标注蛋白功能意义重大。基于文本进行蛋白质功能预测的方法可以充分利用蛋白序列以外的数据。
【基金项目】
:
国家自然科学基金(61572139)
论文部分内容阅读
因为使用生化实验确定蛋白功能需要耗费大量的时间和资源,所以利用计算技术自动标注蛋白功能意义重大。基于文本进行蛋白质功能预测的方法可以充分利用蛋白序列以外的数据。为了探究文本分类中不同的文本表示对蛋白质功能预测任务的影响,通过实验分析了一系列主流的文本表示方法,包括传统的基于词袋模型的稀疏表示(TFIDF)和含有深度语义信息的稠密表示(W2V,GloVe,D2V),并做了两方面拓展:(1)对基于词向量的文本表示考虑使用IDF加权平均(WW2V,WGloVe);(2)稀疏表示与稠密表示的拼接结合(WW2V-T
其他文献
用日本无刺蔷薇作砧木,通过独干嫁接、2~3枝捆绑嫁接和嫁接—扦插—移栽3种处理,砧木自然生长嫁接做对照,嫁接月季品种绯扇,分别进行嫁接成活率、粗生长量及干性的调查及对比
构树是一种优良的盐碱地园林绿化树种,概述了构树的生物学特性以及在东营地区园林绿化应用中具有的多方面优点。
以三门峡黄土丘陵沟壑区为研究对象,进行植被恢复与重建的试验。5年研究结果表明,试验区的森林资源数量和质量得到显著提升,植被恢复效果显著。
以分析河南太行山猕猴国家级自然保护区济源段的区位优势及自然资源优势为基础,综合论证自然保护区核心区外围实验区发展森林旅游的可行性和目前所存在的问题,针对问题,制订进一
造林时机的选择是造林成活的关键因素,根据树种、苗木类型、立地条件、天气条件等选择不同造林时机,可以确保造林成活率和有效降低成本,禹州市林场在造林时机选择方面的经验值得