基于文本挖掘的精子发生各阶段的相关基因/蛋白名称提取

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:lanbour156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精子发生是雄性哺乳动物生命活动中一个重要的生物学过程,该过程的每一个阶段都有众多基因/蛋白参与并发挥功能.相关基因/蛋白出现异常是导致男性不育症的主要诱因,但这些基因/蛋白的信息大都分散在科研文献中,而人工从海量文献中提取这些基因/蛋白名称费时费力,因此,基于文本挖掘技术,提出了自动提取精子发生过程各个阶段中发挥作用的基因/蛋白名称的策略.首先比较了3种不同算法在不同词条数目下的分类效果,并确定用支持向量机(support vector machine,SVM)算法对相关文本按照精子发生过程的3阶段分类,然后建立适当的信息提取和筛选方法,从文献摘要中提取每个阶段中的基因/蛋白名称.最后,通过与人工提取的基因/蛋白名称进行比较验证,提取结果的正确率为71.9%,证明了提取策略的可行性.
其他文献
四川是长江上游重要的生态屏障和水源涵养地,肩负着维护我国生态安全格局的重要使命。新中国成立70年来,特别是党的十八大以来,四川认真学习贯彻落实习近平生态文明思想和习
多氯联苯(Polychlorinated biphenyls, PCBs)具有高毒性、致癌性、持久性和生物积累性,已经引起了全球性的环境和健康问题。微生物修复技术可以弥补传统物化技术修复PCBs污染
梅州市县域经济发展水平的空间差异十分显著。文章选取了人均GDP、城镇化水平、农民人均年纯收入等7项指标,采取量图分析法,将梅州市8个县级行政区分为先进、中等、落后三种
介绍新型吸湿发热再生纤维素储能纤维及麻赛尔纤维的功能和特性.并将其与抱合力较好的棉纤维混纺,采用赛络紧密纺工艺制备18.0dtex储能、麻赛尔、棉(30:30:40)混纺纱。重点分析纤维
<正>中国画是代表中国文化形象的标志,几千年来从发生、发展到现在,浓缩着中华民族的文化精神、哲学理念及美学个性,它独特的笔墨语言艺术形式,精深规范的理论和技法,在历代
海南岛屯昌玄武质科马提岩成岩时代一直未获解决。作者利用 Sm- Nd同位素法测试了 5件样品 ,获得岩石 Sm- Nd同位素等时线年龄 1 687± 1 0 Ma,及与其相近的 Nd模式年龄 1 63
对冬季气象条件进行了分析统计,设计了热泵新风机组,计算了在最不利气温条件下所需要的新风排风混气比,热泵机组供热量。计算数据结果表明,当有充足的建筑物排风时,该热泵机
<正>www.iresearch.com.cn1 中国电子商务软件行业发展概述2 中国电子商务软件行业市场规模3 中国电子商务软件行业企业分析4 中国电子商务软件行业需求分析5 中国电子商务软
会议
分析并总结了影响用户对特定微博兴趣的若干因素,在此基础上基于潜在因素模型提出了1个融合显式特征和潜在特征的社区热点微博推荐算法(community micro-blog recommendation