利用图结构进行半监督学习的短文本分类研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:pboss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决基于向量空间模型构建短文本分类器时造成的文本结构信息的缺失以及大量样本存在的标注瓶颈问题,提出一种基于图结构的半监督学习分类方法,这种方法既能保留短文本的结构语义关系,又能实现未标注样本的充分利用,提高分类器的性能.通过引入半监督学习的思想,将数量规模较大的未标注样本与少量已标注样本相结合进行基于图结构的自训练学习,不断迭代实现训练样本集的扩充,从而构建最终短文本分类器.经对比实验证明,这种方法能够获得较好的分类效果.
其他文献
课程导引服务是国外大学图书馆的主要工作内容之一。紧密围绕学校的课程和读者需要从课程角度出发建立课程导引服务体系,成为当前国内大学图书馆的努力方向。就国内外高校图
背景:计算机和信息技术的发展,使数据及信息量急剧膨胀,面对“丰富的数据”而“贫乏的知识”这样一种挑战,数据挖掘应运而生,并蓬勃发展。另一方面,医院信息系统中存储了大量的数据
基于引文评价与同行评审方法相结合进行论文评价的思路,利用F1000数据库随机获取同行评审指标论文131篇,利用WoS、JCR、ESI及ImpactStory检索工具获取每篇论文的常用网络计量
指出LibGuides具有组织清晰、后台管理灵活,用户交互性强、社会服务性好等特点。重点分析中国人民大学图书馆协作式学科服务平台建设实践,认为学科馆员主导、用户协作的建设
当前国际科技竞争日益激烈,科技创新能力越来越受到各国政府的重视,科技创新不仅能提高国家的竞争力,而且还能加快企业的技术升级。目前,产学研合作已经成为推动我国科技进步和创
自从我任教以来,一直 在乡村中学任教,面对的学生成绩参差不齐。重要的是学生来源也比较复杂,绝大部分来自农村偏远山区,家庭条件比较差,父母基本没有多少知识,绝大部分是留守儿童和单亲家庭,有的同学一提到作文,则谈虎色变,说手头无材料,脑子空空荡荡,无从下手。在语文教学中,流传这样一句话:“一怕文言文,二怕写作文,三怕周树人”这就是广大中学生学习语文畏惧心理的生动说明。结合语文教学中的重要任务是“写”,
档案是人类活动的原始记录,是文化传承的纽带。然而档案制成材料可以作为大量害虫的营养物质,库房日常管理不善,往往发生虫害,给珍贵文化遗产造成无法挽回的损失。本论文首先
基于Web of Science(WoS)数据库,利用科学知识图谱工具CiteSpace、HistCite构造国外政府信息资源研究的主题、研究趋势与热点等网络,并借鉴网络科学理论及Gephi工具,对国外政
随着全球范围内“回归自然”浪潮的涌起,人们越发重视包括中药在内的植物药,欧美地区市场潜力巨大,是我国中药全方位进入西方国家最为重要的两个地区。长期以来我国中药主要以饮
  本文陈述了选题背景、研究内容与方法、研究现状、研究目的及意义。第二章档案馆信息服务定位概述,论述了与档案馆信息服务定位相关的一些基本概念及档案馆信息服务定位的