【摘 要】
:
随着Web2.0的出现,互联网用户从单纯的信息浏览者成为了信息发布者。尤其在电子商务、社交网络出现之后,互联网用户已经成为了整个互联网最大的信息来源。这些用户产生的数据
论文部分内容阅读
随着Web2.0的出现,互联网用户从单纯的信息浏览者成为了信息发布者。尤其在电子商务、社交网络出现之后,互联网用户已经成为了整个互联网最大的信息来源。这些用户产生的数据对于互联网用户、产品生产商、服务提供商甚至是政府的相关部门都有着重要作用。通过分析处理这些数据,可以了解这些互联网用户的行为习惯、当前热点事件等等。但是这么庞大的数据量已经远远超过了人力所能处理的范围,在这种情况下计算机成为了最好的处理工具,因此便诞生了意见挖掘这一自然语言处理任务。意见挖掘任务旨在通过对带有评价信息的文本集合进行分析,从中提炼出意见摘要,以便用户更直观、更全面地了解全局。其中,细粒度的意见挖掘可以更好的分析评价的细节之处,更有利于决策。本文针对细粒度意见挖掘任务的需要,对评价信息抽取和分类问题进行了研究。首先本文根据细粒度意见挖掘研究的需要,基于在线评论语料建立了一个主观评价语料库。本文在主观评价语料库的基础上,对评价信息的种类和特征进行了总结,分析评价信息的词性以及上下文词性的规律,并以此作为评价信息抽取的理论依据。其次,本文提出了基于条件随机场模型并结合词聚类信息为特征的评价信息抽取模型,以此进行评价信息抽取实验。实验结果表明词聚类信息能提高标注模型性能,与采用短句法依赖为特征的基线实验相比平均有近10%的提升。在抽取出评价信息之后,还需要对这些评价信息进行分类处理,将描述相同主题的评价信息归入同一个类中,降低统计时的误差。本文提出了基于种子集和语义相似度计算的评价信息分类方法。实验结果表明相比基线实验可以有6%左右的性能提升。
其他文献
六盘水地区是贵州省史料记载最早炼铁的地区之一,三线建设时期建成的水城钢铁(集团)有限责任公司,是省内最大的钢铁企业。今天,科学技术进步日新月异,人类越来越多地享受到自
论文以弱势群体为选题对象,运用理论与实证相结合的方法,从政府角度探讨了深圳市弱势群体住房保障制度的创新,提出了可具操作性的弱势群体住房保障对策,论文研究成果对于在现
本文以某矿井回风顺槽为研究对象,对其巷道快速掘进过程中存在的主要技术难题进行分析汇总,分析其主要影响因素,同时提出对应的巷道支护方案。经现场实践后发现,优化后的快速
随着我国市场经济的发展,方便快捷的网络团购一时间如雨后春笋般发展起来,作为新兴的电子商务模式,网络团购有许多的优点,这也正是人们中意的原因。同时由于行业发展过快,导
目的探讨超低频经颅磁刺激(ILF-TMS)对焦虑症患者的疗效。方法对符合《中国精神障碍分类与诊断标准(第3版)》(CCMD-3)焦虑症诊断标准的40例住院患者采用ILF-TMS治疗2周,每天
<正>养老保险制度双轨制走向终结。这个由计划经济向市场经济转型期形成的特殊产物,终于在2015年伊始被画上了句号。从上世纪50年代开始建立的养老制度,到上世纪80年代国家对
契诃夫戏剧精神和艺术风格对20世纪现代戏剧产生了深远的影响,这种影响在戏剧艺术风格方面体现为对淡化戏剧冲突和营造舞台抒情氛围的追求。契诃夫的静态戏剧包含了他独特而
介绍了武钢集团昆明钢铁股份有限公司新建的中小型H型钢生产线的产品大纲、工艺流程、主要设备及其特点。该生产线设计年产能80万t,采用1架粗轧机+10架连轧机的轧制方式,长尺
作为荒诞哲学家,加缪精致而充满刻意性的小说《鼠疫》首先是以灾难为情境的。从灾难中的"替罪羊"和神性英雄来看,《鼠疫》表现出一种与传统灾难的决裂态度来。但是,这种决裂
目的探索骨形态发生蛋白-7(bone morphogenetic protein-7, BMP-7)诱导胚胎小鼠椎间盘髓核细胞(nucleus pulposus, NP)的成骨分化及对经典Notch信号通路的调控作用。方法重组腺