统计与规则相结合的汉语意见抽取方法研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:baggio126000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展和普及,特别是Web2.0的兴起,网上购物、微博、博客及BBS论坛等各种新兴的互联网应用正成为人们感兴趣的热点,而网上购物后的评论、博客、微博以及BBS上的意见信息也在与日剧增。这些评论和意见信息通常具有比较重要的价值,一般政府部门可以通过互联网上的评论来了解人们对某个政策法规或事件的看法并进行及时的科学决策。商业机构可以通过调查互联网上的产品评论来监测顾客意见和预测市场趋势,进而改进他们的服务和产品或采取更为有效的有针对性的营销策略。消费者也可通过浏览其他消费者对某个产品的网络评论并作出判断他们是否购买该产品。因此,怎样有效处理和分析这些具有情感的意见信息是文本情感分析领域亟待解决的问题之一。意见挖掘(opinion mining)研究正是为了满足这些应用而发展起来的,而且已经成为当前自然语言处理(NLP)相关领域的研究热点之一。意见挖掘一般包括三个方面的内容,即有主观性识别、意见极性分类和意见抽取。而本文研究的是意见抽取相关方面的问题。本文利用统计和规则相结合的方法研究汉语中评价对象即主题特征和评价对象、情感词关系对抽取的问题。具体地,本文从将以下几个方面展开论文的研究。首先,本文首先介绍了意见挖掘方面的基本概念,意见挖掘包括的子任务,意见挖掘研究的层次和研究重点,然后介绍汉语意见挖掘研究现状,以及意见挖掘研究的在国内外研究现状。其次,意见句中的评价对象的抽取是细粒度词语级意见挖掘要研究的关键问题之一。为了提高评价对象的抽取性能,本文在条件随机场模型,最大熵模型,支持向量机三种系统模型下综合名词性信息,频率信息,依存关系等各种信息,重点探索在不同特征和不同模型框架下对评价对象抽取的影响。实验结果表明,本文在引入各方面的特征信息后经过三种模型的对比发现条件随机场模型更适合对评价对象进行抽取。最后,本文主要基于统计和规则相结合的方法研究评价对象、情感词关系对抽取问题。首先应用t检验和规则方法对评价对象,情感词关系对进行抽取然后利用查字典的方式进行再抽取,最后采用互信息的方法对评价对象、情感词关系对进行扩展。并将第三章中最好评价对象识别结果采用就近匹配方法与标准的评价对象数据采用同样的方法进行比较。实验结果表明:本文提出的两种对评价对象、情感词关系对抽取方法是有意义的。
其他文献
分类所关心的一个根本问题是如何有效地提高分类系统的泛化能力。尽管传统的分类技术在一些领域己经得到了成功应用,其泛化能力也得到一定程度的认可,但是随着时代的进步和科
基于内容的图像检索技术涉及到计算机图像处理、计算机图像识别和图像数据库等领域。在数量巨大的数字图像数据库中要想提高图像的检索速度就必须提高图像的处理速度。由于图
医院信息化建设的不断发展,要求医院建立起自己的电子病历系统。电子病历代替传统纸质病历文档,极大的方便了病历的管理,提高了医院的工作效率。为了保证电子病历跟纸质病历
目前,互联网行业在掀起新一轮云计算和大数据的浪潮,数据挖掘如火如茶,在这其中视频产业尤为突出。与此相对应的是处在信息大爆炸时代的人们,每天都在接受海量数据的冲击。如
日益激烈的市场竞争中,企业在环境的动态变化和自身的能动选择下不断演化,才能生存和发展。企业模型是企业系统的抽象,可以用来分析企业的演化特性。目前,比较常用的企业模型受结
图像分割是图像处理和计算机视觉领域低层次视觉中最基础,最重要的领域之一,同时具有广泛的应用价值。目前,现有的分割算法在实际的应用领域中都存在各种各样的问题,诸如耗时性,目
无线传感器网络是一种新型的信息获取平台,它具有成本低廉、可快速部署、自组织网络,使用灵活性强等诸多优点。无线传感器网络通过将大量的微型传感器节点以随机的方式部署在
在图像分类及标注、文本及语音分类、基因功能分析等实际应用中,分类所面临的数据已呈现出多标签特性,多标签分类已成为分类研究中的一个重要研究方向。与单标签分类问题不同
现代电网的规模不断扩大、电压等级不断升高,仿真分析成为现代电网研究的重要手段。然而,传统分析方法在面对大电网的海量仿真数据时缺乏有效的处理工具和手段,难以帮助分析人员快速掌握电网运行信息、深入研究系统变化规律。本文围绕电力系统仿真分析中的高维时序数据,通过可视分析技术,提出了一种空间分布地理图与时变曲线图协同分析的关联分析方法。空间分布地理图对高维仿真数据进行基于地理分布的分层可视分析,时变曲线图
为了对电能质量进行监测,电力公司需要部署电能质量监测设备用于电能质量数据的采集。由于不同厂商生产的电能质量监测设备采用的数据规约和通信协议不同,每家厂商都有自己专用的监测设备管理系统。如果电力公司采用多家厂商的设备,就需要使用多个不同的监测设备管理系统来管理这些监测设备。为了使用户能够对不同厂家的设备进行统一管理,本课题提出了基于WCF技术的电能质量监测设备管理方案,将各厂商监测设备服务器端方法封