面向产品评价的细粒度情感分析技术研究

被引量 : 0次 | 上传用户:hanxiqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着电子商务的迅猛发展,互联网中出现了大量的产品评价文本。人们开始寻求通过自动的方法在这些海量的主观文本中抽取出有价值的信息,于是情感分析研究应运而生。作为情感分析的一个重要的子任务,细粒度的情感分析,如评价发出者和评价对象的识别,由于可以获得用户评价的精细化信息,因此越来越受到研究者的关注。目前细粒度情感分析研究中,基于模板和规则的方法来抽取细粒度要素的方法是其中的一种主要途径,然而这种方法存在灵活性弱,扩展性差,召回率低等缺点。另一种主要途径是将细粒度情感要素的抽取视为序列标注问题,采用基于随机条件场、隐马尔可夫模型等序列标注方法来抽取特定的情感要素,但是这些方法无法很好地处理评价文本中大量存在的评价元素之间的长距离依赖,这也降低细粒度情感分析性能上提升的空间。围绕着对产品评价文本细粒度情感分析任务,本课题进行了一系列系统化的工作。第一,提出了面向产品评价文本的细粒度情感标注体系。该体系使用领域本体的形式组织和表示产品的相关概念节点。依据该体系,对1000短篇相机的产品评论文本进行了标注,建立了一套高质量、细颗度情感分析语料(CUHIT Opinmine)。第二、文本提出了一种使用基于依存句法树结构的条件随机场模型对评价对象与评价描述进行结合抽取的方法,该模型改善了线性条件随机场在标注细粒度情感要素时无法适应情感要素长距离语义依赖的问题,使用树边特征表达了细粒度要素中的句法相关性。在CUHIT Opinmine语料库与COAE2011任务三数据集对该模型分别进行了实验和评估。最后,为了进一步提高产品评价的评价对象的识别效果,本文提出了一种基于半监督的学习本体节点新实例的方法来处理产品评价文本出现的词典未登入领域专有词。实验中将该方法的输出结果构建为一套单独特征集提供给细粒度情感分析模型使用。本课题的贡献如下:一方面,标注的一套产品评价细粒度语料为后续的情感分析提供数据支持;另一方面,提出的使用基于依存句法树结构的条件随机场模型的方法性能更优,验证了使用树边能更好的表示评价文本的语义的相关性的推断;最后,课题提出了加强产品评价细粒度情感分析中对词典未登入领域专有词的识别方法,实验证明该方法能显著提高评价对象识别的召回率。
其他文献
刑事附带民事诉讼是我国刑事诉讼的基本法律制度,该制度对于维护刑事受害人及其近亲属的合法权益具有深远的意义。我国现行的刑事附带民事诉讼法律制度的构造主要着重于降低司
圆锥形零件在机床、汽车、飞机、航天等各个行业中有着广泛的应用,圆锥配合具有安装快速、定位准确的优点,因此它在很多机械结构中均能见到。为了更好地生产、使用圆锥形零件,常
电子束焊接会产生焊缝余高,在未添加填充材料且存在大量金属蒸发的情况下,所产生的余高必定是由焊接过程中熔池金属的体积膨胀造成的。因此,余高大小将直接关系到焊缝内部的组织
煤矿井下使用水平煤仓探讨郑州煤炭设计研究院薛金贵新密市煤炭管理局王超杰水平煤仓在国外早已使用,英国使用最为普遍,在现有的生产矿井中,水平煤仓占煤仓总数的90%以上,并且使用效
一.我国市场手动牙刷功效特点分析与评价目的:了解我国市场牙刷产品中功效范围及内容,评价牙刷功效特点。方法:在沃尔玛购物广场西安市金花南路分店采用整群抽样采样,购买全部12
背景与目的本实验室于2008年发现Apelin能够增强心肌细胞SERCA功能并且增加钙瞬变幅度。本研究在以上研究基础上进一步研究Apelin对心肌缺血再灌注的保护作用。不同于已有的
居民收入密度函数的核密度估计具有非连续性,因无法通过积分计算特定收入区间的人口规模,故在核密度估计基础上,构建二分递归算法用以测算特定收入群体规模。使用中国健康和
应用生态学的思维和方法论审视当前课堂教与学变革创新是教育学的重要研究领域。该文借鉴生态学的原理与方法,从目标、角色与关系、活动与过程、评价等四个维度解读了当前课
随着人们生活水平不断提高,建设生态宜居城市备受关注,其中构建景观水体是生态居住区建设的重要内容之一。景观水体的建设需要大量水资源,而目前我国大部分城市都处于缺水状况,水
随着现代科学技术的高速发展,数据采集及其处理技术的应用越来越广泛,但由于科学研究和实际工程项目的需要,单通道数据采集已经无法满足设计的需求,多通道数据采集已成为发展的必