产品特征自动提取及情感分类研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:scg5252
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展和Web2.0技术的普及,产品的在线评论数量越来越多。人们需要借助于情感分析技术从海量信息中获取对产品的情感倾向,以帮助自己形成对产品的正确认识。但是传统的文本级和句子级情感分析已经无法满足人们全面细致的了解产品的各部件和性能的需求,因此特征级情感分析越来越受到人们的重视。本文围绕特征级情感分析,展开了相关的理论和应用研究,主要工作包括:(1)基于Lasso的特征选择方法及其在产品特征自动提取中的应用。产品特征的自动抽取是情感分析中的重要研究内容。本文提出了一种基于特征选择和词频及共现剪枝的提取产品特征的方法。首先引入在分类任务中被广泛采用的Lasso(Least Absolute Shrinkage and Selection Operator)方法,将产品特征抽取问题转换成分类中的特征选择问题,通过Lasso生成稀疏模型的特性得到产品候选特征集;然后根据候选特征集中的特征在文本中出现的频率进行排序和词频剪枝;最后经过进一步的合并和PMI(Point Mutual Information)剪枝处理,得到最终的产品特征集。在中文产品评论集上的实现验证了本文提出方法的有效性。(2)依存关系和褒贬指向规则(DCDT, Derogatory and Commendatory Direction Tendency)在提取产品特征观点词中的应用。对评价文本进行依存分析,基于产品评价特征,利用依存关系和褒贬指向规则提取出与产品特征相关的观点词,构成观点词集;然后使用情感词典判断情感词集中每个情感词的极性;最后给出每个产品特征的情感极性判断结果。实验结果表明,本方法可以高效地得到对产品各方面的情感分类的结果,能够很好地帮助用户获得对产品各部分和性能的褒贬倾向的全面了解。
其他文献
该文认为系统管理应用应是针对大型、复杂、异构的通信网络环境,因此系统管理在功能上和体系结构上均比以往的网络管理有很大的突破,从整体上对系统管理给出了一个框架上的描
该文首先概述了先后出现的各种应用程序编程模型,而后对目前应用比较广泛的EJB体系结构、CORBA体系结构和DCOM体系结构三种主流的网络应用软件体系结构进行研究、分析,并比较
该文在总结作者亲自参与的《文渊阁四库全书》电子版的基础上,探讨了大规模古籍电子化的关键技术及实现.该文探讨了OCR相关的前后处理技术,使OCR真正实际应用于大规模古籍电
该文论述了采用面向对象方法去实现红塔卷、包设备管理信息系统的理论、方法和实现过程.全文共分六章.第一章介绍了课题为源、研究目标、意义和内容.第二章论述了MIS开发的一
该文通过对网络计划基本原理的研究,并参考了国内外最新科研资料,针对大型单件小批混合生产企业的生产特点,提出产品网络图改进设计,使传统的网络计划适应单件小批的生产特点
为了更好地开展危矿找矿工作,充分利用矿产节约资源,本文提出BP算法智能提取等高线建模。对等高线进行抽取赋值栅格化,初步建立粗略数字高程模型(DEM),随后基于“分块”思想,利用B
嵌入式系统被广泛地应用到工业控制系统,仿真系统,医疗仪器、信息家电,通讯设备和手持数字设备中.在某些传统应用中,嵌入式设备只需要为用户交互提供较为简单的字符界面就满
近年来,传统的通信方式如电报、电话等,已不能满足人们日益增长的通信需要。随着多媒体、图像处理、计算机及网络等技术领域的进展,通信已发展到视频通信阶段。目前,许多大公司都
该文对多传感器多目标的有源数据融合、无源数据融合算法进行了改进,对点迹/航迹关联算法、属性参数与航迹关联算法作了比较深入地研究,给出了关联的具体算法,使得整个系统在
该文研究了集群服务器系统的基本理论,论述ROSE集群服务器系统设计基本原理、方法和关键技术.