基于树形结构的产品特征提取算法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:jim_666cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是对文本中的观点、情感和主观性的计算处理过程。基于特征的用户评论情感分析是情感分析领域近几年出现的一个研究热点,它主要面向产品的用户评论,进行产品特征提取、情感词提取和情感分类等方面的研究。为了更加准确、灵活地提取产品特征,本文提出一种新的基于树形结构的算法框架。该算法框架充分结合底层算法和树形结构信息,在较好地提高产品特征提取效果的同时,具有较高的参数灵活性。基于树形结构的产品特征提取算法将现有产品特征提取算法当做底层算法,通过评论网站上的树形结构信息指导产品特征的提取。其中,算法首先采用关联规则挖掘作为底层算法,用户评论经过预处理操作后生成事务文件,使用关联规则挖掘算法挖掘频繁产品特征,得到候选产品特征。候选产品特征经过一系列剪枝操作,最后得到产品特征。然后,算法引入树形结构信息,并使用该信息指导产品特征提取。在线评论网站为了方便用户快速定位到目标产品,通常会将产品信息进行分类,这样就形成了一颗产品树。其中,每个非叶子节点代表一个产品分类,叶子节点表示具体产品。在产品树中,深度越大,产品分类越细,同一个父亲节点下的产品联系越紧密,相似性越高。本文发现用户倾向于使用相似的词语描述相似的产品,使用不同的词语描述不同的产品。基于树形结构的产品特征提取算法正是基于这一现象,通过给目标节点的邻居节点设定不同的权重,指导目标节点的产品特征提取过程。权重的设置依据叶子节点在树中的距离确定,距离越大,权重越小,对目标节点的影响越小,反之亦然。最后,算法通过特征排序,输出最终的产品特征。实验结果表明,基于树形结构的产品特征提取算法在保证准确率的前提下,显著地提高了召回率。同时,实验发现不同的参数设置,对结果产生了不同的效果,因此,可以根据实际需求的不同,合理地选择不同的参数,算法的灵活性较高。
其他文献
CADAL中国文学编年史系统旨在构建一个基于丰富的历史文学资源的科研信息系统。在将这些资源数字化的基础上,组织与系统化各种类型的数字资源,形成跨媒体表达,并提供关于人物
近年来,Web服务计算领域随着SOA技术的广泛应用而得到了快速发展,从中衍生出了服务发现、服务组合、服务选择等若干子领域。服务选择,作为服务执行前的重要步骤,其中的QoS预
随着嵌入式系统的普及应用,选用实时操作系统(RTOS)作为其基础软件平台已成为必然选择。然而,由于嵌入式系统的强实时约束,导致RTOS无法对资源竞争等高复杂度的操作提供全面
用户的情感信息在人机交互中起着重要的作用,自动情绪识别的应用可以使人机交互变得更加智能和友好。近年来,基于脑电的自动情绪识别受到了广泛关注并涌现出大量成果,但其在
P2P技术一项最重要的应用就是P2P网络,P2P网络“无中心化”的特征使得其不断受到人们的关注。然而,随着网络规模的扩大,越来越多的恶意节点加入其中,使得网络中存在较大的安全隐
在布料模拟中,为了达到较高的真实感,一般采用物理模拟的方法,虽然物理模拟方法可以得到高精度的结果,但通常需要花费较高的计算代价,因此效率和精度的权衡是需要关心的最重
近些年来,随着显卡技术的高速发展以及性价比的提升,将GPU用于通用计算逐渐成为国内外研究的热点。早期的GPGPU开发使用GPU的图形学接口,开发难度大、成本高。NVIDIA公司推出
敦煌飞天艺术有着深厚的文化内涵和强烈的艺术感染力。但是目前在飞天动画的制作方面存在流程复杂,制作耗时,技术要求高等问题。而且在动画制作过程中也缺乏对飞天飘带运动模
伴随着数字多媒体技术和设备的快速普及,使得人们获取和制作视频的方式更加容易,同时这些视频数据可以很容易的被人们通过视频编辑软件进行任意修改,使得互联网中充斥着各种
嵌入式系统开发、生产过程中涉及到的一个很重要的问题就是“镜像文件烧写”,镜像文件的烧写方案直接关系到嵌入式设备的开发、生产效率。目前国内很多嵌入式设备厂商的生产