在线评论中基于边界平均信息熵的产品特征提取算法

来源 :系统工程理论与实践 | 被引量 : 0次 | 上传用户:liongliong427
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务业务的迅猛发展,基于用户网上评论的文本研究也成为热点课题.用户在进行购买决策时,不仅需要了解该商品的整体评价,同时需要知道商品各个特征的情感态度倾向,故文章的目的在于研究在线评论中产品特征的自动提取的问题.实验选择满足BNP(base noun phrase)模式的N-Gram作为候选项,并利用N-Gram的边界平均信息熵的指标以及子串依赖关系对候选项进行过滤,提取最终的产品特征.与仅采取BNP模式直接作为产品特征的参照条件相比,当前方法选取的过滤条件可以有效提高产品特征提取的准确率.文中的方法不依赖于外部的领域语料且不需进行人工干预,其最终输出的结果具有子串依赖的层次性,可以作为领域知识构建的有效的参考数据结构.
其他文献
采用热色液晶测温技术对以二氧化碳为工质的稳态射流冲击换热和管内插入扭转带方式的旋转射流冲击换热进行了实验研究.与普通射流相比,旋转射流导致驻点附近区域的换热趋于均
提出了一种基于双边滤波的单尺度Retinex图像增强方法,在有效增强图像的同时,很好地保持了图像边缘及高亮部分的细节.采用双边高斯滤波来估计图像亮度,同时对原始图像进行局
本文通过将韩礼德的语篇功能语法应用到语篇教学,帮助学生挖掘文章字里行间所隐含的深层含义,更好的了解作者的交际意图。通过理解语篇中的情景语境、及物性分析、主位结构和衔
会展旅游有其兼容性强、辐射面广、组团规模大、消费档次高和文化气息浓等特性,是提高本地区旅游产业质量、加快旅游产业结构调整和国际化发展的一个新的突破点。将会展与旅游
构建社会主义和谐社会是党的十六届六中全会的主要议题,是当前党和人民的主要任务,也是建设社会主义的新起点。要构建和谐社会,我们必须直面现实,以政治沟通为契机,妥善协调
采用试管稀释法,分别测定了火绒草水煎液、水提醇沉液、醇提物、醇提石油醚部分、醇提乙酸乙酯部分、醇提正丁醇部分、醇提水溶部分等7种提取物时大肠杆菌C83882、大肠杆菌C83
目的:探讨脑卒中偏瘫患者的早期康复训练与心理护理方法及效果。方法:对70例脑卒中偏瘫患者的早期康复训练和心理护理情况进行回顾性分析。结果:本组64例肢体功能基本恢复,5
这里刊登的材料选自Harold S. Madsen编的Techniques in Testing(1983),简单介绍了英国和美国的标准化的、可以出售的主要英语测试题和研究测试的服务机构。其中,大部分是水
期刊
分析了国内外掘进工作面防灾技术现状,提出高压注水防突技术措施,经过详细考察,确定了有关主要技术参数,在五处矿井具有严重突出危险掘进工作面试验,有效防治了煤与瓦斯突出,
综述了使用洁净氧化剂(氧气、过氧化氢),液相催化氧化有机醇的新进展.并对均相及多相催化剂体系中催化氧化有机醇在精细化学品合成中的应用进行了比较.