产品属性挖掘及应用

被引量 : 1次 | 上传用户:say_8139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于互联网发展起来的电子商务引领了消费的新潮流,致使网络中产品评论数据骤然增长,由于这些消费者评论中包含用户对产品功能属性、部件属性等有价值的评价信息,因此产品属性挖掘技术应运而生。目前已有产品属性挖掘技总结为人工定义和机器自动识别两种。人工定义的方法,是由领域专家归纳总结出属性,方法虽然很准确,但只能针对该领域进行产品属性提取,没有通用性,可移植性不强,无监督的机器自动识别方法,主要是利用自然语言处理技术,但会增加品属性的冗余度,降低准确率。本文针对以上研究存在的不足,以电子商务网站中的产品评论信息为研究对象,提出并实现了一种基于词性模板的产品属性挖掘方法,并将该方法针对复杂观点句加以改进。第一,通过分析电子商务网站的标签规则,爬取消费者产品评论,建立原始评论数据库,得到产品属性挖掘的数据语料库;第二,通过分句处理、词性标注对产品评论进行预处理;第三,深入分析已完成词性序列标注的产品评论,利用词性模板进行特征归类,最终得到“候选产品评论”、“无属性评论”、“无观点评论”、“非候选标签”四类词性序列特征;第四,通过窗口临近原则,比较属性值距属性的距离向量大小,识别出候选产品评论的属性和属性值,得到正确的搭配关系;第五,对识别出的属性进行置信度计算,置信度越高是正确属性的准确率越大;第六,通过设置停用词,进一步降低地候选产品属性的冗余度,提高属性识别的准确度。本文对识别出的产品属性的应用进行研究,首先,从消费者的角度出发,通过识别出的属性以及属性占比可得出产品最受消费者关注的热门属性,已达到帮助潜在消费者做出购买决策的目的;其次,从企业的角度出发,通过从已成交的消费者评论中识别出的产品属性,明确该类产品的优势属性和劣势属性,从而帮助企业改进产品、提高质量,及时修复潜在可能恶化的客户关系。再次,从运营商的角度出发,通过识别出第三方电子商务网站的属性,可提高客户对电商网站的依赖性,增加电商网站的用户群。本文的主要研究贡献:第一,通过改进属性提取分类器架构,与基于名词词性模板得到候选产品评论的方法相比,提高了候选产品评论的有效度;第二,基于COAE2009提供的数据包,对词性模板窗口阈值设置进行分析,选取合适窗口值,降低候选产品属性冗余度;第三,新增置信度计算模块,根据属性在文本中上下文的信息、频率等特征,进行置信度计算,提高品属性识别的准确度;第四,对识别出的产品属性的应用进行研究,提高了产品属性挖掘的研究价值。
其他文献
现阶段,内部审计在企业发展中扮演的角色越来越重要,成为企业评价和改善风险管理,完善公司治理,帮助企业实现目标的重要手段。然而,大公司尤其是集团公司由于子企业众多,区域
近年来我国出现了一系列食品安全问题,如瘦肉精火腿肠、三聚氰胺奶粉、毒豆芽、地沟油等,严重影响了人们的身体健康。为满足食品安全的市场需求,我国一些企业开始借鉴、模仿
进入二十一世纪以来,我国的经济继续在高速的增长,中国大都市正在经历着巨大的经济和社会体制转型,快速工业化和城市化下中国社会城市空间格局日益分化,城市空间结构正经历着急剧
创业在促进我国经济增长与发展方面起到了举足轻重的作用,近年来,我国的创业活动异常活跃,但是新企业的成功率却非常低。对于创业者来说,创业就如漫长的马拉松一样,最终能够跑到终
在经济全球化的新时代,随着我国互联网科技的普及范围越来越广,支付宝、淘宝众筹、P2P模式等新型的金融词汇不断出现在人们的视野当中,传统金融领域不断渗透着互联网技术方便快
目的:分析在小儿厌食症治疗中应用中医小儿推拿法的治疗效果。方法:选取2018年6月至2019年8月期间收治的60例厌食症患儿作为本次研究对象,根据治疗方法的不同分为两组,对照组
现如今经济全球化是全世界各个国家共同追求的目标,各国通过跨国贸易、资本流通等方式实现着各个国家的市场分工协作。中国作为新兴国家,其企业的跨国并购活动吸引着全世界的目
中小企业是中国经济快速发展的主要动力来源之一,随着中国经济的不断繁荣昌盛,中小企业所发挥的力量及重要程度也在持续上升。然而,中小企业融资难的问题却日益尖锐。银监会曾出
小说是高中语文教材中一种重要的文学体裁,也是较受学生欢迎的文学样式,无论教材如何变化,小说总是占有重要的地位。因此,小说教学也就成了高中语文教学的重要组成部分。随着课程
环境责任保险是以企业发生污染事故对第三者造成的损害依法应承担的赔偿责任为标的的保险。国际经验表明,环境责任保险制度是通过经济手段解决环境管理难题的有效手段。环境责