论文部分内容阅读
用户体验是用户在使用或期望使用产品的反应和结果,是企业的宝贵资源。随着大数据和人工智能技术的发展,这些海量的用户体验数据很好地通过多个途径以图文和影音等形式保留了下来,形成了多源异构大数据,如何从中挖掘出可用的知识支持企业经营决策,已逐步引起学术界和产业界的关注而成为近年来一个重要的研究热点。然而,用户体验数据尚未得以有效挖掘和利用,原因在于:数据融合困难,情感识别率不高,忽略营销效应,不能实现地理可视化。针对上述问题,在前人研究的基础上,构建了文本情感营销效应模型,提出了营销效应情感词典构建方法和基于地理信息实体抽取的依附连接消费者地址ACA算法。主要研究内容概况如下: 首先,在深入分析文本情感营销效应内涵及理论基础上,构建了用户体验文本情感营销效应模型,以品牌价值、销售收入为被解释变量,文本情感极性强度为解释变量,企业资产为控制变量进行回归分析;在分析过程中引入了变量的滞后项以分析文本情感极性强度对其产生的当期效应与滞后效应;结合逐点互信息PMI-IR法对营销效应情感词进行查询结构分析,优化了词汇的情感分类和情感极性强弱区分,提高了文本情感挖掘在营销场景中的准确性和有效性。 其次,在线上线下多源异构用户体验语料库建设的基础上,构建了一个面向用户体验数据挖掘的营销效应情感词典。首先采用人工标注,构建营销效应种子情感词,然后利用逐点互信息PMI-IR方法,采用条件随机域CRF机器学习方法进行营销效应情感词的自动抽取,并通过众包人工标注交叉抽检,构建了包含784个网络昵称词在内的28250万个词的本体库;利用该词典对来自在线评论、呼叫中心语音转写等多源异构用户体验数据进行文本挖掘,对比采用知网等常用词典的挖掘效果,营销效应情感词典挖掘结果具有较高的覆盖率和准确率。 最后,提出多源异构用户体验数据位置实体识别运算框架体系,结合GIS技术,将用户体验数据情感极性强度进行地理可视化;采用依附连接消费者地址ACA算法,通过用户体验数据地理信息实体与领域本体关联,改进了领域值抽取效率,提高了地理位置识别效果;通过实例分析验证了它的有效性及可行性。