基于多源异构数据的文本情感挖掘及应用研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:zhongfeiran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户体验是用户在使用或期望使用产品的反应和结果,是企业的宝贵资源。随着大数据和人工智能技术的发展,这些海量的用户体验数据很好地通过多个途径以图文和影音等形式保留了下来,形成了多源异构大数据,如何从中挖掘出可用的知识支持企业经营决策,已逐步引起学术界和产业界的关注而成为近年来一个重要的研究热点。然而,用户体验数据尚未得以有效挖掘和利用,原因在于:数据融合困难,情感识别率不高,忽略营销效应,不能实现地理可视化。针对上述问题,在前人研究的基础上,构建了文本情感营销效应模型,提出了营销效应情感词典构建方法和基于地理信息实体抽取的依附连接消费者地址ACA算法。主要研究内容概况如下:  首先,在深入分析文本情感营销效应内涵及理论基础上,构建了用户体验文本情感营销效应模型,以品牌价值、销售收入为被解释变量,文本情感极性强度为解释变量,企业资产为控制变量进行回归分析;在分析过程中引入了变量的滞后项以分析文本情感极性强度对其产生的当期效应与滞后效应;结合逐点互信息PMI-IR法对营销效应情感词进行查询结构分析,优化了词汇的情感分类和情感极性强弱区分,提高了文本情感挖掘在营销场景中的准确性和有效性。  其次,在线上线下多源异构用户体验语料库建设的基础上,构建了一个面向用户体验数据挖掘的营销效应情感词典。首先采用人工标注,构建营销效应种子情感词,然后利用逐点互信息PMI-IR方法,采用条件随机域CRF机器学习方法进行营销效应情感词的自动抽取,并通过众包人工标注交叉抽检,构建了包含784个网络昵称词在内的28250万个词的本体库;利用该词典对来自在线评论、呼叫中心语音转写等多源异构用户体验数据进行文本挖掘,对比采用知网等常用词典的挖掘效果,营销效应情感词典挖掘结果具有较高的覆盖率和准确率。  最后,提出多源异构用户体验数据位置实体识别运算框架体系,结合GIS技术,将用户体验数据情感极性强度进行地理可视化;采用依附连接消费者地址ACA算法,通过用户体验数据地理信息实体与领域本体关联,改进了领域值抽取效率,提高了地理位置识别效果;通过实例分析验证了它的有效性及可行性。
其他文献
(一)玉米是一个C4植物,光合效率高,增产潜力大玉米在光合作用过程中固定CO2的最初产物和长尔文循环显著不同,生产的产物不是甘油酸磷酸,而是草酰乙酸等四个碳的二羧酸,因此,
感应控制是城市交通信号控制的重要方法之一,特别适合于交通流量不大但随机波动较大的交叉口的信号控制。本文针对经典的感应控制所存在的效率不高等局限性,研究了感应控制的
本文研究的是大连市国有企业青年科技人员工作满意度和绩效之间的关系。首先,通过对课题研究的理论基础和实践基础进行分析,阐明了笔者对工作满意度、工作绩效和二者之间关系的
本文提出城市交通物流基础设施的概念,并尝试以系统理论为方法论指导,来描述城市交通物流基础设施系统,用系统分析的一般原则和方法初步解决一些问题。本文将城市交通物流基础设
  本文总结出商业银行综合业务经营管理理论和相应的经营原则,即现代商业银行的三大主营业务是资产业务、负债业务和中间业务,商业银行要以做好资产负债业务为基础,大力开拓服
随着供应链管理思想在经济全球化的推动下取得了飞速发展,供应商和零售商之间的关系发生着巨大的变革。跨国公司的经营策略趋向于将现有的以赚取买卖差价为特征的传统零售商转
安全工作是工业企业生存与发展的基础,也是国家财产和人民群众生命健康安全的根本保障,随着社会的进步和企业生产经营的不断发展,安全生产面临许多新的形势,国家和社会各界对安全
CIPS(Computer Integrated Process System,即计算机集成过程系统)中各类信息在执行层中融合与贯通,流程工业企业各生产目标的实现,内部物流管理、生产成本控制等生产管理活
本文对知识产权流通中的信息披露问题进行了研究。文章通过对产权市场和知识产权交易的特点分析,以及同国外类似交易市场进行比较,指出我国当前条件下的知识产权交易中的信息披
在锦州城北,有个美丽的三屯村。当你望着村中一排排整齐的“北京平”和一幢幢别墅式小楼时,很难想到,十年前,这个村竟是另一番景象:村部是几间低矮破旧的土房,村里仅有一个