基于潜在影响因素挖掘的代价敏感动态文本情感分析研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:BBP
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今,随着电子商务相关在线平台变得愈加成熟,智能手机等移动终端的遍及也使得用户生成内容遍布互联网。用户评论作为用户生成内容的典型代表,是企业和消费者共同关注的重点,企业通过文本评论挖掘创造商业价值,消费者购买决策受用户评论影响。文本挖掘俨然是当前的热点研究话题,其中文本情感分析是最具代表性的解决方法。然而,当前文本情感分析主要以单步决策为主,忽略了决策的动态性;同时传统文本情感分析研究主要从分类精度出发,极少考虑决策行为产生的代价以及代价的不平衡性。因此,本文将动态决策和代价特征加入到文本情感分析中,为文本情感分析研究提供了一条新思路。首先,引入粒计算思想构建动态决策框架。粒计算是解决复杂问题的有效方法,通过粒子对客观事物进行抽象表示,并采用多层次粒结构完成问题的动态求解。本文采用LDA和NMF挖掘潜在影响因素,然后提出封装式、嵌入式、集成式和加权组合式的粒化准则,采用自上而下拆分型粒结构搭建出具有动态决策的粒化模型。然后,利用三支决策思想构建具有代价敏感性的动态文本情感分析模型。结合三支决策的代价敏感性,在决策过程考虑了误分类代价和学习代价最小原则,由此判断文本情感极性。基于粒化模型的多层粒结构生成动态决策框架,在各粒层采用三支情感分析或二支情感分析来完成模型构建。最后,使用真实数据集来证明本文构建的动态文本情感分析模型的优势性。并且基于模型有效性和决策方法有效性两方面,对模型从分类质量和分类代价两个维度进行综合评估。由实验对比结果可知,本文方法不仅提高了分类质量,而且还使得整体的决策代价明显降低。除此,还对企业提出了有效建议,帮助其更好的挖掘用户评论价值。在企业实际运用中,本文方法不仅能帮助企业实现具有低代价的动态文本情感分析,还能对用户评论进行快速响应;进而可获取潜在影响因素和情感标签来增加企业拥有的信息要素;最后还能对企业的战略目标提供相应的决策支持。
其他文献
学位
学位
学位
学位
随着我国基础设施建设的不断发展,双洞穿越滑坡体的工程案例越来越多,因双向六车道及八车道的高速公路隧道在新建高速公路的比例逐渐增加,导致双洞穿越潜在滑坡体工程逐步向小净距、超大断面方向发展,而学术界对双洞超大断面隧道穿越潜在滑坡体的研究还较少。因此,本文以寒山口隧道工程为依托,通过数值模拟、模型试验、现场监测等手段分析超大断面并行双洞隧道正交穿越潜在滑坡体的失稳机理及整治措施的整治效果,同时对双向六
学位
城市道路的交通参数估计作为交通诱导、自适应式交通控制和事故检测的重要前提,一直是交通领域的研究重点。网联车的出现为交通参数估计的研究带来了新的发展机遇。本文在学习前人研究进展的基础上,基于交通流理论和动态贝叶斯网络分析城市干道交通状态的时空演变过程,提出了网联车环境下估计交通参数的方法。主要工作包括了如下部分:(1)基于交通流理论建立城市干道交通状态时空演变模型。以路段的到达排队车辆数和绿灯时间结
学位
200km/h高原艰险山区客货共线铁路的规划与修建预示着铁路作为高原艰险山区物资进出的主通道格局即将形成,铁路货物运输将带动区域经济整体加快发展,促进高原艰险山区加速融入国家经济发展新格局。但高原艰险山区恶劣的气象环境和复杂的地形特点不止给铁路的修建带来了极大地挑战,也使得高原艰险山区铁路的货物运输组织及铁路货车车辆的安全运行变得十分困难,尤其是设计速度为200km/h的客货共线铁路,货物运输组织
近几年,在京津冀协同发展、筹办举办冬奥会和首都“两区”建设的背景之下,张家口市迎来了生态产业发展的良好契机。优化政策工具是实现张家口市产业高质量发展的关键。本研究充分梳理了2016-2020年间省市两级有关张家口市生态产业的政策文本,从基本政策工具维度和产业价值链维度两方面,建立张家口市生态产业政策工具二维分析框架,以张家口市生态产业政策工具为研究对象,结合本地实例,发现对生态产业进一步立足于本市