在线中文评论离散情感分析及其影响研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:liliqqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于心理学的离散情感理论从人类的基本情感角度出发,将人类所有的情感都视为这些独立、独特且可以彼此区分的各种基本情感的组合。离散情感的相关研究在英语在线评论中的探索和应用相对较早,已经取得了一定的成果,而有关在线中文评论离散情感的分析,尤其是消费领域的研究仍处于起步阶段。基于此,论文立足在线中文商品评论情感表达的特点,采用管理学、计算机科学、心理学、人类行为动力学、语言学等多个学科的不同理论、模型和技术手段,以中国大型电子商务平台Jingdong Mall(www.jd.com)的手机商品的海量中文评论为研究对象,围绕评论中不同离散情感的识别、分布规律的发现及其对在线销量的影响作用等三个方面展开研究工作,具体研究内容和研究成果如下。(1)论文以基于心理学情感认知评价理论的OCC模型作为情感分类的依据,使用自然语言处理技术和有监督的机器学习方法,提出了在线中文评论中隐含离散情感的分类方法。在构建了包含满意(Satisfaction)、失望(Disappointment)、赞美(Admiration)、谴责(Reproach)、喜欢(Love)和讨厌(Hate)等六种离散情感的标注评论语料库的基础上,论文针对六种离散情感的六个子标注评论集进行基于卡方统计量(CHI)的特征选择,并使用基于高斯贝叶斯(GaussianNB)、K最近邻分类(KNN)、逻辑斯蒂回归(LR)、随机森林(RF)和支持向量机(SVM)等算法的五种分类器进行离散情感的分类。研究结果表明,基于逻辑斯蒂回归(LR)算法的分类器对每种离散情感均具有最好的分类效果,而基于不同算法的分类器对同一种离散情感的分类效果也并不相同。该研究为在线中文评论的情感识别提供了新的思路和方法,为从事中文在线评论情感分析的其他研究者提供了参考。(2)论文基于统计学和人类行为动力学的研究方法,在已完成上述六种离散情感分类的海量在线中文商品评论的基础上,对消费者不同离散情感表达行为的分布规律进行了知识发现,研究基于群体层面,从评论属性、商品属性和时间属性等多个维度,挖掘了在线评论中不同评论星级、不同价格区间以及不同“购买-评论”时间间隔的离散情感的分布特点。研究发现随着评论星级从1星级到5星级的变化,包含喜爱情感(Love)和讨厌情感(Hate)的评论数占比变化最多。不论什么价位的手机,消费者在评论中最乐于表达的是喜爱情感(Love)和满意情感(Satisfaction),而越是价位适中的商品,消费者对其“性价比”越看重,而对于价格较高的商品,消费者越是容易对商家、第三方电商平台、物流等提供的服务做出评价。离散情感的“购买-评论”时间间隔发布频次曲线表现出“双峰分布”的特征,不同离散情感评论的第一个高峰均出现在商品购买后的第1天,其中包含赞美情感(Admiration)和谴责情感(Reproach)评论的发表频次最高;六种情感在商品购买后的第11天时出现了第二个峰值,尤其是喜爱情感(Love)、讨厌情感(Hate)和满意情感(Satisfaction)最为明显。六种离散情感的评论在不同“购买-评论”时间间隔服从幂律分布,且三个正向离散情感对应的幂指数比三个负向离散情感对应的幂指数要大。不同离散情感的评论其“购买-评论”的时间间隔都具有较强的阵发性,其中赞美情感(Admiration)和谴责情感(Reproach)的阵发性指标值最大,而讨厌情感(Hate)的阵发性指标值最小。六种不同离散情感的评论其“购买评论”的时间间隔的记忆性指标都接近于0,说明在电商平台上,每个消费者的购买行为与评论行为都是一个独立的个体行为。该研究在一定程度上补充和完善了现有关于在线评论情感分析的研究中鲜有情感分布规律探究的不足,丰富了在线评论情感信息的研究范畴,为用户生成内容的行为特征规律与知识发现提供了新的研究方向。(3)针对已完成离散情感分类的海量在线中文评论,论文引入评价倾向框架效应理论(ATF)、说服效应及双过程理论,运用管理学的研究方法,从行为导向,通过构建回归模型对在线评论所隐含的上述六种离散情感对商品在线销量的影响进行深入探究,从不同角度分析了不同离散情感与潜在消费者购买行为之间的内在机理。研究发现在线评论隐含的效价相同的离散情感并非都会对商品在线销量产生相似的影响。三个积极的离散情感中,只有赞美情感(Admiration)对在线销量有显著的正向影响;三个消极的离散情感中,只有讨厌情感(Hate)对在线销量有显著的负向影响。商品的品牌竞争力对于离散情感对销量的影响有调节作用。相对于强势品牌,包含讨厌情感(Hate)的评论数占比对弱势品牌商品的商品销量影响更大。研究不同于现有对在线评论离散情感的研究大多采用调查问卷或实验的形式,且大多针对评论感知有用性进行探究的现状,加深了对在线评论中离散情感的理解,拓展了在线口碑的相关研究。
其他文献
为了提高玉米秸秆还田后小麦播种质量,为广大麦玉轮作区小麦生产提供技术支撑,通过采用将不同小麦播种方式进行组合的研究方法,对小麦群体发育及产量结构进行分析。结果表明:
为研究施肥对玛曲高寒沙化草地地上生物量的影响,设置不施肥(CIO、施有机肥(O)、施氮肥(N)、施磷肥(P)、施氮磷肥(NP)、施有机肥和氮肥(ON)、施有机肥和磷肥(0P)及施有机肥和氮磷肥(ONP)等8个
对先唐时期佛经目录的发展演变进行考察,可以看出这一历史阶段佛教在中土的发展以及佛教的中国化历程。佛教传入中国初期,佛经目录的分类以译经方式为主,至隋法经《大隋众经
中国村落地名分布广泛,数量巨大,很多村落地名具有悠久的历史。它伴随着中国聚落的产生而产生,语言和文字的发展而发展,在历史的长河中传承与新生,变更与消亡,并在自然环境和
为进一步阐明不同宿主不同地区无乳链球菌之间的关系,本研究从细菌形态学、生理生化、16SrRNA和cfb基因等方面,鉴定了2009—2011年广东、海南等地区的25株罗非鱼链球菌病原。