论文部分内容阅读
随着电子商务的井喷式发展,网络购物正在被越来越多的人接受和使用,随之而来的是信息量的爆炸式增长。研究显示,64.4%的电子商务网站消费者会将已购买者对于产品的评论作为他们在电子商务网站作出购买决策的参考信息来源。意见挖掘技术可以帮助潜在购买者、经销商和产品生产者从这些散布在网页中的海量产品评论中获取有效信息。本文基于意见挖掘框架,对产品属性提取、意见挖掘在电子商务推荐系统中的应用作了研究和探索。首先,本文在评论要素中增加了时间维度的抽取,并建立了层次化产品属性集,提出了基于JWNL(Java WordNet Library)库的pos标注、情感词表扩展算法。其次,将候选产品属性词周边的词语、产品属性词周边词的词性、候选产品属性词和匹配意见词的位置关系等产品属性词的上下文语法特征纳入考虑范围,以此来帮助判别显性产品属性词,并运用最大熵模型进行训练,使得产品属性提取达到比较好的效果。最后,以Amazon电子商务网站的四款数码相机产品为例,我们对不同粒度的产品属性的情感分值进行了计算,将基于层次化产品属性集合的意见挖掘的评分结果应用于电子商务推荐系统,提出了基于产品属性情感评分的不同产品优劣势比较,并使用PowerBuilder编程工具对部分推荐形式进行了展示。我们结合消费者心理学知识、产品生命周期理论和产品市场扩散理论对情感评分和产品属性热度随时间变化的原因进行了分析和解释。本文的创新成果体现在提出了基于JWNL库的情感词表扩展算法,在产品属性提取中考虑了候选产品属性的上下文特点,提出了意见挖掘在电子商务中的应用,我们加入时间维度对产品属性热度和情感分值随时间变化的趋势进行探索,并结合社会科学领域的知识对挖掘结果进行解释分析。本文的研究具有很好的应用价值,不仅能够帮助消费者从海量产品评论中快速获取感兴趣的信息,而且可以为企业的管理决策提供数据支持。