论文部分内容阅读
随着因特网服务的不断深入,互联网商业服务深入人心,由此得到了飞速发展,而在没有实物参考的情况下,网民在消费时无法对商品进行预测,在做出选择之前更多的依赖于其他买家的评论和意见,在线评论就成为了衡量商品的重要标准之一。目前,在线评论的数量呈爆炸式增长,而商家为买家提供商品评价主要依据打分制,在线评论所包含的丰富的知识并没有得到充分利用,如何利用在线评论得到商品全方位的描述和评价成为研究的热点和重点。由于本体能够对特定领域的重要概念进行形式化描述而被广泛地应用,且通用情感词词典没有包含动态情感词和领域情感词,所以将本体应用到在线评论知识表达中。但由于经典本体不足以表达不确定、模糊的知识,而情感词汇的倾向本就是不确定的,所以本文利用模糊领域本体来描述在线评论知识,并利用模糊本体能够表示不确定知识的特性对情感词汇倾向进行表示。由于商品描述知识中具有领域情感词和动态情感词,且在线评论包罗万象,具有商品的全面描述信息,本文基于领域知识挖掘发现属性及其相关领域情感词和动态情感词组合,并利用《知网》和词汇相关度对情感词进行褒、贬两个维度的情感标注,最后利用语义检索实现最大化的语义匹配,并将匹配结果排序后反馈给用户。本文重点对两个方面进行了研究:(1)模糊领域本体构造方面:本文利用领域知识建立模糊领域本体,设计了基于形式背景构造权值概念格,通过权值概念格生成二项集的领域知识挖掘过程,并通过实验证明了在大数据量的情况下,基于权值概念格生成二项集比经典算法Apriori更适用。并介绍了利用经典本体框架,通过OWL2的断言和注释功能表示模糊语义的模糊领域本体构造方法。(2)模糊领域本体应用方面:将模糊领域本体应用到加权句子情感分析,通过基于手机模糊领域本体的句子情感倾向判断实验,利用准确率、召回率和F值作为评价指标,与基于情感词典的句子情感倾向判断进行比较,证明了模糊领域本体更适用于含有动态情感词情况下的句子情感倾向分析。