论文部分内容阅读
近年来,网络中存在大量用户对汽车的讨论信息,而据调查统计,超过60%的购车用户会通过汽车论坛等渠道了解汽车信息,且该渠道更是超过“亲友介绍”成为消费者最信任的口碑获取渠道。因此对于汽车行业而言,监测其产品的网络口碑走势显得尤为重要。而海量汽车网络口碑中,负面的网络口碑极易通过快速传播形成网络热点新闻,并对汽车品牌造成严重影响。因此,设计一个自动化的、专门化的面向汽车行业的负面网络口碑识别系统对各大中小型汽车企业的品牌风险预警工作具有重要的作用。本文在分析比较文本识别相关技术的基础上,设计并实现了一个面向汽车行业的负面网络口碑识别系统。本文的主要工作包括以下三个部分:(1)分析比较了现有的文本分类技术,根据本文系统需要选择支持向量机算法作为系统中识别汽车口碑类别的文本分类算法,同时通过训练已有的软件包完成了汽车口碑类数据的识别;(2)分析比较现有的情感极性判别技术,根据本文系统需要选择一种基于褒贬词汇统计的情感权值算法作为文本情感极性判定的依据,并根据该算法实现了负面口碑文本的识别。(3)利用基于支持向量机的文本分类技术及基于褒贬词汇统计的情感极性判别技术,结合低成本降噪的黑名单过滤技术设计并实现了一个面向汽车行业的、采用多层次过滤方式的负面网络口碑识别系统;本文在最后对系统进行了测试,测试结果表明本文设计的汽车行业负面网络口碑识别方案有效可行。目前,本文系统已应用于汽车行业网络风险监测平台。