基于属性聚类的手机评价模型研究与应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:hsh15811353953
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电商行业的快速发展,网络购物越来越受消费者的青睐。在购买手机时,消费者可以根据电商平台上的评论信息,分析手机在“外观”、“价格”、“功能”等方面的表现并做出判断。另外,手机生产商也可以通过分析评论来了解消费者的关注倾向,进而为新款手机的制造提供策略性帮助。本文提出的手机评价模型是以评论语料为依据,通过分析语料来反映消费者对手机某一特征的倾向程度,并为消费者或生产商提供参考。本文从手机的评价信息出发,研究现有评价模型、属性评价结构和属性聚类的相关理论,对相关技术方案深入思考。首先,设计爬虫规则并利用八爪鱼爬虫工具在京东商城上获取5种品牌的手机评论作为参考语料,把其中荣耀手机的评论用于检测模型的评估语料,即单款手机的评论语料;其次,根据现有的中文自然语言处理技术,对参考语料和单款手机的评论语料进行分词和去停用词处理;再次,用预处理过的参考语料训练CBOW(Continuous Bag-of-Words)模型得出参考语料模型,并由此模型得出与手机特征词相关的属性词及其词向量,进而通过Kmeans、谱聚类和SOM(Self-organizing Maps)对属性词的词向量进行聚类,并选取最好的聚类结果确定手机的属性评价结构;最后,依据参考语料模型和单款手机的评论语料的预处理结果抽取出荣耀手机评论中的属性词,结合手机属性评价结构和评价方法,构建某款手机的评价模型并可视化展示。本文利用TOPSIS(Technique for Order Preference by Similarity to an Ideal Solution)方法的思想,通过计算单款手机的评论语料的属性词集合与参考语料的属性词集合的接近程度(即手机特征倾向度)提出手机评价方法。因数据非数值化,故采用计算Jaccard相似系数的方式作为计算手机特征倾向度的方法;又因中文语义的多样性,提出基于语义相似度的评价方法,根据语义相似度阈值的变化反映不同语义层次的手机特征倾向程度。实验表明:SOM对属性词聚类的平均精确率、召回率、F值和准确率分别达到84.4%、80.63%、82.47%、80%,证明通过SOM聚类建立属性评价结构的合理性;其次,基于语义相似度的评价方法更能灵活地反映不同语义层次的手机特征倾向程度,为消费者提供不同精度范围的参考。
其他文献
本文采用SWOT分析方法,对安徽省现阶段发展户外素质拓展旅游项目的优势、劣势、机会和威胁进行了系统分析,以期能对加快该新兴旅游项目的发展提供一些有益的思路与启示。
本文分别从《宪法》与《会计法》之间的不协调、经济法与《会计法》之间的不协调、《刑法》与《会计法》之间的不协调三个方面来分析《会计法》与相关法律制度之间的不协调及
目的:本研究基于COI条形码序列对市售水牛角、地龙药材进行鉴定研究,对两种市售动物药材商品的真伪情况进行调查,为市场监管提供有力工具;同时对市售动物药材的DNA提取方法优
在新编《大学体育教程》出版之际,以我国普通高校公共体育教材的历史沿革为主线,对建国以来我国体育教材的发展过程进行阶段性评议,并对新中国成立以来我国普通高校体育教材
学校心理健康教育课的设计模式是由其设计要素构成的,心理健康教育课的设计要素是由其结构要素决定的。心理健康教育课的结构要素包括四个方面,即活动对象、活动目标、活动策略
本文主要围绕矿难事故中国家赔偿责任的引入展开论述,结合现行法规和法理探讨了在这类事故中国家责任的成立以及国家责任的承担等实际问题。
本文运用文献法、访谈法、对比分析等研究方法,对普通高校体育教学改革取得的进展和出现的问题进行分析,并提出自己的见解和建议。以期为普通高校体育教学改革提供参考。 Th
"人肉搜索"是一种新型网络搜索引擎模式,在带给人们全新搜索体验的同时,它也滋生出一定的社会问题。当"人肉搜索"演变为"网络暴力",公民人格权就会成为这场暴力背后的牺牲品
<正>Wernicke脑病临床上多为慢性酒精中毒所致疾病。而妊娠妇女剧烈呕吐亦可导致Wernicke脑病的发生,临床可因误诊或治疗不及时而引起严重后果。现将我科于2000年1月以来收治
<正> 水的形态变化是自然界中常见的现象,是认识天气现象的基础。学习这类规律性的知识,可以培养学生探究自然规律的能力。为了让学生直接认识蒸发现象,为新授作准备,课前,我