基于文本挖掘的扫地机器人在线评论研究

来源 :暨南大学 | 被引量 : 0次 | 上传用户:pygta
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
扫地机器人作为一款人工智能产品深受消费者的喜爱,同时互联网购物平台发展迅猛,消费者在网上购物会产生海量的网购评论文本数据,好评与非好评的评论文本对消费者的购买决策起到一定的影响,而当下各网购平台的评价界定标准不统一,因此运用自然语言处理技术对海量的文本数据进行分析,挖掘出消费者所关注产品的特征,建立文本分类器具有实际的研究意义。运用以网络爬虫技术为核心的八爪鱼爬虫软件获取科沃斯、石头科技和小米三个品牌各三种产品在京东商城的评论文本数据,对评论文本进行数据预处理,分品牌提取关键词、绘制词云图以及基于LDA主题模型对好评与非好评文本进行主题提取,实现文本特征分析。并利用文本增强技术和欠采样解决数据不平衡问题,运用七种机器学习算法构建情感分类模型,利用网格搜索和交叉验证寻找模型最优参数组合,比较模型评估指标准确率、Macro-F1后,分别构建以支持向量机、决策树、朴素贝叶斯、多层感知机、逻辑回归、Cat Boost为元分类器的两层Stacking融合模型进行对比。最终得出Stacking-MLP预测效果最优,准确率和Macro-F1均为0.9312,说明建立的Stacking融合模型在好评与非好评这种二分类问题上很有优势,能高效进行文本情感分类。最终分析结果表明,目前扫地机器人在一定程度上是能够减轻人们的负担,大部分消费者对其的态度是积极的,主要关注扫地机的功能、性能、外观和物流以及售后服务等。三大品牌各有所长,在不同方面都有待改进,最后结合文本挖掘分析的结果,对三大品牌提出针对性的建议,给消费者做出购买决策提供了一定的参考价值。
其他文献
2021年中国金融深度指标值为美国的5倍,但固定资产投资等主要经济指标增长缓慢,表明注入市场的金融资源没有得到有效配置,大量金融资源因受到政府的隐性担保被流入到某些无效的生产部门或企业,从而影响企业绩效的发展。鉴于此,深入探究金融资源配置效率对制造业企业绩效的影响效应,能够帮助我国制造业企业了解如何更好的提升其金融资源配置效率,推进我国产业实现高质量转型升级,最终使得国家经济高质量发展有着显著的现
学位
为了增强新能源汽车产业的实力,我国将其纳入战略性新兴产业并予以重点扶持。近年来我国政府颁布了一系列财税政策。与此同时该行业也存在充电配套设备落伍和新能源汽车推广受阻等问题,因此政府逐步调整针对新能源汽车领域的财税政策。论文以财税政策对新能源汽车销量的影响研究为主题以探索财税政策的有效性和未来的优化方向。首先,论文研究财税政策对新能源汽车销量和市场占有率的影响。其次,论文还利用双固定效应模型研究传统
学位
学位
代谢综合征是一个全球性的公共卫生问题,其临床症状得到有效控制,能明显降低脑卒中、心肌梗死等严重心脑血管疾病的发病率。在当前人口老龄化的时代背景下,亟需对代谢综合征早期识别问题进行的研究。本文根据广域多医疗中心数千份临床问卷资料,基于集成学习算法建立老年代谢综合征早期识别预测模型,并利用级联分类器原理对疾病预测模型的不足之处进行优化,以及利用SHAP框架对进行模型解释和特征重要性的研究,以此构建老年
学位
学位
如今,全球化进程加快,市场格局不断被颠覆,企业为了在日趋加剧的市场竞争中获得一席之地,开始寻求与社会的合作来实现共赢的局面。随着企业社会责任意识的苏醒,对企业社会责任的讨论也与日俱增。企业从事社会责任活动不仅能够传播声誉,带来物质上的收益,还满足了利益相关者的需求,使公司创造长期价值成为可能,也为社会的可持续发展提供有利条件。而在实际中,企业管理者可能为了实现利润最大化而采取避税行为,这不仅会侵害
学位
改革开放以来,随着工业化、城镇化进程的加快,我国城市大气污染等环境问题日益突出,曾严重影响人类生产生活。近年来,各大城市积极出台大气治理政策措施,打赢蓝天保卫战,我国空气质量得到了改善。为了解我国城市空气污染现状,研究基于函数型数据的视角,通过Pseudo分位数函数型聚类方法,以PM2.5颗粒物为代表,对我国343个城市的污染物浓度数据进行了聚类分析。该聚类方法更容易发现数据中不同层次的分布信息,
学位
本文采集了2014-2021的获奖专利数据作为高价值专利、使用两个及以上的专利网站的低分专利数据作为低价值专利建立训练数据集,构建专利价值识别模型用以鉴别高价值的专利。论文分别采用了SVM模型、Stacking集成学习模型、BP神经网络模型三种不同的模型方法进行训练对比,使用验证集进行模型性能对比检验,结合模型评估指标选择最优的模型作为专利价值识别模型的主模型。通过准确率和损失率指标的对比,BP神
学位
学位
随着经济的快速发展、证券市场在我国的规模一直在扩充,企业之间的竞争日趋激烈,越来越多的公司会出现风险以及危机,财务困境的企业频繁出现。对于市场的监管者、证券市场的投资者来说,需要缓解这种情况的发生,并且提前了解企业的财务状况,那么一套有效的预警防御机制就非常重要。本文选取了2014-2018每年全国A股的所有制造业公司作为研究对象,来预测2017-2021年公司的财务状况,即用T-3年的数据预测T
学位