论文部分内容阅读
随着互联网的不断发展,社交平台孕育而生,随之网络上的数据呈现爆炸式的增长,其中文本数据是众多数据中具有代表性的数据形式。文本数据中往往携带着个人的情感色彩,因此对文本数据进行情感分析是了解社会舆情倾向、产品口碑、服务质量等问题的有效手段。不仅如此,它将公众置于一个看不见的网中,紧密联系在一起,公众的各类情感也以这张网为载体不断地交流。面对如此庞大的文本数据和复杂的公众关系,也为各领域的行业提出了新的挑战。本文在前人的基础上对物流领域的情感提出一种新的研究方式,提出了机器学习的朴素贝叶斯分类算法对于物流情感文本集的情感分类研究,分析公众的情感倾向,并在此基础上构建公众的各类情感网络,对情感网络特征和传播路径进行研究。首先对爬取的与物流相关的情感文本进行了数据清洗和预处理,去除无用重复的文本后,对文本数据分割成训练数据和测试数据。为了使计算机识别文本内容,对情感文本进行了分词并去除了停用词和向量化。选取词频统计在前两百的词汇作为特征词汇,计算特征词汇的TF-IDF值后训练朴素贝叶斯分类模型,然后通过训练好的模型将文本数据分类成正向情感、中性情感和负向情感。分析发现现阶段公众情感中正向情感占绝大部分、中性情感占第二位、负向情感最少。在此基础上,利用Ucinet6软件,以用户为节点,转发关系为边界,构建发布情感文本的公众的整体情感网络和各类型情感的情感网络。研究各类型的物流情感网络的传播特征和传播路径后发现负向情感网络的用户的关系是最紧密的,负向情绪更加的容易引起公众的共鸣,正向情感类型用户的转发量大部分都在0到1之间,没有形成正向的情感领袖,中性情感网络的情感焦点较多,需要向正向情感引导。情感信息在网络中的传播路径开始是以“中心式”的方式向四周一级传播的,在传播的过程中可能会产生二级用户节点,再以二级用户为中心节点向四周扩散,之后形成三级、四级用户节点,直至信息传递到节点度为0的公众,需要更多地关注各级节点上公众的情感类型。最后根据应用中的情感分析和情感网络研究结果总结了现阶段物流行业存在的问题。需要让管理者认识到大数据对行业带来的促进作用,并建议利用大数据的功能特点,提高物流服务监控手段,优化物流末端网点的管理环境。在优化的情感网络中传播公司改善的服务内容,提升用户粘性,增加用户量。在大数据的支持下优化配送路线提高配送效率等措施。