基于用户生成内容的中文情感分析研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:houjinlei11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络用户们每天都在以社交平台为主的各种平台上发表自己的日常、对热门话题的看法、购买某个产品或服务后的感受等主观信息。互联网用户生成内容里隐藏了大量有价值的信息,针对这些内容进行情感分析有着产品质量提升、服务水平提高、获取公民述求以及优化人机交互等现实意义。然而,用户生成内容往往口语化、个性化、非结构化,仅依赖人工处理非常困难。因此,在中文用户生成内容的情感倾向性分析中,从语句级别和方向级别两个角度进行深入研究。针对中文粗粒度语句级情感分析,为了解决现有的几部经典中文情感词典分类不够细致以及未收纳网络用词等问题,专门构建了包括否定词、连词、程度副词、网络用语等在内的5部情感词典。在充分分析了中文用户生成文本的特征之后,总结整理了语义分析规则集,并在此基础上给出了一套中文句子情感值计算方法。使用该算法在电商评论数据集上进行了三组实验,实验结果显示本文提出的方法在中文句子级情感判断上均好于其他两种方法。对于中文细粒度的情感分析,先后给出了两种解决方案。首先,通过综合双向长短时记忆网络Bi LSTM和注意力Attention机制两者的优点,提出了Bi LSTM+Attention模型。实验证明,此模型在中文餐饮评论文本数据集上情感分析的准确率高于业内已有的LSTM、Bi LSTM等模型。接着,基于多头注意力机制(Multi-head Attention,MHA)又提出了融合词位置信息的Bi LSTM-MHA模型,该模型在输入层和特征学习层两处对前一个模型Bi LSTM+Attention进行了改进。同时,使用几种数据增强技术扩充了已有的数据集。在增强前后的数据集上进行了一些系列实验后,结果均表明改进后的Bi LSTM-MHA模型在中文文本方面级分析上性能更好。
其他文献
复杂型号工程对于国民经济发展和国家安全发挥着举足轻重的作用。论文探讨基于精益思想的研发管理优化策略、方法、路径等,指导企业研发管理改革和提升,以适应未来不断增长的市场需求和激烈的竞争环境。论文以商业航天运载火箭这类复杂型号工程产品为对象,以精益思想为灵魂,将研发管理优化作为导向,建立研究和分析的架构。首先,由选题的背景引导出研究的目的和意义;其次,对国内外精益生产、精益思想、精益研发的发展历程和现
学位
随着我国资本市场财务舞弊案件不断被披露,如银广夏、金亚退、欣泰退等,监管部门和社会公众无法完全信赖上市公司经审计后的会计信息,质疑注册会计师的职业道德和服务质量,严重阻碍了注册会计师行业的存续和发展。为了快速解决这些问题,迫切需要对审计失败发生原因、预防审计失败的措施进行研究。论文采用文献研究法和案例研究法。首先,论文筛选和整理了国内外学者以往做过的研究,形成论文观点的基础,同时梳理了审计失败的成
学位
随着电力通信技术的日新月异和电力通信行业的蓬勃发展,各电力企业通信技改项目逐年增加,随之所带来的项目质量、进度等风险问题也日渐突出。因此,电力通信技改项目风险管理显得至关重要,目前国内对电力通信专网的项目风险管理研究不够完善,风险管理的模式和电力企业员工的风险管理意识有待提高。本论文通过对相关文献资源进行研究,分析了目前国内外风险管理方面相关理论研究和实践案例成果,并理论结合实际以H电力调度交换技
学位
随着软件系统功能的不断丰富,原来的单机系统软件已经无法很好地满足服务需求。单机系统被划分成一个个微服务系统,极大地提高了系统的可用性和分区容错性。为了进一步扩展系统的功能,各软件公司总会不断地迭代当前的服务。为了保证增量的功能不会引起存量功能的可用性问题,各大公司都投入了大量的人力财力去做自动化测试。但传统的自动化测试在面临频繁的测试时也出现了效率低下的问题,不能够适应项目的迭代速度,新版本的发布
学位
随着互联网技术的不断发展,在线学习系统的功能复杂性也在不断增加,面对日益增长的用户需求,传统单体架构并不能满足不了我们的需求。与此同时,国际化的不断推进,多方面的学习交流也成为了趋势。在线学习系统的功能越来越多样化,同时系统层面需要容易维护且方便开发人员进行功能的扩展,减少系统上的耦合。为了更好的满足在线学习系统的需求,提高在线学习的吸引力和趣味性并解决传统单体架构带来的一些问题,因此系统以微服务
学位
项目管理是一种成熟的现代管理方法和工具,已在各行各业大量应用。近年来,我国汽车产业结构调整加快,逐渐由高速增长转变为高质量发展新阶段。作为汽车整车企业上游供应商,汽车零部件企业必须擅于运用项目管理打造具有竞争力零部件产品,才能适应整车客户愈发严苛的技术、质量、成本、开发周期等要求。DM公司是一家从事汽车热管理系统研发、制造和销售的汽车零部件企业,为应对激烈市场竞争,需要持续加快新产品开发。作为新产
学位
最近几年,互联网金融迅速发展,各大互联网金融公司和证券公司争相开发自己的股票交易系统,而股票交易相关系统必不可少的就是股票行情展示功能。因此需要设计实现一款可以支持多家证券公司、功能完整、数据全面的股票行情分析系统,用于帮助广大股民获取行情数据。基于Dubbo中间件的股票行情分析系统包括个股必读、市场总览、龙虎榜、恐惧贪婪指数四大功能模块。在软件架构上采用Dubbo中间件实现微服务,对各个模块进行
学位
即时通讯(Instant Messaging,IM)系统作为实时通信系统,支持在不同用户之间提供诸如文本,图片,音频和视频等类型消息的可靠传输服务。在当今这个互联网时代,即时通讯服务俨然已经作为一种基础设施而广泛存在于不同的业务应用当中。云加密系统是一个基于内容关联加密算法的密钥管理系统,后端系统基于微服务架构构建,同时支持移动端和PC端等多种用户端,主要为用户提供针对密钥文件的云存储管理服务。通
学位
深基坑工程是许多学科交织在一起的综合技术,在设计时和现场施工中管理人员、机器、材料等发生变化都会影响施工。随着时代的不断发展,高层建筑也开始增加,在此背景下基坑工程数量也在提升,受基坑工程周边环境的限制,选择合适的施工方案和施工技术,可以有效进行基坑支护建设,同时应采用一定的评价方法对基坑建设过程进行风险评估。通过调研的方式对基坑安全事故进行研究分析,明确对其产生影响的相关因素,探究如何对风险进行
学位
生物活性肽预测对于药物、食品研究等领域都具有重要意义。目前,基于机器学习方法的活性肽预测主要针对特定活性肽,并主要通过程序预测或人工构建生物特征,再建模预测活性肽,预测结果依赖相关特征预测的准确性和相关生物背景知识。很多活性肽来自于前体蛋白,从前体蛋白质中精准定位出肽片段的工作比较匮乏,尤其是基于端到端模型的活性肽预测。针对研究现状,提出了基于端到端的活性肽预测模型,实现从前体蛋白中预测出活性肽。
学位