基于条件随机场和情感词典的中文微博情感倾向性研究

来源 :南华大学 | 被引量 : 1次 | 上传用户:qpowapian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着21世纪到来,传统信息传播方式已经无法满足新时代信息传递的需求。互联网的飞速崛起,促进了传统信息传播媒介到新兴信息传播媒介的转换,由过去滞后、单调、被动的传播方式逐渐转向互联、主动、快速的新型传播方式。互联网为用户提供了大量的开放式信息交互工具,例如BBS、微博、博客等,用户可以不受时间和空间限制,在遵守法律的前提下,通过网络在各种平台上无限制的分享观点、传播信息,促进了信息的互相交流。微博作为其中最具代表性的信息传播平台,以其快捷性、方便性、趣味性,快速的被人们接受和使用。越来越多的互联网用户开始使用微博分享信息和表达观点,这些观点中往往带着用户比较鲜明的正面或者负面情感色彩。微博具有用户数量多、消息传播快、话题范围广的特点,因此,对微博中的情感信息进行挖掘并进行情感倾向性分析具有很重要的意义。本文对国内外许多学者在文本情感倾向性分析方面做过的相关工作进行了详细介绍并总结。本文从中文分词、词性标注、句法分析等方向入手,介绍了情感倾向性分析中中文文本处理的相关技术,以及当前比较常见的情感词库—Word Net、How Net等。文章基于新浪微博提供的分析语料,分析了中文微博短文本情感倾向性分析所面临的问题,提出了利用CRFs(Conditional Random Fileds,条件随机场)机器学习方法和自定义情感词典相结合的方式。经过实验验证了本文提出的方法。实验结果表明,相较于句法分析方法,文章提出的方法准确度提高了5%左右。文章最后总结了本方法的不足,对未来情感倾向性分析技术进行了展望,并指出了未来工作的方向和切入点。
其他文献
无线传感器网络由分布在特定区域的成百上千个功能简单能量有限的无线传感器节点组成,在科学研究、环境监测、工农业生产等方面有着非常广阔的应用前景。由于传感器节点能量
随着信息管理能力的提升以及人们对信息的访问量快速增加,企业对存储和管理信息的能力有了新的要求。网络存储的出现和发展适应了这一要求,网络存储因此有了长足的发展。但是
随着人工智能技术的不断进步,诊断技术己开始进入一个新阶段,即智能化诊断阶段。将人工智能领域的各种方法加以综合利用并用于故障诊断,特别是针对模糊性的诊断对象,将更有利
随着信息技术的发展,传统的关系数据库功能已不能满足当今信息系统中对时态信息处理能力的需求。而时态数据库理论为解决时态信息处理问题提供了一个很好的解决方案。经过二十
随着计算机网络的广泛应用,网络安全问题成为当下的研究热点。由于生物免疫系统的免疫识别、免疫细胞的分布检测、免疫自适应调节、免疫记忆等特性与入侵检测系统需要的特性
从交通监控到财产保护,从军事到民用,从公司到个人,智能视频监控系统以其特有的优势已被应用到越来越多的场合之中。不论是平安城市,还是智能交通抑或是现代化小区,这些新生
在日新月异的网络时代,B2B电子商务在不断发展。虽然大多数企业都实现了信息化,然而各个企业的管理系统往往各自独立,因此,如何将各个不同应用系统集成,实现B2B电子商务的综
短期电力负荷预测作为能量管理系统EMS的重要组成部分,它不仅是保证电力系统安全经济运行和实现电网科学管理及调度的重要方面,也是进行电网市场化运营所必需的基本内容,其预测精度直接影响电网及各发电厂的经济效益。电力系统负荷的运行变化易受多方面影响,其中天气、节假日等特殊情况的影响十分重要,常用预测方法对其不能很好适应。本文在分析比较各种预测方法优缺点的基础上,提出了一种考虑气象因素及日期类型的BP神经
网格是一个集成的计算与资源环境,它能充分吸纳各种计算资源,并将它们转化成一种随处可得的、可靠的、标准的同时还是经济的计算能力,实现资源的全面共享。良好的调度是实现高效
由于计算机在图像领域的优异性,情感计算越来越受到国内外研究者的关注,情感计算是试图使计算机能够像人类那样具有理解和表达情感能力的一个多学科交叉的新研究领域,在智能