基于博客搜索的博文情感倾向性分析技术的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:navigate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随互联网的普及及其在全球范围内的飞速发展,网上博客信息呈爆炸式增长,博客在网民中的使用率高达57.7%,网民对博客的认知和普及程度日臻升高。博客使作者能方便地发表自己的观点,读者能快捷地对博文进行浏览和评论,以博客的形式来共享思想与资源变得越来越流行,其已成为一个重要的情感抒发与交流的平台,也使得它日渐成为舆情产生和传播的主要场所。然而,在信息过度膨胀的时代,网民更关注言简意赅、情感倾向相关的名人焦点信息。为了能快速的按需从博客领域获得支持或反对等博文情感信息,迫切需要一种合适的情感检索工具,来对海量的博客资源进行组织和搜索。这时,最好的选择就是博文情感倾向性搜索。本文通过对中文博文中隐含的情感因素加以分析研究,结合自然语言处理技术,提出了情感词典和依存分析相结合的博文情感倾向性分析SPOA算法。在博文预处理阶段构建了基础情感词典和褒贬多义词词典,进行博文中情感词的识别;以关系对组为最小情感分析单位,并结合提出的情感异位关系对转换VCCA算法,使得计算上下文相关的修饰程度,更加准确和合理。而后的实验表明,在中文博文情感分析上,基于依存句法的SPOA方法优于窗口修饰算法,语法距离的引入和依存关系对的修饰,使博文情感倾向分析的性能明显提升。博文全文分析与网摘分析,效果无明显差别,但针对博文结构的重点情感句处理,整体性能占优,表明博文结构特点对情感分析有明显影响。最后,应用本情感分析算法,将博文按照用户倾向性需求排序返回,初步实现了一个博文情感搜索原型系统。
其他文献
运动目标的识别与跟踪在国民经济、军事领域、科学技术研究和工程应用等许多方面都有着重要的研究价值。基于运动目标图像的识别与跟踪技术是世界各国精确制导武器系统急需解
传真通信作为有一种传统的传输静态图像的手段,是现代通信的重要组成部分。随着Internet的发展,IP通信技术与传统电信技术的融合步伐的进一步加快, IP传真(Facsimile over IP