互联网信息情感倾向性的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:RockyZhang111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网信息资源急剧膨胀,带有个人情感色彩的言论越来越多,分析这些文本有着很大的现实意义,因此如何有效地抽取与过滤互联网上的信息,如何对文本进行情感倾向分析成为当前互联网智能信息处理的研究热点。这涉及到自然语言处理、信息检索、信息抽取、机器学习等多个领域的研究内容。本文首先介绍了研究的背景以及相关的理论基础,而后,详细地研究了从互联网信息抽取到情感倾向分析的一个完整的流程,主要是三个方面:互联网信息抽取、信息过滤、文本倾向分析。在信息抽取中,主要分析了互联网信息的结构,应用了DOM树、HTML解析器处理网页数据,引入了模板技术以解决多样化的网页信息抽取。在信息过滤部分,在词语语义相似度计算基础上,近一步改进了句子的语义相似度计算算法;最后,研究了文档之间相似度计算的方法,并通过文档与主题之间的相似度值来实现文本信息的过滤。此后部分,深入研究了文本的倾向性计算算法,涉及短语的倾向性计算、句子及篇章的倾向性计算。在此基础上,阐述了一个互联网信息倾向性分析系统的设计与实现。最后,通过实验验证了信息抽取的可行性、改进的信息过滤算法的高效性以及倾向性分析算法的准确性,同时对互联网信息倾向性分析系统进行了功能测试,实验证明系统达到了设计要求。
其他文献
残疾人是一个数量众多、特性突出、特别需要帮助的群体。由于自身残疾的影响和外界环境的障碍,残疾人特别是视力残疾人在获取信息方面存在较大的困难。随着社会信息化的加速,
作为物联网大潮流下的M2M产业,虽然世界各国政府都在大力支持和推行,但目前物联网和M2M的发展却趋于狭隘,虽然实际应用已在我们的日常生活和工作中通过商业运营的模式展开,但局限
无论在民用或军事领域,无线传感器网络均具有广泛的应用前景,如用于战场环境下敌情的监测、智能家居、珍稀野生动物监测等。一个典型的无线传感器网络由一个基站和大量普通的传
网页隐秘通信是指在不影响网页正常使用的前提下利用网页中的信息冗余传递私密信息。网页隐秘通信检测与网页隐秘通信相互对立,两者在不断对抗中相互促进共同提高,通过网页隐
随着计算机网络和信息技术的快速发展,股票交易市场、气象监控、网络安全、电子商务等众多应用领域都产生了大量的数据,其中这些数据以流的形式存在,通常称之为数据流。这些数据
随着互联通信技术的快速发展,人们在实际生活当中对信息的要求越来越高。相对于以文字和语音为主体的原始通信方式,综合语音、图片、视频等多种信息源的多媒体通信方式有着不可
随着Internet的迅猛发展,许多传统行业也逐渐加入到互联网中,并迎来了新的春天。现代易货业的发展正是借助互联网的平台及发达的物流系统发展起来的。它大大的提高了传统易货
车辆路径问题在物流、组合优化以及管理学领域等都受到许多学者的广泛关注,许多实用的理论方法已经运用到实际案例中,对人们的日常生活生产都起到了较大的影响。车辆路径问题作
OLAP(Online Analysis Processing)是数据仓库中一种重要的决策支持分析工具。传统的OLAP设计基于历史数据的离线批量计算,制约了分析的实时性。在当今瞬息万变的商业社会,决策
移动计算环境下,客户端缓存的方法可以较好的解决网络弱连接和断接下客户访问数据的问题。语义缓存是通过客户查询语义信息描述的相关性而建立起的一种客户缓存。客户端具有缓