基于情绪知识的情感分类方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:t6293003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着博客、电子商务、社交网站与微博等信息平台的兴起,主观性文本的信息量迅速膨胀。为了自动分析这些主观性文本包含的观点与态度,情感分类(Sentiment Classification)研究获得自然语言处理领域的研究者们密切关注并得到了迅猛发展。情感分类旨在对主观性文本按照其表达的感情色彩(例如:褒义或者贬义)进行自动分类。情绪(Emotion)是指人内在的心理反应与感受。情绪知识具体是指描述情绪的相关知识(例如:情绪词)。相对于普通情感知识来说,情绪知识在表达情感方面具有如下特点和优势:(1)牵涉到的关键词范围较小;(2)具有的情感色彩强烈;(3)情感表达领域较独立。因此,本文借助情绪知识帮助提高情感分类性能,主要研究内容和创新点包括以下几个方面:首先,本文提出了一种结合情绪词和非标注样本的情感分类方法。核心思想是借助于情绪词从未标注语料中抽取高正确率的自动标注样本,并通过半监督学习的方法进行情感分类。实验证明,该方法能够在不同领域内获得较好的分类结果。其次,本文提出了一种基于情绪词与情感词协作学习的情感分类方法。在基于文档-单词二部图的标签传播算法框架下,使用情绪词与情感词构建两个视图,通过协作学习的方法从未标注数据中获取高正确率的自动标注样本作为训练数据。此训练数据用于后续的情感分类训练。实验表明,该方法在多个领域有效提高了分类效果。最后,本文提出了一种基于情绪词的领域适应情感分类方法。针对文本情感分类研究中普遍存在的领域适应问题,使用情绪词在目标领域的未标注数据中抽取高正确率的自动标注样本,并同源领域的标注语料相混合作为已标注样本。在基于二部图的标签传播算法框架下,对目标领域剩余的非标注样本学习进行情感分类。实验结果表明,该方法有效加强了对未标注数据的学习能力,提升了领域适应的情感分类效果。
其他文献
无线传感器网络(Wireless Sensor Network,WSN)的出现引起了全世界的广泛关注。作为当今信息领域的研究热点,涉及多个学科、多种技术,主要包括:网络通信协议、核心支撑技术、
近年来,我国加快低空领域的开放,无人机应用越来越普遍,但是低空领域环境复杂,为保障飞行途中的安全,我们既要保证无人机在执行任务的过程中实时躲避障碍物,也要保证集群中无
普适计算的最终目标是将计算设备无缝集成到人们的日常生活中,使得用户能够“随时随地”获得符合其个性化需求的信息服务。情境感知技术是普适计算研究的重要方向,其目标是使
随着电子商务、手机支付和在线购物等线上交易模式的发展,人们对于虚拟数据的安全性的要求越来越高,传统的在线身份识别技术,如账号密码已不能满足安全性的需求,而生物识别技
互联网给人们提供了丰富的信息资源,它已成为人们获取信息的重要途径。随着互联网上信息数量的激增,信息搜索技术面临着越来越大的挑战,传统的搜索引擎很难满足用户个性化的
粒子系统是利用大量粒子进行模拟仿真的系统,被广泛应用于固颗粒体和流体相关的仿真中,包括可交互的流体的模拟,游戏中烟雾效果的模拟,天体物理学中的模拟和分子动力学等。离
雷暴天气是电子时代的一大公害之一。随着科学技术的发展,尤其是气象科技技术的发展,对雷暴天气预测开展了许多研究工作,也取得了很多成果。但至今还没有开展雷暴天气的小尺
视频监控系统是计算机视觉领域的一个典型应用,随着技术的不断发展,作为计算机视觉的分支之一的智能视频监控系统中的交通检测与跟踪技术已成为新兴的热门研究领域。在分析和
现代化温室是设施农业的典型代表,它采用覆盖材料形成了一个与外界环境相隔离的特殊小气候环境。影响温室小气候环境的因子有太阳辐射、温度、湿度、CO2浓度和通风状况等,其中,
随着科学技术与国家电子政务网络建设的飞速发展,以及警务信息化建设工程金盾工程的进一步推进,警务系统积累了大量的基础数据,部门地区的警务系统也达到了一定规模,有效地节