论文部分内容阅读
社交媒体是当代人表达和宣泄情感的重要平台。基于社交媒体的情感检测能挖掘出用户的态度和偏好,在舆论分析、交通状况分析、广告推荐和安防监控等领域都具有广泛的应用价值。另一方面,随着人工智能的迅速发展,情感生成也成为当前的一大研究热点,社交媒体为情感生成提供了丰富的情感数据。情感生成能改善人机交互的体验,在评论生成、数据增广、对话生成等领域都有广阔的前景。情感生成和情感检测都面临的一大挑战是情感语义鸿沟。通过研究发现,生成对抗网络能学到数据分布的整体关联,判别特征在分类上具有一定的有效性;强化学习有助于对抗神经网络学到高维语义信息。基于以上特性,本文使用生成对抗网络探究了如何在情感检测中获得更鲁棒的情感表示和如何将抽象的情感信息加入到文本生成过程中,主要内容和创新点如下:1.针对社交媒体情感检测中存在情感语义鸿沟和数据标注成本高两个问题,本文提出了一种对抗神经网络判别特征和深度情感特征融合的方法增强情感特征的鲁棒性,减少情感特征和真实情感之间的语义鸿沟;为增加生成对抗网络特征中的情感信息,使用了表情标注的数据进行训练。实验表明,加入生成特征有益于提高模型检测情感的准确率。这是当前已知的第一个将对抗神经网络的特征引入文本情感分析的研究。2.针对情感信息在文本生成中学习不充分及情感生成中文法和情感不兼容两个问题,本文基于LeakGAN模型通过增加情感反馈的方法来强化模型对情感的学习,并通过情感标签对情感进行控制;设计了不同的情感反馈策略,通过实验分析不同策略对于情感和文法平衡的影响。结果表明,通过本文的情感加入方法能够让对抗神经网络生成带有明显情感倾向的文本。这是当前已知的第一个基于对抗神经网络生成带有情感的中文文本的研究。3.针对交通状况分析的数据采集上成本高和覆盖受限两个问题,本文基于社交媒体情感检测模型提出了一种基于社交媒体倾向性预测交通状况的方法,构建了一个低成本、高覆盖率、实时性的交通状况分析系统。通过以时间和空间两个角度验证了本文的方法在交通状况预测上的有效性和可行性。