【摘 要】
:
随着互联网技术的飞速发展和电子商务的不断完善,越来越多的用户开始在电商平台上分享自己对产品的评论和看法,由此产生了海量的产品评论文本,对这些产品评论数据进行情感分类含有很高的商业价值和研究意义。但是,不同语言的情感资源在质量和数量上分布不均匀,无法更好地对情感资源不足的语言进行情感分类,而很多小语种仍然有着进行情感分类的需求和研究意义。因此,研究者借助于英语等语言的标注数据和情感资源帮助其他资源匮
【基金项目】
:
国家青年科学基金项目(NO.61806072);
论文部分内容阅读
随着互联网技术的飞速发展和电子商务的不断完善,越来越多的用户开始在电商平台上分享自己对产品的评论和看法,由此产生了海量的产品评论文本,对这些产品评论数据进行情感分类含有很高的商业价值和研究意义。但是,不同语言的情感资源在质量和数量上分布不均匀,无法更好地对情感资源不足的语言进行情感分类,而很多小语种仍然有着进行情感分类的需求和研究意义。因此,研究者借助于英语等语言的标注数据和情感资源帮助其他资源匮乏的语言进行跨语言情感分类。在跨语言情感分类研究中,传统的方法是借助于平行语料库或者机器翻译来进行两种语言之间的关联。但是,情感表达在不同语言之间存在很大差异造成翻译系统自身出现翻译错误,机器翻译并不能很好地解决语言差异的问题,同时大量质量较高的平行语料库在很多的实际环境中很难获取。针对这一问题,本文以用户产品评论为分析对象,通过建立与两种语言独立的共享空间来进行跨语言情感分类,实现对产品评论情感倾向性的判断。主要研究内容如下:(1)提出一种基于共享空间的跨语言情感分类方法。借助TF-IDF和LDA算法建立双语词典,在进行跨语言语义转换的同时,借助褒贬义词典学习极性信息,学习一种与两种语言独立的共享空间,在共享空间上可以将不同极性的情感词进行很好的区分。为验证方法的有效性,本文选择亚马逊网站三个领域的用户产品评论展开实验,在NLP&&CC2013跨语言情感分类数据集上的实验结果表明,该方法可以有效提升在目标语言上的分类效果。(2)在进行跨语言情感分类时,文本中不同的部分对文本的情感贡献度不同,本文提出一种结合注意力机制和情感特征的跨语言情感分类方法(CLSA)。将包含情感词的上下文单独提取获得情感特征,结合注意力机制使文本更关注于对情感贡献重要的部分,最后将获得的情感特征融入GRU模型,结合提取的情感语义信息获取情感注意力并进行文本的表示,在共享空间上进行最终的跨语言情感分类。通过实验结果得出,本文提出的跨语言情感分类方法与其他方法在同一数据集进行实验对比具有较高的准确率,优于其他主流算法,证明了方法在解决跨语言情感分类任务的有效性。
其他文献
随着老龄人口数量的激增,骨质疏松引起的骨缺损和骨损伤呈高发趋势,而且由于骨质疏松患者的骨组织密度低,其在骨修复和骨替代术后更难痊愈。3D打印技术的兴起,为骨质疏松患者骨缺损和骨替代治疗手术中使用植入体的制备带来了一种全新的方法。通过调整植入体的多孔结构可以获得与骨质疏松患者骨组织力学性能相近的植入体,可有效避免应力屏蔽效应,有利于植入体与骨组织之间的结合。但3D打印钛合金植入体的孔洞结构不利于实现
在日常生活中人们无法避免和汉字打交道,而无论是从书法文化的传承还是人们的汉字教学练习的角度而言,针对汉字书写美观性评估的研究都是具有重要的实用价值。目前的汉字美感评价标准方式多式多样,将评价标准和计算机技术的结合还在不断研究中。本文通过卷积神经网络对汉字字形图像提取汉字字形信息,并且分别从字形约束这一外部因素和汉字笔画信息这一内部因素进行汉字美感的研究,根据美感研究最终选择基于字形的凸包中心、物理
随着我国交通基础设施的不断完善,居民的出行变得更加方便、快捷。公共交通作为城市交通的枢纽系统,承载了大量的居民出行。而公交IC卡作为乘车的主要付费媒介,其数据包含了大量的乘客出行信息。在海量出行信息的背景下,如何利用好这些数据成为了研究热点。本文基于公交IC卡数据,对其进行整理,利用处理后的研究数据,分别对乘客的出行链模型和单线公交OD矩阵这两方面进行了研究。具体研究内容如下:(1)基于大数据平台
人口老龄化加重已成为中国乃至世界所面临的一个社会性问题,而中老年人的日常护理和疾病防治是繁复且必要的医护工作。根据呼吸系统方面的主要病因和卧床瘫痪的护理需求,设计了一种面向辅助翻身的柔性护理床垫。该床垫以气囊为关键受力件,结合柔性压敏传感器达到在睡眠中监测呼吸状态的同时通过调整节气囊高度进行睡姿调整的功能,并且能够通过身体各部位气囊压力和高度的调节辅助翻身防止卧床产生褥疮等。但是该种用于护理床上的
表面肌电信号记录了肌肉的电信号,是在体表无创检测肌肉活动的重要方法,常用于智能假肢控制、康复训练和评估,以及人机交互等领域。如今,肌电采集系统存在处理时间长、存储容量不够和功耗高的问题,因此,基于压缩感知的表面肌电信号采集与重构的研究,对于降低肌电采集系统的功耗,解决数据传输带宽限制,节省数据存储内存,提高肌电信号检测的准确性和实用性等具有十分重要的意义。本文针对表面肌电信号处理时间长和存储信息量
以氧化石墨烯(GO)为代表的二维纳米材料在分离膜中发挥着重要作用。在GO膜的制备中,多孔支撑层用来提供足够的机械支撑,不同物理和化学性质的支撑层影响着GO膜的组装结构和性能。目前支撑层对GO膜性能影响的研究较少。本论文以聚醚砜(PES)超滤膜为基膜,选用不同的纳米材料为中间层,考察了支撑层形貌对复合膜的结构和性能的影响。通过聚多巴胺(PDA)对PES超滤膜改性后压力沉积不同量的二氧化钛(TiO2)
实施创新驱动发展战略,要求企业不断提高自主创新能力,掌握并运用好系统化创新方法是保障企业核心竞争力的有效途径之一。TRIZ提供了发明问题解决工具和方法,能够迅速帮助设计者获得满意的创新方案,是解决各类复杂技术问题的有效手段。但TRIZ在科学有效的定义冲突方面还存在不足之处,且TRIZ本身并未提供可靠的方案评价依据。为了弥补TRIZ理论的不足,论文将引入TOC理论中的思维流程工具与TRIZ工具结合,
随着全球生态环境的日益恶化和能源的紧缺,电动汽车的需求量正不断增多。我国目前正在大力推进纯电动汽车的发展,永磁同步电机以其结构简单、较高的功率密度和峰值效率被广泛的应用于纯电动汽车上。纯电动汽车动力源由内燃机变为电动机,因此它的背景噪声更低,使得电机噪声对整车的贡献更加突出。消费者在购车时越来越注重乘坐舒适性,驱动电机产生的噪声会使人产生不悦的感觉,所以市场和企业都对电动汽车驱动电机NVH(Noi
电解质水溶液的微观结构和宏观性质之间存在着密切的联系。物质的磁效应提供了物质结构、物质内部各种相互作用以及由此引起的各种物理性能相互联系的丰富信息,研究强磁场对水溶液微观结构及其宏观性质的影响,可以揭示水溶液结构受强磁场影响的本质及变化规律,进而为水溶液的宏观性质和微观结构的联系研究提供一定的理论依据。本文利用X射线衍射法、拉曼光谱法、紫外光谱法、接触角测量法、粘度测量法和分子模拟研究了不同强磁场