【摘 要】
:
随着互联网技术的迅猛发展以及互联网应用的不断普及,互联网已经成为越来越多的人们获取信息的重要来源,同时成为人们表达自己观点的平台,由此产生巨大的情绪数据。与此同时,
论文部分内容阅读
随着互联网技术的迅猛发展以及互联网应用的不断普及,互联网已经成为越来越多的人们获取信息的重要来源,同时成为人们表达自己观点的平台,由此产生巨大的情绪数据。与此同时,随着经济的全球化和贸易的国际化的进一步发展,跨语言的交流越来越频繁。在此情形下,如何对互联网上产生的大量情感数据,利用带标记的资源丰富的英语语料库作为源语言,对没有标记的目标语言(汉语)评论进行跨语言情感分析研究,成为目前研究的热点问题。本文对基于特征迁移的跨语言情感分析技术进行了深入的研究,对跨语言结构对应学习算法进行改进,提出了PCL-SCL算法,主要工作如下:1)在已有的跨语言情感分析技术的基础上,将特征迁移学习与情感分析相结合,即通过源域和目标域之间潜在的关系,找到特征表示。采用特征迁移学习,构建对不同语言、不同分布知识的新框架,其主要优势是对目标域是否带标记及数据是否同分布要求不高。2)由于训练过程中存在着影响公式的因素,因此,引入弹性网正则化参数,将L1正则化和L2正则化的处罚函数结合起来形成线性回归方法,使得训练得到稀疏矩阵更加权衡分组与稀疏之间的相关性,从而减少冗余,降低维数。3)通过改进跨语言结构对应学习算法,引入对矩阵求解特征值的方法,得到映射函数,应用到目标域中的每个输入参数,然后通过评估函数,对改进的跨语言结构对应学习(PCL-SCL)算法的质量进行评估,计算准确率。实验结果表明,与跨语言结构对应学习算法相比较,在同一数据集上,准确率相对较高,具有一定的优越性。
其他文献
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种主动式对地观测系统,能够全天时、全天候实施对地观测,SAR图像以其独特的优势发挥着其他遥感图像难以发挥的作用。SAR图像
互联网技术的蓬勃发展导致信息过载,使得公众难以辨别琳琅满目的商品和选择最符合自己需要的商品。因此,基于信息检索的个性化推荐系统应运而生,协同过滤技术是应用最广泛的
自从证券交易市场的出现,世界各地的学者都试图了解驱动股票价格的因素有哪些。尽管文献认为市场是趋于有效的并且与宏观变量有关,但哪些变量是重要的还并不确定。此外,它们
周界入侵电磁传感系统是近年来发展起来的一种户外周界防护系统,该系统广泛应用于机场,军事基地,核电站,工业厂房等重要场所,其原理是将一根漏泄同轴电缆(简称漏缆)浅埋于地
高速宽带无线通信系统中,由于符号间隔降低,导致信号到达接收端的各延时路径可分辨,从而带来多径效应且引入了频率选择性衰落。此信道是非时变的,然而一旦通信双方中的一方处
目的:1.筛选急性脑干梗死患者的差异性内源性代谢物质,通过对获得的生物标志物进行分析,探讨急性脑干梗死发病的可能机制。2.观察针刺组与对照组治疗前后急性脑干梗死患者生物标志物的变化趋势,探讨针刺对急性脑干梗死可能的干预效应。方法:1.以27例临床急性脑干梗死患者和25例正常健康人为研究对象,采集受试者晨起空腹肘静脉血4~5m L,经过高速离心机离心,取血清为检测样本,采用超高效液相色谱-四级杆-飞
日渐成熟的人体运动捕获技术催生了一批大规模运动数据库的出现,为人体动画生成提供了真实且丰富的数据来源。受运动捕获系统成本、环境、资源等方面的限制,通常动画师们会为
随着计算机体系结构的发展,多核处理器内部结构越来越复杂,处理器核的数目和种类不断增加,如何充分利用这些处理器核成为计算机领域的一个研究热点。在多核处理器中,任务调度
在全球经济不断发展,知识经济竞争日趋激烈的今天,现代科技对人类社会的影响日益加深,科技工作者对社会的发展显得越来越突出。但是由于工作压力大、闲暇时间少、久坐、不经
数据挖掘是人工智能领域中的重要组成部分,同时也是一个多领域交叉的学科,广泛的应用于数据处理方面。Pawlak于1982年提出了粗糙集理论(Rough Set,RS),其能够处理数据集中不