基于有序分类的文本情感分析

来源 :淮北师范大学 | 被引量 : 0次 | 上传用户：fantasyst

【摘要】

：

大数据时代,人们所接触的数据在数量与维度上与日俱增,网络上有着丰富的量化数据和文本数据,相对于量化数据,文本数据具有比重大,复杂,新颖等特点。其中文本情感分析在大数据

【作者】

：

陈柏宇

【机构】

：

中国科学技术大学

【出处】

：

淮北师范大学

【发表日期】

：

2017年期

【关键词】

：

文本情感分析 word2vec 有序分类成对比较 PairCode算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大数据时代,人们所接触的数据在数量与维度上与日俱增,网络上有着丰富的量化数据和文本数据,相对于量化数据,文本数据具有比重大,复杂,新颖等特点。其中文本情感分析在大数据时代这个背景下不断地发展并吸引着大量研究者的关注,如何充分有效地利用文本数据,挖掘其中所包含的信息是一个巨大又有意义的挑战。文本分析是指对文本的表示及其特征项的选取;文本分析即让计算机能够对于人类文字进行理解和分析,它要从文本数据中抽取出文本所包含的特征与信息。本文着重探究的对象是文本情感的有序分类,利用神经网络语言模型word2vec将文本数据量化,再通过成对比较有序分类算法将量化数据做情感分类,完成文本情感分析。首先为了更好地利用计算机来分析文本数据,本文利用神经网络语言模型word2vec来对文本数据进行量化,相对于其他的方法具有模型简单、效率高、易调参的优点,并且在此基础上本文结合了其他的特征提取方法,如:TF-IDF,LDA4主题模型,再加以优化得到词向量,此综合法在数值实验上取得了更好的效果。另一方面,本文研究的是有序分类问题,提出了成对比较策略的有序分类算法(PairCode),详细介绍了如何使用成对比较将有序分类转化成无序分类,再将无序分类结果转化成有序分类类别,给出了成对比较下类标签编码矩阵设计、样本均衡、分类器训练、新样本预测等环节中的可行策略。并在数值实验中与其他有序分类算法比较,PairCode算法在MAE、MMAE等有序度量指标上有较好的表现,然而,由于PairCode算法本身策略的特点,其分类速度是较慢的,在后续研究中需要不断改进。

其他文献

变指数Lebesgue空间上分数次极大算子的局部加权有界性

本文主要研究了变指数空间上分数次极大算子局部加权有界性的问题.本文先介绍了变指数空间,极大算子和Ap权的发展史,以及变指数空间中关于分数次极大算子有界性的结论.然后,本文给出局部Ap(·),q(·)权的定义并证明相关性质,证明分数次极大算子的局部加权有界性.本文首次给出了变指数空间上局部Ap(·),q(·)权的定义和局部分数次极大算子的定义,同时进一步完善了分数次极大算子的加权有界性.

学位

图和有向图的局部边连通性

但是边连通度存在着一些不足之处：首先，边连通度相同的图可靠度可能不同；其次，默认图的任何边子集中所有元素可能潜在地同时失效；最后，不能区分删除条割断边得到的图的不同类型，即未

学位

超级局部边二部有向图定向图连通性可靠度

半直线上微分方程边值问题的解

半直线上二阶边值问题起源于对非线性椭圆微分方程对称径向解以及半直线上中间多漏洞的煤气压力模型的研究，近年来，半直线上的非线性微分方程边值问题经常出现在各种理论性和应

学位

数值分析微分方程边值问题不动点定理

Hardy算子与CMO函数构成的交换子在一类Hardy型空间中的估计

本文讨论Hardy算子与CMO函数所构成的交换子Hb,H*b在Hardy型空间Hb;p,q,satom及LHb;p,q,satom上的估计.　　文章分为四章.　　第一章介绍背景知识并定性描述本文的工作.背景

学位

交换子Hardy型空间估计方法Hardy算子CMO函数

非对称范数及其在调和分析中的应用

调和分析源于Euler,Fourier等人的研究,形成于18世纪,主要涉及奇异积分、极大函数方法、球调和函数理论、算子插值方法、位势理论以及一般可微空间等,并且其广泛地应用到代数

学位

非对称范数调和分析插值定理分布函数算子范数

基于有序分类的文本情感分析

其他学术论文