基于情感特征向量的Twitter情感分类方法研究

来源 :中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标 | 被引量 : 0次 | 上传用户:hjm19840220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
公众情感在包括电影评论、消费者信心、政治选举、股票走势预测等众多领域发挥着越来越大的影响力.面向公共媒体内容开展情感分析是分析公众情感的一项基础工作.经典的基于词频特征向量的特征提取方法,主要利用词频作为文本分类的依据,而词频与情感信息之间的关系并不紧密.针对Twitter推文的特点,本文提出了一种采用基于情感特征向量的Twitter推文情感分类方法.该方法首先通过对推文进行数据清洗、词形还原、词性标注和词汇向量化;其次,将单词匹配到情感词典中;最后,利用每个单词的正向情感、负向情感取值生成情感特征向量,通过MNB、SVM等机器学习方法训练模型,对推文的情感进行分类.实验结果表明采用情感特征向量的Twitter推文情感分类方法能够获得更佳的分类性能.
其他文献
在一台CA6DL高压共轨汽车柴油机上,借助INCA标定系统对喷油参数进行调整,研究降低双阶段燃烧低温阶段HC和CO生成量的喷油策略.结果表明:单次喷射时,可通过推迟喷油及增加油量降低HC和CO的生成量,但是受到NOx生成量和压力升高率的限制.将单次喷射改为油量相等喷射正时相距10°CA的两次喷射后,在维持较低的NOx生成量的情况下,通过适当推迟喷油正时及增加喷油量,有效降低了HC和CO的生成量.与
基于当前生态城建设的兴起,本文通过借鉴国内外生态城建设的理念和经验,结合桃花潭镇总体规划的实际,探讨生态小城镇规划的主要内容,以期对未来中国小城镇的建设提供生态的方法,基于镇域用地适应性评价的集约化土地利用,与自然融为一体的空间结构形态,分工互促的合理化产业布局,以疏通为原则的绿色道路交通,配套设施完善的生态化居住环境,立足自然本底的多样化绿化系统,强化规划可操作性的城镇规划控制,从而形成覆盖城乡
在京津冀一体化的背景下,河北省作为主要的承接体,面临着巨大的机遇和挑战.目前河北省内各县市基本都呈现出原料加工的基础工业化与装配加工的高加工混合的工业化阶段,这为其境内小城镇的工业化道路指明了向技术和资本集约化发展的模式——工业园区.同时河北省是农业大省,具有良好的农业基础,在承接京津产业疏解,大力发展第二产业的今天,小城镇不能放弃原有的农业优势,不能失去绿色的生态屏障,在这种环境下,促成小城镇的
近年来中国小城镇的发展十分迅速,特别是小城镇工业发展更是日新月异,但小城镇工业发展中也存在不少诸如产业结构层次低、乡镇企业布局乱、土地利用集约程度低等一系列问题.随着小城镇用地成本的增加,土地紧缩政策推行,低价征收土地再粗放利用土地的开发模式难以为继.而且在小城镇的发展进程中,城镇化滞后于工业化的现象非常普遍,并且已经影响到了小城镇的可持续发展.本文即是在这种背景下,选取临清市烟店镇的产业园区进行
绿色化发展是村镇规划的重要指导思想,而村镇环卫体系的规划建设是绿色村镇建设的重要内容.本文以东北严寒地区代表性村镇为研究对象,以实地调研和问卷调查为基础,从寒地村镇环卫体系的现状概况、构成要素特征和不同类型寒地村镇的环卫体系特征入手,在分析寒地村镇环卫体系整体现状特征的基础上,揭示了寒地村镇环卫体系存在的问题,并从多个方面分析了当下寒地村镇环卫体系规划的主要影响因素.结合相关经验与规范标准,对寒地
随着城市风貌的趋同,村庄担负着传承中国地域、乡土文化的重要载体作用,党的十八大报告明确提出建设美丽中国、实现中华民族永续发展的重要目标,如何正确处理村庄的保护、传承与发展问题,已成为农村建设过程中面临的一个重要课题.对于村庄的保护与发展问题,当前的核心任务就是在确保村民生产生活条件不断改善的前提下,探索实现村庄风貌特色传承与发展的有效路径和方法.但是在村庄建设快速发展的过程中,出现了盲目模仿城市设
随着最新环保标准的颁布实施,循环流化床(CFB)锅炉面临氮氧化物(NOx)排放要求的挑战.根据CFB燃烧理论及已有的NOx生成机理研究成果,提出了以提高床质量、减少床存量、增加循环量为核心的改善炉内气氛降低NOx原始排放的技术路线,配以合理的床温、配风,使CFB锅炉在无烟气脱硝的条件下,实现超低NOx排放.该技术在燃用不同煤种的150t/h、260t/h和560t/h CFB锅炉上进行了工程实践,
热电厂锅炉在高温运行后,管壁蒸汽侧氧化膜在冷却过程中易发生开裂和脱落,对机组安全运行构成威胁.本文采用有限元方法,建立预置有贯穿裂纹和交界面裂纹的氧化膜模型,并利用交界面裂纹尖端的应力强度因子,定量描述交界面裂纹扩展的影响因素.结果表明随着贯穿裂纹密度和长度的增大,有效缓解交界面裂纹的扩展;并随着氧化膜的生长,氧化膜更容易脱落.
研究微博情感分析具有重要的理论意义和现实价值.当前的中文情感分析研究性能较差,主要原因是已有的算法采用串行的模式对其进行研究,即先分词,然后根据分词的结果采取特征建模,进而来训练分类器.串行模式的缺点是分词的错误会进行传播,从而影响分类器的性能.本文提出一种创新的基于分割和分类的联合模型来实现中文微博情感分析.首先根据候选生成模型为句子生成多个候选,基于候选排序模型对该句子进行打分,选择分数最高的
该文采用基于连接依存树表示体系的汉语篇章结构语料构建汉语篇章结构分析平台.该语料标注内容包含子句、连接词、篇章关系、篇章单位主次和篇章结构树等.在此语料上,采用自底向上的方法进行汉语篇章结构分析,包含子句识别、连接词识别与分类、篇章关系识别、篇章单位主次识别和篇章结构树构建等子任务.最后给出了各个子任务的实验结果及汉语篇章结构分析平台的整体性能.本文汉语篇章结构分析平台整体效果还不尽如人意,下一步