【摘 要】
:
在信息技术高速发展的今天,用户需要面对大量的数据,海量数据中蕴含用户所需要的信息。微博作为一种新兴的互联网应用,正在高速地发展,由于用户众多,在微博上人们大量参与讨论的话
论文部分内容阅读
在信息技术高速发展的今天,用户需要面对大量的数据,海量数据中蕴含用户所需要的信息。微博作为一种新兴的互联网应用,正在高速地发展,由于用户众多,在微博上人们大量参与讨论的话题往往成为热点话题,用户针对话题发表的微博信息往往带有主观意味,本文以此为研究的出发点,为了获取在微博下用户对话题的舆情信息,对热点话题类微博的情感分析任务进行了研究,具体的研究包括以下几个方面:首先,分析了热点话题型微博的特点,讨论了有监督方法下,微博主客观分类、情感极性判别问题上分类器的选用以及特征的选择。通过实验发现在SVM分类器下,微博主客观分类问题通过结合文本特征与非文本特征,文本特征采用2选择,并利用微博的表情符,可以获得最优的性能。微博极性判别问题下结合词汇级特征、语句级特征和表情符特征可以取得最好的性能。实验结果证明了方法的有效性。其次,针对目前热点话题类微博下情感分析任务面临标注语料不足的问题。采用了半监督的策略,使用直推式支撑向量机(TSVM)的方法,结合大量未标注数据,在与有监督方法相同的特征组合下,微博主客观分类和情感极性判别的性能得到进一步提升,证明了方法的有效性。再次,研究了热点话题下微博评价对象的抽取策略。发现名词、名词短语以及微博的Hashtag占微博评价对象的绝大部分,同时面对抽取结果表达的多样性,对评价对象进行了聚类研究,并给出相关评价,提炼了话题的评价角度。最后,设计并实现了一个完整的基于热点话题型微博的情感分析系统。该系统有效地整合了本文所研究的方法,整个系统包括微博数据获取子系统、热点话题微博情感分析子系统、结果数据存储子系统、结果可视化子系统。
其他文献
本文利用格兰杰因果检验和向量误差修正模型,对中国股票市场表现和宏观经济变量之间的关系进行了经验检验。格兰杰因果检验表明,大部分宏观经济变量可以格兰杰引起股市价格变
目的通过2009年、2010年2a对神经外科住院病人进行呼吸道感染目标性监测,并于2010年对病房应用循环风消毒机进行室内空气消毒干预,比较院内感染发生率。方法危重病人房间及抢
本文在公共财政改革的大背景下,探讨了商业银行服务于公共财政资金循环、开展银政合作的动因,分析了我国银政合作业务的现状,指出了目前国内银政合作业务与发达国家相比存在
<正> 我院自1996年4月开展泌尿科工作,其中全膀胱切除及可控性尿流改道术病人为12例,用回肠或盲肠做成贮尿囊另用一段肠管做成具有活瓣功能的输出段并行腹壁造口,术后尿液不
民间陋习是传统中不良文化现象,是社会转型和文化现代化的扬弃对象,从传统文化着手研究民间陋习,厘清其主要内容,研究其存在的原因,认识其危害性以及从法律角度对其进行规制,
针对板梁结构的微小缺陷识别问题,对板梁结构的模态振型和模态频率进行了研究,提出了基于小波变换和移动质量法的板梁结构缺陷识别方法。对“质量块在结构表面移动过程中,质
电缆外护套是保护电缆导线的重要部分。在高寒地区,气温温差变化幅度大是造成电缆外护套开裂重要的原因之一。根据齐齐哈尔地区冬季气温统计资料,统计分析了该地区冬季气温波动
采用自制压浆剂配制预应力孔道压浆料,研究了搅拌参数、水泥品种、水胶比及矿物掺合料种类对压浆料浆体的工作性、膨胀性、力学性能及耐久性能的影响。研究结果表明:适当的高
导数是微积分的核心概念之一,引入到高中数学教材之后,为数学解题注入了崭新的活力,拓展了学习和研究的领域。导数成为高中数学知识的一个重要的交汇点,是联系多章节内容和解决有
近年来,伴随着市场经济的不断深入发展,新思潮、新文化不断涌现,大学生的思想更为多元化,价值取向发生了深刻的变化。作为高校“第二课堂”的大学生社团,在大学生的成长和成才中发