基于潜在语义的Web评论情感倾向性研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:redhatping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网络的普及,人们获取信息的方式逐步从报纸、广播和电视等传统媒体向互联网转变。越来越多的人热衷于借助论坛、博客和微博等进行信息交流,互联网已然成为当今社会信息传播的主流载体。然而,互联网的开放性、实时性及多元性等特点,使得网络在某种层面上成为了谣言滋生和扩散之地。特别是随着网民数量的激增,Web信息量呈井喷式发展,如何有效的实现网络舆情的监测与安全预警显得尤为重要。情感倾向分析能够从海量Web评论信息中挖掘出话题的观点倾向,迅速发现热点舆情并预测其发展趋势,可以有效的对网络舆情进行监测及安全预警。然而,现有文本情感倾向分析中普遍存在分类准确率不高的问题,其应用将受到很大的限制。因此,本文针对情感倾向分类中存在的问题及其应用的关键技术进行深入研究,主要研究工作如下:1)针对现有的文本情感倾向分类方法中普遍存在数据稀疏、一词多义和多词一义问题,提出了一种结合潜在语义分析(Latent Semantic Analysis,LSA)和支持向量机(Support Vector Machine,SVM)的文本情感倾向分类方法。从词语的上下文环境来考虑词语的语义信息,能够消除文档集中词语存在的一词多义和多词一义问题可能产生的语义偏差,提高词语语义表达的准确性,并扩大词语在文档中的覆盖能力。实验证明,该方法可以有效的改善现有文本情感倾向分类方法中存在的上述问题,提高文本情感倾向分类的准确率。2)针对现有热点话题发现及预测方法中忽略观点倾向对话题热度影响的问题,在现有方法的基础上结合话题的观点倾向,提出了一种融合观点倾向因子的热点话题发现及预测方法。话题讨论过程中观点倾向或意见越不统一,则话题讨论的越激烈,其话题的热度也就越高。实验结果表明,改进后的方法可以更有效的预测热点话题的发展趋势。
其他文献
金属构件发生疲劳损伤具有复杂性。大部分构件在使用过程中不可拆卸,传统的力学分析、晶粒分析等方式很难实时监控金属的疲劳损伤程度。实际上,在金属构件发生疲劳损伤过程中
庙3油田位于松辽盆地南部扶新隆起带(二级构造单元)的东北部,是一个近南北方向展布的单斜构造。研究区内泉四段断裂复杂,地震界面连续性差,实钻资料与预测结果误差较大,油层
数据过载问题已成为制约互联网发展的重要问题。个性化推荐技术有效地缓解了这一问题,但随着互联网系统复杂性增加、数据内容多样化,个性化推荐技术的应用暴露出一些问题,如
电动汽车产业在“十二五”被我国列为战略新兴产业,其发展受到各级政府的大力支持和社会各界的广泛关注。然而,由于电动汽车技术尚处于完善提升阶段,电动汽车市场推广效果仍
本论文采用杂草样方法调查了辽宁省葫芦岛市玉米田杂草的发生情况,并采用田间小区试验法研究了九种茎叶处理除草剂对玉米田的防除效果和安全性,筛选出防除玉米田禾本科及阔叶杂草效果最好且对玉米安全的除草剂,为有效防除葫芦岛市玉米田的常见杂草提供试验数据支持。研究结果发现,葫芦岛市未经除草剂处理的玉米田共有13科22种杂草,包括禾本科杂草:稗草、马唐、狗尾草、牛筋草等4种,阔叶杂草:反枝苋、鸭跖草、铁苋菜、藜
王仙庄断裂带位于文安斜坡东南部,是文安斜坡沙二段的重要产油区块,近年来在S89、S89-1、S89-2等井获得高产油气,具有良好的勘探成果,展示了王仙庄断裂带沙二段良好的勘探潜
基于语义的动画生成技术受到人们越来越多的关注,很多科研机构和企业都以万维网(W3C)所提供的资源描述框架对故事相关的语义化结构的标准方法进行描述。本文以“基于海量资源
当今社会,水资源短缺问题逐日加剧。在我国大力倡导美丽乡村、城乡一体化建设的当下,园林绿化建设及绿地养护作为耗水大户,其用水问题备受关注。樟子松(Pinus sylvestris var.mongolica Litv.)作为东北地区城乡主要的园林绿化树种、经济树种和生态树种,对其耗水特性和自身生理调控能力的研究是极其必要的。在人工樟子松林内设置减少30%水量和正常水量处理两种情况,运用TDP热扩散技
世界海洋天然气水合物资源量约为2.83×1015m3,是陆地上的100倍以上,水合物总资源约为全球天然气总储量的1.56倍。目前,世界范围内已获取的海域天然气水合物样品普遍具有埋深
我国虽然是世界苹果生产大国,但出口数量相对总产量却只有不到3%,与其他苹果主要生产国、出口国相比,有较大差距。究其原因,是因为苹果采后的商品化处理水平低,其中分级在其