基于LDA模型的文档情感摘要研究

被引量 : 0次 | 上传用户:gaolch014
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,网络上的评论文本数据信息急剧增长,评论文本中通常含有大量的情感信息,但这些情感信息却是以杂乱无章毫无头绪的形式存在的为使人们免受大量冗余信息的困扰,并解决评论文本全局情感倾向性的问题,本文应用情感摘要技术对网络上的评论文本信息进行分析处理与整合,最终呈现给用户直观的情感摘要本文首先对处理评论文本信息时所涉及到的一些关键技术进行研究与探讨,然后借助隐马尔可夫模型的标注功能识别出评论文本中的主观句,最后将潜在狄利克雷分布(LDA)模型应用在句子级别并生成情感摘要本文所做的工作主要包含以下三个方面:1)研究情感分析中的主观句识别,提出一种基于隐马尔可夫模型的主观句识别方法文本情感分析技术通常是将带有主观性信息的文本作为研究对象,因此在进行情感分析之前我们需要进行主观性文本识别在充分考虑主客观文本的特征之间的语法与语义关系,以及特征之间的上下文相关性基础上,提出了一种基于隐马尔可夫模型的主观句识别方法该方法首先融合信息增益与卡方统计分层次作用于主客观文本,提取出既有区分力度又能代表主客观句类型的主客观特征集合,然后借鉴隐马尔可夫模型在词性标注方面的应用,引入隐马尔可夫模型将待分类的主客观句子集合进行特征角色标注,并依据标注的结果计算句子的权重,最终识别出主观句实验结果显示该方法可以有效的识别评论文本中的主观句2)研究情感文本表示模型及文档情感摘要方法,提出一种基于LDA模型的文档情感摘要方法在生成情感摘要之前,首先要做的是对主观性的文本进行文档建模由于LDA主题模型可以避免传统的向量空间模型高维性与稀疏性的问题,并且具有语义特征,因此引入LDA主题模型,并将其应用到句子级别,提出一种基于LDA模型的文档情感摘要方法该方法首先应用LDA模型对已得到的主观情感句进行建模,挖掘文本集合中存在的潜在主题,然后使用Gibbs抽样算法估计LDA模型的参数,最后根据句子的权重大小应用最大边缘相关的消除冗余算法得到文档的情感摘要实验表明本文方法生成的情感摘要与专家摘要更匹配3)设计并实现了基于LDA模型的文档情感摘要原型系统在分析网络评论文本情感摘要生成过程的基础上,针对每个过程设计了相应的功能模块,并最终实现了基于LDA模型的文档情感摘要原型系统该原型系统可以有效地对网络中存在的评论文本进行抓取分析与处理,并最终提供给用户直观的情感摘要生成的情感摘要既能够把握评论文本的全局情感倾向又能表达文本主旨内容
其他文献
研究了以枇杷核为原料,通过破碎、筛滤、离心、脱水等工艺,将枇杷核中的淀粉与纤维、蛋白质及其杂质分离,提取淀粉;并对枇杷核淀粉利用的可能途径进行探讨。
球墨铸铁活塞环槽通常采用车削方法加工,如果将环槽的加工由车削改用磨削时,不仅可以延长活塞使用寿命,而且可以显著提高活塞的运载能力,具有很高的经济效益。为了解决这一
目的:探讨品管圈活动的开展对临床护理文件书写质量的影响效果。方法:选择2018年1月至2018年2月科室护理文件中的40例进行研究,分析其书写质量。2018年3月至2018年4月,开始在
目的 :通过品管圈管理提升门诊药房自动发药系统工作效率,缩短患者取药等候时间。方法 :门诊药房药剂师成立品管圈小组,设定主题、制定计划并设定目标,通过对现状分析拟定相
为探究城市不同功能区大气降尘重金属的污染水平及其风险,在南京市典型工业区、交通区、居住区和高教区这4个区域设置20个采样点,采集大气降尘,并分析其中As、Ba、Cd、Co、Cr
张锡纯就蜈蚣的应用曾告诫——$$蜈蚣尤善搜风,内治肝风萌动,癫痫眩晕,抽掣瘛疭,小儿脐风;最善搜风,贯穿经络脏腑无所不至,调安神经又具特长;味微辛,性微温,走窜之力最速,内而脏腑,外而经
报纸
目的探讨芦荟外敷治疗左氧氟沙星注射液所致静脉炎的临床效果。方法选取2015年1月至2016年6月广东省信宜市人民医院收治的注射左氧氟沙星注射液所致静脉炎患者60例为研究对象
研究背景类风湿关节炎是一种以多发性对称性关节炎症为主,可引起肢体严重畸形的慢性全身性自身免疫性疾病。对患者及社会产生不可估量的经济损失。国内暂时没有针对类风湿关
县级职教中心统筹县域职业教育资源,是服务农业、农村和农民的重要载体,也是我国实现工业化、信息化、城镇化和农业现代化的重要依托。国务院、教育部发布的多个文件中都明确规