基于LSTM和LDA模型的患者情感分析研究

来源 :浙江理工大学 | 被引量 : 3次 | 上传用户:potato_212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网医疗的发展,平台上出现大量的患者留言文本。通过患者留言的文本挖掘,分析出患者的情感信息,对患者和医院有重要的意义。本文主要从两个方面对患者留言文本进行研究,第一,基于深度分层神经网络的情感极性分类研究,第二,基于LDA模型的情感主题分类研究。主要的创新成果如下:(1)提出了基于卷积神经网络(CNN)模型和长短期记忆(BLSTM)模型的双道融合层。传统融合的方式,将CNN模型和LSTM模型训练出的词向量进行简单向量拼接,缺点是模型在多特征信息的句子训练时,分析出的情感结果常常被非特征方向的信息影响。双道融合层引入权重矩阵,使得改进后的LSTM模型在训练时,在CNN模型分类出的特征向量方向的情感信息被放大,而在非特征向量方向的情感信息被削弱。实验证明,双道融合层对多特征信息的句子的情感分类更加准确。(2)提出了深度分层网络模型。CNN模型和BLSTM模型在情感极性分类领域擅长的方向不同,CNN模型不善于处理时序信息,却在短文本的情感极性分类中表现效果好,而BLSTM模型擅长处理时序信息,但是不能处理好短文本的情感极性分类。改进后的模型分为区域CNN层、BLSTM词语层两层输入,保留语料中的时序信息和特征信息。最后,通过双道融合层进行词向量的拼接,实验证明,新的模型比改进后的模型准确率增加了7.84%,召回率增加了3.35%,F1值增加了2.45%。(3)提出了词向量替换层。针对短文本的主题模型分类会出现上下文依赖性差和词汇量不足的问题,实验对比了词嵌入模型和词袋模型,提出利用词嵌入模型训练出符合整篇文章主题的词向量空间,目的是补充短文本情感主题分类时的词汇量,同时,解决短文本的上下文依赖性差的问题。(4)提出改进的LDA模型。针对LDA模型进行短文本分类时,吉布斯采样层的采样词汇单一的问题,提出在吉布斯采样层以一定概率λ从词向量替换层采样余弦距离最近的词向量,并通过调参,获得最优的概率λ。实验证明,改进LDA模型模型的困惑度下降了1.42%,主题一致性增加了3.75%。
其他文献
初春3月.清风袭人。2009年3月28号在美丽的苏州之苏州饭店隆重举行了“第二届华东地区水产动物营养品与饲料科技论坛”。本次论坛的主办单位为苏州大学、中国水产学会水产动物
老师的目光有时让人伤(shāng)心,有时让人高兴,有时充满力量:老师有一双会说话的眼睛。
随着改革向纵深发展,一些发展过程中必然或者偶然出现的问题也渐渐浮出水面,对之进行理性的分析和解读,已成为经济界、科技界众多有识之士关心的热点。本刊记者不久前参加了中国
如何有效建设高职院校思想政治教育体系、增强思想政治教育工作的实效性,是现阶段各高职院校所急需解决的关键性问题。因此,本文就依据目前我国高职院校建设思想政治教育体系
我们知道,劳动力价格低并非价值或贡献低,它往往是市场封闭的结果。中国在过去几十年中劳动力价值有被人为压低的原因,是落后的结果。许多地方政府,一直把所谓劳动力成本低当作招
试验采用原子吸收分光光度计测定了玉米中的微量元素平均含量,结果表明玉米中微量元素的平均含量分别为Fe23.65mg/kg、Cu1.71mg/kg、Mn3.42mg/kg、Zn18.65mg/kg,大部分情况下相当于畜禽
试验建立了应用高效液相色谱法检测渔用配合饲料及原料中三聚氰胺含量的方法。样品经三氯乙酸-乙酸铅-盐酸提取,MCX固相萃取净化后,应用MGC18色谱柱进行分离,柱温为30℃,流动相为
大庆采油院生产保障大队车队,为宣贯《纲要》精神,在“创先争优”活动中,按照大队“安全本质化、管理精细化,服务优质化,岗位标准化”工作思路,以提升管理水平为目的,以提高员工素质
在zài云yún彩cǎi的de南nán面miàn,/那nà遥yáo远yuǎn的de地dì方fɑnɡ,/有yǒu一yì群qún树shù叶yè说shuō:/我wǒ们men想xiǎnɡ像xiànɡ花huā一yí样yànɡ开kāi放fànɡ。/有yǒu一yì群qún花huā朵duǒ说shuō:/我wǒ们men想xiǎnɡ像xiànɡ鸟niǎo一yí样yànɡ飞fēi翔xiánɡ。/有yǒu一yì群qún孔
期刊
在新经济时代,高科技的信息将成为一种重要的生产力,推动着人类社会的发展;高科技的生物工程作为一种新生力量,直接导致农业、医药卫生、食品工业和化学工业革命,推动着新经