心理健康词典的自动构建研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户：wmwanll

【摘要】

：

【作者】

：

王东彬

【出处】

：

江西财经大学

【发表日期】

：

2020年01期

【关键词】

：

词典自动构建自杀线索词自杀线索词组词典评测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自杀等心理健康问题威胁着人们的健康和社会的和谐发展,尽早发现自杀倾向为早期的干预提供了基础。生活中,有自杀想法的人往往不会寻求社会的帮助,但却总是在言语中流露出自杀的念头。随着社交媒体的快速发展,人们越来越喜欢在社交媒体中表达自己的想法和感受,以新浪微博为主的带有个人情感色彩的言论信息正迅速发展,深入了解和挖掘这些信息,为自杀风险的研究提供支撑。研究发现社交媒体中自杀倾向的表达和用户的用词以及语言使用模式之间存在着重要的关系,部分词汇对自杀倾向的判断具有重要的指示作用,本研究称这些词汇为自杀线索词。在情感分析的研究中,已经验证了情感词典有助于情感分析,同理,构建一部自杀线索词典对自杀倾向分析具有重要的意义。目前,对自杀线索词典自动构建的研究非常少,相应的词典资源也远不如情感词典丰富,中科院构建的中文自杀线索词典是目前文献中找到的唯一一部。然而,该自杀线索词典是基于人工构建的方法,需要在阅读大量相关语料的基础上,结合专家领域知识来挑选出初始的自杀线索词语,然后再进行人工优化和补充。人工构建自杀线索词典消耗大量的人力和财力。而且现有的自杀线索词典存在两点不足:(1)网络新词不断更新,新出现的自杀线索词不能及时更新到词典中;(2)词典中仅包含词语,没有词组,但很多词语单独看没有自杀倾向,合并到一起则有了自杀倾向。本文提出两种自杀线索词典自动构建的方法:基于种子词的方法、基于数据集的方法。基于种子词的方法依据候选词与种子词之间的相似性,在自杀文本数据集中找出与中科院人工构建的自杀线索词典中的语义相似性较大的词语作为自杀线索词,主要采用Word2vec和点互信息(PMI)等方法。基于数据集的方法通过抽取出自杀数据集中的重要词语或者主题词语作为自杀线索词,主要采用TF-IDF、LDA主题模型、信息增益、以及基于分类的方法。为了使自杀线索词典更加的完整,采用关联规则挖掘的方法和N-gram的方法自动构建自杀线索词组。为了验证词典的效果,设计了直接评测和间接评测两种评测方法。前者利用中科院人工自杀线索词典作参照,评测自动构建的词典对中科院自杀线索词典的召回率和平均正确率。后者考察抽取的自杀线索词对自杀倾向性分类任务的帮助。从评测指标上看,直接评测法中,基于种子词的方法中Word2vec和PMI的方法对中科院词典的召回率分别为0.0824、0.0495,说明传统情感词典扩展或抽取的方法不完全适用于自杀线索词典的构建。基于数据集的方法中相较于TF-IDF方法和基于分类的方法,LDA主题模型的方法对中科院自杀线索词典的召回率为0.313,且召回词语的平均正确率为0.323。在间接评测法中,基于种子词语的方法构建的自杀线索词典在自杀倾向性分类任务上的平均准确率低于中科院自杀线索词典。基于数据集的方法中,相较于TF-IDF方法、LDA主题模型方法以及基于分类的方法,信息增益的方法在自杀倾向性分类任务上的平均准确率为0.9525,超过了中科院自杀线索词典的0.8969的平均准确率。加入自杀线索词组后,在间接评测法中效果有微弱提高,从0.9525提高到0.9671,证明了自动构建的自杀线索词典的有效性。

其他文献

基于主动全景立体视觉传感器的室内场景三维重建

室内场景三维重建技术在很多领域有着重要的应用,但是现有的重建方法无法在一次扫描或操作的情况下同时获取空间物点的几何和色彩信息,并且点云数据的存储、操作和建模效率不

学位

主动式视觉传感器面激光发生器三维重建单视点全景视觉

经济增长与环境保护双赢的理论与实证分析——以兰州市为例

经济增长与环境保护的两难、环境承载阈值及环境问题负的外部性的存在昭示着我们必须走人与自然和谐的可持续发展道路——实现经济增长和环境保护的双赢。本文以兰州市为例来

期刊

经济增长环境保护两难区间双赢

从传统“记忆空间”看新农村公共空间的设计

本文阐述了公共"记忆空间"的含义及其存在的意义,调查农村村民对传统公共"记忆空间"的记忆程度,并总结其特点,提出对新农村公共空间建设的几点建议。

期刊

记忆空间新农村生活方式公共活动

Brother全面出击打印设备

<正>2011年4月的"十全十美"Brother新品发布会还令人意犹未尽,多款高性价比的产品率先推向市场,"千元双面"激光打印机、新一代彩色激光机、"简印"系列喷墨多功能一体机,一经

期刊

激光多功能一体机Brother新品发布会打印设备激光机墨粉盒

营销管理教学案例库的开发与维护

案例教学是当代各类高校营销管理类课程教学改革的重要手段和必不可少的教学环节。营销管理教学案例库是从事案例教学的理论资源支撑。本文从营销管理案例构成、类型到收集开

期刊

营销管理案例营销管理案例库开发

微波辅助卟啉的合成及金属卟啉形成动力学研究

卟啉及金属卟啉类化合物结构独特、性能优异,在临床医学、工程材料、催化合成等领域应用广泛。特别是含氟基团类卟啉化合物一般具有特殊的生理活性,如可以与癌细胞选择性结合

学位

微波辅助合成单氟取代四苯基卟啉动力学4-哌啶甲酸5101520-四(4-哌啶基)卟啉

检察机关刑事审判监督的困境与对策

<正>检察机关对刑事审判活动进行法律监督,其目的和作用在于监督审判机关严格执行法律,维护国家法律的公正实施。这种监督是我国刑事审判制度的一大特色,是人民检察院行使检

期刊

刑事审判监督刑事审判监督权检察机关困境与对策

均衡05 谨慎06——今明化肥使用情况及需求分析

2005年对于化肥市场来说,总体表现是资源相对充裕、农业需求相对平稳的大体均衡状态下度过的。尽管由于干旱、洪涝灾害气候等因素的影响,化肥需求没有象大家预期的那样有明显

期刊

化肥价格库存量复合肥同比增长化肥使用需求分析

冰川泥石流研究进展概述

冰川泥石流是冰川退化的结果.在全球气候变暖的大背景下,冰川不断退化,消融加剧,冰舌后退引发径流量增大,冰湖面积扩大,加之冰川退化,冰崩雪崩所带来的丰富的冰碛物、寒冻作

会议

冰川泥石流时空分布构造演化安全防护

漳河山西段鱼类和大型底栖动物群落结构特征

调查鱼类和大型底栖动物,为漳河山西段水生生物多样性保护与研究、河流生态修复等相关工作提供依据。2017年在10个采样河段采集鱼类和大型底栖动物,分析其物种组成、分布及多

期刊

鱼类大型底栖动物聚类分析多样性漳河

心理健康词典的自动构建研究

与本文相关的学术论文