基于社交网络文本信息进行人格特征预测的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zb272939419
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人格特征作为人类的一项重要的心理结构,对于人类行为、情绪等方面的预测有着重要作用,这使得人格特征的分析在心理健康、推荐、舆情监控等多个领域中均有着广泛的应用空间。然而,传统的人格特征分析方法大都依靠量表评估的方式,这种方式既耗费大量的人力与时间成本,又缺乏时效性,极大地限制了人格特征分析的可应用性。近年来,线上社交网络迅猛发展,人们每天都会在社交网络上发布大量包含人格特征信息的内容,这为人格特征分析提供了大量有效数据,也使得基于社交网络文本信息进行人格特征分析获得了越来越多的学术关注。尽管基于社交网络文本信息进行人格特征分析的研究已经取得了很大的进步,但仍旧存在诸多不足。数据标注难、语义特征难以全面反映人格特征、难以有效利用其他学科知识等问题极大地限制了人格特征分析的效果。针对这些问题,本文研究并实现了一种能够融合计算机学科与心理学科知识的半监督人格特征预测算法,该算法在降低数据依赖的同时,可获得更好的分析效果。论文主要进行了以下研究工作:1、提出了一种专门针对人格特征分析的网络表示学习算法Personality2vec,该算法包括新的网络构建算法、网络游走算法以及改进的skip-gram算法。该算法可以将数据集中的用户嵌入为人格特征向量,达到良好的人格特征预测效果;2、提出了一种基于知识图谱的人格特征分析算法PerKG,该算法将知识图谱引入人格特征分析领域,通过基于现有心理学知识构建人格知识图谱,并对图谱嵌入算法进行改进,使得人格特征分析算法能够利用其他学科的专业知识,并在无标签情况下为数据集用户生成人格特征向量,达到良好的人格特征预测效果;3、为降低用户使用难度,提高用户进行人格特征预测的效率,设计并实现了一个人格特征预测原型系统,为用户提供了可视化的操作平台,实现了数据存储、人格特征预测以及结果展示等功能。
其他文献
近年来,我国受过高等教育的育龄女性比例大幅上升.高等教育女性作为西方现代婚育观念的率先接触者,她们的生育水平是未来我国育龄女性生育模式变迁的风向标.因此研究高等教育对我国女性生育水平的影响尤为必要.在研究高等教育对女性生育数量的影响时会同时面临内生性和生存数据结构问题.本文基于2015年1%人口抽样调查数据,利用1999年高校扩招政策和各省高等教育资源禀赋所带来的高等教育入学机会在出生队列和省份上的双重外生差异构造高等教育的工具变量,并使用IV-Poisson模型估计上大学对我国女性生育数量的影响;同时通
在人口形势发生重大转折性变化的时代背景下,人口与家庭的关系更为紧密也更为复杂,但现有研究对人口与家庭发展的概念、测量和基本态势还缺乏统一的认识.文章基于转变理论和人口与家庭两个系统的协调耦合关系,利用CRITIC权重法计算指标权重、拟合指数,从多维视角出发构建人口与家庭发展指数并实证分析近30年来中国人口与家庭发展的基本态势.分析结果显示:1990年以来受计划生育政策和经济快速发展的影响,我国的人口与家庭发展呈现总体平稳的态势.人口系统中生育、健康、迁移、结构等各要素均发生了不同程度的变化,人口发展指数在
随着互联网的迅猛发展,更多人将目光聚焦于信息安全之上。在信息安全领域当中,存在一个重要的组成部分,便是信息隐藏技术,而隐写术又作为信息隐藏的一个关键分支,是目前非常热门的研究课题。隐写术是指利用公开的数字载体的冗余性来对秘密信息进行隐藏,并通过公共信道进行秘密信息的传输以实现隐蔽通信。目前,数字图像是互联网中信息交换的主流媒体之一,因其视觉冗余特性而被广泛的用于隐写术中,故本文选择数字图像作为载体
代表世界人口大国的中国和美国在2021年陆续发布2020年人口普查初步结果.最新人口普查数据显示:随着社会经济发展和民众人口观念的转变,两国在人口数量和结构特征层面呈现出一些共性特征.例如总和生育率低于替代水平与大规模老年群体叠加造成的结构性老龄化,区域发展不平衡与高度城市化共同带来的协调发展困境,整体劳动力市场萎缩与家庭内部经济支持的矛盾等.因此,基于国别人口学的研究视角,关注二战之后美国人口国情,研究美国人口各要素变化的特征及其趋势,为准确把握我国人口发展趋势、科学应对我国人口问题提供更加现实的研究依
由长期低生育率和老龄化导致的内生性人口负增长是未来人口发展的新趋势.这种崭新的人口现象改变了人口研究的宏观环境,也引发了人们对未来经济能否实现持续发展的普遍担忧.本文使用联合国2019年世界人口展望数据和世界银行数据,筛选出德国、俄罗斯、匈牙利、波黑、立陶宛、日本作为典型的人口负增长国家,以人口缩减比例作为人口负增长风险的度量指标,以各国持续时间最久的一次负增长时域作为考察范围,从国别队列视角和生命周期思想出发,利用同原点比较模型系统考察典型国家在人口负增长之后的经济增长、劳动参与率变化、固定资产变化和技
中国老年人口的规模与比例急剧上升,预期寿命不断延长,老年人口死亡率变动趋势引起社会的广泛关注.本文采用1982年、1990年、2000年和2010年四次人口普查数据,选用10种参数模型分析比较65岁及以上老年人口累计死亡概率.研究发现逻辑斯蒂模型、冈泊茨-麦克汉姆模型、威布尔模型和广义极值模型能较好地拟合老年人口累计死亡概率.通过比较模型拟合结果与观测值之间的差异发现逻辑斯蒂模型整体上能较好地体现中国老年人口死亡模式;冈泊茨-麦克汉姆、广义极值、逆高斯、对数-逻辑斯蒂、对数-正态和威布尔六种模型的拟合结果
中国作为人口老龄化发展速度最快的国家之一,正在迎来规模日益庞大的晚年丧偶群体.预计2050年我国60岁及以上的丧偶人口规模将达到1.18亿左右.近年来老年丧偶者的生活质量受到政府和学界的广泛关注.本文利用六期"中国老年人健康影响因素跟踪调查(CLHLS)"数据分析丧偶对我国老年人多种健康指标的影响以及社会连结在其中发挥的调节作用.研究发现丧偶会影响老年人的健康后果和健康行为.在健康后果方面,丧偶对老年人认知功能的影响具有显著的性别差异.丧偶降低了老年男性的认知功能,但在一定时期内提高了老年女性的认知功能.
婚姻稳定性下降、人口老龄化加剧预示着越来越多的老年人会经历子女离婚,然而子女离婚是否以及如何影响老年父母健康尚缺乏研究.本文基于生命历程理论和社会性别理论,从老年健康的角度出发,强调来自家庭层面子女离婚的影响,并从家庭代际经济支持等方面分析子女离婚如何影响老年健康及其发生的机制,探索家庭内部影响因素间的作用与联系.本文利用2014年和2018年“中国老年社会追踪调查数据”(CLASS)分析子女离婚对老年父母健康状况的影响.研究发现对于当前我国老年人而言,子女离婚仍是少数,但子女离婚会对老年父母健康带来冲击
近年来,中国老年流动人口规模逐年增大,作为流动人口中的一个相对弱势的群体,他们的社会融入问题不仅关系自身的健康与生活质量,也关系区域经济社会的平稳发展.本文选用2017年"全国流动人口卫生计生动态监测调查"数据,从17万流动人口样本中筛选出6 049份有效样本,从社会融入的意愿、客观社会融入程度和主观社会融入程度三个方面对老年流动人口社会融入现状进行分析,并实证分析其主要影响因素.我国绝大多数的老年流动人口对于现居住地具有强烈的社会融入意愿,社会融入意愿高于流动人口总体;老年流动人口的客观社会融入程度较低
随着当前信息技术的发展,能够获得信息控制权对世界各国是相当重要且必要的。而空间激光通信相比于其它无线通信方式具有通信带宽宽、信息容量大、抗干扰能力强、通信可靠性高、保密性好等优点,因此成为了空间宽带信息传输的重要途径。但空间激光通信的环境十分复杂、卫星研制的风险高、投入大,所以开展在轨激光通信实验之前,对空间激光通信系统建立仿真模型,研究其各方面的性能是必要的。目前对于空间激光通信系统的仿真没有专