基于公开履历数据的人物知识图谱构建

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:sashiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】基于公开履历信息,结合自然语言处理技术与知识图谱构建技术,自动化建立履历知识图谱,为传统研究提供新的视角和工具。【应用背景】自动抽取履历数据中的人物背景、职衔信息并构建任职经历和机构同事等关系,通过可视化呈现的方式为企事业单位的人才选拔、人事任免任务提供决策支持。【方法】爬虫获取履历数据后,使用BERT-BiLSTM-CRF模型进行实体识别,通过定义规则与融合外部领域知识构建实体间关系,并使用Neo4j图数据库实现实体及关系的存储与图谱可视化。【结果】BERT-BiLSTM-CRF模型在实体识别任
其他文献
后疫情时代,线上线下“融合交互”的混合式教学模式成为高等教育的新常态。文章以深圳国际研究生院为案例学校,从场域视角重点分析了其北京和深圳两个校区采取的“融合交互”的混合式教学模式的影响因素与优缺点,研究发现:“融合交互”混合式教学模式可分为五类混合式教学模式,其教学效果受授课教师的教学场域、学生的学习场域和其他教学参与者的辅助教学场域的影响;学生认为混合式教学模式最大的优点是增加了知识获取的便捷性、在任何时间和地点都可以听课,而最大的缺点是技术连接或网络问题。对混合式教学的多种形态及参与者互动的探讨有助于
利用VR视频重述故事叙事场景,能为学生呈现模拟现实生活的幻境.而沉浸式、探索性、情境化互动叙事方式能产生逼真的体验效果,这种沉浸式互动体验对写作学习有潜在价值.基于此
2012年12月21日rn就在一年多之前,我回到了奥克尼岛,本想着是要短暂停留一下.我当时正在申请伦敦的工作,盼望着快点回归我“真实的生活”.现在想来还是很吃惊,当年关将至,我
期刊
新冠疫情大大加速了在线教学方式的应用,而大规模应用和教学全流程覆盖对教学系统提出了新要求.如何检验在线教学体系各子系统支撑大规模应用的能力,以及时弥补体系的薄弱环
智慧教育示范区是教育信息化2.0行动计划的重点任务和高阶目标,是推行智慧教育的试点工程。基于此,文章通过案例分析方法,以首批入选的8个示范区在项目启动会上、第二次工作会议上的汇报报告和各示范区发布的相关政策文件作为文本来源,主要从创建的基础、创建的重点和建设的成果三个维度对各示范区的创建方案、建设情况进行分析,并结合示范区的具体情况,梳理总结出各区域在学习环境的联通、公共服务的优化、信息素养的培养、数据驱动的评价和教育治理的提升五个方面取得的系列成果。此外,文章基于对智慧教育示范区创建中存在的问题进行反思
【目的】构建一个基于两阶段迁移学习的多标签分类模型,以解决现有模型中多标签数据采样困难与跨领域迁移学习共性特征较少的问题。【方法】提出“通用领域-目标领域单标签数据-多标签数据”的两阶段迁移学习模型,首先在通用领域上训练,之后迁移到使用上采样方法均衡后的目标领域单标签数据进行微调,最后迁移到多标签数据,实现多标签分类。【结果】以医学文献图像标注为例,实证结果表明:所提模型对于图像多标签分类和文本多标签分类任务均有较好效果,F1值在一阶段迁移学习模型的基础上提升超过50%。【局限】如何根据不同任务优选基
【目的】通过引入不确定性损失函数和层级注意力机制,解决多任务谣言检测研究中主观设定主任务和辅助任务问题。【方法】融合谣言勘探、立场检测和谣言检测任务的领域信息,构建改进的任务层级注意力机制模型。同时,首次在多任务谣言检测研究中,引入同方差不确定性损失函数,替代传统损失函数。最后使用PHEME数据集,将改进模型与传统多分类模型进行对比。【结果】所提模型相比于目前最优模型,在Pheme4数据集中,Macro-F值提升4.2个百分点;在Pheme5数据集中,Macro-F值提升7.6个百分点。【局限】只在Phe
面对实践中遭遇的“合而不作”“共而不享”“共而不生”等困境,学习共同体如何在“共在”中迈向“共享、共生、共荣”成为亟需破解的难题。沿着“现实检视-意蕴重构-路径再造”的致思进路,检视学习共同体之“美景宏愿”遭遇“尴尬窘境”的现实,文章从内在机理上剖析其致因,明确平等、和谐、负责的主体间关系是撬动窘境、实现宏愿之关键,厘清主体间关系构建之理路。此外,文章以开展多年的“摄影基础”课程为实践基础,基于他者性理论提出从“精拟学习契约,重建主体性,生成主体自觉”“建立多重圈群,重塑伦理价值,激发主体责任”“组织多样
【目的】提出一种基于强化学习的中文专利摘要改写模型(RLCPAR),以解决现有的自动摘要方法在处理多句子摘要改写时存在的句子冗余和准确率低的问题。【方法】引入专利术语词典,运用基于强化学习的句子抽取方法,对专利说明书文本的关键句进行抽取,利用Transformer深度神经网络文本生成方法生成候选摘要,最终融合专利原始摘要信息,经过语义去重和排序得到改写的摘要。【结果】RLCPAR模型实现端到端的专利摘要改写,并且在ROUGE-1、ROUGE-2和ROUGE-L评价标准上分别达到56.95%、37.21%和
【目的】基于传统隐私计算提出可量化模型,对社会化媒体平台用户的隐私悖论行为进行更客观的量化研究。【方法】采用IRT模型和灰色关联分析法对用户信息进行量化,并从效用最大化的角度——感知效益和感知风险的角度构建模型,计算和分析社交平台上的均衡解。利用部分用户信息代入模型进行验证。【结果】通过量化计算,得到平台风险量为0.479,小于0.508的效益量,从而求得均衡系数为1.063。结果验证了隐私悖论的存在,并且利用数据检验模型,符合现实情况。【局限】对感知效益量化框架缺乏检验,并且无法获得用户更全面的数据。两