基于指代消解的引文内容抽取研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:yaczxxzx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]为改善手动或简单的引文提取方法,提高引文内容分析效果,应精确抽取引文内容.[方法]将引文内容抽取任务具体分为引文句、引文上下文、引文元数据三部分,基于指代消解理论,利用机器学习和层次过滤法对引文上下文进行抽取.[结果]实验数据收集了顺序编码制的中文期刊文献,结果证实该方法抽取引文句并解析参考文献结果正确无误,识别引文上下文的F1值为0.780~0.849.[局限]缺乏中文科学引文语料资源,实验数据选择人工标注小规模数据集,跨域能力有限,不可避免存在文本领域依赖的缺陷.[结论]本研究能够优化和扩大引文内容分析的步骤和范围,为使用引文内容分析法的相关研究者提供参考.
其他文献
高质量的教育必须要有高质量的教师.为贯彻落实党的十九届五中全会精神和《中共中央国务院关于全面深化新时代教师队伍建设改革的意见》,推进师范生免试认定中小学教师资格改革,建立师范生教育教学能力考核制度,2021年4月教育部印发《特殊教育专业师范生教师职业能力标准(试行)》(下简称《职业能力标准》),这是贯彻落实党的十九大“办好特殊教育”要求又一重大举措.笔者着重从实践培养角度,解读特殊教育专业师范生教育职业能力结构及关系.
期刊
在全球化日益加速和深化的时代背景下,国际组织尤其是政府间组织在全球教育治理领域的影响力与日俱增.作为当今世界最重要的国际教育组织,UNESCO将成人学习和教育治理作为教育治理领域的重要内容,通过多种形式参与,在很大程度上推动并引领着世界范围内成人学习和教育的发展.GRALE是UNESCO有效推进全球成人学习和教育发展的柔性治理的关键手段,产生了积极的促进作用.通过对2009年以来UNESCO先后发布的四份GRALE分析发现,它参与全球成人学习和教育治理的作用机制包括目标导向机制、协同运行机制、监测评估机制
把握数字公民教育的本土逻辑,可以更好地服务国家发展.我国数字公民教育源于对数字时代的感触与应对,具有“在变革中强民强国”的本土诉求与建设网络空间命运共同体的国际担当;在学校信息技术教育的基础上,着重突出全民科学素质与网络空间道德;形成了多主体统筹、多元素融合的中国特色行动模式.数字公民教育本土逻辑立足于“人”,起点是人的数字化生存与发展,终点是数字时代人类命运共同体,逻辑中介是立足社会主义核心价值观的开放创新.当下应持续开放创新,解决托底数字化生存、主动数字化发展等难点问题,坚持本土导向与问题导向相统一.
国内青少年人工智能教育的实践和研究尚处于起步和摸索阶段.研究表明,单元设计以学科大概念为核心有利于促进学科核心素养的落实,基于此,本研究尝试开展大概念视角下的“初中人工智能基础”单元设计及应用策略探索.首先,剖析了当前国内青少年人工智能教育实践的现状及存在的问题;其次,介绍了大概念和单元设计的概念及内涵,以2020年浙教版初中信息技术教材中“人工智能基础”单元为例,开展了大概念视角下的单元设计;最后,研究提出了初中“人工智能基础”单元设计在教学实施中的应用策略.
通过对残疾人社区服务在突发性公共卫生危机中遇到的问题进行分析,发现残疾人社区服务存在以传统的“照顾服务”为主、服务水平不高、机构内专业人才不足等问题,在突发性公共卫生危机发生时,还面临着应急能力不足、志愿者大幅减少等挑战.建议采用提供在线服务、做好上门照顾服务、及时传递信息、采用资源协同等方式,在突发性公共卫生危机背景下,积极开展残疾人社区服务.
[目的]解决军事文本中实体关系重叠引起的关系抽取困难问题,改善军事文本关系抽取效果.[方法]使用BERT模型作为输入文本的编码器,采用分层强化学习方法分别进行关系与其对应实体的解码,并在实体解码过程中融合关系位置特征,构建军事领域关系抽取模型.[结果]在军事武器装备数据集上F值达到82.2%,相较其他方法提升约8个百分点.在公开的NYT10、NYT10-sub数据集上F1值分别达到71.8%和69.0%,相较其他方法提升约7个百分点与9个百分点.[局限]在人工标注数据集上抽取效果较好,在存在噪声的远程监督
针对存在“孤独症”和“自闭症”两种译名的现实,本文立足“Autism”内涵的流变,从译名历史、医学概念和文化诠释三个维度,重新审视了“孤独症”作为术语译名的合理性.从术语译名的历史看,“孤独症”是“Autism”的本土规范译名,具有自创性、权威性和官方性的特征;从医学概念上看,“Autism”已被认定为一种生物性的神经发育障碍,而不具有主动自我封闭的含义;从文化诠释上看,神经多样性的视角要求以更加积极的态度看待“Autism”,将之视为一种文化差异.因此,基于求真、求善和保持文化主体性的原则,有必要重申“
[目的]解决PDF表格抽取中复杂表头的表格需要依靠大量人工标注的问题.[方法]利用框线信息进行表格检测与结构构建识别文档中表格结构信息后,使用词向量表示其中的内容文本,并计算表格行间内容余弦相似度,最后利用该值判断表格中表头与内容分界行.[结果]在自建PDF表格数据集上进行信息抽取实验,表格信息抽取结果F1值为98.07%,表格内容划分结果F1值超过99%,效果接近需要大量标注语料的深度学习文本分类模型.[局限]所提方法只能抽取关系型表格,且不适用于扫描型PDF文档.[结论]所提方法能够在一定程度上解决P
采用基于移动设备的虚拟教具开展合作探究活动,需要思考资源配置与外部支持的相关设计.本研究分析了合作探究中技术供给的两个方面:虚拟教具的供给比例和外部脚本的提供与否.为探讨技术供给对探究效果和认知负荷的影响,研究设计了三因素混合实验设计的教育准实验.其中,科学探究活动(光的折射、简单电路和电磁感应)为被试内因素,虚拟教具的供给比例(1∶1和1∶m)与外部脚本的提供与否(有和无)为被试间因素.通过重复测量方差分析和合作视频会话分析发现,1∶m条件的探究效果好于1∶1条件;提供外部脚本的探究效果更好;1∶m条件
在建筑师出身的徐白仑心中,无论从事的是什么工作,都应该像建筑高楼大厦一样,第一步是宏图,第二步是蓝图,第三步是设计图,第四步是施工表,第五步是项目书,第六步是时间表,第七步是决算表.从1996年起,徐白仑先后在广西、内蒙古、陕西、黑龙江实施盲童随班就读的“金钥匙工程”,累计帮助5000多名盲童就近接受了义务教育.当年的这些台账手册,原始而详尽地记录了这一浩大工程的每一个细节.
期刊