学术文献致谢功能数据集构建与识别方法研究

来源 :情报科学 | 被引量 : 0次 | 上传用户:cathy1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]本文构建了一个大规模学术文献致谢功能数据集,并提出一种基于SciBERT的致谢功能识别模型,为致谢文本的挖掘和分析提供高质量的数据支持和有效的识别方法.[方法/过程]采用人工的方式扩展和完善致谢功能分类规则,生成学术文献致谢功能自动标引规则模板,对1,750,275条致谢文本进行功能标引.在此基础上,采用SciBERT模型对致谢文本句进行向量表达,引入Softmax回归模型实现致谢功能自动分类,采用warmup策略进行模型调优,并与基准实验进行对比.[结果/结论]得到一个大规模、高质量的学术文献致谢功能数据集,经人工检验准确率达到93%;基于SciBERT的识别模型比基准模型表现更好,在扩展数据集上的Fl值高于98%,在各个类别上的预测结果也有不同程度的提升.[创新/局限]致谢功能识别模型缺少对致谢文本独有特征的考虑和融合.
其他文献
[目的/意义]移动音频有声阅读平台场景化服务离不开对其影响的各类因素及其相互作用关系的挖掘.在此基础上,借助各类影响因素之间的交互作用,动态地调节各类影响因素的配置关系和配置方式,形成移动音频有声阅读平台的场景化功效.[方法/过程]为此,将服务三要素以及场景要素、情境要素和信息期望纳入移动音频有声阅读平台服务的研究视野,综合运用集成和适配的方法,构建了移动音频有声阅读平台的服务机理模型.[结果/结论]以喜马拉雅移动音频有声阅读平台为例,对本文构建的移动音频有声阅读平台服务机理模型进行实证,结果表明集成和适
[目的/意义]针对图书馆用户群体聚类分群不稳定且错误率较高的问题,提出基于马尔可夫模型的图书馆用户聚类分群方法,提升图书馆用户聚类分群精准度.[方法/过程]采用一阶马尔可夫混合模型构建用户动作序列模型,通过模型产生用户行为聚类,体现用户动作的动态性,采用自适应自然梯度算法,依据用户行为分离状态自适应调整自身步长,优化模型参数学习中模型自动选择问题,实现最佳图书馆用户聚类分群.[结果/结论]通过实验结果能够证明,实际聚类数量小于L值时,提出方法能够实现参数学习过程中模型的自动选择.提出方法的分群数量最多,能
[目的/意义]网络信息生态环境优化是实现网络强国战略的重要部分,开展网络信息生态环境评价并提出优化对策,有助于明确提升我国网络信息生态环境出发点和着力点、推动网络强国战略实施.[方法/过程]本文在定义网络信息生态环境内涵的基础上,确定了网络信息生态环境的影响因素,基于DEMATEL方法分析了各影响因素之间的联系,利用结果因素对我国2013-2018年我国网络信息生态环境进行了评价.[结果/结论]结果显示,近年来我国网络信息生态环境持续优化,但同时存在个别年份总体评价结果出现下降或上升较慢的问题,从信息制度
[目的 /意义]“信息过载”问题不利于用户快速准确获取目标信息,本文提出构建社交媒体基因图谱并应用于信息推荐领域,为用户信息推荐提供新思路.[目的 /意义]本文将社交媒体分解为社交媒体用户和社交信息内容两大主体部分,借助生物学基因图谱概念,建立两大主体基因群并分别进行基因提取,构建社交媒体基因图谱,并通过社交媒体基因图谱唯一辨识用户实体偏好进行信息推荐.[结果/结论]构建基于社交媒体基因图谱的信息推荐模型,考虑用户内部及信息环境对基因图谱的影响,进行模型优化,为用户提供更加精准的信息推荐内容.[创新/局限
[目的/意义]从新媒体社交平台中用户行为角度分析造成“信息茧房”的影响因素,探究突破特定内容领域“信息茧房”困境、提升信息传播力的策略.[方法/过程]本文构建了新媒体社交平台中“信息茧房”现象影响因素模型,运用相关分析与回归分析定量化检验新媒体社交平台中“信息茧房”现象产生的多重影响因素,在此基础上提出突破茧房提高非遗短视频传播力的策略.[结果/结论]选择性接触行为、信息偶遇和主观规范直接正向影响“信息茧房”感知和“信息茧房”突破意愿;使用时间、使用频率、单次使用时长和关注人数间接正向影响“信息茧房”感知
[目的/意义]探究学术文献搜索结果选判过程中用户元数据关注特点及其与选择行为的关系,为检索系统优化、用户选择行为指导提供理论依据.[目的/意义]利用出声思维法、半结构化访谈以及关键事件法对30名在读硕士和博士研究生对知网学术文献检索结果的选判行为进行观察与访谈,对得到的材料进行分析.[结果/结论]用户对题名、期刊、摘要等元数据信息关注较多,而对相似文献、下载量等元数据信息关注较少;高年级用户对于文献内容特征的关注程度明显高于低年级用户,但对于新功能的关注度较低;用户关注的元数据信息越多,检索的次数也越多;
[目的/意义]个人信息保护政策作为公民个人信息保护的法律保障依据,具有重要的研究价值,将词频分析、社会网络分析法、内容分析法用于政策解读与分析,推动我国个人信息保护工作的进一步开展.[方法/过程]本文以《中华人民共和国个人信息保护法(二审稿草案)》(2021年4月29日发布)的政策文本为研究对象,运用词频分析、社会网络分析法、内容分析的方法,对该法律草案文本进行研究,从而达到以更多视角挖掘分析法律政策条款内涵的目的,以法律文本的分析为依据完成对我国个人信息推进现状的描述.[结果/结论]通过定量与定性相结合
[目的/意义]情报分析自动化、智能化的核心是情报分析的可计算化,需要面向计算的情报分析模型来指导计算型情报分析的实践,为大数据环境下的情报分析提供参考.[方法/过程]首先梳理前人构建情报分析模型的研究视角,并从中总结出情报分析“任务”“方法”“数据”三要素;在此基础之上提出面向计算的“任务—方法—数据”三维多层情报分析模型,该模型由理念层、路径层、技术层、实施层组成,具备向上抽象、向下具化的能力.[结果/结论]面向计算的情报分析模型能够辅助情报研究人员构建动态、可计算的情报分析流程,既能够发挥以往情报分析
[目的 /意义]研究公共文化服务平台传播影响力的测度问题,有助于优化公共文化服务平台发展的手段、形式和运行机制.[方法/过程]参考已有研究成果,结合公共文化服务平台信息传播的特点,形成公共文化服务平台的传播影响力测度指标;采用基于层次分析法和熵值法的组合赋权法确定各项指标的权重,完成公共文化服务平台传播影响力测度体系的构建;将该体系应用于测度我国不同地区的省级公共图书馆微信公众号的传播影响力水平.[结果/结论]内容特征是影响公共文化服务平台传播影响力的关键因素;华中、华东和西北地区省级公共图书馆微信公众号
[目的/意义]探索研究前沿的可视化服务模式,不断提高高校和科研院所图书馆学科服务能力和水平.[方法/过程]根据ESI研究前沿的析出原理和积累的历史数据,按学科领域计算研究前沿的相似度,分析其演变特点,提出研究前沿的相似等级概念,在R语言环境下,采用ggplot2包绘制其可视化图谱,并用shiny包发布网络应用.[结果/结论]ESI研究前沿的杰卡德相似度和相似等级反映了学科领域研究前沿的总体演变特点和每个研究前沿的演变情况;学科领域研究前沿的加权均值可以作为其稳定性判据;可视化图谱可以帮助科研主体在宏观上了