【摘 要】
:
科技文本内容的分析和利用一直是情报学科研究的关键问题。当前,科学技术进入快速发展阶段,各领域积累了大量科技文献,传统以文献为粒度的文本挖掘方式不利于用户获取和利用科技文献中的知识内容。为更深入有效地利用科技文本,就必须突破这种以单篇文本为粒度的挖掘方案,从更细粒度的角度深入到对科技文本潜在知识内容的挖掘。科技文本的挖掘和利用对整个科学的发展起着重要的作用,特别是人们所重点关注的科技文本中的研究问题
论文部分内容阅读
科技文本内容的分析和利用一直是情报学科研究的关键问题。当前,科学技术进入快速发展阶段,各领域积累了大量科技文献,传统以文献为粒度的文本挖掘方式不利于用户获取和利用科技文献中的知识内容。为更深入有效地利用科技文本,就必须突破这种以单篇文本为粒度的挖掘方案,从更细粒度的角度深入到对科技文本潜在知识内容的挖掘。科技文本的挖掘和利用对整个科学的发展起着重要的作用,特别是人们所重点关注的科技文本中的研究问题、解决方法等细粒度、深层次内容,这些都是人类重要的知识积累。鉴于此,本文面向科技论文中“问题-方法”相关知识的利用,进行科技文本的知识挖掘研究,具体分为两个部分,包括知识单元和知识关联,对于一个特定领域的细粒度知识挖掘,它们常分别对应于实体和实体关系。本文以人工智能领域为实证对象,以科技文献摘要为数据源,进行“研究问题”、“解决方法”对应的知识单元与知识关联抽取研究。综合使用基于通用神经网络(如Bi-LSTM)的方法和基于预训练语言模型(如BERT、Sci Bert)的方法,开展研究问题、解决方法实体的识别和抽取研究,并综合比较各模型在人工智能领域实体识别上的效果。随后,以人工智能领域知识演化为应用场景,将最佳模型应用于人工智能领域全量摘要集,并结合时间因素统计所得的问题、方法实体,从不同年份上问题、方法的分布以及不同问题、方法的年度分布两个角度展开分析,发现了人工智能领域持久具有代表性的研究问题和解决方法以及不同问题、方法的演化趋势。以问题、方法的实体识别结果为基础,开展人工智能领域科技文本的知识关联研究。基于有监督词嵌入关系类比和无监督相似度计算方案,挖掘问题-问题高相关和层次关系、问题-方法解决关系以及方法-方法高相似和层次关系。最后,基于实体关系发现研究成果,以人工智能领域知识问答为应用场景,选定一个具体的研究问题实例,进行人工智能领域实体关系发现应用原型可视化设计,直观地展示问题、方法实体间的关系以及问题、方法的分布与演化规律。
其他文献
网络舆情事件中的网民情感,对网络舆情的走向有着至关重要的影响。新时代下,舆论在网络空间的内容载体不再是单一的文本,转而向文本结合图片或者是短视频。同样,在网络舆情事件中,网民情感表达的载体也同样在发生变化,从单一的文本发展至文本结合图片等。当前网民情感识别研究,多基于文本这一单模态,缺乏对网民在网络舆情事件中发表的图片以及文本和图片相结合内容的关注。针对当前研究不足,本文从多模态融合视角出发,结合
当今中国城镇化不断推进和发展的时期,越来越多乡村的年轻人开始向城市迁移。在这样的现实背景下,农村家庭争先恐后进城为子女买房成为社会上普遍的经济现象,同时更是一种值得深入研究的社会现象。从中可以看出,中国乡土社会的基本结构正在瓦解,代际支持机制发生转变,亲代与子代之间的代际关系呈现“互惠与失衡”的特征。本文基于对东北三家村的农户进行田野调查,尝试将农村家庭帮助子女在城市中买房的行为置入家庭代际关系中
近年来,随着Web2.0的飞速发展,在线社会关系网络如社交媒体成为互联网服务与应用的主角。截至2018年12月31日,微博垂直领域高达60个,月活跃用户连续三年增长7000万,达到4.62亿;Twitter的日活跃用户数量为1.26亿,月活跃用户达到3.21亿。大量的活跃用户通过社交媒体观察和了解世界,使得每天有上亿条信息在互联网上飞速传播。这些网络信息记录了人们参与、监督并影响世界的行为,为众多
随着STEAM教育的兴起,青少年音乐教育重心向音乐创作偏移。音乐创作可以培养学生的创造力和高感知力,但现有的音乐创作教育存在教学内容和方法较为单一传统等问题,理论与演奏的学习持续相当之久,导致音乐创作的学习被延后。与此同时,随着电子科技的高速发展和交互设计理念的逐渐深入,面向青少年的产品设计朝着高科技、人性化、智能化的方向发展。在此背景下,智能产品也在原有的娱乐功能下,逐渐增添了教育的色彩,越来越
随着自动化技术的飞速发展,自动化检测成为了检测技术的重要发展方向。贮箱结构件被大量应用于航空航天、国防工业等领域,为了保证贮箱结构件在使用过程中的可靠性,出厂前对工件壁厚进行检测必不可少。目前,此类工件的检测多采用手工超声测厚的方式,检测结果往往依赖于检测人员的经验,劳动强度大,效率低,检测结果存在较大的人为误差。本文针对贮箱结构件的特点及超声波测厚的影响因素,对超声波壁厚自动化检测系统进行了设计
群体决策是解决各种决策问题的重要理论方法,群体决策的结果能够集结各方面的意见,使决策结果更加科学合理。但是,随着互联网经济的不断发展,决策群体规模不断增长,群体决策的主体已经从少数业内专家转变为更大规模的参与群体,不同个体的异质性复杂化以及可评价属性日趋多样化,使得群体决策不断的向复杂多属性大群体决策的方向发展,传统的决策理论已经不能完全有效的解决当前的决策问题,为了能够解决这一问题,本文对模糊C
近年来,高浓度颗粒云雾的浓度测量受到越来越多的关注,利用光学原理进行浓度测量是其主要手段。本文针对亟待解决的高浓度颗粒云雾浓度测量中研究不足、仪器缺失等一系列问题,展开对测量方法与仪器设计的研究。采用光学测量领域光散射法与光透射法相结合的方式,利用散射光中包含的颗粒粒径与质量浓度信息来补偿光透射法的浓度解算,在此基础上建立了包括朗博-比尔定律与夫朗和费衍射定律在内的计算方法。根据这一方法开发设计了
混合云作为云计算近年来发展的主要形式之一,具有数据交互性强、资源自动化等优势,通过私有云和公有云的部署,便于处理不同类型的计算工作,满足了不同的数据处理需求。但混合云在为用户提供便利服务的同时,也面临着新的安全问题,例如数据安全管理、隐私保护、访问控制等。由于混合云复杂的组成和部署特征,数据一般以密文的形式进行运算,访问控制相关技术的研究需要针对密文和复杂访问控制要素等多方面。面向混合云环境下用户
随着图书资源的不断丰富,读者获取感兴趣图书的难度不断增大,图书推荐技术随之产生。利用用户信息、图书信息以及用户购买或是借阅的记录来预测用户可能感兴趣的图书,主动地为用户推荐图书,使得用户可以快速、准确地获得相关图书,并节约大量时间。此外,优质的图书推荐方法也能够帮助图书销售平台提升其精准化推荐的能力,从而增强自己的核心竞争优势。图书推荐主要包括以下三种方法,分别是基于内容的、基于协同过滤的和基于关