基于表示学习的专利科学引文元数据自动抽取及其内容挖掘研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:smtl520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利科学引文是非专利引文的重要类别之一,通过对专利科学引文进行分析,可以掌握科学技术间的关联关系,进而获知科学知识与技术应用间的知识转移和流动。当前的专利科学引文研究大多通过文献计量的方法进行,如果可以获取专利科学引文的标题、关键词、摘要等内容元数据,就可以更准确、全面的从内容角度对其进行深入分析。对专利科学引文进行抽取可以获得专利科学引文内容元数据,而传统的引文元数据抽取方法存在待改进的地方,如果能够实现高效率的专利科学引文元数据抽取,就可以为专利科学引文分析提供更多的数据支持,实现专利科学引文的内容挖掘。基于上述问题,本文提出了一种基于表示学习的专利科学引文元数据抽取及内容挖掘的方法,以抽取专利科学引文中的内容元数据,并利用得到的内容元数据进行专利科学引文内容挖掘的探索性研究。本文应用和改进传统的引文元数据抽取方法,将表示学习的方法引入专利科学引文元数据抽取中,以期实现更准确的专利科学引文元数据抽取,在获得内容元数据的基础上实现专利科学引文内容挖掘。首先设计专利科学引文识别方法,将专利科学引文从多种格式的非专利引文中识别出来;然后对识别到的专利科学引文进行抽取,得到专利科学引文元数据,并设计对比实验验证方法的有效性;最后,根据识别出的专利科学引文和抽取出的专利科学引文元数据,对专利科学引文的内容进行挖掘和分析,在纳米技术领域进行专利推荐、领域内研究热点分析等方向的实证研究。实验和实证结果表明,本文提出的元数据抽取方法与传统方法相比效果更好,内容挖掘方法具有可用性和实用性。本文主要解决了以下两个问题:(1)专利科学引文元数据的自动抽取。本文首先利用表示学习形成多维语义向量表示非专利引文数据,结合分类算法识别出非专利引文中的专利科学引文;然后设计规则将专利科学引文元数据分割成块,对分割块的语义特征以及位置特征进行向量化表示;最后利用分类算法识别专利科学引文元数据。(2)专利科学引文的内容挖掘。本文通过元数据抽取实验获得专利科学引文元数据后,将其中的标题放入期刊数据库进行检索,得到摘要、关键词等内容元数据,通过对内容元数据的聚类、共引、相似度计算等分析,进行了相关专利推荐、领域内科学研究和技术应用方向的异同等探索性研究。
其他文献
贵州五轮山井田自二叠系煤层形成以来,主要经历了三期构造应力场的更替。在构造控制下,煤层主要经历了四期煤化作用。煤层气主要生产阶段,发生在印支期末-燕山早期,保存的煤层气
笔者自2005年起应用舒筋红花酊外用配合功能锻炼治疗外伤性肘关节僵硬32例,疗效满意,现报道如下。
近年来,静电纺丝纳米纤维因其长径比高、比表面积大、结构可控、形貌多样被广泛研究。石墨烯气凝胶也因为高孔隙率、高比表面积、低密度和良好的压缩性引起人们的关注。本文
微乳液是一种热力学稳定的油水混合体系,在众多领域应用广泛。通过对微乳液体系制备方法的介绍,分析微乳液形成机理,以及微乳液在食品领域的应用进展进行阐述,为日后微乳液的
沙门菌是一种重要的食源性病原菌,绝大部分血清型对人和动物具有致病性,可引起多种不同临床表现的沙门菌病。研究沙门菌感染宿主的致病机制对预防和控制沙门菌病具有重要现实意义。细菌非编码小RNA(Small non-coding RNA,sRNA)是一类基因组中被转录但不编码蛋白质的RNA分子,通过感应外界环境变化,在转录后水平快速调节基因表达。RyhB是存在于沙门菌、大肠杆菌等多种细菌中的一种sRNA。
结合工作实际,对煤炭地质单位投资管理中四个方面的问题进行了分析。投资保持快速增长是煤炭地质经济的一个新特点,投资推动了煤炭地质单位的跨越式发展,带动了地勘单位资产规模
为了评定采动期间地表沉降对采空区上方高等级公路的破坏程度,采用合成孔径差分干涉测量(DInSAR)的技术,利用南屯矿区10景TerraSAR-X卫星数据,对位于老采空区上方的高等级公路在重复采动条件下的沉降情况进行监测。获取了监测期间的开采沉陷时序关系图,这是传统测量方法难以达到的。通过提取出高等级公路时间序列上的下沉值,并基于此值对邹济高等级公路进行损害程度评定,研究表明:公路在监测期间内最大下
利用煤田地质勘探资料,对幸福井田煤层气赋存量、赋存特征及展布规律作了进一步分析和研究,指出了井田内煤炭储量丰富,煤层气赋存量大,煤层气平均含量为11.59m^3/t,含气量较高,具有综
根据已有煤田地质资料,对习水矿区的地质构造进行了分析研究,认为矿区断裂以正断层为主,断层力学性质多属压扭性,东西向构造早于北东向构造;构造复合部位较复杂,其余区段较简
在分析褶皱和断裂构造对煤层瓦斯赋存影响的基础上,根据黄陵一号煤矿的区域地质演化情况和地质构造特征,分析了影响黄陵一号煤矿2号煤层瓦斯分布的主要控制因素,并对井田深部煤