运用图示法自动提取中文专利文本的语义信息

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:youlishi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]提出利用图结构的表示法自动挖掘中文专利文本的语义信息,以为基于文本内容的专利智能分析提供语义支持。[方法/过程]设计两种运用图结构的模型:1基于关键词的文本图模型;2基于依存关系树的文本图模型。第一种图模型通过计算关键词之间的相似性关系来定义;第二种图模型则由句中所提取的语法关系来定义。在案例研究中,借助频繁子图挖掘算法,对所建图模型进行子图挖掘,并构建以子图为特征的文本分类器,用来检测所建图模型的表达性和有效性。[结果/结论]将所建的基于图模型的文本分类器应用于4个不同技术领域的专利文本数据集,并与经典文本分类器的测试结果相比较而知:前者在使用明显较少的特征数的基础上,分类性能较后者提升2.1%-10.5%。由此而推断,使用图结构的表达法并结合图挖掘技术从专利文本中所提取的语义信息是有效的,有助于进一步的专利文本分析。
其他文献
近年来,包括我国在内的世界各地各种灾害时有发生,为在灾后第一时间提供应急援助,事前合理的规划应急物流网络尤为重要。以此为出发点,论文重点研究了轴辐式应急物流网络中枢
目的观察仙人掌提取物在不同时间内对S180荷瘤小鼠的抑瘤作用。方法用野生仙人掌进行乙醇提取且制成受试溶液,并给予昆明小鼠灌胃,1次/日,0.2ml/次/只。给药6天后,皮下种植S1
目的 探讨带血管蒂耳后皮瓣在眼睑恶性肿瘤切除后所致眼睑及周围组织缺损一期修复的临床应用。方法 本组 8例眼睑恶性肿瘤切除后所致眼睑及周围组织缺损 ,用带血管蒂耳后皮
空心莲子草是我国外来入侵物种之一,也是我国急需解决的草害问题之一。本文对该草的形态、生长繁殖、分布及危害等生物学特性作了详细的描述,并综述了目前对该草的各种防除措
“与国内其他书展相比,上海书展一直以全面向读者开放、读者互动程度高、互动体验佳为特色,一年一度,在参展单位和读者中都拥有很高的口碑。政府正带领我们大力实践‘倡导全民阅
报纸
会计委派制在近几年的试行过程中,在会计管理和抵制腐败等方面取得了一定的成效,但也暴露出不少问题。这些问题的存在,在一定程度上制约了会计职能的履行。所以,有必要针对这
中国是为数不多的几个受到自然灾害严重侵袭的国家之一,每年因为地震等自然灾害和突发事件造成的国民经济损失和人员伤亡数目十分惊人。针对于此,如何能够降低自然灾害所带来
目的 探讨对进行药物治疗的患者实施优质护理的效果。方法 确诊冠心病患者106例,随机分为实验组(n=53例),对照组(n=53例)。两组患者药物治疗期间,实验组给予常规护理的同时,补充
<正>智性与心理分析晓航的中篇小说《师兄的透镜》获得鲁迅文学奖,这似乎让一些人感到意外。早在前两三年,晓航的名字频繁地出现在一些大刊与选刊的时候,我实际上就开始仔细
目的为了进一步提高老年冠心病患者围术期安全性,分析和研究右美托咪定对自主神经系统功能的影响。方法将2014年1月-2015年1月在我院拟行上腹部手术的50例老年冠心病患者作为