论文部分内容阅读
专利是集技术情报、经济情报、商业情报等于一体的知识载体,其中尤以专利文本中的名称、摘要和主权项为甚,可以凸显专利技术所涉及到的专利知识。伴随着我国在国际科技舞台愈来愈活跃,针对我国海量的专利文本,进行必要的专利知识计量分析,可以有效揭示我国专利技术的知识结构及其发展状况。因此,如何基于我国国家知识产权局专利数据库(the State Intellectual Property Office Database, SIPOD)独特的专利文本结构,探寻适宜的专利知识计量指标体系、方法和应用,就成了本文研究的主要目的。首先,以知识、知识计量学基本理论及相关概念为基础,立足于专利知识的创造性、系统性、网络性等特征,本文提出了专利知识计量的概念,并阐释了“知识元”以及知识元相互联系、相互作用而形成的“知识链”、“知识群”和“知识网络”等各类知识聚集体是专利知识计量的对象。之后,构建了专利知识元、专利知识链、专利知识群和专利知识网络四层次专利知识计量指标体系。其中,在专利知识元角度,采用指标频数、权重、度数和中介中心度从其数量和质量角度进行了衡量:在专利知识链方面,则从频数、链长、影响力和中介中心度角度对知识链的构成情况及作用进行了度量;在专利知识群方面,是以强度、规模和聚集度指标对它的结构和功能进行了比较;在专利知识网络方面,则以规模、平均最短距离和密度指标对其组成和结构进行了分析。其次,针对我国SIPOD的专利文本结构,在最大字符串匹配算法的基础上,结合具体专利知识元所在的名称、摘要和主权项位置,构建了专利知识元抽取的方法,并采用知识元云图的方式对其进行了知识可视化。之后,本文采用关联规则挖掘算法Apriori中的频繁项集抽取了专利知识链,并借鉴复杂网络分析中凝聚子群的识别法,以Lambda集合算法完成了专利知识群的识别与计算。本文提到的专利知识网络是以抽取出来的专利知识元为节点、以知识元之间的余弦相似度为边形成的,之后借鉴复杂网络的思想对其结构进行了分析。最后,以与下一代移动通信网络密切相关的数字信息的传输(H04L)领域中76877项专利文本为研究对象,开展了专利知识元、专利知识链、专利知识群和专利知识网络四个层次的专利知识计量分析。进而从专利知识元、专利知识链、专利知识群等角度展示了“H04L”技术领域的专利知识结构及各层次问的知识联系,之后结合专利知识元、专利知识链和专利知识群的特征,采用相应的计量指标定位了"H04L"领域的核心技术知识、热点技术知识、关键技术知识和核心技术知识群。