基于中文专利的产业概念层次体系构建方法研究

来源 :情报杂志 | 被引量 : 0次 | 上传用户:linxunchang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]构建丰富的产业概念层次体系,有助于对产业数据资源进行有序组织,研究构建过程中关键词识别与层级关系确定的方法。[方法/过程]以产业中文专利数据为来源,引入平衡语料与平均信息熵提取通用词并过滤;融合位置、词性、TF-IDF与外部知识库特征,改进TextRank模型有效识别关键词;最后结合产业专家知识、深度学习和近邻传播聚类(AP)算法生成产业概念层次体系。[结果/结论]实验选取“汽车制造”产业进行实证分析,结果显示在关键词抽取上较传统方法有了明显的提高,自动生成的三层次体系包含6个一级关键词和2
其他文献
[目的/意义]开放的微博平台是谣言的重要发源地,研究谣言检测对于减少谣言的传播,降低或消除谣言的影响具有重要现实意义。[方法/过程]提出了一种基于用户特征分析的微博谣言
[目的/意义]情感识别一直是网络舆情领域的研究热点,为解决传统文本表示模型无法根据语境对词语进行理解,且在小数据集下识别效果不好的问题,设计了一种基于优化深度双向自编
随着现代技术的高速发展,以综合电力推进技术为代表的海洋工程船舶已逐步成为当今高技术船舶动力系统发展的主流趋势。由此带来更多的是中高压电力系统和区域直流配电系统在