论文部分内容阅读
共词聚类分析法采用聚类的计算方法,对文章中共现的主题词对的关联性进行运算,将关系密切的主题词聚集为代表不同研究子主题的类团,达到挖掘隐含信息的目的。共词聚类结果仅揭示出类团内主题词间相关性的强弱,而主题词间语义关系的揭示仍主要依赖于学科专家的参与,这在一定程度上阻碍了共词聚类研究的发展。因此,如何结合其他方法自动揭示共词聚类结果类团内主题词间语义关系成为了当前研究的一个重要问题。关联数据的发布与应用为这一问题的解决带来了新的发展契机,尤其是关联数据中预先建立了概念节点间大量权威的关联关系,为类团内主题词间语义关系的自动揭示奠定了基础。本文通过关联数据相关技术构建了基于关联数据的类团内主题词间语义关系的揭示模型,利用关联数据图形结构所蕴含的语义知识揭示类团内主题词间的语义关系。 本论文的研究工作主要包括以下几个方面: 首先,系统调研了基于关联数据的知识发现和重要性评价以及语义关系表示等相关研究,对所涉及的关键技术、方法进行总结和分析,作为本论文的研究基础。 其次,基于关联数据图型结构梳理主题词对应概念节点在关联数据中的关联关系,构建了基于关联数据的类团内主题词间语义关系的揭示模型。模型通过界定相关概念,对主题词节点在关联数据图中不同的关联关系进行分析和整理,作为进一步解释其语义关系的基础。模型的构建是揭示类团内主题词间语义关系的重点,也是本研究的核心。 第三,模型的应用需结合一定的技术和方法,本文借鉴相关研究提出了基于关联数据揭示类团内主题词间语义关系的一套技术方案。主要包括:目标关联数据资源集的遴选技术、关联数据子图构建技术、语义关系挖掘技术以及语义关系表示技术等。 最后,本文借助Jena和Virtuoso等开源工具实现了一个实验系统,对本文提出来的基于关联数据的类团内主题词间语义关系揭示模型进行验证,分析模型的可行性、有效性及存在的问题,同时确立下一步研究工作的方向。 综上,本论文分析并探讨了基于关联数据揭示类团内主题词间语义关系的技术路线、实现策略并对其进行了验证,希望对共词聚类的相关研究和应用提供借鉴,也对关联数据的消费和应用研究提供一些启发。