基于关联数据的类团语义揭示研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:jiangqiqi77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
共词聚类分析法采用聚类的计算方法,对文章中共现的主题词对的关联性进行运算,将关系密切的主题词聚集为代表不同研究子主题的类团,达到挖掘隐含信息的目的。共词聚类结果仅揭示出类团内主题词间相关性的强弱,而主题词间语义关系的揭示仍主要依赖于学科专家的参与,这在一定程度上阻碍了共词聚类研究的发展。因此,如何结合其他方法自动揭示共词聚类结果类团内主题词间语义关系成为了当前研究的一个重要问题。关联数据的发布与应用为这一问题的解决带来了新的发展契机,尤其是关联数据中预先建立了概念节点间大量权威的关联关系,为类团内主题词间语义关系的自动揭示奠定了基础。本文通过关联数据相关技术构建了基于关联数据的类团内主题词间语义关系的揭示模型,利用关联数据图形结构所蕴含的语义知识揭示类团内主题词间的语义关系。  本论文的研究工作主要包括以下几个方面:  首先,系统调研了基于关联数据的知识发现和重要性评价以及语义关系表示等相关研究,对所涉及的关键技术、方法进行总结和分析,作为本论文的研究基础。  其次,基于关联数据图型结构梳理主题词对应概念节点在关联数据中的关联关系,构建了基于关联数据的类团内主题词间语义关系的揭示模型。模型通过界定相关概念,对主题词节点在关联数据图中不同的关联关系进行分析和整理,作为进一步解释其语义关系的基础。模型的构建是揭示类团内主题词间语义关系的重点,也是本研究的核心。  第三,模型的应用需结合一定的技术和方法,本文借鉴相关研究提出了基于关联数据揭示类团内主题词间语义关系的一套技术方案。主要包括:目标关联数据资源集的遴选技术、关联数据子图构建技术、语义关系挖掘技术以及语义关系表示技术等。  最后,本文借助Jena和Virtuoso等开源工具实现了一个实验系统,对本文提出来的基于关联数据的类团内主题词间语义关系揭示模型进行验证,分析模型的可行性、有效性及存在的问题,同时确立下一步研究工作的方向。  综上,本论文分析并探讨了基于关联数据揭示类团内主题词间语义关系的技术路线、实现策略并对其进行了验证,希望对共词聚类的相关研究和应用提供借鉴,也对关联数据的消费和应用研究提供一些启发。
其他文献
随着计算机技术和网络技术的发展,电子资源越来越成为高校图书馆馆藏的重要组成部分。在电子资源快速增长、用户的需求日益增加,以及图书馆人力、经费十分有限的实际情况下,电子
藏书发展政策,是近二十年来国内图书馆学界研究的一个论题。藏书发展与图书采选、藏书建设、文献资源建设等传统研究领域有包含或相交的关系,但并不等同。传统的藏书建设内容,如
学位
期刊
研究生教育作为一种现代教育制度,从19世纪的德国发展起来,到二次世界大战以后,世界各工业发达国家纷纷建立了学位授予和研究生教育制度.继60年代美国等世界发达国家研究生教
宝鸡市陈仓区是宝鸡市乃至陕西省畜禽养殖大区,多年来畜牧业粗放式数量扩张型发展对周边环境造成了较为严重污染,制约了畜牧产业后续发展和生产能力的提升.调整产业结构,保持
随着信息技术的不断进步,人类被日益增多的数字信息资源所包围。发展数字信息资源及其技术是信息时代的要求,是知识经济发展的需要,世界各国对此高度重视,纷纷采取措施促进数字信
当今世界,科技全球化和开放科学的深入发展推动了科研资源的全球化配置,加剧了各国对优质科研资源特别是优秀科研人才的竞争。这种竞争主要表现在两个方面:加大对国际科技精英
信息素质教育是指根据所处社会信息环境,综合运用各种手段,培养和提高人们的信息意识以及有效识别、获取、评价和利用信息能力的教育活动。中国科学院是为国家培养新一代创新型
为了从根本上规范医疗广告发布行为,国家工商总局、卫生部日前联合公布了新修订的《医疗广告管理办法》。办法对医疗广告审查、医疗广告内容等作出了明确规定。新修订后的《
随着全球化的深入发展,以智能、绿色、泛在为特征的群体性技术革命将引发国际产业分工重大调整,作为发展中国家的中国,要在新一轮工业革命中抢得先机,实现经济结构转型升级、产业