论文部分内容阅读
教育是国家竞争力的基础,也是综合国力的重要体现。由于教育信息化的不断推进,教育资源逐渐从线下向线上迁移。随着Web2.0的兴起,互联网上的数据规模急剧增加。但是互联网上海量的教育资源,除了丰富人们的选择,也会带来信息过载的问题。使用知识图谱能够以网络的方式对教育资源进行组织,与传统方法相比对资源的组织利用能力更强,可以有效解决信息迷航问题。针对互联网教育资源海量、无序、碎片化的缺陷,本文利用教材资源良好的体系性作为框架,结合线上线下的教育资源,围绕数据获取、命名实体识别、实体关系抽取、知识融合以及知识图谱可视化,提出了一套完整的面向教育领域的知识图谱构建方法。并以图书情报学科下“信息分析”课程为例,从多源数据构建知识图谱,选择书本教材、慕课和博客三个渠道,对方法加以实现,并提出了知识图谱在课程设置优化、教育资源智能搜索和教育资源个性化推荐三方面的应用方案。本文梳理教育资源的分布情况和存在形式,尤其是在互联网教育资源分布割裂、零散的情况下,明确数据的获取渠道,为教育领域的多源数据整合提供帮助。针对教育资源的特殊性,设计了基于新词发现+条件随机场+规则的命名实体识别算法,以及依存句法分析+条件随机场+规则的关系抽取算法,经实验验证有良好的效果,为教育资源知识图谱构建提供新的工具手段。知识图谱构建完成后链接不同教育资源,将数据存储于图数据库Neo4j中,方便数据的修改与查询,进而更好地对教育资源加以利用。结果表明,本文构建的“信息分析”课程知识图谱以书本教材数据抽取的实体为主干,慕课和博客数据抽取的实体为补充,揭示了课程中信息分析方法相关概念以及概念之间的联系。并且依据课程知识图谱可以明确知识单元间的关系进行课程设置优化,同时知识图谱满足教育资源智能搜索和教育资源个性化推荐的需要,解决信息迷航问题,让教育资源得到更充分地利用。