基于大数据的公共数字文化资源领域知识图谱的研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:SQUIRRELXX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国近年来进行了许多公共文化服务的数字化建设探索,然而与当前社会的发展水平和我国国民日益增长的精神文化需求相比,现在的公共文化服务水平仍然有待提升。公共数字文化服务的研究在保障和提高人民生活水平方面上有重大的意义。公共文化数字资源领域的知识图谱可以为公共文化服务和文化数字资源共享奠定理论基础与技术支持,可以大力推进我国的公共文化服务的数字化建设。本文以公共文化大数据应用为背景,论述了公共数字文化领域内的知识图谱的构建过程。首先,对公共文化资源以及公共数字文化资源相关数据进行了分类整理,确定了本体的核心概念集,使用Protege 5.0构建该本体,并用OWL语言描述公共数字文化本体。其次,构建了面向公共文化领域的知识图谱模型。该模型包括网络数据采集模块、基于Han LP的分词过滤实体识别系统、以及实体关系抽取模块。实体关系抽取模块部分提出了面向公共文化的实体关系构建方法。针对公共文化数据的特点,使用文档代替实体,文本建模处理文档,进而使用主题聚类的K-means算法和公共文化本体进行规则推理完成关系构建。文本建模选用了不同的主流实体资源建模方法,包括基于TFIDF和基于Word2Vec的向量空间模型构建,以及基于LDA的主题模型构建。将实验结果进行对比,验证了各文本建模方法在算法时间上的高效性,最后选择了LDA主题模型来构建实体资源的语义关系,为公共文化资源关系的构建提供理论依据。最后,完成了公共数字文化资源知识图谱平台的实现与应用。搭建了基于Hadoop的云平台的基本架构,并在此基础上进行了知识图谱平台的设计与实现;将知识图谱应用于公共文化资源个性化推荐系统上,并基于知识图谱的推荐结果进行了可视化展示。本文将自然语言处理领域的TF-IDF,Word2Vec和LDA模型用于公共数字文化资源的信息关系构建,通过实验对比三个不同模型的不同聚类效果,验证算法的效率和语义关联性,为公共文化资源关系的构建建立基础,具有一定的现实意义。
其他文献
《伊奥兰塔》是柴可夫斯基歌剧创作的终结版,也是一部具有唯美、纯真的童话歌剧。本文通过谱例研究法、分析研究法、归纳总结法等论文研究方法从柴可夫斯基生平与其主要声乐
19世纪末,俄国进入了一个工业快速发展期,虽然工业基础和工业水平的整体实力不如欧美等工业强国,但此时的工业发展速度却远远超过了西方工业大国。作为轻工业的重要组成部分,
随着无人机技术的快速发展,与航拍相关的增稳云台技术也成为了发展的热点之一,云台可以被广泛用于军事、探测、生产以及日常的拍摄中。由于云台系统工作环境复杂,工作状况变
随着全球化进程的不断加快,全球范围内的信息交流愈发广泛。核电作为国家重要能源,也参与到全球化的进程中,成为国与国之间的合作项目。在2016年末至2018年初中英两国共同开
工业是关系国家发展的支柱产业,优化控制效果、提升生产效率是工业控制的主要目标。在工业控制系统中,模型建立是控制问题的基础,而真实模型参数会随系统运行损耗,噪声干扰等
崔国因,生于太平县甘棠村的一个没落的书香门第之家,自幼接受中国传统文化教育,历官翰林院编修、左庶子,曾任出使美国、日斯巴尼亚(今西班牙)、秘鲁三国大臣。经过多年官场历
研究背景:以细胞膜为基础的纳米系统具有良好的生物相容性及靶向性,在许多治疗应用中得到了广泛的研究。然而,目前的研究主要集中在单细胞膜上,来自不同细胞种类的膜的多功能
传统的地铁车站由于在公共区域设置有大量的结构柱,存在割裂空间、阻挡视线、限制人流等问题,在客流高峰期,这些缺点带来的弊端将愈加明显。而取消结构柱后形成的大跨无柱地铁车站,以其空间通透、视野开阔、人流通畅等优点,近年来逐渐受到大家的青睐并不断地被推广应用,相关的研究成果也较为丰硕,但是对于不同结构型式的无柱地铁车站间的受力特性的对比、在受到车站跨度及埋深等影响因素改变时的力学行为变化规律以及抗震性能
党的十八大以来,我国生态文明建设呈现快速发展的新局面。特色生态小镇作为生态文明建设的一个全新载体开始走进学术研究视野。特色生态小镇是坚持产业、文化、旅游“三位一体”和生产、生活、生态“三态融合”发展的基本原则,在促进人与自然和谐相处、实现人民群众对美好生活期待的基础上,作为我国经济和城镇化发展到一定阶段的必然产物,是破解我国当前经济增长困境的新动能,也是为实现美丽乡村愿景而出现的新载体。本论文围绕
目的:研究间充质干细胞(mesenchymal stem cells,MSC)对经鞘氨醇激酶1(sphigosine kinase 1,SphK1)基因沉默的人结肠癌RKO细胞增殖和迁移的影响,并探讨其可能机制。方法:采用