OAI-PMH中元数据相似度计算的研究与实现

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:dongwinder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
OAI协议(OAI-PMH)作为一种新兴的元数据互操作协议,为实现元数据的传播、共享和分发提供了解决办法。由于它的简单、低门槛、跨平台等优点,在众多领域中得到了应用。随着OAI协议应用的不断扩展,该协议中元数据资源呈现出快速增长的态势,如何发现元数据间的关联,得到有用知识,以便用户从海量的元数据信息中获取所需、感兴趣的信息内容,成为目前迫切需要解决的问题。相似度计算作为发现信息关联,得到知识的基础,被广泛应用于信息检索、推荐和挖掘等领域,在信息处理中占据着重要的地位。本文在深入研究国内外相似度计算方法的基础上,结合元数据的结构特点,将相似度计算引入OAI协议中,对元数据间的相似性进行度量,提出了一种基于向量空间模型的OAI-PMH中元数据相似度计算方法。考虑到元数据不同元素位置的特征项对权重计算结果的影响,该方法在选择出元数据特征项后,采用位置权重系数改进的TF-IDF方法计算特征项权重,将元数据对象映射成空间中的向量,通过空间中向量夹角计算来度量元数据间相似度。本文设计和实现了OAI-PMH服务提供者,并在其中集成了元数据相似度计算功能,将该功能作为服务提供者的一个模块,来组织服务提供者收集回来的元数据。实验分析表明,该方法对元数据相似度计算是可行的,有效的从元数据集中挖掘出相似元数据。通过此模块计算元数据间相似度,在用户查询浏览元数据时,自动推荐与所浏览元数据相似的资源,便于用户找到感兴趣的信息。这样不仅为用户提供了更好的增值服务、提高了信息服务质量,而且还满足了用户查询需求。
其他文献
条码技术已经成为当今主要的计算机自动识别技术之一,广泛应用到社会的各行各业,为人们的生产生活提供了极大的便利。随着条码应用领域的不断拓展,需要条码表示的数据信息量
随着计算机在教育领域的应用普及和多媒体技术的飞速发展,以多媒体点播为主的助学系统已成为各高校辅助教学的重要手段。然而传统的助学系统研究起步较晚,开发技术相对落后,
文化算法提供了一种明确的机制来表示、存储和整合进化过程中的知识。其主要思想:在进化过程中,从进化的种群中获取待解决问题的经验知识,将这些经验知识存储在信念空间中,并
IPv6被认为是下一代互联网的核心协议。IPv4地址资源已经枯竭的状况加速了各国IPv4网络向IPv6网络过渡。在过渡初期,IPv4网络和IPv6网络将在一段时期内并存,IPv6网络是IPv4网
如今,随着Web服务(Web Services)技术的日臻成熟,Web服务的应用会越来越广泛,前景也会更加明朗。但是,单个Web服务提供的功能毕竟有限,如果把多个Web服务组合起来,那么一个功
硬件性能的提高和价格的降低带来了嵌入式技术的高速发展。现在,智能家电已经进入千家万户。需要一个总控设备来完成各智能家电的控制、数据的存储、家庭内部网络和Internet
针对当前的入侵检测系统判断过于单一、无法协助系统保证关键服务正常工作的问题,本文将李德毅院士提出的云理论(Cloud Theory)与入侵检测系统(Intrusion Detection System)
学位
随着信息技术与网络技术的飞速发展,人类社会对计算机数据的依赖越来越强。使用数据备份系统对重要数据进行备份与恢复,是人们保护数据安全性与完整性的常用手段。备份系统的
当前,web应用因为其易于部署等优点而倍受青睐,很多企业都使用它来构建自己的信息管理平台。随着web应用的越来越广泛,对技术也提出了新的要求,基于web的可视化建模技术就是