挖掘社会化标注服务语义万维网络

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:malongqingse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义搜索是目前万维网研究的热点,目标是从大量的网络资源中找到真正语义相关而不是仅仅是关键词匹配的内容。为了实现语义搜索, 必须用机器可以理解的元数据对网络资源进行标注。传统的语义搜索研究试图首先定义好的一个统一的本体,这个本体一般使用RDF或者OWL等标准的标记语言表示;然后使用这个本体去标注网络上的各种资源和以及资源之间的关系。这种先建立本体,后添加标注的自上而下的标注方法已经成功的应用在生物信息学,知识管理等领域。但是它具有以下缺点:1.当前的网络上的资源非常复杂,要为这样大规模异构的网络资源建立一个共同的本体非常困难。2.现在的网络是一个动态的环境,即使构建出了这个这种全局统一的本体,它也很难适应网络上资源的快速变化。3.这种标注需要标注者具有一定的本体工程的背景知识,这对于普通的网络用户来说是一个很高的门槛。社会化标注是目前新兴的一种标注方法,它允许普通的网络用户自由选择标签来标注网络资源,不需要遵循一个公共的本体或者词汇表。这种自下而上的标注方法被称为民间分类法,它克服了传统标注方法的缺点:标签是自由选取的,不需要建立一个统一的本体;也不要求用户有专业的背景知识,因此普通的网络用户也可以参与标注;同时民间分类法可以随着用户的不断标注而进化,适应动态的网络环境。但是社会化标注由于缺乏统一的本体指导标注,标签会出现一次多义和多词一义的问题。缺乏明确的语义信息,社会化标注很难被运用到语义搜索之中。本文采用“浮出语义”的思路,研究社会化标注数据中用户,网络资源和标签三者之间关系,建立了一个无指导学习的统计学模型,挖掘出社会化标注语义信息。通过得到的量化语义信息,可以解决社会化标注中一词多义和多词一义的问题,明确社会化标注的语义信息。根据这些浮出的语义信息,本文提出了一系列社会标注数据上的语义搜索模型,包括:个性化搜索,知识发现搜索等模型。本文还实现了一个名为deegle的在线智能搜索系统,在美味书签网的社会化标注数据上实现个性化搜索,知识发现等功能,初步的评估表明deegle可以找到语义相关但是通过关键字查找技术无法找到的网络资源,实现语义搜索。
其他文献
工作流引擎是工作流管理系统的核心部件,它的结构是否合理对整个系统有着至关重要的影响。目前,工作流产品都有着不同的侧重点,通用性,可移植性差,对企业造成重复开发,究其原因,主要
电力通信资源是电力系统的重要基础设施之一,是电网正常运行的重要保证。电力通信资源数据的采集、汇总,并利用商务智能技术从大量数据中提取有用信息,对于及时掌握电力通信
随着网络技术、多媒体技术、数据库技术、海量存储技术等技术的发展,数字图像的数量不断增加,使用日益广泛,并成为信息社会中的主要信息资源之一。然而,由于图像往往具有丰富
本论文研究了嵌入式系统的体系结构和发展状况,对ARM处理器的工作模式、寄存器的设置和分配进行了研究,同时对于微处理器S3C2410进行了分析和讨论。论文在研究了嵌入式Linux
蓝牙作为一种低功耗短距离无线传输技术,它的特点和范围都非常适合无线传感器网络的要求。将蓝牙技术应用于新兴的无线传感器网络系统,这无论在国内或者国际上都是较为先进的
目前计算机文件数据的安全主要通过操作系统的访问控制机制来进行保护。这种方式有很大的局限性。如果用户绕过操作系统的这种机制,就能为所欲为地访问任何文件。因此,为了彻
传统信息检索方式下,由于信息资源缺少统一的语义描述,用户难以查找到与需求相关的资源,难以实现信息资源的语义共享。如何实现信息资源的语义检索,提高数字化信息资源的利用率,这
随着Web技术的飞速发展,基于Web的联机分析处理(OnlineAnalyticalProcessing,OLAP)服务越来越多的被引入到现代企业的决策支持系统中,为企业决策者提供方便快捷的决策支持。
计算机火焰模拟的方法大致分为三种:粒子系统方法、数学物理方法和纹理技术方法;其中比较传统的是粒子系统方法。本文对粒子系统的核心控制机制进行了一些改进,在一定程度上
近年来,工作流技术逐渐成为了计算机应用领域中的最为活跃的研究热点之一。工作流系统的时间管理问题在工作流管理中扮演了十分重要的角色。对工作流过程模型中的时间信息进行