大规模语义检索及其在轨迹数据中的应用

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:w0wchenhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
万维网上的资源为科学研究及人类社会提供了浩瀚的信息和知识。但是,从万维网的诞生到现在,仅仅在二十多年的时间里,人类已经面临着万维网上由于信息急剧增长所带来的检索问题。于是,万维网之父Tim Berners-Lee又提出了语义网,其核心思想就是让计算机能够自动处理万维网上的信息和知识,为人们提供更加精准的信息检索服务。随着语义网的发展,万维网上已经积累了大量的各个领域的语义资源,这些资源相互关联,形成了一个规模巨大的人类知识库。  面临着规模如此庞大而且日益增长的语义资源,现有的语义推理技术都试图找到完备并且正确的答案,但是在万维网这一开放的、全局的、巨大的、分布的多数据源中,要实现这样的推理现实性不大。为此,研究人员试图从不同的学科和视角努力尝试,其中利用认知科学在人类信息组织和检索方面上的研究成果来解决大规模语义资源的处理问题是一个重要的方向。  城市计算为这种研究提供了极佳的实验场所。城市计算是指城市空间里的任意设备、车辆、建筑、道路,包括人等都可作为一个计算单元,通过城市感知、数据挖掘、智能提取和服务提供这四个主要环节来建立一个城市级别的计算生态系统,为人们提供更美好的城市生活。城市计算通常涉及到多个异构数据源,而语义技术能够提供统一的数据表达形式,利于数据的复用及扩展。同时,城市计算通常以地理领域为基础,而地理领域的很多数据能够公开获取,这些都为城市计算的开展提供了便利的条件。  因此,本文以城市计算为应用背景、以认知启发为主要手段,针对大规模语义检索所面临的问题进行研究,主要研究内容概括如下:  1)针对由语义资源的规模性所带来的问题,有效的资源组织方式能够根据用户需求帮助用户迅速定位到所需资源,加快语义检索与推理的速度。认知科学中的语义网络理论认为人们将各种类别的信息储存在相互联系、具有不同层次的网络结构中。而传统的Web推理方法将所有的数据视为仅分布在同一层次上,因此推理系统需要基于所有数据进行推理,这使得在数据量迅速增大时,推理时间被无限增长。然而不同的用户对于同样的推理任务所需求的推理结果可能是处于不同层次的。受此启发,本文利用本体中类和子类的层次特性,提出了多层语义关联网络模型以组织大规模语义资源,以更加符合人类认知机理的方式为基于Web规模的语义检索与推理提供多层次和多角度的信息服务。  2)针对由语义资源的规模性所带来的问题,有效的资源调度策略能够根据用户需求帮助用户提取到最相关的资源,减少语义推理的规模,从而提高语义推理的速度。认知科学中的有限理性理论认为人类并不会去搜寻无穷无尽的信息以获得一个最好的答案,而会综合利用有限的时间、知识和力量去做理性的决定,在信息检索所需要的消耗和信息利用之间能做出很好的平衡。认知科学中的ACT-R理论使用一个激活方程式描述人类提取最相关信息的过程,是有限理性理论的体现。受此启发,本文基于多层语义关联网络模型,将激活方程式应用于语义资源检索中,并对此检索过程进行了形式化地表述,设计了相关算法,阐述了资源提取的相关策略。  3)城市计算中的一项重要数据是轨迹数据,它能够反映人的各种活动、体现城市的动态性,具备多种应用价值,但是目前基于轨迹数据的研究成果由于缺少语义而不能为多个领域所共用。在此背景下,本文基于本体理论对轨迹数据的语义标注进行建模,提出一种多尺度的标注方法使轨迹数据具有多种语义,以便更好地提升轨迹数据的应用价值。  4)城市计算中的一个重要问题是交通拥堵,而有效的路线推荐不仅能够在一定程度上改善城市的交通状况,而且有助于节能环保。移动手机定位数据(轨迹数据)由于其样本量大、实时性强并且能够在一定程度上描述手机用户的出行行为而正得到研究人员的重视,并广泛应用于城市计算中。我们知道,有经验的用户能够知道哪条路线在哪个时间段内拥堵而在哪个时间段内畅通,或者说一个有经验的用户不一定能够选出最优的路线,但总是能够选择出令他满意的路线,而这与认知科学中的有限理性理论完全相符。本文受此启发,基于大规模实际的移动手机定位数据,利用ACT-R理论中的激活方程式、试图挖掘移动手机定位数据中蕴含的人们选择满意路线的智能与经验,并将这些智能与经验应用于满意路线的推荐(检索)之中。
其他文献
论文首先介绍了电梯控制系统的基本组成及各部分功能,并分析了调速装置ZETADYN 10E2-64的控制过程.然后分别从硬件和软件两个方面对系统的构成与实现进行了详尽的分 析和论述
中国西北干旱地区的发展一直是人们普遍关心的问题.绿洲地区的经济发展,是西北干旱地区发展的关键,水资源市郊利用是西北干旱地区发展的核心.该论文研究选择了策大雅农场作为
该文对星载SAR图像处理方法及其应用进行了深入的理论分析和实验研究,主要研究内容如下:根据星载SAR利用目标回波散射特性成像的机理,揭示了星载SAR图像和光谱类图像的区别及
人在回路中系统仿真是仿真领域的重要研究内容之一.该文的主要工作是以HJ8反坦 克导弹为研究对象,根据射手的工作原理,建立合适的描述人的控制行为的这模型,作为射手环节加入
该文作者参加了与日本NewTech公司合作的RAID(磁盘阵列)系统开发项目,并经历了从最初设计到实现到最后基本完成样机的全过程.作者根据在这一典型实时系统开发过程中的体会以
伪随机性是混沌信号的基本特征,伪随机信号在工程技术中有着广泛的应用.该文从混沌信号的伪随机性出发,研究了混沌信号序列的统计特性,并研究了混沌信号在扩展频谱通信中的应
该论文重点研究了结合"软计算"的元胞自动机的衅案生成及其控制算法的实现.该文在元胞自动机的基础上,结合竞争、模糊、遗传算法思想,提出了竞争元胞自动机、模糊元胞自动机
该文从建模与仿真两个方面对生产物流系统进行了研究,在建模方面,主要研究了基于随机Petri网模型的物流系统性能分析,提出了使用一种扩展有色Petri网对复杂系统进行建模的方
该论文研究传导干扰测试系统的设计和实现技术,通过深入分析电磁干扰对测试系统的影响途径,采用屏蔽技术很好地抑制了电磁干扰对原始信号的影响,有效地保证了测试信号的准确
功能磁共振成像(functional Magnetic Resonance Imaging,fMRI)是近些年来发展起来的一种新的非介入性研究大脑功能的成像技术。研究人员借助信息科学中的数据分析方法对fMRI数