数据空间数据源描述信息更新策略研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:minifeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的飞速发展使得我们被大量的信息所包围。大数据是这个信息时代最鲜明的特征,如今全球的数据存储已经进入了“泽它时代”。信息的爆炸式增长给我们带来的问题很多,不仅是存储空间的问题,还有存储模式的问题。多样化的数据无法存储在模式单一的数据库中。近几年,为了解决这种异类数据的存储问题,提出数据空间(Data Space)的概念。数据空间能够淡化数据模式,支持不同类型数据的分布式存储,支持 pay-as-you-go的方式。数据空间作为一种新的数据管理技术,以用户为中心,为用户提供数据管理服务。  数据空间是一个新的研究领域,在数据存储、查询、索引等方面已经有一定的研究工作。但是目前学术研究界对其更新问题的研究还不成熟,并且数据空间中数据源的分布式存储以及数据源的多源异质异构特性使数据空间的更新研究更加复杂。  本文研究了数据空间中数据源的更新策略,确切地说是数据源描述信息的更新策略。完成的主要工作包括:(1)采用模糊哈希的方式对文档内容的变化程度进行分析,确定是否达到需要更新其描述信息的标准。(2)对于文档数据的更新,提出一种重要性与新鲜度相结合的方法,以用户的要求为标准,给不同的文档集合设置不同的更新频率。(3)将数据空间文件夹单独视为一类资源,设计了一种检测其增删改变化的算法。(4)采用时间序列预测的方法,构建ARIMA模型来预测网页的改变频率。  本文重点研究了数据空间中的本地数据源与在线数据源的更新策略。基于ARIMA模型,提出了预测数据源改变频率的方法。针对不同数据源制定相应的更新策略,从而保持数据空间的新鲜度维持在较高的水平。
其他文献
针对400v备自投开关切换至短路母线上时往往由于备自投装置的选择性问题导致进线开关跳闸进而使得低压系统全部失电,提出了保护整定配合和区域选择性联锁的解决方案,有效避免
移动机器人技术已成为目前机器人技术研究的一个热点。移动机器人运行过程中,需要实时测量自身位置和姿态。和传统的传感器相比,视觉传感器方式具有信号探测范围宽、获取信息
位于海岸边的护岸经常受到台风、潮水的袭击,涨退潮循环容易造成水土流失,导致护岸毁损及护岸后方地基下沉.通过对咬合桩及注浆两种修复方案的比选,根据施工可行性,选定注浆
蒸氨生产是整个焦化回收过程的一个中问环节,它的生产状况直接影响其它工序的产品质量和产量,在焦化生产中占有十分重要的地位。由于蒸氨过程是一个大时滞、多变量、非线性、参
数控机床的出现为较好地解决复杂、小批量、精密、多变的零件加工问题,提供了一种有效的自动化加工手段。目前,数控机床伺服进给系统普遍采用PID控制方法,其优点是算法简便、易
随着车辆数量的飞速增加,交通安全变得越来越重要。遵守交通规则是避免交通事故的最有效方法。遵守交通规则,既需要相关人员遵纪守法,也需要主管部门的监督管制。人工监督,要消耗
8月1日,海豚会深圳湾旗舰会和海豚玫瑰会深圳旗舰会8月主题活动在深圳南山科技园高新南七道数字技术园隆重举行,60位会员嘉宾出席,共同探讨各自企业布局“互联网+”的心得和
随着国际贸易的发展,世界海运量迅速扩大,人们为了提高船舶运输的安全性和经济性进行了船舶自动化方面的各种研究,其中通信导航系统作为船舶的一个重要组成部分在保障航海安全性
近些年,随着经济的不断进步与发展,对于建筑工程的需求也越来越大,同时对于建筑节能的要求与标准也越来越高;门窗作为建筑工程中的外围护结构,对于建筑的节能与消耗有着直接
砂轮作为磨削加工中被广泛使用的一种磨具,其表面形貌对磨削加工过程和最终所加工出的产品表面质量有着直接的影响,因此对砂轮表面形貌进行测量和评价具有重要意义。测量采样间