基于数据流系统的空间数据流系统建模

来源 :中国信息通信 | 被引量 : 0次 | 上传用户:qq271232312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 数据流系统以连续查询为特点,连续查询的处理机制能够保证数据处理做到实时处理。但是现有的通用的数据流系统没有对空间数据处理的支持,而基于位置服务显然是一种需要空间数据处理的应用。本文从支持位置服务的后台数据处理出发,提出用基于数据流系统的流数据库来支持基于位置服务的数据处理的思想,并结合当今数据流系统的发展和基于位置的服务的需求,对数据流系统进行空间扩展,提出一种空间数据流系统的模型。
  关键词 数据流 空间连续查询 LBS
  1 数据流系统
  数据流(data stream)应用的出现引起了国内外专家和学者的关注,数据流管理技术作为一种新兴的技术已经被广泛的研究,目前通用的DSMS(data stream management system)包括TelegraphCQ[1],Aurora[2]和STREAM[3]。
  数据流的查询过程是持续的查询(continuous query)[4],持续查询所关心的并不是全部的数据,而是近期最近到达的部分数据,所以数据流中的持续查询采用滑动窗口(moving window)机制,基于滑动窗口的查询。
  本文基于通用流数据库[5][6],构建一个空间数据流系统模型。在此过程中,借鉴交通导航应用开展工作。这里的空间流数据库模型系统的主要的工作仅包括增加空间数据类型、空间滑动窗口和空间谓词,为了实现简单易懂的空间连续查询语言,本文在设计时,尽量和原有的空间数据库查询语言和连续查询语言做到统一。本文依据标准SQL和CQL设计空间数据类型和空间谓词,并参考OGIS标准,尽量不修改原有查询语言的结构,采用通用的空间数据类型表示方法,通过增加通用的关键词的方式,扩展连续查询查询语言。
  2 空间数据类型扩展
  我们考虑交通导航LBS(Location Based Service)应用,在这种应用中,需要知道移动对象前方道路的交通状况,根据交通状况选择合适的运行路线。假定每个移动对象每隔30秒向导航服务中心报告移动对象当前的速度和位置信息。前方的交通状况由运行在前方的一定范围的移动对象数量和这些移动对象的平均速度来决定,数量多并且平均速度小于40km/h就表示交通状况差,否则交通状况良好。随着移动汽车位置的改变,其维持的空间查询窗口也在不断的改变位置,如果设计一种空间滑动窗口,使之能够随着移动对象的改变而改变,就可以解决这个问题。
  根据例子应用的需要,拟增加的空间数据类型有Point和SSwin两种。Point用来表示一个移动对象,而SSwin用来表示一个空间滑动窗口。
  (1)Point[x:float, y:float],在这里Point表示某个移动对象,它的值为移动对象的二维空间坐标;
  (2)SSwin [Point1, Point2],表示某一空间滑动窗口,为了简化问题,此处的SSwin,仅表示一个矩形的空间滑动窗口,由两个Point标识。
  3 增加空间滑动窗口查询函数
  为了支持空间查询,需要增加空间谓词和空间函数,本文需要增加空间函数Inside,用来判断空间移动物体是否在空间滑动窗口内。
  (1)Inside(Obj,SSwin)
  这里的SSwin表示空间滑动窗口,Obj表示移动对象位置,此运算符的结果为整型,当Obj在SSwin 的内部时,其值为0,否则,返回值为1。
  (2)空间滑动窗口的连续查询
  通过以上增加了空间数据类型和空间谓词以后,流数据库可以支持空间滑动窗口的连续查询。粗体字部分表示本文增加的空间谓词:
  :
  
  ……
  :
   |
  :
  INSIDE ( , )
  
  ……
  4 空间滑动窗口查询的实现
  本文的空间流数据库模型的实现工作是基于STREAM流数据库管理系统,通过修改此系统的代码,实现空间流数据库系统。此系统是斯坦福大学开发的一个的通用的流数据管理模型。此数据库管理系统模型是开放源代码的。它能够处理对多个连续的数据流和存储关系的连续查询。它提供大量的复杂流查询,用来处理高容量和高突发性的数据流。它提供丰富的连续查询语言,有良好的交互操作界面。
  本文的实现是要在流数据库管理系统的基础上进行扩展,虽然仅是对原有系统的扩展,但是需要做的工作仍然涉及到整个数据库管理设计的全过程。一个数据库管理系统的设计包括一系列的阶段,一般遵循以下的顺序。同时以下这些步骤也是实现此空间流数据库的过程中,主要的工作:
  (1)生成词法分析树:由抽象的查询语言生成词法分析树,这个过程是数据流管理系统实现的最初阶段。根据上节定义的空间连续查询语法,在本文的空间数据流系统中,用Yacc[7]生成查询语言的语法分析树。
  (2)语义分析:对词法分析树进行语义分析,将词法分析树转换为系统能够识别的内部表示。这一步生成的语义表示仍然不是一个操作符树。这个过程的设计主要是将空间数据类型和空间谓词转换为系统能够识别的形式,具体的实现类似于算术表达式的语义转换。
  (3)生成逻辑计划:将查询的内部表示转换为逻辑查询计划。逻辑查询计划由逻辑操作符组成。逻辑操作符大多是关系代数操作符(比如:选择,投影,连接等),当然也有一些连续查询特有的操作符(比如滑动窗口操作符)。逻辑操作符不需要和查询执行中的操作符有关,它仅仅是一种关系代数的抽象表示。
  (4)生成物理计划:将逻辑查询计划转换为物理查询计划。物理查询计划中的操作符是直接和在查询执行期间执行的操作符相关的。之所以要生成一个单独的逻辑查询计划,是因为逻辑查询计划更加容易生成,而物理查询计划涉及到底层细节。   (5)查询执行:组织存储空间的分配,物理操作符的执行等。
  5 实验
  5.1 LBS运动模型
  构造如图1所示的导航应用,移动汽车每30秒向导航中心报告当前位置信息和行驶速度并且进行空间滑动窗口的聚集查询,这里我们主要涉及count和avg聚集查询,分别计算滑动窗口内汽车数量和平均速度。移动汽车根据查询结果了解前方路况,以起到交通导航的作用。
  5.2 输入设计
  (1)MovCar
  MovCar的结构如下表所示:
  (2)SpaSliWindow
  空间滑动窗口(SpaSliWindow)数据流,该数据流包含空间滑动窗口标志信息和空间滑动窗口位置信息:
  5.3 空间滑动窗口查询设计
  上一节中构造了两个输入数据流,分别模拟移动汽车信息数据流和空间滑动窗口数据流,下面编写空间滑动窗口查询的脚本语言,该查询脚本基于前面分析的简单的交通导航应用以CQL(持续查询语言)编写,脚本文件如图2所示。
  5.4 结果输出
  注册了输入数据流,并且定义了空间滑动窗口查询之后,经过我们设计的空间流数据库模型的处理得出图3和图4所示的结果。图3所示为导航查询结果,可以看出,在61时刻的滑动窗口3内有6辆移动汽车,汽车平均速度为34.1667km/h,小于40km/h,满足查询条件,由此汽车A得知此刻前方路段交通状况差,可以采取积极的应对措施,绕过此拥挤的路段。图4所示为每个查询时刻对应空间滑动窗口内的汽车信息,可以看出,1时刻的空间滑动窗口内有移动汽车A、B、C、D、E,31时刻的空间滑动窗口内有移动汽车A、B、C、D,61时刻的空间滑动窗口内有移动汽车A、B、C、D、E、F,91时刻的空间滑动窗口内有移动汽车A、B、C,121时刻的空间滑动窗口内有移动汽车A、C。
  6 小结
  本文结合交通导航应用对数据流系统进行空间扩展,扩展了空间点和空间滑动窗口,及基于空间滑动窗口的查询操作,并依据数据库的设计步骤,实现了空间数据流系统。以导航应用为例,构造了一个基于空间滑动窗口的运动模型,通过试验分析,输出的结果均符合我们设计的运动模型。
  参 考 文 献
  [1] Sirish C, Owen C, Amol D, Michael JF, Joseph MH, Wei H, Sailesh K, Samuel RM, Fred R, Mehul AS. TelegraphCQ: Continuous dataflow processing[R]. In: Alon YH, ed. Proc. of the 2003 ACM SIGMOD Int’l Conf. on Management of Data. New York: ACM Press, 2003. 668—668.
  [2] Daniel JA, Don C, Ugur C, Mitch C, Christian C, Sangdon L, Michael S, Nestime T, Stan Z. Aurora: A new model and architecture for data stream management[J]. The Int’l Journal on Very Large Data Bases, 2003,12(2):120—139.
  [3] A. Arasu, B. Babcock, S. Babu, M. Datar, K. Ito, I. Nishizawa, J. Rosenstein, and J.
  Widom. STREAM: The stanford stream data manager[J]. IEEE Data Engineering Bulletin, 2003,26(1):19—26.
  [4] Shivanath B, Jennifer W. Continuous queries over data streams[J]. SIGMOD Record,2001,
  30(3):109—120.
  [5] 姜芳艽.DBMS与DSMS的比较研究.微计算机信息,2007.2,3:33-36.
  [6] 金澈清,钱卫宁,周傲英.流数据分析与管理综述.软件学报,2004,15(8):1172-1181
  A Model of Spatial Data Stream Systembased on Data Stream System
  Gong Piqiang,Jiang Jie
  (Jiangsu Provincial Posts and Telecommunications Planning and design institute limited liability company,Nanjing 210003,China)
  Abstract The data stream system has the characteristic of continuous query which can provide real-time data processing. The existing general data stream system does not support spatial data processing, but location based service appearntly require spatial data processing.This paper proposed the method which implements LBS applications by stream database based on data stream system from the data processing view. Futhermore, this paper expands the stream database to support spatial operation which can provide data processing for LBS applications and satisfy the requirement of LBS applications and finally proposed a model of spatial data stream system.
  Key words data stream,Spatial Continuous Query,LBS
  (收稿日期:2012年8月21日)
其他文献
我国工业化发展阶段仍处于资源消耗的高峰期,工业重型化、低端化特征明显。我国作为世界制造业大国,为世界提供了高份额的基础原材料和资源型产品,在经济增长的同时,付出了沉重的资源环境代价。我国人均优质资源短缺,对外依存度逐年加大。我国基础制造业的资源能源环境全生命周期效率与发达国家还存在较大差距,导致工业废弃物产生量逐年增加,每年20亿吨的废弃物负载极其沉重,造成了严重的资源浪费、环境污染和生态破坏。制
期刊
近日,中兴通讯宣布,中标KPN比利时(KPNGB)的核心网项目采购合同。根据合同约定,中兴通讯将在此后4年内帮助KPN比利时部署统一融合的核心网Uni-Core,实现2G/3G/4G网络的统一接入。此项目是中兴通讯继2010年9月中标KPN德国(E-Plus)核心网项目后,与KPN的再度合作。  荷兰皇家电信(KPN Telecom)是荷兰最大的移动以及固网运营商,在德国和比利时拥有移动网络,被评
期刊
6月中旬,中国将考虑对部分重要资源产品如铜、稀土等实行收储政策,并对部分稀有金属采取类似稀土管理办法措施的消息在有色金属行业内疯传。  受此利好消息的刺激,上海期货交易所的沪铜一反连日暴跌走势,当日其主力合约1 209跳空高开至收盘上涨1 320点,收于每吨54 350元。  但发改委能源研究所有关人士表示,国家近期并没有收储铜的计划。但是,有关铜的储备机制建设已经开始筹备,预计未来会和稀土一样建
期刊
河南是目前全国唯一铅冶炼产能超过百万吨的省份,总产能在160万吨左右,精铅产量约占国内总产量的30%。河南铅产能主要集中在焦作(包括济源)、安阳、三门峡的灵宝、洛阳四地,其中“铅都”焦作(包括济源)产能约100万吨,济源约95万吨,焦作沁阳约16万吨。  2011年我国铅冶炼企业产能迅速扩张,但下游蓄电池行业因环保洗礼加速整合,铅供需由短缺转为过剩。2012年产业发展面临更多挑战,采购困难、销售低
期刊
“城市矿产”是对废弃资源再生利用规模化发展的形象比喻,它通常是指工业化和城镇化过程产生和蕴藏在废旧机电设备、电线电缆、通讯工具、汽车、家电、电子产品、金属和塑料包装物以及废料中,可循环利用的钢铁、有色金属、稀贵金属、高分子材料等有价资源。自1971年美国学者斯潘德洛夫提出了“在城市开矿”的口号以来,其概念和内涵不断丰富发展,至今已形成国内外广泛关注的新兴产业。  “城市矿产”作为一种载能性、循环性
期刊
瑞典从1984年开始,国会立法批准正式实施易拉罐回收和保证金制度,在成功地实施了易拉罐回收保证金制度之后,国会又于1993年立法批准建立饮料塑料瓶的回收保证金制度,并于1994年开始实施。2011年回收率达到88.8%,其中易拉罐回收了13 800吨,塑料瓶回收了19 060吨。  在瑞典,RETURPACK负责该机制的全部回收、处理、保证金的收取、支付和财务运作及协调业务。RETURPACK(全
期刊
我国有色金属行业发展迅速,2011年10种有色金属产量达到3 438.29万吨,为2000年产量的4.4倍,年均增幅14.4%。有色金属行业在规模不断扩大的同时,资源短缺、能源高消耗和环境污染等问题也日益突出,已对行业可持续发展构成了严重威胁。  目前,我国有色金属原料以矿产资源为主,大部分金属资源禀赋差,大多属于金属品位低、选冶难度大的复杂矿物资源。长期以来,我国大宗有色资源主要依靠进口,如20
期刊
6月19日,中国再生资源产业技术创新战略联盟一届四次理事会暨高层论坛在云南省昆明市召开。中国再生资源产业联盟专家委员会名誉主任、中国工程院院士黄崇、中国科学院院士沈保根,工业和信息化部节能司王孝洋副处长、环境保护部科技标准司姜宏调研员,中共昆明市委常委、副市长朱永扬、中国再生资源产业联盟秘书长王吉位、副理事长李士龙出席会议。中国再生资源产业联盟理事会成员、专家委员会委员、行业企业、科研院所和高校等
期刊
应对稀土价格上涨压力  全球流化催化裂化催化剂生产商正在努力克服稀土镧和铈价格大幅上涨带来的压力。全球流化催化裂化催化剂大量应用了含稀土分子筛的材料,稀土价格暴涨造成这种催化剂生产成本增加,大幅挤压了生产商的盈利空间。据行业数据显示,2011年一季度,轻稀土中的主要元素氧化镧和氧化铈国际市场价格上涨了500%,氧化钇价格涨幅为347%,氧化铽涨幅124%,氧化钐涨幅168%,氧化镨涨幅141%,氧
期刊
按照国家科技部等六部门印发的《关于推动产业技术创新战略联盟构建的指导意见》,中国再生资源产业技术创新战略联盟于2009年10月27日正式成立。中国资源综合利用协会会长、中国铝业公司总经理、党组书记熊维平担任联盟第一届理事长。中国工程院徐滨士院士、黄崇祺院士、左铁镛院士、钱易院士、张文海院士、张懿院士、邱定蕃院士、孙传尧院士、中国科学院沈保根院士(按年龄排序)担任联盟专家委员会名誉主任,负责制定联盟
期刊