应该重新划分数据类型

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:dddff628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  这次,我想谈谈我对未来核心存储技术的一些基本看法。
  首先,我知道这篇文章可能会引起一些观点上的争论。但我认为,EMC作为一个以客户为中心的公司,现在和以后都会以提供市场需要的技术和解决方案为己任。不要以为我们公司会仅仅因为我的预言就停止生产某种产品了,我们所采取的行为永远都是基于需求的。
  在开始谈论存储需求之前,我想先说说我关于数据和信息需求发展情况的观点。因为数据就是存储的“客户”,所以,要了解存储的发展方向就必须从数据说起。
  我认为,未来的数据世界依然是分为两种类型。以前我们一直分为结构化数据和非结构化数据,但是事情并非这么简单,因为现在人们必须行动起来,在他们的非结构化数据中添加一些结构化的成分,这样才能使这些数据更便于使用。换句话说,数据和信息正在变得更加结构化。因此,这些术语已经不再适合形容这些数据类型了。而且,我认为关于数据的分歧将越来越依赖于我称为单事务处理时延的需求。现在OLTP(联机事务处理)系统已经有了这方面的需求,其事务处理性能对相关的存储系统是一个极为重要的属性。单事务处理时延至关重要是因为大多数OLTP系统的操作都只与单个关系型数据库相关,这主要是出于一致性方面的考虑。在这种情况下,总体带宽和I/O容量就没有时延那么重要了。这就像只有一个收费站的高速公路,收费站的性能很大程度上决定了系统的总体性能。
  上面这种数据类型我称之为OLTP数据,大量的其他信息(估计現在已超过70%,而到2010年将上升到95%)可以划归为另一种类型—我称之为Web数据。这种数据与前一种类型数据定义的区别在于,单事务处理时延并不是最重要的因素。比如说,一次Web搜索大概花费半秒钟的时间,人们会关注究竟是花了0.45秒还是0.55秒吗?当然不会。既然多个搜索可以并行执行,那么这里需要的就是聚合性能。在高速公路上,也许收费站都很慢,但由于有很多个,那就不会成为瓶颈了。
  我认为我们将要看到的变化是非结构化数据会变得更加结构化。显然,使用传统关系型数据库是不行的,使用传统数据库的应用程序无法约束这些孤立Web数据。因为这些结构可能是来自标签、索引、元数据或者定义本体的对象结构的。
  我们最近获悉一家名为XHive的公司开发了一些很不错的技术。其中最有意义的是,XHive开发了XML数据库技术。这样,结构化数据的关系型方式更加灵活,而不受使用私有数据库结构的约束。
  关于这些数据类型,可能又会有无穷无尽的需求,这些需求可能是关于性能、可靠性或信息等方面的,将会推动存储和信息生命周期管理不断发展。那么我为什么只从一个属性来定义新的数据类型呢?原因很简单,就是对于OLTP系统来说,交易处理时延的需求能够优化存储体系结构的发展。而对于Web数据,其体系结构的发展由更多的系统需求来推动。
  尽管以后将有无数的数据类型和需求,但首要的目标依然是:在可预见的未来,存储体系结构需要满足两种数据类型的基本需求。过去,我们划分为结构化数据和非结构化数据;而现在,我认为划分为OLTP数据和Web数据更加恰当。
其他文献
在人们的印象中,苹果的MP3产品既叫好,又叫座,已经成为时尚一族竞相追捧的必备装备;苹果的台式电脑和笔记本电脑,虽然出色的设计也是令人爱不释手,但其在国内市场的份额,远远无法和苹果MP3在数码领域的领导地位相媲美。  在MP3产品在国内市场站稳脚跟后,苹果开始向电脑市场发起了冲锋。  近日,苹果与国内最大的IT直营连锁零售企业—宏图三胞正式联姻,双方就开展中长期战略合作等事宜达成共识。双方将借助宏
山东大学集群系统存储架构拓扑图  前不久,浪潮天梭高性能计算系统与中国象棋界顶尖高手的对局吸引了无数人的眼球。高性能计算又成了万众瞩目的焦点。以前,一提起高性能计算系统,人们往往会首先联想到军事、科学研究、气象、地理等方面的应用,更多关注的是其突出的计算能力。其实,高性能计算系统涉及整机构架、存储、通信、安全等多个技术模块,而随着数据量、计算节点的增加,存储系统承受的压力也越来越大。  高性能计算
V2 Conference视频平铺布局    每年数以百万计的电子产品在被消耗的同时正造成巨大的环保问题,每年各种文山会海正在给企业带来巨大成本压力。面对这些问题,最好的解决之道是什么?  2005年,对于正大投资有限公司而言是个收获的年份。通过采用覆盖集团的网络视频会议系统平台,公司销售人员坐镇北京公司便可运筹帷幄,与分支机构人员和客户实现高效畅达沟通。并且这种沟通还避免高成本投入,兼顾了环境保
即将流行的闪存硬盘能够做到超高的数据读取速度、轻薄的体积和安静的工作状态。  你是否对电脑漫长的开机等待时间感到厌烦?你是否经常看到硬盘灯正在狂闪而电脑的反应却越来越迟缓?一项革命性的技术——闪存硬盘有望改变这些问题,它利用闪存代替传统的硬盘,数据读取速度达到传统硬盘的10~30倍,而且体积可以做到接近U盘。更重要的是,闪存硬盘没有机械结构,因此没有传统硬盘读写磁盘时发出的“咯咯”声。  闪存硬盘
扑面而来的SaaS热潮,让一些企业先行投身到SaaS之中。它们目前的运作模式孰优孰劣?  SaaS的火热,有点像当年互联网的架势。中国计算机报调查发现,尽管大部分的企业用户都还缺乏对SaaS的了解,传统软件供应商、互联网公司乃至政府机构等仍然纷纷投身到SaaS这一产业的洪流中。  也许正如互联网的发展轨迹那样,经过几年的沉浮,一大批先烈会倒下,而一小部分幸存下来的企业则能够从中获取巨大的发展空间。
IT产业的变革对渠道商的发展产生了巨大影响    激烈的市场竞争、多变的市场需求,使IT渠道发生了剧烈的变化。传统的线性为主、层次分明的主流渠道模式已逐渐被以客户为中心的渠道模式所代替,整个渠道价值链正向服务和增值型的方向迅速转型。这种转变势必引发IT渠道的利益再分配、策略调整等问题。近些年,国内IT渠道商的盈利能力已明显减弱,成千上万的IT渠道商面临大浪淘沙、重新洗牌的危险。  该变革对厂家、分
2007年8月16日,IBM宣布对Solaris提供更广泛的支持,同时宣布对部分基于Intel x86架构的服务器提供资金支持。昔日的对手从竞争走向竞合,将会给市场带来多大影响?且听竞争双方和Gartner的见解。  IBM对Solaris的扩展支持最初仅限于两个刀片服务器(HS21和LS41),以及三个机架式服务器(x3650、x3755和x3860),同时计划扩展此范围。用户能够从这些IBM
CIO對部分新概念的了解情况    CIO对新概念的态度    CIO的采购决策意愿  面对层出不穷的新概念,CIO们可谓几多欢喜几多愁。一方面,伴随新技术衍生的新概念,为CIO提供了更多的技术选择;另一方面,一些厂商不断提出新名词,实质上不过是新瓶装旧酒,而狂轰乱炸的推销和宣传让CIO不胜其烦。那么,作为企业信息主管的CIO们,他们有了解新概念的意愿吗?他们愿意尝试新概念吗?本期调查围绕这一话题
闵毅达不断地重复戴尔2.0的概念,而这个概念似乎跟时下很多的2.0都大相径庭。  地点: 北京丰联广场5层  人物: 戴尔(中国)有限公司中国及大中华区总裁 闵毅达  中国计算机报社执行总编辑刘保华  时间: 2007年7月25日下午  在采访之前,闵毅达先用笔记本“秀”了一下戴尔在各大主流媒体上新推出的广告:五彩缤纷的戴尔笔记本让人眼花缭乱。戴尔的“变色”跟近期推出的戴尔2.0战略有着密不可分的
如果说在店铺栉次鳞比的电脑城里,我们看到的是惨烈竞争的硝烟战火,那么在广州IT服务店里看到的则是一派悠闲的田园风光。“比起电脑城,这里的利润率高,日子过得也滋润。”一位社区店的经营者曾经向记者发出过这样的感叹,伴随着国内城市社区规划逐步成熟,经历了第一轮竞争洗礼之后的IT社区店正在远离电脑城的社区里享受着一片宁静的天空。    应该说,“IT社区店”并不是一个新的概念。早在1998年,致力于渠道创