说说大数据的三个“不是”

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:qq12433184000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  有人说,大数据是个谎言;有人说,大数据是个伪命题。
  大数据市场确实存在。Gartner预测,到2015年,70%的信息基础架构扩展与投资的主要驱动因素是业务分析需求。以前,人们把精力主要放在如何存储好海量的数据上,而没有想到深入挖掘数据的内在价值。随着数据与业务之间的关系越来越紧密,以及一些大数据分析工具不断涌现,数据分析成了企业决策的前提。
  大数据不一定是复杂的分析
  许多人一提到大数据,首先想到的是复杂的数据分析。这让有些希望采用大数据分析工具的用户产生了畏难情绪,也让有些用户产生了误解,认为大数据分析只是那些拥有复杂业务流程和海量数据的大企业的事。市场研究机构麦肯锡的研究人员表示:“要创造新的重大价值,并不一定要采用复杂的大数据分析方法,有时只要能保证数据的可用性或对数据应用进行基本的分析,就能获得所需的重要价值。”
  不同的企业或一个企业内部不同的部门对数据分析和数据价值的理解都不相同。企业处于不同的信息化发展阶段,也会设定不同的数据分析目标,采用不同的数据分析工具。正是基于此,戴尔率先提出了大数据成熟度模型。戴尔公司全球企业级解决方案副总裁Cheryl Cook表示:“这一模型已经得到了业内许多分析机构的认可。所有行业以及所有数据应用都适用于此模型。”
  如下图所示,大数据成熟度模型分成五个阶段。第一个阶段,数据处于混乱状态,数据存储无章可循,数据难以访问,企业的信息系统处于高风险状态。第二个阶段,实现数据的保留。在这个阶段,企业被动地对数据进行存储。数据虽然经过一定的处理,但还不具有高质量,数据的访问也会受到一定限制。第三个阶段,实现存储的优化。在这个阶段,通过对存储系统的进一步优化以及基于策略的控制与管理,用户可以逐步发现数据的价值。第四个阶段,实现简单的分析。在存储优化的基础上,用户可以进行数据建模和简单的数据分析,对归档数据进行搜索等。第五个阶段,实现复杂的分析。在这个阶段,大数据分析工具将得到充分应用,用户可以进行比较复杂的建模、分析和决策。经过上述五个阶段,曾经杂乱无章的数据也将经历从数据到信息再到知识的转变过程,最终成为企业决策的重要依据。
  这个大数据成熟度模型可以解答人们对于大数据应用的几个疑惑。第一,用户使用大数据分析工具,并不意味着一定要进行复杂的分析。举例来说,处于存储优化阶段的用户就可以实现无障碍的数据访问,并能获得所需的数据价值。第二,大数据的应用要经历一个逐步完善的过程,必须循序渐进,先做好数据存储和优化,然后再进行数据分析。第三,大数据解决方案通常包括两个部分:一是大数据保留解决方案,二是大数据分析解决方案。将两类解决方案有机地结合在一起,才能有效降低大数据分析应用的成本,更好地挖掘数据的价值。Cheryl Cook表示,戴尔可以提供上述两种解决方案。一方面,戴尔可以提供针对结构化和非结构化数据的大数据保留解决方案,主要包括存储虚拟化与整合、应用程序优化、数据保护、灾难恢复以及数据保留与管理解决方案;另一方面,戴尔还能提供支持Hadoop、Cloudera等开源软件的大数据分析解决方案。
  记者曾与包括大庆油田、太平洋保险公司等在内的一些用户进行过交流。它们目前都没有计划部署大数据应用。“从全球范围来看,大数据应用还处于起步阶段。”戴尔亚太及日本地区商用事业部企业解决方案副总裁Philip A. Davis表示,“与云计算兴起时一样,可能要经过两三年的市场培育,用户才能逐渐接受大数据应用。”
  中国东方航空股份有限公司信息部总经理严振红介绍说:“在大数据的概念出现以前,我们就在做客户数据、经营数据的分析工作。但是客户数据库、经营数据库等都是相互独立的,数据不能共享。现在,我们要做的是将这些系统的数据整合起来,统一进行分析。”
  Hadoop不是万能的
  简单来说,Hadoop是一个能够对大量数据进行分布式处理的软件框架。Hadoop最独特的优势在于为用户提供了一个分布式的、高容错的文件系统和加速数据处理的办法。随着Web 2.0、社交网站的大规模兴起,人们需要一个高效的处理非结构化数据的平台。Hadoop正好可以满足人们的需求。有些人甚至在Hadoop和大数据之间划上了等号。Hadoop能够解决大数据应用的所有难题吗?
  “Hadoop是一个复杂的工具套件。如果没有厂商或专业技术人员的帮助,用户自己部署Hadoop是一件十分困难的事。目前,Hadoop的应用并不普及。互联网用户是最早采用Hadoop平台的。”Philip A.Davis表示,“如果想让大数据解决方案充分发挥其作用,就必须搭建一个高效的信息基础架构,实现信息基础架构的自动化、智能化,同时提高其可管理性。”
  Hadoop的应用是有一定技术门槛的。如今,许多IT厂商都推出了基于Hadoop的解决方案包,其目的是帮助用户简化Hadoop的部署与应用。Philip A.Davis表示:“戴尔提供的基于Hadoop的大数据分析方案可以将Hadoop的部署周期从原来的两个月缩短至两天。”
  VMware全球高级副总裁范承工也认为,由于缺少精通Hadoop技术的专业人才,Hadoop的部署对于用户来说是一件费时费力的事。如今,VMware可以将Hadoop部署在虚拟化架构之上,将部署工作从半自动化变为全自动化,从而减少了人工干预,使得Hadoop的部署变得更加简单,也不容易出错。
  “很多中国企业的CIO认为,大数据解决方案是有价值的,但实施起来确实有许多困难。”戴尔全球副总裁、中国区大型企业及公共事业部总经理容永康举例说,“国内懂得在Hadoop上进行开发的专业技术人员非常少。一些金融行业的用户很想现在就部署大数据解决方案,但是苦于找不到既懂Hadoop技术,又懂得金融业务的专业人才。”
  Informatica首席技术官James Markarian表示:“在IT环境中,Hadoop不可能作为一个孤岛存在。为了让Hadoop跨越不同平台,用户需要将Hadoop作为其IT大环境中的一部分来管理,并通过Hadoop重复使用他们的开发技巧、资产及数据,同时还要统筹管理全部数据。”
  在美国市场上,70%的大数据应用处理的还是结构化的数据。从技术的角度看,虽然Hadoop也能处理结构化的数据,但是目前基于Hadoop的大数据分析解决方案主要还是用于处理非结构化的数据。因此,用户处理结构化数据和非结构化数据通常是用两套不同的分析工具。这种混合的大数据处理模式是一种普遍现象。
  从未来的发展看,非结构化数据的快速增长是大数据分析的主要驱动因素。从这个角度讲,Hadoop的应用前景还是十分广阔的。
  大数据不仅仅是一个解决方案
  Cheryl Cook强调说:“用户千万不能认为,只要购买了一个大数据的解决方案,就能解决所有的问题。许多中国用户还没有充分意识到数据能够带来多大的价值。戴尔收购佩罗系统公司,增强了自身的顾问咨询能力,可以帮助客户分析数据能够带来什么样的价值。这为用户日后正确部署大数据解决方案奠定了基础。”
  有些厂商通过收购或其他方式,很快就推出了大数据解决方案,并将这些解决方案推销给客户。Cheryl Cook表示:“戴尔先从客户的需求入手,帮助客户分析当前遇到的实际问题是什么,然后进一步明确客户能从数据中获取什么样的价值,最后才是提供量身定制的解决方案。”戴尔大数据解决方案的特色在于开放化和多样化。戴尔既可以提供基于开源软件的大数据解决方案,也可以提供支持微软、SAP等软件的大数据解决方案。针对Hadoop平台,戴尔还能提供一些附加的服务,目的是为了让Hadoop平台能够满足客户的个性化需求。在部署大数据解决方案之前,用户首先要搞清楚,能从大数据解决方案中获得什么样的价值,然后再制定具体的实施规划,接下来就是构建高效的信息基础架构,最后才是部署大数据分析工具。
其他文献
嵌入式系统正在向智能系统发展。成千上万的嵌入式设备借助无线网络,将数据(包括文字、图像、音频、视频等)传输到云端,而这些被人们冠之以大数据的信息在被分析之后,可为企业带来优化资源配置、管理简化、成本节约、竞争力提升等诸多裨益。  嵌入式应用遍地开花  中国民生银行为创新业务发展,希望ATM、客户终端以及专用设备之间能互联互通。他们选择Windows Embedded和微软的.net开发环境开发出了
2010年,Groupon全球扩张,在全球200多个市场拥有超过4000万注册用户,并且拒绝了来自互联网巨头谷歌的收购要约。在新一轮融资中,投资者对其估值将达到78亿美元,Groupon可谓2010年互联网界最大的一匹黑马。  然而,即便业绩斐然,Groupon并不能够在2011年有半点轻松:互联网巨头对其虎视眈眈,Facebook、Twitter等合作伙伴的业务扩张造成威胁,同行业成长起来的追随
“可以说,一开始的超极本概念并不适合中国用户。”谈到超极本的演变,海尔电脑笔记本事业部总经理路凯林如是说。  8月中,海尔电脑推出了旗下7G系列的新一代产品,其中的7G-5s是一款游戏超极本。同时发布的还有带有光驱的7G-5等产品。与此同时,为了凸显7G-5s的性能优势,海尔还和盛大合作,推出了《永恒之塔》限量版7G-5s。  超极本的革新  “一开始的超极本大都以极致轻薄作为出发点,这样的产品确
从2009年下半年开始,“三网融合”成为继3G、物联网之后的又一个热点。它描绘了一副美好的画面:在电视上可以玩网络互动游戏,在电脑、手机上也可以及时收看电视节目并点播高清电影,电脑、电视、手机的功能界线越来越模糊。2010年7月,工业和信息化部公布了首批三网融合试点城市名单,至此,三网融合在中国正式启动。    融合业务发展提速    目前,三网融合大规模开展的业务主要包括数字电视、IPTV、手机
创新是一个非常广泛的话题,包括技术创新、业务创新、管理创新等多种创新活动。在此,我根据自己平时的观察和在IT相关行业工作的一点经验,就企业的技术和产品创新这个话题,选出几个我认为比较重要的问题来讨论。  这几个问题看上去都非常简单,大家甚至早就有普遍共识。可是,最简单的问题常常是最难说得清楚的,而且未必得到了很好的认识和理解。    一流的企业制定标准?    最近几年,制定行业标准成为了中国企业
IDC的数据显示,从2009年到2012年,中国云数据中心基础设施市场的增长速度是世界平均增长水平的三倍。云计算已经成了IT业界和用户最关注,同时也是投资最多的领域之一。英特尔公司数据中心及互联系统事业部云计算市场总监Raejeanne Skillern表示:“云计算、高性能计算和大数据将成为增长最快的三个细分市场。英特尔在相关产品和解决方案,以及生态系统建设方面已经做好了准备。”  英特尔的云计
一个大规模生产、分享、应用大数据的时代正在开启,大数据分析意味着企业能从这些新的数据中获取新的洞察力,并将其与已知业务的各个细节相融合。企业分析的数据越全面,分析结果越接近真实。那些没有引入新的数据分析技术和新的数据类型的企业,不太可能成为其所在行业的领军者。全球领先的独立企业数据集成软件提供商Informatica认为,从数据架构模型分析入手,化繁为简,通过成熟的平台方式进行数据分析、数据集成,
平板电脑让地图活起来  “平板电脑上的地图要做成活地图,使其从人们找不到路才会用一次的工具变成人们每天都要用的一项应用。”高德软件有限公司副总裁郄建军认为。平板电脑所具备的特性,给软件开发带来了新的空间。他举例说:“平板电脑上有陀螺仪,将其和导航软件结合起来,可以使导航体验更加流畅。从前过隧道的时候,GPS信号被屏蔽,就无法继续导航,而利用陀螺仪,平板电脑可以利用车速和方向继续为车辆定位,直到离开
量化IT价值、从成本中心向利润中心转变,是每个CEO对企业IT部门的要求和期许,也是每个CIO的工作动力和努力方向。但指标难量化、标准不统一、结果无实效等绩效考核自身的痼疾再加上IT管理工作本身的复杂性,让IT的绩效考核成为管理的死角。  探索中的IT绩效管理   关于IT价值的这笔账并不好算。我们可以用签单金额、回款情况考核一位销售人员,会用全年收入利润值衡量一位财务总监的价值所在,但如何从I
作为一名行政人员,如果有人问你对一款笔记本电脑有什么要求,你会如何回答?你可能会考虑到笔记本电脑的综合性能。但如果是问一名销售人员,他可能需要一台便携性够好而且续航够给力的笔记本电脑;如果是设计人员,则需要一台拥有强劲性能和高效显卡的笔记本电脑;对于企业IT采购人来说,一台高性价比并且节能环保,能有效降低企业运营成本的笔记本电脑或许是他的首选。  有没有一款笔记本电脑能够解决企业不同岗位员工对它的