云计算 频道

向巨头学习:如何应对海量数据的挑战?

  【IT168 专稿】第三届中国云计算大会于2011年5月18-20日在北京国家会议中心圆满闭幕,本次大会以探讨云计算的应用之路为宗旨,针对当前云计算的热点话题,设立了9个主题论坛。在20日下午的 “云计算中心技术架构”主题论坛上,来自百度首席科学家威廉·张、RackSpace CTO John Engates、Yahoo!北京全球研发中心架构师韩轶平、SAP中国区企业信息管理资深顾问杜韬就“应对海量数据库的”这一话题进行了深入的探讨。

  随着物联网、社交网络等新的互联网技术的发展,在为人们带来便利的同时,也产生了大量的、结构化的非格式化的数据。如何通过数据挖掘,从海量数据中获得有用的信息,为用户提供好的用户体验,增强企业的竞争力,这对企业来说是一个挑战。

各巨头的数据量级大曝光
▲图1 圆桌论坛:如何应对海量数据挑战?(从左至右:主持人、百度首席科学家威廉.张、RackSpace CIO John Engates、Yahoo!北京全球研发中心架构师周轶平、SAP 中国区企业信息管理资深顾问杜涛)

  各巨头的数据量级大曝光

  百度威廉.张表示,“数百PB,每一天需要处理的数据是数十个TB,许多数据要在几秒钟之内处理,很多数据在几分钟之内要处理,更多的是几个小时之内处理就够了,几个小时处理数十个PB的数据,也是很困难的。所有的策略都是针对实时性和数据处理的时效性理来做的。互联网用户的需求是更加实时,如微博、团购、秒杀等,所以说实时处理十分重要。”

  Yahoo!周轶平谈道,“雅虎的云计算平台综述超过三万台机器,最大的超过4000太左右,总存储容量超过了100PB。”他表示,雅虎最近放了很多精力在保护用户的隐私和数据安全性上,欧盟规定雅虎不能够存储用户的数据超过一百天,虽然不能保存,但是雅虎做很深入的数据挖掘,从数据瓦局得到一些真正有价值的信息,并把这些信息保存下来。”

  SAP杜涛也介绍了其需要帮助客户处理的数据量的级别,“SAP作为企业级应用的提供商,更关注客户的数据量是多少,这些客户包括中小型企业到大型的客户,其中有数据密集型的企业,如电信、金融、政府、零售等等,客户的数量级包括从几个TB到数百个TB。”同时,SAP自己有一个很大的数据中心,主要是为SAP的客户提供服务,有三万台服务器,数据量大概是15TB并且有越来越多的客户的数据会在SAP的数据中心。

0
相关文章