云计算 频道

英特尔专家:云计算大数据的分析与挑战

  云计算的物理特性和“野性”数据概念

  Bell认为数据本身属性即具备繁殖(ferality)或复制(reproductive)能力。“数据并不会永远依照算法或输入时的顺序整齐排列,在经过云计算和其他控制机制后,数据会产生何种变化才是重点所在,因为我们都会尝试着去控制这些本身即具备“野性”(feral)的数据,”Bell说。

  事实上,Bell举例道,将同一类型的数据全都放在同一种类别中,像是将兔子或其他繁殖力极强的动物放在一起,或许能做出初步有的有效分类。她也指出,由于数据可以很容易地在各个类别间转移,或是完全转移到另一种类别,因此上下文(contexts)也可以很容易地转移,这或许能让人们试着去管理数据,或是减少这些数据的增殖情况。“在数据世界中,去思考这些策略,是相当有趣的一件事,”她若有所思地表示。

  数据的另一个特性在于,尽管数据大多具有明确概念(conceptually),但却也难以捉摸。例如,“云端”事实上仍需要许多实体建设。“云计算最终都会有一个实体机房。云计算数据中心必须是一个实体建筑,其中设有服务器,”Bell强调了实体建设的重要性。

  Bell同时强调,云计算并不是特殊的概念。“我们思考的不只是单一的云端系统,我们在想的是许许多多的云,以及成千上万的实体设备,包括进行数据分析的数据中心(server farm)在内,对我来说,所有这些实体设备,都是研究大数据过程中的关键部份,”她表示。

  而这也对大数据的研究提出了诸多问题,包括最终数据是否会无处不在?数据中心该设置在何处?这些数据该由何地的何种法律来管辖?采用何种网络运作?以及如何提供和将提供何种服务?

  同时,这也让人们开始思考,是否每件事或每个人都会产生数据,抑或是像William Gibson对网路空间(cyberspace)所下的注解:“未来已然来临,只是还未广为人知。”(future was already here but unevenly distributed)

  Bell认为,数据将会在各种地方以不同的方式出现,但并非所有情况下的数据都是有用的。“你可以轻松地和苹果(Apple)的Siri对话,看起来这个语音管家似乎颇具智能性,但基本上我只觉得那是一连串毫无意义的对谈,”她说。

  再者便是如何处理旧设备和旧数据,这些数据可能尚未数字化,如何处理它们并以新型态来呈现都会是一大问题。

  “愈来愈大量的数据不断地产生出来,但这些数据并不一定出自人类之手,”她指出,即使静态数据有可能经过处理转变为动态资讯,但在相反情况下却不一定会出现同样的结果。

  在全球各地,物联网(Internet of things, IoT)应用模式都正在发酵,从交通号志灯到汽车、冰箱、除草机,到固定电话、平板电脑、笔电和电视,所有的装置都会产生数据,但将来这些数据未必会适合每一个独立的使用者,Bell说。

  例如,有些家庭会共用电话;一些家庭成员在白天工作时使用自己的平板电脑,但夜间或周末时则让给他们的孩子使用。“我们要如何排序数据,才能得知有多少使用者共用一部设备?”Bell表示,这让数据排序成为更艰难的任务。

 

0
相关文章