云计算 频道

英特尔专家:云计算大数据的分析与挑战

  人类数据的特征──不确定性

  然而,开发演算法的噩梦还不仅限于要从这么多独立使用者和个别设备中对数据进行排序,Bell表示,更重要的是,你必须牢记,有些数据根本就不是真实的。

  她以一份在美国进行的研究为例指出,在该研究的调查对象中,几乎100%在个人数据中都谎报了约会地点。那么,如何对这些虚构的数据进行排序,而且让结果呈现出非常人性化的观点呢?

  “因此,目前人类和机器设备们都会建构数据,但我们会需要演算法来协助建构更有用的数据,”她表示。

  “数据基本上只是由0与1组成的字串,这很容易想像,而你所要做的,只是找到适合的工具,尽可能去发挥这些数据的作用。但如果我们停止思考,那么数据将成为一堆难以想像数位符号。所以,我们要开始想像数据的轮廓,去想像经过处理后,它将会呈现出什么样的结果,”她说。“我们正试着以这些数据集为基础提出建议,但我们却无法假设所有数据都100%是真实的。”

  此外,Bell指出,随着数据使用者的数量不断增加,他们对数据的期望也愈来愈高,这些人会希望每一个故事、每一个当下、每一个所产生的数据,都能得到相应的处理。

  另一个问题,则是这些数据是否需要被打理得很好,关联性很强?或是能以散乱型态呈现?

  随着设备、服务、应用程序迅速增加,我们处理数据的经验也快速累积,同时,随着云计算系统不停增加,大数据的概念也正不断成长,Bell说,这也意味着在数据量持续增长的同时,我们将面对一系列崭新的挑战。

  但所有这些问题都能得到妥善答覆吗?或是目前我们仍然未能触及问题核心?Bell表示,大数据代表了“令人难以置信的庞大商机”,它不仅仅是字面上极庞大的数字,它还将对今天的系统架构师、工程师、设备制造商和使用者带来深远的影响。

0
相关文章