云计算 频道

2011-12年 中国Hadoop应用趋势调查报告

  3、 Hadoop在企业内部的应用现状

  3.1 贵单位平均每月有多少新增加的数据?

Hadoop在企业内部的应用现状

  调查表明,28%的企业每月有500GB的新增数据,11%的企业每月新增数据量在100GB到500GB之间,这也说明了企业的数据量的增长速度十分迅速,急需一个海量数据解决方案,这也促使企业开始思考,如何从企业固有的数据中去挖掘新的价值。

  3.2 贵公司是否在使用或者考虑使用Hadoop来做大规模数据分析处理?

Hadoop在企业内部的应用现状

  在参与调查的用户中,有超过半数(51%)的用户已经在使用Hadoop,有将近1/3的人计划在半年或一年之内部署Hadoop,这表明,Hadoop的市场需求很大,这也必将导致越来越多的厂商加入到Hadoop的市场竞争中,从而逐步完善Hadoop的商业圈。

  3.3 贵单位的Hadoop集群有多少个节点?

  调查表明,集群数在100个企业以上的占了21%,Ha

  doop集群呈现大规模的趋势,表明Hadoop的应用在大型企业的应用比较多。30%的受调查者所在企业的Hadoop集群数不超过5个,这其中包含了没有Hadoop集群的企业,而这部分人都在关注着Hadoop,这意味着,Hadoop未来的发展空间十分值得期待。

  3.4 贵单位有多少开发人员在使用Hadoop?

Hadoop在企业内部的应用现状

  企业使用Hadoop集群的开发人员10人以上的超过了1/3,绝大部分企业的Hadoop的开发人员都在4人或以上,这从一个角度反映了Hadoop应用所需要的成本,尤其是人力成本,是企业所必须要考虑到的因素。

  3.5 贵单位每天有多少个Hadoop任务在运行?

Hadoop在企业内部的应用现状

  运行在Hadoop上面的任务数量基本上(62%)都在10个以内,但也有部分(29%)的企业每天有50个以上的Hadoop任务在运行。

  3.6 贵单位有多少数据存储在Hadoop集群中?

Hadoop在企业内部的应用现状

  5000GB以上的占了26%,这意味着,Hadoop对于数据量巨大的企业来说是一个很好的选择,数据量越大,Hadoop相比企业平台的效率越高。

  3.7 贵公司使用Hadoop的主要用途是什么?

Hadoop在企业内部的应用现状

  调查表明,企业使用Hadoop最主要的目的是数据挖掘和改善商业智能分析,有一半以上的企业使用Hadoop的主要目的之一是数据挖掘和改善商业智能分析;其次是日志分析、WEB搜索,以及降低数据分析成本,所占的比例分别为38%和31%,同时,还有26%的企业使用Hadoop的目的之一是半结构化/非结构化数据处理与分析。

  综上所述,商业智能和数据挖掘、半结构化/非结构化数据分析与处理是推动Hadoop在企业内应用的两大重要的动力。

  3.8 贵单位已经使用了哪些Hadoop相关技术活工具?

Hadoop在企业内部的应用现状

  调查表明,HDFS、MapReduce是企业企业在使用Hadoop架构的两种最主要的技术,其使用率分别占了74%和69%,这意味着基本上使用了Hadoop框架的企业都使用了这两种技术,这也反映了国内对于这两种技术的使用已经达到了一个比较高的水准;同时,Hbase、Hive都有超过三分之一的企业在使用。

1
相关文章