云计算 频道

Hadoop:全球热恋

  技术小贴士

  eBay的Williams为大家提供了以下秘诀:

  通过学习Hadoop的组织结构来学习如何有效管理Hadoop。 “如果你的企业有很多人在使用Hadoop集群,他们可能会尝试一次性做很多相同的事情,”Williams表示,“这意味着他们可能会产生相同的中间数据,这是一种浪费。”

  他建议,一天运行一次通用数据查询,并将结果保存在一个地方,让需要的人可以使用,这样做可以节省大量处理时间和相关资源,“仔细想想哪些数据集对于你的用户是很有用的,然后创建这些数据集。”

  清理你的Hadoop集群是关键的维护工作。 “这真的非常重要,”Williams表示,“你可能需要运行大量Hadoop工作,创建大量数据,通常情况下,通过文件来处理工作的用户会一走了之,这对于用户很常见,如果你这样做的话,你最终将会面对大量额外的Hadoop文件。”

  “所以你需要制定一个策略以保持Hadoop集群的整洁,这样就不会超出磁盘空间。让用户清理出他们不需要的东西。如果你有一个大型Hadoop集群,定期清理是非常重要的。”

0
相关文章