云计算 频道

vForum 2011:图解vCops虚拟云管理应用

  【IT168 专稿】10月26-27日,VMware Forum 2011中国用户大会在北京召开,作为全球虚拟化解决方案的领导厂商,VMware每年都在vForum上为中国用户带来虚拟化和云计算领域的前沿技术,并引领虚拟化行业创新风潮。请关注IT168 vForum2011大会视频直播专题

  26日下午,在云计算基础架构—管理和运营分会场中,VMware技术讲师向我们详细介绍了最新版vCenter Operations案例分析与功能演示。

  根据介绍,斯坦福大学医学院已经有4年虚拟化应用历史,虚拟化架构环境如下:

  服务器:310 VMs on 21 ESXi hosts
  存储:20Tb NFS datstores replicated on campus, DR site
  网络:10Gb ESXi upgrades are 75% complete

  由于斯坦福大学虚拟化应用历史较长,所采用的虚拟化管理软件也纷繁复杂,包括Zabbix,Cacti,Big brother,这些虚拟化管理软件提供了25930个静态阀值的监控度量目标,使得在系统环境中定位问题的根源变得极为复杂。

vForum 2011:图解vCops虚拟云管理应用

  在我们前面的介绍vForum2011:vCops将虚拟云管理化繁为简一文中,我们已经介绍过,基于静态阀值的传统的管理工具往往会有多项具体的考量指标,针对每一项指标会有一个阀值,当超过阀值之后系统会给出相应的报警信息。以一个交易型网站为例,当某项商品正处于热销期,产生的工作负载其实极有可能超过原先预设的阀值,但这种情况却并非系统的故障,系统仍然会给出相应的出错信息。这种情况带来的问题就是,基于静态阀值的管理系统会产生大量的纷繁的信息,真正有价值的信息反而无法引起管理员的重视。

  如何才能过滤掉25830个静态度量中的噪音信息,并快速定位到关键问题上呢?

  vCenter Operations的管理系统则结合了衍伸指标和动态阀值的各种信息,并定义了CPU、内存、IO等第一级指标,优先考虑从第一级度量分析问题,从而降低误报的可能性,并提供了智能方式过滤噪音信号,系统管理员就能够在短期内,管理工具的高层次度量发掘底层问题根源。

vForum 2011:图解vCops虚拟云管理应用

  这是一个SAS工作造成工作负载105超标的出错信息,与此同时,CPU健康度也下降到了24,最后分析原因,是因为在不适当的时间进行了一个大备份的操作。

vForum 2011:图解vCops虚拟云管理应用

  这是一个邮件服务器的工作负载状况,可以看到工作负载达到100%,与此同时,内存占用也达到了100%,最终分析原因,因为存在着其他应用争用这部分内存的情况。

0
相关文章