云计算 频道

青云推新功能 改进用户自动化运维体验

  【IT168 云计算】青云QingCloud是一家有着文艺情怀的创业公司,从CEO黄允松到工程师,再到市场、品牌、行政客服等支撑人员,小而美的团队架构汇聚了云计算业界的精英人才。正因为这种形式的组织架构,这样自由的技术氛围,才有可能更加专注于技术创新,无疑这是一个良性循环,云服务公司只有孜孜不倦的去追求提高用户体验,才会有更大的发展空间,青云是这么想的,也是这样做的。

  近期,为了增强青云QingCloud的可用性,给用户提供更好的用户体验,进一步为用户节约IT成本,青云QingCloud发布了定时器(Scheduler)、自动伸缩(AutoScaling)两款新功能,引起了业界的广泛关注。那么,这两项功能具体能起到哪些作用?基于这两项新功能,青云QingCloud可以帮助用户达到怎样的操作体验?笔者带着疑问对话了青云QingCloud横跨前后端的工程师罗夕,由他从产品技术、市场、战略等几个方面来对两项新功能做了详细的解析。

  


▲青云QingCloud工程师罗夕:负责网站、SDK/CLI、监控告警、自动伸缩功能的研发。

  新功能改善用户自动化运维的敏捷度

  It168:请简述下,定时器(Scheduler)、自动伸缩(AutoScaling)两项新功能主要能帮助用户带来哪些方面的便捷?

  罗夕:自动伸缩(AutoScaling)功能能够帮助用户基于监控数据自动调整资源配置或者集群规模,以应对突增的系统压力;定时器(Scheduler)可用于定义周期性的资源调整或备份任务,两者均具有完整的操作记录及通知机制。

  此次推出的两款自动化运维工具,充分发挥了 QingCloud 极致弹性、按秒计费等独特优势,在实现运维自动化的同时,使资源使用最大限度趋近业务规模,从而帮助用户最大限度提高资源使用效率、降低 IT 成本。

  It168:据了解,自动伸缩(AutoScaling)功能是基于监控数据动态地调节资源配置或集群规模,从而达到及时应对突增的系统压力。请问,这项功能是基于青云的什么功能基础完成的?

  罗夕:了解青云的用户都知道,之前,我们已经提供了监控告警功能(Alarm),这项功能可以实现对各类资源做监控。但每种资源的监控项不同,如主机监控项有:CPU、内存、磁盘、IO、网卡流量等;公网IP的监控则是:进流量带宽、出流量带宽(Mbps)。用户可以监控所有资源的任何监控项,设置合适的阈值即可。当系统发现资源的监控数据超出用户设定的阈值,就会主动通知用户。

  而自动伸缩(AutoScaling)功能是基于监控告警功能(Alarm)的进一步扩展。具体来说,当资源监控告警时,不仅可以发送通知,还能执行自动伸缩行为。其实,无论定时器任务还是自动伸缩行为,对资源的操作都是基于我们的 API 实现的,有了强大、稳定、开放的 API,才能实现灵活有效的自动化运维。

  用户需求决定功能的开放程度

  It168:我们知道,青云的业务收费是按秒收费的,在定时器(Scheduler)重复的基准周期上,是依据什么来设定的?

  罗夕:目前定时器的执行周期分两类:执行一次和重复执行。

  执行一次:用户可以设定一个未来的时间点,会精确到分钟,到达时间后就会自动执行这个任务,而且只会执行一次。

  重复执行:用户可以设定重复周期的粒度为『每天』、『每周』、『每月』,其中『每周』和『每月』都可以细化指定具体哪些天。比如每周一、三、五执行,或每月1号、10号、月末执行。同样,执行的具体时间精确到分钟。

  之所以设计上述的周期类型,以及时间上精确到分钟,是因为我们认为这已经可以满足用户的需求了,没必要再提供更细粒度的周期。这里不是技术实现上有什么难度,而是从需求、以及合理使用资源的角度出发,避免早期的过度设计。如果以后确实有合理的需求,我们会继续升级功能来满足。

  It168:通过了解,我们知道,目前自动伸缩(AutoScaling)功能向用户提供了有限的资源覆盖。请问为什么目前仅支持公网IP、负载均衡器、关系型数据库三项资源?未来还会支持哪些资源?

  罗夕:因为目前这三类资源比较适合做自动伸缩,也有比较明确且强烈的用户需求。未来青云会根据用户反馈,以及新功能的增加,选择适当的资源类型加到自动伸缩界面中。

  其实理论上所有的资源操作都可以支持,只要放开脚本编辑功能即可。目前脚本都是自动生成的,不能修改,脚本中的关键参数都是通过 UI 界面,由用户输入。未来我们会打开脚本的直接编辑功能,这样用户就可以自行编写复杂、个性化的操作行为。

  It168:如何解决触发安全问题,是否存在错误判断的风险?如果有,青云如何做规避?

  罗夕: 我们很多功能都是基于已有功能开发的,在公开场合也说过,要『吃自己的狗粮』,比如数据库服务就是基于虚拟主机开发;监控告警(Alarm)是基于资源数据收集服务;自动伸缩又基于 Alarm 。我们每个功能都经过长期测试才会推出,所以对每个功能/服务都有信心,相信它足够支持更上层的业务。

  在执行资源操作时,我们的脚本会『以用户的身份』来调用 API ,这样有几个好处:首先,不会误操作其他用户资源,因为有权限控制。其次, 关键操作会以日志(job)的形式保留下历史,在控制台可以随时查看。

  营造好一个基于青云的生态

  It168:两项新功能的上线,提升了青云的功能性、可用性,对于提升用户体验无可厚非。请问,除此之外,对于青云未来市场布局还有哪些战略意义?

  罗夕:帮助用户更合理有效地使用青云资源是我们不断努力的一个方向,因为我们希望能营造好一个基于青云的生态,无论是合作伙伴还是我们的用户,都是生态的一部分,只有大家都越做越好,这个生态才是健康的。我们都知道基础设施的稳定是整个生态的基础,而除此以外,自动化运维也会进一步促进上层业务的发展。

  这两个新功能可以帮助用户自动化的管理资源,降低资源维护成本,提高用户系统的弹性,同时还能减少一些开销。另外,这两个功能目前都是免费的,可以更好地吸引新用户并提高黏性。

  未来,AutoScaling 应该会对青云的 PaaS 建设有助力作用,Technical PaaS 也是今年青云的重点之一。

  同时青云一直强调,我们从不照搬任何功能,都是从需求出发去实现我们能想到的最好最酷的产品。

  It168:未来在产品线拓展方面,青云有哪些规划与动作?

  罗夕:今年 Technical PaaS 依然是一个重点,会继续丰富功能,比如大数据处理需要的基础组件:queue server,hadoop,spark 等等。同时我们还会提供一个第三方平台,集成很多合作伙伴的业务到青云控制台,比如防攻击、网络加速、应用层的监控等,方便青云用户使用,也帮助合作伙伴拓展用户。

0
相关文章