【IT168 SACC专场报道】在数字化转型时代,云已成为万物智能的数字化大脑。而随着大数据应用、人工智能、移动互联网等技术的飞速发展,“智慧+”的概念正在深入到各行各业,提升企业效率,释放商业潜能,创造全新机遇。作为国内优异技术盛会之一,2017中国系统架构师大会(SACC2017)将于10月19-21日在北京新云南皇冠假日酒店震撼来袭。
今年,大会以“云智未来”为主题,云集国内外优异专家,围绕云计算、人工智能、大数据、移动互联网、产业应用等热点领域展开技术探讨与交流。本届大会共设置2大主会场,18个技术专场;邀请来自互联网、金融、制造业、电商等多个领域,100余位技术专家及行业领袖来分享他们的经验;并将吸引4000+人次的系统运维、架构师及IT决策人士参会,为他们提供最具价值的交流平台。
《万亿级数据洪峰消息引擎》
在大会首日的分会场上,来自阿里的中间件资深架构师金吉祥(牟羽)以《万亿级数据洪峰消息引擎》为主题,围绕阿里消息引擎家族史、消息引擎面临的挑战,未来展望三个方面进行了分享。在分享中,他从可用性&可靠性挑战、熔断机制、开源HA机制改进三个方面入手着重介绍了“双十一”在高可用方面面临的挑战以及阿里消息引擎在高可用方面的优化改进。

据介绍,阿里中间件消息引擎发展到今日,前前后后经历了三代演进。
第一代,推模式,数据存储采用关系型数据库。在这种模式下,消息具有很低的延迟特性,尤其在阿里淘宝这种高频交易场景中,具有非常广泛地应用。
第二代,拉模式,自研的专有消息存储。能够媲美Kafka的吞吐性能,但考虑到淘宝的应用场景,尤其是其交易链路等高可靠场景,消息引擎并没有一位的追求吞吐,而是将稳定可靠放在首位。因为采用了长连接拉模式,在消息的实时方面丝毫不逊推模式。
第三代,RocketMQ,2011年推出以拉模式为主,兼有推模式的高性能、低延迟重量级分布式消息引擎,2012进行开源。如今,RocketMQ服务于阿里集团大大小小上千个应用,在双11当天,更有不可思议的万亿级消息流转,为集团大中台的稳定发挥了举足轻重的作用。
《云平台计算服务进化之路》
薛峰作为AWS的解决方案架构师,围绕计算服务的进化、AWS计算服务、无服务器情况介绍等站在全球的高度讲述了云平台计算服务进化之路。

薛峰表示,云计算发展到今天也有10年多,相比自建数据中心或租用物理服务器,云计算的优势明显,大家现在已经非常熟悉了,并且很多人已经在享受云计算带来的便利。
云计算提供的就是计算服务,后来才逐渐扩展到更多产品和服务种类,比如网络 、存储、数据库等等。
AWS Lambda 可通过响应每个触发程序来运行代码,并自动扩展应用程序。代码是并行运行并逐个处理触发程序,按照工作负载的大小精细地扩展。
使用 AWS Lambda 时,会按代码执行时间 (以每 100 毫秒为单位) 和代码触发次数收费。代码未运行时,无需支付任何费用。EC2 最小计费单位是小时,使用 ECS 服务不计费,但是它部署出来的 EC2 实例还是会按小时计费的。
Lambda 免费套餐包含每月 1百万免费请求,以及每月 400,000 GB 秒的计算时间。
《基于Mesos/Docker的Elasticsearch容器化私有云》
去哪儿网DEVOPS马文介绍,传统的Elasticsearch交付与维护主要存在弊端是:传统部署以kvm虚机或实体机为节点,需提前申请,过程较慢; ES运行环境需要人工事先部署,自动化程度不高;集群扩容需要人工一遍一遍的部署环境, 效率低;集群信息不集中,不易于管理,维护成本高;ES需求量增加之后,更加加大了维护的成本和繁杂性.
针对上述弊端,容器化的私有云平台设计目标包括:加快集群构建速度、快速扩容和快速迁移能力、ES使用/运维标准化、集中的信息展示与良好的用户交互界面
改进之后,可以看到在成本、效率、规范上有很大的改进和提升。

《小米生态云的应用引擎实践》
据小米生态云李波介绍,小米生态云包括用户控制平台、大数据服务、人工智能服务模块,是为小米生态链及合作伙伴提供一站式云服务及解决方案。

关于小米生态云引擎的进化方面,主要存在开箱即用的PaaS平台、完整的权限和授权体系、成熟稳定,非常适用于无状态Web应用等优点,和–Buildpack机制和基础文件系统不灵活,定制难度大、生态链公司开发测试逐步迁移到Docker平台,与生产环境不一致、无法限制应用的CPU绝对用量、不支持cluster应用、UDP应用、Docker支持不完整,非原生体验、自有体系,组件繁多,部署运维复杂、社区参与度和活跃度下降等缺点。

对于应用引擎的未来规划,李波表示,建议应用版本管理、多应用映射同一域名、限制容器磁盘大小、应用资源监控、报警服务、精细化的资源调度、集群自动扩容以及Windows支持等。
《统一资源调度平台建设实践》
许令波,前阿里巴巴高级技术专家,09 年毕业进入淘宝后,一直工作了 7 年多时间,所有的工作经历都和淘宝的发展阶段相关。11 年淘宝 PV 从一亿到 10 亿 PV 阶段,系统的性能成为最大的挑战,针对大流量的读系统设计了高可用的静态化方案,应用在详情、购物车以及秒杀系统中,参与到双 11 大促的交易链路优化。目前加入滴滴基础平台,现负责滴滴统一资源调度平台建设,参与滴滴基础设施的建设。

许令波在演讲中提到,目前大部分工作都在设私有云,需要将物理资源进行统一的抽象要么进行虚拟化要么进行容器化,一般分为两个阶段:一是实现物理资源的虚拟化(即资源的抽象),将物理机分割成更小单位的虚拟机可以显著提升机器的利用效率,实现存储计算分离以及在离线混部等;二是将资源虚拟化后进一步实现编排更细粒度在时间和空间上优化资源的使用,进而实现自动化运维、弹性伸缩以及故障自愈等。与此同时,对滴滴搭建统一资源调度平台的关键技术实践方案以及在建设过程中遇到的典型问题进行了分析。
许令波表示,如果想在容器中获取正确Loadavg信息的那么就要具备以下几点:获取运行在容器中的所有进程(包括:线程);获取运行在容器中的进程总数;获取运行在容器中的所有进程运行状态;Loadavg计算公式;难点是如何控制性能消耗;控制对进程信息获取的系统调用。

▲更多信息尽在IT168现场报道专题 http://sacc.it168.com/topic2017/
