云计算 频道

见招拆招 看爱奇艺刘俊晖的架构全路数

  【IT168 专稿】2016年10月27日-10月29日我们将迎来中国系统架构师大会(SACC)的八周岁,八年来我们目睹了整个IT架构的变迁史,也见证了中国IT圈内一波又一波的架构师成长路,感谢与你们同在。大会召开在即IT168记者有幸邀请到了爱奇艺云平台的技术总监刘俊晖, 一起来看看他与架构有着怎样的故事,希望他的竭诚分享能够给你的架构之路有所启迪。

见招拆招 看爱奇艺刘俊晖的架构全路数

  嘉宾简介:刘俊晖爱奇艺云平台技术总监,主要负责数据库、中间件、大数据基础架构等研发和运维。08年毕业于复旦大学计算机软件与理论硕士学位,先后就职于Intel、SAP,曾带领团队研发SAP HANA(内存数据库)的数据挖掘引擎。对云计算和大数据领域颇有研究。

  三年又三年 架构师养成记

  Intel可以说是刘俊晖梦想开始的地方,四年间的经验积累使他完成了底层系统、Web架构及云计算相关技术的创新研发与实践,不知不觉中也塑造出了他专业的职业素养。

  而后在SAP工作的三年,使得刘俊晖在需求分析、团队沟通和项目协作的能力上得到了极大锻炼。三年间他只专注做了一件事情,那就是为SAP战略级的内存数据库产品HANA从无到有打造了一个高性能的in-house数据挖掘引擎, 涵盖了分类、聚类、关联分析等方面的数十个常用算法,并在此基础上催生了很多智能产品和方案,并成功的推出了市场。从痛点分析、团队组建、产品研发到落地的推出,推动了一个完整的技术产品研发周期,使他各方面能力得到了极大提升,更加精进。

  来到爱奇艺云平台以后,他成功组建了服务云团队,并树立了一个全新的目标:向全公司所有业务提供稳定可靠的基础服务,包括关系数据库、NoSQL、MQ、RPC、Hadoop、Spark等20多个服务,并与业务一起做架构分析和优化,最终给用户提供优质的视频服务。

  由于之前是在传统IT公司工作,产品研发周期长,客户体量小,工作起来还算得心应手,但是在快速发展的互联网公司里面却大有不同,业务需求纷繁复杂:线上出问题要立刻解决,流量井喷时要有足够灵活和稳定的基础架构去支撑,从云平台角度还需考虑单个项目的架构、整个公司的基础架构,高性能与低成本之间的完美平衡以及实现局部与全局的最优状态等等,总之处处充满着的挑战。然而挑战与机遇并存,在这种高度紧张的环境下团队的所有成员也都在快速的成长,在各种挖坑填坑的过程中也对互联网的技术架构产生了亲密接触。浓厚的兴趣使刘俊晖毅然决然的投身于架构师事业中不能自拔。

  五大要素 成就优秀架构师

  说道架构师,在刘俊晖眼中它并不是一个特定的职位,而是一个角色概念。当从开发、测试、运维等各种岗位成长起来后,慢慢地就要开始培养各自领域的架构能力,从更宏观和更高的层面去思考问题。

  刘俊晖认为一个出色的架构师除了过硬的一线经验、快速学习能力、沟通协调能力这些必备素质以外,还要有意识地去培养良好的大局观和把握主线的能力。例如,作为一个业务开发的架构师,在一个新项目的架构设计阶段,不仅要考虑新项目的功能设计,还需要考虑与其它业务系统的依赖关系,会不会给某个依赖系统带来过载的压力?同时还要考虑容量规划,是否与基础架构团体提前沟通资源,防止出现资源瓶颈影响上线进度和质量?此外架构演变的路线也是不得不考虑的点,在限定的资源和时间条件下,架构可以如何进化?这些都考验架构师的大局观。所以想要成为一名出色的架构师需要在这些方面勤加努力。

  “零”失败架构是如何做到的?

  架构师可以做到很出色,但是架构可不一定每次都能成功,一旦架构出现问题或者开发时间不足时该如何把控呢?

  “一定要把握主线,抓住核心功能,放弃一些次要的功能,这样才有可能保证整个项目的顺利进行,或者当线上出现故障的时候,如何通过服务降级,保住核心功能体验,也是积极应对的方法。”刘俊晖如是表示。“其实当我们谈架构的时候,往往已经是在面对一个比较复杂的分布式系统,分布式系统有着CAP和BASE等经典理论,引申出高可用、可扩展、一致性、性能等特点,而衡量一个分布式系统的架构是否成功,则取决于业务需求,对于支付系统来说,一致性是最高标准,而相对于视频播放服务,高可用和性能则更为重要。对于大部分架构来说,最终一致性已经足够,而高可用和可扩展往往是互联网架构的首要考虑因素。”

  高可用: 每一层都要考虑高可用,如果简单分为云平台和业务两层的话,在云平台层面,从数据中心建设(双电、UPS、多DC),到数据库(MHA、NoSQL集群方案),到中间件(消息系统、RPC服务框架),再到访问层(DNS、LVS负载均衡)等,都尽力做到一定程度的高可用;同时,在直接响应用户的业务层面,应该考虑跨DC的部署,具备服务降级和服务调度的能力,这样在灾难和故障(断电、断网、底层部分不可用)发生的时候,又或者是流量突增的时候,不至于整体服务不可用或者可以防止雪崩。

  可扩展:这里有两层含义,一个是容量规划上的可扩展,一个是动态可扩展。前者是一个基础,基本上架构的每一层都要考虑到业务发展迅猛甚至井喷的时候,是否能够做到水平扩展,只要添加机器就可以了?而后者是一个更大的挑战,动态可扩展,也是就说具备了伸缩性,前提就是有一个资源池 (比如爱奇艺有基于Mesos和YARN的资源池),可以调度不同计算类型的任务,支持弹性伸缩,这个对于成本节省和抗突发流量是非常有帮助的。

  一起展望云平台架构

  刘俊晖认为随着云时代的到来,对于云平台架构的采用,无论是私有云还是公有云模式,都将成为所有公司一种必然的发展趋势。资源的集中和人才的集中,有利于云平台技术的发展和对新硬件技术的应用,也有利于业务聚焦在自己的核心逻辑开发上,应该积极拥抱云。云平台架构里,硬件和开源软件已经得到了飞速的发展,相信也仍会继续,在这里偷偷透露一下刘俊晖老师近期重点关注的领域哟:生态构建和工具链塑造(比如能否把更多通用功能抽象成通用的组件或者服务,线上数据与离线数据之间的打通和高效使用,一体化全链路的监控服务),以及背后运维体系的演化上(如智能运维、资源共享等)。

见招拆招 看爱奇艺刘俊晖的架构全路数

  说到底,架构其实就是为了公司业务服务的,更进一步说就是为了满足用户需求而存在的。在如今互联网的大潮之下,用户的需求被激发,要求也越来越苛刻,随着互联网里积累的数据越来越庞大,必然导致对架构演变速度的加快,唯有不断创新才能达到这一速度。

  每年的架构师大会就像是一场精彩的年度汇报讲演,本届大会将会以"架构创新之路"为主题,带给你别样精彩,也许你会发现今年较往年相比增添了许多有意思的专场: 比如说VR、直播这样的热点领域,还有开源开发工具交流等引导开源潮流的专场,总之看点颇多!作为本届SACC的嘉宾,刘俊晖表示非常期待。感谢刘俊晖老师参与此次采访,更多精彩内容请见大会官网:http://sacc.it168.com/

1
相关文章