云计算·大数据 频道

涂鸦智能超强算力背后——把亿级物联网关架构在 AWS Graviton2 实例上

  当很多人意识到,AIoT正成为下一轮科技红利的最大受益者时,涂鸦智能已凭借强大的技术创新能力,成为一家全球领军企业。那么,在这家企业高速成长的背后,有哪些不为人知的故事呢?笔者有幸采访到涂鸦智能云端开发部首席架构师陈亚焱,通过他的具体介绍,让我们看到技术创新带来的颠覆力。

  一家世界级领军企业的成长历程

  提到涂鸦智能,相信只要是对AIoT有所了解的人,就一定不会感到陌生!

  虽然,涂鸦智能看上去还只是一家创业公司,从成立到现在仅有6年时间,但其业务已经遍布全球,打造出了位居世界前列的语音AI交互平台。凭借涵盖了硬件开发工具、全球云、智慧商业平台,该公司可以为开发者提供一站式人工智能物联网领域的PaaS级解决方案。旗下的全球云开发平台、AI+IoT开发者平台,已成为数字化纽带,把消费者、品牌制造商、OEM厂商和连锁零售商的智能化需求紧密地连接在一起。涂鸦智能有一个最神圣的使命,即“让万物智联”,打造开放中立的物联网生态系统。今天看来,他们当初的选择和判断非常具有前瞻性。

  2020年8月,涂鸦智能名列2020中国新型创新企业50强第25位;在《苏州高新区·2020胡润全球独角兽榜》中,排名第256位。除了服务中国用户,海外地区的开发者占比也很高,为全球超26万名的开发者提供服务平台及解决方案。当很多企业还停留在AIoT概念上时,涂鸦智能已经迅速成长为一家超大业务体量的公司。

  用技术创新打造超强算力

  为了增强客户粘性,打造算力支撑平台,涂鸦智能通过云平台提供服务。但由于数据量太大,对实时性要求较高,原有的云端服务器出现了技术瓶颈。

  “当海量设备同时在线,数据量非常大,并且不分波峰、波谷,就像智能插座一样,只要通电之后,就会是大数据量的实时在线。”陈亚焱说道, 涂鸦智能提供的是一个全球化的IoT云平台,每天处理设备请求次数是840亿次,请求高峰是150万次/秒;同时,作为一家AI+IoT公司,每天还会处理1.2亿次的AI语音交互数。最重要的是,一旦遇到黑五、圣诞、元旦,会遇到流程增长高峰期,整个技术架构平台必须做实时扩容。另外,不能影响客户体验,云端服务器的响应时间必须小于10毫秒/次。如何以最低成本维护海量设备运行,并且确保实时性要求?如何确保亿级设备同时在线,降低数据中心搭建成本? 必须在底层架构上进行革新!

  与亚马逊云服务(AWS)合作后,涂鸦智能在底层架构平台上做了更个性化的改造。首先,每个IoT设备都通过MQTT协议连接到云端,底层同时支持了TLS和QUIC。值得一提的是,涂鸦智能是第一家将QUIC用于MQTT协议的公司,这一改变带来了更高性能的网络传输体验,让设备在入网环境下有更出色的表现。 然后,通过AWS的NLB(Network Load Balancer网络负载均衡),将请求转发到后端具体的实例上。再之后,在Levimqm2m这层保持一个TCP的长链接,做一下协议解析,并将解析后的MQTT协议,交给后边的Levimqcore,做一些请求的处理以及转发、连接的认证等等。而peadb是涂鸦智能自研的内存数据库,作用就是存储每一个设备的连接状态、权限信息等等。目前,云端网关的这三层架构已全部切换到了AWS的Graviton2,基于M6g或者 C6g构建,每一层都是微服务架构,可以水平扩展。

  成果显著,CPU性能提升100%

  据陈亚焱透露,在架构方案测试时,在使用x86的时候,也就是在使用M5g时候,CPU的数值大约是在27%。到2020年8月份,准备迁移到Graviton2上的时候,灰度了一部分流量到Graviton2的架构上,也就是M6g机型,使得CPU占用率降到了平均12%以下。如果用数字来表现,Graviton2给涂鸦智能带来了三大成果。第一,CPU的性能提升了100%;第二,服务器单价降低20%;第三,整体性价比提升了2.5倍。

  “AWS Graviton2的架构非常符合涂鸦智能连接层架构,由于连接层本身就有轻量级进程,Graviton2每个CPU核的设计,确保每个进程都是隔离运行状态;并且Graviton2提供了更大的缓存,导致整个CPU获得了最大化提升。” 陈亚焱对Graviton2的表现非常满意,并表示未来会逐步迁移更多的机器。

2
相关文章