涂鸦智能超强算力背后——把亿级物联网关架构在 AWS Graviton2 实例上-云计算·大数据专区

涂鸦智能超强算力背后——把亿级物联网关架构在 AWS Graviton2 实例上

作者：李代丽编辑：李代丽 2021-02-18 09:46 IT168网站原创

　　当很多人意识到，AIoT正成为下一轮科技红利的最大受益者时，涂鸦智能已凭借强大的技术创新能力，成为一家全球领军企业。那么，在这家企业高速成长的背后，有哪些不为人知的故事呢？笔者有幸采访到涂鸦智能云端开发部首席架构师陈亚焱，通过他的具体介绍，让我们看到技术创新带来的颠覆力。

　　一家世界级领军企业的成长历程

　　提到涂鸦智能，相信只要是对AIoT有所了解的人，就一定不会感到陌生！

　　虽然，涂鸦智能看上去还只是一家创业公司，从成立到现在仅有6年时间，但其业务已经遍布全球，打造出了位居世界前列的语音AI交互平台。凭借涵盖了硬件开发工具、全球云、智慧商业平台，该公司可以为开发者提供一站式人工智能物联网领域的PaaS级解决方案。旗下的全球云开发平台、AI+IoT开发者平台，已成为数字化纽带，把消费者、品牌制造商、OEM厂商和连锁零售商的智能化需求紧密地连接在一起。涂鸦智能有一个最神圣的使命，即“让万物智联”，打造开放中立的物联网生态系统。今天看来，他们当初的选择和判断非常具有前瞻性。

　　2020年8月，涂鸦智能名列2020中国新型创新企业50强第25位；在《苏州高新区·2020胡润全球独角兽榜》中，排名第256位。除了服务中国用户，海外地区的开发者占比也很高，为全球超26万名的开发者提供服务平台及解决方案。当很多企业还停留在AIoT概念上时，涂鸦智能已经迅速成长为一家超大业务体量的公司。

　　用技术创新打造超强算力

　　为了增强客户粘性，打造算力支撑平台，涂鸦智能通过云平台提供服务。但由于数据量太大，对实时性要求较高，原有的云端服务器出现了技术瓶颈。

　　“当海量设备同时在线，数据量非常大，并且不分波峰、波谷，就像智能插座一样，只要通电之后，就会是大数据量的实时在线。”陈亚焱说道，涂鸦智能提供的是一个全球化的IoT云平台，每天处理设备请求次数是840亿次，请求高峰是150万次/秒；同时，作为一家AI+IoT公司，每天还会处理1.2亿次的AI语音交互数。最重要的是，一旦遇到黑五、圣诞、元旦，会遇到流程增长高峰期，整个技术架构平台必须做实时扩容。另外，不能影响客户体验，云端服务器的响应时间必须小于10毫秒/次。如何以最低成本维护海量设备运行，并且确保实时性要求？如何确保亿级设备同时在线，降低数据中心搭建成本？必须在底层架构上进行革新！

　　与亚马逊云服务（AWS）合作后，涂鸦智能在底层架构平台上做了更个性化的改造。首先，每个IoT设备都通过MQTT协议连接到云端，底层同时支持了TLS和QUIC。值得一提的是，涂鸦智能是第一家将QUIC用于MQTT协议的公司，这一改变带来了更高性能的网络传输体验，让设备在入网环境下有更出色的表现。然后，通过AWS的NLB（Network Load Balancer网络负载均衡），将请求转发到后端具体的实例上。再之后，在Levimqm2m这层保持一个TCP的长链接，做一下协议解析，并将解析后的MQTT协议，交给后边的Levimqcore，做一些请求的处理以及转发、连接的认证等等。而peadb是涂鸦智能自研的内存数据库，作用就是存储每一个设备的连接状态、权限信息等等。目前，云端网关的这三层架构已全部切换到了AWS的Graviton2，基于M6g或者 C6g构建，每一层都是微服务架构，可以水平扩展。

　　成果显著，CPU性能提升100%

　　据陈亚焱透露，在架构方案测试时，在使用x86的时候，也就是在使用M5g时候，CPU的数值大约是在27%。到2020年8月份，准备迁移到Graviton2上的时候，灰度了一部分流量到Graviton2的架构上，也就是M6g机型，使得CPU占用率降到了平均12%以下。如果用数字来表现，Graviton2给涂鸦智能带来了三大成果。第一，CPU的性能提升了100%；第二，服务器单价降低20%；第三，整体性价比提升了2.5倍。

　　“AWS Graviton2的架构非常符合涂鸦智能连接层架构，由于连接层本身就有轻量级进程，Graviton2每个CPU核的设计，确保每个进程都是隔离运行状态；并且Graviton2提供了更大的缓存，导致整个CPU获得了最大化提升。” 陈亚焱对Graviton2的表现非常满意，并表示未来会逐步迁移更多的机器。

关注我们