云计算 频道

机器学习快速落地, Amazon SageMaker终于来了!

  前不久,全球市场份额占比最大的公有云厂商亚马逊云服务(AWS)宣布,旗下机器学习服务Amazon SageMaker在中国宁夏和北京区域正式上线,对于想通过机器学习加速数字化转型的企业来说,这无疑是一个重大的福利。基于Amazon SageMaker发布的一系列工具,企业不但拥有了机器学习所需要的强大的模型、算法等方面的能力,还省去了准备、建立、部署、训练等环节,系统自带的各种功能,可以极大地提升开发效率,降低总体成本。

  那么,问题来了,Amazon SageMaker到底是什么?

  SageMaker是什么?

  “按照英文字义理解,Sage是魔法的意思,SageMaker是一个魔法生成器,是一项完全托管的机器学习服务,可以帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习 (ML) 模型。” AWS首席云计算企业战略顾问 张侠博士,从SageMaker的概念开始,进行了详细解读。

  传统的机器学习要经历一个艰难、复杂的过程,需要配备一些专业的技术人员,包括计算机、物理、统计、应用数学等好几个专业的博士,用张量计算、卷积计算等方法,去构建整个流程。不仅耗费人力、物力、财力,花费时间也长,一般至少需要八、九个月时间才能完成。而通过SageMaker,技术人员只需要具备基础知识,就可以在几周内完成机器学习部署。

  SageMaker拥有业界最全的内置算法,关于计算机视觉的有图像分类、对象监测、语义分割的算法;关于推荐的有分解机算法;关于主题模型的有LDA、NTM;关于预测的有DeepAR;关于聚类的有KMeans算法;关于回归的有Linear、XGBoost、Learner、KNN等等。

  AWS在去年re:Invent大会上还推出了Amazon SageMaker Studio,提供的是一个全面整合的机器学习的集成开发环境,它可以让开发者无需关心代码层面的问题,一键即可进行大规模协作,同时可快速创建易用的实验环境,对上千个实验进行比较、跟踪,在全可见、可控的环境下自动生成高精度、高质量的模型,并且可以自动调试、监控和运维。

  另外,Amazon SageMaker还有一个特有的弹性笔记本功能,通过Amazon SageMaker Notebooks,用户可在几秒钟内访问笔记本,并且在不显示增加计算资源的情况下启动,灵活调整计算资源类型。

  同时,还有多个符合特定业务场景的工具应用。比如:Amazon SageMaker Experiments,可跨实验和用户大规模跟踪、度量和实验数据,对组织和目标进行自定义管理,让训练快进快出、保证质量;Amazon SageMaker Debugger,可自动收集数据并用于可视化分析、调试,能自动化错误监测,通过警报提升生产力;Amazon SageMaker Model Monitor,可对模型进行监测,并通过内置规则检测数据漂移或编写自定义规则,用于定制化分析。再比如:完全可见、可控的自动化模型构建工具Amazon SageMaker Autopilot;用于数据处理和模型评估的分析作业工具Amazon SageMaker Processing;还有训练一次便可多处运行的Amazon SageMaker Neo等等。

  如果用一句话概括,SageMaker其实是一个能提供端到端服务的机器学习平台,具有零安装、模型训练灵活、按秒付费等特点,因此可以帮助用户将基于机器学习的模型快速构建到拥有智能应用程序的生产环境中去。从准备开始,到最后的机器学习部署,SageMaker能提供全流程的工具集。

  至于,Amazon SageMaker具体应该怎么来用?AWS为何要花大力气部署与机器学习相关的技术?这要从机器学习发展现状以及AWS在人工智能领域的战略说起。

  AWS为何如此看重机器学习?

  众所周知,人工智能其实是一个比较大的概念,包括机器人、语言识别、图像识别、自然语言处理和专家系统等,主要是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术和应用系统的一门技术科学。

  作为人工智能的重要分支,机器学习强调的是学习,而不是计算机程序,主要通过一台机器使用复杂的算法来分析大量的数据,识别数据中的模式,并做出一个预测,不需要像过去那样,通过人手动在机器的软件中编写特定的指令,机器可以模仿人获取一些学习的能力。

  与机器学习密切相关的还有深度学习,是一个基于神经网络的模式分析方法的统称。因为机器学习从上个世纪80年代开始被广泛关注,所以之后的十几年,深度学习也得到了快速发展,取得了突破性的成果,返过来推动了人工智能和机器学习的发展。

  大体来看,机器学习有几个重要元素:一个是数据;另一个是计算能力;第三个是算法。从某种程度上来说,机器学习是大数据平台、云计算和一些深度学习框架凝聚在一起的产物。其中,云计算起到了决定性作用,它既能提供大数据的存储,提供了很多计算能力,又使得用户可以非常方便地交流、分享各种各样的算法。

  如今,人工智能和机器学习已经成为新一代信息技术的典型代表,很多传统企业以及创新型企业都把机器学习看成是企业最重要的变革手段,用于提高产品自动化能力,或者进一步优化业务流程。但同时我们也发现,机器学习正面临两大难以逾越的挑战。第一,人才短缺。人工智能以及机器学习都需要很多专业知识,而了解这方面知识的人才又比较欠缺,有些人才需要百万年薪才能找到。第二,技术落地难。如何快速构建、扩展与人工智能相关的产品和应用,并把一些创新型技术落地到生产环境中去,还有一段很长的路要走。

  作为互联网巨头企业,亚马逊公司之所以要致力于机器学习领域,并不是简单的追赶技术热潮,而是企业互联网内在基因使然。从二十多年前有电商开始,亚马逊就在关注与机器学习相关的工作,产品推荐、产品搜索,物流配送等等很多创新业务和服务都有机器学习的身影。比如:在仓储业务环境中,除了送货的无人机,亚马逊还推出了智能助理Amazon Echo、无人值守商店Amazon GO等等,背后其实都有机器学习和人工智能的身影。

  到目前为止,AWS有数千名工程师以及数据科技人员,在从事与人工智能相关的工作,除了满足企业内部的应用需求,还要进行业务创新,把更多服务打包成产品,推向市场。就像AWS云计算的发展脉络一样,最初也是基于自己企业内部应用,最后形成产品以及解决方案,为更多外部企业提供服务。对于机器学习,AWS有着自己的定义,那就是把机器学习能力转移到每一位创建者手中,使它成为被广泛应用的工具。

  如何为行业赋能?

  了解了AWS机器学习发展历史,对于用户为什么更愿意选择AWS这个问题,也就不难理解!

  首先,是工具的丰富性。AWS提供了最广泛、深入的机器学习服务,其中核心服务就是Amazon SageMaker,它能加速整个机器学习过程,包括建模、训练调优、部署管理等。外加AWS云平台的助力,用户可以把数据存储、数据仓库,包括物联网的技术和机器学习结合到一起,形成所谓的AIoT智能物联网。

  其次,应用的快速落地。在选择机器学习工具或者解决方案时,用户看重的不只是功能的丰富性,还有应用的可实施性。目前,全球有数万家企业选择了AWS来运行机器学习工作负载。AWS拥有的机器学习用户数量要高于其他任何运营商的至少两倍。可以说,我们在各行各业都能看到AWS机器学习的身影,比如健康、医疗、在线教育等一些行业。

  AWS的机器学习可以落地到各种特定应用场景。比如:在短视频行业,通过大量机器学习以及推荐算法的使用,可以自动生成视频内容,并对内容进行分类,用户只要有浏览记录,就能判断他会喜欢其他哪些视频。在金融行业,从风险欺诈侦测到智能投顾等很多方面,机器学习都有施展拳脚的空间。再比如:健康医疗行业,从药物的发现,到基因的使用、到各种个性化的医疗诊断,包括精准医疗、在线医疗等等,机器学习都能发挥关键作用。

  而从应用效果来看,很多用户对AWS的机器学习给与了高度评价。以大型方程式赛车Formula One 为例,Formula One公司在21个国家/地区举办过一系列赛车活动,在全球拥有超过5亿粉丝,2017年创下18亿美元的总收入。为了推动业务增长,Formula One使用AWS服务来推动赛事模式的变革,通过数据跟踪系统和数字广播等新技术的使用,公司增强了粉丝和车队的赛车体验方式。

  “AWS在速度、可扩展性、可靠性、全球覆盖范围、合作伙伴社区以及可用云服务的广度和深度方面,均优于其他所有云提供商。” Formula One创新和数字技术总监Pete Samara说道。

  具体而言,Formula One的数据专家使用 Amazon SageMaker 培训深度学习模型,用65年的历史竞赛数据来提取关键竞赛成绩统计数据,进行竞赛预测,并让粉丝深入了解车队和车手采用的瞬间决策和战略。另外,Formula One的赛车运动部门在 AWS 上运行高性能计算工作负载,在制定新的赛车设计规则时,大幅度提高了空气动力学团队可以运行的模拟数量和质量。

  总之,机器学习带来的诸多好处,显而易见。可以预测,未来随着疫情的退去,机器学习会加快落地进程,尤其在企业数字化转型关键阶段,如何从客户体验、运营、决策、创新等方面多管齐下,提高整体竞争力,是企业下一步提振经济的关键点。

0
相关文章