亚马逊云科技数据战略重塑云计算未来-云计算·大数据专区

亚马逊云科技数据战略重塑云计算未来

作者：李代丽编辑：李代丽 2023-01-11 11:03 IT168网站原创

　　面对海量数据，人类如何始终保持探索能力，有效驾驭数据？这便是云计算带来的价值！

　　正如亚马逊云科技CEO Adam Selipsky所言，虽然数字世界像满天星空，充满不确定性，有时候浩瀚无垠，有时候深不可测，甚至需要面对极端挑战，但也充满着无限可能。只要我们正确使用工具，就可以战胜环境，打开探索宇宙奥秘的大门。

　　所以，云计算就像火箭、卫星和空间站，给了人类探索数字世界的有效工具，创造出互联互通的新世界！

　　那么，具体而言，云计算正在如何影响整个世界？如何帮助企业始终保持探索能力？亚马逊云科技re:Invent全球大会有很多关键信息点！

　　▲亚马逊云科技大中华区产品部总经理陈晓建

“亚马逊云科技在每年的re:Invent全球大会上，都会发布许多重磅的新服务、功能和应用，来支持遍及全球各地、来自千行百业的客户进行不断的创新和重塑。面临全球经济的不确定性，各种规模的客户都希望能进一步削减成本、增强业务的灵活性并加速创新。我们希望能通过技术的不断创新，让全球包括中国的客户能凌云驭势、重塑未来。”亚马逊云科技大中华区产品部总经理陈晓建，在2022 re:Invent 中国行活动上，具体介绍了是云计算的诸多创新点。

　　从底层基础技术创新，到端到端的数据线路，再到云原生步伐的坚定，亚马逊云科技把云计算带到一个新高度，尤其是最新发布的数据战略，值得重点关注。

　　亚马逊云科技一直在数据存储和分析、机器学习等方面创新，并应用到实践中。如：通过数据分析为用户进行书籍推荐；在云计算领域推出云原生数仓Amazon Redshift和首个云原生的数据库服务Amazon DynamoDB。

　　亚马逊云科技通过提供端到端的全面数据解决方案，帮助客户打造从数据的摄入、数据存储与查询，到数据分析、商业智能，再到人工智能与机器学习创新，并通过安全合规的方式进行集团内或公司之间的共享和输出。

　　具体而言，构建端到端的数据战略，包括三个核心：

　　1)建立面向未来的云原生数据基础设施；

　　新一代云原生数据基础设施，需要用合适的数据库工具应对所有类型的工作负载。

　　亚马逊云科技拥有最完整的数据库，包括关系数据库（如 Amazon Aurora）和 8 个专用数据库（如Amazon DynamoDB）为应用程序提供数据工作负载支持。同时，亚马逊云科技可以为分析工作负载提供最全面的服务，例如使用 Amazon Redshift 的 SQL 分析、使用 Amazon EMR 的大数据分析、使用 Amazon QuickSight 的商业智能以及使用 Amazon OpenSearch 的交互式日志分析。

　　亚马逊云科技还提供一系列广泛的功能来支持机器学习工作负载，包括 PyTorch 和 TensorFlow 等深度学习框架、可以更轻松地创建 ML 模型的 Amazon SageMaker 等服务，以及具有内置机器学习功能的 AI 服务，例如Amazon Transcribe 和Amazon Polly。

　　如今，数以万计的亚马逊云科技客户使用Amazon Athena进行数据查询，许多客户也在使用Apache Spark来进行复杂的数据处理，不想花时间在复杂的基础架构层面的配置和运维上。

　　除了强大的数据库能力，云原生数据基础设施能力，还要支撑在大规模运行的情况下依然保持高性能，并且通过智能化手段和工具为客户降低运营复杂性，有效提升工作效率。更重要的是，提供高级别的可靠性和安全性，来保护企业的数据存储。

　　2)实现高效、跨组织的数据一体化融合；

　　连接数据的能力与云原生数据基础设施一样重要，企业需要一套解决方案来实现高效、跨组织的数据一体化融合，中间涉及从自动化数据路径到数据治理工具。

　　而ETL，是挖掘数据价值，进行机器学习建模的必要前置步骤。在现实情况中，绝大多数数据都是多源异构的，ETL将把分散、零乱、标准不统一的数据整合到一起，通过抽取、清洗转换之后加载到分析服务。

　　Amazon Glue是一项完全托管的ETL 服务，深受市场的欢迎。作为Serverless数据分析产品，Amazon Glue让客户不需要做底层资源的准备和配置，而只要关注在ETL和数据本身。

　　在今年亚马逊云科技提出“零ETL”功能后，企业无需再次手动构建数据管道。亚马逊云科技多项全新的集成功能，可帮助客户实现“Zero-ETL”（零ETL）。什么是零ETL呢？是指Amazon Redshift流式注入功能正式可用后，日志数据无需从MSK进入Amazon S3，再通过代码拷贝进入Amazon Redshift做分析。Amazon MSK和Amazon Redshift可以直接打通，同时把数据同步从分钟级别提高到了秒级，极大地提升了实时性。

　　Amazon Redshift现在支持将文件从S3自动化的复制到Amazon Redshift，避免了人工操作。在Amazon Redshift的分析负载中，有相当一部分的数据来自于关系型数据库Amazon Aurora。通过把Amazon Aurora和Amazon Redshift 打通，大大降低了用户使用这些服务的工作量，提升了数据使用效率。

　　3)借助教育和工具，使数据普惠化。

　　Amazon DeepRacer 通过强化学习对学生进行ML培训，来自 150 个国家/地区的超过 310,000 名开发人员已经通过亚马逊云科技 DeepRacer 接受了机器学习方面的培训。希望通过成熟的培训和认证体系，以及AIML奖学金项目，让更多的学生、业务人员或者IT从业者能够充分掌握云计算技术，从而更好地拥抱这样一个信息爆炸时代。

　　最新推出的Amazon QuickSight Q，不仅仅预备了预测的能力，而且还能揭示数据背后的原因，而且这些都是系统自动完成的。

　　除此之外，通过低代码机器学习，可以快速进入业务需要的机器学习场景中。通过Amazon SageMaker Data Wrangler、Amazon SageMaker Canvas、Amazon SageMaker AutoPilot、Amazon SageMaker JumpStart，可以帮助使用者从数据准备到模型构建和开发，到训练和调整，直到部署和运营管理，在全生命周期的每个阶段轻松上手。

　　亚马逊云科技认为，云原生的数据战略由三个关键因素构成，极致的性能，轻松和无处不在的连接，以及推行数据的普惠化。

　　有数据显示，未来五年产生的数据量将会是数字时代开始以来的两倍多。可见，数据爆炸不是未来，而是现实，如何管理海量数据，挖掘数据价值，对每个组织来说都是巨大的挑战。而今天亚马逊云科技在云上各个层面的创新，极大地降低了数据的使用门槛，让数字世界的未来充满更多可能性！

关注我们