云计算·大数据 频道

云智共生发展回顾及未来征途展望

  喜欢围棋的人,一定不会忘记一件事,那就是二十多年前,那场轰动全世界的人机大战。

  1997年,国际象棋世界冠军加里·卡斯帕罗夫在纽约与IBM开发的超级计算机深蓝进行了六局对弈比赛。机器与人进行智力比拼,这在历史上是第一次。最终,机器胜出,成为围棋冠军。再之后,AI经历了很长一段时间的平稳期,似乎一直在为酝酿一个更大的动作在做准备。

  谁都不会想到,二十多年后的今天,生成式AI走进人们的视野,它以前所未有的颠覆力影响着人们的生活,改变着人们的工作习惯。

  如果你想找一个夏日热门旅行目的地,你可以问Siri、Alexa、小爱、小艺、天猫精灵;如果你是个文案工作者,特别讨厌写长文,语音转文本应用可以随时在线提供服务;如果你想在购物网站上找一件称心如意的夏装,就和机器人聊一聊,咨询那件衣服的详细信息……这些案例无不在说明,生成式AI已深入融入社会生活和工作的方方面面,曾经需要很多人头脑风暴才能解决的问题,现在都可以由生成式AI来代替。

  生成式AI不仅影响着我们的个人工作和生活,在商业领域也取得了突破性进展。有数据统计,到2026年,超过80%的企业将采用生成式AI来提高工作效率。当然,生成式AI并不是金钥匙,如果使用不当,将会给企业带来负面效果。生成式AI到底是企业业务的加速器,还是业务平稳运行的风险点?我们先从GenAI的起源开始,分析未来技术变革的走向!

  追溯历史:GenAI的过去、现在和未来

  在很多人的潜意识里,会觉得生成式AI是一个现代化技术,是现代文明的开始。实际上,生成式AI技术的起源可以追溯到1906年。

  当时,一位名叫安德烈·马尔科夫的俄罗斯数学家,制定了一个统计计算,来模拟随机过程的行为。这种数学方法后来被称为马尔可夫链。马尔可夫链随后形成了许多即将出现的生成式AI模型的基础。另外,我们还惊讶地发现,大多数ML算法,使用的是马尔可夫模型来执行下一个单词预测任务,例如:电子邮件中的自动完成功能。

  在某种程度上,ChatGPT等OpenAI模型也是基于马尔科夫模型的原理来设计的。然而,由于马尔可夫模型无法准确捕获数据中的复杂模式和依赖关系,因此需要更先进的生成式AI模型。

  2014年,蒙特利尔大学的研究人员推出了一种名为生成对抗网络(GAN)的机器学习架构。GAN主要由两个神经网络组成:一个是,生成新数据样本的生成器网络;另一个是,将生成的样本与实际样本分开的判别器网络。由于GAN用于生成视频、样本和音频,因此它们可以应用于美术生成、合成数据生成和数据增强等领域。

  一年后,斯坦福大学和伯克利加州大学分校合作推出了扩散模型。这些模型可以生成新的数据集,也可以复制训练数据集中的样本。通常以生成超现实图像而闻名,该模型成为文本到图像生成系统的关键。

  2017年,谷歌推出了transformer架构,该架构以开发大规模语言模型来驱动ChatGPT而闻名。这个架构框架基于编码器-解码器原理工作。编码器通过一个称为注意力的数学公式来评估不同元素之间的关系,从而生成输入序列的注意图。另一方面,解码器接收该序列并产生输出序列。

  历史性跨越:生成式AI和云携手共进

  虽然,生成式AI已被看作是科技创新的强大推力,但其实云计算才是背后那个推手,是生成式AI变得越来越强的催化剂。

  首先,云提供了一个可扩展的基础设施能力,让生成式AI变成业务应用的内置工具成为可能。同时,云和GenAI通力协作,使得人工智能朝向普惠化方向发展,让全球用户都看到了新技术创新的发展潜力。

  从基础设施层间来看,云可以为生成式AI提供更强大的算力支持。生成式AI非常耗费算力,一片好的英伟达GPU芯片成本为8万元,普通的GPU也需要花费27,000美元左右,但如果开发者可以从云服务商那里租用虚拟GPU,显然可以大量节省成本。尤其在训练场景,开发者可以根据业务需要和使用时长进行付费。同样,生产场景也一样,开发者要想更好地利用数据,必须借助GPU的处理能力来提高推理的速度,而云基础设施可以更好地满足用户的弹性扩展需求。

  在可访问性上,云让不同规模、不同发展阶段的企业都能用上生成式AI这项技术,有效降低了使用成本,而不是让用户在昂贵的基础设施上构建和管理自己的大模型。所以,云和AI的结合等于给用户带来了福利,用户不需要斥巨资组建自己的AI团队,就可以使用世界上先进的技术,通过在云上进行个性化定制的方式,选择适合企业业务的应用。

  更强调知识共享和团队协作。要知道,大型的人工智能项目开发不是某一个人的工作,而是需要整个团队的通力合作,需要工程师、数据科学家和研究人员之间相互协作,而云可以提供内置的协作工具,建立能够共享的开发环境,并且能对不同版本开发进行有效控制。所以,云和AI协作,打破了过去我们一直无非解决的数据孤岛难题。另外,如果开发者使用的是云原生解决方案,生成式AI开发会变得更加顺畅,他可以在云上进行调试、项目管理,实现简单的代码共享,极大地简化了生成式AI模型的开发、部署和管理过程。

  从数据管理的角度看,生成式AI模型需要注入大量的训练数据。借助云驱动的数据管理和存储解决方案,企业可以更好地进行存储、处理和管理这些数据,更好地训练企业需要的人工智能模型。通常,新一代人工智能模型依靠深度学习和机器学习来形成神经网络。神经网络复制了真实的人类大脑,它形成了一个由相互连接的节点组成的系统,可以更快更好地处理信息。一旦这个人工智能模型完成训练,它就会产生新的数据,这个过程称为推理。当用户提示输入图像或文本时,Gen AI可以根据提示生成数据。这就是为什么只有通过上下文关联技术以及采用丰富的数据集,进行大量训练,才能生成人工智能模型的根本原因。

  为了快速、低成本地处理数据,云提供了底层的数据处理能力,用户可以根据业务需求构建数据湖、数据仓库或数据管道,以满足数据的一致性性和高质量要求。

  安全性也是数据管理的核心能力。如果一个企业的模型是基于错误的数据进行训练的,最终将产生可不估量的损失。比如:如果受一些含有偏见、抄袭和操纵性数据的影响,将可能带来意想不到的风险。云则提供了天然安全的控制能力和相关工具,可以检测出用于大模型训练的数据中可能存在的潜在风险和偏见。

  云还提供了实时推理能力,帮助用户构建快速响应和低延迟的实时推理库。通过边缘计算,用户可以在在数据源附近部署训练有素的生成式AI 模型,最大限度地减少延迟并增强实时决策能力。尤其在语音生成和实时图像生成的场景下,这种能力非常重要。

  云与AI结合的典范

  1、亚马逊云科技:在生成式AI领域发展迅猛

  关于生成式AI,亚马逊云科技提供了三个关键解决方案——Amazon Bedrock、Amazon SageMaker和Amazon Titan。

  Amazon SageMaker Jumpstart为开发人员提供了600多个预训练的开源模型,用户可以将ML集成到他们的生产工作流程中。基于亚马逊云科技提供基础解决方案,用户可以构建用于访问、定制和部署新时代ML模型的环境,使得开发人员能够在最终部署之前训练和微调这些模型。

  亚马逊云科技Bedrock,你可以把它想象成是一个多模平台,用户可以在Bedrock上快速使用AI21Labs、Anthropic和Stability AI等领先初创公司的模型,创建生成式AI应用程序。同时,Bedrock也提供由亚马逊云科技内部团队开发的Titan基础模型目录。目前,Amazon Titan已被集成到很多人熟悉的业务服务中,如CodeWhisperer、Alexa、Rekognition和Polly。

  Amazon Bedrock有无服务器特性,开发人员可以根据自己的需求选择合适的模型,通过个性化基础模型设计,将其嵌入到应用程序中,通过亚马逊云科技的工具和技术进行部署。对于用户来说,使用Bedrock的好处是,用户可以直接测试、训练和使用这些模型,而无需关心整个基础架构的复杂性。

  值得注意的是,Amazon 正在计划推出一系列基础模型,补齐不同功能,如文字补全、聊天补全、代码补全和图像生成等。这些模型将与Amazon Bedrock集成,以进行进一步的微调。

  2、微软Azure:最大化实现OpenAI的商业化创新

  毫无疑问,微软在生成式AI领域绝对是一个重要玩家。微软与Open AI合作,推出了自己的基础模型Azure Open AI。Azure Open AI从Open AI中提取了大多数基础模型,并将它们集成到云中。诸如text-davinci-003、GPT -3.5和GPT 4-turbo等型号都集成到Azure中。用户使用微软Azure构建生成式AI的好处是,可以让数据保持高度安全的状态,通过专用虚拟网络访问大模型。

  同时,将基础模型与Azure ML集成,可以帮助客户访问各种库和工具,以更好的状态微调和使用这些模型。在微软的未来计划中,还会引入语义内核,更好地支持LLM编排服务,包括在增强和提示工程方面,加大部署力度。

  3、谷歌云:GenAI带来了云原生基础设施的变革

  当前,生成式AI在谷歌的搜索和云业务中已经在发挥重要作用。谷歌云提供了四个关键的基础模型:PaLM、cody、Imagen和Chirp,开发人员可以通过Vertex AI访问这些模型。Vertex AI还提供了一个模型花园,客户能够使用和微调各种模型。此外,谷歌还推出了GenAI Studio和GenApp Builders等无代码工具,用于创建生成式AI应用程序。

  为了增强DevOps中的生成式AI, Google已经在Google Cloud Shell、Google Cloud工作站和Google Cloud Console中嵌入了PaLM 2 API。所以,生成式AI已不只是谷歌云特有的一种能力,而是成为可以反向推动业务发展的加速器。

  受生成式AI影响的行业

  1、金融:生成式AI在金融公司中非常受欢迎。利用语言模型,金融公司可以为他们的座席提供更加个性化的服务,以提高客户的满意度,提高工作效率。大模型也可以应用于改进会话界面。这意味着生成式AI将为其代理增加更多的会话能力,使客户互动更加人性化。例如,全球保险索赔提供商Sedgwick,在其索赔处理系统中嵌入了ChatGPT的开放API版本Sidekick,以增强客户体验和索赔处理流程。

  2、制造业:在制造业,生成式AI可以增强产品生命周期管理、内容管理、数据分析质量控制、可编程逻辑控制器代码生成和生产计划等流程。

  3、医疗保健:生成式AI可以帮助简化知识管理流程,改进医疗专业人员之间的无缝信息流。此外,生成式AI可以帮助医疗部门整合患者病史,更好地评估疾病方案和诊治方式,以改进诊断和设计治疗计划。

  4、零售业:为了减少冗余,生成式AI可以帮助零售业优化时间,改善资源密集型工作,如撰写营销文案、产品页面描述和图像/视频描述等。例如,中国电子商务巨头京东将ChatGPT解决方案集成到其产品列表中,以便根据客户的需求和偏好描述定制产品。

  5、政府:生成式AI可以成为政府官员提升办公能力的一个很好的工具,政府官员通常会花费大量的时间和精力来管理大量的文书和文件。例如,葡萄牙政府将Chat GPT纳入其业务活动,向其公民,特别是移民和外地学生提供简洁和全面的法律信息。

  小结:

  生成式AI与云的结合,正成为推动科技进步和社会发展的强大引擎。随着技术的不断革新,我们见证了生成式AI在文本生成、图像创作、音乐制作等领域的广泛应用,而云计算则以其强大的计算能力和弹性伸缩的特性,为AI应用提供了稳定可靠的支持。

  展望未来,生成式AI与云的结合将继续深化,推动更多领域的智能化升级。可以想象,在医疗、教育、娱乐等各个行业,生成式AI将借助云计算的力量,为人们提供更加便捷、高效和个性化的服务。这是历史发展的必然,也是我们曾经想象的科技改变世界的模样。

0
相关文章