云计算·大数据 频道

封神大模型 Llama 3.1 405B 正式发布,主流云厂商纷纷跟进

  就在刚刚,美国科技巨头Meta推出迄今为止性能最强大的开源大模型——Llama 3.1 405B(4050亿参数),同时发布了全新升级的Llama 3.1 70B和8B模型版本。至此,开源大模型再上新台阶,对闭源大模型发出一记重拳。

  据资料介绍,Llama 3.1 405B支持上下文长度为128K Tokens,在基于15万亿个Tokens、超1.6万个H100 GPU上进行训练,这也是Meta有史以来第一个以这种规模进行训练的Llama模型。

  研究人员基于超150个基准测试集的评测结果显示,Llama 3.1 405B可与GPT-4o、Claude 3.5 Sonnet和Gemini Ultra等业界头部模型媲美。

  Llama 3.1的发布,对大模型的发展具有里程碑式意义,主流云厂商及时跟进,纷纷上架最新模型。

  1、Meta Llama 3.1模型现已在亚马逊云科技正式可用

  亚马逊云科技宣布,Meta刚刚发布的新一代Llama模型现已在Amazon Bedrock和Amazon SageMaker中提供。客户也可以在基于Amazon Trainium和Amazon Inferentia自研芯片的Amazon Elastic Cloud Compute(Amazon EC2)实例中部署这些模型。Llama 3.1模型是一系列预训练和指令微调的大语言模型(LLMs),支持8B、70B和405B三种尺寸,适用于广泛的使用场景。开发人员、研究人员和企业可以用此模型进行文本摘要和分类、情感分析、语言翻译和代码生成。

  2、阿里云国内首家支持Llama3.1训练推理

  Meta开源最新Llama 3.1系列,包括备受关注的4050亿参数 “超大杯”模型。阿里云魔搭社区第一时间上架全系列3款模型,阿里云百炼平台在国内首家推出针对Llama 3.1系列的训练、部署、推理服务,企业和开发者即日起可在阿里云上基于其打造自己的专属大模型。

  3、腾讯云上架 Llama 3.1模型,支持在 TI 平台精调和推理

  为了给企业、开发者提供更多元的模型选择,腾讯云 TI 平台迅速响应,国内首批完成Llama 3.1的适配和上架,支持一键发起精调和推理。腾讯云对该系列模型进行了精调、推理测试验证,保障模型的可用性、易用性,可覆盖智能对话、文本生成、写作等多个不同场景。

  从主流云厂商的最新动态来看,很多都是开源大模型阵营的忠实拥趸者,同时也是技术创新的先锋。开源大模型生态圈的蓬勃发展,有望拉开大模型开源和闭源的差距,吸引更多开发者的关注和使用。

0
相关文章