封神大模型 Llama 3.1 405B 正式发布，主流云厂商纷纷跟进-云计算·大数据专区

封神大模型 Llama 3.1 405B 正式发布，主流云厂商纷纷跟进

作者：李代丽编辑：李代丽 2024-07-24 17:46 来源：ITPUB

　　就在刚刚，美国科技巨头Meta推出迄今为止性能最强大的开源大模型——Llama 3.1 405B（4050亿参数），同时发布了全新升级的Llama 3.1 70B和8B模型版本。至此，开源大模型再上新台阶，对闭源大模型发出一记重拳。

　　据资料介绍，Llama 3.1 405B支持上下文长度为128K Tokens，在基于15万亿个Tokens、超1.6万个H100 GPU上进行训练，这也是Meta有史以来第一个以这种规模进行训练的Llama模型。

　　研究人员基于超150个基准测试集的评测结果显示，Llama 3.1 405B可与GPT-4o、Claude 3.5 Sonnet和Gemini Ultra等业界头部模型媲美。

　　Llama 3.1的发布，对大模型的发展具有里程碑式意义，主流云厂商及时跟进，纷纷上架最新模型。

　　1、Meta Llama 3.1模型现已在亚马逊云科技正式可用

　　亚马逊云科技宣布，Meta刚刚发布的新一代Llama模型现已在Amazon Bedrock和Amazon SageMaker中提供。客户也可以在基于Amazon Trainium和Amazon Inferentia自研芯片的Amazon Elastic Cloud Compute（Amazon EC2）实例中部署这些模型。Llama 3.1模型是一系列预训练和指令微调的大语言模型（LLMs），支持8B、70B和405B三种尺寸，适用于广泛的使用场景。开发人员、研究人员和企业可以用此模型进行文本摘要和分类、情感分析、语言翻译和代码生成。

　　2、阿里云国内首家支持Llama3.1训练推理

　　Meta开源最新Llama 3.1系列，包括备受关注的4050亿参数 “超大杯”模型。阿里云魔搭社区第一时间上架全系列3款模型，阿里云百炼平台在国内首家推出针对Llama 3.1系列的训练、部署、推理服务，企业和开发者即日起可在阿里云上基于其打造自己的专属大模型。

　　3、腾讯云上架 Llama 3.1模型，支持在 TI 平台精调和推理

　　为了给企业、开发者提供更多元的模型选择，腾讯云 TI 平台迅速响应，国内首批完成Llama 3.1的适配和上架，支持一键发起精调和推理。腾讯云对该系列模型进行了精调、推理测试验证，保障模型的可用性、易用性，可覆盖智能对话、文本生成、写作等多个不同场景。

　　从主流云厂商的最新动态来看，很多都是开源大模型阵营的忠实拥趸者，同时也是技术创新的先锋。开源大模型生态圈的蓬勃发展，有望拉开大模型开源和闭源的差距，吸引更多开发者的关注和使用。

关注我们