技术卓越奖:百度智能云百舸异构计算平台
一句话点评:不仅在技术层面上实现重大突破,也是AI应用领域的里程碑,标志着AI计算平台在效率与稳定性上的双重提升。
▲技术卓越奖:百度智能云百舸异构计算平台
简介:
百度百舸异构计算平台(AI Heterogeneous Compute,简称AIHC)是面向大规模深度学习的高性能云原生AI计算平台,为模型算法专家和运维专家提供全面的集群运维支持和任务全生命周期管理,同时具备训练/推理加速、故障容错、智能故障诊断等高级功能,有效训练时长可达99.5%以上,大幅提升算力使用效率,助力企业在大模型时代的业务转型。
获奖理由:
百度智能云百舸异构计算平台的亮点:推出了“多芯混训”能力,这一创新技术使平台能够在万卡规模集群上实现95%的多芯混合训练效能,极大提升了训练效率;在集群部署环节,展现其卓越的性能表现,尤其针对大规模集群的应用场景,将运行准备时间从数周缩短至最快1小时;全面升级了故障检测手段和自动容错机制,有效降低了故障发生频次,并大幅缩短了集群故障的处理时间;通过对推理速度和成本的调整,长文本推理的效率提升了超过一倍。