云计算·大数据 频道

零一万物大模型战略:既仰望星空,又脚踏实地

  这是一条史上最卷的赛道,我们要勇闯无人区……面对大模型的激烈竞争,躬身入局者无一例外都会经历艰难期。面对种种挑战,零一万物的打法是什么?

  在零一万物成立一周年之际,我们见到了久未谋面的创始人李开复老师,这也是他首度“现身说法”,亲自拆解开源与闭源、国内与国际多轨并行的大模型战略。

  当百模大战、千模大战开打,参战者无非分三类:一、大模型;二、小模型;三、中间模型。大模型,比拼的是模型参数、底层的算力,正所谓“力大出奇迹”;小模型的典型特征是可控、可制定、可交付;中间模型,可能比较接近于大多数企业的选择,既具备底座能力,又能满足用户多样化需求。

  那么,被业界寄予厚望的零一万物,正在布局怎样一种大模型之路?李开复的回答是:既仰望星空,又脚踏实地!

  以世界级开源产品赋能生态

  零一万物的企业愿景是,普惠大地,让所有用户受益。更进一步的理解是,打造一个全球化的大模型公司,让更多用户都更愿意使用最新应用。而在通往世界级大模型的路上,一定会面临开源与闭源的选择问题。

  针对开源路线,如何打造世界级大模型,对标Llama、Claude、GPT、Gemini,甚至超越这些产品?

  李开复介绍道,零一万物在去年11月份发布了Yi 开源模型,6B和34B,已得到国际认可。今天,Yi-1.5升级将刷新所有指标,把开源产品推向全球。

  到目前为止,除了6B、9B、34B,零一万物的预训练模型,还有Chat模型,都免费对全世界开放。这些模型中英文俱佳,一点都不输于市面上各种开源模型。

  在大模型应用中,有一部分人群是创业者、学生、老师、科研人员和公益组织,这类人群会觉得大模型很贵,无法更方便、快捷地去调整数据和模型参数。面对这样的需求,零一万物连夜在Hugging Face、魔搭社区发布六款开源模型。

  走开源路线,并不只是简单地发布几款产品,还要思考如何去维护社区。零一万物在开源社区运营过程中,做了很多工作,这些工作也取得了初步成果。从学习导航、销售到API的应用,商业写作,都已经有了早期用户,社区受欢迎的程度,有目共睹。

  开源地址:Hugginf Face https://huggingface.co/01-ai

  魔搭社区 :https://www.modelscope.cn/organization/01ai

  以AI-first闭源路线探索商业化

  与开源对应的闭源路线的发展,做世界级的产品,开源与闭源并不是非此即彼。

  开源重发展生态,而闭源是在获客基础上,让公司的整体运营始终可持续。为了打造更有竞争力的闭源产品,零一万物最新推了Yi-Large千亿参数的大模型。

  众所周知,在大模型领域,GPT-4已是金标准,Yi-Large参考的也是一系列国际指标。在斯坦福的开源评测项目 AlpacaEval 2.0 上,Yi-Large 控制了文本长度误差的胜率(LC Win Rate)排第二 ,略输GPT-4一点,但是在竞价胜出率 (Win rate)却赢GPT-4很多。

  在国内权威的通用大模型综合性测评基准SuperCLUE的评估中,在Yi-Large国产大模型中文评比中排在榜首。

  虽然,Yi-Large已经是最好的模型,但零一万物在大模型领域的创新并不仅限于此。

  “我们在训练更大的模型Yi-XLarge,这是一个基于MoE架构的模型,已经有初步训练成果。”李开复强调,虽然 Yi-XLarge还尚未发布,但非常值得期待。

  那么,大模型的未来,只会是参数越来越大吗?为什么有人会说模型越大越难用?国内大模型赛道的参与者,从狂奔到长跑,到底如何有效达到PMF(产品市场匹配度)?答案别无其他,只是因为有人在短暂的时间里做出了很棒的用户体验。所以,做大模型不能胡乱烧钱,AI2.0时代还要考虑TC-PMF(Product-Market-Technology-Cost Fit,技术成本 X 产品市场契合度)。

  换言之,零一万物要做一个务实的AGI信仰者,把模型尺寸压缩下来,把推理成本降下来。除了以万知AI为突破口,打造2C领域的数字办公场景,零一万物也在2B方面进行探索,与世界500强企业达成合作。

  零一万物不只从模型本身入手,苦练内功。在底层的基础设施层面,也在发力。这是零一万物大模型的另一个特点,即“模基共建”,模型团队和Infra架构团队相互协作,共同作战。英伟达曾分享过NVIDIA GPU 架构下的 FP8案例,零一万物就是FP8训练框架的三个最 佳 实践之一,与Google、Inflection AI齐名。

  展望未来,全球大模型市场的潜力和活力仍在不断发酵和壮大。我们欣喜地看到,很多企业都在这片新的蓝海中,各自以不同的策略和方向探索前行。

  不可否定的是,超大模型的训练将仅限于少数几家巨头,他们将以高昂的成本构建其技术底座。与此同时,众多公司也在积极寻求更加普惠和实用的解决方案。他们或是聚焦于打造尺寸适中、更具实用价值的AI模型,或是探索超小模型的可能性,还有的公司则致力于开源技术的研发和应用。这些努力,正是零一万物所看重的方向,也是推动AI技术走向更广泛应用的关键。

0
相关文章