云计算·大数据 频道

加快推进AI开发进程,MongoDB发布Voyage模型新系列

  MongoDB持续发力,将AI开发置于优先战略地位,并于近日推出了Voyage模型新系列。

  Voyage重塑数据检索格局

  四个月前,MongoDB宣布推出了模型上下文协议服务器以及助力客户现代化数据基础设施的人工智能驱动服务。时隔四个月后,MongoDB再创佳绩,于周四重磅发布了五个Voyage AI嵌入和重新排名模型。这一举措旨在帮助用户构建坚实的数据层,为代理和其他AI工具提供精准、高效的智能数据处理支持。

  Voyage AI如今已成为MongoDB嵌入和重新排名模型套件的核心组成部分。其背后有着一段特殊的渊源——2025年2月,MongoDB收购了这家AI初创公司,自此开启了在AI领域的深度探索。此次最新Voyage模型的普遍可用,意义非凡。它不仅消除了系统之间数据移动的繁琐需求,简化了构建分析和AI应用程序所需的基础设施,还显著提高了向量搜索的准确性,为企业AI开发提供了有力保障。

  除了Voyage模型新系列,MongoDB还带来了一系列令人瞩目的新功能。为MongoDB Compass和Atlas Data Explorer量身打造的AI驱动助手闪亮登场,用户只需使用自然语言,就能轻松与系统进行交互,大大降低了操作门槛。在MongoDB Vector Search方面,新增的功能更是实现了数据摄取、更新或查询时的自动向量嵌入生成,进一步提升了数据处理效率。

  麦克奈特咨询公司总裁威廉·麦克奈特对这些新功能给予了高度评价。他认为,这些功能集体发力,意义重大。当这些模型与运营数据和向量搜索深度集成后,便形成了一个用于分析和人工智能的统一数据智能层。这一创新成果精准地攻击了AI计划中最大的实际失败点——承诺的演示与实际运行业务系统之间的差距,为企业AI项目的顺利落地提供了坚实支撑。

  借AI增强竞争优势

  在激烈的市场竞争中,MongoDB的新功能无疑为其增添了强大的竞争力。与Amazon DynamoDB、Apache Cassandra、Couchbase、Snowflake和Redis等竞争对手相比,MongoDB基于云的服务MongoDB Atlas本就具有一定的市场影响力,而新功能的加入更是如虎添翼。

  威廉·麦克奈特指出,新功能有望增强MongoDB在处理大规模数据和提供流畅体验方面的竞争优势,加速其在人工智能驱动应用程序中的采用进程。在当今数字化时代,数据规模不断扩大,企业对数据处理和AI应用的需求也日益增长。MongoDB凭借其不断创新的功能,正好满足了市场的这一迫切需求,有望在竞争中脱颖而出。

  尽管近年来许多企业高度重视AI开发,数据管理和AI供应商也纷纷努力在平台上营造易于构建AI工具的环境,但大多数AI项目仍然难以跨越试点阶段。碎片化的系统和组织不力的数据资产,使得相关数据难以被发现,成为企业在开发代理和其他应用程序时面临的诸多难题之一。

  Databricks推出的Instructed Retriever,作为检索增强生成管道的替代品,通过附加规范增强用户查询,在一定程度上帮助用户发现了相关信息。而MongoDB则另辟蹊径,没有选择开发新的数据检索方法,而是致力于改进对数据进行分类的模型,以提高数据的可发现性。这一决策源于MongoDB与客户的深入交流。

  MongoDB高级副总裁兼核心产品负责人Ben Cefalo在1月12日的虚拟新闻发布会上透露,在过去几个月里,他们与无数客户进行了沟通,了解到在人工智能从原型到生产的过程中,检索环节容易出现问题。当人工智能从演示迈向生产级应用时,检索碎片化和准确性下降的问题屡见不鲜。

  The Voyage 4系列模型正是MongoDB为解决这一问题而推出的创新成果。它代表了MongoDB在改进检索方面的积极尝试,旨在促进更成功的AI开发。同时,原生集成Voyage模型致力于打造一个统一的数据平台,让AI开发无需客户再费心拼凑管道。Ben Cefalo强调:“在一个AI世界里,光有数据库是不够的。”

  向量搜索和存储在AI领域的重要性日益凸显。自OpenAI于2022年11月推出ChatGPT后,生成式人工智能(GenAI)的兴趣激增,向量搜索和存储迅速成为AI管道的关键元素。向量嵌入作为数据(包括文本和图像等非结构化数据)的数值表示,使数据易于被发现。由于数值表示符号化了数据的基本特征,向量嵌入还能实现相似性搜索,提高搜索响应的相关性。

  嵌入模型能够自动分配向量嵌入,而排序模型则负责对搜索结果等项目列表进行优化和重新排序,使AI输出更加相关。MongoDB的新Voyage 4模型各具特色,均包含嵌入和检索功能,旨在提高AI管道中的检索准确性。通用的voyage - 4模型在检索准确性、成本和延迟之间取得了巧妙平衡;voyage - 4 - large模型则以提供最高的检索准确性为亮点;voyage - 4 - lite专注于优化成本和延迟;voyage - 4 - nano则专为本地开发和测试而设计。

  此外,MongoDB还推出了voyage - multimodal - 3.5,这一创新成果使用户能够为视频分配向量嵌入,除了文本和图像嵌入外,进一步拓展了数据处理的边界。

  Omdia公司分析师Stephen Catanzano对这些模型给予了充分肯定。他认为,Voyage 4系列的嵌入模型使用户能够在优化成本和延迟的同时,实现最 先进的检索准确性。而且,这些模型引入的视频处理功能,扩展了开发人员可以构建的应用程序范围,无需进行广泛的架构更改,为AI开发带来了更多可能性。

  威廉·麦克奈特也指出,Voyage 4模型的价值不仅体现在提高检索准确性和处理视频内容上,还在于它们允许用户在不重写代码的情况下轻松切换模型,为用户提供了更大的灵活性和便利性。

  通过实用新功能提升用户体验

  除了引人注目的Voyage模型新系列,MongoDB还带来了一系列实用的新功能。在MongoDB向量搜索中自动生成的向量嵌入,彻底消除了单独嵌入管道的需求,类似功能已在MongoDB社区版公开预览,为用户提供了更加便捷的数据处理方式。

  MongoDB Compass和Atlas Data Explorer中的AI助手,成为用户与系统交互的新桥梁。用户只需使用自然语言,就能轻松完成各种操作,大大提高了工作效率。用于向量搜索的词法预过滤器,为开发人员构建语义搜索界面提供了高级过滤功能,使搜索结果更加精准。

  全新的统一网络界面,使用户能够通过AI辅助在所有MongoDB Atlas集群中开发复杂的查询,简化了查询开发流程。人工智能技能认证则为数据和人工智能团队提供了提升自身能力的机会,帮助他们扩展数据战略,加速开发周期。

  威廉·麦克奈特认为,除了Voyage AI模型外,自动生成的向量嵌入和AI驱动的助手是MongoDB的亮点新功能。这些功能共同作用,大幅降低了运营成本,使团队能够顺利从原型过渡到关键任务生产,同时简化了架构,为企业AI发展提供了有力支持。

  Stephen Catanzano也强调了自动生成向量嵌入和智能助手的重要性。前者消除了对外部嵌入管道的依赖,简化了架构;后者提供了量身定制的、内置的AI指导,减少了开发者在进行复杂数据操作时的摩擦,提升了开发体验。

  从整体发布来看,Stephen Catanzano将这些新功能视为“重要的”举措。它们不仅解决了与AI部署相关的关键挑战,还从竞争角度帮助MongoDB实现了差异化发展。通过在单一系统中统一操作数据和检索,MongoDB减少了延迟和复杂性,满足了企业对于具备全部人工智能功能的数据平台的强烈需求。MongoDB不仅提供了众多实用功能,还拥有强大的零部件生态系统,能够填补任何空白,为企业提供全方位的支持。

  持续改进,拥抱AI发展新征程

  尽管新功能为企业构建AI工具带来了一定的便利,解决了部分难题,但MongoDB在竞争激烈的市场中仍需不断努力,以进一步改善其竞争地位。

  威廉·麦克奈特提出了一系列建议。他认为,MongoDB应改进大规模JSON插入操作,目前这些操作比统一平台慢,同时提升JSON查询性能,目前这一性能落后于现代统一引擎。此外,MongoDB还应加强与第三方平台的兼容性,使客户能够更轻松地配置定制的数据和AI堆栈。为将MongoDB与其他系统集成的用户提供更多指导,并添加与开发者平台的集成,也是提升竞争力的关键举措。这些改进将直接解决MongoDB在大规模场景中的已知弱点,同时保持其作为灵活的、对开发者友好的文档数据库的核心优势,以支持通用工作负载。

  Stephen Catanzano也建议MongoDB与第三方AI框架和流行的开发者平台进行深度集成。此外,专注于实时分析和预测建模能力可能会吸引新用户,进一步巩固其作为人工智能驱动数据平台的领导者地位。

  MongoDB此次发布的Voyage模型新系列和一系列新功能,无疑为AI开发领域带来了新的机遇和挑战。在未来的发展中,MongoDB能否持续创新,不断改进和完善自身功能,满足企业日益增长的AI需求,我们拭目以待。相信在MongoDB的努力下,AI开发将迎来更加美好的明天,为企业数字化转型注入强大动力。

0
相关文章