云计算·大数据 频道

AliSQL DuckDB 全面开源,MySQL在AI时代分析场景继续发光发热

  2026年,数据库圈依然“战事不断”。一边是开源社区对Oracle主导MySQL开发的不满终于爆发,一群核心用户公开呼吁成立独立基金会,担心MySQL失去活力;另一边,PostgreSQL的势头越来越猛,DB-Engines排名稳居第四,成为主流关系型数据库中增长最快的开源项目。

  与此同时,更大的变量来自AI 。Agentic AI时代,数据库不再只是存数据的“仓库”,而是开始变成AI代理的安全层、治理层和执行层。当以OpenClaw为代表的各种龙虾们(包括RDS也推出了RDSClaw)开始自主操作数据库,传统服务模式还能撑多久?这可能是很多数据库产品不得不进行智能化变革的根本原因!

  接下来,我们重点聊聊开源数据库与AI结合,将碰撞出怎样的火花?

  过去,MySQL和PG被称为是“绝代双雄”。但两款产品的发展境遇并不相同,PG如今已是AI新增项目的“新宠”,而MySQL的未来则充满不确定性,8.0版本将在4月份终止社区支持。但有意思的一点是,MySQL突然在一段时间里“话锋一转”,成为AI增量客户的“旧爱”。

  AI时代,需要怎样的开源数据库?

  MySQL是从什么时候开始迎来重要“反转”的呢?此事还要从一个月前的AliSQL DuckDB全面开源说起!2026年2月份,阿里云瑶池数据库迎来里程碑杯式事件,AliSQL社区一口气开源三大能力:AliSQL DuckDB、AliSQL向量化引擎、AliSQL-CLI工具。这不是一次普通版本更新,而是数据库领域的一次重要变革。

  基于AliSQL最新开源能力,用户可以用最短链路拥有AI就绪的数据底座;而对于DBA“老哥们”来说,也可以再“吃一波”MySQL技术红利!

  “今天的AliSQL已经不再是原有MySQL的内核级优化,而是进化为AI时代最开放的数据底座。”阿里云数据库产品事业部RDS产品部负责人陈宗志(花名:暴跳),在接受ITPUB独家专访时直言。

  这句话的分量,圈内人都懂。

  一直以来,MySQL就像一个只擅长TP的“瘸腿巨人”,OLAP数据处理能力始终是短板。尤其在AI时代,MySQL的功能更新更是慢如“蜗牛”,无法满足用户AI就绪、AI原生目标,以至于有大量用户在增量场景更愿意选用PostgreSQL。面对PG的大幅赶超,MySQL的关注度开始断崖式下跌,有些声音甚至认为:MySQL不行了!

  那么,AliSQL是如何“扳回一局”,让MySQL“起死回生”,并获得AI时代技术竞争力的呢?

  首先,我们需要明确一个观点,“不是PG抢了MySQL的存量市场,而是PG占据了AI时代的新增市场”,这个区别点至关重要!

  在推进MySQL智能化变革这件事上,AliSQL可以说是“未卜先知”,精准捕获到市场动向。同时,受益于AliSQL 与AMD 的深度协作,联合发布面向HTAP场景深度调优的 AliSQL DuckDB+ 9代 AMD机的高性能分析解决方案,打造出了AI时代“性能组合拳”,使得MySQL在AI时代又重新迸发新的勃勃生机!

  MySQL怎么就又“行”了?

  “我不仅负责MySQL,我也负责PG团队。” 面对MySQL到底还行不行的质疑,暴跳先“叠了个甲”。

  确实,从市场发展现状来看,PG在国外的流行度已超过MySQL,是过去十年中增长最快的数据库之一。但从市场占有率来看,MySQL在2025年的市场份额为40-42%,远高于PostgreSQL的17%。尤其在国内商业化领域,MySQL在存量市场仍占据绝对优势。

  而从技术变化的本质来看,PG在AI时代流行,是因为它的插件化体系正好命中AI Agent的需求。因为,在AI Agent场景下,用户更希望一个数据库解决所有问题,不管是向量、文档、全文检索,PG都能在一个数据库内完成。虽然,PG的单项能力可能不是最优,但对AI Agent来说,够用就好。反观MySQL,拥抱AI也是大趋势,但明显节奏慢了许多,虽然MySQL9.0版发布了Vector数据类型与函数,但仅支持HeatWave,也就是Oracle的企业版。

  对于用户而言,是不是可以放弃MySQL,选择PG?显然,这不是最明智选择!不只是因为MySQL有大批存量客户,更重要的是它有强大的在线数据处理能力。即便在今天这种大型互联网交易业务场景,MySQL的高吞吐、高负载和高并发能力,也是无法取代。

  既然MySQL依然重要,并想继续向前发展,必然要走与PG相同的路线,那就是更好地去满足AI Agent时代用户对于数据库的多样化需求。这也是以AliSQL为代表的主流社区以及相关的内核开发人员,正在努力的方向,希望通过向量化能力、CLI工具的支持,让MySQL也能成为AI时代的第一选择。

  问题是,MySQL是一个传统的关系型数据库,引入向量引擎只是AI转型的第一步,最重要的分析能力如何解决?换句话来说,在AI浪潮席卷全球的当下,如何既保持MySQL的使用习惯,又能满足分析性事务需求?

  早期用户会选择拉长ETL数据链路的方式,实现“曲线救国”目标,比如:通过MySQL+ ClickHouse或者MySQL+ HBase的方式,满足数据处理需求。同时,还有一部分用户会走MySQL开源分支路线,比如:通过AliSQL、MariaDB这样的开源产品,倒逼MySQL上游社区做出策略调整。

  此次,AliSQL DuckDB开源,就是数据库智能化变革的一个产物,也是MySQL与AI结合过程中用户急需、但却是最缺少的一些能力。

  AliSQL做对了什么?

  至于,AliSQL 是谁?它和RDS又是怎样一种关系?用户在RDS和AliSQL之间该怎么选?这些问题看似简单,但却一直让外界困惑!

  “AliSQL是当年阿里巴巴集团在去IOE大背景下孵化出来的MySQL独立分支。RDS MySQL正是基于AliSQL内核的商业化产品。” 阿里云数据库产品事业部RDS产品管理负责人许鸿斌(花名:洛霄)解释道。

  在人们的潜意识里,一般是先发展开源社区,然后再从开源社区孵化出商业版。但对很多国内互联网大厂来说,刚好相反。一般是先做自己的商业版,然后再把一些社区需要的能力开放出来。RDS正式在此种背景下诞生,走的是先商业后开源路线。如今,AliSQL已经成长为MySQL内核优化技术社区中不可或缺的一支重要力量。

  AliSQL发展历程如下:

  2010-2015年:破晓诞生,去IOE攻坚

  打造MySQL分支AliSQL,对淘宝商品库进行改造,开始去IOE,承接原Oracle 全部核心业务,成功支撑双11的数据洪流;

  2016-2020年:全面开源,生态跃迁

  AliSQL正式开源,从5.6迭代进入5.7和8.0时代,性能持续跃升,并衍生出许多商业化明星产品,成为云原生数据库生态基石;

  2021-2025年:主打融合和智能进化

  首 创融合DuckDB列存引擎,为MySQL体系注入开源HTAP能力,一份数据同时服务交易与分析,同时深度集成Vector向量索引,构建AI应用的数据基座,支撑语义搜索、大模型上下文管理等新兴场景;

  2026年:重启,再创,向新而生

  AliSQL再度出发,奔向下一代数据库高地,AliSQL DuckDB、AliSQL向量化引擎、AliSQL-CLI三大能力开源,让用户拥有最短链路的AI就绪数据底座。

  面向未来,AliSQL和RDS MySQL将是“双轨并进”机制,如果你希望采用开源的技术栈构建自己的数据链路,那你就选择AliSQL,如果你觉得很多云上的定制化需求不适合开源,那就采用RDS。

  DuckDB为什么重要?

  值得一提的是,虽然AliSQL DuckDB刚刚开源,但并不是一个“实验室”产品,已经有很多知名企业通过RDS在实际生产场景使用了AliSQL DuckDB,比如:小红书。

  这里,需要明确的一个重要话题点是,DuckDB是怎样一种存在,为什么对AliSQL如此重要?这要回到前文,依然是ETL问题!

  AI时代,什么最重要?明显是数据!打造智能数据底座需要什么?答案是:就绪速度!传统的数据分析链路有多长?数据从MySQL导出,经过ETL工具清洗转换,加载到专业数据仓库,再通过接口提供给AI模型训练。这一路下来,没有三五个环节、不耗费几小时甚至几天,数据根本到不了AI模型里。

  现在,有了AliSQL DuckDB,一切都变了。用户可以直接在MySQL内部完成数据分析,数据不再需要“搬家”,AI模型可以直接在数据库内部获取训练数据。这个链路缩短了多少?你可以把它看作是“跨省物流”变成了“同城闪送”,用户将用最短链路拥有AI就绪的数据底座。

  想象一下,一家电商公司的推荐系统需要实时分析用户行为数据。以前需要将数据同步到专门的数仓,现在直接在业务数据库里就能完成分析,响应时间从分钟级降到秒级。这个速度差,在AI竞争白热化的今天,在内存和存储大幅涨价的当下,AliSQL DuckDB可能给了很多人一条活路。

  用暴跳的话来说,DuckDB列式存储引擎的引入,使得用户可以在不改变现有应用架构的前提下,轻松获得高达200倍的分析查询性能提升。更重要的是,用户可以使用MySQL协议、沿用熟悉的SQL语法、无需学习新工具、无需改造应用程序。一键创建、自动同步、无缝切换,真正做到了“分析能力即服务”。

  虽然,DuckDB是一家来自荷兰的创新型数据库产品,但也是稳健、成熟的代表,以其轻量级设计和卓越的数据分析能力而著称,目前已经在GitHub上得到广泛关注。为了进一步推动DuckDB社区的繁荣发展,AliSQL与DuckDB官方(DuckDB社区、DuckDB Labs.)签署了战略合作协议,双方从Bug report、patch的提出,到品牌活动的开展等,都有深度合作。

  当然,软件能力提升只是其中一个方面。在AI数据底座的构建中,软件能力再强,也离不开硬件算力的坚实托举。当AliSQL DuckDB将列式分析、向量化执行与MySQL生态无缝融合时,一个更深层的命题浮出水面:如何让这份“数据库级智能”,真正跑在最适配的硅基引擎上?答案是——软硬协同的深度优化。

  近年来,AliSQL 也与AMD 深度协作,联合发布面向HTAP场景深度调优的 AliSQL DuckDB+ 9代 AMD机的高性能分析解决方案,打造出了AI时代“性能组合拳”。受益于AMD EPYC高性能服务器CPU的代际持续迭代,第9代机型搭载的是第五代AMD EPYC处理器(代号为Turin)。在CPU的性能规格上,相比上一次Genoa(8代机型),在Zen架构,算力IPC,内存带宽和能耗上都有大的飞跃,9代AMD机依托的Zen5架构比上一代Zen4的IPC综合提升了17%,其中针对AI算力提升了37%,同时内存的带宽也提升了33%,支持了全链路的AVX512指令集,工艺节点上采用了更先进的TSMC 3nm/4nm工艺。收益于全新的CPU技术,从而在标准TPC-H sf100基准测试中,搭载 9代AMD 机型的AliSQL DuckDB集群,相较上一代机型(8代),整体分析查询性能提升50%,查询耗时也大大缩短。

  为什么说AliSQL已从“MySQL内核优化”走向“超越”?

  如果说DuckDB解决了分析能力问题,那么同期开源的AliSQL向量化能力则是数据库变革的另一枚重磅“炸弹”。

  AliSQL的向量化方案,是基于MariaDB方案的改进,并且直接集成到MySQL代码中,性能对标的是pgvector。更重要的是,它解决了用户的现实痛点,如果你的数据都在MySQL里,既有向量需求又有标量需求,没必要再迁移到另一个数据库。这样传统MySQL的DBA也能在AI时代进一步创造价值。

  那么,有了AliSQL的向量化方案,传统向量数据库还有发展空间吗?暴跳的观点是,企业级应用场景大部分是向量+标量结合,即“先用标量过滤,再用向量匹配”,有了AliSQL可以一体化实现向量+标量数据的处理;但这并不意味着纯向量数据库会消失,比如:图片相似度匹配等场景,就是纯向量数据库的“刚需”。这就像Elasticsearch和MySQL全文检索的关系,大部分场景有MySQL的FTS就够了,但少数专业场景需要专用引擎。

  面对AI时代的数据底座构建,除了用AliSQL DuckDB解决列存数据分析问题、用向量化方案支持向量数据的检索,还有一个能力也特别重要——那就是智能CLI,这是让大模型“听懂”数据库的关键能力。

  “传统的MySQL CLI工具,和大模型结合有门槛,新的智能CLI直接内置了与大模型的连接能力。” 洛霄解释道。

  如何理解智能CLI的工作原理?比如,你想知道今天MySQL为什么慢,可以直接在CLI里提问,工具会结合当前情况,给出智能诊断和分析。更厉害的是,智能CLI可以用自然语言查询,即便你不会写SQL,也可以直接说“我想查什么”,系统会帮你转换成SQL并执行。有了智能CLI,可以大幅降低AI的使用门槛,哪怕是线下环境,也不用额外购买Agent产品,CLI直接帮你把数据和大模型结合。

  开源意味着什么?如何看待MySQL社区的中国力量?

  很明显,AliSQL社区最新开源的诸多产品能力,都是MySQL走向AI时代的“必备武器”,已经超越了一个普通分支社区的范畴。那么,AliSQL社区的未来定位是什么?在国际舞台上扮演什么角色?

  “我们从来没定位自己只在国内做社区。” 暴跳的回答,暴露了AliSQL一个更大的“野心”。

  可能很多人还不知道,暴跳是一个真正的“技术极客”,他曾是MySQL官方国内Bug提交最多的开发者,如今也一直积极与国际社区交流,希望把AliSQL社区的最新方案贡献到国际社区,让MySQL上下游生态繁荣发展。

  众所周知,Oracle裁了大量MySQL开发人员,这让社区比较悲观。对于很多做了十年内核开发的老DBA来说,不希望社区走下坡路,甚至被时代抛弃。AliSQL社区的使命很明确,那就是给MySQL社区持续贡献力量,让它在AI时代“不掉队”。

  未来,AliSQL社区还有两个重要的规划方向:一个是与数据湖集成,让AliSQL成为“对数据湖更友好的数据库”。基于AliSQL,用户就能把数据转成Iceberg格式,存到S3或其他存储中,下游的Spark、Flink、DuckDB都能直接分析,真正实现“一次写入,多次分析”,彻底消除ETL流程;另一个是把更多企业能力开源,比如:把大事务优化、秒杀场景优化等企业版能力,逐步开源到社区版。

  写在最后

  从收割MySQL的红利,到把AliSQL的贡献回馈给社区,MySQL在AI时代的“反转”,或许是中国开源力量成长的一个缩影。为了让MySQL在AI时代崛起,AliSQL已经迈出最坚实的一步!相信,AliSQL 最新能力开源之后,不仅会让MySQL社区走向繁荣发展的新征程;对于用户来说,也将是一大福利,这意味着企业将以最短链路实现智能化数据底座的升级。

0
相关文章