当AI不仅能回答问题,还能直接操作你的浏览器、编写并执行代码时,软件开发的门槛似乎正在崩塌。谷歌的 Antigravity 项目,正是这一变革的前沿实验场——它将AI Agent深度集成进开发环境,描绘出一个用自然语言驱动一切的编程未来。但在炫酷的演示背后,它的实际表现更像是一个聪明却时常分心的“实习生”,能力超群,但远未达到可靠程度。
“便利性”与“不可预测性”让Agent成为“双刃剑”
作为谷歌的“亲儿子”项目,Antigravity与Chrome浏览器的结合,堪称是“无缝集成”。只要安装一个插件,你就能用最自然的方式对它下令:“帮我打开这个网页,抓取最新的产品价格列表。”
AIAgent会应声启动一个Chrome实例,执行点击、滚动、提取文本等交互操作。更令人印象深刻的是它的“应变能力”——当你要求对某个网站截图却发现未安装相应插件时,它不会卡死,而是会自主制定B计划,转而调用Python脚本和自动化框架来完成任务。
然而,这种高度的自主性也带来了应用上的不可控性。当你要求从知名影评网站RogerEbert.com提取最新评测的电影列表时,Antigravity Agent的表现暴露了其不可预测的一面:它可以自行决定略微向下滚动页面,导致完全错过了页面顶部最显眼的几部电影。相比之下,一个精心编写的Playwright自动化脚本,虽然缺乏“智能”,却能稳定、可重复地完成任务。
不可预测性背后,揭示了一个核心矛盾:如果你告诉AI,“要做什么”,它会立刻执行,但是它是如何理解并进行执行的,这是一个不可完全预见的“黑箱”。然而,在追求确定性的工程领域,这种不可预测性可能是致命的。
代码错误,早期产品的典型“暗礁”
使用前沿的AI Agent编程工具,几乎不可能一帆风顺。在测试中,Antigravity曾犯下一些令人啼笑皆非又值得深思的错误。
一次,它在编写代码时,误将一整段功能代码重复插入项目。它后来发现了错误,但发现方式颇具讽刺意味——竟是偶然注意到了另一个与项目无关的问题,才顺藤摸瓜回头检视。这一现象暗示其“检查”机制可能并非系统性的,而是带有些许运气成分。
另一个问题则更贴近工具本身的特点。如果你在IDE中创建一个Antigravity项目目录,随后将其移动到电脑的其他位置,一些依赖关系可能会静默地断裂,比如之前关联的“知识项”会丢失。目前,产品并未提供直观的修复方法。这些“坑”正是早期软件不够成熟的典型标志。
Antigravity vs. Kiro,智能编程之战正在开启
Antigravity主要竞争对手是 Kiro ,他们都在向“AI原生IDE”进军。它们的核心卖点都是提供一个统一的工作空间,而非将代码编辑器、终端、AI聊天机器人等工具生硬地拼接在一起。两者都采用“提示词驱动”的迭代方式来开发流程,都是通过用户描述需求来完成指令下达,然后通过AI Agent负责拆解、实现并不断与你确认。
以下为两者具体区别:
核心模型
谷歌 Antigravity: Gemini(双子座)系列为主,选择更为多元
竞争对手 Kiro:限于Claude Sonnet 4.0/4.5
模型部署方式
谷歌 Antigravity:目前仅支持云端API调用,即使你有本地硬件也无法托管私有模型
竞争对手 Kiro:同样依赖外部API
工作流特性
谷歌 Antigravity:功能相对基础,专注于核心的代理交互循环 更注重开发工作流,
竞争对手 Kiro:例如可定义“Agent Hooks”在保存文件等时点自动触发代理行为
发展阶段
谷歌 Antigravity:早期预览阶段,功能可能不完善
竞争对手 Kiro:相对更成熟,在开发者流程集成上思考更深
从开发体验来看,Antigravity尚未具备Kiro那样精细的流程自动化功能。但并不代表谷歌会永远输于对手,目前谷歌正在全力聚焦于更深层次的挑战,打磨AI Agent本身的行为逻辑、与用户的反馈循环,然后才会大规模添加外围的开发者功能,向正式的v1.0版本迈进。
结语:
就AI IDE的发展前景而言,用户需要的是“副驾驶”还是“自动驾驶”?
从Antigravity的体验过程来看,AI编程未来既要拥抱又需要提高警惕。AI IDE的出现,不仅展现了自然语言作为“终极编程语言” 的巨大潜力,也将当前技术的局限性暴露无遗。
AI IDE无疑是一个强大的“副驾驶”,能处理繁琐的重复操作、激发灵感,还可以快速进行原型验证。但当用户想把AI IDE当成“自动驾驶”应用时,就可能遭遇意想不到的滚动、莫名其妙的代码重复或出现环境配置的“幽灵”级错误。
很明显的一个趋势是,短期内你可以把它作为一个不知疲倦、能力多样的初级开发者或自动化脚本编写员,但其产出的每一个步骤、每一行代码,都需要经验丰富的人类工程师进行严格的审查、测试与整合。
最后,需要明确的一点是,谷歌Antigravity、Kiro等产品在AI IDE赛道的竞争,比拼的不仅是AI模型的强弱,更是对开发者真实工作流痛点的深度理解,以及考验的是构建一个可靠、可预测、可调试的AI Agent系统的工程能力。这场竞赛才刚刚开始,而最终的赢家,将是那个能让AI“智能”变得真正稳定和可信的工具。