别再只争 Claude Code 和 Codex:下一层是 Agent Harness
Databricks Omnigent 说明,AI Agent 的竞争正在从单个工具能力,转向控制、协作、审核和多 Agent 工作台。

别再只争 Claude Code 和 Codex 谁更强了。
对深度 AI 用户来说,更难的问题已经不是某一个 Agent 能不能写代码、能不能完成任务。
更难的是:人类怎么操控一群 Agents,而不是坐在电脑前当 AI 保姆。
6 月 13 日,Databricks 发布了 Omnigent。它把自己定义成一个开源 meta-harness:站在 Claude Code、Codex、Pi 和自定义 agents 之上,用来组合、控制和分享 agent sessions。
这件事值得看。
下一层竞争,不只是哪个模型更聪明,而是谁能让人类真正管理一群 Agents。
Agent Harness 到底是什么
Agent Harness 不是模型。
模型是 GPT、Claude、Gemini、Qwen、Kimi 这一类东西。
Agent Harness 也不是聊天框。
Harness 更像让模型真正跑起来的执行框架。它把模型接到文件、终端、浏览器、Git、工具、权限、日志、任务状态、上下文和人类确认。
简单说:
模型 + Harness = 正在工作的 Agent。Claude Code 好用,不只是因为 Claude 会写代码。它好用,是因为 Claude 被放进了一个适合写代码的 Harness:能读 repo、改文件、跑命令、看 diff、遵守项目规则。
Codex 也不只是一个代码模型。它也是任务环境、隔离执行、diff 管理和交付流程。
Cursor 表面是 IDE,但更深的变化也是一样:产品正在变成 Agent 工作台。
为什么 Omnigent 值得看
Databricks 在博客里说,他们内部经常同时开着四五个 Agent:coding agents、Gemini search、内部 agents、文档、Slack 和协作工具。
这很熟悉。
AI 本来是为了减少切换,结果深度用户开始在多个 AI 员工之间搬运上下文。
Omnigent 想做的是在这些 harness 之上加一层共享接口。官方给出的三个关键词很清楚:
- 组合:不用重写所有东西,就能组合多个 agents、models 和 harnesses。
- 控制:在 prompt 之上,用更高层的策略管理成本、权限和状态。
- 协作:分享 live sessions,让同事一起 review、评论和接管。
所以它叫 meta-harness。
它不是又一个单独 Agent,而是管理 Agents 的一层。
为什么单个 Agent 不够
真实工作不是单线程。
一个 Agent 写代码。一个 Agent review。一个 Agent 查文档。一个 Agent 跑测试。一个 Agent 看 UI 细节。真正的问题不再是「谁最强」,而是「谁适合干哪一段」。
这本来就是团队工作的方式。
同样的结构正在进入 AI Agents。
单个 Agent 可以很强,但依然难管理。它会改太多文件,会陷入循环,会漏掉需求,会误解目标,也会给出一个看似完整但方向错了的方案。
于是深度用户开始遇到一个新问题:AI Babysitting。
你让 Agent 跑任务,但你不敢真的走开。你要一直看它有没有跑偏。
更好的系统,不应该让人一直盯着 Agent。
它应该让 AI 执行更多,让人类管理目标、判断结果,并在关键节点介入。
团队接下来应该看什么
对企业来说,Agent Harness 会变成基础设施问题。
不要只问一个工具用了哪个模型。
更应该问:
-
它怎么运行 Agent?
本地机器、云端沙箱、共享工作区,还是隔离环境? -
它怎么管理权限?
Agent 能碰哪些文件、凭证、工具、API 和代码仓库? -
它怎么展示过程?
团队能不能看到工具调用、终端命令、Git diff、浏览器操作和生成文件? -
它怎么支持协作?
一个 agent session 能不能分享、review、评论、接管? -
Agent 能不能替换?
今天 Claude Code 更好,明天 Codex 更便宜,工作流能不能继续? -
人类在哪里批准或叫停?
自动化越强,判断越要可见。
这些不是小产品细节。
它们决定 Agent 是个人小技巧,还是团队基础设施。
这和 Buda 有什么关系
Buda 不应该被理解成另一个聊天框。
它更接近一个协作型 AI Agent Workspace:Agent 有 session、Drive 知识、工具、沙箱、Channels、Terminal、Browser、Git 可见性,以及人类审核位置。
这和 meta-harness 的方向是一致的。模型会变,Agent 工具会变,团队会继续试 Claude Code、Codex、Cursor、Pi、开源 Agent 和本地模型。
真正应该沉淀的是管理层:
- 任务怎么拆;
- Agent 怎么分工;
- 权限怎么收口;
- 成本和进度怎么看;
- 人类怎么 review;
- 工作怎么分享,而不是锁在某个人电脑里。
未来不是一个超级 Agent 单独做完所有事。
而是人类通过一个工作台,管理一群能执行、可观察、可接管的 Agents。
在 Buda dashboard 探索多 Agent 工作方式。