别再只争 Claude Code 和 Codex:下一层是 Agent Harness

Databricks Omnigent 说明,AI Agent 的竞争正在从单个工具能力,转向控制、协作、审核和多 Agent 工作台。

Buda Team
返回博客
别再只争 Claude Code 和 Codex:下一层是 Agent Harness

别再只争 Claude Code 和 Codex 谁更强了。

对深度 AI 用户来说,更难的问题已经不是某一个 Agent 能不能写代码、能不能完成任务。

更难的是:人类怎么操控一群 Agents,而不是坐在电脑前当 AI 保姆。

6 月 13 日,Databricks 发布了 Omnigent。它把自己定义成一个开源 meta-harness:站在 Claude Code、Codex、Pi 和自定义 agents 之上,用来组合、控制和分享 agent sessions。

这件事值得看。

下一层竞争,不只是哪个模型更聪明,而是谁能让人类真正管理一群 Agents。

Agent Harness 到底是什么

Agent Harness 不是模型。

模型是 GPT、Claude、Gemini、Qwen、Kimi 这一类东西。

Agent Harness 也不是聊天框。

Harness 更像让模型真正跑起来的执行框架。它把模型接到文件、终端、浏览器、Git、工具、权限、日志、任务状态、上下文和人类确认。

简单说:

模型 + Harness = 正在工作的 Agent。

Claude Code 好用,不只是因为 Claude 会写代码。它好用,是因为 Claude 被放进了一个适合写代码的 Harness:能读 repo、改文件、跑命令、看 diff、遵守项目规则。

Codex 也不只是一个代码模型。它也是任务环境、隔离执行、diff 管理和交付流程。

Cursor 表面是 IDE,但更深的变化也是一样:产品正在变成 Agent 工作台。

Agent Harness 示意图:模型、工具、工作区、权限、日志和人类审核

为什么 Omnigent 值得看

Databricks 在博客里说,他们内部经常同时开着四五个 Agent:coding agents、Gemini search、内部 agents、文档、Slack 和协作工具。

这很熟悉。

AI 本来是为了减少切换,结果深度用户开始在多个 AI 员工之间搬运上下文。

Omnigent 想做的是在这些 harness 之上加一层共享接口。官方给出的三个关键词很清楚:

  • 组合:不用重写所有东西,就能组合多个 agents、models 和 harnesses。
  • 控制:在 prompt 之上,用更高层的策略管理成本、权限和状态。
  • 协作:分享 live sessions,让同事一起 review、评论和接管。

所以它叫 meta-harness。

它不是又一个单独 Agent,而是管理 Agents 的一层。

为什么单个 Agent 不够

真实工作不是单线程。

一个 Agent 写代码。一个 Agent review。一个 Agent 查文档。一个 Agent 跑测试。一个 Agent 看 UI 细节。真正的问题不再是「谁最强」,而是「谁适合干哪一段」。

这本来就是团队工作的方式。

同样的结构正在进入 AI Agents。

单个 Agent 可以很强,但依然难管理。它会改太多文件,会陷入循环,会漏掉需求,会误解目标,也会给出一个看似完整但方向错了的方案。

于是深度用户开始遇到一个新问题:AI Babysitting

你让 Agent 跑任务,但你不敢真的走开。你要一直看它有没有跑偏。

更好的系统,不应该让人一直盯着 Agent。

它应该让 AI 执行更多,让人类管理目标、判断结果,并在关键节点介入。

Meta-Harness 控制层示意图:多个 Agent 通过一个人类管理的工作台协作

团队接下来应该看什么

对企业来说,Agent Harness 会变成基础设施问题。

不要只问一个工具用了哪个模型。

更应该问:

  1. 它怎么运行 Agent?
    本地机器、云端沙箱、共享工作区,还是隔离环境?

  2. 它怎么管理权限?
    Agent 能碰哪些文件、凭证、工具、API 和代码仓库?

  3. 它怎么展示过程?
    团队能不能看到工具调用、终端命令、Git diff、浏览器操作和生成文件?

  4. 它怎么支持协作?
    一个 agent session 能不能分享、review、评论、接管?

  5. Agent 能不能替换?
    今天 Claude Code 更好,明天 Codex 更便宜,工作流能不能继续?

  6. 人类在哪里批准或叫停?
    自动化越强,判断越要可见。

这些不是小产品细节。

它们决定 Agent 是个人小技巧,还是团队基础设施。

这和 Buda 有什么关系

Buda 不应该被理解成另一个聊天框。

它更接近一个协作型 AI Agent Workspace:Agent 有 session、Drive 知识、工具、沙箱、Channels、Terminal、Browser、Git 可见性,以及人类审核位置。

这和 meta-harness 的方向是一致的。模型会变,Agent 工具会变,团队会继续试 Claude Code、Codex、Cursor、Pi、开源 Agent 和本地模型。

真正应该沉淀的是管理层:

  • 任务怎么拆;
  • Agent 怎么分工;
  • 权限怎么收口;
  • 成本和进度怎么看;
  • 人类怎么 review;
  • 工作怎么分享,而不是锁在某个人电脑里。

未来不是一个超级 Agent 单独做完所有事。

而是人类通过一个工作台,管理一群能执行、可观察、可接管的 Agents。

Buda dashboard 探索多 Agent 工作方式。