別再只爭 Claude Code 和 Codex:下一層是 Agent Harness

Databricks Omnigent 說明,AI Agent 的競爭正在從單個工具能力,轉向控制、協作、審核和多 Agent 工作台。

Buda Team
返回部落格
別再只爭 Claude Code 和 Codex:下一層是 Agent Harness

別再只爭 Claude Code 和 Codex 誰更強了。

对深度 AI 用户来說,更難的問題已經不是某一個 Agent 能不能寫代碼、能不能完成任務。

更難的是:人類怎么操控一群 Agents,而不是坐在电腦前当 AI 保姆。

6 月 13 日,Databricks 發布了 Omnigent。它把自己定義成一個開源 meta-harness:站在 Claude Code、Codex、Pi 和自定義 agents 之上,用来組合、控制和分享 agent sessions。

這件事值得看。

下一層竞爭,不只是哪個模型更聪明,而是誰能让人類真正管理一群 Agents。

Agent Harness 到底是什么

Agent Harness 不是模型。

模型是 GPT、Claude、Gemini、Qwen、Kimi 這一類东西。

Agent Harness 也不是聊天框。

Harness 更像让模型真正跑起来的執行框架。它把模型接到文件、終端、浏覽器、Git、工具、權限、日志、任務状態、上下文和人類确認。

簡單說:

模型 + Harness = 正在工作的 Agent。

Claude Code 好用,不只是因為 Claude 会寫代碼。它好用,是因為 Claude 被放进了一個适合寫代碼的 Harness:能讀 repo、改文件、跑命令、看 diff、遵守項目规則。

Codex 也不只是一個代碼模型。它也是任務環境、隔离執行、diff 管理和交付流程。

Cursor 表面是 IDE,但更深的變化也是一样:產品正在變成 Agent 工作台。

Agent Harness 示意图:模型、工具、工作区、權限、日志和人類審核

為什么 Omnigent 值得看

Databricks 在博客里說,他们內部經常同時開着四五個 Agent:coding agents、Gemini search、內部 agents、文檔、Slack 和協作工具。

這很熟悉。

AI 本来是為了减少切换,結果深度用户開始在多個 AI 員工之间搬运上下文。

Omnigent 想做的是在這些 harness 之上加一層共享接口。官方給出的三個关鍵詞很清楚:

  • 組合:不用重寫所有东西,就能組合多個 agents、models 和 harnesses。
  • 控制:在 prompt 之上,用更高層的策略管理成本、權限和状態。
  • 協作:分享 live sessions,让同事一起 review、评论和接管。

所以它叫 meta-harness。

它不是又一個單独 Agent,而是管理 Agents 的一層。

為什么單個 Agent 不夠

真實工作不是單線程。

一個 Agent 寫代碼。一個 Agent review。一個 Agent 查文檔。一個 Agent 跑测試。一個 Agent 看 UI 細節。真正的問題不再是「誰最強」,而是「誰适合干哪一段」。

這本来就是团隊工作的方式。

同样的結构正在进入 AI Agents。

單個 Agent 可以很強,但依然難管理。它会改太多文件,会陷入循環,会漏掉需求,会誤解目标,也会給出一個看似完整但方向错了的方案。

于是深度用户開始遇到一個新問題:AI Babysitting

你让 Agent 跑任務,但你不敢真的走開。你要一直看它有没有跑偏。

更好的系统,不應該让人一直盯着 Agent。

它應該让 AI 執行更多,让人類管理目标、判断結果,并在关鍵節点介入。

Meta-Harness 控制層示意图:多個 Agent 通過一個人類管理的工作台協作

团隊接下来應該看什么

对企业来說,Agent Harness 会變成基礎设施問題。

不要只問一個工具用了哪個模型。

更應該問:

  1. 它怎么运行 Agent?
    本地机器、云端沙箱、共享工作区,還是隔离環境?

  2. 它怎么管理權限?
    Agent 能碰哪些文件、凭证、工具、API 和代碼仓庫?

  3. 它怎么展示過程?
    团隊能不能看到工具调用、終端命令、Git diff、浏覽器操作和生成文件?

  4. 它怎么支持協作?
    一個 agent session 能不能分享、review、评论、接管?

  5. Agent 能不能替换?
    今天 Claude Code 更好,明天 Codex 更便宜,工作流能不能继續?

  6. 人類在哪里批准或叫停?
    自动化越強,判断越要可見。

這些不是小產品細節。

它们决定 Agent 是個人小技巧,還是团隊基礎设施。

這和 Buda 有什么关系

Buda 不應該被理解成另一個聊天框。

它更接近一個協作型 AI Agent Workspace:Agent 有 session、Drive 知識、工具、沙箱、Channels、Terminal、Browser、Git 可見性,以及人類審核位置。

這和 meta-harness 的方向是一致的。模型会變,Agent 工具会變,团隊会继續試 Claude Code、Codex、Cursor、Pi、開源 Agent 和本地模型。

真正應該沉淀的是管理層:

  • 任務怎么拆;
  • Agent 怎么分工;
  • 權限怎么收口;
  • 成本和进度怎么看;
  • 人類怎么 review;
  • 工作怎么分享,而不是鎖在某個人电腦里。

未来不是一個超级 Agent 單独做完所有事。

而是人類通過一個工作台,管理一群能執行、可觀察、可接管的 Agents。

Buda dashboard 探索多 Agent 工作方式。