← Blog

Harness Engineering 導覽

從這一頁進入 Bloss0m 的 Harness 專區——不必從部落格列表逐篇翻找。

建議把本頁加入書籤。 之後在 Bloss0m 讀任何 Harness 相關文章,都可以先回到這裡找連結與順序。


先建立心智模型

Harness = 包住模型以外的執行環境:工具、記憶、規劃、驗證、狀態交接、repo 規範與回饋迴路。
Harness Engineering = 刻意設計並維護這層環境,讓 Agent 的失敗變成「可修復、可不再發生」,而不是賭下一版模型。

Agent = Model + Harness
模型決定能力上限;Harness 決定長任務、多輪與團隊協作時能不能穩定交付

2025 常問「Agent 能不能用」;2026 更常問「能不能證明系統能跑完」。本專區的文章都在回答後者。


專題進度

PRD-001 深讀系列已全數完稿(2026-06-03 更新)。索引文(本頁)加上 spec-002~009 共 8 篇深讀均已上線;Phase 2(blog 17–21)五篇亦已發佈。

階段Spec對應 blog狀態
索引spec-00113 本頁✔️ 已發佈
Phase 1spec-002~00416 Hashimoto、14 Fowler、15 LangChain✔️ 已發佈
Phase 2spec-005~00917 Anthropic 並行、18 Phil Schmid、19 Parallel.ai、20 Ignorance.ai、21 HumanLayer✔️ 已發佈

另有三篇早期 Harness 深讀(blog 09–11)在 PRD 規劃前已發佈,仍列於下方索引,與本系列交叉連結。


全系列文章索引(本站)

以下為 Bloss0m Harness 專區完整清單(依主題分組)。每篇皆為繁中解讀,文末附官方或原文出處。

導覽與延伸

編號文章說明
13本頁 — Harness Engineering 導覽專區起點(你正在這裡)
09長時間 AI 工程的 Harness 設計長時應用:生成/評估分工、QA 合約

實戰與長任務(OpenAI · Anthropic)

編號文章
11Harness Engineering:讓 Codex 可觀測可交接
10長任務代理的 Harness:跨上下文穩定交付
1716 個平行 Claude 建 C 編譯器

觀念、評析與框架

編號文章
16Mitchell Hashimoto:Harness 起源與六階段
14Martin Fowler:控制迴路與信任
15LangChain:Agent Harness 解剖
18Phil Schmid:2026 與耐久性
19Parallel.ai:什麼是 Agent Harness

業界收斂與工具鏈落地

編號文章
20Ignorance.ai:Emerging Playbook
21HumanLayer:Skill Issue 配置面實戰

依情境進站(怎麼選第一篇)

你的情境建議從這裡開始
第一次聽 Harness,要向同事解釋19 科普 → 下方索引
負責 Codex / Claude Code,要治理 repo11 OpenAI21 HumanLayer
做長時間 coding agent、跨 session10 長任務17 並行壓測
要方法論與信任、審查邏輯16 Hashimoto14 Fowler
要比較 OpenAI / Stripe / 個人極端實踐20 Playbook
長時產品而非單 repo加上 09 長時應用

推薦閱讀路徑(三條)

路徑 A · 最快(2–3 篇)

  1. 本導覽頁
  2. 1119
  3. 若要立刻改 repo:21

路徑 B · 工程師系統化(推薦)

161410 + 152021 → 視需要 1718

路徑 C · 含長時應用

路徑 B 加上 09


與相近概念的分工

概念一句話
Prompt engineering單次對話怎麼下指令
Context engineering上下文怎麼組、壓縮、注入
Harness engineering整個執行環境:工具、狀態、驗證、交接、治理
Eval / benchmark證明好不好;Harness 讓每次 eval 可比、可累積

使用方式

  • 從部落格列表進來:先開本頁,再依索引點進深讀。
  • 從某一篇深讀進來:文內連結若寫「導覽」,即指 本頁
  • 要讀英文原文:請進各深讀文末的「原文出處」連結。

PRD-001 八篇深讀(spec-002~009)已全部完稿;若官方發佈重要新文,會更新本導覽索引,各篇深讀亦會個別修訂。


參考

Looking for an AI platform or Agentic AI partner? I help teams ship enterprise-grade RAG, multi-agent, and real-time AI systems.

Contact