打造有效的 AI Agent：架構模式與實作策略總覽

Enterprise AI

生成式 AI 能回答問題；AI Agent 能解決問題。對企業而言，Agent 帶來的是可擴展的開放式問題解決、動態決策，以及路徑無法事先寫死的多步驟流程。本文根據 Anthropic 的 《Building Effective AI Agents》 文件整理而成，原文可參考官方頁面：Building Effective AI Agents，本文則以實作觀點重新組織內容，供企業在選型與落地時參考。

一、為什麼要談 Agent？

1.1 傳統自動化 vs Agent

傳統自動化依賴事先寫好的腳本，每一步都要預先定義。Agent 不同：它會評估任務、選擇工具、嘗試做法、根據結果調整策略，類似一位有經驗的員工處理不熟悉專案的方式。例如處理客服升級時，Agent 可以讀取問題、查帳戶歷史、查知識庫、起草回覆、必要時轉給專人，全程無需人工介入。

關鍵在於：自主推理與工具選擇，加上從錯誤中恢復與持續朝目標前進的能力。這讓 Agent 特別適合「步驟無法事先全部定死」的場景，例如事件應變、資料分析、客戶 onboarding、或開發流程中由自動化測試形成反饋的迭代解題。

1.2 企業實例

Coinbase：以 Claude 驅動的客服 Agent 處理每小時數千則訊息，可用性 99.99%，並衍生出 35–50 個內部 AI 應用。
Tines：以 Agent 動態處理工作流邏輯，將多步驟資安作業收斂為單一 Agent 操作，對應約 100x 的 time-to-value 提升。
Gradient Labs：金融客服 Agent 在脈絡下理解查詢並執行標準作業程序，80–90% 解決率，讓人力專注在關係經營與策略工作。
零售銀行：信用風險備忘錄從關係經理手動查十餘個資料源、耗時數週，改為 Agent 輔助後，生產力提升 20–60%，信用案件週轉時間縮短約 30%。

導入 Agent 仍需要認真考慮：架構模式、成本控制與營運治理。

二、常見應用場景

2.1 程式開發

Augment Code（基於 Claude on Vertex AI）協助開發者在數百萬行相互依賴的程式庫中導航。有企業客戶將原 CTO 估計需 4–8 個月的專案在 2 週內完成，開發者上手時間從數週縮短為 1–2 天。

2.2 資料與維運

Grafana 以 Claude 驅動智慧助理，讓從 CTO 到初階工程師都能用自然語言查詢維運資料（例如「我結帳服務的請求延遲如何？」），並自動組出 PromQL / LogQL 查詢。

2.3 客服與營運

Intercom Fin AI（Claude）：最高約 86% 解決率，預設約 51%，回應從約 30 分鐘降到秒級，支援 45+ 語言。
Assembled Assist（Claude）：客戶滿意度提升約 20%、支援成本下降、升級率降逾 50%、每小時解決案件數提升逾 30%，聚焦複雜 Tier 2+ 案件。

2.4 法務

Thomson Reuters CoCounsel（Claude on Bedrock）：整合 3,000+ 專家與逾 150 年權威內容，處理合約與稅務文件；客戶回饋可顯著縮短作業時間。
Legora：以 Claude 驅動法務平台，在自有大型法務評測上表現提升約 18%，利於建構可適應不同業務與客戶需求的 Agent 工作流。

2.5 行銷與金融

Advolve：以 Claude 協調數位獲客，管理多平台數百萬廣告、即時資料驗證與動態預算分配，營運工時約降 90%、廣告報酬率（ROAS）提升約 15%。
Inscribe：AI 風險 Agent 將詐騙審查從約 30 分鐘縮短到約 90 秒（約 20x），產出在客戶案例中提升約 70x，並支援 KYC/KYB、影像與 PDF 詐騙偵測及可稽核風險報告。

三、架構設計原則

3.1 從簡單開始，再依需求擴充

建議先做單一職責、做好一件事的 Agent，再隨需求演進成更複雜系統。簡單系統：token 與算力成本低、除錯容易、指標也較容易對應到業務結果。

3.2 選對模型

在能力、速度、成本之間取得平衡。複雜多 Agent 編程或財務分析適合用能力最強的模型；大量、規則明確的客服或表單擷取則可用較輕、較快的模型，成本差異在規模化後會非常可觀。

3.3 模組化設計

新能力與功能迭代很快，架構應支援模組化，例如：

Prompt：集中於設定檔或程式庫
Tools：獨立的可重用模組
Agent：按任務組裝，只掛載需要的工具與資源

這樣可快速定義新 Agent，並在 LangGraph、Mastra 等框架上自然擴展；新工具與提示策略可透過中央設定一次 rollout。

3.4 Agent Skills

Agent Skills 提供結構化方式，為 Agent 加上領域知識、工作流與工具整合，而不必把一切塞進 prompt。Skills 可組合：例如合規 Skill 呼叫文件分析 Skill，再使用專門的擷取 Skill。適用情境包括：領域專業（財務、法務、科研）、組織內標準流程、專用工具整合（資料庫、API）、產業與合規要求。單一 Agent 與多 Agent 架構都可搭配不同 Skills。

3.5 可觀測性

Agent 的推理過程不透明、非確定性，除錯時不能只看 stack trace，需要看到 prompt 鏈、模型決策路徑、檢索脈絡、token 消耗與整體推理流程。除日誌、監控與分散式追蹤外，要能回答「模型為何這樣決策」「脈絡如何在多步驟間流動」，才能有效除錯與優化。

四、單一 Agent 系統

單一 Agent 在一個循環中運作：感知環境 → 決定下一步 → 執行。

使用者交付任務
Agent 擬定計畫、呼叫工具、觀察結果、依反饋調整
重複直到完成或觸發停止條件（例如「暫停待人審核」）

組成：推理引擎（模型）、定義角色與能力的 prompt、對外互動的 toolkit，以及可選的 Skills 擴充領域知識與流程。

適用：路徑無法從一開始就確定的開放式問題。
不適用：若要求「第一次就完美、100% 準確」，應考慮多 Agent 或先為單一 Agent 加強 Skills，再評估是否真的需要多 Agent。

範例：研究型 Agent 搭配 MCP 連接內容庫、業務工具與開發環境；使用者問「研究遠端工作生產力工具在工程團隊的採用情況，並與我們內部生產力指標做關聯」。Agent 可分解為：外部搜尋、內部資料庫查詢、並行執行、最後做關聯與綜整，並在過程中用 think / 工具呼叫做迭代分析與產出。

五、多 Agent 系統

多 Agent 架構讓多個專長 Agent 分工協作，處理單一通用 Agent 難以勝任的複雜問題：任務被分解、分配、由多 Agent 執行，再綜合成一致輸出。

Anthropic 內部研究顯示：對需要同時朝多個獨立方向探索的複雜任務，多 Agent 相較單一 Agent 有約 90.2% 的效能提升；多 Agent 成為「擴展智能」的重要方式。

適用：(1) 開放式、步驟難以預測且需隨時轉向或探索旁支；(2) 需要多種專長，單一 Agent 在多重領域下表現明顯下滑；(3) 需廣度查詢、多方向並行時，並行帶來明顯增益。成本：token 消耗遠高於單一 Agent，需確保業務價值足以支撐；且除錯與可觀測性更關鍵，要能追蹤 Agent 間的決策與互動結構。

5.1 集中式：階層／監督模式

由中央監督者分配任務給專長 Agent，再綜整結果，責任鏈清晰。

全協調：監督者完全掌控互動與執行
偏路由：主要做分派，可能把對話交給專長 Agent
混合：依任務複雜度決定是否動用監督者

挑戰：脈絡可能過大，單一 Agent 難以有效管理，導致 context 溢出、推理品質下降、協調失敗。實作上需要：context 編輯（接近 token 上限時清理過期工具呼叫與結果）、記憶／檔案型工具把資訊放在 context 外、工具支援分頁／篩選／截斷與合理上限（例如約 25,000 tokens）。

範例：行銷活動開發。客戶提交 brief → 行銷總監 Agent 拆解並分配 → 市場研究、創意設計、文案、媒體規劃等 Agent 各自執行 → 監督者綜整、化解衝突 → 產出完整活動策略與素材。

5.2 分散式：協作模式

多個 Agent 對等溝通、動態協商角色，以分散智能共同解題，協調來自互動本身而非中央指令。

![多 Agent 協作工作流示意圖](/blog/04-building-effective-ai-agents/4_Multi-agent collaborative workflow.png)

實作形態包括：群組對話式（多 Agent 在同一對話串協作）、事件驅動（以事件為共同語言傳遞狀態與任務）、黑板架構（共用知識庫讀寫）。

挑戰：通訊複雜、湧現行為難以預測、可能出現任務在 Agent 間來回彈跳；需要明確的責任分工、解題方式與「努力預算」，以及衝突化解機制。

範例：競爭情報彙整。客戶提出需求 → 定價、產品、行銷、財務、社群、策略等情報 Agent 建立通道並分工 → 即時交叉比對、驗證、綜整 → 產出經交叉驗證的競爭態勢與策略建議。

六、Agent 工作流模式

工作流定義 Agent 如何溝通、交接與協作，通常是預先定義、相對靜態的。

6.1 順序工作流（Sequential）

依既定順序執行，適合可重複、需稽核軌跡的流程（如文件審核、合規檢查）。可用軟體邏輯或 AI 路由（依中間結果決定下一步）。優點是可預測、可估成本、可針對階段除錯；缺點是對例外或全新情境彈性較低。

![多 Agent 順序工作流示意圖](/blog/04-building-effective-ai-agents/5_Multi-agent sequential workflow.png)

適用：可拆成固定子任務、階段有明確依賴、無法並行、或需要「草稿→審核→定稿」這類漸進精煉。不適用：階段少且單一 Agent 就能做、需要 Agent 協作而非單純交接、或流程需要回溯與迭代。

範例：資料科學洞察自動化。需求進入 → 範圍 Agent 判斷分析類型與資料源 → 資料工程 Agent 取數、清洗、特徵 → 分析 Agent 執行統計／模型／視覺化或轉交人工 → 審核／升級 → 產出報告或儀表板。

6.2 並行工作流（Parallel）

多個 Agent 同時處理獨立子任務，結果再合併或後處理，適合需要多視角或明顯加速的情境（類似 fan-out/fan-in）。

適用：子任務可並行、或多視角能提高信心；例如一道模型做查詢、另一道做不當內容過濾；或多個 prompt 對程式漏洞或內容適當性做投票。

不適用：任務需依序累積脈絡、必須嚴格順序或確定性、資源受限、或無法協調共享狀態與衝突化解。

範例：金融風險評估。申請進入 → 資料彙總 Agent 收集信用／市場／營運／監管等資料 → 信用風險、市場風險、營運風險、合規 Agent 並行分析 → 風險彙總與決策引擎加權綜整 → 產出准駁建議與報告。

6.3 評估—優化工作流（Evaluator-Optimizer）

一個 AI 生成，另一個 評估並回饋，迭代直到達標，類似寫手與編輯的協作。

適用：有明確評估標準、迭代精煉能帶來可衡量價值，例如文學翻譯、需安全要求的程式生成、講究語調的對外溝通、多步驟推理與驗證。

不適用：第一次產出已足夠、標準主觀或不明、時間與成本不允許、即時回應、簡單分類或 token 預算極緊。

範例：API 文件自動生成。程式碼輸入 → 生成 Agent 產出初版文件 → 技術評估 Agent 對照程式檢查參數、端點、範例 → 生成 Agent 依回饋修正，通常 2–4 輪 → 發布至開發者入口。

七、決策框架：如何選架構？

依控制需求、問題複雜度、資源與領域深度選擇。

7.1 控制需求

高（法規、金融、安全關鍵）→ 單一 Agent 或順序工作流，行為可預測、可追溯。
中（客服、內容、分析）→ 階層式多 Agent，兼顧彈性與監督。
低（研究、腦力激盪、複雜分析）→ 協作式多 Agent 可行，不確定性可接受。

7.2 問題複雜度

單一領域（產品問答、退貨、報表）→ 單一 Agent 即可。
多領域但可預測（入職、合規流程、標準分析）→ 順序或並行工作流。
複雜、開放（策略分析、研究、系統排障）→ 多 Agent 架構。

7.3 資源限制

預算／token 緊→ 單一 Agent 或精簡的並行工作流（多 Agent 約 10–15x token）。
搶時效→ 先上單一 Agent，再規劃演進。
長期戰略→ 從單一 Agent 就設計模組與介面，便於日後加入更多 Agent。

7.4 領域深度

單一領域、流程成熟→ 單一 Agent + 專用 Skills。
多領域需協調→ 多 Agent，各配專屬 Skills（例如合約分析、風險、合規分開，再協作）。

簡要對照：單一 Agent 適合客服、文件處理、程式審查、例行分析；順序工作流適合多階段審核、內容產製管道、資料轉換與合規；並行工作流適合多視角、可並行、重速度與風險多維度評估；多 Agent 適合複雜解題、研究、跨系統動態互動與策略支援。

八、混合架構與演進

實務上常出現混合模式：

階層 + 並行：監督者分派給專長 Agent，專長 Agent 內部再跑並行工作流（如風險評估中信用／市場／營運並行）。
順序 + 動態路由：線性流程中依中間結果切換不同 Agent（如客服先分類，再路由到簡單解決 Agent 或複雜研究團隊）。
單一 Agent + 多 Agent 升級：日常由單一 Agent 處理，遇邊界情況再觸發多 Agent，兼顧成本與能力。

文件中的電商演進範例：單一客服 Agent → 依訂單狀態／產品／客訴路由 → 各類專長 Agent + 共享脈絡 → 庫存／支付／物流多 Agent 協調 → 再加入評估 Agent 做品質與持續改進。重點是：架構隨需求演進，從簡單開始、量測為本，只在能證明價值時增加複雜度。

九、小結與下一步

生成式 AI 答題，Agent 解題；企業實例顯示在客服、風控、行銷、法務、開發等場景已有明顯生產力與品質提升。
架構選擇應對齊業務價值：單一 Agent → 工作流 → 多 Agent，並搭配 Skills、可觀測性與模組化。
決策時問清楚：控制需求、問題複雜度、資源與領域深度，再對照單一／順序／並行／多 Agent 的適用情境。
從最簡單能滿足當前需求的架構開始，保留日後擴充路徑；可觀測性與與業務直接掛鉤的指標從第一天就要納入。

若要以 Claude 實作 Agent，可從 Claude Developer Platform 的 API、文件與 prompt 工程著手，並搭配 Agent Skills、多 Agent 架構說明與 Anthropic 工程部落格做進階設計與部署。本文內容整理自 Anthropic《Building Effective AI Agents》文件，供團隊在選型與實作時對照使用。