打造有效的 AI Agent:架構模式與實作策略總覽
生成式 AI 能回答問題;AI Agent 能解決問題。對企業而言,Agent 帶來的是可擴展的開放式問題解決、動態決策,以及路徑無法事先寫死的多步驟流程。本文根據 Anthropic 的 《Building Effective AI Agents》 文件整理而成,原文可參考官方頁面:Building Effective AI Agents,本文則以實作觀點重新組織內容,供企業在選型與落地時參考。
一、為什麼要談 Agent?
1.1 傳統自動化 vs Agent
傳統自動化依賴事先寫好的腳本,每一步都要預先定義。Agent 不同:它會評估任務、選擇工具、嘗試做法、根據結果調整策略,類似一位有經驗的員工處理不熟悉專案的方式。例如處理客服升級時,Agent 可以讀取問題、查帳戶歷史、查知識庫、起草回覆、必要時轉給專人,全程無需人工介入。
關鍵在於:自主推理與工具選擇,加上從錯誤中恢復與持續朝目標前進的能力。這讓 Agent 特別適合「步驟無法事先全部定死」的場景,例如事件應變、資料分析、客戶 onboarding、或開發流程中由自動化測試形成反饋的迭代解題。
1.2 企業實例
- Coinbase:以 Claude 驅動的客服 Agent 處理每小時數千則訊息,可用性 99.99%,並衍生出 35–50 個內部 AI 應用。
- Tines:以 Agent 動態處理工作流邏輯,將多步驟資安作業收斂為單一 Agent 操作,對應約 100x 的 time-to-value 提升。
- Gradient Labs:金融客服 Agent 在脈絡下理解查詢並執行標準作業程序,80–90% 解決率,讓人力專注在關係經營與策略工作。
- 零售銀行:信用風險備忘錄從關係經理手動查十餘個資料源、耗時數週,改為 Agent 輔助後,生產力提升 20–60%,信用案件週轉時間縮短約 30%。
導入 Agent 仍需要認真考慮:架構模式、成本控制與營運治理。
二、常見應用場景
2.1 程式開發
Augment Code(基於 Claude on Vertex AI)協助開發者在數百萬行相互依賴的程式庫中導航。有企業客戶將原 CTO 估計需 4–8 個月的專案在 2 週內完成,開發者上手時間從數週縮短為 1–2 天。
2.2 資料與維運
Grafana 以 Claude 驅動智慧助理,讓從 CTO 到初階工程師都能用自然語言查詢維運資料(例如「我結帳服務的請求延遲如何?」),並自動組出 PromQL / LogQL 查詢。
2.3 客服與營運
- Intercom Fin AI(Claude):最高約 86% 解決率,預設約 51%,回應從約 30 分鐘降到秒級,支援 45+ 語言。
- Assembled Assist(Claude):客戶滿意度提升約 20%、支援成本下降、升級率降逾 50%、每小時解決案件數提升逾 30%,聚焦複雜 Tier 2+ 案件。
2.4 法務
- Thomson Reuters CoCounsel(Claude on Bedrock):整合 3,000+ 專家與逾 150 年權威內容,處理合約與稅務文件;客戶回饋可顯著縮短作業時間。
- Legora:以 Claude 驅動法務平台,在自有大型法務評測上表現提升約 18%,利於建構可適應不同業務與客戶需求的 Agent 工作流。
2.5 行銷與金融
- Advolve:以 Claude 協調數位獲客,管理多平台數百萬廣告、即時資料驗證與動態預算分配,營運工時約降 90%、廣告報酬率(ROAS)提升約 15%。
- Inscribe:AI 風險 Agent 將詐騙審查從約 30 分鐘縮短到約 90 秒(約 20x),產出在客戶案例中提升約 70x,並支援 KYC/KYB、影像與 PDF 詐騙偵測及可稽核風險報告。
三、架構設計原則
3.1 從簡單開始,再依需求擴充
建議先做單一職責、做好一件事的 Agent,再隨需求演進成更複雜系統。簡單系統:token 與算力成本低、除錯容易、指標也較容易對應到業務結果。
3.2 選對模型
在能力、速度、成本之間取得平衡。複雜多 Agent 編程或財務分析適合用能力最強的模型;大量、規則明確的客服或表單擷取則可用較輕、較快的模型,成本差異在規模化後會非常可觀。
3.3 模組化設計
新能力與功能迭代很快,架構應支援模組化,例如:
- Prompt:集中於設定檔或程式庫
- Tools:獨立的可重用模組
- Agent:按任務組裝,只掛載需要的工具與資源
這樣可快速定義新 Agent,並在 LangGraph、Mastra 等框架上自然擴展;新工具與提示策略可透過中央設定一次 rollout。
3.4 Agent Skills
Agent Skills 提供結構化方式,為 Agent 加上領域知識、工作流與工具整合,而不必把一切塞進 prompt。Skills 可組合:例如合規 Skill 呼叫文件分析 Skill,再使用專門的擷取 Skill。適用情境包括:領域專業(財務、法務、科研)、組織內標準流程、專用工具整合(資料庫、API)、產業與合規要求。單一 Agent 與多 Agent 架構都可搭配不同 Skills。
3.5 可觀測性
Agent 的推理過程不透明、非確定性,除錯時不能只看 stack trace,需要看到 prompt 鏈、模型決策路徑、檢索脈絡、token 消耗與整體推理流程。除日誌、監控與分散式追蹤外,要能回答「模型為何這樣決策」「脈絡如何在多步驟間流動」,才能有效除錯與優化。
四、單一 Agent 系統
單一 Agent 在一個循環中運作:感知環境 → 決定下一步 → 執行。

- 使用者交付任務
- Agent 擬定計畫、呼叫工具、觀察結果、依反饋調整
- 重複直到完成或觸發停止條件(例如「暫停待人審核」)
組成:推理引擎(模型)、定義角色與能力的 prompt、對外互動的 toolkit,以及可選的 Skills 擴充領域知識與流程。
適用:路徑無法從一開始就確定的開放式問題。
不適用:若要求「第一次就完美、100% 準確」,應考慮多 Agent 或先為單一 Agent 加強 Skills,再評估是否真的需要多 Agent。
範例:研究型 Agent 搭配 MCP 連接內容庫、業務工具與開發環境;使用者問「研究遠端工作生產力工具在工程團隊的採用情況,並與我們內部生產力指標做關聯」。Agent 可分解為:外部搜尋、內部資料庫查詢、並行執行、最後做關聯與綜整,並在過程中用 think / 工具呼叫做迭代分析與產出。
五、多 Agent 系統
多 Agent 架構讓多個專長 Agent 分工協作,處理單一通用 Agent 難以勝任的複雜問題:任務被分解、分配、由多 Agent 執行,再綜合成一致輸出。

Anthropic 內部研究顯示:對需要同時朝多個獨立方向探索的複雜任務,多 Agent 相較單一 Agent 有約 90.2% 的效能提升;多 Agent 成為「擴展智能」的重要方式。
適用:(1) 開放式、步驟難以預測且需隨時轉向或探索旁支;(2) 需要多種專長,單一 Agent 在多重領域下表現明顯下滑;(3) 需廣度查詢、多方向並行時,並行帶來明顯增益。成本:token 消耗遠高於單一 Agent,需確保業務價值足以支撐;且除錯與可觀測性更關鍵,要能追蹤 Agent 間的決策與互動結構。
5.1 集中式:階層/監督模式
由中央監督者分配任務給專長 Agent,再綜整結果,責任鏈清晰。

- 全協調:監督者完全掌控互動與執行
- 偏路由:主要做分派,可能把對話交給專長 Agent
- 混合:依任務複雜度決定是否動用監督者
挑戰:脈絡可能過大,單一 Agent 難以有效管理,導致 context 溢出、推理品質下降、協調失敗。實作上需要:context 編輯(接近 token 上限時清理過期工具呼叫與結果)、記憶/檔案型工具把資訊放在 context 外、工具支援分頁/篩選/截斷與合理上限(例如約 25,000 tokens)。
範例:行銷活動開發。客戶提交 brief → 行銷總監 Agent 拆解並分配 → 市場研究、創意設計、文案、媒體規劃等 Agent 各自執行 → 監督者綜整、化解衝突 → 產出完整活動策略與素材。
5.2 分散式:協作模式
多個 Agent 對等溝通、動態協商角色,以分散智能共同解題,協調來自互動本身而非中央指令。

實作形態包括:群組對話式(多 Agent 在同一對話串協作)、事件驅動(以事件為共同語言傳遞狀態與任務)、黑板架構(共用知識庫讀寫)。
挑戰:通訊複雜、湧現行為難以預測、可能出現任務在 Agent 間來回彈跳;需要明確的責任分工、解題方式與「努力預算」,以及衝突化解機制。
範例:競爭情報彙整。客戶提出需求 → 定價、產品、行銷、財務、社群、策略等情報 Agent 建立通道並分工 → 即時交叉比對、驗證、綜整 → 產出經交叉驗證的競爭態勢與策略建議。
六、Agent 工作流模式
工作流定義 Agent 如何溝通、交接與協作,通常是預先定義、相對靜態的。
6.1 順序工作流(Sequential)
依既定順序執行,適合可重複、需稽核軌跡的流程(如文件審核、合規檢查)。可用軟體邏輯或 AI 路由(依中間結果決定下一步)。優點是可預測、可估成本、可針對階段除錯;缺點是對例外或全新情境彈性較低。

適用:可拆成固定子任務、階段有明確依賴、無法並行、或需要「草稿→審核→定稿」這類漸進精煉。不適用:階段少且單一 Agent 就能做、需要 Agent 協作而非單純交接、或流程需要回溯與迭代。
範例:資料科學洞察自動化。需求進入 → 範圍 Agent 判斷分析類型與資料源 → 資料工程 Agent 取數、清洗、特徵 → 分析 Agent 執行統計/模型/視覺化或轉交人工 → 審核/升級 → 產出報告或儀表板。
6.2 並行工作流(Parallel)
多個 Agent 同時處理獨立子任務,結果再合併或後處理,適合需要多視角或明顯加速的情境(類似 fan-out/fan-in)。

適用:子任務可並行、或多視角能提高信心;例如一道模型做查詢、另一道做不當內容過濾;或多個 prompt 對程式漏洞或內容適當性做投票。
不適用:任務需依序累積脈絡、必須嚴格順序或確定性、資源受限、或無法協調共享狀態與衝突化解。
範例:金融風險評估。申請進入 → 資料彙總 Agent 收集信用/市場/營運/監管等資料 → 信用風險、市場風險、營運風險、合規 Agent 並行分析 → 風險彙總與決策引擎加權綜整 → 產出准駁建議與報告。
6.3 評估—優化工作流(Evaluator-Optimizer)
一個 AI 生成,另一個 評估並回饋,迭代直到達標,類似寫手與編輯的協作。

適用:有明確評估標準、迭代精煉能帶來可衡量價值,例如文學翻譯、需安全要求的程式生成、講究語調的對外溝通、多步驟推理與驗證。
不適用:第一次產出已足夠、標準主觀或不明、時間與成本不允許、即時回應、簡單分類或 token 預算極緊。
範例:API 文件自動生成。程式碼輸入 → 生成 Agent 產出初版文件 → 技術評估 Agent 對照程式檢查參數、端點、範例 → 生成 Agent 依回饋修正,通常 2–4 輪 → 發布至開發者入口。
七、決策框架:如何選架構?
依控制需求、問題複雜度、資源與領域深度選擇。
7.1 控制需求
- 高(法規、金融、安全關鍵)→ 單一 Agent 或順序工作流,行為可預測、可追溯。
- 中(客服、內容、分析)→ 階層式多 Agent,兼顧彈性與監督。
- 低(研究、腦力激盪、複雜分析)→ 協作式多 Agent 可行,不確定性可接受。
7.2 問題複雜度
- 單一領域(產品問答、退貨、報表)→ 單一 Agent 即可。
- 多領域但可預測(入職、合規流程、標準分析)→ 順序或並行工作流。
- 複雜、開放(策略分析、研究、系統排障)→ 多 Agent 架構。
7.3 資源限制
- 預算/token 緊→ 單一 Agent 或精簡的並行工作流(多 Agent 約 10–15x token)。
- 搶時效→ 先上單一 Agent,再規劃演進。
- 長期戰略→ 從單一 Agent 就設計模組與介面,便於日後加入更多 Agent。
7.4 領域深度
- 單一領域、流程成熟→ 單一 Agent + 專用 Skills。
- 多領域需協調→ 多 Agent,各配專屬 Skills(例如合約分析、風險、合規分開,再協作)。
簡要對照:單一 Agent 適合客服、文件處理、程式審查、例行分析;順序工作流適合多階段審核、內容產製管道、資料轉換與合規;並行工作流適合多視角、可並行、重速度與風險多維度評估;多 Agent 適合複雜解題、研究、跨系統動態互動與策略支援。
八、混合架構與演進
實務上常出現混合模式:
- 階層 + 並行:監督者分派給專長 Agent,專長 Agent 內部再跑並行工作流(如風險評估中信用/市場/營運並行)。
- 順序 + 動態路由:線性流程中依中間結果切換不同 Agent(如客服先分類,再路由到簡單解決 Agent 或複雜研究團隊)。
- 單一 Agent + 多 Agent 升級:日常由單一 Agent 處理,遇邊界情況再觸發多 Agent,兼顧成本與能力。
文件中的電商演進範例:單一客服 Agent → 依訂單狀態/產品/客訴路由 → 各類專長 Agent + 共享脈絡 → 庫存/支付/物流多 Agent 協調 → 再加入評估 Agent 做品質與持續改進。重點是:架構隨需求演進,從簡單開始、量測為本,只在能證明價值時增加複雜度。
九、小結與下一步
- 生成式 AI 答題,Agent 解題;企業實例顯示在客服、風控、行銷、法務、開發等場景已有明顯生產力與品質提升。
- 架構選擇應對齊業務價值:單一 Agent → 工作流 → 多 Agent,並搭配 Skills、可觀測性與模組化。
- 決策時問清楚:控制需求、問題複雜度、資源與領域深度,再對照單一/順序/並行/多 Agent 的適用情境。
- 從最簡單能滿足當前需求的架構開始,保留日後擴充路徑;可觀測性與與業務直接掛鉤的指標從第一天就要納入。
若要以 Claude 實作 Agent,可從 Claude Developer Platform 的 API、文件與 prompt 工程著手,並搭配 Agent Skills、多 Agent 架構說明與 Anthropic 工程部落格做進階設計與部署。本文內容整理自 Anthropic《Building Effective AI Agents》文件,供團隊在選型與實作時對照使用。