Google Cloud 推出 Open Knowledge Format (OKF)：讓 AI Agent 讀懂企業知識的開放標準

將企業內部中斷的中繼資料與 Runbook，轉化為人機共讀的 Lingua Franca

Technology 2026/06/16

隨著大語言模型（LLM）與 AI Agent 的快速演進，限制模型能力的往往不再是參數規模，而是**「缺乏相關的 Context（上下文環境）」**。雖然 LLM 在編寫程式碼、總結文檔或分析資料方面表現出色，但如果沒有正確、即時的背景資訊，它們就無法產生精確且可落地的答案。

在多數企業中，這些背景資訊通常是高度碎片化且被鎖死在各個系統中的：

資料庫的 Schema（綱要）和表結構。
企業內特定指標（Metrics）的商業定義。
系統故障的運行手冊（Runbook）或排障流程。
資料系統之間的關聯路徑。
舊 API 的棄用通知。

為了打破這些知識孤島，Google Cloud 資料團隊於 2026 年 6 月 12 日正式推出了一項名為 Open Knowledge Format (OKF) 的開放規範（相關程式碼已於 GitHub 開源）。OKF 旨在將近來流行的 「LLM-Wiki」 模式正式化，提供一個廠商中立、對 AI Agent 和人類都極其友善的知識表示標準。

以下為您深度解讀這一全新規範的核心內涵、工作原理與設計哲學。

§1 什麼是 Open Knowledge Format (OKF)？

「OKF 不是一個新的資料服務，也不是另一個 SaaS 平台，它只是一種『知識表示格式』。」

OKF 的核心結構非常簡單，本質上就是一個包含 Markdown 文件與 YAML Frontmatter（前置屬性）的目錄結構。它具備以下三個「僅有」的特點：

僅有 Markdown：可在任何編輯器中閱讀，能在 GitHub 上渲染，並能被任何搜尋引擎直接索引。
僅有檔案（Files）：可以打包成 tar 包，託管在任何 Git 儲存庫中，或掛載到任何檔案系統中。
僅有 YAML Frontmatter：用於定義少數需要被結構化查詢的關鍵欄位：
- type：（唯一強制要求的欄位，例如 table、metric、playbook）
- title：（概念名稱）
- description：（概念的簡要描述）
- resource：（關聯的底層資源標識）
- tags：（分類標籤）
- timestamp：（時間戳）

如果您使用過 Obsidian、Notion、Hugo，或者熟悉近一年來興起的 CLAUDE.md / AGENTS.md 等 Agent 約定檔案，您會對 OKF 的形態感到非常熟悉。OKF 正是將這些實踐經驗提煉為一套標準的互操作規範。

§2 碎片化的 Context 景觀與 Living Wiki 模式

當 AI Agent 被問到：「如何從事件流中計算我們的每週活躍用戶（WAU）？」 時，它必須從中繼資料目錄、程式碼註釋、內部 Wiki 甚至是資深工程師的腦海中拼湊答案。現有的解決方案往往被各家目錄廠商的 SDK 或知識圖譜 Schema 所綁定，無法在不同產品或組織之間移植。

這導致每個 Agent 開發者都在重複造輪子，企業知識也被牢牢鎖死在創建它的工具中。

2.1 知識作為 Living Wiki（動態維基）

開發團隊正在改變建構 AI Agent 的方式：不再讓模型反覆搜尋相同的文檔，而是為 Agent 提供一個共享的 Markdown 知識庫。 AI 領域的知名學者 Andrej Karpathy 在其熱門的 LLM Wiki gist 中指出：「LLM 不會感到無聊，不會忘記更新交叉引用，並且可以一次性修改 15 個檔案。」 人類因為嫌繁瑣而容易放棄維護個人 Wiki，而這種枯燥的「簿記與更新工作」恰恰是 LLM 最擅長的。

OKF 便是這一背景下的產物。它統一了資料夾內檔案的命名規則、交叉鏈接方式，讓分散的 Wiki 能夠真正合作，共同為 AI Agent 提供精確的 Context 支撐。

§3 OKF 的三大設計原則

OKF 的規格極其精簡，其 v0.1 規範只佔用了一個單頁，背後貫徹了三大設計哲學：

1. 極簡主義（Minimally opinionated）

OKF 對每個概念檔案僅強制要求一個 type 欄位，其餘的屬性（包含具體有哪些類型、正文結構、附加欄位）完全交由知識的生產者決定。規範定義的是互操作性的邊界，而非具體的內容模型。

2. 生產者與消費者解耦（Producer/Consumer Independence）

OKF 乾淨地分離了「誰編寫知識」與「誰使用知識」。

一個由人類手寫的 Markdown 知識庫，可以被 AI Agent 直接讀取。
一個由中繼資料匯出管線自動生成的知識束（Bundle），可以直接在視覺化工具中渲染。
一個由 LLM A 生成的知識庫，可以被 LLM B 進行查詢。格式是唯一契約，兩端的工具均可獨立替換。

3. 是格式，而非平台（Format, not platform）

OKF 不與任何雲端廠商、資料庫、模型提供商或 Agent 框架綁定，閱讀和寫入它不需要任何專有帳號或 SDK。Google 資料團隊表示，開放標準的價值來自於有多少人使用它，而非誰擁有它。

§4 開源生態系與工具鏈

為了加速 OKF 的落地，Google 團隊在發布規範的同時也開源了以下實用的生態工具：

自動化資料增強 Agent (Enrichment Agent)：一個可以掃描 BigQuery 資料集的參考實現。它會為每個表和視圖草擬 OKF 概念檔案，再通過第二階段的 LLM 爬取權威文檔，將引用來源、Schema 和 Join 路徑增強至檔案中。
無後端視覺化工具 (Visualizer)：能將任何 OKF Bundle 轉換為一個交互式關係圖的單個 HTML 檔案。無需安裝，無後端，且任何資料都不會離開瀏覽器頁面。
現成樣例束 (Sample Bundles)：GitHub 儲存庫中提供了 GA4 電商資料集、Stack Overflow 以及比特幣公共資料集的標準 OKF 樣例，可供開發者直接查閱。

此外，Google Cloud 自身的 Knowledge Catalog（知識目錄） 也已完成升級，原生支援匯入 OKF 格式的知識束並將其服務給內置的 AI Agent。

§5 總結：未來的 Lingua Franca

Open Knowledge Format (OKF) 是一次將「人機共讀知識庫」標準化的重要嘗試。在 RAG 和 AI Agent 走向深入的今天，擺脫複雜且容易出錯的 PDF/HTML 解析，將企業知識沉澱為一套基於 Git 版本管理、人機通行的 Markdown-wiki，正在成為大勢所趨。

無論您是建構中繼資料目錄、自動化資料增強管線，還是專為 AI Agent 設計的企業 Wiki，OKF 都提供了最佳的通用語言（Lingua Franca）。

瞭解更多：

Google 官方部落格原文：How the Open Knowledge Format can improve data sharing

完整規範與開源工具鏈：GitHub - GoogleCloudPlatform/knowledge-catalog (OKF)