Paper Reading
Deep dives · Series · Reproducible notes
- Beyond RAG for Agent Memory:從解耦到聚合
三遍掃讀 xMemory:把對話記憶拆成四層結構,並以不確定性感知檢索抑制冗餘,兼顧回答品質與 Token 成本。
- GraphRAG vs RAG:能力邊界與混合策略
用統一 Benchmark 拆解 RAG 與 GraphRAG:誰擅長單跳事實、誰擅長多跳推理,以及如何用路由與融合拿到更佳整體表現。
- RAG-ANYTHING:多模態一體化 RAG 框架(雙圖構建與混合檢索)
用三遍掃描法深度解析 RAG-ANYTHING:為何傳統 RAG 會因「模態盲區」失真,以及雙圖構建如何把圖、表、公式與正文一起納入精準檢索。
- RAG-MCP:用檢索對抗 MCP 工具海的提示膨脹
三遍掃讀 RAG-MCP:把工具發現外包給語意檢索,只把少數 MCP schema 餵給 LLM;附壓力測試熱力圖與準確率/Token 數據解讀。
- RAG without Forgetting:把 Query 擴展經驗寫進 Key 記憶
用三遍掃描法解析 ERM:如何把高成本 Query Expansion 轉成可持續演化的 Key 記憶,兼顧檢索品質與毫秒級延遲。
- 9 年後重讀深度學習奠基作之一:AlexNet(下)
第二遍閱讀怎麼讀到「方法真正長什麼樣」:ReLU 為何關鍵、架構圖怎麼看、多 GPU 切分的歷史包袱,以及 AlexNet 的資料增強與訓練超參數,哪些值得學、哪些只是時代限制。
- 9 年後重讀深度學習奠基作之一:AlexNet(上)
用「三遍讀論文法」從標題、摘要與討論切入 AlexNet:為何它能在 ImageNet 一戰成名、論文想傳達的核心訊息是什麼,以及哪些結論放到今日仍成立、哪些需要更精準的詮釋。
Looking for an AI platform or Agentic AI partner? I help teams ship enterprise-grade RAG, multi-agent, and real-time AI systems.
Contact