Projects
AI platform · Agent design · RAG · Realtime AI
BloomRender
一站式 AI 修圖與多種生成場景(證件照、形象照、旅遊照、虛擬試穿)
BloomRender — Let your ideas bloom. AI 驅動的專業照片編輯與生成工作室,以 Google Gemini API 提供修圖、濾鏡、證件照、形象照、旅遊照、主題寫真、雙人/團體照與 AI 虛擬試穿。
View project收據 OCR API
多醫院收據格式 → 統一 JSON 輸出,端對端自動解析
以 PaddleOCR + YOLOv7 + 自訂正則化流程,自動解析台灣各大醫院住院/門診收據,輸出 API 友善的 JSON 結構。
View projectAgentic RAG 系統
16.7x 效能提升(20s → 1.2s 響應)
基於 LangGraph 的多代理 RAG,以 Gemini 多模態解析 PDF、語義分塊與查詢重寫/自我校正,提供 REST 與 MCP API,支援 Docker 與 Cloud Run 部署。
View projectPortfolio Opening Bell Agent(開盤投資組合助理)
將投資人實際持股、即時行情與新聞脈絡整合成結構化開盤報告與決策儀表盤,協助在開盤前快速掌握風險與機會。
部位感知的 AI 投資組合助理:結合持股、即時行情與新聞,產出開盤指南與決策儀表盤,支援趨勢交易與風險排查。
View project即時語音 AI
即時語音對話 · 可選 Realtime API / Gemini Live
OpenAI Realtime API + Gemini Live + MCP:可選模型的類 ChatGPT 語音助理,支援即時語音、串流回覆、深色/淺色模式與工具增強對話。
View projectPPT2Preview
投影片 + 大綱 → 帶 AI 語音的專業影片
將投影片與 Markdown 大綱自動轉為帶 AI 語音解說的專業影片,支援 PDF/PPTX 上傳、Gemini 腳本生成、多音色 TTS 與一鍵合成下載。
View projectLINE Chatbot · n8n 工作流平台
1 主流程智能路由至 19 個子流程(RAG、事實查證、圖像、新聞等)
基於 n8n 建構的 LINE Chatbot,以 Google Gemini 分析用戶輸入並智能路由至 19 個子流程,涵蓋 RAG、事實查證、新聞、圖像生成與網頁爬取。
View projectTrendScope 會議趨勢平台
手動整理會議重點 → 一鍵產出結構化報告
以 Gemini、BigQuery 與 FastAPI 打造的會議內容處理與報告生成平台,從逐字稿、簡報與爬蟲結果自動整理出結構化趨勢報告。
View projectText2Podcast
文字 → 雙講者 Podcast 音訊一鍵產出
從文字內容自動生成專業 Podcast 音訊,以 AI 將文字轉為雙講者對話稿,搭配 Google Cloud TTS 合成自然語音,支援多種長度模式與即時進度追蹤。
View projectPDF to Markdown Converter
PDF → 結構化 Markdown,支援 RAG 與 AI 前處理
將 PDF 轉換為結構化 Markdown,內建前端介面與 FastAPI 後端,採混合解析策略(PyMuPDF + Gemini Vision),支援 RAG 與 AI 解析前處理。
View projectLooking for an AI platform or Agentic AI partner? I help teams ship enterprise-grade RAG, multi-agent, and real-time AI systems.
Contact專案
AI 平台 · Agent 設計 · RAG · 即時 AI
BloomRender
一站式 AI 修圖與多種生成場景(證件照、形象照、旅遊照、虛擬試穿)
BloomRender — Let your ideas bloom. AI 驅動的專業照片編輯與生成工作室,以 Google Gemini API 提供修圖、濾鏡、證件照、形象照、旅遊照、主題寫真、雙人/團體照與 AI 虛擬試穿。
看專案收據 OCR API
多醫院收據格式 → 統一 JSON 輸出,端對端自動解析
以 PaddleOCR + YOLOv7 + 自訂正則化流程,自動解析台灣各大醫院住院/門診收據,輸出 API 友善的 JSON 結構。
看專案Agentic RAG 系統
16.7x 效能提升(20s → 1.2s 響應)
基於 LangGraph 的多代理 RAG,以 Gemini 多模態解析 PDF、語義分塊與查詢重寫/自我校正,提供 REST 與 MCP API,支援 Docker 與 Cloud Run 部署。
看專案Portfolio Opening Bell Agent(開盤投資組合助理)
將投資人實際持股、即時行情與新聞脈絡整合成結構化開盤報告與決策儀表盤,協助在開盤前快速掌握風險與機會。
部位感知的 AI 投資組合助理:結合持股、即時行情與新聞,產出開盤指南與決策儀表盤,支援趨勢交易與風險排查。
看專案即時語音 AI
即時語音對話 · 可選 Realtime API / Gemini Live
OpenAI Realtime API + Gemini Live + MCP:可選模型的類 ChatGPT 語音助理,支援即時語音、串流回覆、深色/淺色模式與工具增強對話。
看專案PPT2Preview
投影片 + 大綱 → 帶 AI 語音的專業影片
將投影片與 Markdown 大綱自動轉為帶 AI 語音解說的專業影片,支援 PDF/PPTX 上傳、Gemini 腳本生成、多音色 TTS 與一鍵合成下載。
看專案LINE Chatbot · n8n 工作流平台
1 主流程智能路由至 19 個子流程(RAG、事實查證、圖像、新聞等)
基於 n8n 建構的 LINE Chatbot,以 Google Gemini 分析用戶輸入並智能路由至 19 個子流程,涵蓋 RAG、事實查證、新聞、圖像生成與網頁爬取。
看專案TrendScope 會議趨勢平台
手動整理會議重點 → 一鍵產出結構化報告
以 Gemini、BigQuery 與 FastAPI 打造的會議內容處理與報告生成平台,從逐字稿、簡報與爬蟲結果自動整理出結構化趨勢報告。
看專案Text2Podcast
文字 → 雙講者 Podcast 音訊一鍵產出
從文字內容自動生成專業 Podcast 音訊,以 AI 將文字轉為雙講者對話稿,搭配 Google Cloud TTS 合成自然語音,支援多種長度模式與即時進度追蹤。
看專案PDF to Markdown Converter
PDF → 結構化 Markdown,支援 RAG 與 AI 前處理
將 PDF 轉換為結構化 Markdown,內建前端介面與 FastAPI 後端,採混合解析策略(PyMuPDF + Gemini Vision),支援 RAG 與 AI 解析前處理。
看專案正在找 AI 平台或 Agentic AI 夥伴?我協助團隊交付企業級 RAG、多代理與即時 AI 系統。
聯絡