Projects
AI platform · Agent design · RAG · Realtime AI
- BloomRender
BloomRender — Let your ideas bloom. AI 驅動的專業照片編輯與生成工作室,以 Google Gemini API 提供修圖、濾鏡、證件照、形象照、旅遊照、主題寫真、雙人/團體照與 AI 虛擬試穿。
- 收據 OCR API
以 PaddleOCR + YOLOv7 + 自訂正則化流程,自動解析台灣各大醫院住院/門診收據,輸出 API 友善的 JSON 結構。
- Agentic RAG 系統
基於 LangGraph 的多代理 RAG,以 Gemini 多模態解析 PDF、語義分塊與查詢重寫/自我校正,提供 REST 與 MCP API,支援 Docker 與 Cloud Run 部署。
- Portfolio Opening Bell Agent(開盤投資組合助理)
部位感知的 AI 投資組合助理:結合持股、即時行情與新聞,產出開盤指南與決策儀表盤,支援趨勢交易與風險排查。
- 即時語音 AI
OpenAI Realtime API + Gemini Live + MCP:可選模型的類 ChatGPT 語音助理,支援即時語音、串流回覆、深色/淺色模式與工具增強對話。
- PPT2Preview
將投影片與 Markdown 大綱自動轉為帶 AI 語音解說的專業影片,支援 PDF/PPTX 上傳、Gemini 腳本生成、多音色 TTS 與一鍵合成下載。
- LINE Chatbot · n8n 工作流平台
基於 n8n 建構的 LINE Chatbot,以 Google Gemini 分析用戶輸入並智能路由至 19 個子流程,涵蓋 RAG、事實查證、新聞、圖像生成與網頁爬取。
- pdf2ppt:NotebookLM PDF 轉成可編輯 PPT
將 NotebookLM 與一般簡報型 PDF 轉成可編輯 PowerPoint,結合原生 PDF 解析、PaddleOCR、頁面分類與條件式背景重建,兼顧可編輯性與視覺還原。
- TrendScope 會議趨勢平台
以 Gemini、BigQuery 與 FastAPI 打造的會議內容處理與報告生成平台,從逐字稿、簡報與爬蟲結果自動整理出結構化趨勢報告。
- Text2Podcast
從文字內容自動生成專業 Podcast 音訊,以 AI 將文字轉為雙講者對話稿,搭配 Google Cloud TTS 合成自然語音,支援多種長度模式與即時進度追蹤。
- PDF to Markdown Converter
將 PDF 轉換為結構化 Markdown,內建前端介面與 FastAPI 後端,採混合解析策略(PyMuPDF + Gemini Vision),支援 RAG 與 AI 解析前處理。
Looking for an AI platform or Agentic AI partner? I help teams ship enterprise-grade RAG, multi-agent, and real-time AI systems.
Contact