方法論案例 · 本機 AI Agent 工作系統

我的本機 Agentic AI 工作系統

這篇整理我目前使用本機式 Agentic AI 的工作方法。重點不是介紹某一個模型,也不是把 AI 當成更聰明的聊天框,而是把 AI 放進一套可以讀資料、用工具、保存狀態、交接下一輪、最後交付可驗收成果的工作系統。

Agentic AI 系統工作藍圖
這張圖用一頁概括本機 AI Agent、交接、記憶、知識協作與驗收之間的關係。

README 教你用 Kit;這篇講 Kit 放在哪一層。

如果你只是想知道 Agent Handoff Kit 怎樣安裝、怎樣開工、怎樣收工,README、60 秒 intro 和實操 guide 已經足夠。這篇不應重複那些內容。

這篇真正要補上的,是一個架構層問題:當你開始使用 Claude Code、OpenAI Codex、Google Antigravity CLI、Tencent WorkBuddy 這類本機 AI Agent 時,整套工作方法應該怎樣分層,才不會每次開新對話都重新入職、重新解釋、重新混亂。

所以,Agent Handoff Kit 在這篇不是主角,不是平台,不是記憶資料庫,也不是 Notion 或 Google Drive 同步工具。它是整套本機 Agentic AI 工作系統中的「項目連續性與交接層」:把開工入口、目前狀態、下一步、風險、真源登記、規則入口、安全邊界和收工提示放進項目文件。正因為只佔這一層,它的定位才清楚。

Agentic AI 不是聊天模式,而是工作系統。

我最初使用 AI 時,也會自然地把它當成問答工具:輸入問題,等它回答。這種方式適合查資料、改句子、做短任務,但一旦任務變長,問題就會出現。

新對話記不起前文,檔案版本混亂,AI 不知道哪些資料才是真源,也不知道甚麼操作需要先問我。這不只是效率問題,而是工作風險。

所以我現在的做法,是先建立一套 Agentic AI 工作系統,再讓 AI 在系統內工作。

模型、上下文、工具、規則與權限、記憶、交接、驗收,合在一起,才是一個可用的 AI Agent 工作流。 模型只是一部分。真正令工作穩定的,是 AI 能否在正確資料、正確工具、正確邊界之內,一步一步完成任務,並把狀態留給下一輪。

普通聊天 AI 回答問題;本機 AI Agent 進入項目。

我優先使用能讀寫本機資料夾的 AI Agent,而不只是在網頁聊天框輸入問題。這類工具可以是 Claude Code、OpenAI Codex、Google Antigravity CLI、Tencent WorkBuddy;工具名稱會變,但我重視的是三個共同能力。

  • 能讀寫工作資料夾。
  • 能調用工具,例如搜尋、讀檔、改檔、執行檢查。
  • 能交付可檢查成果,而不是只輸出一段看似合理的文字。

這是普通聊天 AI 和本機 AI Agent 的核心分別。普通聊天 AI 多數只能在對話框內回答;本機 AI Agent 可以進入一個工作目錄,理解檔案、素材、規格和項目狀態。

新手第一步不需要追求最複雜的自動化。先建立一個清楚的工作資料夾,讓 AI 每次都在同一個資料夾內工作,已經能大幅減少混亂。

AI 最大的實務問題之一,是新對話失憶。

你在上一輪花了很多時間解釋目標、檔案、規則和偏好;到下一輪,AI 又像重新入職一樣,重問一次,甚至重做一次。這不只是浪費時間,也會令正式成果變得不穩定。

所以我把 Agent Handoff Kit 放在整個流程中央。它的作用不是替代 AI,而是讓不同 AI Agent 可以接上同一個項目狀態。

  • 開工入口:用 AGENTS、CLAUDE、GEMINI 和 START_NEXT_SESSION_PROMPT 讓不同本機 AI 工具找到同一套開始方式。
  • 目前狀態:用交接文件保存做到哪裡、下一步、風險和檢查結果。
  • 真源與索引:把重要檔案、外部來源、同步責任和文件角色登記清楚,避免新文件變成孤兒。
  • 規則入口:按任務載入需要的工作規則,例如寫作、研究、知識整理、發布或安全操作。
  • 追溯紀錄與長期決策:近期工作、長期演進、架構取捨和重要學習不只留在聊天紀錄。
  • 安全護欄:刪除、覆寫、發佈、權限、費用、外部寫入等高風險操作要先停下來講清楚。
  • 收工接力:本輪結束時更新交接文件和下一次開工提示,讓下一個 AI 工具接得上。

我的習慣很簡單:開始時說「開工」,結束前說「收工」。只要某項成果已經定稿,例如正式圖片、正式文章、規格、工作流程,我就會要求 AI 把它接入 Agent Handoff Kit。

這樣下一輪 AI 不需要憑印象,也不用翻舊對話,而是直接讀項目內的狀態、索引、規則和交接提示。

Memory 有用,但不能取代真源。

Memory 一定要有,但我不會把 Memory 當成真相。在通用 Agentic AI 系統裡,記憶通常可以分三層理解:短期記憶保留當前任務的狀態、觀察和剛剛做過的事;長期記憶沉澱偏好、決策、常用流程和反覆出現的規則;檢索記憶在需要時回到文件、資料庫、知識庫或官方來源尋找證據。

這種分層不需要綁定某一個框架。新手只要先分清三件事:當前對話裡正在處理甚麼、項目檔案裡已確認甚麼、長期知識庫裡沉澱了甚麼。三者分清楚,AI 才不會把臨時想法、已確認事實和長期偏好混在一起。

我的原則是:Memory 輔助判斷,真源仍以檔案、資料庫、官方文件或已確認資料為準。

如果 AI 說「我記得你之前偏好這樣做」,這只能作為提示;如果要正式交付,仍要回到真源檢查。

知識與協作層要分工

我把知識和協作資料分成三類:Google Drive 適合參考資料、附件、鏡像和備份;Notion 適合索引、決策、知識庫和項目 Dashboard;本機資料夾適合正式工作檔、程式碼、規格、圖片和輸出。

這三者不要混在一起。本機資料夾適合做當前工作真源,因為 AI 可以直接讀寫和驗收。Notion 適合做人類可讀的索引和知識沉澱。Google Drive 適合放參考檔、附件和跨裝置保存。

AI 應該能在有權限和邊界的情況下連接外部資料與工具,而不是困在聊天框裡。但能連接不代表可以任意寫入。外部平台寫入、刪除、發布、權限、費用操作,都應該先停下來確認。

我不把「AI 回答了」當成交付。

我的 Agentic AI 工作流,最後一定要回到交付。我會問:成果是否可檢查?檔案是否存在?來源是否可追溯?下一輪是否能接手?

先定義成功

每次開始前,先講清楚目標、範圍和驗收標準。不要只說「幫我整理一下」。更好的說法是:「整理成一篇可給新手閱讀的教學文章,保留我的個人口吻,但方法要通用。」AI 需要知道終點,才不會只交一份看似完整但無法驗收的內容。

先讀真源

有檔案就讀檔案,有官方文件就查官方文件,有 Dashboard 就先搜尋 Dashboard。未讀不猜,未核實就標明。AI 最大的風險不是不會寫,而是寫得很順但沒有核對。

高風險先確認

刪除、覆寫、發布、權限、費用、外部寫入,都要先確認。本機 AI Agent 很強,是因為它可以做事;也正因為它可以做事,所以必須有邊界。

每輪可驗收

每一輪工作,都應該留下可驗收結果:檔案是否建立、圖片是否正確、文章是否放入指定位置、交接狀態是否更新、下一步是否清楚。這樣 AI 才不會只是在對話中完成,而是在真實工作系統中完成。

Connector、Plugin、Skill、MCP 是工具接入層,不是產品定位本身。

本機 AI Agent 要真正做事,通常需要連接工具、資料和可重用方法。Connector 可以接外部服務;Plugin 可以帶入一組能力;Skill 可以保存可重用工作方法;MCP 則把工具和資源用較標準的方式交給 AI 使用。這些東西很重要,但它們不是 Agent Handoff Kit 的定位。

我的分法是:工具負責讓 AI 做得到,治理負責讓 AI 做得穩,Agent Handoff Kit 負責把狀態、真源、規則、安全邊界和下次開工提示落在項目文件。

所以 Connector、Plugin、Skill、MCP 應該被放在「工具與權限」這一層:哪些資料可以讀、哪些工具可以用、哪些操作要先問、哪些結果要寫回真源。不能因為 AI 能調用工具,就把外部平台、記憶、同步和交接混成一件事。

把一次工作設成回路

我會把一次 AI 工作看成一個 loop:先定義目標,再讀真源,再用工具行動,再觀察結果,再驗收,再把下一步交接出去。這就是我理解的 loop engineering:不是要求 AI 一次答中,而是設計一個可以反覆觀察、修正和驗收的工作回路。

近年的 harness engineering 說法也接近這個方向:不要只看模型本身,而要看模型、工具、權限、記憶、觀察、失敗歸因、人工介入和驗收如何合成一個工作環境。對個人使用者來說,不需要先建龐大平台;先把資料夾、真源、工具權限、交接、驗收和高風險確認設好,已經是最實用的治理。

驗收要多維度

文字看起來順,不等於完成。正式交付前,我會同時檢查:內容是否符合目標,來源是否已讀,檔案和連結是否存在,圖片或頁面是否視覺可用,高風險操作是否已確認。下一步不屬於交付本身的驗收,而是收工交接時必須留下的接力資訊。

這裡的 governance 不是企業口號,而是日常工作邊界:AI 可以讀甚麼、改甚麼、調用甚麼、何時要停、如何驗收、怎樣把狀態留給下一輪。

剛開始,不需要一開始就建立很複雜的系統。

可以先照這個最小版本做:

  1. 建立一個專用工作資料夾。
  2. 把參考資料、圖片、草稿、輸出都放入同一個資料夾。
  3. 安裝 Agent Handoff Kit。新手可以先看 安裝 Prompt,再叫 AI 在目前資料夾安裝或升級
  4. 每次開始工作時說「開工」。
  5. 每次完成一輪重要工作時說「收工」。
  6. 正式成果要登記為真源。可以直接對 AI 說:「docs/xxxx.md 接入 Agent Handoff Kit」。
  7. 如果不確定哪些重要文件還未接入,可以說:「掃描未接入 Agent Handoff Kit 的重要文件」。這適合大量新增文件、換 AI 接手前、發布前或整理舊項目時使用。
  8. 要求 AI 先讀真源,再動手。可以說:「先讀 README、HTML、Markdown 文檔、Notion DB 這些真源;讀完再提出計劃,未讀不要猜。」如果你不確定真源在哪裡,就說:「先告訴我你會讀哪些真源,讀完再開始改。」
  9. 發布、刪除、外部寫入前必須先確認;確認內容要包括影響範圍、回復方法和驗收方式。

做到這一步,AI 已經不再只是聊天工具,而是可以接力工作的助手。

真正穩定的 AI 工作,不是靠一次神回覆,而是靠工具、上下文、記憶、真源、護欄和交接一起運作。

我用這幾句話提醒自己。

  • 先建環境並設置工具,再叫 AI 做事。
  • 先讀真源,不靠印象。
  • Memory 只是輔助,不是真相。
  • Connector、Plugin、Skill、MCP 是工具接入層,不是交接層。
  • 每輪都要做多維度驗收:文字、來源、連結、檔案、視覺、安全。
  • 高風險操作先停,列出影響、回復方法、需要我確認的動作。
  • 每次收工要留下下一步:下一輪要先讀甚麼、接著做甚麼、哪些風險仍未解。
  • 成果要能被下一個 AI 接手。

先理解方法,再回到工具。

這篇文章的作用,是幫你理解:當你開始認真使用本機 AI Agent 時,為甚麼需要工作資料夾、真源、交接、Memory 邊界和驗收。要開始實際使用 Agent Handoff Kit,應回到 intro、guide 和 GitHub README。