在代理型人工智慧時代,建模的隱藏價值
謊言: 「AI 現在能寫程式碼,所以架構不再重要。」
現實: 「AI 現在能執行動作,因此架構比以往任何時候都更重要。」
🚨 警訊
我們正目睹一場淘金熱的發生,一次性程式碼開發者正用膠帶式提示語串接 API 呼叫,建構出在示範中表現完美卻在生產環境中瞬間崩潰的脆弱邏輯鏈。
在聊天機器人時代,幻覺只是一則好笑的錯誤訊息。
在代理型人工智慧時代,幻覺可能是一筆被刪除的資料庫、一筆未經授權的電匯,或一項違規的合規法規。
當我們從生成式人工智慧(創造文字)轉向代理型人工智慧(執行任務)時,軟體建模其價值並未減弱——反而急速攀升。這正是為何未來屬於最優秀的建模者,而非最優秀的提示設計者的原因。
📉 「提示優先」架構的陷阱
目前,許多團隊正以這種方式建構代理:
-
輸入:使用者要求某項複雜任務。
-
處理:大型語言模型接收包含 50 條規則的龐大系統提示。
-
動作:大型語言模型直接輸出 JSON 或函式呼叫。
-
風險: 沒有狀態追蹤,沒有類型安全,除了「請不要搞砸」之外沒有任何防護機制。
⚠️ 為何這在擴展時會失敗
| 功能 | 僅靠提示的方法 | 建模方法 |
|---|---|---|
| 可靠性 | 機率性(希望它能運作) | 確定性(確保約束條件) |
| 除錯 | 「提示太模糊了」 | 「狀態轉換違反了規則 4」 |
| 可擴展性 | 上下文窗口會快速填滿 | 狀態被外部化並加以管理 |
| 安全性 | 依賴大語言模型的對齊 | 依賴結構驗證 |
💡 關鍵洞察: 沒有模型的代理僅僅是擁有根權限的混亂實習生。擁有模型的代理則是帶有檢查清單的資深工程師。
🧱 建模的復興
建模並不是畫出沒有人看的 UML 圖表。在代理時代,建模是關於 創造讓 AI 能安全思考的防護機制。
1. 領域建模作為「真實情況」🌍
大語言模型是在整個互聯網上訓練的,而不是 你的 業務邏輯。如果你要求代理「處理退款」,它會根據公開資料猜測其含義。
-
解決方案: 定義一個嚴格的 領域模型.
-
價值: 您迫使大型語言模型將其自然語言理解映射到 您的 特定實體(訂單、客戶、政策)。這透過將AI固定在您的架構上,減少幻覺。
2. 狀態建模作為「記憶」🧠
代理需要知道它們在工作流程中的位置。提示鏈會失去上下文。
-
解決方案: 實施 狀態機 (例如:空閒 → 計劃 → 執行 → 核實 → 完成)。
-
價值: 代理無法跳過步驟。它無法在「規劃」之前「執行」。它無法在「核實」之前「完成」。
3. 約束建模作為「安全」🛡️
如果代理試圖調用它不應該使用的API,會發生什麼情況?
-
解決方案: 本體論與能力地圖。
-
價值: 代理僅能意識到其當前狀態下有效的工具。它實際上 無法 看到
delete_user功能,當處於read_only_mode.
🛠️ 案例研究:旅遊代理大對決
讓我們來看看兩種建立AI旅遊代理的方法,用於預訂航班和酒店。
❌ 方法A:一次性腳本
-
邏輯: 一個巨大的提示: 「你是一名旅遊代理。為使用者預訂航班和酒店。使用這些工具。」
-
失敗模式: 使用者說「幫我預訂一班去火星的航班。」LLM 嘗試使用無效參數呼叫航班 API。或者,它在確認航班日期之前就預訂了飯店,導致衝突。
-
結果: 錯誤的預訂、生氣的客戶、API 速率限制封鎖。
✅ 方法 B:建模系統
-
邏輯: A 工作流程圖.
-
意圖狀態: 驗證目的地是否存在于資料庫中。
-
航班狀態: 搜尋 → 選擇 → 暫存(鎖定庫存)。
-
飯店狀態: 搜尋 → 選擇 → 暫存。
-
交易狀態: 扣款 → 確認雙方 → 釋放。
-
-
成功模式: 如果使用者說「火星」,系統會在 LLM 接觸 API 之前就拒絕該目的地。如果航班失敗,狀態機會自動回滾飯店的暫存。領域模型 拒絕該目的地,使 LLM 永遠不會看到 API。如果航班失敗,狀態機會自動回滾飯店的暫存。
-
結果: 穩健、可審計、可恢復的交易。
🚀 經濟論點:技術債務 vs. 設計債務
有人誤以為建模會拖慢開發進度。但在 AI 時代,情況恰恰相反。
-
提示調優是一種迭代債務: 你調整一個提示,就會破壞其他部分。你加上「不要做 X」,結果卻停止了「做 Y」。這是一種高維護成本的債務。
-
建模是一筆前期投資: 你只需定義一次類型和狀態。AI 會適應模型。當業務邏輯變更時,你只需更新模型,而非修改 50 頁的系統提示。
📉 成本曲線:
第一週: 提示法更快。
第一個月: 建模速度相當。
第一年: 提示法難以維護,如同亂麻。建模則是一項資產。
🧭 建築師的新工具包(M.A.P.)
為了在代理時代存活下來,採用 M.A.P. 你下一個AI專案的框架:
1. M建模資料
不要讓LLM輸出原始字串。強制輸出轉換為 Pydantic模型 或 JSON結構.
-
規則: 若未定義類型,就不算真實。
2. A設計流程
不要讓LLM決定操作順序。使用 狀態機 或 工作流程引擎 (例如 Temporal 或 LangGraph)。
-
規則: LLM填補空位;程式碼驅動車輛前進。
3. P保護邊界
定義 前置條件 和 後置條件 針對代理可使用的每一個工具。
-
規則: 信任,但要驗證。執行前務必驗證代理的輸出。
🔮 未來:架構師如園丁
過往,開發者是砌磚工,親手放置每一行程式碼。
未來,開發者將是 園丁.
你不會將每一片葉子都拉到正確位置。你設計支架(模型),豐富土壤(資料),修剪危險的枝條(限制條件)。然後,讓AI自然成長。
一次性程式碼能建出示範。
永續的設計才能建立帝國。
當最初的AI熱潮漸漸平息,市場不會獎勵能產生最多程式碼的人,而是獎勵那些能夠 設計出能讓程式碼保持誠實的系統的人。
🏁 最終重點
不要停止編碼。開始建模。AI是引擎,但 你 才是方向盤。











