de_DEen_USes_ESfr_FRhi_INid_IDjapl_PLpt_PTru_RUvizh_CN

🏗️ 從一次性程式碼到永續設計

在代理型人工智慧時代,建模的隱藏價值

謊言: 「AI 現在能寫程式碼,所以架構不再重要。」
現實: 「AI 現在能執行動作,因此架構比以往任何時候都更重要。」


🚨 警訊

我們正目睹一場淘金熱的發生,一次性程式碼開發者正用膠帶式提示語串接 API 呼叫,建構出在示範中表現完美卻在生產環境中瞬間崩潰的脆弱邏輯鏈。

在聊天機器人時代,幻覺只是一則好笑的錯誤訊息。
代理型人工智慧時代,幻覺可能是一筆被刪除的資料庫、一筆未經授權的電匯,或一項違規的合規法規。

當我們從生成式人工智慧(創造文字)轉向代理型人工智慧(執行任務)時,軟體建模其價值並未減弱——反而急速攀升。這正是為何未來屬於最優秀的建模者,而非最優秀的提示設計者的原因。


📉 「提示優先」架構的陷阱

目前,許多團隊正以這種方式建構代理:

  1. 輸入:使用者要求某項複雜任務。

  2. 處理:大型語言模型接收包含 50 條規則的龐大系統提示。

  3. 動作:大型語言模型直接輸出 JSON 或函式呼叫。

  4. 風險: 沒有狀態追蹤,沒有類型安全,除了「請不要搞砸」之外沒有任何防護機制。

⚠️ 為何這在擴展時會失敗

功能 僅靠提示的方法 建模方法
可靠性 機率性(希望它能運作) 確定性(確保約束條件)
除錯 「提示太模糊了」 「狀態轉換違反了規則 4」
可擴展性 上下文窗口會快速填滿 狀態被外部化並加以管理
安全性 依賴大語言模型的對齊 依賴結構驗證

💡 關鍵洞察: 沒有模型的代理僅僅是擁有根權限的混亂實習生。擁有模型的代理則是帶有檢查清單的資深工程師。


🧱 建模的復興

建模並不是畫出沒有人看的 UML 圖表。在代理時代,建模是關於 創造讓 AI 能安全思考的防護機制。

1. 領域建模作為「真實情況」🌍

大語言模型是在整個互聯網上訓練的,而不是 你的 業務邏輯。如果你要求代理「處理退款」,它會根據公開資料猜測其含義。

  • 解決方案: 定義一個嚴格的 領域模型.

  • 價值: 您迫使大型語言模型將其自然語言理解映射到 您的 特定實體(訂單、客戶、政策)。這透過將AI固定在您的架構上,減少幻覺。

2. 狀態建模作為「記憶」🧠

代理需要知道它們在工作流程中的位置。提示鏈會失去上下文。

  • 解決方案: 實施 狀態機 (例如:空閒 → 計劃 → 執行 → 核實 → 完成)。

  • 價值: 代理無法跳過步驟。它無法在「規劃」之前「執行」。它無法在「核實」之前「完成」。

3. 約束建模作為「安全」🛡️

如果代理試圖調用它不應該使用的API,會發生什麼情況?

  • 解決方案: 本體論與能力地圖。

  • 價值: 代理僅能意識到其當前狀態下有效的工具。它實際上 無法 看到 delete_user 功能,當處於 read_only_mode.


🛠️ 案例研究:旅遊代理大對決

讓我們來看看兩種建立AI旅遊代理的方法,用於預訂航班和酒店。

❌ 方法A:一次性腳本

  • 邏輯: 一個巨大的提示: 「你是一名旅遊代理。為使用者預訂航班和酒店。使用這些工具。」

  • 失敗模式: 使用者說「幫我預訂一班去火星的航班。」LLM 嘗試使用無效參數呼叫航班 API。或者,它在確認航班日期之前就預訂了飯店,導致衝突。

  • 結果: 錯誤的預訂、生氣的客戶、API 速率限制封鎖。

✅ 方法 B:建模系統

  • 邏輯: A 工作流程圖.

    1. 意圖狀態: 驗證目的地是否存在于資料庫中。

    2. 航班狀態: 搜尋 → 選擇 → 暫存(鎖定庫存)。

    3. 飯店狀態: 搜尋 → 選擇 → 暫存。

    4. 交易狀態: 扣款 → 確認雙方 → 釋放。

  • 成功模式: 如果使用者說「火星」,系統會在 LLM 接觸 API 之前就拒絕該目的地。如果航班失敗,狀態機會自動回滾飯店的暫存。領域模型 拒絕該目的地,使 LLM 永遠不會看到 API。如果航班失敗,狀態機會自動回滾飯店的暫存。

  • 結果: 穩健、可審計、可恢復的交易。


🚀 經濟論點:技術債務 vs. 設計債務

有人誤以為建模會拖慢開發進度。但在 AI 時代,情況恰恰相反。

  • 提示調優是一種迭代債務: 你調整一個提示,就會破壞其他部分。你加上「不要做 X」,結果卻停止了「做 Y」。這是一種高維護成本的債務。

  • 建模是一筆前期投資: 你只需定義一次類型和狀態。AI 會適應模型。當業務邏輯變更時,你只需更新模型,而非修改 50 頁的系統提示。

📉 成本曲線:

  • 第一週: 提示法更快。

  • 第一個月: 建模速度相當。

  • 第一年: 提示法難以維護,如同亂麻。建模則是一項資產。


🧭 建築師的新工具包(M.A.P.)

為了在代理時代存活下來,採用 M.A.P. 你下一個AI專案的框架:

1. M建模資料

不要讓LLM輸出原始字串。強制輸出轉換為 Pydantic模型 或 JSON結構.

  • 規則: 若未定義類型,就不算真實。

2. A設計流程

不要讓LLM決定操作順序。使用 狀態機 或 工作流程引擎 (例如 Temporal 或 LangGraph)。

  • 規則: LLM填補空位;程式碼驅動車輛前進。

3. P保護邊界

定義 前置條件 和 後置條件 針對代理可使用的每一個工具。

  • 規則: 信任,但要驗證。執行前務必驗證代理的輸出。


🔮 未來:架構師如園丁

過往,開發者是砌磚工,親手放置每一行程式碼。
未來,開發者將是 園丁.

你不會將每一片葉子都拉到正確位置。你設計支架(模型),豐富土壤(資料),修剪危險的枝條(限制條件)。然後,讓AI自然成長。

一次性程式碼能建出示範。
永續的設計才能建立帝國。

當最初的AI熱潮漸漸平息,市場不會獎勵能產生最多程式碼的人,而是獎勵那些能夠 設計出能讓程式碼保持誠實的系統的人。

🏁 最終重點

不要停止編碼。開始建模。AI是引擎,但  才是方向盤。

發佈日期: 分類 AI