日期: 2025年12月29日 Kila
超級懶人包
-
基礎設施勝過魔法: 宣告「試點地獄 (Pilot Purgatory)」結束的不是更聰明的模型,而是 MCP (Model Context Protocol) 與 Agents SDK 的普及。Agent 終於能穩定地「讀寫」企業系統,而不只是在聊天視窗裡賣弄文采 。
-
座位費的「變種」求生: SaaS 商業模式並未立即死亡,而是進入了 Hybrid Pricing (混合定價) 時代。Salesforce 的 Agentforce + Data 360 錄得近 14億美元 ARR (+114% YoY),其 $2 per conversation 的定價策略證明了市場正在接受「底薪 (Seat) + 績效 (Action)」的新支付邏輯 。
-
DeepMind 的冷水: 盲目堆疊 Agent 數量是燒錢的自殺行為。Google DeepMind 研究證實,3-4 個 Agent 是協作效率的黃金分割點,超過此數邊際效益將轉負。
單體強模型往往勝過一群平庸的協作者 。
為什麼 ChatGPT 遇冷,而 Agent 爆發?
回顧 2024 年,市場對 AI 的情緒經歷了一次明顯的過山車。儘管 Copilot 類產品大量普及,但許多企業發現續費率(Retention)
到了 2025 年底,我們看到了真正的範式轉移:AI Agent 的崛起。
這不僅僅是更聰明的聊天機器人。為了釐清概念,我們引用 AI 工程專家 Chip Huyen 提出的定義框架,這已成為目前業界判斷 Agent 能力的黃金標準:
Agent = Model(模型) + Tools(工具) + Planning(規劃)
-
模型 (Model): 這是大腦,負責理解自然語言和邏輯推理(如 GPT-5.2 或 Claude 4.5)。
-
工具 (Tools): 這是雙手。與 Chatbot 最大的不同在於,Agent 被賦予了調用外部系統的權限。它可以連接 API、查詢 SQL 數據庫、操作瀏覽器,甚至發送 Slack 通知。
-
規劃 (Planning): 這是 Agent 的核心靈魂。當面對一個模糊的指令——例如「
幫我處理這筆退款爭議」——Agent 不需要人類告訴它第一步做什麼。 它能自主將目標拆解為一系列子任務(驗證客戶資格 -> 計算退款金額 -> 更新 ERP 系統 -> 發送確認郵件),並在過程中自我修正。如果第一步驗證失敗, 它會嘗試其他路徑,而不是直接報錯。
這標誌著技術從 "Read-Only"(唯讀) 到 "Read-Write"(讀寫) 的跨越。企業願意支付高溢價的,正是這種「非同步執行」的能力—
為什麼這是一場工程學的勝利?
技術的本質並沒有發生基因突變,發生改變的是 Computer Use (電腦操作能力) 與 Context (上下文) 的整合深度 。
1. 從「聊天」到「操作」
在 2024 年,要讓 AI 執行任務,你往往需要繁瑣的 API 對接。但在 2025 年,我們看到了 Anthropic 和 OpenAI 直接讓 Agent 接管了作業系統 (OS) 和瀏覽器層級 。
-
OpenAI Operator / CUA: 這是典型的降維打擊。Agent 不再需要專用的 API 接口,它可以像人類一樣「看著」螢幕,控制滑鼠點擊、輸入文字、
導航網頁 。 -
Anthropic Computer Use: 讓 Claude 能夠直接操作桌面環境,這對於編碼和技術型 Agent 來說是巨大的護城河 。
2. MCP: Agent 時代的 USB 接口
這是我認為 2025 年最被低估的技術進展:Model Context Protocol (MCP) 。 在此之前,每個 Agent 連接數據庫的方式都像是在發明一種新語言。MCP 的出現,為 Agent 與數據源 (Systems of Record) 之間建立了一個通用的標準。這就像 USB 接口一樣,一旦標準化,生態系統的摩擦力就會瞬間消失。
-
Microsoft Copilot Studio 已經原生支援 MCP,這意味著企業不需要再為每個 Agent 寫一堆膠水代碼。
2025 年的贏家,不是那些還在微調模型參數的人,而是那些搞定了「
這直接引發了一個更現實的問題:如果 AI 真的開始幹活了,我們該付它多少錢?
座位費沒死,它只是「變種」了
市場上有一個流行的論點:「AI Agent 將殺死 SaaS 的 Per-Seat (按人頭付費) 商業模式。」這個說法很危險——因為它只對了一半。
SaaS 確實面臨壓力,但巨頭們並不是坐以待斃。我們正在見證商業模式的 Hybrid Mutation (混合突變)。企業不會一夜之間放棄訂閱制,而是進入一個「
1. Salesforce 的數據反擊
Salesforce 在 2025 年 Q3 (FY26) 的財報給了另一個答案。其 Agentforce + Data 360 業務錄得接近 14億美元 的 ARR (年經常性收入),年增長率達 114%。
這證明了什麼?證明了企業願意為「數碼勞動力」買單,
2. 定價的藝術:$2 Per Conversation
Salesforce 的定價策略非常有心機。他們推出了 $2 per conversation 的標準定價,並引入了 Flex Credits 機制。這不是單純的 API 調用費,這是 Outcome-Adjacent Pricing。
-
舊世界 (SaaS): 你租用工具,不管你有沒有用,每個月都要付錢。
-
新世界 (Agentic): 你付一筆基礎的「座位費」來維持系統運作,然後為 Agent 的每一次「實際工作」額外付費。
這意味著軟體公司不再只是在切分企業的IT 預算(通常佔營收的 5-10%),而是開始直接進攻更龐大的勞動力預算。
不僅LAM,關注 "Context" & "Control"
不止是 LAM (Large Action Model) 正在堀起 。模型本身正在商品化,任何人都可以透過 API 調用最強的大腦。
真正的護城河在於 Context (上下文) 和 Control (控制權)。誰擁有數據的完整上下文,誰能確保 Agent 不會發瘋,誰就是贏家。
1. Microsoft: The Context King
Microsoft 的策略是透過 Copilot Studio 讓 Agent 普及化。利用其在 Office 365 和 SharePoint 的統治地位,Microsoft 試圖讓建立 Agent 變得像使用 Excel 一樣簡單。
其優勢在於非結構化數據的處理能力。企業大量的隱性知識隱藏在 PDF、郵件、Teams 會議記錄中。Microsoft 的 Graph 技術讓 Agent 能夠「讀懂」這些散落在各處的知識,這在法律、諮詢、
更關鍵的是,Copilot Studio 原生支援 MCP (Model Context Protocol),這讓企業可以快速將 Agent 連接到內部的 Legacy Systems。當你的 Agent 能直接讀懂那份 200 頁的合規 PDF 並回答問題時,這就是護城河 。
2. Palantir: The Reality Architect
如果說 Microsoft 管文檔,Salesforce 管客戶,那麼 Palantir (PLTR) 就管「現實世界」。
Palantir 的 AIP (Artificial Intelligence Platform) 之所以獨特,在於它的核心技術 Ontology(本體論)。
-
什麼是 Ontology? 它將真實世界的資產(如工廠流水線、戰場上的坦克、
供應鏈中的貨輪)映射為數位雙胞胎。 -
Agent 的能力: 其他家的 Agent 頂多幫你寫郵件或更新 CRM,但 Palantir 的 Agent 能執行物理級別的決策。例如:「颶風即將來襲,Agent 自動分析影響,並重新調度 50 個貨櫃的物流路徑」。
-
護城河: 這種讓 Agent 理解「實體資產互動邏輯」的能力,是 Palantir 在軍工、製造和能源領域不可撼動的護城河。對於需要「
高風險決策」的企業來說,Palantir 是唯一選擇。
3. Sierra: The Trust Broker
由 OpenAI 現任董事會主席 Bret Taylor 創立的 Sierra,估值已達 100 億美元。為什麼?因為它解決了 B2C Agent 最致命的問題:Trust (信任)。
在面對消費者時,企業對 Hallucination (幻覺) 是零容忍的。Sierra 的價值在於它不僅僅是讓 Agent 說話,而是建立了嚴密的 Guardrails (護欄),確保 Agent 絕不承諾超出政策的退款。在 B2B 市場,Reliability (可靠性) 的溢價遠高於 Creativity。
Google DeepMind 的「規模悖論」
在 Agent 狂熱中,最清醒的聲音反而來自 Google DeepMind。他們發布的研究報告《Towards a Science of Scaling Agent Systems》戳破了「多智能體 (Multi-Agent)」的泡沫 。
1. More Agents ≠ Better
直覺告訴我們,三個臭皮匠勝過一個諸葛亮。但數據告訴我們:
研究顯示,3-4 個 Agent 是協作效率的「黃金分割點」。一旦超過這個數量,Agent 之間的溝通成本和 Token 消耗將呈指數級上升,而績效卻會出現 Diminishing Returns。
2. 複雜度的代價
-
協調崩潰: 當任務需要過多工具時,多智能體系統容易出現「協調崩潰」,
因為它們花在解釋彼此操作上的時間比實際推理還多 。 -
單體強模型勝出: 在許多情況下,一個經過嚴格定義工具的強大單體模型,
其表現遠勝過一群平庸的 Agent 互相開會。
這給企業的啟示是: 不要為了 AI 而 AI。盲目堆疊 Agent 數量只會讓你燒光預算,卻得不到結果。Simplicity 和 Focus 才是工程落地的關鍵。
贏家屬於「控制者」
我們正處於一個分水嶺。2025 年不是 Agent 的「魔法元年」,而是 Operational Discipline的元年。
市場不再獎勵那些展示超型 Demo 的公司,而是獎勵那些能將 Agent 轉化為生產級資產的企業 。這場遊戲的贏家邏輯已經徹底改變:
1. 治理即產品:未來的護城河不在於誰的模型參數更大,
2. 數據鴻溝:我們將看到企業之間出現巨大的 GenAI Divide。 一邊是擁有 Structured Data (結構化數據) 和 Context 的「控制者」(如 Microsoft, Salesforce),他們的 Agent 能讀懂企業的每一條神經;另一邊是陷在 Unstructured Data (非結構化數據) 泥沼中的落後者,他們的 Agent 只能由始至終地產生幻覺 。Agent 需要的是乾淨的數據糧食,而不是混亂的 PDF 垃圾。
Agentic AI 是一場關於 Infrastructure 和 Integration 的戰爭,而不是模型智商的戰爭。
這不是科幻小說,這是工程學。
蕭生點評
我想大家首先明白AI Agent嘅基本性質。2026年好有可能係AI Agent之年,
合規免責聲明
本文僅供資料及教育用途,不構成任何投資建議或招攬。