Skip to main content
Home
News Repo 2026 (v05)
since 2026-01-01

Breadcrumb

  1. Home
  2. 【謎米財經分析報告】 蒸汽、鋼鐵與協調稅:AI Agent 的理想與現實

【謎米財經分析報告】 蒸汽、鋼鐵與協調稅:AI Agent 的理想與現實

KF Cheng
By KF Cheng on Fri, 2026-01-09 - 17:01
Short Title
【謎米財經分析報告】 蒸汽、鋼鐵與協調稅:AI Agent 的理想與現實
Private
Public
Image
Financial Analysis Report 謎米財經分析報告
2026-01-09

2026年1月6日 Kila

無限心智的黎明:從 Ivan Zhao 的預言說起

這一篇不會如平常的公司或產業分析,而是將Picture放大,去看整個AI Agent的趨勢。

如果說 2023 年是 ChatGPT 的驚奇時刻,那麼 2025 年本應是 AI Agent(智能體)全面接管工作的一年。但現實卻有些令人尷尬。OpenAI 的 Sam Altman 曾預言 AI 將「加入勞動力隊伍」,但直到今天,大多數人的 AI 體驗依然停留在對話框裡的你問我答。我們期待的是能幫我們自動訂機票、寫報告、甚至運營公司的數碼員工,但得到的卻往往是一個偶爾會一本正經胡說八道的聊天機器人。

這種落差從何而來?是技術失敗了嗎?還是我們看錯了方向?

為了回答這個問題,本文將拆解 Notion CEO Ivan Zhao 的深度文章《Steam, Steel, and Infinite Minds》(下附連結),並對照 Cal Newport 在《The New Yorker》的最新觀察以及 Google DeepMind 的硬核數據,試圖還原 AI Agent 的真實面貌。這不是關於某個模型的評測,而是一場關於「組織物理學」的探討。

Ivan Zhao 在他的文章中提出了一個極具洞察力的觀點:每一種新技術出現時,我們總是習慣用「後視鏡」看未來 。早期的電影看起來像被攝影機拍下來的舞台劇,早期的電話通訊像電報 。同樣地,今天最流行的 AI 形式 Chatbot,看起來就像是過去 Google 搜尋框的擬人化版本 。

我們正處於一個尷尬的過渡期。Ivan 把它比喻為工業革命初期的「水車換蒸汽機」階段 。當時的工廠老闆只是把推動機器的水車換成了蒸汽機,但工廠的佈局、流程完全沒變,因此生產力的提升非常有限。直到後來,人們意識到蒸汽機意味著可以脫離河流,將工廠搬到離港口和工人更近的地方,並圍繞著動力源重新設計整條生產線,第二次工業革命才真正爆發 。

現在的我們,正在做著「把蒸汽機裝在水車工廠」裡的傻事。我們試圖把強大的 AI 模型塞進為人類設計的舊工作流中,讓它充當一個更聰明的 Copilot。但 AI Agent 的本質不是輔助,而是「無限的心智」 。當這種新材料真正滲透進組織時,它將改變的不是某個單點的效率,而是整個公司的結構與形態。

鋼鐵摩天大樓:未來的組織物理學

要理解 Agent 將如何改變工作,我們可以從個人和組織兩個維度來看。

在個人層面,Ivan 講述了他的共同創辦人 Simon 的故事 。Simon 被稱為「10x 工程師」,但他現在幾乎很少親自寫程式碼了。如果你走過他的辦公桌,你會看到他正在指揮三、四個 AI Coding Agent 同時工作 。他不再是那個在鍵盤上敲敲打打的工匠,他成了一名指揮家,或者說是「無限心智的管理者」 。

Steve Jobs 曾經把電腦比喻為「大腦的自行車」 ,意指它能放大人類的體能。但 Simon 的工作模式已經超越了自行車,他在「開車」 。在自行車時代,你踩得越快,車子跑得越快,動力依然來自於你的雙腿;但在汽車時代,你踩油門只是為了傳遞指令,動力來自於引擎。Simon 不再需要自己輸出每一行代碼,他只需要定義目標、審核結果,然後讓 Agent 團隊在後台不知疲倦地運轉。

這種個人層面的質變,如果放大到組織層面,將引發一場「建築材料」的革命。

Ivan 認為,今天的公司組織就像是用磚頭和木材蓋起來的房子 。在這種結構中,「人」是承重牆 。我們依靠無止盡的會議、訊息同步、文檔傳遞來維持組織的運作。因為人類大腦的頻寬有限,需要睡覺,會有情緒波動,所以當公司規模擴大到一定程度,溝通成本就會急劇上升。這就像用磚木蓋房子,蓋到六、七層就是極限,再高就會因為自身重量而坍塌 。

這就是為什麼大公司往往反應遲鈍,且充滿了官僚主義。這不是管理問題,這是物理問題 。

而 AI Agent 就像是建築史上的「鋼鐵」 。鋼鐵強度高且韌性好,它讓建築不再需要厚重的牆體來承重,輕盈的框架就能支撐起數十層高的摩天大樓 。當 AI Agent 能夠承載上下文(Context),能夠在不同工具和流程之間自動傳遞訊息時,人類就不再需要充當那個疲憊的「人肉路由器」或「膠水」 。

想像一下,每週兩小時的進度同步會議,變成了一個 5 分鐘的非同步審閱;原本需要三層審批的決策,現在可以在幾分鐘內由 Agent 匯總數據並給出建議 。這意味著公司可以真正地規模化,而不會像現在這樣,規模越大,效率越低。

更重要的是,就像蒸汽機讓工廠脫離了對河流地理位置的依賴,AI Agent 將讓知識工作脫離對人類生理限制的依賴 。我們的工作流將不再受限於朝九晚五,不再受限於時區,這些「無限的心智」可以在我們睡覺時繼續運轉 。

這是一個極其迷人的願景:從磚木結構的佛羅倫斯小鎮,進化到鋼鐵森林般的東京大都會 。

規模的詛咒:Google DeepMind 的冷水

Ivan Zhao 描繪的願景令人心潮澎湃,但當我們試圖在現實中搭建這座摩天大樓時,卻發現了一個嚴酷的物理法則:我們手中的「鋼鐵」目前還充滿了雜質。

Google DeepMind 最近發布的一份重磅研究報告,給 Agent 的狂熱信徒潑了一盆冷水。這份報告揭示了一個反直覺的「規模悖論」:在現有的技術架構下,Agent 的數量並不是越多越好。

在矽谷的設想中,如果一個 Agent 能解決一部分問題,那麼十個 Agent 協作應該能解決十倍複雜的問題。但數據顯示,3 到 4 個 Agent 是目前的「黃金分割點」。一旦超過這個數量,系統的表現不僅不會提升,反而會因為溝通成本的激增而雪崩式下跌。

這就是所謂的「協調稅」(Coordination Tax)。當你增加 Agent 的數量(n)時,它們之間的對話輪次並不是線性增加,而是呈現接近平方級(n^2)的爆炸性增長。每一個新增的 Agent 都需要與其他 Agent 同步資訊、對齊目標、確認進度。結果是,Agent 們花在「開會」和「溝通」上的時間,遠遠超過了它們真正「幹活」的時間。

這聽起來是不是很耳熟?這恰恰重演了人類組織在擴張時遇到的「大公司病」。我們原本希望用 Agent 來消除人類組織的低效,結果卻在數碼世界裡完美複製了官僚主義。

更糟糕的是錯誤的放大效應。DeepMind 的數據指出,在「獨立多智能體」模式下,由於缺乏有效的糾錯機制,單個 Agent 的錯誤會被放大 17.2 倍。為了控制這種錯誤,我們不得不退回到「中心化管理」模式,設置一個類似經理角色的 Agent 來審核所有產出。雖然這能將錯誤倍率降低到 4.4 倍,但也讓效率暴跌——每 1000 個 Token 能帶來的成功次數,從單兵作戰的 67.7 次直接跌到了 21.5 次。

這就是我們面臨的困境:想要規模化,就需要協作;一協作,效率就因溝通成本而崩潰。目前的 Agent 架構,還撐不起摩天大樓的重量。

介面的鴻溝:為何它連飯店都訂不好?

這時你可能會問,既然協作這麼難,為什麼 Ivan 文章中的工程師 Simon 能夠成功?

答案在於「戰場」的不同。Cal Newport 在《The New Yorker》的文章中一針見血地指出:Simon 的成功是因為他處於 LLM(大型語言模型)的舒適區——程式碼終端機(Terminal)。

程式碼的世界是純文字的、封閉的、邏輯自洽的。對於 Agent 來說,修改網站上的代碼並加入「Taco餅」頁面,就像是在自家後院散步一樣簡單。但當 Agent 走出這個舒適區,試圖進入充滿圖形介面(GUI)的真實世界,例如幫你訂一家飯店時,它就變成了一個笨拙的巨人。

Newport 描述了一個令人啼笑皆非的場景:一個由 OpenAI 發布的早期 Agent,在房地產網站的下拉選單中選擇價格時,竟然卡了將近 15 分鐘。這是因為目前的 Agent 必須像人類一樣去識別螢幕上的像素、點擊滑鼠,而這對於基於文字預測的模型來說,效率極低且極易出錯。

更深層次的問題在於「世界模型」的缺失。LLM 雖然讀過網際網路上所有的文字,但它並不真正理解物理世界的運作邏輯。

Sam Altman 團隊曾展示過一個規劃美國職棒大聯盟球場之旅的 Demo,結果 Agent 規劃的路線中竟然包含了一個位於墨西哥灣中部的莫名其妙的停靠點。這暴露了 Agent 根本沒有「地理」或「旅行」的概念,它只是在進行機率預測。在這種情況下,一個涉及多個步驟的任務(選日期、比價、看地圖、付款)就像是一場賭博。只要其中一個步驟出現「幻覺」(目前最先進模型的幻覺率仍約為 10%),整個任務就會徹底脫軌。

所以,我們現在的情況是:在封閉、可驗證的程式碼環境裡,Agent 已經是法拉利;但在開放、複雜的真實世界裡,它還是一輛會隨時衝出懸崖的單車。

結語:在「紅旗法案」下等待新的蒸汽機

回到 Ivan Zhao 的歷史隱喻,我們現在正處於一個數碼版的「紅旗法案」時代。

1865 年,為了應對早期汽車帶來的混亂,英國通過了紅旗法案,規定每一輛行駛的汽車前方必須有人手持紅旗開路,這雖然保證了安全,但也將汽車的速度限制在了行人水準。

今天,我們對 Human-in-the-loop(人在迴路中)的堅持,就是現代版的紅旗法案。這並不是因為我們像當年的馬車夫一樣守舊,而是因為現在的「汽車」(Agent)確實還不夠安全可靠。DeepMind 的數據告訴我們協作會崩潰,Newport 的觀察告訴我們介面還沒打通,我們不得不親自舉著紅旗,盯著 Agent 的每一個動作,生怕它把事情搞砸。

2025 年之所以沒能成為預言中的「Agent 之年」,是因為科技巨頭們承諾了我們一座鋼鐵摩天大樓,實際上交付的卻還是一堆需要人工堆砌的磚頭。

但這並不意味著 Ivan Zhao 的願景是錯的。相反,這正是新技術週期的必經之路。我們需要的可能不是更聰明的單個模型,而是像工廠脫離河流那樣的架構範式轉移——也許是 DeepMind 提到的針對特定任務的「分而治之」架構,或是像 MCP(模型上下文協議)這樣能讓 Agent 繞過笨拙 GUI 直接與軟體對話的新標準。

正如 Andrej Karpathy 所說,這不是「Agent 的一年」,而是「Agent 的十年」。佛羅倫斯的石板路通向東京的霓虹燈,中間必然要經過漫長而混亂的工地。我們現在能做的,就是保持耐心,繼續冶煉我們手中的鋼鐵。

 

Reference:

Steam, Steel, and Infinite Minds by Ivan Zhao https://www.notion.com/blog/steam-steel-and-infinite-minds-ai

 

合規免責聲明 

本文僅供資料及教育用途,不構成任何投資建議或招攬。內容未考慮讀者之個人目標、財務狀況或需求。作者與本頻道並非持牌人士;所載資料來自被認為可靠之來源,但不保證其完整或準確。市場有風險,投資須審慎。

 

 

投資理財
謎米財經分析報告
About BYOS

Build-Your-Own-System is a practice to build digital solutions for business and enterprise based on integration of open source technology and web resources, an excellent approach for digital transformation by practice and experience.  It does not require IT background or programming, because business analysis, experiment and digital innovation is what it is about.

BAYGO

Build-as-you-GO is the strategy behind building a site, and the flexibility of BYOS architecture supports this strategy, which makes everybody the best designer for their own system over time.

More about BayGO

BYOS Workshops

It is the skillset for the digital era.  No IT background is needed.  No programming is needed. It is just a matter of hands-on practice.  You'll be surprised you can do it too.

Our Services

We provide services in:

  • Agile System Building
  • Digital Transformation Consultancy
  • Knowledge Management
  • Combined Consultancy
  • BYOS Workshops
  • BYOS Mentorship
A self-hosted platform for knowledge management
Built by KF Cheng    ©2026
Self-hosted Platform: KHub v4.00.62
Running on Ubuntu 22.04 PHP 8.1 MariaDB 10.10 Nginx 1.18
Clear keys input element