|推理運算成核心戰略
多年來,Nvidia主導圖形處理器(GPU)市場,旗下晶片是訓練大型AI模型的主要工具。過去一年,AI企業加快將模型商業化,客戶開始要求針對推理運算優化的晶片。推理運算指AI模型回應用戶查詢的運算過程,與訓練模型的需求有別。黃仁勳指出,傳統GPU耗電量龐大,且內建記憶體不足,難以有效應對推理工作負載。
|全新伺服器整合兩大技術
Nvidia全新旗艦產品命名為Groq 3 LPX機架,整合72台下一代Vera Rubin伺服器,以及256顆由Groq開發的語言處理器(LPU)。Groq為一家初創公司,Nvidia於去年12月以200億美元技術授權交易收購其頂層領導團隊。黃仁勳表示,新系統每秒可生成7億個token,這是衡量AI運算量的基本單位。新系統的高頻寬記憶體容量,亦較Hopper世代提升500倍,有助解決記憶體瓶頸問題。
黃仁勳在主題演講中表示,「推理運算的轉折點已然到來」。他又指,「這是AI的未來。這就是AI的走向。這個系統專為推理運算設計,而這個工作負載正是驅動AI工廠的核心。」
|銷售目標大幅上調
Nvidia更新旗下Blackwell及Rubin系列晶片的銷售預測,目標於2027年底前售出價值1萬億美元的晶片。此前的指引為2026年底前售出5,000億美元。這次上調反映Nvidia對推理運算市場需求的高度信心。
|夥伴生態系持續擴張
大會上,Nvidia宣布一系列新合作,涵蓋多個業務領域。在軟件方面,Nvidia聯同Cursor、Mistral、Perplexity、Reflection及Thinking Machines組成聯盟,目標簡化前沿開源AI模型的開發流程。黃仁勳稱,聯盟的工作將加速企業軟件工具的發展,推動全球軟件即服務行業轉型為代理式AI服務行業。
在數據基礎設施方面,獲Nvidia支持的英國雲端運算初創Nscale宣布,將於西維珍尼亞州建設一個1.35吉瓦的數據中心集群,採用Vera Rubin新型伺服器,項目命名為Monarch Compute Campus,被描述為全球最大規模AI運算設施之一。
|自動駕駛業務同步拓展
Nvidia亦宣布擴大自動駕駛業務,為旗下機器人出租車運算系統新增四家合作夥伴,分別為印度BYD、中國吉利汽車(Geely Auto)、現代汽車(Hyundai)及日產汽車(Nissan)。黃仁勳表示,上述汽車製造商借助Nvidia晶片及模擬模型,預計將大幅增加路面上的自動共乘車輛數目。
演講尾聲,一個由Nvidia、DeepMind及迪士尼(Disney)合作開發的機器人走上舞台,外形仿照迪士尼動畫《魔雪奇緣》中的雪寶。黃仁勳與機器人展開對話,藉此展示Nvidia旗下Omniverse部門在實體AI領域的最新成果。