黃仁勳發布Groq LPX伺服器推理速度較上代提升350倍

Short Title

Private

Public

2026-03-18

Nvidia行政總裁黃仁勳（Jensen Huang）周一在美國聖荷西出席年度GTC大會。他在逾三萬人面前宣告「推理運算時代」正式來臨。黃仁勳發布全新Groq 3 LPX機架伺服器，運算速度較舊一代晶片提升350倍。Nvidia同步更新銷售目標，預計於2027年底售出價值1萬億美元的晶片。

｜推理運算成核心戰略

多年來，Nvidia主導圖形處理器（GPU）市場，旗下晶片是訓練大型AI模型的主要工具。過去一年，AI企業加快將模型商業化，客戶開始要求針對推理運算優化的晶片。推理運算指AI模型回應用戶查詢的運算過程，與訓練模型的需求有別。黃仁勳指出，傳統GPU耗電量龐大，且內建記憶體不足，難以有效應對推理工作負載。

｜全新伺服器整合兩大技術

Nvidia全新旗艦產品命名為Groq 3 LPX機架，整合72台下一代Vera Rubin伺服器，以及256顆由Groq開發的語言處理器（LPU）。Groq為一家初創公司，Nvidia於去年12月以200億美元技術授權交易收購其頂層領導團隊。黃仁勳表示，新系統每秒可生成7億個token，這是衡量AI運算量的基本單位。新系統的高頻寬記憶體容量，亦較Hopper世代提升500倍，有助解決記憶體瓶頸問題。

黃仁勳在主題演講中表示，「推理運算的轉折點已然到來」。他又指，「這是AI的未來。這就是AI的走向。這個系統專為推理運算設計，而這個工作負載正是驅動AI工廠的核心。」

｜銷售目標大幅上調

Nvidia更新旗下Blackwell及Rubin系列晶片的銷售預測，目標於2027年底前售出價值1萬億美元的晶片。此前的指引為2026年底前售出5,000億美元。這次上調反映Nvidia對推理運算市場需求的高度信心。

｜夥伴生態系持續擴張

大會上，Nvidia宣布一系列新合作，涵蓋多個業務領域。在軟件方面，Nvidia聯同Cursor、Mistral、Perplexity、Reflection及Thinking Machines組成聯盟，目標簡化前沿開源AI模型的開發流程。黃仁勳稱，聯盟的工作將加速企業軟件工具的發展，推動全球軟件即服務行業轉型為代理式AI服務行業。

在數據基礎設施方面，獲Nvidia支持的英國雲端運算初創Nscale宣布，將於西維珍尼亞州建設一個1.35吉瓦的數據中心集群，採用Vera Rubin新型伺服器，項目命名為Monarch Compute Campus，被描述為全球最大規模AI運算設施之一。

｜自動駕駛業務同步拓展

Nvidia亦宣布擴大自動駕駛業務，為旗下機器人出租車運算系統新增四家合作夥伴，分別為印度BYD、中國吉利汽車（Geely Auto）、現代汽車（Hyundai）及日產汽車（Nissan）。黃仁勳表示，上述汽車製造商借助Nvidia晶片及模擬模型，預計將大幅增加路面上的自動共乘車輛數目。

演講尾聲，一個由Nvidia、DeepMind及迪士尼（Disney）合作開發的機器人走上舞台，外形仿照迪士尼動畫《魔雪奇緣》中的雪寶。黃仁勳與機器人展開對話，藉此展示Nvidia旗下Omniverse部門在實體AI領域的最新成果。

科技

Sinic Analytics

黃仁勳發布Groq LPX伺服器推理速度較上代提升350倍

About BYOS

BAYGO

BYOS Workshops

Our Services

黃仁勳發布Groq LPX伺服器 推理速度較上代提升350倍

About BYOS

BAYGO

BYOS Workshops

Our Services

黃仁勳發布Groq LPX伺服器推理速度較上代提升350倍