
NVIDIA 行政總裁黃仁勳 6 月 1 日在 GTC Taipei 2026 主題演講中,正式介紹全新 NVIDIA Vera CPU 處理器。他強調,過去的 CPU 是為人類所設計,而 Vera CPU 則是專為 AI 代理(Agentic AI)時代而生的處理器。
AI 代理對速度的極致渴求
黃仁勳解釋,AI 代理與人類不同,它們非常「缺乏耐心」,其運作的世界是以納秒(nanoseconds)為單位計算。當 AI 代理使用工具或存取資料庫時,需要系統盡快給出回應。AI 代理每一刻的等待,都會阻礙其進入下一個運算步驟。因此 CPU 的低延遲與高互動性至關重要。NVIDIA 從頭重建架構,打造出 Vera CPU 來專門應對這類工作負載。
核心技術突破與效能表現
NVIDIAVera CPU 在單執行緒效能(Single-threaded performance)以及內部傳輸頻寬上皆達到了世界級的水準。為了讓讀者更直觀了解 Vera 的技術突破,以下整理了其核心規格與效能數據:
與 Rubin GPU 深度整合的 AI 工廠
Vera CPU 並非單獨運作,而是 NVIDIA Vera Rubin 系統的核心樞紐。在 Vera Rubin 機架中,已內建了兩顆 CPU 用於協調 GPU、管理 KV 快取(KV cache)以及處理機架內執行的軟件 。此外 NVIDIA 也推出了專屬的 Vera CPU 機架,單一液冷機架內可容納 256 顆 CPU,專門負責協調模型、調度記憶體與啟動工具。
透過具備記憶體一致性的 NVLink-C2C(Chip-to-chip)技術,GPU 能直接連接到系統傳輸網路。官方資料亦指出其互連技術能實現每秒 1.8 TB 的數據傳輸,是 PCIe Gen 6 的 7 倍,整個機架可同時運行逾 22,500 個獨立運算環境。目前 Alibaba、Meta、Oracle Cloud Infrastructure 及 CoreWeave 等主要雲端服務供應商已宣布部署計劃。
市場定位與生態系統
AI 時代的經濟基礎是「Token」的生成。黃仁勳坦言,Vera CPU 及儲存伺服器位處資料中心最關鍵、也是最昂貴的路徑上,因為這正是產生經濟價值與 Token 的所在。為了實現利潤最大化,Vera CPU 具備極高的能源效率,讓營運商能在不排擠 Token 生成電力的前提下,於 AI 工廠中部署盡可能多的 CPU。
目前 Vera Rubin 已進入全面量產階段,預計將成為 NVIDIA 史上擴張最快、最成功的新產品線,並於今年下半年透過合作夥伴正式出貨。
|
鍾意就快D Share啦!
|
|
|



