熱爆娛樂 +: NVIDIA Vera CPU 發表　黃仁勳：「為 AI 時代創造的 CPU」

2026年6月1日星期一

NVIDIA Vera CPU 發表　黃仁勳：「為 AI 時代創造的 CPU」

NVIDIA 行政總裁黃仁勳 6 月 1 日在 GTC Taipei 2026 主題演講中，正式介紹全新 NVIDIA Vera CPU 處理器。他強調，過去的 CPU 是為人類所設計，而 Vera CPU 則是專為 AI 代理（Agentic AI）時代而生的處理器。



AI 代理對速度的極致渴求

黃仁勳解釋，AI 代理與人類不同，它們非常「缺乏耐心」，其運作的世界是以納秒（nanoseconds）為單位計算。當 AI 代理使用工具或存取資料庫時，需要系統盡快給出回應。AI 代理每一刻的等待，都會阻礙其進入下一個運算步驟。因此 CPU 的低延遲與高互動性至關重要。NVIDIA 從頭重建架構，打造出 Vera CPU 來專門應對這類工作負載。





核心技術突破與效能表現

NVIDIAVera CPU 在單執行緒效能（Single-threaded performance）以及內部傳輸頻寬上皆達到了世界級的水準。為了讓讀者更直觀了解 Vera 的技術突破，以下整理了其核心規格與效能數據：

核心規格與技術	效能表現與特點
核心架構	搭載 88 個 NVIDIA 自研的 Olympus 核心，整合於單一網格（Monolithic mesh）上。
指令吞吐量	每個時脈週期可擷取、解碼並執行 10 個指令（IPC 為全球最高）。
記憶體技術	全球首款採用 LPDDR5X 記憶體，能在不犧牲頻寬的情況下同時修正多個錯誤。
記憶體頻寬	高達1.2 TB/s，是目前最高效能外部 CPU 頻寬的 2 到 3 倍。
記憶體延遲	峰值記憶體延遲比 x86 架構低40%。
核心通訊速度	核心之間的通訊速度比傳統 CPU 快50%。
內部傳輸結構	具備3.6 TB/s的極速光纖網路（fabric），且無晶片化邊界稅（No chiplet tax）。
AI 代理沙盒效能	執行代理沙盒（Agentic sandbox）的效能是 x86 CPU 的1.8 倍。
資料處理加速	SQL 資料處理速度為傳統的3 倍；即時串流數據處理速度更高達6 倍。
傳輸介面	全球首款支援 PCI Express Gen 6 的 CPU。





與 Rubin GPU 深度整合的 AI 工廠

Vera CPU 並非單獨運作，而是 NVIDIA Vera Rubin 系統的核心樞紐。在 Vera Rubin 機架中，已內建了兩顆 CPU 用於協調 GPU、管理 KV 快取（KV cache）以及處理機架內執行的軟件。此外 NVIDIA 也推出了專屬的 Vera CPU 機架，單一液冷機架內可容納 256 顆 CPU，專門負責協調模型、調度記憶體與啟動工具。

透過具備記憶體一致性的 NVLink-C2C（Chip-to-chip）技術，GPU 能直接連接到系統傳輸網路。官方資料亦指出其互連技術能實現每秒 1.8 TB 的數據傳輸，是 PCIe Gen 6 的 7 倍，整個機架可同時運行逾 22,500 個獨立運算環境。目前 Alibaba、Meta、Oracle Cloud Infrastructure 及 CoreWeave 等主要雲端服務供應商已宣布部署計劃。



市場定位與生態系統

AI 時代的經濟基礎是「Token」的生成。黃仁勳坦言，Vera CPU 及儲存伺服器位處資料中心最關鍵、也是最昂貴的路徑上，因為這正是產生經濟價值與 Token 的所在。為了實現利潤最大化，Vera CPU 具備極高的能源效率，讓營運商能在不排擠 Token 生成電力的前提下，於 AI 工廠中部署盡可能多的 CPU。



目前 Vera Rubin 已進入全面量產階段，預計將成為 NVIDIA 史上擴張最快、最成功的新產品線，並於今年下半年透過合作夥伴正式出貨。

本文作轉載及備份之用來源 source: http://unwire.hk

鍾意就快D Share啦！