掃呢頁CODE去手機

2026年6月1日 星期一

NVIDIA Vera CPU 發表 黃仁勳:「為 AI 時代創造的 CPU」

伺服器機櫃展示,專業數據中心硬件設備.
NVIDIA行政總裁黃仁勳6月1日在GTCTaipei2026主題演講中,正式介紹全新NVIDIAVeraCPU處理器。他強調,過去的CPU是為人類所 ...




NVIDIA 行政總裁黃仁勳 6 月 1 日在 GTC Taipei 2026 主題演講中,正式介紹全新 NVIDIA Vera CPU 處理器。他強調,過去的 CPU 是為人類所設計,而 Vera CPU 則是專為 AI 代理(Agentic AI)時代而生的處理器



科技演示會議現場,專業人士展示最新科技產.



AI 代理對速度的極致渴求

黃仁勳解釋,AI 代理與人類不同,它們非常「缺乏耐心」,其運作的世界是以納秒(nanoseconds)為單位計算。當 AI 代理使用工具或存取資料庫時,需要系統盡快給出回應。AI 代理每一刻的等待,都會阻礙其進入下一個運算步驟。因此 CPU 的低延遲與高互動性至關重要。NVIDIA 從頭重建架構,打造出 Vera CPU 來專門應對這類工作負載





核心技術突破與效能表現

NVIDIAVera CPU 在單執行緒效能(Single-threaded performance)以及內部傳輸頻寬上皆達到了世界級的水準。為了讓讀者更直觀了解 Vera 的技術突破,以下整理了其核心規格與效能數據:

核心規格與技術效能表現與特點
核心架構

搭載 88 個 NVIDIA 自研的 Olympus 核心,整合於單一網格(Monolithic mesh)上

指令吞吐量

每個時脈週期可擷取、解碼並執行 10 個指令(IPC 為全球最高)

記憶體技術

全球首款採用 LPDDR5X 記憶體,能在不犧牲頻寬的情況下同時修正多個錯誤

記憶體頻寬

高達1.2 TB/s,是目前最高效能外部 CPU 頻寬的 2 到 3 倍

記憶體延遲

峰值記憶體延遲比 x86 架構低40%

核心通訊速度

核心之間的通訊速度比傳統 CPU 快50%

內部傳輸結構

具備3.6 TB/s的極速光纖網路(fabric),且無晶片化邊界稅(No chiplet tax)

AI 代理沙盒效能

執行代理沙盒(Agentic sandbox)的效能是 x86 CPU 的1.8 倍

資料處理加速

SQL 資料處理速度為傳統的3 倍;即時串流數據處理速度更高達6 倍

傳輸介面

全球首款支援 PCI Express Gen 6 的 CPU



與 Rubin GPU 深度整合的 AI 工廠

Vera CPU 並非單獨運作,而是 NVIDIA Vera Rubin 系統的核心樞紐。在 Vera Rubin 機架中,已內建了兩顆 CPU 用於協調 GPU、管理 KV 快取(KV cache)以及處理機架內執行的軟件 。此外 NVIDIA 也推出了專屬的 Vera CPU 機架,單一液冷機架內可容納 256 顆 CPU,專門負責協調模型、調度記憶體與啟動工具



透過具備記憶體一致性的 NVLink-C2C(Chip-to-chip)技術,GPU 能直接連接到系統傳輸網路。官方資料亦指出其互連技術能實現每秒 1.8 TB 的數據傳輸,是 PCIe Gen 6 的 7 倍,整個機架可同時運行逾 22,500 個獨立運算環境。目前 Alibaba、Meta、Oracle Cloud Infrastructure 及 CoreWeave 等主要雲端服務供應商已宣布部署計劃。





市場定位與生態系統

AI 時代的經濟基礎是「Token」的生成。黃仁勳坦言,Vera CPU 及儲存伺服器位處資料中心最關鍵、也是最昂貴的路徑上,因為這正是產生經濟價值與 Token 的所在。為了實現利潤最大化,Vera CPU 具備極高的能源效率,讓營運商能在不排擠 Token 生成電力的前提下,於 AI 工廠中部署盡可能多的 CPU

目前 Vera Rubin 已進入全面量產階段,預計將成為 NVIDIA 史上擴張最快、最成功的新產品線,並於今年下半年透過合作夥伴正式出貨。






本文作轉載及備份之用 來源 source: http://unwire.hk
鍾意就快D Share啦!