英偉達推出ARM架構CPU,效能10倍領先

近日,NVIDIA創始人黃仁勳在GTC2021重磅釋出了三款基於Arm IP打造的處理器——NVIDIA Grace、BlueField-3 DPU、NVIDIA DRIVE Atlan。

還是熟悉的廚房、熟悉的皮衣,4月13日凌晨,NVIDIA GTC2021如約而至。NVIDIA創始人黃仁勳的主題演講作為GTC的重頭戲,果然沒有讓人失望,其在演講中重磅釋出了多款產品,其中三款基於Arm IP打造的處理器尤為引人關注:

NVIDIA Grace:專為大規模人工智慧和高效能計算應用而設計

BlueField-3 DPU:首款支援第五代PCIe匯流排並提供資料中心時間同步加速的DPU

NVIDIA DRIVE Atlan:新一代AI自動駕駛汽車處理器,算力將達到1000TOPS

英偉達CPU問世

GTC大會期間,黃仁勳在接受集微網電話採訪時表示,英偉達收購Arm正在穩妥有序進行。儘管收購尚未塵埃落定,但英偉達已經開始了基於Arm IP的研發,打造了一款專為大規模人工智慧和高效能計算應用而設計的CPU——NVIDIA Grace。目前,絕大多數的資料中心仍將繼續使用現有的CPU,而Grace主要將用於計算領域的細分市場。黃仁勳介紹道,“結合 GPU 和 DPU,Grace 為我們提供了第三種基礎計算能力,並具備重新定義資料中心架構,推進 AI 前進的能力。”

圖源:機器之心

Grace 的名字來自於計算機科學家、世界最早一批的程式設計師,也是最早的女性程式設計師之一的格蕾絲 · 赫柏(Grace Hopper)。她創造了現代第一個編譯器 A-0 系統,以及第一個高階商用計算機程式語言「COBOL」。計算機術語「Debug」(除錯)便是她在受到從電腦中驅除蛾子的啟發而開始使用的,於是她也被冠以「Debug 之母」的稱號。

Grace CPU是NVIDIA首次使用下一代 Arm Neoverse 核心的設計,採用了更為先進的 5nm 製程,在內部通訊能力上,它使用了英偉達第四代 NVIDIA NVLink,在 CPU 和 GPU 之間提供高達 900 GB/s 的雙向頻寬,相比之前的產品提升了八倍。整個SoC是由多個晶片組合構成,它主要有三個部分,分別是CPU、GPU和記憶體/IO子系統。Grace是一款高度專業化的處理器,主要解決工作負載問題,例如訓練擁有超過1萬億個引數的下一代NLP模型。當與英偉達GPU緊密結合時,基於Grace CPU的系統將比當今最先進的基於英偉達DGX的系統(執行在x86 CPU上)的效能還要快10倍。

此外,Grace 還是第一個透過錯誤校正程式碼(ECC)等機制利用 LPDDR5x 記憶體系統提供伺服器級可靠性的 CPU,同時提供 2 倍的記憶體頻寬和高達 10 倍的能源效率。對Grace的效能,黃仁勳如此總結道:“Grace能充分彰顯出Arm的強大。”

雖然是首次出現在大眾視野中,但目前Grace已經找到了至少兩個客戶——瑞士國家超級計算中心(CSCS)將採用Grace,構建一臺名為Alps的超級計算機,其算力可達20Exaflops;美國洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)即將推出的超級計算機也將採用Grace。

三類晶片,逐年飛躍

GTC2021上,除了推出首款CPU“炸圈”外,英偉達的DPU同樣值得關注。“我們每年都會發布激動人心的新品。三類晶片,逐年飛躍,一個架構。”黃仁勳說,資料中心路線圖包括CPU、GPU和DPU這三類晶片,而Grace和BlueField是其中必不可少的關鍵組成部分。

圖源:智東西

英偉達全新推出的BlueField-3 DPU包含220億個電晶體,採用16個Arm A78 CPU核心、18M IOPs彈性塊儲存,加密速度是上一代的4倍,並完全向下相容BlueField-2。據悉,BlueField-2能夠解除安裝相當於30個CPU核的工作負載,而BlueField-3實現了10倍的加速計算效能提升,能夠替代300個CPU核,以400Gbps的速率對網路流量進行保護、解除安裝和加速。該處理器也是首款支援第五代PCIe匯流排並提供資料中心時間同步加速的DPU。此外,黃仁勳還發布了英偉達新一代AI自動駕駛汽車處理器——NVIDIA DRIVE Atlan,其算力將達到1000TOPS,約是上一代Orin處理器的4倍,超過了絕大多數L5無人駕駛出租車的總計算能力。黃仁勳提出,“對於汽車而言,更高的算力意味著更加智慧化,開發者們也能讓產品更快迭代。TOPS就是新的馬力。”

圖源:智東西

該SoC採用下一代GPU的體系結構、新型Arm CPU核心、新深度學習和計算機視覺加速器,並內建為先進的網路、儲存和安全服務的BlueField DPU,網路速度可達400Gbps。同時,這也是DRIVE平臺首次整合DPU,透過Arm核為自動駕駛汽車帶來資料中心級的網路。

除了NVIDIA Grace、BlueField-3 DPU、NVIDIA DRIVE Atlan這三款基於Arm IP打造的處理器外,黃仁勳還提到了AI-on-5G計算平臺,這是一款專為邊緣設計、將5G和AI相結合的新型計算平臺,將採用NVIDIA Aerial軟體開發套件與NVIDIA BlueField-2 A100,將GPU和CPU組合成“有史以來最先進的PCIE卡。”目前,富士通、谷歌雲、Mavenir、Radisys和Wind River等合作伙伴都在開發適用於NVIDIA AI-on-5G平臺的解決方案。

佈局Arm生態

從自研三類晶片到GPU合作伙伴,從雲、高效能計算、邊緣計算到PC,不難看出英偉達對於Arm生態的重視程度。

為亞馬遜AWS Graviton2 CPU提供GPU加速

2021年下半年,基於AWS Graviton2的Amazon EC2例項將與NVIDIA GPU相結合,在雲端部署,可實現降低成本、支援更豐富的遊戲串流體驗、最佳化雲上安卓遊戲和人工智慧推理、以更低成本提供更高的AI推理效能等優勢。

為科學和AI應用開發提供支援的全新HPC開發者套件

NVIDIA全新HPC開發者套件為超級計算機提供了一個高效能、高能效的平臺,該平臺結合了1個Ampere Altra CPU(包含80個Arm Neoverse核,執行頻率高達3。3GHz)、雙NVIDIA A100 GPU(每個GPU可提供312TFLOPS的FP16深度學習效能)、兩個用於加速網路、儲存和安全的NVIDIA BlueField-2 DPU。

提升邊緣影片分析和安全功能

NVIDIA正擴大與Marvell的合作,將基於Arm的OCTEON DPU與GPU相結合,加速AI工作負載,實現網路最佳化和安全。

打造新一類基於Arm並搭載NVIDIA RTX GPU的新款PC

NVIDIA將與聯發科合作,共同打造一個採用Arm核與NVIDIA顯示卡、支援Chromium、Linux和NVIDIA SDK的參考平臺,將GPU的效能及先進的AI、光線追蹤圖形等技術帶入Arm PC平臺。

寫在最後

黃仁勳在NVIDIA GTC2021上公佈了多項最新成果與研發進展,首款資料中心CPU的釋出,也宣告著英偉達資料中心產品線正式集齊了“未來計算的三大支柱”——CPU、GPU、DPU,從英偉達在Arm身上“下的功夫”便不難看出其在CPU領域的野心。英偉達每年在GTC大會上釋出的新品已經成為了行業發展的重要指向,而正如黃仁勳所說,“新時代的計算機需要新的晶片、新的系統架構、新的網路、新的軟體和工具。”不知今天過後,晶片圈的風向要怎麼變呢?

參考資料:

1、《英偉達CPU問世:ARM架構,對比x86實現十倍效能提升》,機器之心

2、《英偉達CPU面世!基於Arm,效能超過英特爾為核心的自家系統10倍,連客戶都找好了》,大資料文摘

3、《晶片圈變天了!英偉達推出首個CPU,狂捧Arm生態》,智東西

4、《英偉達釋出“空氣CPU”,Arm架構專為AI而生,效能超x86十倍,與自家GPU更搭》,量子位

5、《NVIDIA釋出首款代號為“Grace”的CPU 基於ARM架構與Neoverse核心》,cnBeta。COM

相關文章