NVIDIA DGX-2

NVIDIA DGX-2

NVIDIA? DGX-2? 是 NVIDIA   2-petaFLOPS 系統,它整合了 16 個完全互聯的 GPU,使深度學習性能提升 10 倍,突破了人工智能速度和規模的障礙。它采用 NVIDIADGX? 軟件和基于 NVIDIA NVSwitch 技術構建的可擴展架構。


  • 產品特性
  • 產品配置
  • 規格參數

DX2.jpg

計算能力造就出眾的訓練性能


  人工智能日益復雜,因而對計算能力的要求比以往更高。NVIDIA DGX-2 16 NVIDIA 家族的 GPU 計算能力于一身,可以加速實現之前無法訓練的新人工智能模型類型 。此外,它還具有突破性的 GPU 可擴展性,因此您可在單一節點上訓練規模擴大 4 倍的模型,而且其性能達到 8 GPU 系統的 10 倍。


人工智能網絡架構


  通過使用 DGX-2,模型的復雜性和規模再也不受傳統架構局限性的限制。現在,您可以利用 NVIDIA NVSwitch 網絡架構進行模型并行訓練。NVIDIA 2 petaFLOPS GPU 加速器采用的正是這種創新技術,其 GPU 間帶寬高達 2.4 TB/s,性能比前代系統提升了 24 倍,并且問題解決速度提高了 5 倍。


將人工智能規模提升水平的快速途徑


  現代企業需要快速部署人工智能功能以滿足業務需求。DGX-2 提供隨時可用的模塊化解決方案,打造擴展人工智能的快速途徑。憑借用于構建大型深度學習計算集群的靈活網絡選項,再結合可在共享基礎設施環境中改進用戶和工作負載隔離的安全多租戶功能,DGX-2 使人工智能擴展得以簡化,從而加快了擴展速度。借助加速部署模型和專為輕松擴展而構建的架構,您的團隊可以減少構建基礎設施所花的時間,節省出更多的時間來提升洞察力。


運行的企業級人工智能基礎設施


  人工智能對您的業務而言非常關鍵,因此,您需要專為高可靠性、可用性和可維護性 (RAS) 而設計的平臺來為您保駕護航。DGX-2 專為 RAS 而打造,可以減少計劃外停機時間,簡化可維護性,并保持運行連續性。DGX-2 是一款企業級產品,依托 NVIDIA 專業知識,專為滿足嚴格的全天候運行要求而構建,旨在使重要的人工智能工作保持正常運行。



NVIDIA DGX-2
探索 DGX-2 強勁的組件



blob.png

 NVIDIA TESLA V100 32GB,SXM3
 雙板卡總計 16 塊 GPU,總計 512GB HBM2 內存
每塊 GPU 板卡由 8 塊 NVIDIA Tesla V100 組成。
 總計 12 NVSWITCH 連接
高速互聯,2.4 TB/秒對分帶寬。
 8 EDR INFINIBAND/100 GbE 以太網
1600 Gb/秒雙向帶寬和低延遲。
 PCIE 交換器組件
 2 個 INTEL XEON PLATINUM CPU
 1.5 TB 系統內存
 雙 10/25 GbE 以太網
 30 TB NVME SSDS 內部存儲




NVLINK 結構
推動多 GPU 處理技術發展


   隨著開發人員在人工智能 (AI) 計算等應用領域中越來越依賴并行結構,各行各業中的多 GPU 和多 CPU 系統愈發普及。其中包括采用 PCIe 系統互聯技術的 4 GPU 和 8 GPU 系統配置來解決非常復雜的重大難題。然而,在多 GPU 系統層面,PCIe 帶寬逐漸成為瓶頸,這就需要更快速和更具擴展性的多處理器互聯技術。



blob.png更大限度提高系統吞吐量


   NVIDIA?NVLink? 技術提供更高帶寬與更多鏈路,并可提升多 GPU 和多 GPU/CPU 系統配置的可擴展性,因而可以解決這種互聯問題。單個 NVIDIA Tesla?V100 GPU 即可支持多達六條 NVLink 鏈路,總帶寬為 300 GB/秒,這是 PCIe 3 帶寬的 10 倍。全新 NVIDIA DGX-1 等服務器充分利用這些技術來提高可擴展性,進而實現超快速的深度學習訓練。

 

GPU 至 GPU 通信加速的新水平

Tesla V100中采用的NVLink引入NVIDIA Pascal架構,將每個方向的信號發送速率從20GB/每秒增加到25GB/每秒。

此產品可用于 GPU 至 CPU 或 GPU 至 GPU 的通信,配備 Tesla V100 的 DGX-1V 服務器即是如此。

 

blob.png blob.png

說明:Tesla V100 中以 NVLink 連接的 GPUGPUGPUCPU通信        說明:在 DGX-1V 服務器中,混合立體網絡拓撲使用 NVLink 連接 8 Tesla V100 加速器



blob.png新的性能水平

NVIDIA NVLink 將采用相同配置的服務器性能提高 31%。此產品可大大提高帶寬并減少延遲,即使更大型的深度學習工作負載不斷增加,也能實現性能擴展.




NVSWITCH:完全連接的 NVLINK


   blob.png由于 PCIe 帶寬日益成為多 GPU 系統級別的瓶頸,深度學習工作負載的快速增長使得對更快速、更可擴展的互連的需求逐漸增加。

    NVLink 實現了很大的進步,可以在單個服務器中支持八個 GPU,并且可提升性能,使之超越 PCIe。但是,要將深度學習性能提升到一個更高水平,將需要使用 GPU 架構,該架構在一臺服務器上支持更多的 GPU 以及 GPU 之間的全帶寬連接。
    NVIDIA NVSwitch 是節點交換架構,可支持單個服務器節點中 16 個全互聯的 GPU,并可使全部 8 個 GPU 對分別以 300 GB/s 的驚人速度進行同時通信。這 16 個全互聯的 GPU 還可作為單個大型加速器,擁有 0.5 TB 統一顯存空間和 2 PetaFLOPS 計算性能。

?
24小時銷售熱線:186-2294-9858
地址:財富興園29號樓
金品計算機    版權所有   2016   津ICP備 7010215號-1
    
津公網安備 12011402000382號

金品服務器提供:服務器報價超微服務器GPU服務器深度學習GPU深度學習服務器