小編的世界優質文選主機

AI服務器哪家強？浪潮還是寧暢？

2021年7月04日 - 主機小編深度圍觀頻道

深度圍觀頻道

優質科技領域創作者

文/公眾號深度圍觀和訊名家簽約作者

產品到底哪家強，自己說了都不算，也不是比誰聲音大，最好是有個公平的競賽，好在世界是公平的，權威的世界級比賽還是有的。

要判斷AI服務器哪家強, 國際AI性能基准測試MLPerf可以說是試金石。

MLPerf 由圖靈獎得主大衛帕特森（DavidPatterson）聯合谷歌、斯坦福、哈佛大學等頂尖學術機構發起成立，是影響力最廣的國際AI性能基准評測。

2018年，來自百度、谷歌、哈佛、斯坦福以及UCB大學的工程師和科學家們共同開會探討推動了MLPerf測試的誕生。這項測試旨在推動機器學習領域技術的發展，也為衡量機器學習系統性能建立了一個相對權威的標准。

MLPerf是一系列測試機器學習性能表現的標准。它通過在一個標准目標下訓練機器學習模型的時間，作為一套系統性能的測量標准。其中訓練任務包括圖像識別、物體探測、NLP自然語言處理以及強化學習等。而在最新的1.0版本中，MLCommons又增加了兩項新的測試項目：語音-文字轉換以及3D醫學圖像處理。

所以，對於品牌來說發榜日是個重要而且緊張的日子。

6月30日，MLPerf如期發榜，此次性能評測基於最新 MLPerf Training V1.0 基准，涵蓋了圖像分類（ResNet）、醫學影像分割（U-Net3D）、目標物體檢測（SSD）、目標物體檢測（Mask R-CNN）、語音識別（RNN-T）、自然語言理解（BERT）、智能推薦（DLRM）以及強化機器學習（Minigo）8類AI應用場景，每類場景都包含固定任務(Closed)和開放優化(Open)兩類性能競賽。

其中最大的看點是：國際大廠布再屠榜，中國品牌表現可圈可點。

八大場景測試寧暢浪潮雄霸榜單

6月30日，國際權威AI性能基准評測平台MLPerf，發布了基於Training V1.0 的最新標准測試結果。寧暢 AI服務器X640 G40和X660 G45，分別以48.43、28.64成績，取得固定任務（closed）賽道，單機服務器系統的MASK R-CNN、U-NET3D兩項AI場景世界性能第一。

也就是說寧暢 AI服務器X640 G40和X660 G45在固定任務（closed）賽道8大場景測試中收獲兩大場景世界冠軍。

而另外國產大廠---浪潮，在固定任務（Closed）賽道的全部8項任務中，獲得圖像分類 ResNet、自然語言理解 BERT、目標檢測 SSD 和智能推薦 DLRM 4項訓練任務性能冠軍，其中，浪潮 NF5688M6 獲得 ResNet、DLRM 和 SSD 的單機訓練性能第一，NF5488A5 獲得 BERT 的單機訓練性能桂冠。

浪潮 NF5688M6和NF5488A5在固定任務賽道8大場景中一共收獲4項冠軍。

“國家對”表現非常強勁，浪潮在毫不掩飾自己的喜悅，新聞標題用上了：“浪潮AI服務器斬獲半數冠軍”。而寧暢則是直接用：“世界冠軍!寧暢服務器獲MLPerf 新紀錄“來表達。

此情此景，真有點中國乒乓球隊領獎的味道。

寧暢這樣簡單描述這一重要賽事的勝利：一秒分析5040張X光照片、AI"奧運會” MLPerf放榜、寧暢AI服務器再獲世界性能第一。

浪潮則憑借卓異的軟硬件系統優化能力，將 MLPerf 訓練基准的單機效率進一步提升至新的高度。相比2020年 MLPerf Training v0.7 榜單，浪潮刷新了圖像分類、自然語言理解、目標檢測（SSD）和智能推薦4項任務的單機訓練性能紀錄，將模型訓練耗時分別縮短了17.95%、56.85%、18.61%和42.64%，凸顯出頂級 AI 服務器在 AI 模型訓練效率上的巨大價值。

浪潮在 MLPerf 基准評測中的出色表現，得益於在 AI 計算系統創新上卓越的系統設計能力和全棧優化能力。在硬件層面，針對 AI 訓練中常見的密集 IO 通信瓶頸，浪潮 PCIe Retimer Free 設計實現了 CPU-GPU 間通道免中繼高速互聯，大幅降低通信延遲，極大提升了 AI 訓練效率；同時，針對高負載多 GPU 協同任務調度，對 NUMA 節點與 GPU 之間的通信進行全面優化和基准調校，確保訓練任務中的數據 IO 無阻塞通信；此外，在通信散熱層面，針對目前業界功率最高的 500W 80GB A100 GPU ，浪潮率先開發的先進片上液冷系統，確保 GPU 在全功率甚至超頻負載下依然穩定工作，將 AI 計算系統的性能發揮到極致。

寧暢同樣刷新的新記錄，寧暢奪冠的兩大場景MASK R-CNN、U-NET3D是重量級圖像目標檢測以及圖像分割模型，其應用場景包括自動駕駛、醫療圖像分析、監控、工業檢測等，是典型數據中心應用模型。而第一成績背後是每秒分析5040張X光照片、57000張圖片以及570餘次訓練迭代的，單機服務器世界極限處理速度。

寧暢方面介紹，本次MLPerf Training V 1.0測試，共有16家國際一線廠商在固定任務（closed）賽道，提交了91個單機系統配置，並於DLRM、MASK R-CNN、Resnet50、SSD、U-NET3D等8個AI場景下，產生超百項測試成績。MLPerf測試的AI場景包含固定任務(Closed)和開放優化(Open)兩個賽道，固定任務(Closed)更側重公平性，參與測試的各計算系統基於同一套參數運行。搭載英特爾第三代至強可擴展處理器、Optane BPS大容量持久內存以及NVIDIA A100 Tensor Core GPU的寧暢X640 G40以及X660 G45，從眾多機型配置中“殺出”，以48.43、28.64分鐘成績奪得MASK R-CNN、U-NET3D場景的單機世界性能第一，取得新世界性能紀錄。

在MASK R-CNN、U-NET3D測試中，單機服務器系統需要運行29GB、21GB的原始圖像數據，並通過分析與迭代最終完成模型訓練。而完成過程所耗費時間越少，則印證系統性能越強。

此處劃重點：

除獲得以上兩項性能冠軍外，在橫向比較搭載同400W功耗GPU的單機服務器系統，寧暢X660 G45在DLRM（推薦系統）、SSD（目標檢測）固定任務賽道，以1.92、8.51分鐘成績取得世界性能第一。

請大家注意的是：浪潮 NF5688M6 獲得 DLRM 和 SSD 的單機訓練性能第一，搭載的是500W功耗GPU ，寧暢搭載的是400W功耗GPU 。

從這個角度上來說，寧暢收獲的同樣是八大場景4個冠軍席位。

兩強爭霸不是頭一回

我們來看去年榜單，2020年

美國東部時間10月21日，全球備受矚目的權威AI基准測試MLPERF公布推理測試榜單。

10月22日，浪潮AI服務器NF5488A5宣稱一舉創造18項性能紀錄，在數據中心AI推理性能上遙遙領先其他廠商產品。

同日，寧暢AI服務器X640宣稱：首登MLPERF，斬獲30項AI性能世界第一，同配置測試獲16項世界第一。

當時，寧暢工程師介紹，參加MLPERF INFERENCE（推理）基准測試的X640 G30 AI服務器，最高可支持10張NVIDIA A100 PCIE卡或21張NVIDIA T4 PCIE卡，堪稱“
性能猛獸”。

在去年基准測試中，浪潮AI服務器NF5488A5在開放優化(OPEN)和固定任務(CLOSED)的RESNET50基准性能測試中，均表現優異，相比2019年MLPERF推理榜單的服務器最好性能提升高達3倍

。

總體來說，浪潮和寧暢都在去年的冠軍的基礎上獲得了長足的進步。

值得注意的是，寧暢是奪冠MLPerf的唯一初創公司，而

浪潮是全球領先的 AI 計算廠商， AI 服務器市場份額全球第一，在中國的市場份額已連續四年保持在50%以上。

不知道，面對如此貼身肉搏的寧暢，是否感到了壓力？

結語

我一直認為AI時代已經來臨，但一服務器品牌主管堅持認為AI是一項技術。

如果從靜態的角度來看，AI的確是一項技術。但從動態來看，AI帶來了方方面面的改變，讓我們感受到生活的各種便利和豐富多彩，關鍵是帶來了產業鏈上的悄然變化。

浪潮IPF2021數據中心合作夥伴大會，公開資料中沒見英特爾攜手。回想起，2020年同樣的大會，同樣以智算為主題，IPF2020 宣傳網頁上清晰呈現：“英特爾攜手浪潮，讓智者更強。”而今年的合作大會上，浪潮與寒武紀發布AI服務器“揚子江”

再來看，累創佳績的浪潮AI服務器NF5488A5采用的是2顆AMD EPYC7742處理器。

浪潮首席科學家王恩東在談到智慧時代算力需求的時候說：“在2020年以GPU為代表的AI加速芯片所交付的計算力已經超過了同類CPU，預計到2025年加速芯片所提供的計算力可能在整個計算力交付當中超過80%。”

王恩東在談到挑戰多元化時說：“不同數值精度的計算類型對計算芯片的指令集、架構等要求也是不一樣的，這樣就導致之前一直使用的通用CPU沒有辦法滿足多元計算場景的要求，應當說這也是計算芯片種類越來越多的重要原因。”

在多元化這一段段落最後，王恩東告訴大家：“英偉達公司的CUDA軟件環境更是通過長期的大規模的投入才打造了支撐GPU在HPC和AI方面的霸主地位。”

聽話聽音，作為一位IT業者，你或多或少意會了英特爾為什麼沒有攜手，或多或少你都能意會到產業鏈變革已經來臨。剩下的問題是，你還以為AI 只是一項技術麼？