導(dǎo)讀:就在幾年前,計(jì)算領(lǐng)域還是通用計(jì)算的天下。此一時,彼一時,隨著計(jì)算密集型領(lǐng)域的快速崛起,面對移動互聯(lián)網(wǎng)、大數(shù)據(jù)和云計(jì)算需求的爆炸式增長,傳統(tǒng)的單一CPU方案越來越力不從心。 另一方面,半導(dǎo)體技術(shù)在縱向提速上也已經(jīng)達(dá)到了物理極限,處理器性能再也無法按照摩爾定律,以每18個月翻倍...
就在幾年前,計(jì)算領(lǐng)域還是通用計(jì)算的天下。此一時,彼一時,隨著計(jì)算密集型領(lǐng)域的快速崛起,面對移動互聯(lián)網(wǎng)、大數(shù)據(jù)和云計(jì)算需求的爆炸式增長,傳統(tǒng)的單一CPU方案越來越力不從心。
另一方面,半導(dǎo)體技術(shù)在縱向提速上也已經(jīng)達(dá)到了物理極限,處理器性能再也無法按照摩爾定律,以每18個月翻倍的速度持續(xù)增長。
1、
在這樣的背景下,異構(gòu)計(jì)算“異軍突起”,成為支撐先進(jìn)和更復(fù)雜的AI、AIoT等對計(jì)算量要求巨大應(yīng)用的有力武器,在產(chǎn)業(yè)中迅速“上位”,使得異構(gòu)計(jì)算和異構(gòu)計(jì)算服務(wù)器市場迎來發(fā)展的黃金時期。
據(jù) IDC數(shù)據(jù)顯示,2019 年上半年,中國異構(gòu)計(jì)算服務(wù)器市場中,GPU 加速器市場規(guī)模已達(dá)9.37 億美元,F(xiàn)PFA/ASIC/其他加速器市場發(fā)展較之稍緩,規(guī)模達(dá)到 1250 萬美元。但這些數(shù)字背后,隱藏著中國異構(gòu)計(jì)算服務(wù)器市場的巨大潛力。
據(jù) IDC預(yù)測,2020 年,中國的 GPU 加速器市場將以 38.9% 的速度增長至25.75 億美元,2023 年將增長至 44.47 億美元,相比 2019 年增長近 5 倍。而在中國,GPU 服務(wù)器也已廣泛應(yīng)用于各行各業(yè),包括互聯(lián)網(wǎng)、服務(wù)業(yè)、政務(wù)、教育、電信、制造業(yè)、金融業(yè),等等。
這些數(shù)字,彰顯著中國異構(gòu)計(jì)算服務(wù)市場的黃金時期已然開啟。
2、浪潮商用機(jī)器FP5468G2
“時勢造英雄”,識時務(wù)者為俊杰,各大云計(jì)算和服務(wù)廠商相繼意識到異構(gòu)計(jì)算是大勢所趨后,紛紛推出自己的異構(gòu)計(jì)算產(chǎn)品和服務(wù),其中就包括以自主研發(fā)技術(shù)實(shí)力專注于高端服務(wù)器的浪潮商用機(jī)器。
其實(shí)早在 2018 年 7 月,浪潮商用機(jī)器已經(jīng)推出了面向大規(guī)模數(shù)據(jù)中心的大數(shù)據(jù)分析應(yīng)用設(shè)計(jì)的高端雙路主流機(jī)架式服務(wù)器FP5280G2.以性能、存儲及拓展等多方面的卓越表現(xiàn),助力企業(yè)應(yīng)對數(shù)據(jù)海洋中多種IT應(yīng)用帶來的挑戰(zhàn)。
但超算和AI的融合應(yīng)用趨勢對計(jì)算性能提出了更高的要求,浪潮商用機(jī)器順應(yīng)這一市場需求,于 2019 年 12 月推出了擁有全場景超強(qiáng)異構(gòu)計(jì)算能力,能夠支持AI云平臺建設(shè)、深度學(xué)習(xí)訓(xùn)練和推理等應(yīng)用的FP5468G2.這款8/16 卡的服務(wù)器可以靈活調(diào)配,為HPC與AI的融合應(yīng)用需求提供了更好的選擇,能夠幫助各行各業(yè)在異構(gòu)計(jì)算領(lǐng)域作出創(chuàng)新。
而在這波浪潮中,嗅到商機(jī)的并非浪潮商用機(jī)器一家,其他廠商也推出過自己的異構(gòu)計(jì)算服務(wù)器產(chǎn)品。相比之下,F(xiàn)P5468G2 在 CPU、硬盤等方面優(yōu)勢明顯。
把一臺 FP5468G2 服務(wù)器拆開,我們可以清晰地看到其獨(dú)特的布局設(shè)計(jì),包括最高可支持24塊3.5英寸大容量硬盤的前置存儲,其中6個硬盤槽位可支持U.2 NVMe SSD,提供高效的數(shù)據(jù)讀取和落盤速度,極致的高效大容量本地存儲和高速IO拓展性能,為企業(yè)級用戶提供了海量數(shù)據(jù)存儲的優(yōu)選平臺;此外整機(jī)還支持2+2 冗余鉑金電源,后置支持4個標(biāo)準(zhǔn)PCIe x16插槽,可支持4個100Gb遠(yuǎn)程直接內(nèi)存訪問(RDMA)高速網(wǎng)絡(luò)。
待深入了解 FP5468G2 的內(nèi)部架構(gòu)之后,則會發(fā)現(xiàn)全新的架構(gòu),尤其其支持balance、common、cascade三種拓?fù)涞撵`活的異構(gòu)拓?fù)渑渲茫屗蔀橐粋€計(jì)算力超群的“小渦輪”,以合理的設(shè)計(jì)和完善的配置支持著復(fù)雜、大量的計(jì)算,并且能夠根據(jù)應(yīng)用場景/訓(xùn)練模型,靈活進(jìn)行拓?fù)淝袚Q。
FP5468G2 支持2顆POWER9 Sforza CPU,最多可支持 44 核及176線程超強(qiáng)調(diào)度能力,再加上8塊V100或者16塊T4 GPU,針對特定深度學(xué)習(xí)模型調(diào)優(yōu),性能相較同等X86平臺可提升多達(dá)20%,并全面兼容FPGA/AISC,提供特定應(yīng)用加速。
3、賦能
智能視頻分析:成本更低
拋開技術(shù)和其他相關(guān)因素的考量,成本一直是阻礙企業(yè)采用異構(gòu)計(jì)算服務(wù)器的重要因素之一。而與同類型產(chǎn)品相比,F(xiàn)P5468G2在成本上有著明顯的優(yōu)勢,尤其是在其三大應(yīng)用場景之一——智能視頻分析領(lǐng)域。
FP5468G2可用于安防智能視頻分析,包括平安城市、智能交通、智慧社區(qū)、車輛識別、輿情分析等。在這些場景中,用戶最大的問題是獲得最優(yōu)性價比存儲空間,節(jié)省TCO。
相比之下,F(xiàn)P5468G2在智能視頻分析領(lǐng)域的成本優(yōu)勢主要體現(xiàn)在以下三方面:
1. 節(jié)省空間:平均單位GPU占用0.25U機(jī)柜空間,部署密度更高;
2. 降低采購成本:假設(shè)客戶需要16顆T4 GPU算力,一臺FP5468G2相比于4臺FP5280G2成本節(jié)省約24萬;
3. 降低運(yùn)營成本:節(jié)約電力成本;假設(shè)工業(yè)用電計(jì)1元/kW·h,16卡GPU算力要求下,單臺FP5468G2三年可節(jié)省電費(fèi)3.15萬元。
DL
隨著AI技術(shù)的進(jìn)步,很多企業(yè)都選擇推出自己的AI產(chǎn)品和技術(shù),隨之而來的是大量深度學(xué)習(xí)訓(xùn)練的需求。然而,深度學(xué)習(xí)訓(xùn)練需要超強(qiáng)的算力支持,極高的存儲IO,以及強(qiáng)大的數(shù)據(jù)交換能力,然而雖然市面上的產(chǎn)品和方案琳瑯滿目,但真正能同時具備這些能力的產(chǎn)品實(shí)際上是鳳毛麟角。
FP5468G2在深度學(xué)習(xí)訓(xùn)練場景中則兼顧了這幾點(diǎn),賦能AI企業(yè),進(jìn)行圖像檢測、語音識別和自然語言處理等,使教育行業(yè)能夠更加高效地推進(jìn)科學(xué)研究、高性能計(jì)算、人工智能算法研究等。
具體說來,F(xiàn)P5468G2在深度學(xué)習(xí)訓(xùn)練場景中的優(yōu)勢體現(xiàn)在以下具體的數(shù)字之中:
超強(qiáng)算力
支持8 塊V100或16 塊T4 GPU卡,提供全場景超強(qiáng)異構(gòu)計(jì)算能力
2顆POWER9處理器,具有多達(dá)44個核心、176線程超強(qiáng)調(diào)度能力;
支持4個標(biāo)準(zhǔn) PCIe x16 插槽,支持4個100Gb高速網(wǎng)絡(luò)
靈活拓?fù)?/p>
支持balance、common、cascade三種拓?fù)?,可根?jù)應(yīng)用場景/訓(xùn)練模型,進(jìn)行靈活拓?fù)淝袚Q;
合理設(shè)計(jì)、適配完善
GPU/CPU分離散熱,保障機(jī)器高效穩(wěn)定運(yùn)行;
全面兼容FPGA/AISC, 提供特定應(yīng)用加速。
值得一提的是,POWER9 采用增強(qiáng)的架構(gòu)體系,可支持SMT4并發(fā)多線程,110MB片上L3緩存,能更好應(yīng)對GPU數(shù)量增加帶來的數(shù)據(jù)調(diào)度負(fù)載的提升;獨(dú)特的高寬帶設(shè)計(jì)使得片內(nèi)寬帶可達(dá)7TB/s,外聯(lián)寬帶達(dá)25 GB/s。全新的微架構(gòu)對稱數(shù)據(jù)處理引擎設(shè)計(jì),更高效的指令流水線與單線程性能,海量的數(shù)據(jù)存儲能力,讓FP5468G2的實(shí)力不容小覷。
AI
FP5468G2的第三個應(yīng)用場景是AI云/深度學(xué)習(xí)推理,在互聯(lián)網(wǎng)行業(yè),其可用于客戶行為分析、互動娛樂、輿情分析、精準(zhǔn)營銷、內(nèi)容監(jiān)控等;在金融行業(yè),可用于智能客服、人臉識別、風(fēng)險評估、智能投顧等;在電信行業(yè),可用于智能服務(wù)、智能網(wǎng)絡(luò)、智能客服等。
在這些場景中,動輒數(shù)億TB的數(shù)據(jù)流量往往需要海量的存儲空間,以應(yīng)對每天的日常運(yùn)營。
FP5468G2支持海量的數(shù)據(jù)存儲和高速IO擴(kuò)展:
最大支持24塊3.5英寸大容量硬盤,其中可支持6塊U.2 NVMe SSD
支持4個標(biāo)準(zhǔn) PCIe x16 插槽,支持4個100Gb高速網(wǎng)絡(luò)
FP5468G2可用于AI 公有云、企業(yè) AI 云、混合型 AI 計(jì)算應(yīng)用,如數(shù)據(jù)源中心管理、智慧醫(yī)療一卡通、政務(wù)服務(wù)云、高性能計(jì)算等。
在人工智能領(lǐng)域,F(xiàn)P5468G2 可用于深度學(xué)習(xí)訓(xùn)練和推理,是模型調(diào)優(yōu)的一把好手。
在視頻智能分析領(lǐng)域,F(xiàn)P5468G2 可在平安城市、智能交通、智慧社區(qū)的安防方面發(fā)揮巨大的作用,滿足視頻流海量存儲需求,進(jìn)行信息實(shí)時檢索、音視頻轉(zhuǎn)碼/壓縮等。
展望未來,像 FP5468G2 這樣的異構(gòu)服務(wù)器發(fā)展前景非常可觀。據(jù) IDC 數(shù)據(jù)顯示,2020 年之前,異構(gòu)計(jì)算的應(yīng)用場景和服務(wù)領(lǐng)域已經(jīng)十分廣泛,包括發(fā)展相對成熟的智能客服、語音識別、人臉識別、風(fēng)險評估等領(lǐng)域。但在 2020 年之后,異構(gòu)計(jì)算將拓展到智能機(jī)器人、智能服務(wù)、智能工廠、IT 自動化、智能導(dǎo)診,甚至語言能力等更加復(fù)雜的場景中;到 2025 年,異構(gòu)計(jì)算在自適應(yīng)學(xué)習(xí)、智能診斷等需要謹(jǐn)慎決策的場景中也將發(fā)揮更大的作用。