導讀:北京2023年7月8日 -- 當前,生成式AI(AIGC)已經(jīng)成為AI產(chǎn)業(yè)化發(fā)展的主戰(zhàn)場,隨著大模型參數(shù)量和數(shù)據(jù)量的爆發(fā)式增長,多源異構(gòu)數(shù)據(jù)的傳、用、管、存,正在成為制約生成式AI落地的瓶頸之一。為了化解生成式AI的數(shù)據(jù)存儲與管理瓶頸,浪潮信息在"數(shù)智未來"AIGC數(shù)據(jù)應用創(chuàng)新論壇上,正式發(fā)布面向生成式AI的存儲解決方案,該方案以極致融合、極致性能、極致節(jié)能,和熱溫冷冰四級數(shù)據(jù)全生命周期管理,助力開啟生成式AI新局面,創(chuàng)造智慧時代新機遇。
北京2023年7月8日 -- 當前,生成式AI(AIGC)已經(jīng)成為AI產(chǎn)業(yè)化發(fā)展的主戰(zhàn)場,隨著大模型參數(shù)量和數(shù)據(jù)量的爆發(fā)式增長,多源異構(gòu)數(shù)據(jù)的傳、用、管、存,正在成為制約生成式AI落地的瓶頸之一。為了化解生成式AI的數(shù)據(jù)存儲與管理瓶頸,浪潮信息在"數(shù)智未來"AIGC數(shù)據(jù)應用創(chuàng)新論壇上,正式發(fā)布面向生成式AI的存儲解決方案,該方案以極致融合、極致性能、極致節(jié)能,和熱溫冷冰四級數(shù)據(jù)全生命周期管理,助力開啟生成式AI新局面,創(chuàng)造智慧時代新機遇。
生成式AI亟待突破多源異構(gòu)和存儲性能瓶頸
生產(chǎn)式AI是人工智能從1.0時代進入2.0時代的重要標志,其具備強大的認知智能,在搜索引擎、藝術創(chuàng)作、影音游戲,以及金融、教育、醫(yī)療、工業(yè)等領域有著廣闊的應用前景。Gartner預測,到2023年將有20%的內(nèi)容被AIGC所創(chuàng)建;到2025 年人工智能生成數(shù)據(jù)占比將達到10%。據(jù)分析師預測,到2032年,生成式人工智能市場規(guī)模將達到2,000億美元,占據(jù)人工智能支出總額的約20%,顯著高出當前的5%。換言之,未來十年市場規(guī)??赡苊績赡昃蜁环?。
生成式AI主要應用場景涵蓋文本生成、語音生成、圖片生成、視頻生成、代碼生成、虛擬人生成等,在每種應用的背后是基于行業(yè)上下游對數(shù)據(jù)進行采集、標注、訓練、推理、歸檔,其特征是數(shù)據(jù)量大、多元數(shù)據(jù)類型復雜、服務協(xié)議多樣、性能要求苛刻、要求服務持續(xù)在線。生成式AI對數(shù)據(jù)存儲提出如下挑戰(zhàn):
數(shù)據(jù)存儲產(chǎn)業(yè)需要進行全方位的技術升級,通過在多源異構(gòu)融合、數(shù)據(jù)高速傳輸、海量數(shù)據(jù)管理等方面持續(xù)創(chuàng)新,打造專業(yè)的生成式AI存儲產(chǎn)品與解決方案。
浪潮信息讓生成式AI智慧有數(shù)
浪潮信息是最早布局大模型的企業(yè)之一,打造了算力、算法、數(shù)據(jù)全棧的解決方案能力。在數(shù)據(jù)存儲領域,浪潮信息準確識別行業(yè)痛點、積極布局,經(jīng)過持續(xù)攻關,在融合存儲架構(gòu)、系統(tǒng)性能設計、數(shù)據(jù)全生命周期管理算法等方面不斷突破,打造出生成式AI存儲解決方案。
浪潮信息生成式AI存儲解決方案基于AS13000融合存儲系統(tǒng),可以支撐AIGC產(chǎn)業(yè)上中下游業(yè)務應用,并針對不同業(yè)務階段的數(shù)據(jù)存儲需求,提供熱溫冷冰四級存儲,實現(xiàn)數(shù)據(jù)在各級存儲間自動流轉(zhuǎn)。用高性能節(jié)點形態(tài)來滿足數(shù)據(jù)訓練、數(shù)據(jù)推理兩個階段的高帶寬、低延時、高并行讀寫性能存儲需求,用大容量節(jié)點形態(tài)來滿足數(shù)據(jù)采集、數(shù)據(jù)準備、數(shù)據(jù)歸檔三個階段的海量多元數(shù)據(jù)存儲需求,方案具備極致融合、極致性能、極致節(jié)能三大能力,以及熱、溫、冷、冰四級數(shù)據(jù)全生命周期存儲管理能力,助力生成式AI突破海量數(shù)據(jù)存力瓶頸,加速釋放數(shù)據(jù)的價值。
目前,浪潮信息生成式AI存儲解決方案已經(jīng)在全球領先的中文語言大模型"源1.0"中成功落地,面對千億級參數(shù)量和數(shù)據(jù)量帶來的挑戰(zhàn),浪潮信息通過AS13000高吞吐并行存儲系統(tǒng)實現(xiàn)了多存儲協(xié)議互通、數(shù)據(jù)融合,利用全閃的極致性能,助力"源1.0"大模型實現(xiàn)了16天完成訓練的超高效率。國內(nèi)AI獨角獸公司采用浪潮信息提供的并行文件存儲,承載5000億參數(shù)量的NLP語言類大模型的數(shù)據(jù)集Token和CheckPoint文件,輕松應對大/小文件的讀寫挑戰(zhàn),配置AS13000全閃存儲集群,支持高性能RocE組網(wǎng)和GPU直通存儲功能,帶寬超過300GB、存儲性能超過350萬 IOPS,保證存儲集群的高可用與敏捷擴容。
面對生成式AI掀起的變革熱潮,誰能掌握數(shù)字化變革的先機,誰就能把握未來AI革命的致勝關鍵,而數(shù)據(jù)底座將成為千行百業(yè)創(chuàng)新變革的重要基石。浪潮信息存儲秉承"存儲即平臺"的產(chǎn)品理念,精耕數(shù)據(jù)存儲產(chǎn)品與解決方案,攜手合作伙伴,助力生成式AI在金融虛擬客服、圖片編輯設計、智能駕駛、跨模態(tài)檢索等場景的落地,激活數(shù)據(jù)要素新潛能,駕馭智慧化轉(zhuǎn)型新趨勢,在機遇與挑戰(zhàn)并存的新格局下,為行業(yè)轉(zhuǎn)型注入新價值、新動能。