應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

首款專(zhuān)為大規(guī)模上下文 AI 設(shè)計(jì)的 CUDA GPU,英偉達(dá) Rubin CPX 發(fā)布

2025-09-10 09:13 IT之家
關(guān)鍵詞:英偉達(dá)RubinCPX

導(dǎo)讀:英偉達(dá)宣布推出新產(chǎn)品Rubin CPX,這是一款專(zhuān)為大規(guī)模上下文處理而設(shè)計(jì)的專(zhuān)用 GPU,涵蓋了像大規(guī)模編碼和生成視頻這樣要求高的工作。

  9 月 10 日消息,英偉達(dá)宣布推出新產(chǎn)品Rubin CPX,這是一款專(zhuān)為大規(guī)模上下文處理而設(shè)計(jì)的專(zhuān)用 GPU,涵蓋了像大規(guī)模編碼和生成視頻這樣要求高的工作。

  該硬件旨在將理解 AI 提示的任務(wù)與生成響應(yīng)的任務(wù)區(qū)分開(kāi),英偉達(dá)表示,這將使整個(gè)過(guò)程對(duì)客戶(hù)的效率更高。

  該新硬件預(yù)計(jì)將作為較大的 Vera Rubin 平臺(tái)的一部分工作,該平臺(tái)同時(shí)集成了 Vera CPU 和 Rubin GPU。英偉達(dá)聲稱(chēng)全機(jī)架版本 Vera Rubin NVL144 CPX 擁有 8 exaflops 的 AI 性能

  從英偉達(dá)新聞稿獲悉,獨(dú)立的 Rubin CPX GPU 包含128GB 的 GDDR7 顯存。英偉達(dá)承諾,新硬件具有 3 倍的 attention capabilities,并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的計(jì)算能力。

  英偉達(dá) CEO 黃仁勛將 Rubin CPX 與 RTX 進(jìn)行了比較,他說(shuō):“正如 RTX 革新了圖形和物理 AI,Rubin CPX 是首款專(zhuān)為大規(guī)模上下文 AI 設(shè)計(jì)的 CUDA GPU,能夠在同一時(shí)間推理跨越數(shù)百萬(wàn)個(gè)知識(shí)符號(hào)的模型。”他還試圖量化客戶(hù)的投資回報(bào),提到部署新硬件的 1 億美元投資可以產(chǎn)生 50 億美元的收益。

  英偉達(dá)表示,該硬件將得到其完整軟件棧的支持,包括 Nemotron —— 其一系列開(kāi)放的多模態(tài)模型,專(zhuān)為構(gòu)建企業(yè)級(jí) AI 代理(旨在自主處理復(fù)雜任務(wù)的系統(tǒng))而設(shè)計(jì)。Nemotron 模型提供不同尺寸,從 Nano 用于設(shè)備端應(yīng)用,到 Super 用于單 GPU 設(shè)置,再到 Ultra 用于大型數(shù)據(jù)中心。

  英偉達(dá)表示,預(yù)計(jì) Rubin CPX 將于2026 年底推出。