技術(shù)
導(dǎo)讀:機(jī)器人初創(chuàng)公司 Figure AI 推出了一種名為 Helix 的新型人工智能系統(tǒng),能夠讓人形機(jī)器人通過語音命令執(zhí)行復(fù)雜的動(dòng)作。該系統(tǒng)旨在讓機(jī)器人無需針對(duì)每個(gè)物體進(jìn)行專門訓(xùn)練,就能輕松處理不同物體。
2 月 21 日消息,機(jī)器人初創(chuàng)公司 Figure AI 推出了一種名為 Helix 的新型人工智能系統(tǒng),能夠讓人形機(jī)器人通過語音命令執(zhí)行復(fù)雜的動(dòng)作。該系統(tǒng)旨在讓機(jī)器人無需針對(duì)每個(gè)物體進(jìn)行專門訓(xùn)練,就能輕松處理不同物體。
Helix 系統(tǒng)結(jié)合了兩個(gè)關(guān)鍵的人工智能模塊。第一個(gè)模塊是一個(gè)擁有70 億參數(shù)的多模態(tài)語言模型,能夠以 7 至 9 赫茲的頻率處理語音和視覺信息,充當(dāng)機(jī)器人的“大腦”。第二個(gè)模塊則是一個(gè)擁有8000 萬參數(shù)的 AI,負(fù)責(zé)將語言模型發(fā)出的指令轉(zhuǎn)化為精確的機(jī)器人動(dòng)作,頻率高達(dá) 200 赫茲。
Helix 能夠同時(shí)控制 35 個(gè)自由度,涵蓋了從單個(gè)手指動(dòng)作到頭部、軀干等多個(gè)部分的精細(xì)控制。Figure 通過一系列展示機(jī)器人如何響應(yīng)語音命令、識(shí)別物體并精準(zhǔn)抓取的演示視頻,展示了該系統(tǒng)的強(qiáng)大能力。
官方公布的演示視頻中,兩臺(tái)機(jī)器人在一個(gè)展示廚房中合作,將食物放入冰箱,且全程無需為這些物體進(jìn)行任何特定的預(yù)先訓(xùn)練。
Helix 系統(tǒng)只需500 小時(shí)的訓(xùn)練數(shù)據(jù),遠(yuǎn)低于同類項(xiàng)目的要求。它依靠機(jī)器人內(nèi)置的嵌入式 GPU 運(yùn)行,這使得該技術(shù)在商業(yè)應(yīng)用上具備了可行性。
Figure 的首席執(zhí)行官 Brett Adcock 表示,Helix 的出現(xiàn)對(duì)家用機(jī)器人規(guī)?;?/strong>至關(guān)重要。與傳統(tǒng)機(jī)器人每次執(zhí)行新任務(wù)都需要重新編程不同,Helix 能夠輕松適應(yīng)新的情境 —— 雖然它在實(shí)際應(yīng)用中的表現(xiàn)還需要進(jìn)一步驗(yàn)證。
據(jù)IT之家此前報(bào)道,F(xiàn)igure AI 近期結(jié)束了與 OpenAI 在機(jī)器人專用 AI 模型方面的合作,盡管 OpenAI 仍是其重要投資方。Adcock 在社交平臺(tái) X 上表示,雖然大型語言模型(LLM)越來越強(qiáng)大,但它們正變得商品化,且在 Figure 的戰(zhàn)略中只占“最小的一部分”。
目前,F(xiàn)igure 專注于開發(fā)自己的 AI 模型,旨在實(shí)現(xiàn)高速度的機(jī)器人控制,特別是在實(shí)際環(huán)境中的應(yīng)用。同時(shí),OpenAI 重新開始招募硬件工程師,以組建新的機(jī)器人團(tuán)隊(duì),而此前其機(jī)器人部門已被關(guān)閉。