導(dǎo)讀:麻省理工學(xué)院的一組研究人員利用人工智能來緩解交通擁堵,他們將這一領(lǐng)域的想法應(yīng)用于解決倉庫中多個(gè)機(jī)器人的問題。通過將難以解決的問題分解成更小的塊,一種深度學(xué)習(xí)技術(shù)確定了倉庫中疏導(dǎo)流量的最佳區(qū)域。
麻省理工學(xué)院的一組研究人員利用人工智能來緩解交通擁堵,他們將這一領(lǐng)域的想法應(yīng)用于解決倉庫中多個(gè)機(jī)器人的問題。通過將難以解決的問題分解成更小的塊,一種深度學(xué)習(xí)技術(shù)確定了倉庫中疏導(dǎo)流量的最佳區(qū)域。
在一個(gè)巨大的機(jī)器人倉庫里,數(shù)百個(gè)機(jī)器人在地面上來回穿梭,抓取物品并交付給人類工人進(jìn)行包裝和運(yùn)輸。這種倉庫正日益成為從電子商務(wù)到汽車生產(chǎn)等許多行業(yè)供應(yīng)鏈的一部分。
然而,要讓 800 個(gè)機(jī)器人高效地往返于目的地,同時(shí)又要防止它們相互碰撞,并非易事。這個(gè)問題非常復(fù)雜,即使是最好的路徑搜索算法,也很難跟上電子商務(wù)或制造業(yè)的飛速發(fā)展。
人工智能驅(qū)動(dòng)的高效解決方案
從某種意義上說,這些機(jī)器人就像試圖在擁擠的市中心穿梭的汽車。因此,一群利用人工智能緩解交通擁堵的麻省理工學(xué)院研究人員運(yùn)用了這一領(lǐng)域的理念來解決這一問題。
他們建立了一個(gè)深度學(xué)習(xí)模型,對倉庫的重要信息(包括機(jī)器人、計(jì)劃路徑、任務(wù)和障礙物)進(jìn)行編碼,并利用這些信息預(yù)測倉庫的最佳疏導(dǎo)區(qū)域,以提高整體效率。
他們的技術(shù)將倉庫中的機(jī)器人分成若干組,因此這些較小的機(jī)器人組可以用協(xié)調(diào)機(jī)器人的傳統(tǒng)算法更快地消除擁堵。最終,與強(qiáng)隨機(jī)搜索法相比,他們的方法疏導(dǎo)機(jī)器人的速度快了近四倍。
除了簡化倉庫作業(yè),這種深度學(xué)習(xí)方法還可用于其他復(fù)雜的規(guī)劃任務(wù),如計(jì)算機(jī)芯片設(shè)計(jì)或大型建筑的管道布線。
尖端的神經(jīng)網(wǎng)絡(luò)架構(gòu)
"我們設(shè)計(jì)了一種新的神經(jīng)網(wǎng)絡(luò)架構(gòu),它實(shí)際上適用于這些倉庫這種規(guī)模和復(fù)雜程度的實(shí)時(shí)操作。它可以對數(shù)百個(gè)機(jī)器人的軌跡、出發(fā)地、目的地以及與其他機(jī)器人的關(guān)系進(jìn)行編碼,而且能以一種高效的方式在各組機(jī)器人之間重復(fù)使用計(jì)算,"土木與環(huán)境工程(CEE)專業(yè)吉爾伯特-W-溫斯洛職業(yè)發(fā)展助理教授、信息與決策系統(tǒng)實(shí)驗(yàn)室(LIDS)和數(shù)據(jù)、系統(tǒng)與社會(huì)研究所(IDSS)成員凱茜-吳(Cathy Wu)說。
該技術(shù)論文的資深作者 Wu 和第一作者、電子工程和計(jì)算機(jī)科學(xué)專業(yè)研究生 Zhongxia Yan 共同完成了這項(xiàng)研究。這項(xiàng)研究成果將在學(xué)習(xí)表征國際會(huì)議(International Conference on Learning Representations)上發(fā)表。
機(jī)器人俄羅斯方塊
從鳥瞰圖上看,機(jī)器人電子商務(wù)倉庫的地面有點(diǎn)像快節(jié)奏的"俄羅斯方塊"游戲。
當(dāng)客戶下訂單時(shí),機(jī)器人會(huì)前往倉庫的某一區(qū)域,抓起放置所需物品的貨架,然后將其交給人類操作員,由其揀選和包裝物品。數(shù)百個(gè)機(jī)器人同時(shí)進(jìn)行這項(xiàng)工作,如果兩個(gè)機(jī)器人在穿過巨大的倉庫時(shí)發(fā)生路徑?jīng)_突,就可能會(huì)撞車。
傳統(tǒng)的搜索算法可以避免潛在的碰撞,方法是保持一個(gè)機(jī)器人的運(yùn)行軌跡,并為另一個(gè)機(jī)器人重新規(guī)劃軌跡。但由于機(jī)器人數(shù)量眾多,可能發(fā)生碰撞,問題很快就會(huì)呈指數(shù)級增長。
"由于倉庫是在線運(yùn)行的,機(jī)器人大約每 100 毫秒重新掃描一次。也就是說,每秒鐘,機(jī)器人要重新掃描 10 次。因此,這些操作必須非??焖伲?quot;Wu 說。
由于在重新規(guī)劃過程中時(shí)間非常關(guān)鍵,麻省理工學(xué)院的研究人員利用機(jī)器學(xué)習(xí)將重新規(guī)劃的重點(diǎn)放在最有可能減少機(jī)器人總行駛時(shí)間的擁堵區(qū)域。
Wu 和 Yan 建立的神經(jīng)網(wǎng)絡(luò)架構(gòu)可同時(shí)考慮較小的機(jī)器人群組。例如,在一個(gè)擁有 800 個(gè)機(jī)器人的倉庫中,網(wǎng)絡(luò)可能會(huì)將倉庫地面切割成更小的組,每組包含 40 個(gè)機(jī)器人。
然后,如果使用基于搜索的求解器來協(xié)調(diào)該組機(jī)器人的軌跡,它就會(huì)預(yù)測出哪一組最有可能改進(jìn)整體解決方案。整個(gè)算法是一個(gè)迭代過程,先用神經(jīng)網(wǎng)絡(luò)選出最有希望的機(jī)器人組,再用基于搜索的求解器解散機(jī)器人組,然后用神經(jīng)網(wǎng)絡(luò)選出下一個(gè)最有希望的機(jī)器人組,依此類推。
簡化復(fù)雜系統(tǒng)
神經(jīng)網(wǎng)絡(luò)能有效地推理機(jī)器人群,因?yàn)樗懿蹲降絾蝹€(gè)機(jī)器人之間存在的復(fù)雜關(guān)系。例如,即使一個(gè)機(jī)器人一開始離另一個(gè)機(jī)器人很遠(yuǎn),它們在行進(jìn)過程中的路徑仍有可能交叉。
該技術(shù)還能簡化計(jì)算,只需對約束條件進(jìn)行一次編碼,而無需對每個(gè)子問題重復(fù)編碼。例如,在一個(gè)擁有 800 個(gè)機(jī)器人的倉庫中,要消除一組 40 個(gè)機(jī)器人的擁堵,需要將其他 760 個(gè)機(jī)器人作為約束條件。其他方法則需要在每次迭代中對每組所有 800 個(gè)機(jī)器人推理一次。相反,研究人員的方法只需要在每次迭代中對所有小組的 800 個(gè)機(jī)器人進(jìn)行一次推理。
她補(bǔ)充說:"倉庫是一個(gè)大的環(huán)境,因此這些機(jī)器人群組中的很多都會(huì)在更大的問題上有一些共同點(diǎn)。我們設(shè)計(jì)的架構(gòu)就是為了利用這些共同的信息。"
研究人員在幾個(gè)模擬環(huán)境中測試了他們的技術(shù),包括一些像倉庫一樣的環(huán)境,一些帶有隨機(jī)障礙物的環(huán)境,甚至還有模擬建筑物內(nèi)部的迷宮設(shè)置。通過識別出更有效的疏導(dǎo)群組,他們基于學(xué)習(xí)的方法疏導(dǎo)倉庫的速度比強(qiáng)大的、非基于學(xué)習(xí)的方法快四倍。即使考慮到運(yùn)行神經(jīng)網(wǎng)絡(luò)的額外計(jì)算開銷,他們的方法解決問題的速度仍然快 3.5 倍。
未來方向與同行認(rèn)可
未來,研究人員希望從他們的神經(jīng)模型中獲得簡單、基于規(guī)則的見解,因?yàn)樯窠?jīng)網(wǎng)絡(luò)的決策可能不透明,難以解讀。更簡單、基于規(guī)則的方法也更容易在實(shí)際機(jī)器人倉庫環(huán)境中實(shí)施和維護(hù)。
"這種方法基于一種新穎的架構(gòu),在這種架構(gòu)中,卷積和注意力機(jī)制能夠有效地相互作用。令人印象深刻的是,它能夠考慮到所構(gòu)建路徑的時(shí)空成分,而無需針對具體問題進(jìn)行特征工程。結(jié)果非常出色。"康奈爾理工學(xué)院安德魯-H.和安-R.-蒂施教授 Andrea Lodi 說:"我們不僅能在求解質(zhì)量和速度方面改進(jìn)最先進(jìn)的大型鄰域搜索方法,而且該模型還能很好地推廣到未見過的案例中。"cnBeta