應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

實(shí)現(xiàn)人工智能的“想象力”

2021-08-10 09:08 51CTO

導(dǎo)讀:南加州大學(xué)的一組研究人員正在幫助人工智能想象看不見的東西,這項(xiàng)技術(shù)也可能帶來更公平的人工智能。

首先請(qǐng)?jiān)谀X海中想象一只橙色的貓。然后,想象同一只貓,皮毛已經(jīng)變成了煤黑色?,F(xiàn)在,想象這樣一只貓?jiān)陂L(zhǎng)城上昂首闊步。

在上述一系列想象活動(dòng)中,你大腦中的一系列神經(jīng)元會(huì)基于你之前對(duì)世界的認(rèn)知,快速呈現(xiàn)出不同的圖像。也就是說,作為人類,其實(shí)很容易一個(gè)具有不同屬性的對(duì)象。但對(duì)于計(jì)算機(jī)來說,盡管深度神經(jīng)網(wǎng)絡(luò)在某些任務(wù)上取得了可以與人類表現(xiàn)相匹敵甚至超越的突破,但始終無法與人類的“想象力”相抗衡。

如今,一個(gè)來自南加州大學(xué)的研究團(tuán)隊(duì)開發(fā)出了一種新的人工智能,可以利用類人的能力想象出某個(gè)前所未有的具有不同屬性的物體。這篇以Zero-Shot Synthesis with Group-Supervised Learning為題的論文于今年5月7日發(fā)表在ICLR2021(深度學(xué)習(xí)領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議)會(huì)上。

“我們受到人類視覺泛化能力的啟發(fā),嘗試在機(jī)器上模擬人類的想象力,”該研究的主要作者葛云浩說,“人類可以通過不同的屬性(例如形狀、姿勢(shì)、位置、顏色)來分離所學(xué)知識(shí),然后將它們重新組合,從而想象出一個(gè)新的物體。我們的論文試圖用神經(jīng)網(wǎng)絡(luò)來模擬這個(gè)過程?!?/p>

人工智能的泛化

假如,你想創(chuàng)建一個(gè)生成汽車圖像的人工智能系統(tǒng)。理想情況下,你可以為算法提供一些汽車圖片,從而讓它可以從不同角度生成各種型號(hào)、外形、顏色的汽車,從保時(shí)捷到龐蒂亞克到皮卡,不一而足。

這是人工智能長(zhǎng)期追求的目標(biāo)之一:創(chuàng)建可以進(jìn)行推理的模型。達(dá)成這一目標(biāo)就意味著,給定幾個(gè)示例,模型就能夠提取基本規(guī)則,并將它們應(yīng)用到大量前所未見的新示例中。但機(jī)器通常是根據(jù)樣本特征進(jìn)行訓(xùn)練的,比如像素,而不考慮對(duì)象的屬性。

關(guān)于“想象”的科學(xué)

在這項(xiàng)新研究中,研究人員試圖用一種“退糾纏(disentanglement)”的概念來克服這一限制?!巴思m纏”可以用于“深度偽造(deepfake)”,葛云浩提到,通過“退糾纏”人的臉部表情和特征進(jìn)行“換臉”,人們可以合成新的圖像和視頻,用另一個(gè)人替換原主身份,同時(shí)保留原來的動(dòng)作。與之相似,新方法采用一組樣本圖像——而不是像傳統(tǒng)算法那樣一次一個(gè)樣本——并挖掘它們之間的相似性以實(shí)現(xiàn)所謂的“可控退糾纏表征學(xué)習(xí)”。然后通過重新組合這些知識(shí)來實(shí)現(xiàn)“可控的新圖像合成”,或者你可以稱之為“想象”。

他以《變形金剛》為例進(jìn)行了說明:它可以在電影中取材——威震天的形狀、大黃蜂的顏色、紐約時(shí)代廣場(chǎng)的背景。合成結(jié)果就是一輛大黃蜂顏色的威震天汽車在時(shí)代廣場(chǎng)上飛馳,即使訓(xùn)練期間并沒有出現(xiàn)過這個(gè)樣本。

這個(gè)過程類似于人類的推理:當(dāng)一個(gè)人看到一個(gè)物體的顏色時(shí),我們可以輕松地通過用新顏色替換原始色來將其應(yīng)用于任何其他物體。使用他們的技術(shù),這個(gè)團(tuán)隊(duì)生成了一個(gè)包含 156 萬張圖像的新數(shù)據(jù)集,有助于該領(lǐng)域的未來研究。

理解世界

雖然“退糾纏”并不是個(gè)新點(diǎn)子,但研究人員表示,他們的框架幾乎可以和任何類型的數(shù)據(jù)或知識(shí)兼容,這就擴(kuò)大了應(yīng)用機(jī)會(huì)。比如,通過將敏感屬性從等式中完全移除,將種族和性別相關(guān)知識(shí)分解,從而推進(jìn)人工智能更加公平。

再比如,在醫(yī)學(xué)領(lǐng)域,它可以幫助醫(yī)生和生物學(xué)家發(fā)現(xiàn)更多有用的藥物,通過將藥物功能與其他特性分開,然后將它們重新組合以合成新藥;在自動(dòng)駕駛領(lǐng)域,允許自動(dòng)駕駛汽車想象并避免在訓(xùn)練過程中從未見過的危險(xiǎn)場(chǎng)景,從而推進(jìn)創(chuàng)建更安全的人工智能。

計(jì)算機(jī)科學(xué)教授洛倫·伊蒂說:“深度學(xué)習(xí)已經(jīng)在很多領(lǐng)域展示了無與倫比的性能和前景,但這往往是通過淺層模仿達(dá)成,并沒有更深入地了解使每個(gè)個(gè)體獨(dú)一無二的屬性。這種新的‘退糾纏’方法第一次真正釋放了人工智能系統(tǒng)的想象力,使它們更接近人類對(duì)世界的理解。”