應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個人注冊登錄

亞馬遜殺入AI芯片大戰(zhàn),Alexa的野心是當(dāng)家庭大腦

2018-02-16 17:36 創(chuàng)事記

導(dǎo)讀:2月12日,The Information的報告證實,亞馬遜已經(jīng)開始設(shè)計制造AI芯片,以提升Alexa語音助理的質(zhì)量,為Echo設(shè)備提供支持。此舉緊隨蘋果和谷歌的步伐,被視為亞馬遜順勢而為的厚積薄發(fā),至此,繁盛的AI芯片市場,百家爭鳴,鹿死誰手?

  2月12日,The Information的報告證實,亞馬遜已經(jīng)開始設(shè)計制造AI芯片,以提升Alexa語音助理的質(zhì)量,為Echo設(shè)備提供支持。此舉緊隨蘋果和谷歌的步伐,被視為亞馬遜順勢而為的厚積薄發(fā),至此,繁盛的AI芯片市場,百家爭鳴,鹿死誰手?

  2月12日,根據(jù)The Information的一份報告,亞馬遜已經(jīng)開始設(shè)計制造AI芯片,專用AI芯片也可以幫助Alexa減少對整體遠(yuǎn)程服務(wù)器的依賴,為Echo設(shè)備提供支持。

  亞馬遜希望Alexa能夠成為家中的大腦,控制門鎖,安全攝像頭和烤箱等家用電器。 如果不需要互聯(lián)網(wǎng),那么與這些設(shè)備的連接將更安全可靠。

  該報告稱,亞馬遜希望在智能家居硬件市場和面向消費(fèi)者的人工智能產(chǎn)品領(lǐng)域保持競爭力,并已經(jīng)擁有近450名芯片專業(yè)員工,這要?dú)w功于亞馬遜發(fā)力招聘和收購。

  在過去幾年中,2015年,亞馬遜以3.5億美元收購以色列芯片制造商Annapurna Labs,以及17年年底收購安全攝像頭制造商Blink。Blink的芯片可以降低生產(chǎn)成本并延長其他產(chǎn)品的電池壽命,從亞馬遜的云端攝像頭開始,并擴(kuò)展到Echo揚(yáng)聲器系列。

  此舉緊隨蘋果和谷歌的步伐,后兩家公司已經(jīng)開發(fā)并部署了各種規(guī)模的定制AI硬件。人工智能任務(wù)由于其計算密集程度高,通常需要為設(shè)備本身定制設(shè)計芯片,甚至需要為數(shù)據(jù)中心定制設(shè)計服務(wù)器,這些服務(wù)器通常從云端進(jìn)行人工智能算法的訓(xùn)練。

  這一消息確實對Nvidia和英特爾等公司的業(yè)務(wù)構(gòu)成風(fēng)險,這兩家公司都將其大部分芯片制造專業(yè)技術(shù)轉(zhuǎn)移到了AI以及新興領(lǐng)域,并通過為蘋果、亞馬遜等公司設(shè)計和制造芯片來賺錢。

  亞馬遜收購以色列芯片公司及攝像頭Blink, 發(fā)力AI芯片后勁十足

  亞馬遜計劃開發(fā)自己的AI芯片,以便在其不斷擴(kuò)展的Echo產(chǎn)品線中使用Alexa驅(qū)動的產(chǎn)品可以進(jìn)行更多的計算處理,而不必與云進(jìn)行通信,這一過程可以提高運(yùn)算速度。

  蘋果和谷歌都開始了類似的轉(zhuǎn)變。蘋果已經(jīng)開始開發(fā)自己的iPhone芯片,比如該設(shè)備的圖形處理器和電源管理單元,并因此切斷了長期供應(yīng)商。關(guān)于人工智能,蘋果公司設(shè)計了一種新的“神經(jīng)引擎”,作為其A11仿生芯片的一部分,它在處理機(jī)器學(xué)習(xí)算法的設(shè)備上運(yùn)行,為Face ID和ARKit應(yīng)用程序提供幫助。

  另一方面,谷歌已經(jīng)開發(fā)了自己的AI硬件多年,首先是定制ASIC處理器,為其TensorFlow AI培訓(xùn)平臺定制設(shè)計的TPU(去年升級為第二版),展現(xiàn)機(jī)器學(xué)習(xí)任務(wù)方面的優(yōu)勢。PU是Google子公司DeepMind AlphaGo系統(tǒng)的基礎(chǔ),它幫助Google保持與同樣設(shè)計自己AI培訓(xùn)服務(wù)器硬件的Facebook的競爭力。

  在過去的兩年左右時間里,谷歌已將其知識轉(zhuǎn)移到了消費(fèi)者領(lǐng)域,開始開發(fā)自定義的AI芯片以支持相機(jī)設(shè)備,還在Pixel 2中設(shè)計了圖像處理器。

  繁盛的AI芯片市場,百家爭鳴,鹿死誰手?

  通用芯片并不能很好地適應(yīng)深度學(xué)習(xí)算法的要求,效率低,功耗大,成本高。各種神經(jīng)網(wǎng)絡(luò)算法需要專用芯片來保證其運(yùn)行效率。人工智能的浪潮,催生了 AI 專用芯片的大爆發(fā)。

  無論是云端的運(yùn)算還是移動端的運(yùn)算,都需要專門針對 AI 算法設(shè)計的芯片,但這二者對 AI 專用芯片的要求不同。云端要求 AI 芯片適應(yīng)多種神經(jīng)網(wǎng)絡(luò)架構(gòu),同時能進(jìn)行高精度浮點(diǎn)運(yùn)算,峰值性能至少要達(dá)到Tflops(每秒執(zhí)行10^12次浮點(diǎn)數(shù)運(yùn)算)級別,對功耗沒有嚴(yán)苛要求;支持陣列式結(jié)構(gòu)以進(jìn)一步提高性能。

  移動端 AI 芯片對設(shè)計的要求截然不同。一個根本的要求是控制功耗,這就需要使用一些辦法(如網(wǎng)絡(luò)壓縮)來提升計算能效,同時盡可能少地降低計算性能和計算精度的損失。

  各個廠商紛紛在這兩個方向上發(fā)力 AI 芯片的研發(fā),當(dāng)然云端和移動端也無法截然分開。比如寒武紀(jì),此前研發(fā)的寒武紀(jì)深度學(xué)習(xí)處理器是面向大規(guī)模神經(jīng)網(wǎng)絡(luò)和多種機(jī)器學(xué)習(xí)算法的,而 2016 年推出的寒武紀(jì)1A處理器(Cambricon-1A)則是面向智能手機(jī)、安防監(jiān)控、可穿戴設(shè)備、無人機(jī)和智能駕駛等各類終端設(shè)備的。

  在云端,除了上文的英偉達(dá),英特爾在收購 Altera 之后推出了基于FPGA的專用深度學(xué)習(xí)加速卡,更收購了 Nervana,瞄準(zhǔn)為深度學(xué)習(xí)專門定做和優(yōu)化的 ASIC 芯片;收購了 Movidius,其高性能視覺處理芯片將補(bǔ)足英特爾在移動端 AI 芯片的缺失。另外還有 IBM 的類腦芯片 TrueNorth。當(dāng)然還有本文開頭講到的谷歌 TPU。日前,百度又正式推出了 XPU,它是基于百度 FPGA 的新一代 AI 處理架構(gòu),擁有GPU的通用性和FPGA的高效率和低能耗,對百度的深度學(xué)習(xí)平臺PaddlePaddle做了高度的優(yōu)化和加速。

  在移動端,谷歌、蘋果和三星等都在用專門的 AI 芯片構(gòu)建手機(jī)。微軟正在為增強(qiáng)現(xiàn)實耳機(jī)專門設(shè)計這樣的芯片。同時從科技巨頭谷歌到傳統(tǒng)車廠豐田,所有人都在進(jìn)行自動駕駛汽車的研發(fā),正需要能夠在移動端良好運(yùn)行的 AI 芯片。

  比如擅長底層架構(gòu)改進(jìn)的蘋果,其最新發(fā)布的 Apple X 采用了定制的芯片來處理人工智能工作負(fù)載。這是一個雙核的“A11 生物神經(jīng)網(wǎng)絡(luò)引擎”(A11 bionic neural engine)芯片,每秒運(yùn)算次數(shù)最高可達(dá)6000億次。該芯片賦能的最重要的事情就是使 Face ID 身份認(rèn)證功能能夠快速識別人臉,從而解鎖 iPhone X 或進(jìn)行購物。

  芯片走向定制化,以滿足AI軟件的需求,在行業(yè)中已經(jīng)變成一股新的大趨勢。谷歌已經(jīng)設(shè)計了兩代芯片來處理數(shù)據(jù)中心的AI計算工作負(fù)載。 微軟也為未來版本的 HoloLens 混合現(xiàn)實頭盔開發(fā)了一款A(yù)I芯片。在iPhone上安裝新的專用芯片意味著主芯片的工作量將會減少,從而提高電池壽命。 否則,例如,通過手機(jī)攝像頭進(jìn)行物體識別同時進(jìn)行視頻錄制時,可能會迅速地將電池消耗完。此外,在不久的將來, iPhone以外的更多移動設(shè)備都可能包含針對AI的處理器。

  又如華為。在德國IFA 2017舉辦期間,華為正式發(fā)布全球首款人工智能移動計算平臺麒麟970。華為方面表示,這一帶有強(qiáng)大AI計算力的手機(jī)端移動計算平臺,是業(yè)界首顆帶有獨(dú)立NPU(Neural Network Processing Unit)專用硬件處理單元的手機(jī)芯片。 創(chuàng)新性集成NPU專用硬件處理單元,創(chuàng)新設(shè)計了HiAI移動計算架構(gòu),其AI性能密度大幅優(yōu)于CPU和GPU。相較于四個Cortex-A73核心,處理相同AI任務(wù),新的異構(gòu)計算架構(gòu)擁有約 50 倍能效和 25 倍性能優(yōu)勢,圖像識別速度可達(dá)到約2000張/分鐘。麒麟970高性能8核CPU,對比上一代能效提高20%。率先商用 Mali G72 12-Core GPU,與上一代相比,圖形處理性能提升20%,能效提升50%,可以更長時間支持3D大型游戲的流暢運(yùn)行。

  此外,中國也有幾家公司在進(jìn)行 AI 芯片的研發(fā)。此前騰訊發(fā)布的 AI 產(chǎn)業(yè)報告指出,AI 芯片作為產(chǎn)業(yè)核心,也是技術(shù)要求和附加值最高的環(huán)節(jié),產(chǎn)業(yè)價值和戰(zhàn)略地位遠(yuǎn)遠(yuǎn)大于應(yīng)用層創(chuàng)新。而在這一點(diǎn)上,中國和美國的差距還很大。報告顯示,從基礎(chǔ)層的芯片企業(yè)數(shù)量來看,中國擁有14家,美國33家,中國僅為美國的42%。

  國內(nèi)在 AI 芯片研發(fā)表現(xiàn)突出的企業(yè),除上文介紹的寒武紀(jì)外,還有推出具備深度學(xué)習(xí)人工智能的嵌入式視頻采集壓縮編碼系統(tǒng)級芯片“星光智能一號”的中星微電子,致力于軟硬件一體化解決方案的地平線機(jī)器人,以及打造了“深度學(xué)習(xí)處理單元”(Deep Processing Unit,DPU)的深鑒科技。深鑒科技的目標(biāo)是以 ASIC 級別的功耗,達(dá)到優(yōu)于 GPU 的性能,目前第一批產(chǎn)品基于FPGA平臺。

  美國國防部研究部門 Darpa 的項目經(jīng)理吉爾·普拉特(Gill Pratt)表示,這種向?qū)I(yè)芯片和新的計算機(jī)架構(gòu)轉(zhuǎn)型的趨勢可能導(dǎo)致人工智能芯片的“寒武紀(jì)爆炸”。正如他所看到的那樣,將計算量擴(kuò)展到大量微小的低功耗芯片,以使機(jī)器可以像人類的大腦一樣運(yùn)行,這樣就有效地利用了能量。