技術(shù)
導(dǎo)讀:零售場(chǎng)景的分散化和多變性給新技術(shù)帶來了莫大考驗(yàn),也讓市場(chǎng)更加不確定。人工智能視覺能否被一片傳統(tǒng)土地接納,這是場(chǎng)復(fù)雜得多的踐行。
“我們相信零售會(huì)成為我們第15個(gè)營(yíng)收過千萬的行業(yè)。”商湯集團(tuán)總經(jīng)理尚海龍說。
近三年,商湯代表的計(jì)算機(jī)視覺公司以算法和更高的精準(zhǔn)度打破海康、大華等傳統(tǒng)巨頭的藩籬,闖入相對(duì)封閉的安防領(lǐng)域。
隨著安防市場(chǎng)的紅?;?,恰逢線下零售的升級(jí)換代,2017年下半年,視覺技術(shù)里大小玩家紛紛押注零售,安防領(lǐng)域的AI明星在思量這會(huì)不會(huì)成為下一個(gè)高地,在小眾領(lǐng)域耕耘已久的潛力股,也在期盼得到走向臺(tái)前的機(jī)會(huì)。
“通過技術(shù)賦能效果展現(xiàn)了以后,我相信整個(gè)零售行業(yè)真正進(jìn)入了從商品或服務(wù)來要利潤(rùn),轉(zhuǎn)成向數(shù)據(jù)要利潤(rùn),大家能夠意識(shí)到數(shù)據(jù)的價(jià)值,這個(gè)意識(shí)的轉(zhuǎn)變是偉大的。”
但是零售場(chǎng)景的分散化和多變性給新技術(shù)帶來了莫大考驗(yàn),也讓市場(chǎng)更加不確定。人工智能視覺能否被一片傳統(tǒng)土地接納,這是場(chǎng)復(fù)雜得多的踐行。
看清人臉是基本功
顧客在閘門前面對(duì)攝像頭站定,數(shù)秒后連接攝像頭的屏幕上出現(xiàn)機(jī)器采集的人臉,即完成身份認(rèn)定,購(gòu)物結(jié)束再次刷臉可支付離店。在蘇寧體育Biu門店里,這張臉也正是用戶的逛街ID,攝像頭以及背后的機(jī)器兢兢業(yè)業(yè)地記錄著:男,25歲,在耐克鞋前停留時(shí)間較長(zhǎng),購(gòu)買了一頂鴨舌帽。
蘇寧Biu的視覺解決方案由商湯提供,對(duì)于CV(即:計(jì)算機(jī)視覺 computer vision)明星公司而言,識(shí)別人臉乃看家本領(lǐng)。2014年,商湯創(chuàng)始人湯曉鷗的聯(lián)合實(shí)驗(yàn)室用20萬人臉數(shù)據(jù)達(dá)到98.52%準(zhǔn)確率的成績(jī),超越人眼,在業(yè)界一炮而紅,之后,商湯以技術(shù)優(yōu)勢(shì)殺入資金充沛、需求剛性的安防市場(chǎng)。
“圖像四小龍”商湯、依圖、曠視、云從發(fā)展路徑類似,去年都完成數(shù)億元融資。三四年前,全國(guó)安防設(shè)備產(chǎn)生的海量數(shù)據(jù)亟待處理分析,比如如何在火車站的人海中扒出流竄的犯罪嫌疑人,把持政府項(xiàng)目的傳統(tǒng)巨頭卻無力消化,人工智能視覺“趁機(jī)而入”。
2017年,尤其是下半年,隨著新零售、智慧零售的概念落地,視覺明星們也陸續(xù)殺入其中,包括商湯、曠視、依圖、圖普、閱面等等。它們以“刷臉進(jìn)場(chǎng)“和“刷臉支付”占到一席之位,商湯與蘇寧聯(lián)手,曠視拿下了阿里巴巴的淘咖啡,圖普把技術(shù)鋪到了天福超市、EasyGo以及OPPO……
兩項(xiàng)功能被廣泛應(yīng)用于無人門店和升級(jí)改造中的傳統(tǒng)零售店,這也是目前視覺技術(shù)最被熟知的功能,最直接的效果是可以簡(jiǎn)化收銀環(huán)節(jié),節(jié)約成本。
當(dāng)然,初出茅廬,在陌生的零售場(chǎng)域打拼容易么?
“AI不具備普適性,沒有萬能的,不同場(chǎng)景對(duì)算法的要求不一樣。相比安防和金融,零售的場(chǎng)景太復(fù)雜多變了。”一位視覺產(chǎn)品經(jīng)理感嘆道。
據(jù)透露,目前的刷臉技術(shù)其實(shí)相對(duì)簡(jiǎn)單?!笆袌?chǎng)上提供的算法多是正面底庫(kù)識(shí)別,這種門禁模型做線下零售是有一定的問題。線下零售要做到無感知,可能不是通過注冊(cè)的人臉做識(shí)別,而是第一次進(jìn)店的抓拍作為底庫(kù),可能光線不好,可能有遮擋,可能是側(cè)臉,這就需要專門的訓(xùn)練?!?/p>
尤其是涉及支付環(huán)節(jié),必須人為設(shè)置固定的靜態(tài)場(chǎng)景,強(qiáng)制要求消費(fèi)者配合,即便是人臉識(shí)別老大商湯所搭建的蘇寧Biu店也依托于閘門。
“現(xiàn)在謹(jǐn)慎一點(diǎn)的,像各大銀行ATM刷臉取款增加六位密碼確認(rèn);大膽一點(diǎn)的,像蘇寧門口有閘機(jī),結(jié)賬一個(gè)個(gè)排隊(duì),這樣支付環(huán)境有固定的靜態(tài)場(chǎng)景,準(zhǔn)確率基本可以做到百分之百。大量的動(dòng)態(tài)比對(duì)會(huì)成問題?!鄙泻}堈f。
理論上,機(jī)器視覺不是沒辦法抓取非配合條件下的動(dòng)態(tài)人臉,火車站里抓捕逃犯就涉及到人臉檢測(cè)、特征提取、比對(duì)多項(xiàng)技術(shù),機(jī)器先在一幀視頻中框出所有的人臉,然后挨個(gè)與公安機(jī)關(guān)的照片數(shù)據(jù)庫(kù)對(duì)照。但問題在于,場(chǎng)景的變化要求對(duì)算法同步調(diào)整優(yōu)化。
簡(jiǎn)24原本調(diào)用過外部的技術(shù),但后來選擇了自主研發(fā)。“并不是因?yàn)橥獠考夹g(shù)不好,在機(jī)場(chǎng)這種公共場(chǎng)所,能從茫茫人海當(dāng)中一眼把恐怖分子識(shí)別出來,產(chǎn)品挺牛的,但關(guān)鍵問題在于,第一,需要為我們的場(chǎng)景做優(yōu)化,任何的算法都要根據(jù)本地場(chǎng)景優(yōu)化才能達(dá)到最好的效果。第二,它們的訓(xùn)練人群和我們的不一樣。”創(chuàng)始人林捷透露。
同時(shí),人臉本身的局限性能否完全應(yīng)用于零售業(yè)也存在爭(zhēng)議。“我們認(rèn)為外部特征不能作為人的終生ID,或者綁定金融支付,很危險(xiǎn)的?!鄙钐m科技創(chuàng)始人陳海波說。他對(duì)自家的“不要臉運(yùn)動(dòng)”深以為豪,以掃手取代刷臉,掃的是靜脈、動(dòng)脈和毛細(xì)血管,以每一根血管的分叉點(diǎn)和點(diǎn)與點(diǎn)之間位置關(guān)系為特征值?!拔覀兊腘值達(dá)到4億(能與4億數(shù)據(jù)做對(duì)比,簡(jiǎn)單說,N值越高算法和算力越強(qiáng)),再加上4位手機(jī)號(hào)碼,做到了40億?!?/p>
公開數(shù)據(jù)顯示,商湯2017年有20億張人臉數(shù)據(jù),2億個(gè)體訓(xùn)練,達(dá)到9位密碼時(shí)代。
進(jìn)場(chǎng)之后,靠臉的可能性也不大了。
“一說到視覺技術(shù)就想到刷臉,其實(shí)這是最為簡(jiǎn)單基礎(chǔ)的功能?!绷纸菡f,“進(jìn)場(chǎng)之后拍不到人臉,靠體態(tài)識(shí)別這個(gè)人,知道他拿了什么商品,這比較難?!?/p>
業(yè)內(nèi)公認(rèn)的、視覺技術(shù)應(yīng)用的極致表現(xiàn)為Amazon Go,全程通過機(jī)器捕捉看了什么,拿走了什么,離店后自動(dòng)扣款,當(dāng)然,為確保準(zhǔn)確性,Amazon Go還采用了重力感應(yīng)器、二維碼、紅外感應(yīng)器等輔助技術(shù)。
深蘭于2016年4月發(fā)布了無人值守零售解決方案,陳海波告訴億邦動(dòng)力網(wǎng),人與貨關(guān)聯(lián)的算法極為復(fù)雜,“入場(chǎng)時(shí)采集到人的數(shù)據(jù),包括人的體型,頭到地面的距離,肩到地面的距離,這是一個(gè)綜合數(shù)據(jù),攝像頭一直在追蹤用戶。在商品區(qū)有一條無形的電子?xùn)艡?,手伸進(jìn)去以后觸發(fā)攝像頭開始抓取動(dòng)作。攝像頭以每秒30幀抓取手,當(dāng)觸及商品時(shí)每秒120幀, 同時(shí)實(shí)時(shí)去背,扣掉背景,讓攝像頭都集中看商品,更精準(zhǔn)判斷它是什么。”
“全程要調(diào)動(dòng)多個(gè)攝像頭協(xié)同監(jiān)控,實(shí)時(shí)調(diào)整每個(gè)攝像頭的權(quán)重。如果商品和背景一個(gè)顏色,那機(jī)器大腦也沒辦法了?!?/p>
你們這方案多少錢?
“零售毛利低,對(duì)每一筆投資都會(huì)非常謹(jǐn)慎。相應(yīng)而言,它是一定要看到效果才會(huì)投資。”尚海龍說。
從安防到零售,作為服務(wù)方的計(jì)算機(jī)視覺公司明顯感知到客戶預(yù)算的銳減。
比如,公安系統(tǒng)的視頻監(jiān)控方案并非適用一般的零售商,“它本身使用是公安內(nèi)網(wǎng),一個(gè)本地化的服務(wù)器集群,用物理服務(wù)器去承載所有的視頻流,服務(wù)對(duì)象的特性決定了方案的設(shè)計(jì)。”一位視覺從業(yè)者表示。
普通零售商針對(duì)視頻監(jiān)控則必須考慮:第一,本地加服務(wù)器,購(gòu)買服務(wù)器需要幾萬元,而且需要人維護(hù),還要防止偷盜丟失破損;第二,云加端,視頻流傳到云端處理方案的網(wǎng)絡(luò)帶寬成本加云端GPU服務(wù)成本也不低,傳輸至少一個(gè)720P或者一個(gè)高清碼流,帶寬少說要4M,一個(gè)CPU服務(wù)器,大概阿里是500塊錢一年,GPU是3000塊錢一年;第三,壓縮視頻流上傳云端,會(huì)丟幀失真,效果很差。
“政府項(xiàng)目可以說不計(jì)成本,以達(dá)到最好的效果,這和商業(yè)的邏輯不一樣。
硬件占據(jù)方案成本中的大頭,包括GPU、相機(jī)以及各類感應(yīng)器等。
后臺(tái)分析是店里配備小型硬件處理站還是走云端,包括私有云、公有云還是混合云,廠商們提供了開放選擇。圖普負(fù)責(zé)零售產(chǎn)品的劉凱解釋稱,上不上GPU由客戶需求決定,云端分析處理的好處是及時(shí)性更強(qiáng),剛到店的客人馬上就能被識(shí)別出來,模型、程序的更新也是在云端完成,無需人工干預(yù),但是對(duì)網(wǎng)絡(luò)傳輸要求高;本地化分析則幾乎不占用忙時(shí)帶寬,在本地分析完后再在閑時(shí)將分析結(jié)果上傳到服務(wù)器。
“根據(jù)客戶實(shí)際的需求以及資源的限制來做選擇,沒有最好的,只有最適合的?!眲P說。
相機(jī)有原本線下就在用的幾百塊的普通攝像頭,也有動(dòng)輒上千的深度版,還有方案提供商自主設(shè)計(jì)的獨(dú)家產(chǎn)品。
普通相機(jī)是單目的,2D成像,而深度相機(jī)通過雙目或3D結(jié)構(gòu)光或加紅外模組實(shí)現(xiàn)3D效果,也就可以知道物體離相機(jī)多遠(yuǎn),當(dāng)然價(jià)格也更貴。
“我們現(xiàn)在用2D相機(jī),通過算法模擬3D,當(dāng)然,如果用深度相機(jī)模組可以更準(zhǔn),但成本太高了。”一位產(chǎn)品經(jīng)理表示。
原有的設(shè)備可以用起來?!霸瓉硪呀?jīng)投資過的東西我們不會(huì)進(jìn)行破壞性的損傷,攝像頭我們要200萬像素以上就可以,原來超市里已有的攝像頭直接就可以用,并聯(lián)進(jìn)我們的系統(tǒng)就可以。“尚海龍表示。
圖普向天福超市提供的改造方案正復(fù)用了原有攝像頭,對(duì)接CRM系統(tǒng)拿到會(huì)員頭像和消費(fèi)記錄,自動(dòng)識(shí)別VIP,精準(zhǔn)發(fā)送促銷廣告。
如何把握效果和成本之間的天平,是初來乍到玩家的必修課。
“如果不計(jì)成本的話,我們的精度早就上去了?!焙?jiǎn)24創(chuàng)始人林捷說。
簡(jiǎn)24是Amazon Go的國(guó)內(nèi)追隨者。Amazon Go由亞馬遜在2016年底發(fā)布,主打拿了就走、不需排隊(duì)的,引發(fā)業(yè)內(nèi)震撼。今年年初,亞馬遜從內(nèi)測(cè)正式向公眾開放,而經(jīng)過兩年的時(shí)間,技術(shù)圈和零售圈的人也都意識(shí)到這只是個(gè)“show case”,實(shí)在不具備大規(guī)模復(fù)制可能性。
根據(jù)公開報(bào)道,Amazon Go在160平米的空間里布置了上百個(gè)攝像頭,RGB和深度攝像頭結(jié)合,并采用了紅外線感應(yīng)器和重力感應(yīng)器,盛傳成本高達(dá)千萬美金。
推出了2.0版本的林捷用的是“幾百塊“的普通攝像頭,也不能布置太多,依靠算法迭代來提升精度。
“還是要回到商業(yè)的本質(zhì),攝像頭的價(jià)格和數(shù)量肯定對(duì)效果有影響,但是在零售場(chǎng)景下,成本太高根本不能收回投資,這個(gè)商業(yè)模式就不成立了?!绷纸菡f。
懂零售
一套設(shè)計(jì)方案中,算法、硬件、 場(chǎng)景互相適配,構(gòu)成一個(gè)完整的三角形。方案設(shè)計(jì)得是否符合“商業(yè)的邏輯”,很大程度上取決于對(duì)零售的理解程度。
零售是創(chuàng)新工場(chǎng)AI工程院今年的主打行業(yè),聯(lián)合創(chuàng)始人王晶表示,人工智能團(tuán)隊(duì)當(dāng)中要有行業(yè)專家,每次見客戶最長(zhǎng)的時(shí)間花在了解對(duì)方的實(shí)際業(yè)務(wù)上。
劉凱告訴億邦動(dòng)力網(wǎng),不同類型的零售商間差異會(huì)比較大,但即便同一類型的零售商客戶,在管理上的需求也存在很大差異。
“做家居的客戶會(huì)希望我們能按家庭的維度去識(shí)別客戶,而賣日用品的客戶可能更急迫于知道有哪些人是回頭客。在同類的零售商中,根據(jù)客戶自身管理目標(biāo)的不同,共性的需求也會(huì)在指標(biāo)要求上有差異,如對(duì)準(zhǔn)確率、召回率的要求有所不同,差異化的個(gè)性化需求,未必在整個(gè)行業(yè)間通用。”劉凱說。
王晶認(rèn)為,方案的優(yōu)劣不僅取決于算法,很多時(shí)候是工程上的問題?!氨热?,要從用戶的整個(gè)流程體驗(yàn)的角度考慮,怎樣有一個(gè)很好的結(jié)賬流程,讓用戶感覺更順暢,反之不管技術(shù)多炫酷,如果用戶不舒服,商家都不會(huì)買單的?!?/p>
深蘭在克制技術(shù)的無限延展?!肮褡涌梢灾谎b四個(gè)攝像頭或者六個(gè)攝像頭,攝像頭多了,GPU算力需求比較大,成本高。基本上你故意要偷也能偷走,但是問題是大多數(shù)人正常購(gòu)買,而且如果貨少了,我們調(diào)取視頻也會(huì)發(fā)現(xiàn),還和其他公司共享信用,偷竊查出來后就上黑名單了?!标惡2ń榻B。
即便Amazon Go也有針對(duì)零售場(chǎng)景而變通的一面。其貨架使用的重力感應(yīng)器其實(shí)存有隱患,理論上,小偷可以快速把商品替換成其他東西(比如一袋沙子)而不被發(fā)現(xiàn),不過考慮到這是多人同在的場(chǎng)景,類似的偷盜實(shí)施起來比較困難也就忽略了。
林捷總結(jié)出來一套經(jīng)驗(yàn):不要讓技術(shù)花時(shí)間在運(yùn)營(yíng)能夠解決的問題上。“幾十個(gè)人擠在柜臺(tái)前結(jié)賬,這樣的場(chǎng)景就不要讓視覺科學(xué)家去研究了,機(jī)器分不清楚誰買了什么,就讓顧客排隊(duì)好了?!边@些取舍建立在零售業(yè)的理解上,技術(shù)大咖補(bǔ)課不足就容易掉坑?!坝械?方案)為了做到更好的商品識(shí)別效果,會(huì)加高貨架的層高,降低層數(shù),一般貨架有5到6層,變成了4層?!绷纸輳?qiáng)調(diào),這是損傷便利店平效的本末倒置,“如果了解零售,絕對(duì)不會(huì)在技術(shù)設(shè)計(jì)上犧牲平效的。”
商品識(shí)別方興未艾
要實(shí)現(xiàn)對(duì)人貨關(guān)系互動(dòng)的記錄以及無人結(jié)算,繞不開談商品識(shí)別。這也是視覺科學(xué)家在爭(zhēng)奪的新高地,“前幾年我們刷榜刷的都是人臉,刷爛了,現(xiàn)在物體是最難的?!币晃粯I(yè)內(nèi)人士透露。
去年,曠視參加了COCO競(jìng)賽的物體檢測(cè)、人體關(guān)鍵點(diǎn)和物體分割三個(gè)單項(xiàng)比賽,獲得兩個(gè)第一和一個(gè)第二。碼隆科技取得了 WebVision競(jìng)賽的第一名。
相比人臉識(shí)別,商品識(shí)別還徘徊在起跑線上。傳統(tǒng)商超、便利店和品牌店升級(jí)改造,都一般采用條形碼、RFID這些“老古董”技術(shù),即便繽果盒子這樣的創(chuàng)新項(xiàng)目也啟用了RFID。
“因?yàn)镽FID是一個(gè)比較偏成熟的方案,最早選擇它在創(chuàng)業(yè)上是make sense(說得通)的。圖像識(shí)別技術(shù)可能更領(lǐng)先、挑戰(zhàn)更大?!比A映資本投資總監(jiān)姜志峰說。
總得來說,人臉相對(duì)標(biāo)準(zhǔn)化,可以把人種作為單獨(dú)訓(xùn)練模型,而零售涉及的商品SKU多而雜,每個(gè)類別單獨(dú)訓(xùn)練難度大,不可控性更高。機(jī)器識(shí)別每張照片的基本邏輯是:每張照片有向量,即多組數(shù)字,某幾個(gè)組合起來代表袖長(zhǎng)、顏色、款式等特征,機(jī)器根據(jù)數(shù)字判斷自己“看見”的是啥。但是,如衣服這種柔性物體易變形,不同穿法或者扭曲、折疊在圖片中像素排列不同,讓計(jì)算機(jī)明白它們是同一件的不同形態(tài)很難。
此外,現(xiàn)在人臉識(shí)別已經(jīng)可以把算法做到手機(jī)里,比如刷臉解鎖,而物體識(shí)別暫時(shí)還要基于GPU或者X86這種高性能的硬件架構(gòu),成本較高。
“WebVision競(jìng)賽上李飛飛給我們頒的獎(jiǎng)?!贝a隆創(chuàng)始人黃鼎龍強(qiáng)調(diào)。
和曠視不一樣,物體識(shí)別是碼隆們安身立命的根本。此外,國(guó)內(nèi)市場(chǎng)上頭部玩家還有衣+、Visenze。
與人臉識(shí)別早早收割了安防的麥田不同,商品識(shí)別長(zhǎng)時(shí)間以來被認(rèn)為應(yīng)用場(chǎng)景不明確,空有技術(shù)難變現(xiàn),玩家們?cè)诼L(zhǎng)的商業(yè)化探索中走出了不同的萬里長(zhǎng)征。
三家業(yè)務(wù)都在電商上下了大力氣。碼隆和衣+最初做的都是以以圖搜圖為核心的to C產(chǎn)品,類似淘寶“拍立搜”,后來轉(zhuǎn)向2B服務(wù),一個(gè)建立了Product AI平臺(tái),將識(shí)別能力開放給電商平臺(tái)、品牌、圖庫(kù)等商家;另一個(gè)則鎖定了媒體和大屏等,比如,在優(yōu)酷視頻上即看即買,跳轉(zhuǎn)進(jìn)入淘寶購(gòu)物,即通過衣+的技術(shù)實(shí)現(xiàn)。
“線上的調(diào)用量在緩慢增長(zhǎng)?!秉S鼎龍說,從碼隆的經(jīng)驗(yàn)拉里看,線上市場(chǎng)有需求,但不會(huì)迅速爆發(fā)。為更快打開市場(chǎng),碼隆還把精力投向商家后端,比如,利用圖像識(shí)別技術(shù)實(shí)現(xiàn)一鍵生成產(chǎn)品詳情頁功能。
黃鼎龍認(rèn)為,經(jīng)過幾年的數(shù)據(jù)積累和算法迭代,加之新零售風(fēng)潮愈來愈熱鬧,商品識(shí)別應(yīng)用于線下的機(jī)會(huì)到了。
“這個(gè)事情能不能成立取決于是否useable(可用的)和useful(有用的),一方面,在技術(shù)上要達(dá)到基本可用的狀態(tài),這是很重要的前提條件,別人試了不work就不行;另一方面,也得有用,17年隨著零售領(lǐng)域的(興起),大家開始覺得有用?!包S鼎龍說。
Yi+也在向線下零售進(jìn)發(fā),無人店和快消品品牌是其目前主要客戶群體?!拔覀兊臄?shù)據(jù)積累,和客戶建立起的反饋機(jī)制,都是難以短時(shí)間跨越壁壘?!盰i+產(chǎn)品負(fù)責(zé)人說。
不過,Visenze的興趣還不大,它總部在新加坡,主要為海外客戶提供以圖搜圖技術(shù),例如樂天、H&M等。
CTO李廣達(dá)認(rèn)為,計(jì)算機(jī)視覺技術(shù)還沒有達(dá)到大范圍應(yīng)用于實(shí)體零售的程度?!坝?jì)算機(jī)視覺有mission critical(關(guān)鍵任務(wù))和非mission critical兩種場(chǎng)景,區(qū)別在于效果的可信度。攝像頭解決方案可以一定程度上提升效率,但是有些場(chǎng)景還不能完全信任?!?/p>
他認(rèn)為,電商環(huán)境的以圖搜圖是典型的非mission critical(關(guān)鍵任務(wù))場(chǎng)景。盡管當(dāng)涉及到一些細(xì)節(jié)屬性,比如顏色、領(lǐng)子類型、袖子長(zhǎng)短等等,準(zhǔn)確度會(huì)打折扣,但這可以慢慢打磨。
大而無當(dāng)還是前途無量?
商品識(shí)別是不是真的“useful”,即能否商業(yè)化、是否值得研究尚存爭(zhēng)議。
圖普科技和商湯暫時(shí)都還未涉及?!皬S商對(duì)這方面熱情還比較高,但可能需求不夠聚焦,如何深度結(jié)合實(shí)際業(yè)務(wù)還需要探討?!眲P說。圖為使用RFID的CITYBOX。
“商品的識(shí)別有一些創(chuàng)業(yè)公司在做,術(shù)業(yè)有專攻,市場(chǎng)這么大,我們做好自己的事情就好了。我個(gè)人判斷它(機(jī)器視覺識(shí)別商品)的價(jià)值意義沒那么大?!鄙泻}埥榻B稱,蘇寧Biu店賣球鞋、運(yùn)動(dòng)衣,感應(yīng)電子標(biāo)簽(RFID)即可結(jié)賬。
RFID在服裝行業(yè)尤其受到歡迎?!耙曈X技術(shù)可能在某些產(chǎn)品上取代RFID,服裝可能比較難?!榜R克華菲CIO兼任電商總經(jīng)理左敬東說。
馬克華菲有100多家智慧門店,商品配置RFID標(biāo)簽,通過物聯(lián)網(wǎng)識(shí)別器,消費(fèi)者試穿衣服時(shí)站到智能試衣鏡前,大屏可自動(dòng)識(shí)別商品ID,向消費(fèi)者展示模特試穿效果、產(chǎn)品介紹、評(píng)價(jià)、相關(guān)搭配等內(nèi)容。
除了前端展示,RFID在后端零售庫(kù)存管理上優(yōu)勢(shì)明顯?!罢iT店進(jìn)行庫(kù)存盤點(diǎn),3000件衣服,2個(gè)人,原來需要半天到1天時(shí)間。利用RFID芯片,用掃描槍片式感應(yīng)進(jìn)行群讀掃描,1個(gè)人,僅需15分鐘就能完成全部盤點(diǎn)?!币鹇腹緟R美CMO肖海坤表示。
不過,RFID也有未解決的難題:每件商品都要加貼至少三四毛錢的標(biāo)簽,人工和材料成本高,且遇金屬和液體等不識(shí)別或效果差。
除了機(jī)器視覺和RFID,市面上的還有消費(fèi)者自己拿商品掃碼結(jié)賬、重力感應(yīng)等方案。如下圖物美超市的自助收營(yíng)臺(tái)。
“掃碼對(duì)商戶來說成本低且簡(jiǎn)單,但建立在信用基礎(chǔ)上,盜損大,且顧客自己動(dòng)手影響用戶體驗(yàn)。重力感應(yīng)是老技術(shù)在零售領(lǐng)域的新應(yīng)用,無法判斷具體哪件商品,知道哪個(gè)貨架被動(dòng)過?!?/p>
陳海波本人是機(jī)器視覺忠實(shí)擁護(hù)者,“未來商店一定是沒有營(yíng)業(yè)員,商品、編碼、條形碼不存在,商品一定要能夠被遠(yuǎn)距離非接觸識(shí)別。”
不單單是未來,也有人已然找到了細(xì)分場(chǎng)景的即時(shí)需求。
王晶認(rèn)為不能用RFID的場(chǎng)景也是機(jī)器視覺的機(jī)會(huì),比如蛋糕店,“蛋糕都是用盤盛的,怎么貼標(biāo)簽?”還有超市的自助稱重機(jī)也可以改用視覺識(shí)別,因?yàn)椤霸陲@示屏的一頁頁商品中區(qū)分查找蛇果和富士蘋果的體驗(yàn)很差”。
國(guó)外還有專門從事快消品貨架識(shí)別的Trax,在全球50個(gè)國(guó)家有175個(gè)客戶,不乏可口可樂、百威、雀巢、漢高、百事這樣的大品牌,每月處理2.5億的SKU產(chǎn)品。
剛剛就任中國(guó)區(qū)負(fù)責(zé)人的王茜介紹,Trax已形成“交鑰匙”式解決方案:兩米多的貨架只需一個(gè)成本“幾美金”的攝像頭,品牌商使用手機(jī)拍照即可。
最基本的,品牌商銷售代表把貨架照片上傳至云端解析,監(jiān)督門店;零售商安裝固定攝像頭,實(shí)時(shí)監(jiān)測(cè)動(dòng)態(tài)變化;也可以在冰箱上裝上小小的攝像頭,每開關(guān)一次拍攝一張照片,記錄銷售情況。Trax聲稱,服務(wù)的快消品公司斷貨率下降10%到15%,整體銷售業(yè)績(jī)提升3%到5%。
Trax核心市場(chǎng)在美國(guó),今年1月正式進(jìn)入中國(guó),目標(biāo)三年內(nèi)中國(guó)市場(chǎng)年收入達(dá)到1億美元。
用視覺技術(shù)識(shí)別貨架商品在國(guó)內(nèi)少見,土生土長(zhǎng)的Yi+也打算深耕?!皣?guó)內(nèi)的快消公司相對(duì)傳統(tǒng),我們的本土優(yōu)勢(shì)比較明顯,而且以服飾和商品識(shí)別起步,在零售方面也有優(yōu)勢(shì)?!变N售負(fù)責(zé)人稱。
他表示,貨架識(shí)別在國(guó)內(nèi)處于空白狀態(tài),快消品公司也有迫切需求?!八鼈円话阈枰虺谢蛘唛T店交納進(jìn)場(chǎng)費(fèi),獲取貨架數(shù)據(jù)非常關(guān)鍵,很關(guān)心自己的貨擺得好不好,銷售量好不好,每天有什么變化,之前都沒辦法及時(shí)統(tǒng)計(jì)。”
當(dāng)然,蛋糕店和超市愿不愿意買創(chuàng)新工場(chǎng)的視覺方案,Trax能不能賺到1億美元,Yi+能不能成功挖掘到本土客戶,這些都將被2018年所檢驗(yàn)。
“我們希望通過AI降本增效,如果兩點(diǎn)都能做到的話,我們就會(huì)把它商業(yè)化落地,如果最后得出的結(jié)論是用視覺無法真的做到的話,可能就不會(huì)做類似的產(chǎn)品。頂多做點(diǎn)展示,表明我們有這個(gè)能力而已。”正在關(guān)注商品識(shí)別的計(jì)算機(jī)視覺產(chǎn)品經(jīng)理說。
技術(shù)賣給誰?
陳海波喜歡向投資人就什么零售項(xiàng)目值得投提建議,他本身確實(shí)也在密切關(guān)注,因?yàn)檫@決定了技術(shù)要賣給誰。
他認(rèn)為,AI技術(shù)提供方人力成本高昂,必須要接規(guī)?;捻?xiàng)目,而單個(gè)項(xiàng)目不值得投入?!叭绻蛻糸_一個(gè)店做秀,沒有意義的。我們要拿下市場(chǎng),就必須找到具備成千上萬臺(tái)采購(gòu)量的商家。我們的科學(xué)家很貴的,不值得為一次性項(xiàng)目投入。”
目前市場(chǎng)上的采購(gòu)方從形態(tài)上看有貨架、冰柜、無人BOX創(chuàng)業(yè)公司,也有便利店、商超、賣場(chǎng)等傳統(tǒng)零售商,不同類型的門店客流量不同,SKU不同,需求也千差萬別。
無人店是市場(chǎng)上的主力買家,其核心需求在于離店的身份識(shí)別和收銀結(jié)算兩大項(xiàng)技術(shù),以多金、舍得砸錢給技術(shù)公司留下深刻印象。
“互聯(lián)網(wǎng)公司是資本燒錢模式,重效果,不太講成本,要上最好的設(shè)備。”一位產(chǎn)品經(jīng)理透露。
不過,陳海波放出話不愿意接無人BOX的活兒?!拔覀冋{(diào)研過,根本不賺錢,短期內(nèi)也難以規(guī)?;_店,中國(guó)的零售店已經(jīng)很多了,沒有那么大的市場(chǎng)空間,不是那么多地方需要?!?/p>
深蘭現(xiàn)在的業(yè)務(wù)重心在貨架和自動(dòng)販賣機(jī)的改造上:增加視覺技術(shù),即拿即走,解決盜損問題,把它們變成貨柜或者風(fēng)幕柜,出售毛利率更高的鮮食、水果和便當(dāng)。
參考日本市場(chǎng),中國(guó)自動(dòng)販賣機(jī)的潛力還未被完全激發(fā)。而貨架相比其他零售形態(tài)與消費(fèi)者距離更短,也算進(jìn)步。但是,技術(shù)方案商們對(duì)貨架智能化節(jié)點(diǎn)是否到達(dá)的看法還不統(tǒng)一:低門檻、弱技術(shù)的貨架正忙于搶位,真的有時(shí)間和金錢顧及把自己升級(jí)為智能化產(chǎn)品?
不可否認(rèn),創(chuàng)業(yè)公司愿意嘗試新技術(shù),但技術(shù)也是它們區(qū)別于傳統(tǒng)玩家、立足市場(chǎng)的核心。簡(jiǎn)24選擇自主研發(fā),繽果盒子也發(fā)布了以視覺、傳感器、超聲波多項(xiàng)技術(shù)替代RFID的解決方案,并聲稱已引入全球頂級(jí)人工智能專家,正與國(guó)內(nèi)重點(diǎn)211院校合作共建國(guó)際人工智能實(shí)驗(yàn)室。
一邊是火焰,另一邊則是冰山。
相比創(chuàng)業(yè)公司對(duì)新技術(shù)的熱情,傳統(tǒng)零售被吐槽“感興趣看看”、“掏錢欲望不強(qiáng)”。雖然此類玩家有大把的“試驗(yàn)田”,但看過花花綠綠的PPT和demo視頻,再親自與技術(shù)提供方談一談,心便涼了。
當(dāng)然,一位曾試圖采購(gòu)視覺技術(shù)的品牌操盤手也抱怨:“幾平米地方的改造要好幾萬,還省不了一個(gè)員工,我干嘛要做?”
業(yè)內(nèi)人士介紹,目前人工智能在降低成本和提升業(yè)績(jī)上還不能發(fā)揮顯著作用,難以被零售商真正地落地采購(gòu)。原因在于,算法優(yōu)化是一個(gè)長(zhǎng)周期的、需要“活數(shù)據(jù)”的過程:先有一套標(biāo)準(zhǔn)算法,然后找場(chǎng)景落地,之后數(shù)據(jù)回流,再對(duì)回流的數(shù)據(jù)做算法的差異化訓(xùn)練。甚至有人推測(cè),整個(gè)模型跑通至少需要三年時(shí)間。
“現(xiàn)階段零售業(yè)對(duì)視覺技術(shù)的認(rèn)知還不足,預(yù)期或過高或過低,而前者占大多數(shù)。”Yi+產(chǎn)品負(fù)責(zé)人表示。
從算法模型優(yōu)化的角度講,傳統(tǒng)的連鎖商超、品牌店、便利店都是不錯(cuò)的標(biāo)的。無人店數(shù)量太少;賣場(chǎng)雖然規(guī)模大,但是洶涌的人流對(duì)機(jī)器運(yùn)算造成不小壓力。
“說實(shí)話,現(xiàn)在的項(xiàng)目是賠錢做的,我們的目的還是和客戶一起成長(zhǎng)?!币晃粡臉I(yè)者坦言。
“對(duì)于大部分AI公司來說,數(shù)據(jù)其實(shí)挺難拿的,一方面要有客戶愿意一起優(yōu)化,另一方面,投入的人力也相當(dāng)可觀,需要研究人員來做單獨(dú)訓(xùn)練。“另一位業(yè)內(nèi)人士說。
王晶表示,數(shù)據(jù)量太小的店不是早期階段最理想的案例,優(yōu)先從AI能夠帶來更大效應(yīng)的連鎖店開始,而且線下門店在線化程度低,很多時(shí)候要重新開始積累數(shù)據(jù)?!坝械膫鹘y(tǒng)門店P(guān)OS機(jī)版本太低,以前的數(shù)據(jù)都無法調(diào)取。”
AI公司通常被認(rèn)為核心競(jìng)爭(zhēng)點(diǎn)在于算法、數(shù)據(jù)和算力,而事實(shí)上落地能力也是重中之重?!安荒芎鲆暤氖?,用戶反饋機(jī)制完善度非常重要,你多久拿到用戶新的反饋,從而修改你的方法,節(jié)奏是怎么樣的,有沒有建立自動(dòng)的傳輸流程?!盰i+產(chǎn)品負(fù)責(zé)人稱。
這也意味著AI公司搶占市場(chǎng)的速度異常重要?!叭绻捌谟眉夹g(shù)優(yōu)勢(shì)解決一個(gè)商家比較著急的問題,建立起信任,然后大家一起優(yōu)化方案,如果這個(gè)流程開始跑起來,其他人進(jìn)入就比較難。”
終極目標(biāo)是分析預(yù)測(cè)
“前端獲取了數(shù)據(jù)之后的東西特別重要,可以幫助門店做銷量預(yù)測(cè)、選品建議、個(gè)性化營(yíng)銷?!蓖蹙дf。
王晶表示,人工智能的作用不僅僅在于節(jié)省人力成本,而且可以把線下用戶行為轉(zhuǎn)為在線化的數(shù)據(jù),有了數(shù)據(jù)可以幫零售店主做更多的事情。
一位業(yè)內(nèi)人士講解道,AI的落地分為感知、理解、推理關(guān)系三個(gè)環(huán)節(jié),直到可以告訴人該怎么做的時(shí)候才是AI真正有價(jià)值的時(shí)候。
王晶說,像7-11這樣的便利店選品很大程度上依賴于店長(zhǎng)的個(gè)人經(jīng)驗(yàn),以銷售數(shù)據(jù)為出發(fā)點(diǎn),結(jié)合第二天的天氣和周邊環(huán)境等情況預(yù)判消費(fèi)心理并訂貨,而人工智能可以綜合更多因素做出智能化決策。
“通過攝像機(jī)等傳感器,店主可以掌握消費(fèi)者全流程的行為,消費(fèi)者從進(jìn)店起就被識(shí)別出了是誰,是不是會(huì)員,店內(nèi)看了哪些東西,對(duì)哪些產(chǎn)品感興趣,在哪個(gè)區(qū)交互多,結(jié)賬時(shí)買走了什么東西。”
目前,市面上的視覺方案也引入了大量客戶分析功能,比如,客戶畫像、客流統(tǒng)計(jì)、熱點(diǎn)分析、動(dòng)線規(guī)劃等等。
在圖普科技的一個(gè)公開案例中,某大型餐飲連鎖每天晚上在8點(diǎn)半組織營(yíng)銷活動(dòng),經(jīng)過圖普科技的重新統(tǒng)計(jì)尋找人流量最高的時(shí)段,圖普科技通過數(shù)據(jù)分析發(fā)現(xiàn)8點(diǎn)30分比8點(diǎn)45分差了10%的人流,比9點(diǎn)差了15%的人流?!巴瑯拥某杀就度肭闆r下,選錯(cuò)了最有概率出現(xiàn)最多人的時(shí)間點(diǎn),長(zhǎng)此以往會(huì)有很大損失?!眻D普科技CEO李明強(qiáng)說。
基本各家官網(wǎng)和PPT都有類似的案例,但是也存在質(zhì)疑:這些過渡性功能一定要通過視覺技術(shù)來解決嗎?
“客流分析不是這波視覺技術(shù)帶來的,十年前就有解決方案了。”一位業(yè)內(nèi)人士坦言。
比如,大型商場(chǎng)用AP采集數(shù)據(jù),統(tǒng)計(jì)客流數(shù)量,通過MAC地址反向做人群畫像。早在2014年銀泰就推廣智能機(jī)采集用戶身份,大數(shù)據(jù)公司據(jù)此提供標(biāo)簽,從而實(shí)現(xiàn)精準(zhǔn)營(yíng)銷。
此外,紅外、藍(lán)牙、雙目視頻分析都是相對(duì)成熟的信息收集手段。
百安居去年在上海使用天貓的解決方案推出了首家智慧門店,公開信息中視覺技術(shù)中只有人臉識(shí)別,未提到對(duì)身體、動(dòng)作的識(shí)別,而據(jù)天貓電器的高級(jí)專家吉家在演講中透露大量使用了藍(lán)牙定位技術(shù)?!霸谡麄€(gè)接近一萬平的場(chǎng)內(nèi)放了很多藍(lán)牙,整個(gè)過程你在哪個(gè)模塊哪個(gè)區(qū)間關(guān)注什么都可能會(huì)被記錄。”
有業(yè)內(nèi)人士表示,傳統(tǒng)方法在精度和顆粒度上不如視覺檢測(cè),但憑借低成本可能會(huì)分流走客戶。
同時(shí),現(xiàn)有視覺技術(shù)尚未給客流分析在效果上帶來質(zhì)的提升,比如,熱點(diǎn)識(shí)別可以確定某個(gè)貨架或者區(qū)域人多,但又無法落實(shí)到具體商品上面。
“現(xiàn)在核心是要把數(shù)據(jù)收集起來,不在乎用的是更傳統(tǒng)的方法,還是說更高端?!盰i+產(chǎn)品負(fù)責(zé)人指出。
當(dāng)然,視覺技術(shù)提供商也可以引入視覺以外的、已成熟的技術(shù)和產(chǎn)品。圖普科技的角色在向集成商靠攏,涉及畫像識(shí)別、滯留時(shí)長(zhǎng)、跨天跨門店回訪識(shí)別、軌跡追蹤、熱力圖、自定義報(bào)表、支付人臉綁定等,也有完整的產(chǎn)品形態(tài),包括web,小程序和API接口。
集成商也是計(jì)算機(jī)視覺公司的一個(gè)發(fā)展方向,否則有可能成為CRM、POS等傳統(tǒng)零售服務(wù)商的一個(gè)分支而已。不過,集成商對(duì)客戶資源、整合能力要求很高,而且創(chuàng)新工場(chǎng)、阿里巴巴、騰訊等大玩家都在向其靠攏。
當(dāng)然,總體而言,線下零售還只是大多視覺公司撒出去的眾多種子之一,金融、醫(yī)療、汽車等諸多行業(yè)也在開花結(jié)果,要不要真的扎根零售還沒有定論,畢竟圖普科技負(fù)責(zé)零售的產(chǎn)品和銷售大概二十個(gè)人,商湯的零售銷售只有兩人。
“現(xiàn)在是相互挑戰(zhàn)的過程,類似商湯這樣的公司與??抵g的關(guān)系,傳統(tǒng)集成商技術(shù)上有短板,但渠道和系統(tǒng)資源有優(yōu)勢(shì)。是單項(xiàng)技術(shù)發(fā)展成面,還是面補(bǔ)足技術(shù),還挺難說的?!币晃粯I(yè)內(nèi)人士表示。