應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

給數(shù)據(jù)科學(xué)家判死刑:5年后將被機(jī)器學(xué)習(xí)取代

2019-03-05 09:27 新智元

導(dǎo)讀:數(shù)據(jù)科學(xué)家會(huì)被機(jī)器學(xué)習(xí)取代嗎?雖然現(xiàn)在的數(shù)據(jù)科學(xué)家崗位需求非常熱,但是所從事的工作領(lǐng)域,正好面臨機(jī)器學(xué)習(xí)的不斷挑戰(zhàn)。福布斯作者認(rèn)為,數(shù)據(jù)科學(xué)家工作的5個(gè)領(lǐng)域,未來5-10年會(huì)被機(jī)器學(xué)習(xí)取代,Reddit網(wǎng)友對(duì)此進(jìn)行了激烈的討論。

數(shù)據(jù)科學(xué)家會(huì)被機(jī)器學(xué)習(xí)取代嗎?雖然現(xiàn)在的數(shù)據(jù)科學(xué)家崗位需求非常熱,但是所從事的工作領(lǐng)域,正好面臨機(jī)器學(xué)習(xí)的不斷挑戰(zhàn)。福布斯作者認(rèn)為,數(shù)據(jù)科學(xué)家工作的5個(gè)領(lǐng)域,未來5-10年會(huì)被機(jī)器學(xué)習(xí)取代,Reddit網(wǎng)友對(duì)此進(jìn)行了激烈的討論。

數(shù)據(jù)科學(xué)崗位正在面臨巨大的變革。

計(jì)算器被發(fā)明之前,它的工作是由人來擔(dān)當(dāng)?shù)模换ヂ?lián)網(wǎng)剛剛發(fā)展起來的時(shí)候,網(wǎng)管是一個(gè)非常熱門的職業(yè);中層領(lǐng)導(dǎo)曾經(jīng)并不自己做PPT,這些瑣碎的工作由他們的秘書處理。

如今,計(jì)算員、網(wǎng)管、中層領(lǐng)導(dǎo)的秘書這些崗位,早已被科技的浪潮淹沒在海底深處。

數(shù)據(jù)科學(xué)淘金熱

數(shù)據(jù)科學(xué)家崗位現(xiàn)在的形勢(shì),很像當(dāng)年美國(guó)西部淘金熱潮。一些數(shù)據(jù)科學(xué)家賺到了高薪,各大公司、薪酬網(wǎng)站也在不算釋放缺人、待遇高的信號(hào)。



根據(jù)美國(guó)最熱崗位排行榜數(shù)據(jù)顯示,數(shù)據(jù)科學(xué)家崗位的招聘信息在過去3年時(shí)間,增加了75%,而薪資也提升到了嚇人的30萬美元,相當(dāng)于200萬人民幣。

與此相對(duì)應(yīng)的是,包括UC伯克利在內(nèi)的多所高校,均新增了數(shù)據(jù)科學(xué)專業(yè),并很快就成為最熱門專業(yè)。

著名科技網(wǎng)站Slashdot聯(lián)合創(chuàng)始人、Sight Machine聯(lián)合創(chuàng)始人兼CTO、福布斯科技委員會(huì)成員Nate Oostendorp對(duì)此表示,未來只會(huì)有一小部分人能夠真正成為數(shù)據(jù)科學(xué)家,而其中大部分,前途依舊充滿未知。

從匯編到高級(jí)語言,再到數(shù)據(jù)自動(dòng)化

作為一名元老級(jí)別的開發(fā)者,Nate Oostendorp經(jīng)歷了從低級(jí)語言到高級(jí)語言的變革時(shí)期。

最早的時(shí)候,編譯器設(shè)計(jì)是一門必修課程,比如把C轉(zhuǎn)換成匯編。在商業(yè)應(yīng)用上直接使用匯編,是再正常不過的事情。

然而僅僅幾十年后,大家都還是用高級(jí)語言,直接用匯編語言開發(fā)的軟件,基本上絕跡了。而數(shù)據(jù)科學(xué)領(lǐng)域的變化,顯然更快。

如今,很多公司都在提供數(shù)據(jù)分析工具,就算你不懂代碼,也可以輕松進(jìn)行數(shù)據(jù)分析。

3年后,更高級(jí)別的工具將越來越多地減少對(duì)基礎(chǔ)技術(shù)的專業(yè)知識(shí)的要求。這些工具的不僅簡(jiǎn)化了數(shù)據(jù)科學(xué)家的工作流程、提升了工作效率,更重要的是降低了入行門檻,及時(shí)沒學(xué)過數(shù)據(jù)科學(xué)的人,不懂代碼也可以完成一些數(shù)據(jù)科學(xué)家的工作。

機(jī)器學(xué)習(xí),人工智能,像吹氣球一樣吹大了數(shù)據(jù)科學(xué)的旺盛需求,同時(shí)也將在5年后,吹爆數(shù)據(jù)科學(xué)家這個(gè)職業(yè)。

數(shù)據(jù)科學(xué)家崗位在5年后將不復(fù)存在

Nate認(rèn)為,當(dāng)下非?;鸬臄?shù)據(jù)科學(xué)家,5年后將不再作為一個(gè)獨(dú)立崗位存在。而是分裂成5種類型:



1. 通才

他們將解釋數(shù)據(jù)并使其可用。這些通才將專注于教育最終用戶,幫助用戶提出數(shù)據(jù)問題而不是自己找到所有答案。這可能是一個(gè)過渡性的角色,五年內(nèi)比十年更常見。

2. 行業(yè)專家

他們將在制造,醫(yī)學(xué)和金融等特定行業(yè)應(yīng)用數(shù)據(jù)科學(xué)技術(shù)和工具。這是我認(rèn)為大部分工作都將在這里的地方。但是,這些不會(huì)被視為數(shù)據(jù)科學(xué)工作。這名工作人員不會(huì)是了解制造業(yè)的數(shù)據(jù)科學(xué)家,而是了解數(shù)據(jù)科學(xué)的制造業(yè)領(lǐng)導(dǎo)者。今天相當(dāng)于研究員是統(tǒng)計(jì)學(xué)王牌。

3. 深度專家

這些細(xì)分的特定數(shù)據(jù)科學(xué)技術(shù)的深度專家,人數(shù)是也最少的。這是剩下的純數(shù)據(jù)科學(xué)工作所在的地方。他們的角色將是抽象地追求數(shù)據(jù)科學(xué),提高算法的性能和設(shè)計(jì)新的通用方法。他們將像今天的計(jì)算機(jī)科學(xué)家一樣,建立理論基礎(chǔ)而不是解決日常問題。

4. 分析開發(fā)人員

他們將從數(shù)據(jù)科學(xué)家轉(zhuǎn)變?yōu)榉治鲩_發(fā)人員。這些是軟件開發(fā)專家,負(fù)責(zé)處理數(shù)據(jù)交互并幫助人們從數(shù)據(jù)報(bào)告中進(jìn)行推斷。算法設(shè)計(jì)將是他們工作的一小部分,由數(shù)據(jù)平臺(tái)以及以交鑰匙方式完成大量工作的強(qiáng)大代碼庫提供幫助。

5. 數(shù)據(jù)工程師

他們構(gòu)建管道,將數(shù)據(jù)轉(zhuǎn)換并傳輸?shù)交A(chǔ)平臺(tái),進(jìn)行分析和可視化。雖然數(shù)據(jù)科學(xué)家通常因其出色的算法而受到認(rèn)可,但數(shù)據(jù)科學(xué)家80%的時(shí)間可用于收集,清理和組織數(shù)據(jù)。

此言論一出,造成了非常大的爭(zhēng)議,并在Reddit上產(chǎn)生了激烈的討論。與其說是討論,不如說是一邊倒的反對(duì)此觀點(diǎn)。

各方觀點(diǎn)

反方

logicchains用stackexchange上一個(gè)問題(What happens if the explanatory and response variables are sorted independently before regression?)來說明,數(shù)據(jù)科學(xué)并不單單是自動(dòng)化。選擇正確使用,正確清理和驗(yàn)證數(shù)據(jù)的數(shù)據(jù)至少與選擇正確的模型同樣重要。

他指出,目前沒有任何軟件能夠通過組織內(nèi)部進(jìn)行拖網(wǎng)查找`Sales`表上的’Extra2`字段的正確解釋,該字段有三個(gè)值:“TRUE”,“Error”和null。言下之意:5年內(nèi)不可能,10年內(nèi)不可能。

FrenchCuirassier認(rèn)為,數(shù)據(jù)以指數(shù)速度增長(zhǎng),未來將會(huì)有更多的工作,但其中大部分將分析、理解和解釋數(shù)據(jù)。

人工智能并不能解釋,也不能理解它做的所有事情。AI在未來可能達(dá)到人類智能,但誰敢說我們能活著看到那一天呢?

BeneficialArcher也持有相同觀點(diǎn),認(rèn)為大多數(shù)數(shù)據(jù)科學(xué)角色不太可能實(shí)現(xiàn)自動(dòng)化。目前自動(dòng)化已經(jīng)很成熟了,但沒有任何軟件能夠解決模糊的問題,并使用所有可用的數(shù)據(jù)解決它。

但他又認(rèn)為未來幾年工資會(huì)有所下降是合理的,因?yàn)槌踔姓螌W(xué)到的最基本的經(jīng)濟(jì)原理:供大于求。

killver聲稱沒有看到一個(gè)案例能夠證明AutoML優(yōu)于熟練的數(shù)據(jù)科學(xué)家。如果有,那每年舉行的Kaggle比賽,靠一個(gè)算法就夠了。

具體而言,領(lǐng)域知識(shí)將始終是重要的。嘗試了幾次AutoML工具后發(fā)現(xiàn),這些工具從來沒有達(dá)到過滿意的效果。

正方

當(dāng)然,每個(gè)人的認(rèn)知都是不同的。也有人表示認(rèn)可Nate的部分觀點(diǎn)。

sid__想的比較實(shí)際,他認(rèn)為軟件工程作為一門學(xué)科將比數(shù)據(jù)科學(xué)更難實(shí)現(xiàn)自動(dòng)化。

考慮一家不希望聘請(qǐng)150k數(shù)據(jù)科學(xué)家的普通公司,如果能夠利用普通的軟件工程師,將數(shù)據(jù)投入到autoML引擎中,使用api調(diào)用并獲得預(yù)測(cè)結(jié)果,在很多情況下這已經(jīng)足夠了,特別是如果不是一些關(guān)鍵任務(wù)應(yīng)用程序。

親愛的讀者,你怎么看?