數(shù)據(jù)科學(xué)50年,數(shù)據(jù)科學(xué)家是否依然是21世紀(jì)最性感的職業(yè)?
在如今的數(shù)據(jù)智能時(shí)代,幾乎所有人都相信“數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼你只能看到冰山一角,而絕大部分則隱藏在表面之下!碑(dāng)數(shù)據(jù)的價(jià)值依然在冰山之下隱藏,外面的世界便彌漫著對(duì)數(shù)據(jù)的渴望。
一些新的職業(yè)成為數(shù)據(jù)海洋里的新星,“數(shù)據(jù)科學(xué)家”無(wú)疑是最亮的之一,它被譽(yù)為21世紀(jì)最性感的職業(yè),但是近年來(lái)隨著平民數(shù)據(jù)科學(xué)家的發(fā)展,有人指出數(shù)據(jù)科學(xué)家將要消失,也有國(guó)外相關(guān)人士建議不要去選數(shù)據(jù)科學(xué)家這個(gè)職業(yè),數(shù)據(jù)科學(xué)家還是21世紀(jì)最性感的職業(yè)嗎?
數(shù)據(jù)科學(xué)五十年仍是少年
數(shù)據(jù)科學(xué)家泛指數(shù)據(jù)科學(xué)的從業(yè)者,追溯數(shù)據(jù)科學(xué)家的源頭可以到數(shù)據(jù)科學(xué)誕生的1966年,當(dāng)時(shí)Peter Naur提出"數(shù)據(jù)科學(xué)"(“DataScience”起初叫"datalogy "),用來(lái)代替"計(jì)算機(jī)科學(xué)"。1996年,International Federation of Classification Societies (IFCS)國(guó)際會(huì)議召開(kāi)。數(shù)據(jù)科學(xué)一詞首次出現(xiàn)在會(huì)議(Data Science, classification, and related methods)標(biāo)題里。
在2000年代中期數(shù)據(jù)科學(xué)家職位開(kāi)始出現(xiàn),2009年Natahn Yau指出數(shù)據(jù)科學(xué)家是是采用科學(xué)方法、運(yùn)用數(shù)據(jù)挖掘工具尋找新的數(shù)據(jù)洞察的工程師,數(shù)據(jù)科學(xué)家集技術(shù)專(zhuān)家與數(shù)量分析師的角色于一身。
實(shí)際上大數(shù)據(jù)和數(shù)據(jù)科學(xué)在內(nèi)的整個(gè)數(shù)據(jù)行業(yè)最初都是由Google、Facebook、Twitter等互聯(lián)網(wǎng)巨頭驅(qū)動(dòng),現(xiàn)在仍然如此。總部位于歐洲的JetBrains是國(guó)際知名軟件開(kāi)發(fā)工具提供商,其產(chǎn)品經(jīng)理Andrey Cheptsov認(rèn)為互聯(lián)網(wǎng)巨頭能夠推動(dòng)數(shù)據(jù)行業(yè)的發(fā)展首先有所需求、并有能力進(jìn)行大規(guī)模有效處理數(shù)據(jù),其主要業(yè)務(wù)模型從核心上取決于自身處理大規(guī)模數(shù)據(jù)的效率。
隨著大數(shù)據(jù)行業(yè)的發(fā)展,數(shù)據(jù)科學(xué)家成為了職場(chǎng)新星,更是被財(cái)富雜志譽(yù)為21世紀(jì)最性感的職業(yè)。但是數(shù)據(jù)科學(xué)家在初期成長(zhǎng)也并非一帆風(fēng)順,根據(jù)商業(yè)智能公司SiSense在2012 年左右的一項(xiàng)報(bào)告,在接受調(diào)查的全球400位數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析人士中,59%的數(shù)據(jù)科學(xué)家在從業(yè)六年后都另謀高就。盡管該職業(yè)的報(bào)酬豐厚,其中超過(guò)半數(shù)表示對(duì)職業(yè)安全性的擔(dān)憂(yōu)。
彼時(shí)麥肯錫等咨詢(xún)公司力挺數(shù)據(jù)科學(xué)家,堅(jiān)信數(shù)據(jù)科學(xué)家是當(dāng)今和未來(lái)稀缺的資源。隨著智能手機(jī)的普及移動(dòng)互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)價(jià)值越發(fā)凸顯,數(shù)據(jù)科學(xué)家水漲船高。LinkedIn 發(fā)布的《2017 年美國(guó)新興工作崗位報(bào)告》中指出,“自 2012 年以來(lái),數(shù)據(jù)科學(xué)家的職位增長(zhǎng)了 650% 以上”且“數(shù)百家企業(yè)都在招聘這些職位”。
國(guó)內(nèi)近幾年也有互聯(lián)網(wǎng)公司近幾年開(kāi)始逐步設(shè)立獨(dú)立的數(shù)據(jù)科學(xué)(DataScience)團(tuán)隊(duì),推動(dòng)公司向數(shù)據(jù)驅(qū)動(dòng)發(fā)展。進(jìn)入21世紀(jì)20年代,數(shù)據(jù)科學(xué)家成為更稀缺的資源,很多人也依然相信它還是21世紀(jì)最性感的職業(yè)。
不過(guò)榮譽(yù)傍身的新星也有“暗淡”的一面,2017年有研究指出數(shù)據(jù)科學(xué)家成為離職率最高的職位之一,通常他們每周都會(huì)花費(fèi)一定的時(shí)間尋找新工作。日前仍然有數(shù)據(jù)科學(xué)家從業(yè)者勸諫后來(lái)者不要入坑,可謂是冰火兩重天,何以至此?
數(shù)據(jù)科學(xué)五十年依舊是少年模樣,就如同“AI”這個(gè)名詞在1956年出現(xiàn)到如今60多年才有初步落地,數(shù)據(jù)科學(xué)是一個(gè)綜合性的學(xué)科,國(guó)內(nèi)外很多從業(yè)者認(rèn)為數(shù)據(jù)科學(xué)依然是探索性的工作,管理層對(duì) “數(shù)據(jù)科學(xué)” 的含義往往沒(méi)有達(dá)成共識(shí)。
雖然已經(jīng)經(jīng)過(guò)至少10多年的發(fā)展,現(xiàn)在可能受限于業(yè)務(wù),沒(méi)有辦法生搬硬套一個(gè)角色框架給數(shù)據(jù)科學(xué)家,企業(yè)也容易將數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師混淆。JetBrains產(chǎn)品經(jīng)理Maria Khalusova認(rèn)為“數(shù)據(jù)科學(xué)家”和“數(shù)據(jù)工程師”這兩種職位角色在行業(yè)中還是相當(dāng)新的,也正因此,通常沒(méi)有明確的職責(zé)劃分!拔覀兛吹皆谀承┕局杏蓴(shù)據(jù)科學(xué)家承擔(dān)的職責(zé),在其他公司中這些職責(zé)卻由數(shù)據(jù)工程師承擔(dān)。另一個(gè)越來(lái)越常見(jiàn)的新角色是機(jī)器學(xué)習(xí)工程師,但也是同樣的情況,他們也經(jīng)常與數(shù)據(jù)工程師發(fā)生重疊!盡aria Khalusova在接受IT168采訪(fǎng)時(shí)指出。
數(shù)據(jù)科學(xué)家VS數(shù)據(jù)工程師
新的技術(shù)融入產(chǎn)業(yè)和社會(huì)必然會(huì)帶來(lái)一場(chǎng)職業(yè)的辭舊迎新,這個(gè)過(guò)程并沒(méi)有那么快速。
“從技術(shù)角度來(lái)看,數(shù)據(jù)科學(xué)在某些情況下的實(shí)踐似乎還不如傳統(tǒng)軟件開(kāi)發(fā)成熟。企業(yè)可能會(huì)面臨以下挑戰(zhàn):建立可重現(xiàn)的機(jī)器學(xué)習(xí)管道,對(duì)數(shù)據(jù)和模型進(jìn)行版本控制以進(jìn)行審核,與快速發(fā)展的技術(shù)保持同步!盡aria Khalusova指出。
數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師的角色兩者有許多共同的特點(diǎn)和共技能。這些重疊的技能包括處理和操作大數(shù)據(jù)集、應(yīng)用數(shù)據(jù)的編程技能、數(shù)據(jù)分析技能以及對(duì)系統(tǒng)操作的總體熟練程度。不過(guò)兩者還是有很大的不同。在筆者之前翻譯的文章中也強(qiáng)調(diào)了數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師不可能合二為一,為了從數(shù)據(jù)中獲得價(jià)值,大多數(shù)企業(yè)組織都需要數(shù)據(jù)科學(xué)和數(shù)據(jù)工程,由于相關(guān)技能有很大差異,二者合體也不太現(xiàn)實(shí)。企業(yè)組織可能需要多個(gè)數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師,但兩者之間的比例很少是1:1。對(duì)于大多數(shù)企業(yè)組織來(lái)說(shuō),擁有更多的數(shù)據(jù)工程師比數(shù)據(jù)科學(xué)家更有意義。因?yàn)閿?shù)據(jù)科學(xué)家已經(jīng)學(xué)會(huì)處理大量的干凈數(shù)據(jù),但是從許多不同系統(tǒng)獲得大量的干凈數(shù)據(jù)更難也更具挑戰(zhàn)。與抽象數(shù)據(jù)模型和對(duì)數(shù)據(jù)集運(yùn)行分析相比,移動(dòng)和清理數(shù)據(jù)的工作量更大。
從技能需求方面也有很大的差異,Maria Khalusova認(rèn)為,廣義上來(lái)講,數(shù)據(jù)工程師通常必須熟悉那些為分布式數(shù)據(jù)處理而設(shè)計(jì)的工具,例如Apache Spark、Apache Hadoop、Apache Ignite等。他們要具備數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖方面的經(jīng)驗(yàn),因?yàn)樗麄冃枰軌蚴炀毜厥褂肑ava、Scala和Kotlin等JVM語(yǔ)言,并且必須能夠創(chuàng)建和維護(hù)大多數(shù)數(shù)據(jù)基礎(chǔ)架構(gòu)。

發(fā)表評(píng)論
登錄
手機(jī)
驗(yàn)證碼
立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)
還不是會(huì)員?免費(fèi)注冊(cè)
忘記密碼請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)
圖片新聞
最新活動(dòng)更多
-
8月5日立即報(bào)名>> 【在線(xiàn)會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
8月14日立即報(bào)名>> 【在線(xiàn)研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠(chǎng)展
-
精彩回顧立即查看>> OFweek 2025 具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專(zhuān)題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬(wàn)億美元的公司
- 2 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車(chē)出海美國(guó)
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 5 具身智能泡沫爭(zhēng)議下,華映資本尋找「穿越周期者」
- 6 中國(guó)平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷(xiāo)售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實(shí)現(xiàn)突圍,國(guó)產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來(lái)新一輪協(xié)同進(jìn)化