曠視科技CTO唐文斌:我們是一家人工智能產(chǎn)品公司
我們也非常重視系統(tǒng)的建設(shè),我們有自己研發(fā)的MegBrain深度學(xué)習(xí)引擎和Brain++平臺(tái)。如果說(shuō)研究的價(jià)值在于去探索邊界之外的東西,那邊界之內(nèi)的,比如網(wǎng)絡(luò)結(jié)構(gòu)的搜索,都應(yīng)該用機(jī)器來(lái)完成。我們的產(chǎn)品中常常會(huì)有的定制算法的需求,很多時(shí)候大框架都差不多,數(shù)據(jù)工程師把數(shù)據(jù)整理和準(zhǔn)備好以后,就直接用系統(tǒng)把各種類(lèi)型的模型都嘗試一遍,最后挑選出一個(gè)不錯(cuò)的。
新智元:你提到了數(shù)據(jù)工程師,現(xiàn)在曠視在數(shù)據(jù)方面投入多少?有多少人標(biāo)注數(shù)據(jù)?
唐文斌:全職標(biāo)注的大約有300人,不算在600多人的團(tuán)隊(duì)里面。我們還有很多工作是外包完成。我們內(nèi)部有標(biāo)注的數(shù)據(jù)庫(kù)是PB級(jí)別。
新智元:你曾在清華擔(dān)任科協(xié)主席,也帶過(guò)中國(guó)奧林匹克信息學(xué)競(jìng)賽團(tuán)隊(duì),可以說(shuō)你是曠視最開(kāi)始的首席人才官。你認(rèn)為目前人工智能人才應(yīng)該有什么樣的特點(diǎn)?曠視在選擇的時(shí)候看重什么特質(zhì)?
唐文斌:我覺(jué)得人才的類(lèi)型是很多樣的,每一種類(lèi)型的人才都是人才,光會(huì)寫(xiě)paper的人才也是人才,雖然價(jià)值沒(méi)有那么大。在現(xiàn)在的人工智能發(fā)展態(tài)勢(shì)下,我們最需要的是復(fù)合型人才。做產(chǎn)品的時(shí)候會(huì)有產(chǎn)品經(jīng)理,但人工智能場(chǎng)景下的產(chǎn)品經(jīng)理需要更加復(fù)合。
我們團(tuán)隊(duì)最早的一位同學(xué),員工工號(hào)No. 5的“卿爺”,我們現(xiàn)在提供給小米、VIVO人臉解鎖的產(chǎn)品線都是他帶著團(tuán)隊(duì)來(lái)做的,他需要有什么樣的能力?第一,懂算法,不一定要懂算法具體是怎么做的,但一定要懂算法的邊界在哪里——堅(jiān)信這件事情一定能做到,但同時(shí)也要了解現(xiàn)在的算法有些東西是真的做不到。第二,有很好的工程判斷力,用算法的方式是從本質(zhì)去解決問(wèn)題,而有些東西你會(huì)通過(guò)工程的方法去“不本質(zhì)的解決”,倒推出一個(gè)一個(gè)設(shè)計(jì)。第三,也是更為重要的,需要不斷從用戶的需求、用戶的場(chǎng)景、用戶的價(jià)值角度出發(fā)思考問(wèn)題。這樣一個(gè)產(chǎn)品經(jīng)理,他需要比以往的產(chǎn)品經(jīng)理有更多工程上sense,更多算法上的sense。
從工程師的角度來(lái)講,我們有一個(gè)詞,叫“全棧AI工程師”,我們希望這位同學(xué)不僅數(shù)學(xué)好,懂算法,編程很強(qiáng),還非常懂系統(tǒng);算法編程都很懂才能做引擎,懂體系結(jié)構(gòu)你的引擎才能在不同的平臺(tái)上都跑得很好很快。這樣的人非常難找,但也是最強(qiáng)的。比如說(shuō)我們做Brain++平臺(tái)的那幫人,他們提供的是訓(xùn)練平臺(tái),給到研究人員使用,他們知道Research是怎么使用這些東西,他們自己也隨時(shí)都能轉(zhuǎn)變?yōu)镽esearcher。同時(shí),他們考慮Researcher做的哪些事情是沒(méi)有價(jià)值的,要把它工程化、系統(tǒng)化,最終的目標(biāo)是消滅Researcher——所有在邊界范圍內(nèi)的Research都由系統(tǒng)來(lái)完成,而Research真正要做的事情是突破邊界,探索邊界之外的東西。
曠視在選擇人才的時(shí)候也是按照這個(gè)標(biāo)準(zhǔn)。如果有這樣的人,我們特別特別希望你能夠加入我們,我們團(tuán)隊(duì)里有很多這樣的人,你跟他們?cè)谝黄鹨欢〞?huì)非常愉快。其次,我們也很看重學(xué)習(xí)能力,現(xiàn)在領(lǐng)域發(fā)展很快,你需要非?焖俚馗瞎(jié)奏去嘗試你的新想法,所以學(xué)習(xí)能力和動(dòng)手速度非常重要。我們也有實(shí)習(xí)生項(xiàng)目,總之歡迎你來(lái),孫劍老師帶你飛對(duì)吧(笑)。
算法與硬件結(jié)合,從源頭抓起控制成像質(zhì)量
新智元:曠視的算法、軟件如何與硬件相結(jié)合?
唐文斌:我們有自己的深度學(xué)習(xí)引擎MegBrain,這個(gè)引擎在不同的品牌上做了非常多的底層優(yōu)化,能夠跑得非常快。我們最近做的一款智能相機(jī)產(chǎn)品,這個(gè)相機(jī)是業(yè)界第一款全幀率、全畫(huà)幅(1080P)智能人像抓拍機(jī)。
曠視的全幀率、全畫(huà)幅(1080P)智能人像抓拍機(jī)
全幀率的意思就是說(shuō),每秒30幀,每幀都去抓取,在業(yè)界這個(gè)指標(biāo)是最高的。有的嫌疑人員有很強(qiáng)的反偵察意識(shí),一看到攝像頭會(huì)馬上低頭,如果相機(jī)不能以非常快的速度做出截取,可能只有100毫秒,一兩幀之后這人就消失了。同時(shí),每一幀都檢測(cè),也能確?偸悄茏サ劫|(zhì)量最好的一幀,為后續(xù)應(yīng)用服務(wù)。以往的相機(jī)在畫(huà)面中抓拍做檢測(cè),基本上最多只能抓拍畫(huà)面中10到20個(gè)人,再多就抓不到了,因?yàn)橛?jì)算量不行。我們可以做到128張人臉,很大的人流也能跟蹤得很好。
我們用的是自己設(shè)計(jì)的FPGA芯片,在算法層面也做了很大升級(jí)。硬件也好,算法也好,引擎也好,這幾個(gè)東西是要聯(lián)合優(yōu)化的。這也是自己做引擎的廠家好的地方,我的引擎可以根據(jù)算法的需求去調(diào)整。
新智元:未來(lái)1年曠視會(huì)怎樣?未來(lái)3~5年呢?
唐文斌:我們分幾個(gè)組,研究院大概10%~15%的力量可能在解決2~5年的問(wèn)題,更多的人在解決一年以內(nèi)的問(wèn)題,因?yàn)閯?chuàng)業(yè)公司要?jiǎng)?wù)實(shí)聚焦。在介紹產(chǎn)品時(shí)候也講過(guò),比如說(shuō)我們?yōu)槭裁醋鱿鄼C(jī),并不是因?yàn)橛X(jué)得相機(jī)賺錢(qián),而是我們想當(dāng)視頻大數(shù)據(jù)平臺(tái),發(fā)現(xiàn)源頭數(shù)據(jù)不好,后面再怎么分析也沒(méi)用,所以我們要在源頭上通過(guò)自己的方式把質(zhì)量控制好,讓后面的分析能力能夠更強(qiáng),形成端到端的解決方案和業(yè)務(wù)價(jià)值。
我們希望未來(lái)一年左右,在金融和安防這兩個(gè)場(chǎng)景下能夠站深、站穩(wěn),希望在這兩個(gè)行業(yè)形成全系列的產(chǎn)品,端到端的解決方案,給用戶一套完整的價(jià)值鏈條。我們內(nèi)部有個(gè)說(shuō)法是“4+2+X”,在微型場(chǎng)景下,把臉人車(chē)文字這4個(gè)要素識(shí)別做好,再后希望能夠形成機(jī)器人的手和腿,做一些限定場(chǎng)景的機(jī)器人應(yīng)用!癤”是指通過(guò)Brain++這個(gè)平臺(tái)快速做技術(shù)的定制,讓這個(gè)場(chǎng)景真正的能夠形成一個(gè)完整的產(chǎn)品鏈。但真真實(shí)實(shí)地講,領(lǐng)域發(fā)展這么快,未來(lái)3~5年,我真的不知道!
新智元 AI World 2017即將啟幕
11月8日,在新智元 AI World 2017 世界人工智能大會(huì)上,曠視科技首席科學(xué)家、曠視研究院院長(zhǎng)孫劍博士將發(fā)表演講,聚焦人臉識(shí)別等視覺(jué)前沿技術(shù)和問(wèn)題,為我們帶來(lái)計(jì)算機(jī)視覺(jué)最新技術(shù)和應(yīng)用的精彩分享。
孫劍博士目前在曠視科技(Face++)擔(dān)任首席科學(xué)家、曠視研究院院長(zhǎng)。2003年畢業(yè)于西安交通大學(xué)人工智能與機(jī)器人研究所,畢業(yè)后加入微軟亞洲研究院 ( Microsoft Research Asia),任職首席研究員。自2002年以來(lái)在 CVPR, ICCV, ECCV, SIGGRAPH, PAMI 五個(gè)頂級(jí)學(xué)術(shù)會(huì)議和期刊上發(fā)表學(xué)術(shù)論文 100+ 篇,Google Scholar 引用 25,000+次,H-index 60,兩次獲得 CVPR Best Paper Award (2009, 2016)。孫劍博士于2010被美國(guó)權(quán)威技術(shù)期刊 MIT Technology Review 評(píng)選為“全球35歲以下杰出青年創(chuàng)新者”。
孫劍博士帶領(lǐng)的團(tuán)隊(duì)于2015年獲得圖像識(shí)別國(guó)際大賽五項(xiàng)冠軍 ( ImageNet分類(lèi),檢測(cè)和定位,MS COCO 檢測(cè)和分割),其團(tuán)隊(duì)開(kāi)發(fā)出來(lái)的“深度殘差網(wǎng)絡(luò)”和“基于區(qū)域的快速物體檢測(cè)”技術(shù)已經(jīng)被廣泛應(yīng)用在學(xué)術(shù)和工業(yè)界。同時(shí)孫劍帶領(lǐng)的團(tuán)隊(duì)的研究成果也廣泛被應(yīng)用在微軟 Windows, Office, Bing, Azure, Surface, Xbox 等多條產(chǎn)品線上。目前孫劍博士正在帶領(lǐng)曠視科技的研究團(tuán)隊(duì)推進(jìn)計(jì)算機(jī)視覺(jué)技術(shù)的進(jìn)步和探索其在工業(yè)和商業(yè)上的實(shí)踐。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
8月14日立即報(bào)名>> 【在線研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
精彩回顧立即查看>> OFweek 2025 具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專(zhuān)題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬(wàn)億美元的公司
- 2 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車(chē)出海美國(guó)
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 5 具身智能泡沫爭(zhēng)議下,華映資本尋找「穿越周期者」
- 6 中國(guó)平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷(xiāo)售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實(shí)現(xiàn)突圍,國(guó)產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來(lái)新一輪協(xié)同進(jìn)化