1月28日,噴鼻港中文年夜學(xué)信息工程系傳授、商湯科技開創(chuàng)人湯曉鷗在新興科技峰會(huì)EmTech China上揭橥了題為《人工智能的中國(guó)式文藝中興》的演講。
商湯科技開創(chuàng)人湯曉鷗
下文為演講內(nèi)容整頓:
明天,我講的標(biāo)題是《人工智能的中國(guó)式文藝中興》,這個(gè)標(biāo)題我在上海講過(guò)一次,我這小我不太愛(ài)好反復(fù)本身,因而我又想了一個(gè)新的標(biāo)題——《人工智能的中國(guó)式十月反動(dòng)》。
言歸正傳,我想年夜部門中國(guó)人都應(yīng)當(dāng)曉得《戰(zhàn)狼》,一會(huì)兒賺了56億。這在15、20年前是弗成能的;那時(shí)刻許多人會(huì)去買盜版的VCD,或許去網(wǎng)高低載一個(gè)盜版。假如如許,導(dǎo)演和演員也就沒(méi)有動(dòng)力再持續(xù)保持下去了。明天,中國(guó)片子的結(jié)果最主要的推進(jìn)力就是我們對(duì)原創(chuàng)和版權(quán)的尊敬。
我們?nèi)缃癫皇侵灰徊科尤缭S勝利,好比《羞羞的鐵拳》賺了22億,《青春》到達(dá)14億的票房,《后任3》是18億,《無(wú)問(wèn)西東》做到了5億票房。所以,對(duì)原創(chuàng)的尊敬使得中國(guó)的原創(chuàng)片子賡續(xù)往前成長(zhǎng)。在三四十年月,全球片子成長(zhǎng)起來(lái)時(shí),中國(guó)片子其實(shí)不落伍,像《馬路天使》、《一江春水向東流》一點(diǎn)也不輸給好萊塢片子。
再往前,說(shuō)一下文藝中興的時(shí)刻,假如米爽朗基羅的這些作品或許任何一個(gè)藝術(shù)品很快有人停止復(fù)制,那末他能夠也賺不到錢活不下去,所以,關(guān)于原創(chuàng)的尊敬也是文藝中興能真正鼓起的一個(gè)緣由。
說(shuō)到原創(chuàng),上面我們來(lái)說(shuō)講人工智能。假如我講人工智能,年夜家第一能想到甚么公司?是谷歌。但總有一天,人工智能高潮會(huì)曩昔的,到那天年夜家必定能想到商湯科技。
為何是谷歌?由于谷歌真的把資金投入人工智能成長(zhǎng),2015年的研發(fā)經(jīng)費(fèi)達(dá)120億美金。2014年有一家公司叫DeepMind,只要12個(gè)員工,沒(méi)有賺錢,只是在用深度進(jìn)修玩游戲和下棋,然則谷歌消費(fèi)6.6億美金收買了這家公司。假如是在中國(guó),年夜家就會(huì)花幾百萬(wàn)美金把人一個(gè)個(gè)挖過(guò)去,那要廉價(jià)很多。然則假如那樣做的話,就不會(huì)有后來(lái)的AlphaGo了。 AlphaGo以后,谷歌又做了AlphaGo 2和AlphaGo Zero,有些公司開端學(xué)著AlphaGo下圍棋,還有的公司選擇打撲克牌,但從某種意義上講,這都是跟在他人的前面干事情。
真正成心義的工作是在AlphaGo之前你做了甚么?有無(wú)做甚么工作讓機(jī)械在某項(xiàng)義務(wù)上克服人類。在AlphaGo之前我們做了一件工作,2014年,我們團(tuán)隊(duì)從事人臉辨認(rèn),在全球第一次讓機(jī)械的人臉辨認(rèn)才能跨越了人的眼睛,像AlphaGo一樣,在某一小我類界說(shuō)的單項(xiàng)義務(wù)上,機(jī)械超出了人類。
超出了人類就過(guò)了一條紅線,而過(guò)了這條紅線便可以在工業(yè)長(zhǎng)進(jìn)行運(yùn)用。然則在真正運(yùn)用的時(shí)刻,發(fā)明過(guò)了紅線照樣不敷用,從試驗(yàn)室到年夜范圍家當(dāng)化還有很長(zhǎng)的路要走。2014年,我們用20萬(wàn)人臉來(lái)對(duì)機(jī)械停止練習(xí)做到了98.5%的精確率,而人是97.5%;2015年我們用30萬(wàn)人臉停止練習(xí),到達(dá)了99.55%的精確率;2016年,我們用6000萬(wàn)人臉練習(xí)可以到達(dá)了百萬(wàn)分之一的誤識(shí)率;2017年,我們用20億人臉練習(xí)可以到達(dá)一億分之一的誤識(shí)率,而如許的誤識(shí)率才可以真正地運(yùn)用到各行各業(yè),包含監(jiān)控、金融、安防、手機(jī)等行業(yè)。所以,我們和高通簽訂了全球AI計(jì)謀協(xié)作協(xié)定。
那末除人臉辨認(rèn),我們?nèi)缃襁€做甚么?這個(gè)技巧是行動(dòng)檢測(cè),我們用盤算機(jī)視覺(jué)剖析的辦法,可以從很長(zhǎng)的一段視頻里把重點(diǎn)內(nèi)容檢測(cè)出來(lái),你便可以直接跳過(guò)沒(méi)成心義的部門,直接看這些風(fēng)趣的、真實(shí)的鏡頭。還有基于內(nèi)容的視頻搜刮,在片子中我們可以把各類各樣的片斷搜刮出來(lái),好比說(shuō)你想搜刮武感動(dòng)作片斷,或許悲劇片斷,我們可以直接把它搜刮出來(lái),或許你想搜刮科幻的,我們可以把科幻的片斷搜刮出來(lái)。
和用天然說(shuō)話描寫來(lái)停止場(chǎng)景搜刮,我們用天然說(shuō)話來(lái)描寫一個(gè)片子中的場(chǎng)景,然后它便可以主動(dòng)依據(jù)你的描寫把這個(gè)片子片斷搜刮出來(lái),好比,我們要搜House of Cards中的一個(gè)片斷,“Claire和Frank坐在藍(lán)色沙發(fā)上”,年夜家看到上面這段場(chǎng)景就出來(lái)了。別的,我們不只能把視頻剖析出來(lái),還能懂得這個(gè)視頻,然后用天然說(shuō)話描寫出來(lái)。好比上面這些活動(dòng)視頻,機(jī)械便可以像講解員一樣來(lái)描寫活動(dòng)場(chǎng)上產(chǎn)生的工作。
IJCV是我們這個(gè)范疇的兩年夜頂級(jí)雜志之一,作為IJCV的主編,我會(huì)在每一年的ICCV和CVPR兩個(gè)盤算機(jī)視覺(jué)頂級(jí)會(huì)議上,主辦IJCV Night晚會(huì),約請(qǐng)幾百位頂級(jí)學(xué)者加入。上面這個(gè)演示里我們把片子場(chǎng)景里的一切物體都檢測(cè)出來(lái),演員是哪個(gè)演員,他穿的是甚么衣服,這個(gè)場(chǎng)景是在餐廳里,一切的桌子、花、椅子全體可以或許及時(shí)的主動(dòng)檢測(cè)出來(lái),如許的技巧在之前長(zhǎng)短常難的,然則如今我們都可以做到了。
再回頭來(lái)看我們?nèi)艉斡眠@些技巧來(lái)剖析后面提到的片子《戰(zhàn)狼》和《羞羞的鐵拳》,我們經(jīng)由過(guò)程剖析這些演員的舉措和他們之間的關(guān)系,可以剖析出來(lái)在分歧的場(chǎng)景之下,這兩個(gè)演員是誰(shuí),在做甚么,這個(gè)片斷是甚么類的情節(jié)。
同時(shí),我們可以辨認(rèn)每幀情節(jié)分類,每個(gè)鏡頭是斗毆場(chǎng)景照樣愛(ài)情場(chǎng)景。我們也能夠把一個(gè)片子最出色的鏡頭提掏出來(lái),年夜家可以遴選好比舉措的出色鏡頭、情感戲的出色鏡頭、喜劇的出色鏡優(yōu)等等。
那末總結(jié)起來(lái),我們?cè)谧錾趺茨??我們是在教機(jī)械看片子,一開端我們是教機(jī)械來(lái)辨認(rèn)人臉,Google是在教機(jī)械來(lái)下圍棋,而如今我們來(lái)教機(jī)械取代人看片子。這個(gè)感到有點(diǎn)怪,我們讓機(jī)械來(lái)做下棋,看片子,玩游戲這些風(fēng)趣的工作,然后我們?nèi)祟愔粨?dān)任給機(jī)械充充電,維修和頤養(yǎng)。
我認(rèn)為年夜家聽了這個(gè)必定認(rèn)為很好笑?,F(xiàn)實(shí)上一切的義務(wù),都是我們?nèi)酥浣o機(jī)械做的,機(jī)械是依照我們的指令在干事情,不存在機(jī)械掌握人類如許的工作,AI的真正目標(biāo)是贊助人類,贊助我們進(jìn)步臨盆效力。
最初給年青人留下兩句話:第一句,片子必定要本身親身去看。第二句,AI這個(gè)詞在中國(guó)拼音翻譯過(guò)去就是“愛(ài)”,所以談愛(ài)情也要本身親身去談,不然你就不止“后任3”了,很有能夠“后任4”、“后任5”了。