谷歌推全新人工智能系統(tǒng) 史上最強人臉識別技術
來源:數(shù)字音視工程網(wǎng) 編輯:上善如水 2015-03-25 14:11:12 加入收藏 咨詢

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢內(nèi)容: | |
驗證碼: |
|
有些人總喜歡夸口說:“我從來不會忘記別人的長相。”在人工智能研究突飛猛進的今天,還要這么夸口就有點奇怪了。事實上,現(xiàn)在有些電腦能記住2.6億張臉。上周,谷歌公司的三位研究人員發(fā)表了一篇有關全新人工智能系統(tǒng)的研究論文。這一系統(tǒng)名為FaceNet,谷歌號稱它是迄今為止最精確的人臉識別技術。
姿勢和光線一直都是人臉識別的大難題。該圖顯示了兩張臉在不同組合中所體現(xiàn)出來的“差距”(差距為0.0意味著兩張臉完全一樣)。
面對一個名為“人面數(shù)據(jù)庫”(Labeled Faces in the Wild)的常用人臉識別數(shù)據(jù)庫時,F(xiàn)aceNet識別的準確率近乎百分之百。這個數(shù)據(jù)庫容納了網(wǎng)上搜集的一萬三千多張人臉照片。而在面對一個含有2.6億張人臉照片的龐大數(shù)據(jù)庫時,這個系統(tǒng)的準確率也超過86%。
研究人員聲稱,面對“人面數(shù)據(jù)庫”時,他們主要測試該系統(tǒng)的“確認能力”。就本質(zhì)而言,他們衡量的是這套算法在判斷兩張照片是否同屬一人時到底有多準確。
去年12月,一個中國研究團隊也聲稱,對這套數(shù)據(jù)庫的識別準確率超過99%。去年,F(xiàn)acebook公司的研究人員發(fā)表論文稱,他們也能做到超過97%的準確率。根據(jù)這篇論文援引的一些研究人員的說法,人類對該數(shù)據(jù)庫的識別準確率僅有97.5%。
不過,谷歌研究人員采用的方法絕不只是確認兩張臉是否一樣這么簡單。這套系統(tǒng)還能將人名和臉匹配——經(jīng)典的人臉識別技術,甚至能把看起來最像或最不像的臉歸集在一起。
目前這還僅僅是研究而已,但它預示著,在不遠的將來,我們經(jīng)常在網(wǎng)上視頻或大片里看到的那種能懲治犯罪、加強監(jiān)控的電腦將更加觸手可及。比起在交友應用Tinder上劃來劃去,它可能會使網(wǎng)上交友更加簡單(也更停留于表面)。
很喜歡1998年左右時的布拉德 皮特?這個數(shù)據(jù)庫里有500張看起來很像他的臉。
一開始,我們會看到谷歌的FaceNet及Facebook的DeepFace系統(tǒng)在各自的網(wǎng)絡平臺上運行。它們會讓用戶更加方便地(或者說更加自動化地)給照片貼上標簽,找到要找的人,因為這些算法知道照片中的這個人是誰,即使這些照片并沒有姓名標記。此外,這類系統(tǒng)還能讓網(wǎng)絡公司更加方便地基于照片人物的身份,來分析它們的用戶社交網(wǎng)絡,評判全球流行趨勢及名人的受歡迎程度。
盡管谷歌和Facebook在人臉識別技術上最近才取得這類進步,但與之類似的電腦系統(tǒng)早就無處不在。它們都含有一種名為“深度學習”的人工智能技術。事實證明,這種技術能夠極其有效地完成識別物體(按照某些標準來看,機器在這方面已經(jīng)比人類要強了)、識別語音及理解書面文字等機器辨別任務。
除了谷歌和Facebook外,微軟、百度和雅虎也在“深度學習”研究上投入重金。這種算法已經(jīng)應用在一些我們常用的功能上了,比如智能手機語音控制、Skype實時翻譯、短信預測輸入法及先進的圖像搜索等(如果你已經(jīng)將一些圖片上傳至Google+賬戶里,你就可以試試用它們來搜索特定目標)。Spotify和Netflix公司正在研究如何利用深度學習技術更智能地推薦視頻。貝寶公司則將其用于打擊欺詐。
還有幾家科技創(chuàng)業(yè)公司正將深度學習技術用于實時分析醫(yī)療圖像,并提供諸如文本分析、計算機視覺及語音識別這類云計算服務項目。近年來,Twitter、Pinterest,、Dropbox、雅虎和谷歌等公司都收購了一些專攻深度學習技術的創(chuàng)業(yè)公司。IBM公司剛剛收購了一家位于丹佛,名為AlchemyAPI的初創(chuàng)企業(yè),用以提升其Watson超級計算機的智能水平,并支持其全新的Bluemix云平臺(該平臺的理念是:開發(fā)者可以方便地將移動和網(wǎng)絡應用與云服務連接起來,借以打造一些智能應用,而無需再鉆研人工智能背后復雜的計算機科學)。
不止于此。隨著消費級機器人、無人駕駛汽車及智能家居逐漸成為現(xiàn)實,深度學習技術也將如影隨形,為我們這些新玩具提供耳目和一些頭腦功能。美國國防部高級研究計劃局(DARPA)也在探索如何借助深度學習技術來實時理解龐大的情報信息流。
我猜想,DARPA正在關注谷歌的FaceNet系統(tǒng),并為之激動。
評論comment