機器之心原創(chuàng)
采訪:Tony Peng
參與:熊貓、李澤南
6月15日,三位人工智能先驅Yoshua Bengio、Geoffrey Hinton與Yann LeCun在美國加州接受了2018年圖靈獎的頒獎。這是有「計算機界諾貝爾獎」之稱的圖靈獎十年內(nèi)第三次頒發(fā)給機器學習領域的研究者。
頒獎委員會表示,三位學者因為在深度神經(jīng)網(wǎng)絡概念和工程上的突破,使得 DNN 成為計算的一個重要構成,從而成為了 2018 年圖靈獎得主。毋庸置疑,他們的研究成果已成為今天AI熱潮的主要推動力量。雖然要讓電腦像人類一樣思考,我們還有很多路要走,但是人工智能今天的發(fā)展已對人類經(jīng)濟和我們的生活方式產(chǎn)生了深遠影響。
在本次頒獎之前,機器之心在 MILA 與滴滴出行的合作發(fā)布會上對其中一位獲獎者,蒙特利爾大學教授、人工智能研究機構MILA主管 Yoshua Bengio,和滴滴出行科技合作總監(jiān)吳國斌博士進行了專訪,我們與他們聊到了一些近期熱點話題:5G 和自動駕駛、中美貿(mào)易爭端,以及剛剛出爐的 ICML 2019 最佳論文。Bengio 認為,那篇有關無監(jiān)督學習的論文,思路是錯誤的。
Yoshua Bengio 在專訪中還提到:「我認為美國和中國之間,以及許多西方國家和中國目前正在發(fā)生的事情是非常『不幸』的……我認為,在人類歷史上,我們比以往任何時候都更需要強大和協(xié)作的國際協(xié)調(diào)。」
讓我們看看這位深度學習的奠基者是怎么說的。
人工智能大發(fā)展的時代
恭喜您與 Hinton 博士和 LeCun 博士共獲圖靈獎!這很了不起,對 AI 社區(qū)來說也是一個振奮人心的新聞。我想知道當您聽聞自己是圖靈獎獲得者之后,您做的第一件事是什么?
?
Yoshua Bengio:這個問題很有趣,因為他們在電話上告訴我的第一件事情是我不能告訴任何人。當然啦,我的第一反應就是告訴很多人。所以他們說我可以跟我的家人說一點點。一開始,我跟很少幾個人說了這件事,但我很難控制自己不去談這個,這樣一直過了三個星期,然后才公開宣布。
?
另外還有一個,我在知道這個新聞后感覺非常神奇,對吧?我的意思是我覺得我可以做得很好,但某種程度上這又是一種短暫易逝的感覺。就好像是你中了彩票大獎,但一天之后,你還是和原來一樣。對吧?
?
接下來我想到的是,從情感上來說,這個獎真的不應該只是表彰三個研究者。很多人的努力才讓這成為了可能,比如我們的合作者和我們的學生,還有圍繞深度學習進行科學研究的整個研究社區(qū)。我認為這個獎是對這個社區(qū)的表彰。這是非常重要的,因為過去的很多圖靈獎獲得者都對計算機科學做出了非常理論的貢獻,但深度學習卻大不相同。這是真正正在改變世界的東西。當然其中也有理論,但很多東西都非常涉及直覺,非常具體。
多年以來,機器學習這個研究分支都被認為不如理論計算機科學那樣有價值。所以我們獲得這個獎事實上傳遞了一個信號:機器學習 AI(尤其是深度學習)現(xiàn)在已經(jīng)確實為科學做出了重要貢獻,這些貢獻不只是來自公司企業(yè),也來自學術界。
在 2019 年,您看到的最激動人心或最具創(chuàng)新的機器學習趨勢有哪些?
?
Yoshua Bengio:我看到了在主動機器學習方面的一個進展,其中學習器獲得一個大型數(shù)據(jù)集,然后主動練習其與環(huán)境的交互。所以這不是強化學習,而是主動學習。在對話系統(tǒng)這樣的系統(tǒng)中,交互過程能讓學習器不斷改善或獲取信息。
?
這與傳統(tǒng)的方法非常不同。這與博弈論有關,也與我們不熟悉的新問題有關,比如多智能體。這也與因果問題有關,涉及很多方向。我認為整個研究領域沒有止步在一個極小范圍內(nèi),而是為研究者和公司們打開了許多有趣的新研究方向。
在最近舉行的ICML 2019大會上,最佳論文《Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations》挑戰(zhàn)了無監(jiān)督學習方法,您如何看待最近這些研究?以及之后無監(jiān)督學習的發(fā)展方向?
Yoshua Bengio:我知道那篇論文,但我還沒讀過。我認為這是對「disentangling」原本含義的誤解。很多人目前將disentangling理解為頂層變量的相互獨立關系,但那只是非常粗略的近似。想想你使用一門語言的情況。它們不是獨立的,因為你可以構建詞之間的聯(lián)系并得到句子。所以使用某種基本統(tǒng)計假設是錯誤的。包括這篇 ICML 最佳論文在內(nèi)的這整個體系的論文都試圖發(fā)現(xiàn)這些獨立的因素,我認為這不是正確的做法。這是我的看法。
如今很多大學已開辦了人工智能碩士、博士、甚至本科專業(yè)(特別是在中國)。如何看待這種情況,這對于學界發(fā)展是否有好處?
Yoshua Bengio:這很好,非常重要。我們的研究需要人才,而人才成長于大學。
MILA與滴滴的研究合作
滴滴和 MILA 是如何開始接觸的?這次合作的主要目標是什么?
?
吳國斌:實際上我們是從去年開始的。我們先訪問了 MILA。去年年底,Yoshua Bengio 訪問了滴滴。經(jīng)過幾次討論之后,我們都認為我們在智能駕駛的深度學習方面有很多共同興趣。這是研究方面。我們也都有為社會福祉研發(fā) AI 的興趣。尤其是在滴滴公司,我們有很多面向社會福祉的 AI 項目,比如照料司機的健康環(huán)境以及可用性項目。第三點是我們都關心人才培養(yǎng)。通過與 MILA 合作,我們肯定能培養(yǎng)出交通和 AI 人才。
去年 Bengio 教授訪問滴滴的目的是什么?
?
Yoshua Bengio:我當時正在訪問中國,而且拜訪了中國多個組織機構。我受邀前去訪問,而且我聽說過滴滴以及他們的工作。之前在蒙特利爾也曾有一次會面。我聽說過他們在強化學習領域的工作,而強化學習也是 MILA 的一大重要研究主題。
?
MILA 一開始基本只做深度學習研究。我們是深度學習領域的先行者,過去幾年,我們一直在擴大深度學習延展的范圍。所以如你所見,現(xiàn)代強化學習研究很多也都用到了深度學習,這也被稱為深度強化學習,其應用領域包括機器人、移動機器人和許多其它的決策系統(tǒng)。另外,MILA 也不再是一個單純關注基礎研究的組織了,我們也希望與世界其它部分連接起來——通過與公司企業(yè)合作、參與到對社會有益的機器學習 AI 應用的研發(fā)中以及參與到那些公共討論中,比如政府和企業(yè)應當如何定義什么是好的 AI 應用以及什么在社會福祉方面是可以接受的。
?
我和 Liam Paull(他是一位移動機器人的專家)等同事與滴滴的互動使我們認為這樣的互動是互利共贏的。
能具體說明滴滴和 MILA 在做哪方面的共同研究嗎?你們提到了強化學習,這會是你們研究的一大主要部分。其它部分呢?在 AI 實現(xiàn)社會福祉方面又如何呢?
?
Yoshua Bengio:目前來說,我認為這個項目還有待定義。但讓我從我們 MILA 想要研究的方向來回答一下。這可能也會與滴滴有所關聯(lián)。在深度強化學習方面,有很多有趣的研究都想要問答這一問題:一個學習系統(tǒng)可以如何與其環(huán)境交互,根據(jù)所見到的決策的效果來采取決策,從而搞清楚這個環(huán)境的運作方式?以及搞清楚哪些策略是有效的,哪些是無效的?這就是通常意義上的強化學習問題。
?
但在 MILA,我們感興趣的是構建能以某種方式理解其環(huán)境的系統(tǒng)。因此,要構建一個模型,獲取所觀察到的現(xiàn)象的基本解釋。這是一個非常基本的研究問題,涉及很多方面,比如我個人很感興趣的理解變量之間的因果關系。實際上當前機器學習領域非常缺少這樣的研究,但這對工業(yè)界非常重要;因為在工業(yè)界,你需要的不只是獲取變量之間的相關性,你還要了解如何進行決策,你要了解這樣或那樣的動作會導致怎樣的結果。
?
我舉個例子。下雨與我打開雨傘是存在關聯(lián)的,這是個事實,但我不能通過打開雨傘來實現(xiàn)下雨。但是,如果開始下雨,則會產(chǎn)生我打開雨傘的效果。所以可以看到,如果只是變量之間的相關性,是無法提供有關因果的信息的,但如果你要在真實世界中做決策,而且滴滴要做大量會影響到很多人的決策,你就需要理解因果關系。這是一個相當基本的研究問題。
?
我們也在使用 donkey car 環(huán)境研究移動機器人,這是學生也能非常輕松地應對的東西。它們其實就是有輪子的樂高積木,能夠在非常迷你的城市中像非常小的汽車一樣移動。然后我們就探索不同的強化學習和控制方法可以如何確定它們的路徑、避免發(fā)生事故、優(yōu)化某種獎勵。這其實正是 Liam Paull 教授會在這次合作中參與的研究。他在這方面引領世界。
?
在社會福祉方面。MILA 的使命就聚焦于讓研究成果能對世界產(chǎn)生積極影響。過去,我們已經(jīng)參與了醫(yī)療保健應用。最近我們開始研究與環(huán)境相關的問題,比如氣候變化問題。我們也在與將機器學習用于教育的公司合作。所以我們非常關心以一種讓很多人受益的方式部署我們的研究。而且我們也在積極參與 AI 相關的社會對話。我認為政府、公司、研究者、人文學者、哲學家和人民之間需要大量討論,以共同決定我們要如何處理 AI 給予我們的新力量。
?
吳國斌:我贊同 Bengio 博士。滴滴旗下有很多司機,就像是某種多智能體系統(tǒng)。所以如果考慮某種長期獎勵,深度強化學習就是針對這類主題的非常好的研究。
?
Yoshua Bengio:多智能體系統(tǒng)實際上處于研究前沿。過去,強化學習研究者關注的是單智能體,旨在優(yōu)化未來獎勵。但在很多現(xiàn)實生活的場景中,智能體有很多,比如司機,每一個都會盡力優(yōu)化他們各自的獎勵。我們必須非常謹慎,因為博弈論告訴我們盡管每個智能體都有可能實現(xiàn)最優(yōu)化,但它們也有可能被困在某個對所有智能體都不利的局面。
因此,它們需要彼此通信,以確保它們能以一種對盡可能多的智能體有利的方式協(xié)同運作。所以這需要協(xié)調(diào),這也是語言存在的原因。它能幫助我們協(xié)同一起去做成事情,這比我們每個人都只獨立去做自己的事要好得多。
?
這方面的研究還比較新。不同的智能體如何學習協(xié)調(diào)各自動作的通信語言,這方面還有很多問題。
上周四,MILA與滴滴出行宣布達成了戰(zhàn)略合作協(xié)議。
目前滴滴已在駕乘共享業(yè)務以及其它一些共享通勤業(yè)務上取得了成功。滴滴過去還曾表示其將會革新或甚至塑造交通乃至城市的未來。所以我想知道你們的合作將如何幫助實現(xiàn)這一目標?
Yoshua Bengio:MILA 現(xiàn)在是世界上深度學習研究者最集中的學術界機構。所以對于想要緊跟科學進展以及靠近這個研究者群體的公司來說,這是一個很獨特的地方。需要記得一個重點,機器學習領域的研究發(fā)展速度非常快。我和同事曾在三年前為深度學習寫了一本書(與Aaron C. Courville、Ian Goodfellow等人共著的《Deep Learning》),這三年來情況已經(jīng)發(fā)生了很大的變化,也誕生了很多新思想。所以我想對于公司而言,緊跟發(fā)展進程是非常利益相關的。要做到這一點,一個好辦法就是與引領該科學前沿的研究機構建立良好的關系。
?
吳國斌:在 AI 實現(xiàn)社會福祉方面,滴滴實際上付出了很多努力。去年我們在北京建立了一個 AI 賦能社會共創(chuàng)平臺。所以我們已經(jīng)有多個與 AI 實現(xiàn)社會福祉相關的項目,比如環(huán)境方面的。我們在我們的滴滴汽車中安裝了一些遠程傳感器,用于發(fā)送某些空氣污染指數(shù)。這是一個非常相關的項目。另一個是我們也安裝了 AI 司機助手,能夠為駕駛員的生活和駕駛提供幫助。
交流與沖突
加拿大和美國雖是兩個不同的國家,但在如今的環(huán)境下能看到 MILA 愿意和中國的科技公司合作,著實有些出乎預料——畢竟美國現(xiàn)在正在清洗中國的學者。MILA 仍有興趣與中國公司合作的原因是什么呢?
?
Yoshua Bengio:我喜歡你的問題。我認為現(xiàn)在美國和中國以及很多西方國家和中國之間發(fā)生的事情是非常不幸的。這無助于在國際層面上解決需要解決的問題,從而讓這個社會變得更好。我認為我們現(xiàn)在處在人類歷史的這樣一個時期:我們比以往任何時候都需要強大和協(xié)同的國際合作。否則我們無法解決氣候變化這樣的問題。我們甚至可能無法處理由 AI 帶來的問題,比如我很擔憂的一個問題是機器學習被用在殺人無人機里面。所有這些事情都需要國際性的條約。國際合作是非常強大的。
?
當出現(xiàn)今年這種互相挑釁地拉幫結派和政治緊張局勢時,一切都會走向錯誤方向。這也毫無用處。所以我想我們押注未來會走向更好的方向。我也認為我們與滴滴的這類合作也能向政府釋放信號:互利共贏是要一起去努力。這可能只是個小舉措,但如果有足夠多的組織能跟隨這類范例,那么就可能帶來影響。
?
在我與滴滴的研究者的互動中,我的感覺是他們已經(jīng)在機器學習專業(yè)知識方面達到了與時俱進;他們有很多數(shù)據(jù),他們也在實驗最先進的方法。因為 MILA 在做非常前沿的研究,所以他們也可以從中受益。同時全世界還有很多公司甚至不能適當?shù)亟M織自己的數(shù)據(jù),更別說及時使用機器學習了。
我們在建立合作關系時,我們希望合作伙伴已經(jīng)準備好利用他們與我們的互動了。否則,就會出現(xiàn)很多讓人挫敗的結果。如果連基本的數(shù)據(jù)科學都做不好,那肯定是做不好 AI 的,因為這需要爆發(fā)式的數(shù)據(jù)。如果公司不建立自己的內(nèi)部研究團隊,那么學術界的研究者與產(chǎn)業(yè)界的研究者會很難溝通。雖然可以做,但雙方都要付出多很多的努力去溝通,尤其是一開始雙方甚至不說同一種語言時。
說到學術界和產(chǎn)業(yè)界,我們知道大學的很多人才正在流入產(chǎn)業(yè)界。這種學術界向產(chǎn)業(yè)界的人才流動會對基礎研究產(chǎn)生什么影響?
?
Yoshua Bengio:這是好問題。我要說一兩年前的情況甚至更糟,因為很大一部分的機器學習教職人員都被公司挖走了。所以現(xiàn)在,我這一代仍為大學工作并從事深度學習研究的資深研究者已經(jīng)很少了,甚至二十年或十年前畢業(yè)人都不多了。總之人不是很多。
?
好消息是過去三四年 MILA 以及全世界許多研究機器學習和深度學習的大學迎來了世界各地的研究生博士生,推動著這門科學的進步。現(xiàn)在這些人正在進入人才市場。所以我想我們將開始迎來新的教職人員,年輕的教職人員將開始教授深度學習。以蒙特利爾為例,大約六年前我們 MILA 只有五位教授。而現(xiàn)在我們 MILA 有二十位常駐教授,只是這個學年,我們就要在與我有聯(lián)系的不同大學之間填補近十個教職崗位。所以有很多新的教授在進入大學。我們通過這種方式流失大量人員雖然仍是個問題,但情況在開始好轉。
?
另一件有幫助的事情是我們可以和公司達成協(xié)議讓某些教授兼顧產(chǎn)業(yè)界和學術界而工作。時間比例可以從非常極端的 80-20 或 20-80 到平均的 50-50。這種做法的好處是這些教授可以繼續(xù)指導研究生。他們的教學時間可能更少了或完全不教課,但他們?nèi)匀荒軒椭柧毾乱淮斎凰麄円餐ǔ懈玫氖杖搿K悦總€人都能滿意。至少我們維持了訓練下一代的能力,這是最重要的事情。
2019 年 6 月 15 日,Yoshua Bengio、Geoffrey Hinton 與 Yann LeCun 在圖靈獎頒獎典禮上。
人工智能和 5G 中哪項技術對自動駕駛更重要?
Yoshua Bengio:5G 涉及的是基礎設施和通信。AI 則關乎我們構建智能和決策的方式。當然 5G 也許能促進數(shù)據(jù)獲取。在我看來,這兩個領域的研究是獨立的。
你知道訓練深度學習算法也會導致氣候變化嗎?
?
Yoshua Bengio:這基本上是個假新聞。我有一些同事正要寫點東西反駁這個說法。舉個例子,比如谷歌訓練的那些模型。谷歌已經(jīng)設立了一個系統(tǒng)讓他們的 GPU 和其它設備的能源消耗達到碳平衡。他們的方法是,對于他們的計算機使用的所有電力,他們會購買水電等負碳的電力來源,以將相同數(shù)量的能源投入電網(wǎng)。這樣就以某種方式抵消了消費過程中潛在的碳產(chǎn)生。這一點要記住。當今負責任的公司雖然燃燒了大量能源,他們也在為此負責。
?
還有一件事,我知道我需要謹慎一點,因為我自己沒做這些計算。但我和一些人談過,我們做的研究所消耗的實際能量其實并不多——我想具體數(shù)字還需要仔細檢驗。原因是這取決于你是如何做計算的,也取決于你的模型大小。有些模型非常大,甚至我們 MILA 也無力運行它們,因為我們沒有那樣的基礎設施。所以僅有少數(shù)幾家公司能夠運行他們談到的那些非常大的模型。所以那個新聞存在很多問題。
?
但這個新聞好的部分是也許能幫助公司更有意識地去關注他們在計算上的能源消耗對氣候變化的影響。然后它們能學習谷歌等公司的做法。我認為這能激勵人們研究能耗高效的計算。公司能去開發(fā)也許能效高十倍甚至百倍的芯片。這是好的方面,但我認為這有些夸大了。
深度Pro
理論詳解 | 工程實踐 | 產(chǎn)業(yè)分析 | 行研報告
機器之心最新上線深度內(nèi)容欄目,匯總AI深度好文,詳解理論、工程、產(chǎn)業(yè)與應用。這里的每一篇文章,都需要深度閱讀15分鐘。
今日深度推薦
點擊圖片,進入小程序深度Pro欄目
PC點擊閱讀原文,訪問官網(wǎng)
更適合深度閱讀
www.jiqizhixin.com/insight
每日重要論文、教程、資訊、報告也不想錯過?
點擊訂閱每日精選