在過去幾年中人工智能(AI)和深度學(xué)習(xí)(DL)幾乎是同義詞了。我們已經(jīng)看到AlphaGo作為深度學(xué)習(xí)的一個(gè)案例被各種吹捧。我們也看到深度學(xué)習(xí)用于命名油漆顏色(不是很成功)、模仿倫勃朗和其他偉大的畫家的作品,以及許多其他的應(yīng)用。正如Fran?ois Chollet在推特上所說的那樣,深度學(xué)習(xí)之所以取得成功,部分是因?yàn)椋骸?a >只使用一點(diǎn)非?;镜募夹g(shù)就可以獲得驚人的成功”。換句話說,你不必成為人工智能專家可以使用深度學(xué)習(xí)來完成這些。深度學(xué)習(xí)明顯的簡單性(只需要了解少量基本技術(shù))使人工智能“民主化”變得更容易,讓沒有應(yīng)用數(shù)學(xué)或計(jì)算機(jī)科學(xué)博士學(xué)位的開發(fā)人員成為人工智能開發(fā)的核心。
但話說回來,深度學(xué)習(xí)也存在嚴(yán)重的問題。正如Ali Rahimi所說,我們經(jīng)??梢钥吹缴疃葘W(xué)習(xí)起作用,但我們并不理解深度學(xué)習(xí)是如何工作、什么時(shí)候或?yàn)槭裁雌鹱饔?/a>,甚至離完全理解這些問題還很遠(yuǎn)。“我們僅僅(給新的AI開發(fā)人員)提供比忽悠和預(yù)先訓(xùn)練的深度網(wǎng)絡(luò)多一點(diǎn)的東西,然后就要求他們進(jìn)行創(chuàng)新。我們幾乎無法就我們應(yīng)該解釋的現(xiàn)象達(dá)成一致”。深度學(xué)習(xí)的成功是有啟發(fā)性的,但如果我們無法弄清楚它為何起作用,它作為工具的價(jià)值是有限的。我們可以建立一支深度學(xué)習(xí)開發(fā)人員隊(duì)伍,但如果只能告訴他們“這里有一些工具,你們隨便嘗試,祝好運(yùn)”,這將沒什么作用。
然而,沒有什么是看起來這么簡單。我們迄今為止看到的最佳應(yīng)用是混合系統(tǒng)。 AlphaGo不是一個(gè)純粹的深度學(xué)習(xí)引擎,它結(jié)合了蒙特卡羅樹搜索和至少兩個(gè)深度神經(jīng)網(wǎng)絡(luò)。在2017年O’Reilly紐約人工智能大會(huì)上,Josh Tenenbaum和David Ferrucci勾勒出他們正在研究的系統(tǒng),這些系統(tǒng)將深度學(xué)習(xí)與其他想法和方法相結(jié)合。Tenenbaum正研究一次性學(xué)習(xí),模仿基于單個(gè)經(jīng)驗(yàn)的人類學(xué)習(xí)能力。而Ferrucci正致力于構(gòu)建認(rèn)知模型,使機(jī)器能夠以有意義的方式理解人類語言,而不僅僅是模式匹配。DeepStack的撲克游戲系統(tǒng)將神經(jīng)網(wǎng)絡(luò)與反事實(shí)后悔最小化和啟發(fā)式搜索相結(jié)合。
加入結(jié)構(gòu)信息來改善模型
深度學(xué)習(xí)的基本思想非常簡單:深度學(xué)習(xí)系統(tǒng)通常是具有多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò)。 每個(gè)神經(jīng)元都非常簡單:它從前一層中獲取很多輸入,根據(jù)一組權(quán)重組合它們,并產(chǎn)生輸出,傳遞到下一層。神經(jīng)網(wǎng)絡(luò)并不關(guān)心它處理的是圖像、文本還是遙測信號。然而,這種簡單性暗示著我們可能忽略了許多數(shù)據(jù)內(nèi)在的結(jié)構(gòu)。圖像和文字不一樣,它們的結(jié)構(gòu)不同。語言有很多內(nèi)部關(guān)聯(lián)關(guān)系和結(jié)構(gòu)。正如計(jì)算語言學(xué)家Chris Manning所說:
我認(rèn)為當(dāng)前這個(gè)每個(gè)人都對于快速GPU、海量數(shù)據(jù)和很好的深度學(xué)習(xí)算法進(jìn)行鼓吹的時(shí)代已經(jīng)讓計(jì)算語言學(xué)偏離了正軌。因?yàn)槿绻阌写罅康挠?jì)算資源和海量的數(shù)據(jù),你可以用一個(gè)簡單的學(xué)習(xí)應(yīng)用做很多事情。但那些學(xué)習(xí)模型是非常糟糕的學(xué)習(xí)者。人類是非常好的學(xué)習(xí)者。我們想要做的是構(gòu)建有非常好的學(xué)習(xí)者的人工智能應(yīng)用。……實(shí)現(xiàn)這些學(xué)習(xí)能力的方法是(對模型)加入更多內(nèi)在結(jié)構(gòu)。
如果我們要構(gòu)建能像人類這樣理解語言的人工智能應(yīng)用,我們必將利用語言中的內(nèi)在聯(lián)系和結(jié)構(gòu)。從這個(gè)角度來看,深度學(xué)習(xí)是一個(gè)富有成果的死胡同:它是一條捷徑,但阻礙了我們提出關(guān)于知識是如何構(gòu)架的真正重要問題。Gary Marcus提出了一個(gè)更激進(jìn)的觀點(diǎn):
存在一個(gè)人工智能研究人員應(yīng)該更多思考可能存在內(nèi)在機(jī)制的空間。簡單地假設(shè)包含很少或根本沒有內(nèi)在機(jī)制,往好了說是目光短淺的。往壞了說,不假思索地從頭開始重新學(xué)習(xí)一切可能是徹頭徹尾的愚蠢,只是有效地讓每個(gè)人工智能系統(tǒng)處于不得不重新學(xué)習(xí)大部分(人類)十億年的演化的地位。
深度學(xué)習(xí)始于一種至少原則上是基于人類大腦的模型:神經(jīng)元的互連,以及人類大腦開始時(shí)是空白一片的古老概念。Marcus認(rèn)為人類天生具有一些能力(例如,學(xué)習(xí)語言的能力或形成抽象的能力),對這些能力目前我們依然知之甚少。為了讓人工智能超越深度學(xué)習(xí),他建議研究人員必須學(xué)習(xí)如何對這些天生的能力進(jìn)行建模。
另外還有其他前進(jìn)發(fā)展的道路。Ben Recht最近寫了一系列文章,勾畫出如何解決那些強(qiáng)化學(xué)習(xí)適用的問題。他還擔(dān)心如今所宣傳的深度學(xué)習(xí)承諾的希望超出了它的能力:
如果你閱讀《Hacker News》,你會(huì)認(rèn)為深度強(qiáng)化學(xué)習(xí)可以用來解決任何問題。 ……當(dāng)在新聞稿中出現(xiàn)這樣大膽的聲明時(shí),我個(gè)人會(huì)表示懷疑,特別是當(dāng)其他研究人員懷疑聲明內(nèi)容的可重復(fù)性時(shí)。
Recht主張全面回顧和查看利用最優(yōu)控制和動(dòng)態(tài)系統(tǒng)技術(shù)來增強(qiáng)強(qiáng)化學(xué)習(xí)的可能性。這樣做可以讓強(qiáng)化學(xué)習(xí)模型受益于許多已經(jīng)在實(shí)際應(yīng)用中使用的研究結(jié)果和技術(shù)。他指出:
拋棄模型和知識,我們永遠(yuǎn)不知道能不能從一點(diǎn)樣本和隨機(jī)種子中學(xué)到足夠的泛化能力。
人工智能不僅僅是機(jī)器學(xué)習(xí)
正如Michael Jordan在最近一篇文章中指出的那樣,現(xiàn)在所謂的人工智能通常是指的機(jī)器學(xué)習(xí)(ML)。作為組織人工智能會(huì)議的人,筆者可以證明這一點(diǎn):我們收到的許多提案都是關(guān)于標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)應(yīng)用的?;靵y是不可避免的:當(dāng)宣稱研究是“人工智能”項(xiàng)目幾乎不受尊重時(shí),我們使用術(shù)語“機(jī)器學(xué)習(xí)”。機(jī)器學(xué)習(xí)成為“人工智能里有用的部分”的簡寫。迄今為止的這些有用的部分(包括深度學(xué)習(xí))基本上都是大規(guī)模的數(shù)據(jù)分析?,F(xiàn)在,喧囂潮頭已經(jīng)過去,每個(gè)人都想獲得人工智能,而機(jī)器學(xué)習(xí)應(yīng)用再次成為人工智能應(yīng)用。
但是,一個(gè)完整的人工智能應(yīng)用(例如自動(dòng)駕駛汽車)需要的不僅僅是數(shù)據(jù)分析。 它需要許多領(lǐng)域(遠(yuǎn)不只模式識別領(lǐng)域)都取得進(jìn)展。想要構(gòu)建自動(dòng)駕駛汽車和其他真正的人工智能應(yīng)用,我們需要在傳感器和其他硬件方面取得重大進(jìn)展;我們需要學(xué)習(xí)如何為“邊緣設(shè)備”構(gòu)建軟件,其中包括理解如何在邊緣設(shè)備和 “云端”之間分配任務(wù);我們需要開發(fā)模擬和分布式計(jì)算的基礎(chǔ)設(shè)施;我們還需要了解如何為真正的智能設(shè)備創(chuàng)造用戶體驗(yàn)。
Jordan強(qiáng)調(diào)了未來的研究需要重點(diǎn)關(guān)注的兩個(gè)領(lǐng)域。
智能增強(qiáng)(IA):旨在增強(qiáng)人類智力和能力的工具。這些工具包括搜索引擎(它記住我們沒法記住的事情)、自動(dòng)翻譯,甚至還包括對藝術(shù)家和音樂家的幫助。這些工具可能涉及高級的推理和思考,目前的實(shí)現(xiàn)還沒有這些能力。
智能基礎(chǔ)設(shè)施(II):Jordan把智能基礎(chǔ)設(shè)施定義為“計(jì)算、數(shù)據(jù)和物理實(shí)體組成的網(wǎng)絡(luò),它能使人類的環(huán)境有更多的支持、更有趣和更安全”。這將包括安全地共享醫(yī)療數(shù)據(jù)的網(wǎng)絡(luò)、使運(yùn)輸更安全的系統(tǒng)(包括智能汽車和智能道路),以及許多其他應(yīng)用。智能基礎(chǔ)設(shè)施是以支持人類生活的方式來管理數(shù)據(jù)流。
Jordan觀點(diǎn)里最重要的部分是:如果我們只關(guān)注模仿人類的人工智能,我們就不會(huì)得到IA或II。前者本質(zhì)上是多學(xué)科交叉的,需要新視角來超越用單一的智能體來學(xué)習(xí)輸入到輸出映射。這種視角以及目前它的深度學(xué)習(xí)的實(shí)現(xiàn)將不可避免地成為解決方案的一部分,但同樣不可避免地,它不會(huì)是整個(gè)解決方案。
總結(jié)思考
許多機(jī)構(gòu)的研究人員正在構(gòu)建用于創(chuàng)建未來人工智能應(yīng)用的工具。雖然在深度學(xué)習(xí)領(lǐng)域仍有許多工作要做,但研究人員正在超越深度學(xué)習(xí)以構(gòu)建下一代人工智能系統(tǒng)。加州大學(xué)伯克利分校的RISE實(shí)驗(yàn)室擬定了一個(gè)涉及系統(tǒng)、架構(gòu)和安全性的研究議程。
Ameet Talwalkar最近的帖子還列出了一些業(yè)界機(jī)器學(xué)習(xí)平臺將會(huì)獲益的研究方向。業(yè)界的機(jī)器學(xué)習(xí)必須滿足系統(tǒng)要求,例如內(nèi)存限制、用電預(yù)算和嚴(yán)格的實(shí)時(shí)要求;它們必須易于部署和更新,因?yàn)閿?shù)據(jù)模型會(huì)隨著時(shí)間的推移趨于陳舊;它們必須安全。人類必須能理解應(yīng)用是如何做出決策,以及這些決策可能帶來的后果。這些應(yīng)用還必須考慮到道德規(guī)范。
這些都是Jordan所說的對于智能基礎(chǔ)設(shè)施的要求。在過去幾年中,我們已經(jīng)看到很多機(jī)器學(xué)習(xí)的案例都有著有問題的目的,包括從確定保釋和入獄判決,到有定向廣告、情緒操縱和錯(cuò)誤信息的傳播,這些都告訴我們不一樣的需求。人工智能的研究議程需要考慮數(shù)據(jù)的公平性和偏見、透明度、隱私和用戶的控制,以及從這些數(shù)據(jù)構(gòu)建出的模型。這些問題包括從道德到設(shè)計(jì)的一切:獲得用戶的知情同意,并向用戶解釋同意意味著什么,這不是一個(gè)微不足道的設(shè)計(jì)問題。我們才剛剛開始了解這些學(xué)科如何與人工智能研究聯(lián)系起來。幸運(yùn)的是,我們看到數(shù)據(jù)社區(qū)越來越關(guān)注將道德應(yīng)用于實(shí)踐。諸如數(shù)據(jù)交換(D4GX)、公平問責(zé)和透明度會(huì)議(FAT)等活動(dòng)都致力于數(shù)據(jù)道德建設(shè)。
Talwalkar指出,在萊特兄弟(首次成功飛行)之后將近50年里,航空旅行并沒有變得普遍。雖然他們是第一個(gè)實(shí)現(xiàn)飛行的人,但還需要更多的發(fā)展才能使飛行變得更安全、便宜和方便。我們正處于人工智能史的類似階段。我們在一些基本領(lǐng)域取得了進(jìn)展,我們最終建立的應(yīng)用無疑將是驚人的。我們目前正在為未來的人工智能應(yīng)用奠定基礎(chǔ),但我們還沒有完成。
相關(guān)內(nèi)容:
- 《面向機(jī)器學(xué)習(xí)的噴氣時(shí)代》
- 《開放無限制性:你從未聽說過的最后的重大挑戰(zhàn)》
- 《理解語言依然是人工智能的重大挑戰(zhàn)之一》:David Ferrucci關(guān)于理解語言的人工智能系統(tǒng)演進(jìn)的觀點(diǎn)。
- 《機(jī)器學(xué)習(xí)的悖論》
- 《我們需要構(gòu)建機(jī)器學(xué)習(xí)工具來增強(qiáng)機(jī)器學(xué)習(xí)工程師》
- 《開發(fā)和部署大規(guī)模機(jī)器學(xué)習(xí)管道》:Ben Recht講述為什么我們需要原語、管道同步工具,以及最重要的,對錯(cuò)誤的分析和驗(yàn)證。
- 《如何大規(guī)模訓(xùn)練和部署深度學(xué)習(xí)》:Ameet Talwalkar講述大規(guī)模機(jī)器學(xué)習(xí)



