完美世界辰东小说,好看的小说君子以泽

為明天的人工智能應(yīng)用構(gòu)建工具

我們正在為未來的人工智能應(yīng)用奠定基礎(chǔ)，但還沒完成

2018年4月26日

編者注：讀者可以查看2018年9月4-7日在舊金山舉辦的人工智能大會(huì)上的“實(shí)現(xiàn)人工智能”的議題。

在過去幾年中人工智能（AI）和深度學(xué)習(xí)（DL）幾乎是同義詞了。我們已經(jīng)看到AlphaGo作為深度學(xué)習(xí)的一個(gè)案例被各種吹捧。我們也看到深度學(xué)習(xí)用于命名油漆顏色（不是很成功）、模仿倫勃朗和其他偉大的畫家的作品，以及許多其他的應(yīng)用。正如Fran?ois Chollet在推特上所說的那樣，深度學(xué)習(xí)之所以取得成功，部分是因?yàn)椋骸?a >只使用一點(diǎn)非?；镜募夹g(shù)就可以獲得驚人的成功”。換句話說，你不必成為人工智能專家可以使用深度學(xué)習(xí)來完成這些。深度學(xué)習(xí)明顯的簡單性（只需要了解少量基本技術(shù)）使人工智能“民主化”變得更容易，讓沒有應(yīng)用數(shù)學(xué)或計(jì)算機(jī)科學(xué)博士學(xué)位的開發(fā)人員成為人工智能開發(fā)的核心。

但話說回來，深度學(xué)習(xí)也存在嚴(yán)重的問題。正如Ali Rahimi所說，我們經(jīng)?？梢钥吹缴疃葘W(xué)習(xí)起作用，但我們并不理解深度學(xué)習(xí)是如何工作、什么時(shí)候或?yàn)槭裁雌鹱饔?/a>，甚至離完全理解這些問題還很遠(yuǎn)。“我們僅僅（給新的AI開發(fā)人員）提供比忽悠和預(yù)先訓(xùn)練的深度網(wǎng)絡(luò)多一點(diǎn)的東西，然后就要求他們進(jìn)行創(chuàng)新。我們幾乎無法就我們應(yīng)該解釋的現(xiàn)象達(dá)成一致”。深度學(xué)習(xí)的成功是有啟發(fā)性的，但如果我們無法弄清楚它為何起作用，它作為工具的價(jià)值是有限的。我們可以建立一支深度學(xué)習(xí)開發(fā)人員隊(duì)伍，但如果只能告訴他們“這里有一些工具，你們隨便嘗試，祝好運(yùn)”，這將沒什么作用。

然而，沒有什么是看起來這么簡單。我們迄今為止看到的最佳應(yīng)用是混合系統(tǒng)。 AlphaGo不是一個(gè)純粹的深度學(xué)習(xí)引擎，它結(jié)合了蒙特卡羅樹搜索和至少兩個(gè)深度神經(jīng)網(wǎng)絡(luò)。在2017年O’Reilly紐約人工智能大會(huì)上，Josh Tenenbaum和David Ferrucci勾勒出他們正在研究的系統(tǒng)，這些系統(tǒng)將深度學(xué)習(xí)與其他想法和方法相結(jié)合。Tenenbaum正研究一次性學(xué)習(xí)，模仿基于單個(gè)經(jīng)驗(yàn)的人類學(xué)習(xí)能力。而Ferrucci正致力于構(gòu)建認(rèn)知模型，使機(jī)器能夠以有意義的方式理解人類語言，而不僅僅是模式匹配。DeepStack的撲克游戲系統(tǒng)將神經(jīng)網(wǎng)絡(luò)與反事實(shí)后悔最小化和啟發(fā)式搜索相結(jié)合。

加入結(jié)構(gòu)信息來改善模型

深度學(xué)習(xí)的基本思想非常簡單：深度學(xué)習(xí)系統(tǒng)通常是具有多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò)。每個(gè)神經(jīng)元都非常簡單：它從前一層中獲取很多輸入，根據(jù)一組權(quán)重組合它們，并產(chǎn)生輸出，傳遞到下一層。神經(jīng)網(wǎng)絡(luò)并不關(guān)心它處理的是圖像、文本還是遙測信號。然而，這種簡單性暗示著我們可能忽略了許多數(shù)據(jù)內(nèi)在的結(jié)構(gòu)。圖像和文字不一樣，它們的結(jié)構(gòu)不同。語言有很多內(nèi)部關(guān)聯(lián)關(guān)系和結(jié)構(gòu)。正如計(jì)算語言學(xué)家Chris Manning所說：

我認(rèn)為當(dāng)前這個(gè)每個(gè)人都對于快速GPU、海量數(shù)據(jù)和很好的深度學(xué)習(xí)算法進(jìn)行鼓吹的時(shí)代已經(jīng)讓計(jì)算語言學(xué)偏離了正軌。因?yàn)槿绻阌写罅康挠?jì)算資源和海量的數(shù)據(jù)，你可以用一個(gè)簡單的學(xué)習(xí)應(yīng)用做很多事情。但那些學(xué)習(xí)模型是非常糟糕的學(xué)習(xí)者。人類是非常好的學(xué)習(xí)者。我們想要做的是構(gòu)建有非常好的學(xué)習(xí)者的人工智能應(yīng)用。……實(shí)現(xiàn)這些學(xué)習(xí)能力的方法是（對模型）加入更多內(nèi)在結(jié)構(gòu)。

如果我們要構(gòu)建能像人類這樣理解語言的人工智能應(yīng)用，我們必將利用語言中的內(nèi)在聯(lián)系和結(jié)構(gòu)。從這個(gè)角度來看，深度學(xué)習(xí)是一個(gè)富有成果的死胡同：它是一條捷徑，但阻礙了我們提出關(guān)于知識是如何構(gòu)架的真正重要問題。Gary Marcus提出了一個(gè)更激進(jìn)的觀點(diǎn)：

存在一個(gè)人工智能研究人員應(yīng)該更多思考可能存在內(nèi)在機(jī)制的空間。簡單地假設(shè)包含很少或根本沒有內(nèi)在機(jī)制，往好了說是目光短淺的。往壞了說，不假思索地從頭開始重新學(xué)習(xí)一切可能是徹頭徹尾的愚蠢，只是有效地讓每個(gè)人工智能系統(tǒng)處于不得不重新學(xué)習(xí)大部分（人類）十億年的演化的地位。

深度學(xué)習(xí)始于一種至少原則上是基于人類大腦的模型：神經(jīng)元的互連，以及人類大腦開始時(shí)是空白一片的古老概念。Marcus認(rèn)為人類天生具有一些能力（例如，學(xué)習(xí)語言的能力或形成抽象的能力），對這些能力目前我們依然知之甚少。為了讓人工智能超越深度學(xué)習(xí)，他建議研究人員必須學(xué)習(xí)如何對這些天生的能力進(jìn)行建模。

另外還有其他前進(jìn)發(fā)展的道路。Ben Recht最近寫了一系列文章，勾畫出如何解決那些強(qiáng)化學(xué)習(xí)適用的問題。他還擔(dān)心如今所宣傳的深度學(xué)習(xí)承諾的希望超出了它的能力：

如果你閱讀《Hacker News》，你會(huì)認(rèn)為深度強(qiáng)化學(xué)習(xí)可以用來解決任何問題。 ……當(dāng)在新聞稿中出現(xiàn)這樣大膽的聲明時(shí)，我個(gè)人會(huì)表示懷疑，特別是當(dāng)其他研究人員懷疑聲明內(nèi)容的可重復(fù)性時(shí)。

Recht主張全面回顧和查看利用最優(yōu)控制和動(dòng)態(tài)系統(tǒng)技術(shù)來增強(qiáng)強(qiáng)化學(xué)習(xí)的可能性。這樣做可以讓強(qiáng)化學(xué)習(xí)模型受益于許多已經(jīng)在實(shí)際應(yīng)用中使用的研究結(jié)果和技術(shù)。他指出：

拋棄模型和知識，我們永遠(yuǎn)不知道能不能從一點(diǎn)樣本和隨機(jī)種子中學(xué)到足夠的泛化能力。

人工智能不僅僅是機(jī)器學(xué)習(xí)

正如Michael Jordan在最近一篇文章中指出的那樣，現(xiàn)在所謂的人工智能通常是指的機(jī)器學(xué)習(xí)（ML）。作為組織人工智能會(huì)議的人，筆者可以證明這一點(diǎn)：我們收到的許多提案都是關(guān)于標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)應(yīng)用的?；靵y是不可避免的：當(dāng)宣稱研究是“人工智能”項(xiàng)目幾乎不受尊重時(shí)，我們使用術(shù)語“機(jī)器學(xué)習(xí)”。機(jī)器學(xué)習(xí)成為“人工智能里有用的部分”的簡寫。迄今為止的這些有用的部分（包括深度學(xué)習(xí)）基本上都是大規(guī)模的數(shù)據(jù)分析?，F(xiàn)在，喧囂潮頭已經(jīng)過去，每個(gè)人都想獲得人工智能，而機(jī)器學(xué)習(xí)應(yīng)用再次成為人工智能應(yīng)用。

但是，一個(gè)完整的人工智能應(yīng)用（例如自動(dòng)駕駛汽車）需要的不僅僅是數(shù)據(jù)分析。它需要許多領(lǐng)域（遠(yuǎn)不只模式識別領(lǐng)域）都取得進(jìn)展。想要構(gòu)建自動(dòng)駕駛汽車和其他真正的人工智能應(yīng)用，我們需要在傳感器和其他硬件方面取得重大進(jìn)展；我們需要學(xué)習(xí)如何為“邊緣設(shè)備”構(gòu)建軟件，其中包括理解如何在邊緣設(shè)備和 “云端”之間分配任務(wù)；我們需要開發(fā)模擬和分布式計(jì)算的基礎(chǔ)設(shè)施；我們還需要了解如何為真正的智能設(shè)備創(chuàng)造用戶體驗(yàn)。

Jordan強(qiáng)調(diào)了未來的研究需要重點(diǎn)關(guān)注的兩個(gè)領(lǐng)域。

智能增強(qiáng)（IA）：旨在增強(qiáng)人類智力和能力的工具。這些工具包括搜索引擎（它記住我們沒法記住的事情）、自動(dòng)翻譯，甚至還包括對藝術(shù)家和音樂家的幫助。這些工具可能涉及高級的推理和思考，目前的實(shí)現(xiàn)還沒有這些能力。

智能基礎(chǔ)設(shè)施（II）：Jordan把智能基礎(chǔ)設(shè)施定義為“計(jì)算、數(shù)據(jù)和物理實(shí)體組成的網(wǎng)絡(luò)，它能使人類的環(huán)境有更多的支持、更有趣和更安全”。這將包括安全地共享醫(yī)療數(shù)據(jù)的網(wǎng)絡(luò)、使運(yùn)輸更安全的系統(tǒng)（包括智能汽車和智能道路），以及許多其他應(yīng)用。智能基礎(chǔ)設(shè)施是以支持人類生活的方式來管理數(shù)據(jù)流。

Jordan觀點(diǎn)里最重要的部分是：如果我們只關(guān)注模仿人類的人工智能，我們就不會(huì)得到IA或II。前者本質(zhì)上是多學(xué)科交叉的，需要新視角來超越用單一的智能體來學(xué)習(xí)輸入到輸出映射。這種視角以及目前它的深度學(xué)習(xí)的實(shí)現(xiàn)將不可避免地成為解決方案的一部分，但同樣不可避免地，它不會(huì)是整個(gè)解決方案。

總結(jié)思考

許多機(jī)構(gòu)的研究人員正在構(gòu)建用于創(chuàng)建未來人工智能應(yīng)用的工具。雖然在深度學(xué)習(xí)領(lǐng)域仍有許多工作要做，但研究人員正在超越深度學(xué)習(xí)以構(gòu)建下一代人工智能系統(tǒng)。加州大學(xué)伯克利分校的RISE實(shí)驗(yàn)室擬定了一個(gè)涉及系統(tǒng)、架構(gòu)和安全性的研究議程。

Ameet Talwalkar最近的帖子還列出了一些業(yè)界機(jī)器學(xué)習(xí)平臺將會(huì)獲益的研究方向。業(yè)界的機(jī)器學(xué)習(xí)必須滿足系統(tǒng)要求，例如內(nèi)存限制、用電預(yù)算和嚴(yán)格的實(shí)時(shí)要求；它們必須易于部署和更新，因?yàn)閿?shù)據(jù)模型會(huì)隨著時(shí)間的推移趨于陳舊；它們必須安全。人類必須能理解應(yīng)用是如何做出決策，以及這些決策可能帶來的后果。這些應(yīng)用還必須考慮到道德規(guī)范。

這些都是Jordan所說的對于智能基礎(chǔ)設(shè)施的要求。在過去幾年中，我們已經(jīng)看到很多機(jī)器學(xué)習(xí)的案例都有著有問題的目的，包括從確定保釋和入獄判決，到有定向廣告、情緒操縱和錯(cuò)誤信息的傳播，這些都告訴我們不一樣的需求。人工智能的研究議程需要考慮數(shù)據(jù)的公平性和偏見、透明度、隱私和用戶的控制，以及從這些數(shù)據(jù)構(gòu)建出的模型。這些問題包括從道德到設(shè)計(jì)的一切：獲得用戶的知情同意，并向用戶解釋同意意味著什么，這不是一個(gè)微不足道的設(shè)計(jì)問題。我們才剛剛開始了解這些學(xué)科如何與人工智能研究聯(lián)系起來。幸運(yùn)的是，我們看到數(shù)據(jù)社區(qū)越來越關(guān)注將道德應(yīng)用于實(shí)踐。諸如數(shù)據(jù)交換（D4GX）、公平問責(zé)和透明度會(huì)議（FAT）等活動(dòng)都致力于數(shù)據(jù)道德建設(shè)。

Talwalkar指出，在萊特兄弟（首次成功飛行）之后將近50年里，航空旅行并沒有變得普遍。雖然他們是第一個(gè)實(shí)現(xiàn)飛行的人，但還需要更多的發(fā)展才能使飛行變得更安全、便宜和方便。我們正處于人工智能史的類似階段。我們在一些基本領(lǐng)域取得了進(jìn)展，我們最終建立的應(yīng)用無疑將是驚人的。我們目前正在為未來的人工智能應(yīng)用奠定基礎(chǔ)，但我們還沒有完成。

相關(guān)內(nèi)容：

《面向機(jī)器學(xué)習(xí)的噴氣時(shí)代》
《開放無限制性：你從未聽說過的最后的重大挑戰(zhàn)》
《理解語言依然是人工智能的重大挑戰(zhàn)之一》：David Ferrucci關(guān)于理解語言的人工智能系統(tǒng)演進(jìn)的觀點(diǎn)。
《機(jī)器學(xué)習(xí)的悖論》
《我們需要構(gòu)建機(jī)器學(xué)習(xí)工具來增強(qiáng)機(jī)器學(xué)習(xí)工程師》
《開發(fā)和部署大規(guī)模機(jī)器學(xué)習(xí)管道》：Ben Recht講述為什么我們需要原語、管道同步工具，以及最重要的，對錯(cuò)誤的分析和驗(yàn)證。
《如何大規(guī)模訓(xùn)練和部署深度學(xué)習(xí)》：Ameet Talwalkar講述大規(guī)模機(jī)器學(xué)習(xí)

Ben Lorica

Ben Lorica是O’Reilly Media公司的首席數(shù)據(jù)科學(xué)家，同時(shí)也是Strata數(shù)據(jù)會(huì)議和O’Reilly人工智能會(huì)議的內(nèi)容日程主管。他曾在多種場景下應(yīng)用商業(yè)智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)分析技術(shù)，這些場景包括直銷、消費(fèi)者與市場研究、定向廣告、文本挖掘和金融工程。他的背景包括在投資管理公司、互聯(lián)網(wǎng)初創(chuàng)企業(yè)和金融服務(wù)公司就職。

Mike Loukides

Mike Loukides是O’Reilly傳媒負(fù)責(zé)內(nèi)容策略的副總裁。他編輯了很多非Windows編程的廣受好評的技術(shù)書籍。特別是他對編程語言、Unix和其上的應(yīng)用、系統(tǒng)和網(wǎng)絡(luò)管理感興趣。Mike是《系統(tǒng)性能調(diào)優(yōu)》和《Unix上的強(qiáng)大工具》的作者之一。近年來，關(guān)注于數(shù)據(jù)和數(shù)據(jù)分析領(lǐng)域、分析語言（如R）、數(shù)學(xué)、Octave以及思考如何讓書籍更加社交化。

This article originally appeared in English: "Building tools for the AI applications of tomorrow".