91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

局部可理解的與模型無關(guān)的解釋(LIME)技術(shù)介紹
一種解釋任何機器學習分類器的預測的技術(shù)

機器學習是近來許多科學和技術(shù)進步的核心。隨著計算機在諸如圍棋比賽中戰(zhàn)勝人類專業(yè)選手等案例里所展現(xiàn)出的進步,許多人開始思考機器能否成為更好的司機或更好的醫(yī)生。

在機器學習的許多應用中,用戶常常被要求信任那些幫助他們進行決策的模型。但醫(yī)生肯定不能僅僅依據(jù)“模型就是這樣說的”來給病人動手術(shù)。即使是在低風險的場景里,比如在 Netflix 上選擇一部電影觀看,我們也需要某種程度的信任來決定將幾個小時時間交付給模型的決策。盡管許多機器學習模型都是黑箱,理解模型預測背后的基本原理將肯定有助于幫助用戶決定什么時候可以信任模型的預測或是不信任。如圖1所示,模型預測某個病人患有流感。然后該預測由一個解釋器來解釋,強調(diào)了對模型來說最重要的癥狀?;谶@些模型背后的推理信息,醫(yī)生現(xiàn)在就有能力選擇是否信任這個模型了。

figure1-a9533a3fb9bb9ace6ee96b4cdc9b6bcb

圖1:向人類決策者解釋單個預測。圖片來源:Marco Tulio Ribeiro

從某種意義上說,工程師每次將一個機器學習模型應用于生產(chǎn)系統(tǒng)時,他或她都隱含地表示信任模型將能夠做出合理的預測。這樣的信心通常是通過評估保留數(shù)據(jù)驗證的準確性或其它一些聚合評測來獲得的。但是,任何實踐過機器學習應用的人都知道,這些指標有時是非常有誤導性的。有時候,不應該使用的數(shù)據(jù)意外地混入了訓練數(shù)據(jù)和驗證數(shù)據(jù)中。有時候,模型會給出一些尷尬得難以接受的錯誤。這些和其它的問題說明,在決定一個模型是否值得信任時,能理解模型的預測可以成為一個有用的工具。這是因為人類通常有較好的直覺和商業(yè)智慧,而這些都難以在評估指標中獲得。如果在機器學習過程中有一個“挑選步驟”,即可以選擇某些典型的預測去解釋給人來聽,那么這個過程就會類似于圖2。

figure2-802e0856e423b6bf8862843102243a8b

圖2:向人類決策者解釋一個模型。圖片來源:Marco Tulio Ribeiro

在由Marco Tulio Ribeiro,Sameer SinghCarlos Guestrin合作發(fā)表于 ACM 知識發(fā)現(xiàn)和數(shù)據(jù)挖掘年會(KDD2016)上的論文《“為什么我應該相信你?”解釋任何分類器的預測》中,我們對信任和解釋的問題進行了精細地探索。我們提出了局部可理解的與模型無關(guān)的解釋技術(shù)(Local Interpretable Model-Agnostic Explanations: LIME),一種用于解釋任何機器學習分類器的預測的技術(shù),并在多種與信任相關(guān)的任務中評估了它的可用性。

LIME 背后的直覺

因為我們希望能做到與預測模型無關(guān),所以為了能理解模型內(nèi)部的行為,我們所能做的是去干涉輸入,然后觀察預測結(jié)果會怎樣變化。實驗表明這種做法在可解釋性上是有用的,這是因為我們可以通過改變?nèi)祟惪梢岳斫獾慕M件(比如單詞或圖像的一部分)來改變輸入,即使模型使用的是更加復雜的組件(比如詞向量)作為輸入的特征。

改變原有實例數(shù)據(jù)(比如移除部分單詞或隱藏圖像的一部分)去學到的一個可解讀的模型(比如只帶有少量非零系數(shù)的線性模型),并用它來近似原有的底層模型。通過這個方法我們就得到了一個對原有模型的解釋。LIME 背后的關(guān)鍵直覺就是,通過一個簡單的模型來局部地(在我們想要解釋的預測的附近)逼近一個黑箱模型會比全局性地去逼近這個模型要容易得多。這個思想可以通過給改變后的輸入圖像設定權(quán)重的方式來實現(xiàn),而權(quán)重的值是改變后的圖形和我們想要解釋的實例的相似度的值。上面流感預測的例子里,那三個強調(diào)的癥狀就可能是預測這種類型病人的黑箱模型的準確近似,但它們可能并不能代表該模型在所有病人上的行為方式。

圖 3 所示的例子說明了LIME在圖像分類上是如何工作的。假設我們想解釋一個可以預測圖片中是否包含樹蛙的分類器,我們可以借助左邊被分解成可解讀的組件(連續(xù)超像素)的圖像。

figure3-2cea505fe733a4713eeff3b90f696507

圖3:將一張圖片轉(zhuǎn)換成可理解的多個組件。圖片來源:Marco Tulio Ribeiro和Pixabay

如圖 4 所示,我們通過“隱藏”一些可解讀組件生成一個修改過的實例的數(shù)據(jù)集(在這個例子中是將隱藏的組件都設置成灰色)。對于每一個被修改過的實例,模型都會以一定概率判斷圖像實例是否包含樹蛙。然后我們就在這個局部加權(quán)的數(shù)據(jù)集上得到了一個簡單的(線性)回歸模型,而我們更關(guān)心在更接近原始圖像的修改過的實例上出現(xiàn)的錯誤。最后,我們給出帶有最高正權(quán)重的超像素作為解釋,將其它部分都改成灰色。

figure4-99d9ea184dd35876e0dbae81f6fce038

圖4:用LIME解釋一個預測。圖片來源:Marco Tulio Ribeiro和Pixabay

例子

我們使用 LIME 解釋了文本和圖像領(lǐng)域內(nèi)的大量分類器(比如隨機森林、支持向量機神經(jīng)網(wǎng)絡)。下面是一些由它所生成的解釋的例子。

首先是一個本分類器的例子。20 newsgroups 數(shù)據(jù)集是此領(lǐng)域里一個有名的基準數(shù)據(jù),多篇論文中描述了使用這個數(shù)據(jù)集的不同模型。從中我們選取兩個比較難區(qū)分的分類,基督教(Christianity)和無神論(atheism),它們之間有很多相同的詞匯。訓練一個有 500 樹的隨機森林,我們在測試集上得到的準確率為 92.4%,高得驚人。如果準確率是我們能夠取信的唯一標準,我們能完全信任這個模型。然而,讓我們來看一下圖 5 所示的對測試集中的一個例子的解釋(使用開源軟件包中的一句 Python 代碼即可實現(xiàn)):

exp = explainer.explain_instance(test_example, classifier.predict_proba, num_features=6)

figure5-cd7d3c5128549df1e957bf8f9f93bb2b

圖5:20 newsgroups數(shù)據(jù)集上預測的解釋。圖片來源:Marco Tulio Ribeiro

這是一個分類器因為錯誤的原因卻準確地預測了樣本的分類的例子。額外的解釋顯示出“posting(郵件標頭的一部分)”一詞出現(xiàn)在無神論分類的訓練集中21.6% 的樣本上,但在基督教分類中只出現(xiàn)了兩次。測試數(shù)據(jù)集中的情況類似,該詞在 20% 的無神論樣本中出現(xiàn),但在基督教分類中僅出現(xiàn)了兩次。數(shù)據(jù)集中的這種情況使得(這個數(shù)據(jù)集上的)分類問題要比真實世界的問題簡單得多,但在實際應用里我們并不期待會有類似的模式出現(xiàn)。一旦你理解了這些模型實際是如何工作的,獲得這些洞察就變得很簡單,相應的也會促進模型的泛化能力更好。

第二個例子是解釋谷歌的Inception神經(jīng)網(wǎng)絡模型對圖像做的分類。如圖 6所示,分類器預測這個圖像是“樹蛙”類的概率最高,而“臺球”和“氣球”的概率低一些。我們的解釋揭示該分類器主要專注于蛙的面部作為此預測分類的依據(jù)。它也說明了為什么“臺球桌”有非零概率,因為青蛙的爪子和眼與臺球非常地相似,特別是在綠色背景下。同樣,紅色的心臟也和紅氣球類似。

Figure-6-c8db425eefec7cff5a3cf035a40d8841

圖6:解釋Inception神經(jīng)網(wǎng)絡模型生成的預測。頭三名預測結(jié)果是“樹蛙”、“臺球桌”和“氣球”。圖片來源:Marco Tulio Ribeiro和Pixabay提供的樹蛙、臺球和熱氣球圖片。

我們論文所述的實驗表明機器學習專家和普通人都能從類似于圖5和圖6 這樣的解釋中獲益。能夠選擇哪個模型泛化的更好,能夠通過改變模型對模型進行改進,以及獲得模型行為的關(guān)鍵洞察。

結(jié)論

為了有好地與機器學習系統(tǒng)進行交互,信任是非常重要的。我們認為能解釋每個預測是獲取信任的一個有效方式。LIME是一個方便機器學習實踐者獲得這樣的信任的有效工具,也是一個值得加入他們的工具包的好選擇(說了我們已經(jīng)提供了開源包了嗎?)。但在更好地解釋機器學習模型方面還有很多工作可以做。我們期待看到這個方向上有更多的研究成果出現(xiàn)。下面的視頻里概況地介紹了LIME。在我們的論文里有更多的細節(jié)。

marco-riberio-square-e5ad66b2322e588a6793b190c4530c74

Marco Tulio Ribeiro是華盛頓大學的一名博士生,與Carlos Guestrin一起工作。他的主要研究方向是讓人去理解模型和與機器學習模型的交互更加容易。

sameer-head-shot-e36736576dfc37d7beb26778ca5856fe

Sameer Singh博士是加州大學歐文分校的助理教授。他主要從事大規(guī)模、交互式機器學習和自然語言處理方面的研究。

carlos-guestrin-e886cca0946eaf1a83f9b22fa440e92f

Carlos Guestrin是Turi公司的CEO和華盛頓大學計算機科學與工程系的機器學習亞馬遜教授。他是全球知名的機器學習領(lǐng)域的領(lǐng)導者??逅乖?008年被《流行科學雜志》評為“最杰出的10人”之一。因為人工智能領(lǐng)域的杰出貢獻,他在2009年獲得年度IJCAI計算機與思維獎,和美國青年科學家與工程師總統(tǒng)獎。

Happy predictions. (source: Jared Hersch on Flickr).