91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

醫(yī)療領(lǐng)域構(gòu)建自然語言處理系統(tǒng)的經(jīng)驗(yàn)教訓(xùn)
為醫(yī)療行業(yè)構(gòu)建自然語言處理(NLP)系統(tǒng)很困難,因?yàn)檫@些系統(tǒng)需要具有廣泛常見的醫(yī)學(xué)知識,必須處理多種多樣的輸入,并需要能理解上下文。
編者注:讀者可關(guān)注2019年6月18日在北京舉行的AI大會相關(guān)議題。早鳥價(jià)格將于5月10日結(jié)束。

我們正處于自然語言處理(NLP)領(lǐng)域令人興奮的十年。 在閱讀理解、語言翻譯和創(chuàng)意寫作等復(fù)雜任務(wù)上,計(jì)算機(jī)的表現(xiàn)將會和人類一樣出色。語言理解受益于快速改進(jìn)的“ABC”軟件:A就是AI(免費(fèi)的深度學(xué)習(xí)庫,如PyText和如BERT這樣的語言模型),B是大數(shù)據(jù)(Hadoop,Spark和Spark NLP),以及C,就是云計(jì)算(按需提供的GPU和 來自所有主要云服務(wù)商的NLP即服務(wù)的功能)。

在醫(yī)療領(lǐng)域,一些應(yīng)用已經(jīng)從科幻小說變?yōu)楝F(xiàn)實(shí)。 人工智能系統(tǒng)通過了中國英國的醫(yī)學(xué)執(zhí)照考試 ,而且它們比普通醫(yī)生考得更好。 最新的系統(tǒng)比初級醫(yī)生能更好地診斷出55種兒科疾病。 但是,這些系統(tǒng)比第一批計(jì)算機(jī)視覺深度學(xué)習(xí)應(yīng)用(例如研究一個(gè)圖像)中的一些更難構(gòu)建,因?yàn)樗鼈冃枰哂懈鼜V泛常見的醫(yī)學(xué)知識,要處理更多種類的輸入,并且必須理解上下文。

過去七年來,我很幸運(yùn)能夠參與構(gòu)建醫(yī)療領(lǐng)域的NLP系統(tǒng)。本文旨在分享我學(xué)到的重要經(jīng)驗(yàn),從而希望能幫助你更快更好地構(gòu)建類似的系統(tǒng)。

先見識一下急診室分診記錄的語言

包括我在內(nèi)的許多人都錯(cuò)誤地認(rèn)為美國的臨床記錄是用英文寫的。之所以會這樣,是因?yàn)槿绻銌栣t(yī)生他們使用什么語言,醫(yī)生便會回答說是英語。 但是,請看以下三個(gè)從急診室就診記錄中提取的已脫敏的分診記錄的例子:

Triage Notes
states started last night, upper abd, took alka seltzer approx 0500, no relief. nausea no vomiting
Since yesterday 10/10 “constant Tylenol 1 hr ago. +nausea. diaphoretic. Mid abd radiates to back
Generalized abd radiating to lower x 3 days accompanied by dark stools. Now with bloody stool this am. Denies dizzy, sob, fatigue.

大多數(shù)沒有受過醫(yī)學(xué)教育的人都不理解這些典型句子的意思。以下是一些需要注意的事項(xiàng):

  • 這些句子在英語中都不是語法正確的句子。
  • 這些句子里都沒有使用“病人”或“疼痛”這兩個(gè)詞,且句子沒有主語。
  • 句子里使用了很多術(shù)語:10/10指的是疼痛的強(qiáng)度?!皬V泛的abd輻射至下位”是指向下背部輻射的一般腹部(胃)疼痛。

我把這些記錄給急診室的醫(yī)生看了,他們認(rèn)為這些筆記是有用的。因?yàn)樗鼈兒喢鞫笠㈥P(guān)注最重要的事情。他們會認(rèn)為這些都是急癥室分診記錄的常見情況,而不是“壞”的樣本。

是的,急診室他們有自己的語言

一名哲學(xué)家或語言學(xué)家可能會認(rèn)為這些特點(diǎn)仍然不構(gòu)成典型意義上的“不同的語言”。然而,如果你是一名數(shù)據(jù)科學(xué)家或NLP從業(yè)者,毫無疑問這是不同的語言。

  • 它有不同的詞匯。 僅英語,統(tǒng)一醫(yī)學(xué)語言系統(tǒng)(UMLS)就包含200多個(gè)詞匯表,其中包括了300多萬個(gè)術(shù)語。 相比之下,1989年版的牛津英語詞典有171,476個(gè)單詞(不過,牛津詞典應(yīng)該大致增加三倍,以包含UMLS直接列出的衍生詞)。
  • 它有不同的語法。這些文本對句子是什么以及語言的詞性是什么有自己的定義。 諸如“+惡心”和“自昨天的10/10”之類的陳述是在英語里不存在的語法結(jié)構(gòu)。
  • 它有不同的語義。 “嗚咽”意味著“呼吸急促”(而不是你想到的另一種意思)。 “否認(rèn)”意味著患者說他們沒有癥狀,盡管臨床醫(yī)生認(rèn)為他們可能有。
  • 它超越了行話。行話指的是你在進(jìn)入新學(xué)校或新工作的第一個(gè)月內(nèi)學(xué)會的100到200個(gè)新詞。相比之下,理解醫(yī)療領(lǐng)域的語言需要的時(shí)間和掌握日常意大利語或葡萄牙語一樣長。

經(jīng)驗(yàn)#1:現(xiàn)成可用的NLP模型不起作用

在實(shí)踐中,為英語構(gòu)建的現(xiàn)成的NLP庫和算法在醫(yī)療行業(yè)的這種“不同的語言”上會遭到慘敗。不僅命名實(shí)體識別或?qū)嶓w解析模型會失敗,甚至像符號化、詞性標(biāo)注和句子分割這樣的基本任務(wù),現(xiàn)成的模型對大多數(shù)醫(yī)療行業(yè)的句子都沒用。

如果你不相信,可以隨便使用下面列出的六種流行的NLP云服務(wù)和庫自行測試。除了亞馬遜,其他所有工具都提供了一個(gè)Web用戶界面。通過它,你可以復(fù)制粘貼句子以便查看該服務(wù)是如何分析句子的了。

1.?Google Cloud Natural Language?

2.?IBM Watson NLU

3.?Azure Text Analytics

4.?spaCy Named Entity Visualizer

5.?Amazon Comprehend?(offline)

6.?斯坦福大學(xué)Core NLP

在2018年12月進(jìn)行的一項(xiàng)測試中,上述六個(gè)引擎唯一識別出的醫(yī)學(xué)術(shù)語(其中只有兩個(gè)引擎識別了出來)是Tylenol(泰諾)是個(gè)產(chǎn)品。

醫(yī)療行業(yè)有數(shù)百種語言

和許多人一樣,我犯的下一個(gè)錯(cuò)誤就是想建立“解決通用醫(yī)療行業(yè)問題”的各種模型。亞馬遜的Comprehend? Medical正在采用這種方法,推出通用的醫(yī)療NLP即服務(wù)。這種方法假定醫(yī)療行業(yè)只有一種語言。 而現(xiàn)實(shí)是,每個(gè)子專業(yè)和它的溝通形式都和別專業(yè)根本不同。下面是一些已脫敏的例子:

病理學(xué)(外科病理學(xué)、癌癥):

部分1 標(biāo)記為“?頸靜脈淋巴結(jié)中的轉(zhuǎn)移性腫瘤”由淺白色組織的橢圓形片段組成,其尺寸約為0.3×0.2×0.2cm。

放射學(xué)(MRI頸椎):

C6-7:存在彌漫性椎間盤骨贅,導(dǎo)致腹側(cè)硬膜囊變平,伴有輕度椎管狹窄和中度至重度雙側(cè)神經(jīng)椎間孔狹窄。其他發(fā)現(xiàn):無椎旁軟組織腫塊。

預(yù)授權(quán):

根據(jù)I期試驗(yàn)的結(jié)果,患者將接受永久性刺激器植入。具體而言,該患者將接受由Boston Scientific Neuromodulation Corporation制造的脊髓刺激系統(tǒng)(SCS)。 該SCS系統(tǒng)在植入式刺激器內(nèi)有一個(gè)充電電池。與非可充電的SCS系統(tǒng)相比,它允許醫(yī)生和患者在最佳設(shè)置下控制疼痛,而不會影響電池壽命。 Boston Scientific SCS系統(tǒng)已獲得FDA批準(zhǔn)。

術(shù)后(來自SOAP說明目標(biāo)部分):

緊急:Tmax在過去的24小時(shí)內(nèi),99.8,BP-128/82,P-82,R-18 I / O- 3000ml NS IV / 200ml通過foley輸出,800ml自行輸出

一般:躺在床上,顯得舒服

皮膚 :手術(shù)切口邊緣具有小的紅斑,并且與釘子很接近,沒有開裂,沒有引流。 沒有血腫或血清腫形成的跡象。 沒有黃疸。

牙科(麻醉,特定牙齒):

將苯佐卡因置于與牙齒1相鄰的上顎中。使用長的25號針頭將總共0.00管的阿替卡因和4%的腎上腺素按1:100,000注射液注入口中。

藥物(劑量、途徑、頻率、持續(xù)時(shí)間、形式)

每天需要口服20毫克阿司匹林2次。

需要更多例子嗎? 可以花點(diǎn)時(shí)間研究一下你自己的檢驗(yàn)報(bào)告?;蛘呦胍幌箩t(yī)學(xué)院的學(xué)生開始學(xué)習(xí)皮膚科專業(yè),他們需要掌握皮膚病學(xué)——等于學(xué)習(xí)這門語言。甚至從醫(yī)療出院記錄中識別患者的吸煙狀況也復(fù)雜到足以成為一個(gè)活躍的學(xué)術(shù)研究領(lǐng)域。

而且,每個(gè)醫(yī)學(xué)專業(yè)都有很多變化。例如,對于決定是否批準(zhǔn)針對MRI的預(yù)授權(quán)請求,針對植入式脊髓刺激器,需要從預(yù)授權(quán)表格中查看的項(xiàng)目內(nèi)容就和別的請求完全不同。另一個(gè)例子是在病理學(xué)中使用不同的術(shù)語來討論不同類型的癌癥。這些對實(shí)際問題會帶來影響:我所工作的公司正在進(jìn)行一個(gè)項(xiàng)目,該項(xiàng)目需要訓(xùn)練不同的NLP模型,以從病理報(bào)告中提取有關(guān)肺癌、乳腺癌和結(jié)腸癌的事實(shí)。

到目前為止,亞馬遜的Comprehend Medical僅關(guān)注藥物價(jià)值的正規(guī)化(參見上面最后一個(gè)“阿司匹林”的例子)。 該服務(wù)還具有標(biāo)準(zhǔn)的醫(yī)療命名實(shí)體識別功能,但不能滿足任何特定應(yīng)用的需求。請不要只相信我所說的,你可以使用它的服務(wù)去嘗試上面的例子或你自己的文本。如今,這樣的NLP服務(wù)主要是吸引客戶的手段。 像3MNuance這樣出售“醫(yī)療行業(yè)NLP”的公司在營銷方面更加關(guān)注這一點(diǎn)。

經(jīng)驗(yàn)#2:構(gòu)建可訓(xùn)練的NLP管道

如果你需要自己構(gòu)建醫(yī)療行業(yè)中的NLP系統(tǒng),則需要針對你構(gòu)建的特定應(yīng)用訓(xùn)練NLP模型。但這并不意味著你不能重用現(xiàn)有的軟件。你可以重復(fù)使用的東西有很多:

可重用:

醫(yī)學(xué)術(shù)語

醫(yī)學(xué)詞向量

神經(jīng)網(wǎng)絡(luò)計(jì)算圖

NLP管道的API

訓(xùn)練和推斷的框架

要自建:

病人需要采用什么藥物?

病人是否需要胸部CT掃描?

本次門診的正確的急診計(jì)費(fèi)碼是什么?

這個(gè)病人之前是否有懷孕?

他們有已知的過敏癥嗎?

當(dāng)我們為醫(yī)療行業(yè)構(gòu)建Spark NLPApache Spark的開源NLP庫的擴(kuò)展)時(shí),我們的目的是盡可能多地提供可重復(fù)使用的開箱即用的組件。包括,諸如用于臨床命名實(shí)體識別和脫敏、生物醫(yī)學(xué)實(shí)體正規(guī)化斷言狀態(tài)(例如,否定)檢測的最前沿的學(xué)術(shù)論文的生產(chǎn)級實(shí)現(xiàn)。使用這些實(shí)現(xiàn)不需要學(xué)習(xí)使用TensorFlow(或任何其他框架),因?yàn)樯疃葘W(xué)習(xí)框架已經(jīng)嵌入在易于使用的Python、Java和Scala API中。 這個(gè)庫本身是Spark ML的原生擴(kuò)展,并重用其Pipeline類來構(gòu)建、序列化和擴(kuò)展NLP、ML和DL工作流。

把這個(gè)庫用在現(xiàn)實(shí)世界的項(xiàng)目中,讓我們了解到“醫(yī)療行業(yè)的語言”與人類語言是多么的不同。以下是我們構(gòu)建的一些項(xiàng)目內(nèi)容:

  • 基于深度學(xué)習(xí)的句子分割。 雖然分割維基百科文章的句子通常只需要使用正則表達(dá)式就可以完成,但處理很多頁的臨床文檔是一個(gè)更大的挑戰(zhàn)。特別是,算法必須應(yīng)對頁眉和頁腳、列表、枚舉、標(biāo)注、兩欄格式和其他的格式問題。
  • 醫(yī)療行業(yè)特定的詞性標(biāo)注。 不僅需要不同的模型,而且額外的詞性標(biāo)注也被用于醫(yī)療行業(yè)的模型。 之所以這樣做是因?yàn)樗_實(shí)提高了醫(yī)學(xué)命名實(shí)體識別的準(zhǔn)確性。
  • 醫(yī)療行業(yè)特定的實(shí)體標(biāo)正規(guī)化算法。在實(shí)際項(xiàng)目里,命名實(shí)體識別自己一般是無用的。從“雙眼似乎被感染”里識別“眼睛”和“感染”是醫(yī)學(xué)術(shù)語并沒有多大用處。相反,根據(jù)標(biāo)準(zhǔn)SNOMED-CT臨床術(shù)語將整個(gè)文本塊標(biāo)記為代碼312132001,同時(shí)針對用不同方式對描述相同發(fā)現(xiàn)進(jìn)行正規(guī)化則更加有用。這使你的應(yīng)用能基于此代碼來構(gòu)建業(yè)務(wù)邏輯,而不管它是如何規(guī)正規(guī)化的,或者更確切地說,不管它是如何在原來的文本中被表達(dá)的。

簡而言之:我們越深入地將醫(yī)療行業(yè)文本視為不同的語言,我們就越來越接近甚至超越同一任務(wù)上的人類的準(zhǔn)確性。

經(jīng)驗(yàn)#3:從數(shù)據(jù)標(biāo)注開始

那么,該如何開始你自己的項(xiàng)目? 你怎么知道你離事實(shí)有多遠(yuǎn),誰值得信任?一種方法是從構(gòu)建標(biāo)注驗(yàn)證數(shù)據(jù)集開始。例如,如果你對自動(dòng)化門診病例成ICD-10編碼感興趣,請讓臨床醫(yī)生定義一些代表性樣本,對樣本進(jìn)行脫敏,并讓專業(yè)的臨床編碼人員對其進(jìn)行標(biāo)注(分配正確的代碼)。如果你有興趣從放射學(xué)報(bào)告中提取關(guān)鍵事件或從患者病例中找出被忽視的安全事件,請首先讓臨床醫(yī)生定義一些樣本,并正確標(biāo)注。

這樣做通常會在讓數(shù)據(jù)科學(xué)團(tuán)隊(duì)加入(并浪費(fèi)很多時(shí)間)前提前發(fā)現(xiàn)一些“坑”。如果你無法獲得足夠的數(shù)據(jù),或者無法大規(guī)模地進(jìn)行脫敏,那就無法構(gòu)建可靠的模型。如果在某些情況下臨床醫(yī)生不能一致同意正確的標(biāo)注,那么要解決的第一個(gè)問題是就臨床指南達(dá)成一致,而不是讓數(shù)據(jù)科學(xué)家參與嘗試去自動(dòng)化這種不一致。最后,如果你發(fā)現(xiàn)自己面臨非常不平衡的類別(比如你尋找的是每年只有少數(shù)人患病的情況),那么在引入數(shù)據(jù)科學(xué)家之前修改問題的定義可能是明智之舉。

一旦有了一個(gè)有代表性的和已商定并正確標(biāo)注的驗(yàn)證集,你就可以開始用它來測試現(xiàn)有的庫和云服務(wù)提供商的服務(wù)了。很可能的是,這個(gè)測試將立即發(fā)現(xiàn)每個(gè)產(chǎn)品與你的需求之間的差距。我們與之合作過的最聰明的團(tuán)隊(duì)已經(jīng)設(shè)置了為期一周或兩周的測試項(xiàng)目,其目標(biāo)是使用標(biāo)準(zhǔn)庫或云服務(wù)來發(fā)現(xiàn)它們能達(dá)到的滿足用戶特定需求的最高準(zhǔn)確度。這樣做就可以評估下面每項(xiàng)服務(wù)的難易程度,包括:訓(xùn)練自定義的模型、定義領(lǐng)域?qū)S械奶卣?、解決方案所需的pipeline步驟和把結(jié)果解釋給客戶。

這種方法對你的團(tuán)隊(duì)來說會是一個(gè)很好的教育機(jī)會。它會測試你的軟件以及你需要評估的服務(wù)的支持/咨詢等方面。這樣做將會告訴你與業(yè)務(wù)需求的準(zhǔn)確度級別還有多少距離。最后,第3個(gè)經(jīng)驗(yàn)可以幫你自己判斷經(jīng)驗(yàn)1和2,而不用完全相信我的話。

祝你好運(yùn),并希望你在項(xiàng)目中取得成功。 因?yàn)槲覀兯f的是醫(yī)療行業(yè),世界需要你成功!

相關(guān)資源

David Talby

David Talby是Pacific AI的首席技術(shù)官。他正在幫助多個(gè)快速發(fā)展的公司應(yīng)用大數(shù)據(jù)和數(shù)據(jù)科學(xué)技術(shù)來解決醫(yī)療保健、生命科學(xué)和相關(guān)領(lǐng)域的實(shí)際問題。David在構(gòu)建和運(yùn)營互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)科學(xué)和業(yè)務(wù)平臺以及構(gòu)建世界一流的敏捷分布的團(tuán)隊(duì)方面擁有豐富的經(jīng)驗(yàn)。在加入Pacific AI前,他曾在微軟的Bing Group工作,負(fù)責(zé)Bing Shopping在美國和歐洲的業(yè)務(wù)運(yùn)營。他還在在西雅圖和英國為亞馬遜工作。在那里他建立并管理分布的團(tuán)隊(duì),幫助擴(kuò)展亞馬遜財(cái)務(wù)系統(tǒng)。David擁有計(jì)算機(jī)科學(xué)博士學(xué)位和計(jì)算機(jī)科學(xué)碩士與工商管理碩士學(xué)位。

Words (source: Steve Johnson on Flickr)