基于Spark NLP的自然語言處理
唐曉, 胡喬林, 陳新 譯
出版時間:2022年09月
頁數(shù):386
“這是一本寫得很好的書,它將帶你從語法和語言模型的基礎(chǔ)知識開始,并利用當(dāng)今可用的最佳深度學(xué)習(xí)和遷移學(xué)習(xí)技術(shù),構(gòu)建現(xiàn)實世界的生產(chǎn)級AI應(yīng)用程序。”
——David Talby
John Snow 實驗室CTO
如果你想構(gòu)建一個使用自然語言文本的企業(yè)級應(yīng)用程序,但不確定從哪里開始或使用什么工具,本書將幫助你入門。Wisecube的首席數(shù)據(jù)科學(xué)家Alex Thomas向軟件工程師和數(shù)據(jù)科學(xué)家展示了如何使用深度學(xué)習(xí)和Apache Spark NLP庫,來構(gòu)建可擴展的自然語言處理(NLP)應(yīng)用程序。
通過在Spark處理框架上使用NLP的具體示例、實踐,進行理論解釋和動手練習(xí),本書將會介紹從基本語言學(xué)和寫作系統(tǒng)到情感分析和搜索引擎的所有內(nèi)容。你還將探索一些開發(fā)基于文本的應(yīng)用程序會遇到的特殊問題,例如性能等。在下面四個部分中,你將學(xué)習(xí)NLP基礎(chǔ)知識和構(gòu)建模塊,然后再深入研究應(yīng)用程序和系統(tǒng)構(gòu)建:
● 基礎(chǔ)知識:了解自然語言處理、Apache Spark上的NLP和深度學(xué)習(xí)的基礎(chǔ)知識。
● 構(gòu)建模塊:學(xué)習(xí)構(gòu)建 NLP 應(yīng)用程序的技術(shù)(包括標(biāo)記化、句子分割和命名實體識別),并了解它們的工作方式和原因。
● 應(yīng)用程序:探索構(gòu)建你自己的NLP應(yīng)用程序的設(shè)計、開發(fā)和實驗過程。
● 構(gòu)建NLP系統(tǒng):考慮生產(chǎn)和部署NLP模型的選項,包括支持哪些人類語言。
書名:基于Spark NLP的自然語言處理
譯者:唐曉, 胡喬林, 陳新 譯
國內(nèi)出版社:中國電力出版社
出版時間:2022年09月
頁數(shù):386
書號:978-7-5198-6967-0
原版書書名:Natural Language Processing with Spark NLP
原版書出版商:O'Reilly Media
Alex Thomas
Alex Thomas是Wisecube的首席數(shù)據(jù)科學(xué)家。他將自然語言處理和機器學(xué)習(xí)與臨床數(shù)據(jù)、身份數(shù)據(jù)、雇主和求職者數(shù)據(jù),以及現(xiàn)在的生物化學(xué)數(shù)據(jù)結(jié)合使用。Alex從Apache Spark 0.9版就開始使用,并使用過NLP庫和框架,其中包括UIMA和OpenNLP。
本書封面上的動物是叫隼(學(xué)名:Milvago chimango),屬于隼科的猛禽。
叫隼生活在南美洲灌木叢中,通常在水邊,靠近城鎮(zhèn)和田野。它們成群結(jié)隊地生活,具有侵略性和領(lǐng)地意識。它們經(jīng)常追逐較大的猛禽。
雄性和雌性叫隼都會筑巢并保護巢穴,孵化和喂養(yǎng)幼鳥。這些鳥吃昆蟲、脊椎動物和腐肉,它們還可以在水面上捕魚。
叫隼在其棲息地是比較常見的。O’Reilly封面上的許多動物瀕臨滅絕,所有這些對世界都很重要。