91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
自然語言處理實(shí)戰(zhàn):從入門到項(xiàng)目實(shí)踐
自然語言處理實(shí)戰(zhàn):從入門到項(xiàng)目實(shí)踐
Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana
吳進(jìn)操, 黃若星 譯
出版時間:2022年09月
頁數(shù):292
“很多圖書側(cè)重于機(jī)器學(xué)習(xí)的算法基礎(chǔ),這本書則全面剖析了從電子商務(wù)應(yīng)用程序到虛擬助理等現(xiàn)實(shí)世界中的各種系統(tǒng)。對于熱衷于構(gòu)建和部署自然語言處理系統(tǒng)的專業(yè)人士,這本書是非常寶貴的參考資料?!?br /> ——Zachary Lipton
卡內(nèi)基–梅隆大學(xué)助理教授
亞馬遜人工智能科學(xué)家
《動手學(xué)深度學(xué)習(xí)》合著者

許多介紹自然語言處理(NLP)的書通過精心設(shè)計的示例和定義良好的數(shù)據(jù)集來展示如何解決NLP問題。但是,構(gòu)建生產(chǎn)級NLP系統(tǒng)不能僅靠紙上談兵。如果你想跨越理論與實(shí)踐的鴻溝,在真實(shí)的業(yè)務(wù)環(huán)境中構(gòu)建、迭代和擴(kuò)展NLP系統(tǒng),那么這就是為你而寫的指南。
本書凝集了作者在微軟、谷歌等頭部公司的實(shí)踐經(jīng)驗(yàn),詳細(xì)闡釋了NLP在文本分類、信息提取、聊天機(jī)器人、搜索和信息檢索、主題建模、文本摘要、文本推薦、機(jī)器翻譯、問答系統(tǒng)等常見場景中的應(yīng)用,內(nèi)容覆蓋電商、社交媒體、醫(yī)療、金融、法律等垂直應(yīng)用領(lǐng)域。通過閱讀本書,你將為從0到1開發(fā)切實(shí)可用的NLP系統(tǒng)奠定牢固的知識基礎(chǔ)。
● 了解NLP領(lǐng)域的問題、任務(wù)和解決方法
● 使用深度學(xué)習(xí)方法實(shí)現(xiàn)并評估不同的NLP應(yīng)用程序
● 根據(jù)具體的業(yè)務(wù)問題和垂直應(yīng)用領(lǐng)域調(diào)整NLP解決方案
● 掌握與NLP相關(guān)的各種算法和方法
● 遵循NLP系統(tǒng)的發(fā)布和部署實(shí)踐
● 從產(chǎn)品角度理解NLP項(xiàng)目的機(jī)會和路線圖
  1. 本書贊譽(yù)
  2. 前言
  3. 第一部分 基礎(chǔ)
  4. 第1章 自然語言處理概要
  5. 1.1 真實(shí)世界中的自然語言處理
  6. 1.2 什么是語言
  7. 1.2.1 語言的基本模塊
  8. 1.2.2 為什么自然語言處理很困難
  9. 1.3 機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和自然語言處理:概述
  10. 1.4 自然語言處理方法
  11. 1.4.1 基于啟發(fā)式的自然語言處理
  12. 1.4.2 用于自然語言處理的機(jī)器學(xué)習(xí)
  13. 1.4.3 用于自然語言處理的深度學(xué)習(xí)
  14. 1.4.4 為什么深度學(xué)習(xí)還不是自然語言處理的靈丹妙藥
  15. 1.5 自然語言處理演練:會話智能體
  16. 1.6 小結(jié)
  17. 第2章 自然語言處理流水線
  18. 2.1 數(shù)據(jù)獲取
  19. 2.2 文本提取和清洗
  20. 2.2.1 HTML解析和清洗
  21. 2.2.2 Unicode規(guī)范化
  22. 2.2.3 拼寫更正
  23. 2.2.4 特定于系統(tǒng)的錯誤更正
  24. 2.3 預(yù)處理
  25. 2.3.1 預(yù)備步驟
  26. 2.3.2 常用步驟
  27. 2.3.3 其他預(yù)處理步驟
  28. 2.3.4 高級處理
  29. 2.4 特征工程
  30. 2.4.1 經(jīng)典自然語言處理/ 機(jī)器學(xué)習(xí)流水線
  31. 2.4.2 深度學(xué)習(xí)流水線
  32. 2.5 建模
  33. 2.5.1 從簡單的啟發(fā)式開始
  34. 2.5.2 建立自己的模型
  35. 2.5.3 建立最終模型
  36. 2.6 評估
  37. 2.6.1 內(nèi)在評估
  38. 2.6.2 外在評估
  39. 2.7 建模之后的階段
  40. 2.7.1 部署
  41. 2.7.2 監(jiān)控
  42. 2.7.3 模型更新
  43. 2.8 使用其他語言
  44. 2.9 案例研究
  45. 2.10 小結(jié)
  46. 第3章 文本表示
  47. 3.1 向量空間模型
  48. 3.2 基本的向量化方法
  49. 3.2.1 獨(dú)熱編碼
  50. 3.2.2 詞袋
  51. 3.2.3 n-gram袋
  52. 3.2.4 TF-IDF
  53. 3.3 分布式表示
  54. 3.3.1 詞嵌入
  55. 3.3.2 詞語之上
  56. 3.4 詞和字符之上的分布式表示
  57. 3.5 通用文本表示
  58. 3.6 可視化嵌入
  59. 3.7 人工特征表示
  60. 3.8 小結(jié)
  61. 第二部分 核心
  62. 第4章 文本分類
  63. 4.1 應(yīng)用程序
  64. 4.2 文本分類流水線
  65. 4.2.1 不使用文本分類流水線的簡單分類器
  66. 4.2.2 使用現(xiàn)成的文本分類API
  67. 4.3 一個流水線,多個分類器
  68. 4.3.1 樸素貝葉斯分類器
  69. 4.3.2 邏輯回歸
  70. 4.3.3 SVM
  71. 4.4 在文本分類中使用神經(jīng)嵌入
  72. 4.4.1 詞嵌入
  73. 4.4.2 子詞嵌入和fastText
  74. 4.4.3 文檔嵌入
  75. 4.5 用于文本分類的深度學(xué)習(xí)
  76. 4.5.1 用于文本分類的CNN
  77. 4.5.2 用于文本分類的LSTM
  78. 4.5.3 使用大型預(yù)訓(xùn)練語言模型進(jìn)行文本分類
  79. 4.6 解釋文本分類模型
  80. 4.7 無數(shù)據(jù)或少數(shù)據(jù)學(xué)習(xí)和新領(lǐng)域適應(yīng)
  81. 4.7.1 無訓(xùn)練數(shù)據(jù)
  82. 4.7.2 少訓(xùn)練數(shù)據(jù):主動學(xué)習(xí)和領(lǐng)域適應(yīng)
  83. 4.8 案例研究:企業(yè)工單系統(tǒng)
  84. 4.9 實(shí)用建議
  85. 4.10 小結(jié)
  86. 第5章 信息提取
  87. 5.1 信息提取應(yīng)用程序
  88. 5.2 信息提取任務(wù)
  89. 5.3 信息提取的通用流水線
  90. 5.4 關(guān)鍵詞提取
  91. 5.4.1 實(shí)現(xiàn)關(guān)鍵詞提取
  92. 5.4.2 實(shí)用建議
  93. 5.5 命名實(shí)體識別
  94. 5.5.1 構(gòu)建命名實(shí)體識別系統(tǒng)
  95. 5.5.2 命名實(shí)體識別:使用現(xiàn)有庫
  96. 5.5.3 命名實(shí)體識別:使用主動學(xué)習(xí)
  97. 5.5.4 實(shí)用建議
  98. 5.6 命名實(shí)體消歧與鏈接
  99. 5.7 關(guān)系提取
  100. 5.7.1 關(guān)系提取的方法
  101. 5.7.2 關(guān)系提?。菏褂肐BM沃森API
  102. 5.8 其他高級信息提取任務(wù)
  103. 5.8.1 時間信息提取
  104. 5.8.2 事件提取
  105. 5.8.3 模板填充
  106. 5.9 案例研究
  107. 5.10 小結(jié)
  108. 第6章 聊天機(jī)器人
  109. 6.1 聊天機(jī)器人的應(yīng)用
  110. 一個簡單的FAQ機(jī)器人
  111. 6.2 聊天機(jī)器人的分類
  112. 6.2.1 目標(biāo)導(dǎo)向?qū)υ捠?
  113. 6.2.2 閑聊式
  114. 6.3 構(gòu)建對話系統(tǒng)的流水線
  115. 6.4 對話系統(tǒng)原理
  116. 6.5 深入對話系統(tǒng)的組件
  117. 6.5.1 對話行為分類
  118. 6.5.2 識別插槽
  119. 6.5.3 生成響應(yīng)
  120. 6.5.4 帶有代碼演練的對話示例
  121. 6.6 其他對話流水線
  122. 6.6.1 端到端方法
  123. 6.6.2 用于對話生成的深度強(qiáng)化學(xué)習(xí)
  124. 6.6.3 人工監(jiān)督
  125. 6.7 Rasa NLU
  126. 6.8 案例研究:食譜推薦
  127. 6.8.1 利用現(xiàn)有框架
  128. 6.8.2 開放式生成聊天機(jī)器人
  129. 6.9 小結(jié)
  130. 第7章 主題簡介
  131. 7.1 搜索和信息檢索
  132. 7.1.1 搜索引擎組件
  133. 7.1.2 常見企業(yè)搜索流水線
  134. 7.1.3 一個配置搜索引擎的例子
  135. 7.1.4 案例研究:書店搜索
  136. 7.2 主題建模
  137. 7.2.1 一個構(gòu)建主題模型的例子
  138. 7.2.2 下一步是什么
  139. 7.3 文本摘要
  140. 7.3.1 摘要用例
  141. 7.3.2 一個設(shè)置摘要器的示例
  142. 7.3.3 實(shí)用建議
  143. 7.4 文本推薦系統(tǒng)
  144. 7.4.1 一個圖書推薦系統(tǒng)示例
  145. 7.4.2 實(shí)用建議
  146. 7.5 機(jī)器翻譯
  147. 7.5.1 一個使用機(jī)器翻譯API的示例
  148. 7.5.2 實(shí)用建議
  149. 7.6 問答系統(tǒng)
  150. 7.6.1 開發(fā)自定義問答系統(tǒng)
  151. 7.6.2 尋找更有深度的答案
  152. 7.7 小結(jié)
  153. 第三部分 應(yīng)用
  154. 第8章 社交媒體
  155. 8.1 應(yīng)用
  156. 8.2 獨(dú)特的挑戰(zhàn)
  157. 8.3 用于社交平臺數(shù)據(jù)的自然語言處理
  158. 8.3.1 詞云
  159. 8.3.2 用于SMTD的分詞器
  160. 8.3.3 熱門話題
  161. 8.3.4 理解Twitter的情緒
  162. 8.3.5 SMTD的預(yù)處理
  163. 8.3.6 SMTD的文本表示
  164. 8.3.7 社交媒體渠道的客戶支持
  165. 8.4 模因與虛假新聞
  166. 8.4.1 識別模因
  167. 8.4.2 虛假新聞
  168. 8.5 小結(jié)
  169. 第9章 電子商務(wù)與零售
  170. 9.1 電子商務(wù)目錄
  171. 9.1.1 評論分析
  172. 9.1.2 產(chǎn)品搜索
  173. 9.1.3 產(chǎn)品推薦
  174. 9.2 電子商務(wù)中的搜索
  175. 9.3 構(gòu)建電子商務(wù)目錄
  176. 9.3.1 屬性提取
  177. 9.3.2 產(chǎn)品分類與分類樹
  178. 9.3.3 產(chǎn)品濃縮
  179. 9.3.4 產(chǎn)品除重和匹配
  180. 9.4 評論分析
  181. 9.4.1 情感分析
  182. 9.4.2 方面級情感分析
  183. 9.4.3 將總體評分與“方面”聯(lián)系起來
  184. 9.4.4 理解“方面”
  185. 9.5 電子商務(wù)推薦
  186. 9.6 小結(jié)
  187. 第10章 醫(yī)療、金融和法律
  188. 10.1 醫(yī)療
  189. 10.1.1 健康和醫(yī)療記錄
  190. 10.1.2 患者優(yōu)先級和計費(fèi)
  191. 10.1.3 藥物安全監(jiān)視
  192. 10.1.4 臨床決策支持系統(tǒng)
  193. 10.1.5 健康助理
  194. 10.1.6 電子健康記錄
  195. 10.1.7 心理健康監(jiān)測
  196. 10.1.8 醫(yī)療信息提取與分析
  197. 10.2 金融與法律
  198. 10.2.1 自然語言處理在金融領(lǐng)域中的應(yīng)用
  199. 10.2.2 自然語言處理與法律行業(yè)
  200. 10.3 小結(jié)
  201. 第四部分 綜合
  202. 第11章 端到端自然語言處理過程
  203. 11.1 重溫自然語言處理流水線:部署自然語言處理軟件
  204. 11.2 構(gòu)建和維護(hù)成熟的系統(tǒng)
  205. 11.2.1 尋找更好的特征
  206. 11.2.2 迭代現(xiàn)有模型
  207. 11.2.3 代碼和模型再現(xiàn)性
  208. 11.2.4 故障排除和可解釋性
  209. 11.2.5 監(jiān)控
  210. 11.2.6 盡量減少技術(shù)債務(wù)
  211. 11.2.7 自動化機(jī)器學(xué)習(xí)
  212. 11.3 數(shù)據(jù)科學(xué)過程
  213. 11.3.1 KDD過程
  214. 11.3.2 微軟TDSP
  215. 11.4 讓人工智能在組織中取得成功
  216. 11.4.1 團(tuán)隊(duì)
  217. 11.4.2 正確的問題和正確的期望
  218. 11.4.3 數(shù)據(jù)和時間
  219. 11.4.4 好的流程
  220. 11.4.5 其他方面
  221. 11.5 展望未來
  222. 11.6 結(jié)語
書名:自然語言處理實(shí)戰(zhàn):從入門到項(xiàng)目實(shí)踐
譯者:吳進(jìn)操, 黃若星 譯
國內(nèi)出版社:人民郵電出版社
出版時間:2022年09月
頁數(shù):292
書號:978-7-115-59789-2
原版書書名:Practical Natural Language Processing
原版書出版商:O'Reilly Media
Sowmya Vajjala
 
Sowmya Vajjala擁有德國圖賓根大學(xué)計算語言學(xué)博士學(xué)位,曾就職于微軟研究院,擁有跨學(xué)術(shù)界和工業(yè)界的自然語言處理經(jīng)驗(yàn)。
 
 
Bodhisattwa Majumder
 
Bodhisattwa Majumder曾在谷歌和微軟研究院構(gòu)建自然語言處理系統(tǒng),為數(shù)百萬用戶提供產(chǎn)品服務(wù)。
 
 
Anuj Gupta
 
Anuj Gupta為《財富》100強(qiáng)公司和多家創(chuàng)業(yè)公司孵化和組建了機(jī)器學(xué)習(xí)團(tuán)隊(duì)。
 
 
Harshit Surana
 
Harshit Surana是DeepFlux公司的聯(lián)合創(chuàng)始人兼CTO,曾在卡內(nèi)基–梅隆大學(xué)和麻省理工學(xué)院媒體實(shí)驗(yàn)室研究自然語言處理和機(jī)器學(xué)習(xí)。
 
 
本書封面上的動物是折衷鸚鵡(Eclectus roratus)。折衷鸚鵡原產(chǎn)于大洋洲的低地雨林。從澳大利亞的東北部到印度尼西亞的摩鹿加群島,到處都可以找到折衷鸚鵡。幾個世紀(jì)以來,折衷鸚鵡在印度尼西亞和新幾內(nèi)亞被馴化,它們的羽毛被用來制作精美的頭飾,用來顯示一個人的地位或與鳥類的親屬關(guān)系。
折衷鸚鵡雄鳥的羽毛是亮綠色的,翅膀下有紅色和藍(lán)色的點(diǎn)綴,而雌鳥有紅色的頭部和紫藍(lán)色的胸部。這種鸚鵡的雄鳥和雌鳥是鸚鵡家族中不同性別外形差異最大的,早期生物學(xué)家甚至將它們歸類為不同的物種。折衷鸚鵡和其他鸚鵡的另一個區(qū)別是實(shí)行多配偶制。這使得雌鳥可以安全筑巢長達(dá)11 個月而不用經(jīng)常外出覓食,因?yàn)樗鼈兛梢砸揽慷嘀恍埒B為它們覓食。
購買選項(xiàng)
定價:109.80元
書號:978-7-115-59789-2
出版社:人民郵電出版社