91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
基于Python的無監(jiān)督學習
基于Python的無監(jiān)督學習
Ankur A. Patel
孫立超 譯
出版時間:2020年12月
頁數(shù):366
“研究人員、工程師和學生將會欣賞這本書,書中充滿了實用的無監(jiān)督學習技術、通俗易懂并非常實用的Python示例,學習起來快速并且有效。”
——SarahNagy
Edison資深數(shù)據(jù)科學家
很多業(yè)內(nèi)專家認為無監(jiān)督學習是人工智能的下一個前沿,可能把握著進入通用人工智能的鑰匙。因為世界上絕大部分數(shù)據(jù)是無標簽的,傳統(tǒng)的監(jiān)督學習不能使用到它們。無監(jiān)督學習通過另外的方法可以使用到這些無標簽的數(shù)據(jù)集從而發(fā)現(xiàn)數(shù)據(jù)深層的有價值的數(shù)據(jù)模型,這些模型可能是人類自身也無法發(fā)現(xiàn)的。
作者Ankur Patel通過兩個簡單的、可應用于生產(chǎn)的Python框架向您展示了如何應用無監(jiān)督學習:Scikit-learn和包含Keras的TensorFlow。通過代碼和親身操作的實例,數(shù)據(jù)科學家將發(fā)現(xiàn)數(shù)據(jù)中難以發(fā)現(xiàn)的模型:檢測數(shù)據(jù)中的異常、進行自動特征工程和選擇、生成合成數(shù)據(jù)集等,并獲得更深層次的業(yè)務洞察力。您所需要的只是一些編程和機器學習經(jīng)驗就可以開始學習本書。

● 比較不同機器學習方法的優(yōu)缺點:監(jiān)督學習、無監(jiān)督學習和強化學習
● 從頭到尾的建立和管理機器學習項目
● 建立一個異常檢測系統(tǒng),以捕捉信用卡交易的欺詐
● 將用戶集群到不同的同構組中
● 執(zhí)行半監(jiān)督學習
● 使用受限制玻爾茲曼機開發(fā)電影推薦系統(tǒng)
● 使用生成對抗網(wǎng)絡生成合成圖像
  1. 前言
  2. 第一部分 無監(jiān)督學習基礎
  3. 第1章 機器學習生態(tài)系統(tǒng)中的無監(jiān)督學習
  4. 機器學習基本術語
  5. 基于規(guī)則(Rules-Based)與機器學習
  6. 監(jiān)督學習與無監(jiān)督學習
  7. 監(jiān)督學習的優(yōu)缺點
  8. 無監(jiān)督學習的優(yōu)缺點
  9. 使用無監(jiān)督學習改進機器學習的解決方案
  10. 了解監(jiān)督學習算法
  11. 線性算法
  12. 基于鄰域的算法
  13. 基于樹的算法
  14. 支持向量機
  15. 神經(jīng)網(wǎng)絡
  16. 了解無監(jiān)督學習算法
  17. 降維
  18. 聚類
  19. 特征提取
  20. 無監(jiān)督深度學習
  21. 使用無監(jiān)督學習解決序列數(shù)據(jù)問題
  22. 利用無監(jiān)督學習的強化學習
  23. 半監(jiān)督學習
  24. 無監(jiān)督學習的成功應用
  25. 結論
  26. 第2章 完整機器學習項目
  27. 環(huán)境設置
  28. 版本控制:Git
  29. 克隆本書的Git存儲庫
  30. 科學庫:Anaconda發(fā)行版Python
  31. 神經(jīng)網(wǎng)絡:TensorFlow和Keras
  32. 梯度提升算法,版本1: XGBoost
  33. 梯度提升算法,版本2: LightGBM
  34. 聚類算法
  35. 交互式計算環(huán)境:Jupyter Notebook
  36. 數(shù)據(jù)概述
  37. 數(shù)據(jù)準備
  38. 數(shù)據(jù)采集
  39. 數(shù)據(jù)研究
  40. 生成特征矩陣和標簽數(shù)組
  41. 特征工程與特征選擇
  42. 數(shù)據(jù)可視化(Data Visualization)
  43. 模型準備
  44. 分離出訓練和測試數(shù)據(jù)集
  45. 選擇成本函數(shù)
  46. 創(chuàng)建k 折交叉驗證集
  47. 機器學習模型(第一部分)
  48. 評估指標
  49. 混淆矩陣(Confusion Matrix)
  50. 精確率召回率曲線(Precision-Recall Curve)
  51. 觀察者操作特征曲線(receiver operating characteristic)
  52. 機器學習模型(第二部分)
  53. 模型2:隨機森林(Random Forests)
  54. 模型3:XGBoost梯度提升機(gradient boosting machine)
  55. 模型4:LightGBM梯度提升機
  56. 使用測試集對四個模型評估
  57. 集成(Ensembles)
  58. 最終算法選擇
  59. 完整生產(chǎn)系統(tǒng)
  60. 結論
  61. 第二部分 使用SciKit-Learn進行無監(jiān)督學習
  62. 第3章 降維
  63. 降維的動因
  64. 降維算法
  65. 主成分分析(principal component analysis,PCA)
  66. PCA概念
  67. PCA練習
  68. 增量PCA
  69. 稀疏PCA
  70. 核PCA
  71. 奇異值分解
  72. 隨機投影
  73. 等距映射
  74. 多維標度法
  75. 局部線性嵌入
  76. t-分布隨機鄰域嵌入
  77. 其他降維方法
  78. 字典學習
  79. 獨立成分分析
  80. 結論
  81. 第4章 異常檢測
  82. 信用卡欺詐檢測
  83. 準備數(shù)據(jù)
  84. 定義異常評分函數(shù)
  85. 定義評估指標
  86. 定義繪圖函數(shù)
  87. 普通PCA異常檢測
  88. PCA成分數(shù)量等于原始特征的數(shù)量
  89. 尋找最優(yōu)主成分數(shù)
  90. 稀疏PCA異常檢測
  91. 核PCA異常檢測
  92. 高斯隨機投影異常檢測
  93. 稀疏隨機投影異常檢測
  94. 非線性異常檢測
  95. 字典學習異常檢測
  96. ICA異常檢測
  97. 在測試數(shù)據(jù)集上運行欺詐檢測解決方案
  98. 測試數(shù)據(jù)集上的普通PCA異常檢測
  99. 測試集上的ICA異常檢測
  100. 測試集上使用字典學習異常檢測
  101. 結論
  102. 第5章 聚類
  103. MNIST數(shù)字集
  104. 聚類算法
  105. k均值
  106. k均值慣性
  107. 評估聚類結果
  108. k均值精度
  109. k均值和主成分的數(shù)量
  110. 原始數(shù)據(jù)集上的k均值
  111. 層次聚類
  112. 層次聚類方法
  113. 樹狀圖
  114. 評估聚類結果
  115. 密度聚類(DBSCAN)
  116. DBSCAN算法
  117. HDBSCAN
  118. 結論
  119. 第6章 分組分割
  120. 借貸俱樂部數(shù)據(jù)
  121. 數(shù)據(jù)準備
  122. 將字符串格式轉換為數(shù)字格式
  123. 輸入缺失值
  124. 特征工程
  125. 選擇最終特征集并執(zhí)行縮放
  126. 指定用來評估的標簽
  127. 聚類的好處
  128. k均值應用
  129. 分層聚類應用
  130. HDBSCAN應用程序
  131. 結論
  132. 第三部分 使用TensorFlow和Keras
  133. 無監(jiān)督學習
  134. 第7章 自動編碼器
  135. 神經(jīng)網(wǎng)絡
  136. TensorFlow
  137. Keras
  138. 自動編碼器:編碼器和解碼器
  139. 欠完備自動編碼器
  140. 過完備自動編碼器
  141. 密集與稀疏自動編碼器
  142. 降噪自動編碼器
  143. 變分自動編碼器
  144. 結論
  145. 第8章 自動編碼器實踐
  146. 數(shù)據(jù)準備
  147. 自動編碼器的組成部分
  148. 激活函數(shù)
  149. 我們的第一臺自動編碼器
  150. 損失函數(shù)
  151. 優(yōu)化器
  152. 訓練模型
  153. 對測試集進行評估
  154. 具有線性激活函數(shù)的兩層欠完備自動編碼器
  155. 增加節(jié)點數(shù)
  156. 添加更多隱藏層
  157. 非線性自動編碼器
  158. 具有線性激活的過完備自動編碼器
  159. 具有線性激活、隨機失活的過完備自動編碼器
  160. 具有稀疏、線性激活、隨機失活的過完備自動編碼器
  161. 具有稀疏、線性激活、隨機失活功能的過完備自動編碼器
  162. 使用噪聲數(shù)據(jù)集
  163. 降噪自動編碼器
  164. 二層、降噪、具備線性激活的欠完備自動編碼器
  165. 兩層、降噪、具備線性激活的過完備自動編碼器
  166. 兩層、降噪、ReLu激活的過完備自動編碼器
  167. 結論
  168. 第9章 半監(jiān)督學習
  169. 數(shù)據(jù)準備
  170. 監(jiān)督模型
  171. 無監(jiān)督模型
  172. 半監(jiān)督模型
  173. 監(jiān)督和無監(jiān)督的合力
  174. 結論
  175. 第四部分 使用TensorFlow和Keras
  176. 進行深度無監(jiān)督學習
  177. 第10章 使用受限玻爾茲曼機器的推薦系統(tǒng)
  178. 玻爾茲曼機器
  179. 推薦系統(tǒng)
  180. 協(xié)同過濾
  181. Netflix獎
  182. MovieLens數(shù)據(jù)集
  183. 數(shù)據(jù)準備
  184. 定義成本函數(shù):均方誤差
  185. 進行基線實驗
  186. 矩陣分解
  187. 一個潛在因子
  188. 三個潛在因子
  189. 五個潛在因子
  190. 使用RBM的協(xié)同過濾
  191. RBM神經(jīng)網(wǎng)絡結構
  192. 構建RBM類的組件
  193. 訓練RBM推薦系統(tǒng)
  194. 結論
  195. 第11章 基于深度信念網(wǎng)絡的特征檢測
  196. 深層信念網(wǎng)絡詳述
  197. MNIST圖像分類
  198. 受限波爾茲曼機
  199. 構建RBM類的組件
  200. 使用RBM模型生成圖像
  201. 查看中間特征檢測器
  202. 為DBN訓練三個RBM
  203. 檢查特征檢測器(Examine Feature Detectors)
  204. 查看生成的圖像
  205. 完整DBN
  206. DBN訓練的工作原理
  207. 訓練DBN
  208. 無監(jiān)督學習如何幫助監(jiān)督學習
  209. 使用LightGBM的圖像分類器
  210. 監(jiān)督學習
  211. 無監(jiān)督和監(jiān)督的解決方案
  212. 結論
  213. 第12章 生成對抗網(wǎng)絡
  214. 生成對抗網(wǎng)絡概念
  215. 深度卷積生成對抗網(wǎng)絡
  216. 卷積神經(jīng)網(wǎng)絡
  217. 重新思考DCGAN
  218. DCGAN生成器
  219. DCGAN的鑒別器
  220. 鑒別器和對抗模型
  221. MNIST數(shù)據(jù)集的DCGAN
  222. 在MNIST數(shù)據(jù)集執(zhí)行DCGAN
  223. 結論
  224. 第13章 時間序列聚類
  225. 心電數(shù)據(jù)
  226. 走進時間序列聚類
  227. 心電圖k形時間序列聚類
  228. 數(shù)據(jù)準備
  229. 訓練和評估
  230. 在ECG5000上使用k形進行時間序列聚類
  231. 數(shù)據(jù)準備
  232. 訓練和評估
  233. 基于k均值的ECG5000時間序列聚類
  234. 基于ECG5000的分層DBSCAN時間序列聚類
  235. 比較時間序列聚類算法
  236. k形
  237. k均值
  238. HDBSCAN
  239. 比較所有三種時間序列聚類方法
  240. 結論
  241. 第14章 尾聲
  242. 監(jiān)督學習
  243. 無監(jiān)督學習
  244. SciKit-Learn
  245. TensorFlow和Keras
  246. 強化學習
  247. 今天最有希望的無監(jiān)督學習領域
  248. 無監(jiān)督學習的未來
  249. 結語
書名:基于Python的無監(jiān)督學習
作者:Ankur A. Patel
譯者:孫立超 譯
國內(nèi)出版社:中國電力出版社
出版時間:2020年12月
頁數(shù):366
書號:978-7-5198-4949-8
原版書書名:Hands-On Unsupervised Learning Using Python
原版書出版商:O'Reilly Media
Ankur A. Patel
 
Ankur A. Patel是7Park data數(shù)據(jù)科學部門的副總裁(隸屬于Vista Equity Partners投資組合公司)。在7Park data, Ankur和他的數(shù)據(jù)科學團隊使用替代數(shù)據(jù)為對沖基金和企業(yè)構建數(shù)據(jù)產(chǎn)品,并為企業(yè)客戶開發(fā)機器學習服務(MLaaS)。
Ankur A. Patel是Glean和Mellow的聯(lián)合創(chuàng)始人。Glean使用自然語言處理技術生成供應商的支出情報信息,Mellow為程序員提供自然語言處理的API。此前,Ankur曾領導過7Park Data、ThetaRay、RSquared Macro、Bridgewater Associates(橋水聯(lián)合基金) 和JPMorgan(摩根大通)的團隊。他也是Hands-On Unsupervised Learning Using Python一書的作者。
 
 
購買選項
定價:98.00元
書號:978-7-5198-4949-8
出版社:中國電力出版社