91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
數(shù)據(jù)科學(xué)中的實用統(tǒng)計學(xué)(第2版)
數(shù)據(jù)科學(xué)中的實用統(tǒng)計學(xué)(第2版)
Peter Bruce, Andrew Bruce, Peter Gedeck
陳光欣 譯
出版時間:2021年10月
頁數(shù):270
統(tǒng)計方法是數(shù)據(jù)科學(xué)的重要組成部分,但鮮有數(shù)據(jù)科學(xué)從業(yè)人員接受過正規(guī)的統(tǒng)計學(xué)教育或培訓(xùn),而關(guān)于統(tǒng)計學(xué)基礎(chǔ)的課程和教材又很少從數(shù)據(jù)科學(xué)的角度講解。本書以通俗易懂、分門別類的方式,專門從數(shù)據(jù)科學(xué)的角度系統(tǒng)地闡釋重要且實用的統(tǒng)計學(xué)概念,側(cè)重于介紹如何將各種統(tǒng)計方法應(yīng)用于數(shù)據(jù)科學(xué)。
Python和R都是數(shù)據(jù)科學(xué)從業(yè)人員常用的語言。與第1版相比,本書第2版新增了更多Python示例。你將能夠更全面地了解如何在數(shù)據(jù)科學(xué)項目中正確運用各種統(tǒng)計方法,系統(tǒng)梳理數(shù)據(jù)科學(xué)中的核心統(tǒng)計學(xué)概念,透徹理解哪些統(tǒng)計學(xué)概念重要、哪些不那么重要,以及為什么是這樣。此外,本書還可以幫助你充分準備好應(yīng)對數(shù)據(jù)科學(xué)面試。
通過本書,你將掌握以下知識。
● 為什么探索性數(shù)據(jù)分析是開啟數(shù)據(jù)科學(xué)任務(wù)的關(guān)鍵一步
● 隨機抽樣如何降低偏差并提高數(shù)據(jù)集的質(zhì)量
● 實驗設(shè)計原則如何針對問題生成確定性答案
● 如何使用回歸方法估計結(jié)果并檢測異常
● 用于預(yù)測記錄所屬類別的主要分類方法
● 從數(shù)據(jù)中“學(xué)習(xí)”的統(tǒng)計機器學(xué)習(xí)方法
● 從未標記的數(shù)據(jù)中提取信息的無監(jiān)督學(xué)習(xí)方法
  1. 第1章 探索性數(shù)據(jù)分析 
  2. 1.1 結(jié)構(gòu)化數(shù)據(jù)的要素 
  3. 1.2 矩形數(shù)據(jù) 
  4. 1.2.1 數(shù)據(jù)框和索引 
  5. 1.2.2 非矩形數(shù)據(jù)結(jié)構(gòu) 
  6. 1.2.3 擴展閱讀
  7. 1.3 位置估計 
  8. 1.3.1 均值 
  9. 1.3.2 中位數(shù)和健壯的估計 
  10. 1.3.3 示例:人口和謀殺率的位置估計 
  11. 1.3.4 擴展閱讀 
  12. 1.4 變異性估計 
  13. 1.4.1 標準差以及相關(guān)估計 
  14. 1.4.2 基于百分位數(shù)的估計 
  15. 1.4.3 示例:美國各州人口數(shù)量的變異性估計 
  16. 1.4.4 擴展閱讀 
  17. 1.5 探索數(shù)據(jù)分布 
  18. 1.5.1 百分位數(shù)與箱線圖 
  19. 1.5.2 頻數(shù)表和直方圖 
  20. 1.5.3 密度圖和密度估計 
  21. 1.5.4 擴展閱讀 
  22. 1.6 探索二元數(shù)據(jù)和分類型數(shù)據(jù) 
  23. 1.6.1 眾數(shù) 
  24. 1.6.2 期望值 
  25. 1.6.3 概率 
  26. 1.6.4 擴展閱讀 
  27. 1.7 相關(guān)性 
  28. 1.7.1 散點圖 
  29. 1.7.2 擴展閱讀 
  30. 1.8 探索兩個及以上的變量 
  31. 1.8.1 六邊形分箱圖和等高線圖(繪制數(shù)值型數(shù)據(jù)之間的關(guān)系) 
  32. 1.8.2 兩個分類變量 
  33. 1.8.3 分類型數(shù)據(jù)和數(shù)值型數(shù)據(jù) 
  34. 1.8.4 多個變量的可視化 
  35. 1.8.5 擴展閱讀 
  36. 1.9 小結(jié) 
  37. 第2章 數(shù)據(jù)與抽樣分布 
  38. 2.1 隨機抽樣和樣本偏差 
  39. 2.1.1 偏差 
  40. 2.1.2 隨機選擇 
  41. 2.1.3 數(shù)量和質(zhì)量:什么時候數(shù)量更重要 
  42. 2.1.4 樣本均值與總體均值 
  43. 2.1.5 擴展閱讀 
  44. 2.2 選擇偏差 
  45. 2.2.1 均值回歸 
  46. 2.2.2 擴展閱讀 
  47. 2.3 統(tǒng)計量的抽樣分布 
  48. 2.3.1 中心極限定理 
  49. 2.3.2 標準誤差 
  50. 2.3.3 擴展閱讀 
  51. 2.4 Bootstrap方法 
  52. 2.4.1 重抽樣與Bootstrap方法 
  53. 2.4.2 擴展閱讀 
  54. 2.5 置信區(qū)間 
  55. 2.6 正態(tài)分布 
  56. 2.7 長尾分布 
  57. 2.8 學(xué)生的t分布 
  58. 2.9 二項分布 
  59. 2.10 卡方分布 
  60. 2.11 F分布 
  61. 2.12 泊松及其相關(guān)分布 
  62. 2.12.1 泊松分布 
  63. 2.12.2 指數(shù)分布 
  64. 2.12.3 估計故障率 
  65. 2.12.4 韋布爾分布 
  66. 2.12.5 擴展閱讀 
  67. 2.13 小結(jié) 
  68. 第3章 統(tǒng)計實驗與顯著性檢驗 
  69. 3.1 A/B測試 
  70. 3.1.1 為什么要有對照組 
  71. 3.1.2 為什么只有A/B,沒有C/D…… 
  72. 3.1.3 擴展閱讀 
  73. 3.2 假設(shè)檢驗 
  74. 3.2.1 零假設(shè) 
  75. 3.2.2 備擇假設(shè) 
  76. 3.2.3 單向假設(shè)檢驗與雙向假設(shè)檢驗 
  77. 3.2.4 擴展閱讀 
  78. 3.3 重抽樣 
  79. 3.3.1 置換檢驗 
  80. 3.3.2 示例:Web黏性 
  81. 3.3.3 窮盡置換檢驗和Bootstrap置換檢驗 
  82. 3.3.4 置換檢驗:數(shù)據(jù)科學(xué)的底線 
  83. 3.3.5 擴展閱讀 
  84. 3.4 統(tǒng)計顯著性和p值 
  85. 3.4.1 p值 
  86. 3.4.2 α 
  87. 3.4.3 第 一類錯誤和第二類錯誤 
  88. 3.4.4 數(shù)據(jù)科學(xué)與p值 
  89. 3.4.5 擴展閱讀 
  90. 3.5 t檢驗 
  91. 3.6 多重檢驗 
  92. 3.7 自由度 
  93. 3.8 ANOVA 
  94. 3.8.1 F統(tǒng)計量 
  95. 3.8.2 雙向ANOVA 
  96. 3.8.3 擴展閱讀 
  97. 3.9 卡方檢驗 
  98. 3.9.1 卡方檢驗:一種重抽樣方法 
  99. 3.9.2 卡方檢驗:統(tǒng)計理論 
  100. 3.9.3 費希爾精確檢驗 
  101. 3.9.4 與數(shù)據(jù)科學(xué)的關(guān)聯(lián) 
  102. 3.9.5 擴展閱讀 
  103. 3.10 多臂老虎機算法 
  104. 3.11 檢驗力與樣本容量 
  105. 3.11.1 樣本容量 
  106. 3.11.2 擴展閱讀 
  107. 3.12 小結(jié) 
  108. 第4章 回歸與預(yù)測 
  109. 4.1 簡單線性回歸 
  110. 4.1.1 回歸方程 
  111. 4.1.2 擬合值與殘差 
  112. 4.1.3 最小二乘法 
  113. 4.1.4 預(yù)測與解釋(分析) 
  114. 4.1.5 擴展閱讀 
  115. 4.2 多元線性回歸 
  116. 4.2.1 示例:金縣房屋數(shù)據(jù) 
  117. 4.2.2 模型評估 
  118. 4.2.3 交叉驗證 
  119. 4.2.4 模型選擇與逐步回歸 
  120. 4.2.5 加權(quán)回歸 
  121. 4.2.6 擴展閱讀 
  122. 4.3 使用回歸進行預(yù)測 
  123. 4.3.1 外推風(fēng)險 
  124. 4.3.2 置信區(qū)間與預(yù)測區(qū)間 
  125. 4.4 回歸中的因子變量 
  126. 4.4.1 虛擬變量的表示方法 
  127. 4.4.2 多水平因子變量 
  128. 4.4.3 有序因子變量 
  129. 4.5 解釋回歸方程 
  130. 4.5.1 相關(guān)的預(yù)測變量 
  131. 4.5.2 多重共線性 
  132. 4.5.3 混淆變量 
  133. 4.5.4 交互作用與主效應(yīng) 
  134. 4.6 回歸診斷 
  135. 4.6.1 離群點 
  136. 4.6.2 強影響值 
  137. 4.6.3 異方差、非正態(tài)與相關(guān)誤差 
  138. 4.6.4 偏殘差圖與非線性 
  139. 4.7 多項式回歸與樣條回歸 
  140. 4.7.1 多項式回歸 
  141. 4.7.2 樣條回歸 
  142. 4.7.3 廣義可加模型 
  143. 4.7.4 擴展閱讀 
  144. 4.8 小結(jié) 
  145. 第5章 分類 
  146. 5.1 樸素貝葉斯算法 
  147. 5.1.1 為什么進行精確貝葉斯分類是不現(xiàn)實的 
  148. 5.1.2 樸素貝葉斯問題求解 
  149. 5.1.3 數(shù)值型預(yù)測變量 
  150. 5.1.4 擴展閱讀 
  151. 5.2 判別分析 
  152. 5.2.1 協(xié)方差矩陣 
  153. 5.2.2 費希爾線性判別分析 
  154. 5.2.3 一個簡單的例子 
  155. 5.2.4 擴展閱讀 
  156. 5.3 邏輯回歸 
  157. 5.3.1 邏輯響應(yīng)函數(shù)和logit函數(shù) 
  158. 5.3.2 邏輯回歸和廣義線性模型 
  159. 5.3.3 廣義線性模型 
  160. 5.3.4 邏輯回歸的預(yù)測值 
  161. 5.3.5 系數(shù)和優(yōu)勢比的解釋 
  162. 5.3.6 線性回歸與邏輯回歸:共性與差異 
  163. 5.3.7 評估模型 
  164. 5.3.8 擴展閱讀 
  165. 5.4 分類模型評估 
  166. 5.4.1 混淆矩陣 
  167. 5.4.2 稀有類問題 
  168. 5.4.3 精確度、召回率和特異度 
  169. 5.4.4 ROC曲線 
  170. 5.4.5 AUC 
  171. 5.4.6 提升度 
  172. 5.4.7 擴展閱讀 
  173. 5.5 非平衡數(shù)據(jù)的處理策略 
  174. 5.5.1 欠采樣 
  175. 5.5.2 過采樣與上(下)加權(quán) 
  176. 5.5.3 數(shù)據(jù)生成 
  177. 5.5.4 基于成本的分類 
  178. 5.5.5 探索預(yù)測結(jié)果 
  179. 5.5.6 擴展閱讀 
  180. 5.6 小結(jié) 
  181. 第6章 統(tǒng)計機器學(xué)習(xí) 
  182. 6.1 KNN 
  183. 6.1.1 一個小例子:預(yù)測貸款違約 
  184. 6.1.2 距離的度量 
  185. 6.1.3 獨熱編碼 
  186. 6.1.4 標準化(歸一化,z分數(shù)) 
  187. 6.1.5 K的選擇 
  188. 6.1.6 KNN作為特征引擎 
  189. 6.2 樹模型 
  190. 6.2.1 一個簡單的例子 
  191. 6.2.2 遞歸分割算法 
  192. 6.2.3 測量同質(zhì)性或不純度 
  193. 6.2.4 讓樹停止生長 
  194. 6.2.5 預(yù)測連續(xù)的值 
  195. 6.2.6 如何使用樹 
  196. 6.2.7 擴展閱讀 
  197. 6.3 裝袋法與隨機森林 
  198. 6.3.1 裝袋法 
  199. 6.3.2 隨機森林 
  200. 6.3.3 變量的重要性 
  201. 6.3.4 超參數(shù) 
  202. 6.4 提升方法 
  203. 6.4.1 提升算法 
  204. 6.4.2 XGBoost 
  205. 6.4.3 正則化:避免過擬合 
  206. 6.4.4 超參數(shù)與交叉驗證 
  207. 6.5 小結(jié) 
  208. 第7章 無監(jiān)督學(xué)習(xí) 
  209. 7.1 主成分分析 
  210. 7.1.1 一個簡單的例子 
  211. 7.1.2 計算主成分 
  212. 7.1.3 解釋主成分 
  213. 7.1.4 對應(yīng)分析 
  214. 7.1.5 擴展閱讀 
  215. 7.2 K-均值聚類 
  216. 7.2.1 一個簡單的例子 
  217. 7.2.2 K-均值算法 
  218. 7.2.3 簇的解釋 
  219. 7.2.4 選擇簇的數(shù)量 
  220. 7.3 層次聚類 
  221. 7.3.1 一個簡單的例子 
  222. 7.3.2 樹狀圖 
  223. 7.3.3 凝聚算法 
  224. 7.3.4 測量相異度 
  225. 7.4 基于模型的聚類 
  226. 7.4.1 多元正態(tài)分布 
  227. 7.4.2 混合正態(tài)分布 
  228. 7.4.3 選擇簇的數(shù)量 
  229. 7.4.4 擴展閱讀 
  230. 7.5 數(shù)據(jù)縮放與分類變量 
  231. 7.5.1 縮放變量 
  232. 7.5.2 主導(dǎo)變量 
  233. 7.5.3 分類數(shù)據(jù)和Gower距離 
  234. 7.5.4 混合數(shù)據(jù)聚類中的問題 
  235. 7.6 小結(jié) 
  236. 擴展閱讀 
書名:數(shù)據(jù)科學(xué)中的實用統(tǒng)計學(xué)(第2版)
譯者:陳光欣 譯
國內(nèi)出版社:人民郵電出版社
出版時間:2021年10月
頁數(shù):270
書號:978-7-115-56902-8
原版書書名:Practical Statistics for Data Scientists, Second Edition
原版書出版商:O'Reilly Media
Peter Bruce
 
彼得·布魯斯(Peter Bruce),Statistics. com統(tǒng)計學(xué)教育學(xué)院創(chuàng)始人兼院長,重采樣統(tǒng)計軟件Resampling Stats的開發(fā)者,美國統(tǒng)計協(xié)會職業(yè)發(fā)展咨詢委員會成員。
 
 
Andrew Bruce
 
安德魯·布魯斯(Andrew Bruce),亞馬遜數(shù)據(jù)科學(xué)家、華盛頓大學(xué)統(tǒng)計學(xué)博士,擁有30余年的統(tǒng)計學(xué)和數(shù)據(jù)科學(xué)經(jīng)驗。
 
 
Peter Gedeck
 
彼得·格德克(Peter Gedeck),數(shù)據(jù)科學(xué)家,擁有30余年的科學(xué)計算和數(shù)據(jù)科學(xué)經(jīng)驗,善于開發(fā)機器學(xué)習(xí)算法。
 
 
購買選項
定價:99.80元
書號:978-7-115-56902-8
出版社:人民郵電出版社