91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
數(shù)據(jù)科學(xué)難點(diǎn)解惑
數(shù)據(jù)科學(xué)難點(diǎn)解惑
Daniel Vaughan
王薇 譯
出版時(shí)間:2025年08月
頁(yè)數(shù):260
“Daniel又寫了一部杰作,作為數(shù)據(jù)科學(xué)家與商業(yè)高管之間價(jià)值創(chuàng)造的連接紐帶。這本書是實(shí)現(xiàn)數(shù)據(jù)科學(xué)商業(yè)成功所缺失的手冊(cè)。”
——Adri Purkayastha
Global Head of AI Technology Risk, BNP Paribas
“涵蓋了從經(jīng)濟(jì)學(xué)到廣告,再到流行病學(xué)的所有內(nèi)容,以及如何在實(shí)踐中應(yīng)用數(shù)據(jù)科學(xué)技術(shù)。它從大多數(shù)書籍結(jié)束的地方開(kāi)始,即基于數(shù)據(jù)洞察的實(shí)際決策過(guò)程。這是任何數(shù)據(jù)科學(xué)家書架上早該添加的作品。”
——Brett Holleman
Freelance data scientist
本書提供了一系列在傳統(tǒng)數(shù)據(jù)工程和數(shù)據(jù)科學(xué)教育中被忽視的技術(shù)和最佳實(shí)踐。一個(gè)普遍的誤解是,優(yōu)秀的數(shù)據(jù)科學(xué)家是該領(lǐng)域“重大主題”的專家,即機(jī)器學(xué)習(xí)和編程。然而,大多數(shù)情況下,這些工具只能幫助我們到達(dá)某個(gè)程度。實(shí)際上,真正區(qū)分頂級(jí)數(shù)據(jù)科學(xué)家與普通數(shù)據(jù)科學(xué)家的是這些重大主題中的細(xì)微差別,以及對(duì)業(yè)務(wù)產(chǎn)生影響的能力。
總體而言,本書使一名普通數(shù)據(jù)科學(xué)家候選人與在行業(yè)中表現(xiàn)卓越的數(shù)據(jù)科學(xué)家之間產(chǎn)生了差異。本書作者將這些技能匯集、擴(kuò)展并應(yīng)用于為來(lái)自不同公司和行業(yè)的數(shù)據(jù)科學(xué)家創(chuàng)造價(jià)值和培訓(xùn)。
通過(guò)本書,你將能夠:
● 確保數(shù)據(jù)科學(xué)工作流程創(chuàng)造價(jià)值。
● 設(shè)計(jì)可操作的、及時(shí)的和相關(guān)的指標(biāo)。
● 提供引人矚目的敘述以獲得利益相關(guān)者的支持。
● 使用模擬確保你的機(jī)器學(xué)習(xí)算法是解決該問(wèn)題的正確工具。
● 識(shí)別、糾正和預(yù)防數(shù)據(jù)泄露。
● 通過(guò)估計(jì)因果效應(yīng)理解增量性。
  1. 前言
  2. 第一部分 數(shù)據(jù)分析技術(shù)
  3. 第1章 那又怎樣?利用數(shù)據(jù)科學(xué)創(chuàng)造價(jià)值
  4. 1.1 價(jià)值是什么
  5. 1.2 是什么:了解業(yè)務(wù)
  6. 1.3 所以呢:在DS中創(chuàng)造價(jià)值的要點(diǎn)
  7. 1.4 現(xiàn)在怎么辦:成為一個(gè)積極進(jìn)取的人
  8. 1.5 衡量?jī)r(jià)值
  9. 1.6 關(guān)鍵要點(diǎn)
  10. 1.7 擴(kuò)展閱讀
  11. 第2章 指標(biāo)設(shè)計(jì)
  12. 2.1 指標(biāo)應(yīng)具備的理想屬性
  13. 2.1.1 可衡量
  14. 2.1.2 可操作性
  15. 2.1.3 相關(guān)性
  16. 2.1.4 及時(shí)性
  17. 2.2 指標(biāo)分解
  18. 2.2.1 漏斗分析
  19. 2.2.2 存量流量分解
  20. 2.2.3 P×Q型分解
  21. 2.3 例子:另一種收入分解
  22. 2.4 例子:市場(chǎng)
  23. 2.5 關(guān)鍵要點(diǎn)
  24. 2.6 擴(kuò)展閱讀
  25. 第3章 增長(zhǎng)分解:理解順境與逆境
  26. 3.1 為什么要進(jìn)行增長(zhǎng)分解
  27. 3.2 加法分解
  28. 3.2.1 例子
  29. 3.2.2 解釋和用例
  30. 3.3 乘法分解
  31. 3.3.1 例子
  32. 3.3.2 解釋
  33. 3.4 混合比率分解
  34. 3.4.1 例子
  35. 3.4.2 解釋
  36. 3.5 數(shù)學(xué)推導(dǎo)
  37. 3.5.1 加法分解
  38. 3.5.2 乘法分解
  39. 3.5.3 混合比率分解
  40. 3.6 關(guān)鍵要點(diǎn)
  41. 3.7 擴(kuò)展閱讀
  42. 第4章 2×2設(shè)計(jì)
  43. 4.1 簡(jiǎn)化的案例
  44. 4.2 什么是2×2設(shè)計(jì)
  45. 4.3 示例:測(cè)試模型和新功能
  46. 4.4 示例:了解用戶行為
  47. 4.5 例子:信貸發(fā)放和接收
  48. 4.6 示例:確定工作流程的優(yōu)先級(jí)
  49. 4.7 關(guān)鍵要點(diǎn)
  50. 4.8 擴(kuò)展閱讀
  51. 第5章 構(gòu)建商業(yè)案例
  52. 5.1 構(gòu)建商業(yè)案例的一些原則
  53. 5.2 示例:主動(dòng)留存策略
  54. 5.3 欺詐罪預(yù)防
  55. 5.4 購(gòu)買外部數(shù)據(jù)集
  56. 5.5 從事一個(gè)數(shù)據(jù)科學(xué)項(xiàng)目
  57. 5.6 關(guān)鍵要點(diǎn)
  58. 5.7 擴(kuò)展閱讀
  59. 第6章 提升度是什么
  60. 6.1 定義提升度
  61. 6.2 示例:分類器模型
  62. 6.3 自選擇偏差和幸存者偏差
  63. 6.4 提升度的其他用途
  64. 6.5 關(guān)鍵要點(diǎn)
  65. 6.6 擴(kuò)展閱讀
  66. 第7章 敘述
  67. 7.1 什么是敘述:用你的數(shù)據(jù)來(lái)講故事
  68. 7.1.1 清晰明了的
  69. 7.1.2 可信的
  70. 7.1.3 難忘的
  71. 7.1.4 可操作的
  72. 7.2 構(gòu)建一個(gè)故事
  73. 7.2.1 科學(xué)講述
  74. 7.2.2 什么,那又怎樣,現(xiàn)在怎么辦
  75. 7.3 最后的階段
  76. 7.3.1 寫TL;DR
  77. 7.3.2 如何撰寫令人難忘的TL;DR
  78. 7.3.3 示例:為本章節(jié)寫TL;DR
  79. 7.3.4 進(jìn)行有力的電梯演講
  80. 7.3.5 展現(xiàn)你的敘述
  81. 7.4 關(guān)鍵要點(diǎn)
  82. 7.5 擴(kuò)展閱讀
  83. 第8章 數(shù)據(jù)可視化:選擇正確的圖表來(lái)傳遞信息
  84. 8.1 一些有用的和不太常用的數(shù)據(jù)可視化
  85. 8.1.1 條形圖和折線圖
  86. 8.1.2 斜線圖
  87. 8.1.3 瀑布圖
  88. 8.1.4 平滑散點(diǎn)圖
  89. 8.1.5 繪制分布
  90. 8.2 一般建議
  91. 8.2.1 為你想傳達(dá)的信息找到正確的圖表
  92. 8.2.2 明智的選擇顏色
  93. 8.2.3 圖表中的不同維度
  94. 8.2.4 爭(zhēng)取足夠大的數(shù)據(jù)墨水比率
  95. 8.2.5 定制與半自動(dòng)化相比
  96. 8.2.6 從一開(kāi)始就確定正確的字體大小
  97. 8.2.7 交互的或者靜態(tài)的
  98. 8.2.8 保持簡(jiǎn)單
  99. 8.2.9 從解釋圖表開(kāi)始
  100. 8.3 關(guān)鍵要點(diǎn)
  101. 8.4 擴(kuò)展閱讀
  102. 第二部分 機(jī)器學(xué)習(xí)
  103. 第9章 模擬法和自助法
  104. 9.1 基本的模擬
  105. 9.2 模擬線性模型和線性回歸
  106. 9.3 什么是部分依賴圖
  107. 9.4 遺漏變量偏差
  108. 9.5 模擬分類問(wèn)題
  109. 9.5.1 潛在變量模型
  110. 9.5.2 比較不同算法
  111. 9.6 自助法
  112. 9.7 關(guān)鍵要點(diǎn)
  113. 9.8 擴(kuò)展閱讀
  114. 第10章 線性回歸:回到基礎(chǔ)
  115. 10.1 什么是系數(shù)
  116. 10.2 Frisch-Waugh-Lovell定理
  117. 10.3 為什么你應(yīng)該關(guān)心FWL
  118. 10.4 干擾因子
  119. 10.5 額外變量
  120. 10.6 在機(jī)器學(xué)習(xí)中變化是中心角色
  121. 10.7 關(guān)鍵要點(diǎn)
  122. 10.8 擴(kuò)展閱讀
  123. 第11章 數(shù)據(jù)泄露
  124. 11.1 什么是數(shù)據(jù)泄露
  125. 11.1.1 結(jié)果也是一個(gè)特征
  126. 11.1.2 特征是結(jié)果的函數(shù)
  127. 11.1.3 不良控制變量
  128. 11.1.4 時(shí)間戳標(biāo)記錯(cuò)誤
  129. 11.1.5 具有不規(guī)則時(shí)間聚合的多個(gè)數(shù)據(jù)集
  130. 11.1.6 其他信息的泄露
  131. 11.2 檢測(cè)數(shù)據(jù)泄露
  132. 11.3 完全分離
  133. 11.4 窗口方法
  134. 11.4.1 選擇窗戶的長(zhǎng)度
  135. 11.4.2 訓(xùn)練階段與評(píng)分階段相對(duì)應(yīng)
  136. 11.4.3 實(shí)現(xiàn)窗口方法
  137. 11.5 有數(shù)據(jù)泄露了:現(xiàn)在怎么辦
  138. 11.6 關(guān)鍵要點(diǎn)
  139. 11.7 擴(kuò)展閱讀
  140. 第12章 生產(chǎn)化模型
  141. 12.1 “生產(chǎn)就緒”是什么意思
  142. 12.1.1 批量評(píng)分(離線)
  143. 12.1.2 實(shí)時(shí)模型對(duì)象
  144. 12.2 數(shù)據(jù)和模型漂移
  145. 12.3 任何生產(chǎn)流程中的基本步驟
  146. 12.3.1 獲取和轉(zhuǎn)換數(shù)據(jù)
  147. 12.3.2 驗(yàn)證數(shù)據(jù)
  148. 12.3.3 訓(xùn)練和評(píng)分階段
  149. 12.3.4 驗(yàn)證模型和評(píng)分
  150. 12.3.5 部署模型和評(píng)分
  151. 12.4 關(guān)鍵要點(diǎn)
  152. 12.5 擴(kuò)展閱讀
  153. 第13章 機(jī)器學(xué)習(xí)中的故事講述
  154. 13.1 機(jī)器學(xué)習(xí)故事講述的全過(guò)程
  155. 13.2 事前和期間講故事
  156. 13.2.1 提出假設(shè)
  157. 13.2.2 特征工程
  158. 13.3 事后講故事:打開(kāi)黑盒子
  159. 13.3.1 可解釋性和性能的權(quán)衡
  160. 13.3.2 線性回歸:設(shè)置一個(gè)基準(zhǔn)
  161. 13.3.3 特征重要性
  162. 13.3.4 熱圖
  163. 13.3.5 部分依賴圖
  164. 13.3.6 累積局部效應(yīng)
  165. 13.4 關(guān)鍵要點(diǎn)
  166. 13.5 擴(kuò)展閱讀
  167. 第14章 從預(yù)測(cè)到?jīng)Q策
  168. 14.1 剖析決策制定
  169. 14.2 明智的閾值產(chǎn)生簡(jiǎn)單的決策規(guī)則
  170. 14.2.1 精確率和召回率
  171. 14.2.2 例子:潛在客戶生成
  172. 14.3 混淆矩陣優(yōu)化
  173. 14.4 關(guān)鍵要點(diǎn)
  174. 14.5 擴(kuò)展閱讀
  175. 第15章 增量:數(shù)據(jù)科學(xué)的圣杯
  176. 15.1 定義增量
  177. 15.1.1 從因果推理到提升預(yù)測(cè)
  178. 15.1.2 因果推理作為差異化因素
  179. 15.1.3 提升決策制定
  180. 15.2 干擾因子和對(duì)撞因子
  181. 15.3 選擇偏差
  182. 15.4 無(wú)混淆假設(shè)
  183. 15.5 打破選擇偏差:隨機(jī)化
  184. 15.6 匹配
  185. 15.7 機(jī)器學(xué)習(xí)和因果推理
  186. 15.7.1 打開(kāi)源代碼庫(kù)
  187. 15.7.2 雙重機(jī)器學(xué)習(xí)
  188. 15.8 關(guān)鍵要點(diǎn)
  189. 15.9 擴(kuò)展閱讀
  190. 第16章 A/B測(cè)試
  191. 16.1 什么是A/B測(cè)試
  192. 16.2 決策標(biāo)準(zhǔn)
  193. 16.3 最小可檢測(cè)效應(yīng)
  194. 16.3.1 選擇統(tǒng)計(jì)功效、顯著性水平和P值
  195. 16.3.2 估計(jì)結(jié)果的方差
  196. 16.3.3 模擬
  197. 16.3.4 例子:轉(zhuǎn)換費(fèi)率
  198. 16.3.5 設(shè)置MDE
  199. 16.4 假設(shè)列表
  200. 16.4.1 指標(biāo)
  201. 16.4.2 假設(shè)
  202. 16.4.3 排名
  203. 16.5 實(shí)驗(yàn)治理
  204. 16.6 關(guān)鍵要點(diǎn)
  205. 16.7 擴(kuò)展閱讀
  206. 第17章 大型語(yǔ)言模型和數(shù)據(jù)科學(xué)實(shí)踐
  207. 17.1 當(dāng)前人工智能的狀態(tài)
  208. 17.2 數(shù)據(jù)科學(xué)家們做什么
  209. 17.3 不斷演變的數(shù)據(jù)科學(xué)家職位描述
  210. 17.3.1 案例學(xué)習(xí):A/B測(cè)試
  211. 17.3.2 案例學(xué)習(xí):數(shù)據(jù)清理
  212. 17.3.3 案例學(xué)習(xí):機(jī)器學(xué)習(xí)
  213. 17.4 LLM和本書
  214. 17.5 關(guān)鍵要點(diǎn)
  215. 17.6 擴(kuò)展閱讀
書名:數(shù)據(jù)科學(xué)難點(diǎn)解惑
作者:Daniel Vaughan
譯者:王薇 譯
國(guó)內(nèi)出版社:中國(guó)電力出版社
出版時(shí)間:2025年08月
頁(yè)數(shù):260
書號(hào):978-7-5239-0155-7
原版書書名:Data Science: The Hard Parts
原版書出版商:O'Reilly Media
Daniel Vaughan
 
Daniel Vaughan曾領(lǐng)導(dǎo)不同公司和行業(yè)的數(shù)據(jù)團(tuán)隊(duì),目前正在為幾家金融科技公司提供咨詢,幫助確保其數(shù)據(jù)、機(jī)器學(xué)習(xí)和人工智能計(jì)劃的成功。作為《Analytical Skills for AI and Data Science》(O'Reilly)的作者,他擁有超過(guò)15年的機(jī)器學(xué)習(xí)開(kāi)發(fā)經(jīng)驗(yàn)和超過(guò)8年的數(shù)據(jù)科學(xué)團(tuán)隊(duì)領(lǐng)導(dǎo)經(jīng)驗(yàn)。Daniel獲得了紐約大學(xué)(NYU)經(jīng)濟(jì)學(xué)的博士學(xué)位。
 
 
本書封面的動(dòng)物是一只斑馬魚(學(xué)名:Danio rerio)。斑馬魚是一種淡水魚,屬于小鯉家族,原產(chǎn)于南亞。它們因其側(cè)面有五條水平藍(lán)色條紋而得名,這些條紋延伸到尾鰭末端。雄性在藍(lán)色條紋之間有金色條紋,而雌性則有銀色條紋而非金色。野生的斑馬魚通??砷L(zhǎng)至1.5英寸,壽命為兩三年。它們通常生活在淺水區(qū),包括溪流、池塘和稻田。
斑馬魚因其鮮艷的顏色而在水族箱中很受歡迎,同時(shí)它們易于照顧和繁殖。它們的卵在兩到三天內(nèi)孵化,并在三到四個(gè)月內(nèi)達(dá)到成熟。由于其透明的卵和幼蟲便于觀察發(fā)育,它們?cè)诳茖W(xué)研究中也被廣泛用作脊椎動(dòng)物模型生物。
由于在自然棲息地的數(shù)量眾多,斑馬魚被認(rèn)為是一種低關(guān)注物種。
購(gòu)買選項(xiàng)
定價(jià):88.00元
書號(hào):978-7-5239-0155-7
出版社:中國(guó)電力出版社