91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
數(shù)據(jù)質(zhì)量管理:數(shù)據(jù)可靠性與數(shù)據(jù)質(zhì)量問題解決之道
數(shù)據(jù)質(zhì)量管理:數(shù)據(jù)可靠性與數(shù)據(jù)質(zhì)量問題解決之道
Barr Moses, Lior Gavish, Molly Vorwerck
李晗玥, 陳天皓, 步凡 譯
出版時(shí)間:2024年05月
“任何關(guān)心數(shù)據(jù)質(zhì)量的人都必須閱讀這本書?!?br /> ——Debashis Saha AppZen、Intuit和eBay的數(shù)據(jù)主管

你的產(chǎn)品儀表盤看起來時(shí)髦嗎?你的季度報(bào)告過時(shí)了嗎?你使用的數(shù)據(jù)集是壞的還是根本就是錯(cuò)誤的?這些問題幾乎影響每一個(gè)團(tuán)隊(duì),但它們通常以一種臨時(shí)的、被動(dòng)的方式得到解決。如果你也受困于這些問題,那么本書就是為你準(zhǔn)備的。
如今,許多數(shù)據(jù)工程團(tuán)隊(duì)都面臨著“好管道,壞數(shù)據(jù)”的問題。如果你的數(shù)據(jù)不好,那么數(shù)據(jù)基礎(chǔ)設(shè)施再先進(jìn)也沒用。在本書中,來自數(shù)據(jù)可觀測(cè)性公司蒙特卡羅的Barr Moses、Lior Gavish和Molly Vorwerck解釋了如何利用世界上一些最具創(chuàng)新性的公司采用的最佳實(shí)踐和技術(shù)來解決大規(guī)模數(shù)據(jù)質(zhì)量和信任問題。
通過閱讀本書,你將:
● 構(gòu)建更可信、更可靠的數(shù)據(jù)管道。
● 編寫腳本進(jìn)行數(shù)據(jù)檢查,并通過數(shù)據(jù)可觀測(cè)性識(shí)別損壞的管道。
● 了解如何設(shè)置和維護(hù)數(shù)據(jù)SLA、SLI和SLO。
● 制定并領(lǐng)導(dǎo)公司的數(shù)據(jù)質(zhì)量計(jì)劃。
● 了解如何像對(duì)待生產(chǎn)軟件一樣對(duì)待數(shù)據(jù)服務(wù)和系統(tǒng)。
● 跨數(shù)據(jù)生態(tài)系統(tǒng)自動(dòng)繪制數(shù)據(jù)沿襲圖。
● 為關(guān)鍵數(shù)據(jù)資產(chǎn)構(gòu)建異常檢測(cè)器。
  1. 前言
  2. 第1章 為什么數(shù)據(jù)質(zhì)量值得關(guān)注
  3. 1.1 什么是數(shù)據(jù)質(zhì)量
  4. 1.2 構(gòu)筑當(dāng)下
  5. 1.2.1 了解“數(shù)據(jù)宕機(jī)的增加”
  6. 1.2.2 促成當(dāng)前形勢(shì)的其他行業(yè)趨勢(shì)
  7. 1.3 總結(jié)
  8. 第2章 對(duì)可靠數(shù)據(jù)系統(tǒng)的構(gòu)建模塊進(jìn)行組裝
  9. 2.1 了解事務(wù)型數(shù)據(jù)和分析型數(shù)據(jù)之間的差異
  10. 2.2 是什么讓它們有所不同
  11. 2.3 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)湖
  12. 2.3.1 數(shù)據(jù)倉(cāng)庫(kù):模式級(jí)別的表類型
  13. 2.3.2 數(shù)據(jù)湖:文件級(jí)別的操作
  14. 2.3.3 什么是湖倉(cāng)一體
  15. 2.3.4 在倉(cāng)庫(kù)和湖之間同步數(shù)據(jù)
  16. 2.4 收集數(shù)據(jù)質(zhì)量指標(biāo)
  17. 2.4.1 什么是數(shù)據(jù)質(zhì)量指標(biāo)
  18. 2.4.2 如何提取數(shù)據(jù)質(zhì)量指標(biāo)
  19. 2.4.3 使用查詢?nèi)罩玖私鈹?shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)質(zhì)量
  20. 2.4.4 使用查詢?nèi)罩玖私鈹?shù)據(jù)湖中的數(shù)據(jù)質(zhì)量
  21. 2.5 設(shè)計(jì)數(shù)據(jù)目錄
  22. 2.6 構(gòu)建數(shù)據(jù)目錄
  23. 2.7 總結(jié)
  24. 第3章 收集、清洗、轉(zhuǎn)換和測(cè)試數(shù)據(jù)
  25. 3.1 收集數(shù)據(jù)
  26. 3.1.1 應(yīng)用程序日志數(shù)據(jù)
  27. 3.1.2 API響應(yīng)
  28. 3.1.3 傳感器數(shù)據(jù)
  29. 3.2 清洗數(shù)據(jù)
  30. 3.3 批處理與流處理
  31. 3.4 流處理的數(shù)據(jù)質(zhì)量
  32. 3.5 數(shù)據(jù)標(biāo)準(zhǔn)化
  33. 3.5.1 處理異構(gòu)數(shù)據(jù)源
  34. 3.5.2 模式檢查和類型強(qiáng)制轉(zhuǎn)換
  35. 3.5.3 數(shù)據(jù)中的句法歧義與語義歧義
  36. 3.5.4 管理AWS Kinesis和Apache Kafka之間的事務(wù)型數(shù)據(jù)轉(zhuǎn)換
  37. 3.6 運(yùn)行分析型數(shù)據(jù)轉(zhuǎn)換
  38. 3.6.1 確保ETL期間的數(shù)據(jù)質(zhì)量
  39. 3.6.2 確保轉(zhuǎn)換期間的數(shù)據(jù)質(zhì)量
  40. 3.7 警報(bào)和測(cè)試
  41. 3.7.1 dbt單元測(cè)試
  42. 3.7.2 Great Expectations單元測(cè)試
  43. 3.7.3 Deequ單元測(cè)試
  44. 3.8 使用 Apache Airflow管理數(shù)據(jù)質(zhì)量
  45. 3.8.1 調(diào)度程序的SLA61
  46. 3.8.2 在Apache Airflow中安裝斷路器
  47. 3.8.3 SQL檢查運(yùn)算符
  48. 3.9 總結(jié)
  49. 第4章 數(shù)據(jù)管道的監(jiān)控和異常檢測(cè)
  50. 4.1 了解已知的未知和未知的未知
  51. 4.2 構(gòu)建異常檢測(cè)的算法
  52. 4.2.1 新鮮度監(jiān)控
  53. 4.2.2 了解分布
  54. 4.3 為模式和沿襲構(gòu)建監(jiān)控器
  55. 4.3.1 模式變更和沿襲的異常檢測(cè)
  56. 4.3.2 對(duì)沿襲進(jìn)行可視化
  57. 4.3.3 調(diào)查數(shù)據(jù)異常
  58. 4.4 使用Python和機(jī)器學(xué)習(xí)擴(kuò)展異常檢測(cè)
  59. 4.4.1 利用機(jī)器學(xué)習(xí)改進(jìn)數(shù)據(jù)監(jiān)控警報(bào)
  60. 4.4.2 假陽性和假陰性的解釋
  61. 4.4.3 提高精確率和召回率
  62. 4.4.4 通過數(shù)據(jù)監(jiān)控檢測(cè)新鮮度事件
  63. 4.4.5 F分?jǐn)?shù)
  64. 4.4.6 模型的準(zhǔn)確率重要嗎
  65. 4.5 深入探究:其他有用的異常檢測(cè)方法
  66. 4.6 為數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖分別設(shè)計(jì)數(shù)據(jù)質(zhì)量監(jiān)控器
  67. 4.7 總結(jié)
  68. 第5章 為數(shù)據(jù)可靠性進(jìn)行架構(gòu)設(shè)計(jì)
  69. 5.1 在攝取數(shù)據(jù)時(shí)評(píng)估并維護(hù)高數(shù)據(jù)可靠性
  70. 5.2 度量和維護(hù)管道中的數(shù)據(jù)質(zhì)量
  71. 5.3 了解下游的數(shù)據(jù)質(zhì)量
  72. 5.4 構(gòu)建數(shù)據(jù)平臺(tái)
  73. 5.4.1 數(shù)據(jù)攝取
  74. 5.4.2 數(shù)據(jù)存儲(chǔ)和處理
  75. 5.4.3 數(shù)據(jù)轉(zhuǎn)換和建模
  76. 5.4.4 商業(yè)智能和分析
  77. 5.4.5 數(shù)據(jù)發(fā)現(xiàn)和治理
  78. 5.5 建立對(duì)數(shù)據(jù)的信任
  79. 5.5.1 數(shù)據(jù)可觀測(cè)性
  80. 5.5.2 評(píng)估數(shù)據(jù)質(zhì)量的投資回報(bào)率
  81. 5.5.3 如何為數(shù)據(jù)設(shè)置SLA、SLO和SLI
  82. 5.6 案例分析:Blinkist
  83. 5.7 總結(jié)
  84. 第6章 解決大規(guī)模數(shù)據(jù)質(zhì)量問題
  85. 6.1 在軟件研發(fā)過程中解決數(shù)據(jù)質(zhì)量問題
  86. 6.2 數(shù)據(jù)事件管理
  87. 6.2.1 事件檢測(cè)
  88. 6.2.2 響應(yīng)
  89. 6.2.3 根因分析
  90. 6.2.4 解決
  91. 6.2.5 不做指責(zé)的復(fù)盤
  92. 6.3 事件應(yīng)對(duì)與緩解策略
  93. 6.3.1 建立事件管理的標(biāo)準(zhǔn)程序
  94. 6.3.2 為什么數(shù)據(jù)事件指揮官如此重要
  95. 6.4 案例分析:PagerDuty公司的數(shù)據(jù)事件管理
  96. 6.4.1 PagerDuty的數(shù)據(jù)運(yùn)營(yíng)概況
  97. 6.4.2 PagerDuty的數(shù)據(jù)挑戰(zhàn)
  98. 6.4.3 使用DevOps的最佳實(shí)踐來規(guī)模化數(shù)據(jù)事件管理
  99. 6.5 總結(jié)
  100. 第7章 構(gòu)建端到端的數(shù)據(jù)沿襲
  101. 7.1 為現(xiàn)代數(shù)據(jù)系統(tǒng)構(gòu)建端到端字段級(jí)別的沿襲
  102. 7.1.1 數(shù)據(jù)沿襲的基本要求
  103. 7.1.2 數(shù)據(jù)沿襲的設(shè)計(jì)
  104. 7.1.3 解析數(shù)據(jù)
  105. 7.1.4 構(gòu)建用戶界面
  106. 7.2 案例分析:在??怂构緲?gòu)建數(shù)據(jù)可靠性
  107. 7.2.1 在與利益相關(guān)方打交道時(shí),運(yùn)用“可控自由”原則
  108. 7.2.2 投資于去中心化數(shù)據(jù)團(tuán)隊(duì)
  109. 7.2.3 避免追逐閃亮的新科技,而應(yīng)該選擇解決問題的技術(shù)
  110. 7.2.4 為實(shí)現(xiàn)自助式分析,要致力于建立數(shù)據(jù)信任
  111. 7.3 總結(jié)
  112. 第8章 推廣和普及數(shù)據(jù)質(zhì)量
  113. 8.1 將“數(shù)據(jù)”視為產(chǎn)品
  114. 8.2 將數(shù)據(jù)視為產(chǎn)品的經(jīng)驗(yàn)
  115. 8.2.1 Convoy案例分析:數(shù)據(jù)即服務(wù)或輸出
  116. 8.2.2 Uber案例分析:數(shù)據(jù)產(chǎn)品經(jīng)理的崛起
  117. 8.2.3 采用“數(shù)據(jù)即產(chǎn)品”的方法
  118. 8.3 在數(shù)據(jù)平臺(tái)中建立信任
  119. 8.3.1 確保產(chǎn)品目標(biāo)與業(yè)務(wù)目標(biāo)保持一致
  120. 8.3.2 尋求適合的利益相關(guān)方的反饋與認(rèn)可
  121. 8.3.3 優(yōu)先考慮長(zhǎng)期增長(zhǎng)和可持續(xù)性,而非短期收益
  122. 8.3.4 為數(shù)據(jù)及其評(píng)估標(biāo)準(zhǔn)設(shè)定基準(zhǔn)指標(biāo)
  123. 8.3.5 了解何時(shí)構(gòu)建、何時(shí)購(gòu)買
  124. 8.4 分配數(shù)據(jù)質(zhì)量所有權(quán)
  125. 8.4.1 首席數(shù)據(jù)官
  126. 8.4.2 商業(yè)智能分析師
  127. 8.4.3 分析工程師
  128. 8.4.4 數(shù)據(jù)科學(xué)家
  129. 8.4.5 數(shù)據(jù)治理主管
  130. 8.4.6 數(shù)據(jù)工程師
  131. 8.4.7 數(shù)據(jù)產(chǎn)品經(jīng)理
  132. 8.4.8 誰來負(fù)責(zé)數(shù)據(jù)可靠性
  133. 8.5 為數(shù)據(jù)質(zhì)量創(chuàng)建責(zé)任制
  134. 8.6 平衡數(shù)據(jù)可訪問性與數(shù)據(jù)信任
  135. 8.7 對(duì)數(shù)據(jù)進(jìn)行認(rèn)證
  136. 8.8 實(shí)施數(shù)據(jù)認(rèn)證流程的七個(gè)步驟
  137. 8.9 案例分析:Toast尋找適合其數(shù)據(jù)團(tuán)隊(duì)結(jié)構(gòu)的過程
  138. 8.9.1 起初:一個(gè)艱難滿足數(shù)據(jù)需求的小團(tuán)隊(duì)
  139. 8.9.2 以分散式數(shù)據(jù)運(yùn)營(yíng)支持超級(jí)增長(zhǎng)
  140. 8.9.3 重組、再集中化并重新聚焦于數(shù)據(jù)信任
  141. 8.9.4 在擴(kuò)張數(shù)據(jù)團(tuán)隊(duì)時(shí)需要考慮的因素
  142. 8.10 提高數(shù)據(jù)素養(yǎng)
  143. 8.11 優(yōu)先考慮數(shù)據(jù)治理和合規(guī)性
  144. 8.11.1 優(yōu)先考慮數(shù)據(jù)目錄
  145. 8.11.2 數(shù)據(jù)目錄之外:實(shí)施數(shù)據(jù)治理
  146. 8.12 構(gòu)建數(shù)據(jù)質(zhì)量策略
  147. 8.12.1 讓領(lǐng)導(dǎo)層對(duì)數(shù)據(jù)質(zhì)量最終負(fù)責(zé)
  148. 8.12.2 設(shè)定數(shù)據(jù)質(zhì)量的KPI
  149. 8.12.3 帶頭實(shí)施數(shù)據(jù)治理計(jì)劃
  150. 8.12.4 自動(dòng)化數(shù)據(jù)沿襲與數(shù)據(jù)治理工具
  151. 8.12.5 創(chuàng)建溝通計(jì)劃
  152. 8.13 總結(jié)
  153. 第9章 現(xiàn)實(shí)世界中的數(shù)據(jù)質(zhì)量:對(duì)話和案例分析
  154. 9.1 為更高的數(shù)據(jù)質(zhì)量構(gòu)建數(shù)據(jù)網(wǎng)格
  155. 9.1.1 面向領(lǐng)域的數(shù)據(jù)所有者和數(shù)據(jù)管道
  156. 9.1.2 自助式服務(wù)功能
  157. 9.1.3 互操作性與通信標(biāo)準(zhǔn)化
  158. 9.2 為什么要實(shí)施數(shù)據(jù)網(wǎng)格
  159. 9.2.1 選不選網(wǎng)格
  160. 9.2.2 計(jì)算你的數(shù)據(jù)網(wǎng)格分?jǐn)?shù)
  161. 9.3 與 Zhamak Dehghani的對(duì)話:數(shù)據(jù)質(zhì)量在數(shù)據(jù)網(wǎng)格中的作用
  162. 9.3.1 你可以從單一解決方案構(gòu)建數(shù)據(jù)網(wǎng)格嗎
  163. 9.3.2 數(shù)據(jù)網(wǎng)格是數(shù)據(jù)虛擬化的另一種表達(dá)嗎
  164. 9.3.3 每個(gè)數(shù)據(jù)產(chǎn)品團(tuán)隊(duì)是否管理自己獨(dú)立的數(shù)據(jù)存儲(chǔ)
  165. 9.3.4 自助式數(shù)據(jù)平臺(tái)與分散式數(shù)據(jù)網(wǎng)格是一回事嗎
  166. 9.3.5 數(shù)據(jù)網(wǎng)格適用于所有的數(shù)據(jù)團(tuán)隊(duì)嗎
  167. 9.3.6 團(tuán)隊(duì)中的某個(gè)人會(huì)“擁有”數(shù)據(jù)網(wǎng)格嗎
  168. 9.3.7 數(shù)據(jù)網(wǎng)格是否會(huì)引起數(shù)據(jù)工程師和數(shù)據(jù)分析師之間的摩擦
  169. 9.4 案例分析:Kolibri Games的數(shù)據(jù)棧之旅
  170. 9.4.1 最初的數(shù)據(jù)需求
  171. 9.4.2 追求績(jī)效營(yíng)銷
  172. 9.4.3 2018年:專業(yè)化和集中化
  173. 9.4.4 開始以數(shù)據(jù)為導(dǎo)向
  174. 9.4.5 開始數(shù)據(jù)驅(qū)動(dòng)
  175. 9.4.6 構(gòu)建數(shù)據(jù)網(wǎng)格
  176. 9.4.7 五年數(shù)據(jù)演變的五個(gè)關(guān)鍵思考
  177. 9.5 讓元數(shù)據(jù)為業(yè)務(wù)服務(wù)
  178. 9.6 通過數(shù)據(jù)發(fā)現(xiàn)釋放元數(shù)據(jù)的價(jià)值
  179. 9.6.1 數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖的考量
  180. 9.6.2 數(shù)據(jù)目錄可能淹沒在數(shù)據(jù)湖甚至數(shù)據(jù)網(wǎng)格中
  181. 9.6.3 從傳統(tǒng)的數(shù)據(jù)目錄過渡到現(xiàn)代的數(shù)據(jù)發(fā)現(xiàn)
  182. 9.7 決定何時(shí)開始處理公司的數(shù)據(jù)質(zhì)量問題
  183. 9.7.1 在最近遷移到云端
  184. 9.7.2 數(shù)據(jù)棧隨著更多的數(shù)據(jù)源、更多的表和更高的復(fù)雜性而擴(kuò)展
  185. 9.7.3 你的數(shù)據(jù)團(tuán)隊(duì)正在擴(kuò)充
  186. 9.7.4 你的團(tuán)隊(duì)至少花費(fèi)了30%的時(shí)間來解決數(shù)據(jù)質(zhì)量問題
  187. 9.7.5 你的團(tuán)隊(duì)擁有比一年前更多的數(shù)據(jù)消費(fèi)者
  188. 9.7.6 你的公司正在轉(zhuǎn)向自助式服務(wù)分析模型
  189. 9.7.7 數(shù)據(jù)是客戶價(jià)值主張的關(guān)鍵部分
  190. 9.7.8 數(shù)據(jù)質(zhì)量源于信任
  191. 9.8 總結(jié)
  192. 第10章 開創(chuàng)可靠數(shù)據(jù)系統(tǒng)的未來
  193. 10.1 要積極主動(dòng),而不是消極被動(dòng)
  194. 10.2 對(duì)數(shù)據(jù)質(zhì)量和數(shù)據(jù)可靠性未來的預(yù)測(cè)
  195. 10.2.1 數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖將融為一體
  196. 10.2.2 數(shù)據(jù)團(tuán)隊(duì)中的新角色
  197. 10.2.3 自動(dòng)化的興起
  198. 10.2.4 更多的分布式環(huán)境與數(shù)據(jù)領(lǐng)域的興起
  199. 10.3 何去何從
書名:數(shù)據(jù)質(zhì)量管理:數(shù)據(jù)可靠性與數(shù)據(jù)質(zhì)量問題解決之道
譯者:李晗玥, 陳天皓, 步凡 譯
國(guó)內(nèi)出版社:機(jī)械工業(yè)出版社
出版時(shí)間:2024年05月
書號(hào):978-7-111-75411-4
原版書書名:Data Quality Fundamentals
原版書出版商:O'Reilly Media
Barr Moses
 
Barr Moses是蒙特卡羅公司的首席執(zhí)行官兼聯(lián)合創(chuàng)始人,該公司是數(shù)據(jù)可觀測(cè)性類別的創(chuàng)建者。在長(zhǎng)達(dá)十年的數(shù)據(jù)職業(yè)生涯中,她曾擔(dān)任以色列空軍數(shù)據(jù)情報(bào)部隊(duì)指揮官、貝恩公司顧問和Gainsight公司運(yùn)營(yíng)副總裁。她主持了O'Reilly的第一門數(shù)據(jù)質(zhì)量課程。
 
 
Lior Gavish
 
Lior Gavish是蒙特卡羅公司的首席技術(shù)官兼聯(lián)合創(chuàng)始人,曾聯(lián)合創(chuàng)辦網(wǎng)絡(luò)安全初創(chuàng)公司Sookasa,該公司于2016年被Barracuda公司收購(gòu)。在Barracuda,他曾擔(dān)任高級(jí)工程副總裁,推出了屢獲殊榮的ML防欺詐產(chǎn)品。Lior擁有斯坦福大學(xué)工商管理碩士學(xué)位和特拉維夫大學(xué)計(jì)算機(jī)科學(xué)碩士學(xué)位。
 
 
Molly Vorwerck
 
Molly Vorwerck是蒙特卡羅公司的內(nèi)容主管,還擔(dān)任過Uber工程博客的主編和Uber技術(shù)品牌團(tuán)隊(duì)的首席項(xiàng)目經(jīng)理。她還負(fù)責(zé)Uber首席技術(shù)官的內(nèi)部溝通,以及Uber人工智能實(shí)驗(yàn)室研究審查項(xiàng)目的戰(zhàn)略。
 
 
購(gòu)買選項(xiàng)
定價(jià):109.00元
書號(hào):978-7-111-75411-4
出版社:機(jī)械工業(yè)出版社