91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
AI輔助數(shù)據(jù)質(zhì)量監(jiān)控
AI輔助數(shù)據(jù)質(zhì)量監(jiān)控
Jeremy Stanley, Paige Schwartz
李晗玥, 柯幸燁, 陳天皓 譯
出版時(shí)間:2025年05月
頁(yè)數(shù):202
“這本書巧妙地闡述了從規(guī)則定義、機(jī)器學(xué)習(xí)到規(guī)模擴(kuò)展以及警報(bào)疲勞等數(shù)據(jù)質(zhì)量的整個(gè)生命周期,是一本權(quán)威的參考資料?!?br /> ——Chris Riccomini
The Missing README的作者
如今,各類企業(yè)每天總共要處理250億億字節(jié)的數(shù)據(jù)。然而,在這些用于開發(fā)產(chǎn)品、驅(qū)動(dòng)人工智能系統(tǒng)以及助力商業(yè)決策的數(shù)據(jù)中,有多少是質(zhì)量不佳甚至完全沒用的數(shù)據(jù)呢?這本書將向你展示如何確保你的組織所依賴的數(shù)據(jù)是可靠的。
大多數(shù)數(shù)據(jù)工程師、數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家真心關(guān)注數(shù)據(jù)質(zhì)量,但他們往往沒有時(shí)間、資源或足夠的認(rèn)知來(lái)構(gòu)建一個(gè)能夠大規(guī)模成功運(yùn)行的數(shù)據(jù)質(zhì)量監(jiān)控解決方案。在本書中,來(lái)自Anomalo公司的Jeremy Stanley和Paige Schwartz將闡釋如何利用自動(dòng)化數(shù)據(jù)質(zhì)量監(jiān)控來(lái)高效覆蓋所有數(shù)據(jù)表,主動(dòng)就問(wèn)題發(fā)出預(yù)警,并立即解決問(wèn)題。
通過(guò)閱讀這本書,你將:
● 了解為何數(shù)據(jù)質(zhì)量是企業(yè)的當(dāng)務(wù)之急。
● 構(gòu)建一個(gè)無(wú)監(jiān)督機(jī)器學(xué)習(xí)模型,用于檢測(cè)數(shù)據(jù)問(wèn)題。
● 實(shí)施通知機(jī)制,以減輕警報(bào)疲勞,并快速對(duì)問(wèn)題進(jìn)行分類并解決它們。
● 將自動(dòng)化數(shù)據(jù)質(zhì)量監(jiān)控與數(shù)據(jù)目錄、編排層以及商業(yè)智能和機(jī)器學(xué)習(xí)系統(tǒng)進(jìn)行集成。
● 學(xué)習(xí)如何克服自動(dòng)化數(shù)據(jù)質(zhì)量監(jiān)控的局限性。
● 了解如何大規(guī)模部署和管理你的監(jiān)控解決方案。
  1. 前言
  2. 第1章 數(shù)據(jù)質(zhì)量監(jiān)控勢(shì)在必行
  3. 1.1 高質(zhì)量的數(shù)據(jù)是新時(shí)代的黃金
  4. 1.1.1 數(shù)據(jù)驅(qū)動(dòng)型公司是當(dāng)今的顛覆者
  5. 1.1.2 數(shù)據(jù)分析的普及
  6. 1.1.3 人工智能和機(jī)器學(xué)習(xí)是競(jìng)爭(zhēng)優(yōu)勢(shì)之源
  7. 1.1.4 公司正在投資現(xiàn)代數(shù)據(jù)棧
  8. 1.2 數(shù)據(jù)越多,問(wèn)題越多
  9. 1.2.1 數(shù)據(jù)工廠中的問(wèn)題
  10. 1.2.2 數(shù)據(jù)遷移
  11. 1.2.3 第三方數(shù)據(jù)源
  12. 1.2.4 公司的成長(zhǎng)與變化
  13. 1.2.5 外界因素
  14. 1.3 為什么我們需要數(shù)據(jù)質(zhì)量監(jiān)控
  15. 1.3.1 數(shù)據(jù)疤痕
  16. 1.3.2 數(shù)據(jù)沖擊
  17. 1.4 自動(dòng)化數(shù)據(jù)質(zhì)量監(jiān)控:一個(gè)全新的領(lǐng)域
  18. 第2章 數(shù)據(jù)質(zhì)量監(jiān)控策略與自動(dòng)化的角色
  19. 2.1 監(jiān)控需求
  20. 2.2 數(shù)據(jù)可觀測(cè)性:必要但不充分
  21. 2.3 傳統(tǒng)的數(shù)據(jù)質(zhì)量監(jiān)控方法
  22. 2.3.1 人工數(shù)據(jù)質(zhì)量檢測(cè)
  23. 2.3.2 基于規(guī)則的測(cè)試
  24. 2.3.3 指標(biāo)監(jiān)控
  25. 2.4 使用無(wú)監(jiān)督機(jī)器學(xué)習(xí)實(shí)現(xiàn)自動(dòng)化數(shù)據(jù)質(zhì)量監(jiān)控
  26. 2.4.1 什么是無(wú)監(jiān)督機(jī)器學(xué)習(xí)
  27. 2.4.2 類比:車道偏離警告
  28. 2.4.3 自動(dòng)化的局限性
  29. 2.5 數(shù)據(jù)質(zhì)量監(jiān)控的四大支柱方法
  30. 第3章 對(duì)自動(dòng)化數(shù)據(jù)質(zhì)量監(jiān)控的商業(yè)影響進(jìn)行評(píng)估
  31. 3.1 對(duì)數(shù)據(jù)進(jìn)行評(píng)估
  32. 3.1.1 數(shù)量
  33. 3.1.2 種類
  34. 3.1.3 速度
  35. 3.1.4 真實(shí)性
  36. 3.1.5 特殊情況
  37. 3.2 評(píng)估你的行業(yè)
  38. 3.2.1 監(jiān)管壓力
  39. 3.2.2 人工智能/機(jī)器學(xué)習(xí)的風(fēng)險(xiǎn)
  40. 3.2.3 數(shù)據(jù)即產(chǎn)品
  41. 3.3 評(píng)估你的數(shù)據(jù)成熟度
  42. 3.4 評(píng)估對(duì)利益相關(guān)方的好處
  43. 3.4.1 工程師
  44. 3.4.2 數(shù)據(jù)團(tuán)隊(duì)領(lǐng)導(dǎo)者
  45. 3.4.3 科學(xué)家
  46. 3.4.4 消費(fèi)者
  47. 3.5 進(jìn)行投資回報(bào)率分析
  48. 3.5.1 定量指標(biāo)
  49. 3.5.2 定性指標(biāo)
  50. 3.6 總結(jié)
  51. 第4章 利用機(jī)器學(xué)習(xí)使數(shù)據(jù)質(zhì)量監(jiān)控自動(dòng)化
  52. 4.1 要求
  53. 4.1.1 敏感性
  54. 4.1.2 特異性
  55. 4.1.3 透明度
  56. 4.1.4 可擴(kuò)展性
  57. 4.1.5 非必要需求
  58. 4.1.6 數(shù)據(jù)質(zhì)量監(jiān)控不等同于異常檢測(cè)
  59. 4.2 機(jī)器學(xué)習(xí)方法和算法
  60. 4.2.1 數(shù)據(jù)抽樣
  61. 4.2.2 特征編碼
  62. 4.2.3 模型開發(fā)
  63. 4.2.4 模型可解釋性
  64. 4.3 整體思路的偽代碼實(shí)現(xiàn)
  65. 4.4 其他應(yīng)用
  66. 4.5 總結(jié)
  67. 第5章 構(gòu)建一個(gè)適用于真實(shí)數(shù)據(jù)的模型
  68. 5.1 數(shù)據(jù)挑戰(zhàn)及應(yīng)對(duì)措施
  69. 5.1.1 季節(jié)性
  70. 5.1.2 基于時(shí)間的特征
  71. 5.1.3 混亂程度
  72. 5.1.4 就地更新表格
  73. 5.1.5 列之間的相關(guān)性
  74. 5.2 模型測(cè)試
  75. 5.2.1 引入合成異常
  76. 5.2.2 基準(zhǔn)測(cè)試
  77. 5.2.3 模型改進(jìn)
  78. 5.3 總結(jié)
  79. 第6章 實(shí)施警報(bào)機(jī)制同時(shí)避免警報(bào)疲勞
  80. 6.1 如何通過(guò)通知促進(jìn)數(shù)據(jù)問(wèn)題響應(yīng)
  81. 6.1.1 分類處理
  82. 6.1.2 路由
  83. 6.1.3 解決方案
  84. 6.1.4 文檔記錄
  85. 6.2 在沒有通知的情況下采取行動(dòng)
  86. 6.3 一個(gè)通知的解析
  87. 6.3.1 可視化
  88. 6.3.2 操作
  89. 6.3.3 文本描述
  90. 6.3.4 檢查的創(chuàng)建者/最后編輯者
  91. 6.4 發(fā)送通知
  92. 6.4.1 通知的受眾
  93. 6.4.2 通知的渠道
  94. 6.4.3 通知的時(shí)機(jī)
  95. 6.5 避免警報(bào)疲勞
  96. 6.5.1 合理安排檢查順序
  97. 6.5.2 使用機(jī)器學(xué)習(xí)對(duì)警報(bào)進(jìn)行聚類
  98. 6.5.3 抑制通知
  99. 6.6 自動(dòng)化根因分析
  100. 6.7 總結(jié)
  101. 第7章 集成監(jiān)控與數(shù)據(jù)工具和系統(tǒng)
  102. 7.1 監(jiān)控?cái)?shù)據(jù)堆棧
  103. 7.2 數(shù)據(jù)倉(cāng)庫(kù)
  104. 7.2.1 與數(shù)據(jù)倉(cāng)庫(kù)集成
  105. 7.2.2 安全性
  106. 7.2.3 多倉(cāng)庫(kù)之間的數(shù)據(jù)協(xié)調(diào)
  107. 7.3 數(shù)據(jù)編排器
  108. 7.4 數(shù)據(jù)目錄
  109. 7.5 數(shù)據(jù)使用者
  110. 7.5.1 BI和分析工具
  111. 7.5.2 MLOps
  112. 7.6 總結(jié)
  113. 第8章 大規(guī)模運(yùn)營(yíng)解決方案
  114. 8.1 自建還是購(gòu)買
  115. 8.2 配置
  116. 8.2.1 確定最重要的表格
  117. 8.2.2 決定監(jiān)控表格中的哪些數(shù)據(jù)
  118. 8.2.3 大規(guī)模配置
  119. 8.3 啟用
  120. 8.3.1 用戶角色和權(quán)限
  121. 8.3.2 培訓(xùn)、支持與推廣
  122. 8.4 持續(xù)改善數(shù)據(jù)質(zhì)量
  123. 8.4.1 數(shù)據(jù)健康計(jì)劃
  124. 8.4.2 衡量指標(biāo)
  125. 8.5 從混亂到清晰
  126. 附錄 數(shù)據(jù)質(zhì)量問(wèn)題的類型
書名:AI輔助數(shù)據(jù)質(zhì)量監(jiān)控
譯者:李晗玥, 柯幸燁, 陳天皓 譯
國(guó)內(nèi)出版社:機(jī)械工業(yè)出版社
出版時(shí)間:2025年05月
頁(yè)數(shù):202
書號(hào):978-7-111-78025-0
原版書書名:Automating Data Quality Monitoring
原版書出版商:O'Reilly Media
Jeremy Stanley
 
Jeremy Stanley是Anomalo公司的聯(lián)合創(chuàng)始人兼首席技術(shù)官。此前,他曾在Instacart公司擔(dān)任數(shù)據(jù)科學(xué)副總裁,在那里他領(lǐng)導(dǎo)了機(jī)器學(xué)習(xí)項(xiàng)目,并推動(dòng)了旨在提高公司盈利能力的各項(xiàng)舉措。
 
 
Paige Schwartz
 
Paige Schwartz是Anomalo公司的一名專業(yè)技術(shù)作家,曾為包括Airbnb(愛彼迎)、Grammarly和OpenAI等在內(nèi)的企業(yè)客戶撰寫文案。她曾擔(dān)任谷歌的產(chǎn)品經(jīng)理,擅長(zhǎng)機(jī)器學(xué)習(xí)和數(shù)據(jù)相關(guān)領(lǐng)域的話題。
 
 
本書封面上的動(dòng)物是一只姥鯊(Cetorhinus maximus)。姥鯊是世界上第二大的魚類,雖然它們看起來(lái)令人生畏,但實(shí)際上是相當(dāng)溫和的生物。
姥鯊最長(zhǎng)可達(dá)12米,最重可達(dá)6噸,它們的大型背鰭使它們?cè)谒嬗蝿?dòng)時(shí)容易被發(fā)現(xiàn)。它們有一個(gè)球狀的鼻子,頭部幾乎被鰓裂環(huán)繞。姥鯊?fù)ㄟ^(guò)緩慢游動(dòng)并張開大嘴攝食,將浮游動(dòng)物捕捉在鰓耙中。一只姥鯊每小時(shí)可以過(guò)濾約2000噸海水中的食物。它們廣泛分布于全球溫帶地區(qū)。
姥鯊曾被過(guò)度捕獵到瀕臨滅絕的地步。盡管已對(duì)它們實(shí)施了保護(hù)措施,但它們?nèi)钥赡軙?huì)被誤撈或因被漁具纏住而受傷。此外,它們還面臨著被船只撞死的危險(xiǎn)。
購(gòu)買選項(xiàng)
定價(jià):79.00元
書號(hào):978-7-111-78025-0
出版社:機(jī)械工業(yè)出版社