Kubeflow學(xué)習(xí)指南:生產(chǎn)級機(jī)器學(xué)習(xí)系統(tǒng)實(shí)現(xiàn)
狄衛(wèi)華 譯
出版時(shí)間:2022年01月
頁數(shù):228
如果你正在訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)模型,但不確定如何將其投入生產(chǎn),本書將協(xié)助你完成目標(biāo)。Kubeflow為模型生命周期的不同階段提供了一系列云原生工具,從數(shù)據(jù)探索和特征準(zhǔn)備到模型訓(xùn)練和模型服務(wù)。本書可以幫助數(shù)據(jù)科學(xué)家用Kubeflow構(gòu)建生產(chǎn)級機(jī)器學(xué)習(xí)實(shí)現(xiàn),并向數(shù)據(jù)工程師展示了如何使模型具有可伸縮性和可靠性。
作者使用書中的示例解釋了如何使用Kubeflow在云端或者本地開發(fā)環(huán)境中的Kubernetes上訓(xùn)練機(jī)器學(xué)習(xí)模型并為模型提供服務(wù)。
本書將幫助你:
● 理解Kubeflow的設(shè)計(jì)、核心組件和所能解決的問題。
● 使用Kubeflow和流行的工具(包括scikit-learn、TensorFlow和Apache Spark)訓(xùn)練模型。
● 使用Kubeflow流水線使模型保持最新狀態(tài)。
● 了解如何獲取模型訓(xùn)練的元數(shù)據(jù)。
● 為超參調(diào)優(yōu)進(jìn)行訓(xùn)練。
● 了解如何在生產(chǎn)中為模型提供服務(wù)。
● 探索如何用其他開源工具擴(kuò)展Kubeflow。
- 序言
- 前言
- 第1章 Kubeflow及其適用對象
- 1.1 模型開發(fā)生命周期
- 1.2 Kubeflow適合什么場景
- 1.3 為什么需要容器化
- 1.4 為什么需要 Kubernetes
- 1.5 Kubeflow的設(shè)計(jì)和核心組件
- 1.6 Kubeflow的替代方案
- 1.7 案例研究
- 1.8 總結(jié)
- 第2章 你好,Kubeflow
- 2.1 搭建Kubeflow
- 2.2 訓(xùn)練和部署模型
- 2.3 超越本地部署
- 2.4 總結(jié)
- 第3章 Kubeflow設(shè)計(jì):超越基礎(chǔ)
- 3.1 中央儀表盤
- 3.2 支持組件
- 3.3 總結(jié)
- 第4章 Kubeflow Pipeline
- 4.1 Pipeline入門
- 4.2 Kubeflow Pipeline組件介紹
- 4.3 Pipeline高級主題
- 4.4 總結(jié)
- 第5章 數(shù)據(jù)準(zhǔn)備和特征準(zhǔn)備
- 5.1 選擇正確的工具
- 5.2 本地?cái)?shù)據(jù)準(zhǔn)備和特征準(zhǔn)備
- 5.3 分布式工具
- 5.4 將其整合到一個(gè)Pipeline中
- 5.5 將整個(gè)notebook作為數(shù)據(jù)準(zhǔn)備Pipeline階段使用
- 5.6 總結(jié)
- 第6章 制品和元數(shù)據(jù)存儲
- 6.1 Kubeflow ML Metadata
- 6.2 基于Kubeflow的MLflow元數(shù)據(jù)工具
- 6.3 總結(jié)
- 第7章 訓(xùn)練機(jī)器學(xué)習(xí)模型
- 7.1 用TensorFlow構(gòu)建推薦器
- 7.2 部署TensorFlow訓(xùn)練作業(yè)
- 7.3 分布式訓(xùn)練
- 7.4 使用scikit-learn訓(xùn)練模型
- 7.5 總結(jié)
- 第8章 模型推斷
- 8.1 模型服務(wù)
- 8.2 模型監(jiān)控
- 8.3 模型更新
- 8.4 推理要求概述
- 8.5 Kubeflow中的模型推理
- 8.6 TensorFlow Serving
- 8.7 Seldon Core
- 8.8 KFServing
- 8.9 總結(jié)
- 第9章 多工具使用案例
- 9.1 CT掃描去噪示例
- 9.2 共享Pipeline
- 9.3 總結(jié)
- 第10章 超參調(diào)優(yōu)和自動化機(jī)器學(xué)習(xí)
- 10.1 AutoML概述
- 10.2 使用Kubeflow Katib進(jìn)行超參調(diào)優(yōu)
- 10.3 Katib概念
- 10.4 安裝Katib
- 10.5 運(yùn)行第一個(gè)Katib實(shí)驗(yàn)
- 10.6 調(diào)優(yōu)分布式訓(xùn)練作業(yè)
- 10.7 神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索
- 10.8 Katib的優(yōu)勢
- 10.9 總結(jié)
- 附錄A Argo執(zhí)行器配置和權(quán)衡
- 附錄B 特定于云的工具和配置
- 附錄C 在應(yīng)用程序中使用模型服務(wù)
書名:Kubeflow學(xué)習(xí)指南:生產(chǎn)級機(jī)器學(xué)習(xí)系統(tǒng)實(shí)現(xiàn)
譯者:狄衛(wèi)華 譯
國內(nèi)出版社:機(jī)械工業(yè)出版社
出版時(shí)間:2022年01月
頁數(shù):228
書號:978-7-111-69937-8
原版書書名:Kubeflow for Machine Learning
原版書出版商:O'Reilly Media
Trevor Grant
Trevor Grant是Apache Mahout的PMC主席。
Holden Karau
Holden Karau是一位加拿大人,在IBM的Spark技術(shù)中心擔(dān)任軟件開發(fā)工程師。同時(shí)作為一位Spark committer,經(jīng)常在PySpark和機(jī)器學(xué)習(xí)方面進(jìn)行貢獻(xiàn)。另外曾在多次國際會議中發(fā)表關(guān)于Spark的演講。
Databricks的軟件開發(fā)工程師,活躍于開源社區(qū)。她還著有《Spark快速數(shù)據(jù)處理》。
Boris Lublinsky
Boris Lublinsky是Lightbend的首席架構(gòu)師。
Richard Liu
Richard Liu是Waymo的一名高級軟件工程師。
Ilan Filonenko
Ilan Filonenko是Bloomberg數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施團(tuán)隊(duì)的一名軟件工程師