互联网
类型
可以朗读
语音朗读
171千字
字数
2022-01-01
发行日期
展开全部
主编推荐语
Kubeflow是基于K8S的机器学习工具包,是为数据科学家和数据工程师构建生产级别的机器学习实现而设计的。
内容简介
本书采用循序渐进的方式,从Kubeflow的安装、使用和设计开篇,随后从模型训练的整个周期展开,涵盖了数据探索、特征准备、模型训练/调优、模型服务、模型测试、模型监测和模型版本管理等各个环节,既有相关的理论知识也囊括了真实的使用案例,能够让读者在学习Kubeflow知识的同时全面了解机器学习的相关知识,是入门和深入学习Kubeflow以及机器学习的良好指南。
目录
- 版权信息
- 关于作者
- 关于封面
- O'Reilly Media, Inc. 介绍
- 译者序
- 序言
- 前言
- 第1章 Kubeflow及其适用对象
- 1.1 模型开发生命周期
- 1.2 Kubeflow适合什么场景
- 1.3 为什么需要容器化
- 1.4 为什么需要Kubernetes
- 1.5 Kubeflow的设计和核心组件
- 1.5.1 使用notebook进行数据探索
- 1.5.2 数据准备与特征准备
- 1.5.3 训练
- 1.5.4 超参调优
- 1.5.5 模型验证
- 1.5.6 推理/预测
- 1.5.7 Pipeline
- 1.5.8 组件概述
- 1.6 Kubeflow的替代方案
- 1.6.1 Clipper
- 1.6.2 MLflow
- 1.6.3 其他替代方案
- 1.7 案例研究
- 1.7.1 MNIST
- 1.7.2 邮件列表数据
- 1.7.3 产品推荐系统
- 1.7.4 CT扫描
- 1.8 总结
- 第2章 你好,Kubeflow
- 2.1 搭建Kubeflow
- 2.1.1 安装Kubeflow及其依赖项
- 2.1.2 搭建本地Kubernetes
- 2.1.3 搭建Kubeflow开发环境
- 2.1.4 创建第一个Kubeflow项目
- 2.2 训练和部署模型
- 2.2.1 训练和监测进展
- 2.2.2 测试查询
- 2.3 超越本地部署
- 2.4 总结
- 第3章 Kubeflow设计:超越基础
- 3.1 中央仪表盘
- 3.1.1 notebook(JupyterHub)
- 3.1.2 训练operator
- 3.1.3 初识Kubeflow Pipeline
- 3.1.4 超参调优
- 3.1.5 模型推理
- 3.1.6 元数据
- 3.1.7 组件概述
- 3.2 支持组件
- 3.2.1 MinIO
- 3.2.2 Istio
- 3.2.3 Knative
- 3.2.4 Apache Spark
- 3.2.5 Kubeflow多用户隔离
- 3.3 总结
- 第4章 Kubeflow Pipeline
- 4.1 Pipeline入门
- 4.1.1 探索预置的Pipeline样例
- 4.1.2 用Python构建一个简单的Pipeline
- 4.1.3 步骤之间存储数据
- 4.2 Kubeflow Pipeline组件介绍
- 4.2.1 Argo:Pipeline的基石
- 4.2.2 Kubeflow Pipeline对Argo工作流的增强
- 4.2.3 使用现有镜像构建Pipeline
- 4.2.4 Kubeflow Pipeline组件
- 4.3 Pipeline高级主题
- 4.3.1 Pipeline阶段的条件执行
- 4.3.2 按计划执行Pipeline
- 4.4 总结
- 第5章 数据准备和特征准备
- 5.1 选择正确的工具
- 5.2 本地数据准备和特征准备
- 5.2.1 获取数据
- 5.2.2 数据清理:过滤垃圾信息
- 5.2.3 格式化数据
- 5.2.4 特征准备
- 5.2.5 自定义容器
- 5.3 分布式工具
- 5.3.1 TensorFlow扩展
- 5.3.2 使用Apache Spark的分布式数据
- 5.3.3 使用Apache Spark的分布式特征准备
- 5.4 将其整合到一个Pipeline中
- 5.5 将整个notebook作为数据准备Pipeline阶段使用
- 5.6 总结
- 第6章 制品和元数据存储
- 6.1 Kubeflow ML Metadata
- 6.1.1 编程查询
- 6.1.2 Kubeflow Metadata用户界面
- 6.2 基于Kubeflow的MLflow元数据工具
- 6.2.1 创建和部署MLflow跟踪服务器
- 6.2.2 记录运行数据
- 6.2.3 使用MLflow用户界面
- 6.3 总结
- 第7章 训练机器学习模型
- 7.1 用TensorFlow构建推荐器
- 7.1.1 入门
- 7.1.2 创建一个新notebook会话
- 7.1.3 TensorFlow训练
- 7.2 部署TensorFlow训练作业
- 7.3 分布式训练
- 7.3.1 使用GPU
- 7.3.2 使用其他框架进行分布式训练
- 7.4 使用scikit-learn训练模型
- 7.4.1 建立新的notebook会话
- 7.4.2 数据准备
- 7.4.3 Scikit-learn训练
- 7.4.4 解释模型
- 7.4.5 导出模型
- 7.4.6 集成到Pipeline
- 7.5 总结
- 第8章 模型推断
- 8.1 模型服务
- 8.2 模型监控
- 8.2.1 模型的准确性、漂移和可解释性
- 8.2.2 模型监控要求
- 8.3 模型更新
- 8.4 推理要求概述
- 8.5 Kubeflow中的模型推理
- 8.6 TensorFlow Serving
- 8.7 Seldon Core
- 8.7.1 设计Seldon推理图
- 8.7.2 测试模型
- 8.7.3 服务请求
- 8.7.4 监控模型
- 8.7.5 审阅
- 8.8 KFServing
- 8.8.1 Serverless和服务平面
- 8.8.2 数据平面
- 8.8.3 示例演练
- 8.8.4 剥离底层基础设施
- 8.8.5 审阅
- 8.9 总结
- 第9章 多工具使用案例
- 9.1 CT扫描去噪示例
- 9.1.1 使用Python进行数据准备
- 9.1.2 使用Apache Spark进行DS-SVD
- 9.1.3 可视化
- 9.1.4 CT扫描去噪Pipeline
- 9.2 共享Pipeline
- 9.3 总结
- 第10章 超参调优和自动化机器学习
- 10.1 AutoML概述
- 10.2 使用Kubeflow Katib进行超参调优
- 10.3 Katib概念
- 10.4 安装Katib
- 10.5 运行第一个Katib实验
- 10.5.1 准备训练代码
- 10.5.2 配置实验
- 10.5.3 运行实验
- 10.5.4 Katib用户界面
- 10.6 调优分布式训练作业
- 10.7 神经网络架构搜索
- 10.8 Katib的优势
- 10.9 总结
- 附录A Argo执行器配置和权衡
- 附录B 特定于云的工具和配置
- B.1 Google云
- 附录C 在应用程序中使用模型服务
- C.1 利用模型服务构建流式应用程序
- C.2 利用模型服务构建批处理应用程序
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。