科技
类型
可以朗读
语音朗读
128千字
字数
2024-04-01
发行日期
展开全部
主编推荐语
教你如何使用ray构建分布式机器学程序。
内容简介
Ray是开源分布式计算框架,简化了扩展计算密集型Python工作负载的过程。本书展示了如何使用Ray构建机器学习应用程序,介绍了Ray如何融入当前的机器学习工具,以及Ray如何与这些工具紧密集成。
本书前3章介绍了Ray作为分布式Python框架的基础知识,并提供了应用示例;第4-10章介绍了Ray高级库(Ray RLlib、Ray Tune、Ray Dataset、Ray Train、Ray Serve、Ray Cluster、Ray AIR),并展示如何使用高级库创建应用程序;第11章对Ray的生态进行了总结,并指导读者继续学习。
目录
- 版权信息
- O'Reilly Media,Inc.介绍
- 推荐序 让分布式AI触手可及
- 序
- 前言
- 第1章 Ray概述
- 1.1 Ray是什么
- 1.1.1 Ray的渊源
- 1.1.2 Ray的设计原则
- 1.1.3 Ray的三层架构:内核、库、生态
- 1.2 分布式计算框架
- 1.3 数据科学库套件
- 1.3.1 Ray AIR和数据科学工作流
- 1.3.2 处理数据
- 1.3.3 训练模型
- 1.3.4 调优超参数
- 1.3.5 部署模型
- 1.4 Ray的生态
- 1.5 总结
- 第2章 Ray Core入门
- 2.1 Ray Core简介
- 2.1.1 Ray API的第一个示例
- 2.1.2 Ray Core API概述
- 2.2 理解Ray的系统组件
- 2.2.1 在节点上调度和执行任务
- 2.2.2 主节点
- 2.2.3 分布式调度和执行
- 2.3 利用Ray创建简单的MapReduce示例
- 2.3.1 映射和打乱文档数据
- 2.3.2 利用约简进行单词统计
- 2.4 总结
- 第3章 创建第一个分布式应用程序
- 3.1 强化学习入门
- 3.2 创建简易的迷宫问题
- 3.3 创建模拟
- 3.4 训练强化学习模型
- 3.5 创建分布式Ray应用程序
- 3.6 回顾强化学习术语
- 3.7 总结
- 第4章 利用Ray RLlib进行强化学习
- 4.1 RLlib概述
- 4.2 RLlib入门
- 4.2.1 创建Gym环境
- 4.2.2 运行RLlib CLI
- 4.2.3 使用RLlib Python API
- 4.3 配置RLlib实验
- 4.3.1 资源配置
- 4.3.2 配置rollout worker
- 4.3.3 配置环境
- 4.4 使用RLlib环境
- 4.4.1 RLlib环境概述
- 4.4.2 使用多智能体
- 4.4.3 使用策略服务器和客户端
- 4.5 高级概念
- 4.5.1 创建高级环境
- 4.5.2 应用课程学习
- 4.5.3 使用离线数据
- 4.5.4 其他高级主题
- 4.6 总结
- 第5章 利用Ray Tune进行超参数调优
- 5.1 调优超参数
- 5.1.1 使用Ray创建随机搜索示例
- 5.1.2 调优超参数的难点
- 5.2 Ray Tune入门
- 5.2.1 Tune的原理
- 5.2.2 配置和运行Tune
- 5.3 使用Tune进行机器学习
- 5.3.1 结合使用RLlib和Tune
- 5.3.2 调优Keras模型
- 5.4 总结
- 第6章 利用Ray进行数据处理
- 6.1 Ray Dataset
- 6.1.1 Ray Dataset基础
- 6.1.2 利用Ray Dataset进行计算
- 6.1.3 数据集管道
- 6.1.4 示例:并行训练分类器副本
- 6.2 外部集成库
- 6.3 创建ML管道
- 6.4 总结
- 第7章 利用Ray Train进行分布式训练
- 7.1 分布式模型训练基础
- 7.2 基于示例介绍Ray Train
- 7.2.1 预测纽约出租车的大额小费
- 7.2.2 加载、预处理、特征化
- 7.2.3 定义深度学习模型
- 7.2.4 示例:利用Ray Train进行分布式训练
- 7.2.5 分布式批量推理
- 7.3 Ray Train训练器
- 7.3.1 迁移到Ray Train
- 7.3.2 扩展训练器
- 7.3.3 利用Ray Train进行预处理
- 7.3.4 将训练器和Ray Tune集成
- 7.3.5 使用回调函数监控训练
- 7.4 总结
- 第8章 利用Ray Serve进行在线推理
- 8.1 在线推理的主要特点
- 8.1.1 ML模型属于计算密集型
- 8.1.2 ML模型无法独立使用
- 8.2 Ray Serve入门
- 8.2.1 Ray Serve概述
- 8.2.2 定义基础HTTP端点
- 8.2.3 扩展和资源分配
- 8.2.4 批处理请求
- 8.2.5 多模型推理图
- 8.3 端到端示例:创建基于NLP的API
- 8.3.1 获取内容和预处理
- 8.3.2 NLP模型
- 8.3.3 HTTP处理和驱动逻辑
- 8.3.4 整合
- 8.4 总结
- 第9章 Ray集群
- 9.1 手动创建Ray Cluster
- 9.2 在Kubernetes上进行部署
- 9.2.1 设置KubeRay集群
- 9.2.2 与KubeRay集群交互
- 9.2.3 公开KubeRay
- 9.2.4 配置KubeRay
- 9.2.5 配置KubeRay日志
- 9.3 使用Ray集群启动器
- 9.3.1 配置Ray集群
- 9.3.2 使用集群启动器CLI
- 9.3.3 与Ray Cluster交互
- 9.4 使用云集群
- 9.4.1 AWS
- 9.4.2 其他云服务
- 9.5 自动扩展
- 9.6 总结
- 第10章 Ray AIR入门
- 10.1 为什么使用AIR
- 10.2 AIR核心概念
- 10.2.1 Ray Dataset和预处理器
- 10.2.2 训练器
- 10.2.3 调优器和检查点
- 10.2.4 批预测器
- 10.2.5 部署
- 10.3 适合AIR的任务
- 10.3.1 AIR任务执行
- 10.3.2 AIR内存管理
- 10.3.3 AIR故障模型
- 10.3.4 自动扩展AIR任务
- 10.4 总结
- 第11章 Ray生态及其他
- 11.1 蓬勃的生态
- 11.1.1 数据加载和处理
- 11.1.2 模型训练
- 11.1.3 模型服务
- 11.1.4 创建自定义集成
- 11.1.5 Ray集成概述
- 11.2 Ray和其他系统
- 11.2.1 分布式Python框架
- 11.2.2 Ray AIR和更广泛的ML生态
- 11.2.3 将AIR集成到ML平台
- 11.3 继续学习
- 11.4 总结
- 作者简介
- 封面简介
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。