互联网
类型
可以朗读
语音朗读
173千字
字数
2022-08-01
发行日期
展开全部
主编推荐语
本书先介绍预测分析的重要概念和原则,然后给出一系列的代码示例和算法讲解,进而用Python工具构建高性能的预测分析解决方案。
内容简介
全书所涵盖的内容包括预测分析过程、理解问题和准备数据、理解数据集—探索性数据分析、基于机器学习的数值预测、基于机器学习的类别预测、调整模型和提高性能、基于Dash的模型实现等。
本书适合想要学习预测建模并对用Python工具实现预测分析解决方案感兴趣的数据分析师、数据科学家、数据工程师和Python开发人员阅读,也适合对预测分析感兴趣的读者参考。
目录
- 版权信息
- 内容提要
- 前言
- 审阅者简介
- 译者简介
- 作者简介
- 第1章 预测分析过程
- 1.1 技术要求
- 1.2 什么是预测分析
- 1.3 回顾预测分析的重要概念
- 1.4 预测分析过程
- 1.4.1 理解问题和定义问题
- 1.4.2 收集数据和准备数据
- 1.4.3 使用EDA挖掘数据信息
- 1.4.4 构建模型
- 1.4.5 评价模型
- 1.4.6 沟通以及/或者部署
- 1.4.7 CRISP-DM和其他方法
- 1.5 Python数据科学栈概述
- 1.5.1 Anaconda
- 1.5.2 Jupyter Notebook
- 1.5.3 NumPy
- 1.5.4 SciPy
- 1.5.5 pandas
- 1.5.6 Matplotlib
- 1.5.7 Seaborn
- 1.5.8 scikit-learn
- 1.5.9 TensorFlow和Keras
- 1.5.10 Dash
- 1.6 小结
- 扩展阅读
- 第2章 理解问题和准备数据
- 2.1 技术要求
- 2.2 理解业务问题并提出解决方案
- 2.2.1 背景决定一切
- 2.2.2 定义预测内容
- 2.2.3 明确项目需要的数据
- 2.2.4 考虑数据访问
- 2.2.5 提出解决方案
- 2.3 实践项目
- 2.3.1 钻石的价格——理解问题和定义问题
- 2.3.2 更多背景知识
- 2.3.3 钻石的价格——提出解决方案
- 2.3.4 钻石的价格——收集数据和准备数据
- 2.4 实践项目
- 2.4.1 信用卡违约——理解问题和定义问题
- 2.4.2 信用卡违约——提出解决方案
- 2.4.3 信用卡违约——收集数据和准备数据
- 2.5 小结
- 扩展阅读
- 第3章 理解数据集
- 3.1 技术要求
- 3.2 什么是EDA
- 3.3 一元EDA
- 3.3.1 数值特征的一元EDA
- 3.3.2 分类特征的一元EDA
- 3.4 二元EDA
- 3.4.1 两个数值特征
- 3.4.2 两个分类特征
- 3.4.3 一个数值特征和一个分类特征
- 3.5 图形化的多元EDA
- 3.6 小结
- 扩展阅读
- 第4章 基于机器学习的数值预测
- 4.1 技术要求
- 4.2 机器学习简介
- 4.2.1 监督学习中的任务
- 4.2.2 创建第一个机器学习模型
- 4.2.3 机器学习的目标——泛化
- 4.2.4 过拟合
- 4.2.5 评价函数和最优化
- 4.3 建模之前的实际考虑
- 4.3.1 scikit-learn简介
- 4.3.2 进一步的特征变换
- 4.4 多元线性回归
- 4.5 LASSO回归
- 4.6 kNN
- 4.7 训练与测试误差
- 4.8 小结
- 扩展阅读
- 第5章 基于机器学习的分类预测
- 5.1 技术要求
- 5.2 分类任务
- 预测分类和概率
- 5.3 信用卡违约数据集
- 5.4 逻辑回归
- 5.4.1 一个简单的逻辑回归模型
- 5.4.2 完整的逻辑回归模型
- 5.5 分类树
- 5.5.1 分类树的工作原理
- 5.5.2 分类树的优点和缺点
- 5.5.3 训练更大的分类树
- 5.6 随机森林
- 5.7 训练误差对测试误差
- 5.8 多元分类
- 5.9 朴素贝叶斯分类器
- 5.9.1 条件概率
- 5.9.2 贝叶斯定理
- 5.9.3 回到分类问题
- 5.9.4 高斯朴素贝叶斯
- 5.10 小结
- 扩展阅读
- 第6章 面向预测分析的神经网络简介
- 6.1 技术要求
- 6.2 引入神经网络模型
- 6.2.1 深度学习
- 6.2.2 MLP的结构——神经网络模型的组成部分
- 6.2.3 MLP的学习原理
- 6.3 TensorFlow和Keras简介
- 6.3.1 TensorFlow
- 6.3.2 Keras——以人为本的深度学习
- 6.4 基于神经网络的回归
- 6.4.1 构建预测钻石价格的MLP
- 6.4.2 训练MLP
- 6.4.3 基于神经网络的预测
- 6.5 基于神经网络的分类
- 6.5.1 构建预测信用卡违约的MLP
- 6.5.2 评价预测
- 6.6 训练神经网络模型的“黑暗艺术”
- 6.6.1 决策太多,时间太少
- 6.6.2 神经网络的正则化
- 6.6.3 训练神经网络模型的实用技巧
- 6.7 小结
- 扩展阅读
- 第7章 模型评价
- 7.1 技术要求
- 7.2 回归模型的评价
- 7.2.1 评价回归模型的指标
- 7.2.2 评价回归模型的可视化方法
- 7.3 评价分类模型
- 7.3.1 混淆矩阵及相关指标
- 7.3.2 评价分类模型的可视化方法
- 7.4 k折交叉验证
- 7.5 小结
- 扩展阅读
- 第8章 调整模型和提高性能
- 8.1 技术要求
- 8.2 超参数调整
- 8.2.1 优化单个超参数
- 8.2.2 优化多个超参数
- 8.3 提高性能
- 8.3.1 改进钻石价格预测
- 8.3.2 是技术问题,更是业务问题
- 8.4 小结
- 第9章 基于Dash的模型实现
- 9.1 技术要求
- 9.2 模型沟通和/或部署阶段
- 9.2.1 使用技术报告
- 9.2.2 说明现有应用程序的功能
- 9.2.3 分析应用程序
- 9.3 Dash简介
- 9.3.1 什么是Dash
- 9.3.2 Plotly
- 9.3.3 安装
- 9.3.4 应用程序布局
- 9.3.5 构建基本的静态App
- 9.3.6 构建基本的交互式App
- 9.4 将预测模型实现为网络应用程序
- 9.4.1 生成预测模型对象
- 9.4.2 构建网络应用程序
- 9.5 小结
- 扩展阅读
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。