可以朗读
语音朗读
170千字
字数
2021-01-01
发行日期
展开全部
主编推荐语
本书专为初学者顺利入门而设计,解决机器学习中基本理论和编程实践的两大障碍。
内容简介
本书讲述机器学习的基本原理,使用Python和Numpy实现涉及的各种机器学习算法。通过理论学习和实践操作,使读者了解并掌握机器学习的基本原理和技能,拉近理论与实践的距离。
全书共分为13章,主要内容包括:机器学习介绍、线性回归、逻辑回归、贝叶斯分类器、模型评估与选择、K-均值算法和EM算法、决策树、神经网络、隐马尔科夫模型、支持向量机、推荐系统、主成分分析、集成学习。全书源码全部在Python3.7上调试成功,每章都附有习题和习题参考答案,供读者参考。
本书系统讲解了机器学习的常用核心算法和Python编程实践,内容全面、实例丰富、可操作性强,做到理论与实践相结合。本书适合机器学习爱好者作为入门和提高的技术参考书,也适合用作计算机专业高年级本科生和研究生的教材或教学参考书。
目录
- 版权信息
- 内容简介
- 前言
- 第1章 机器学习介绍
- 1.1 机器学习简介
- 1.1.1 什么是机器学习
- 1.1.2 机器学习与日常生活
- 1.1.3 如何学习机器学习
- 1.1.4 Python的优势
- 1.2 基本概念
- 1.2.1 机器学习的种类
- 1.2.2 有监督学习
- 1.2.3 无监督学习
- 1.2.4 机器学习的术语
- 1.2.5 预处理
- 1.3 Numpy数据格式
- 1.3.1 标称数据
- 1.3.2 序数数据
- 1.3.3 分类数据
- 1.4 示例数据集
- 1.4.1 天气问题
- 1.4.2 鸢尾花
- 1.4.3 其他数据集
- 1.5 了解你的数据
- 习题
- 第2章 线性回归
- 2.1 从一个实际例子说起
- 2.1.1 模型定义
- 2.1.2 模型假设
- 2.1.3 模型评估
- 2.2 最小二乘法
- 2.2.1 最小二乘法求解参数
- 2.2.2 用最小二乘法来拟合奥运会数据
- 2.2.3 预测比赛结果
- 2.3 梯度下降
- 2.3.1 基本思路
- 2.3.2 梯度下降算法
- 2.3.3 梯度下降求解线性回归问题
- 2.4 多变量线性回归
- 2.4.1 多变量线性回归问题
- 2.4.2 多变量梯度下降
- 2.4.3 随机梯度下降
- 2.4.4 小批量梯度下降
- 2.4.5 正规方程
- 2.5 多项式回归
- 2.5.1 多项式回归算法
- 2.5.2 正则化
- 习题
- 第3章 逻辑回归
- 3.1 逻辑回归介绍
- 3.1.1 线性回归用于分类
- 3.1.2 假设函数
- 3.1.3 决策边界
- 3.2 逻辑回归算法
- 3.2.1 代价函数
- 3.2.2 梯度下降算法
- 3.2.3 SciPy优化函数
- 3.2.4 多项式逻辑回归
- 3.3 多元分类
- 3.3.1 一对多
- 3.3.2 一对一
- 3.3.3 Softmax回归
- 习题
- 第4章 贝叶斯分类器
- 4.1 简介
- 4.1.1 概述
- 4.1.2 判别模型和生成模型
- 4.1.3 极大似然估计
- 4.2 高斯判别分析
- 4.2.1 多元高斯分布
- 4.2.2 高斯判别模型
- 4.3 朴素贝叶斯
- 4.3.1 朴素贝叶斯算法
- 4.3.2 文本分类
- 习题
- 第5章 模型评估与选择
- 5.1 简介
- 5.1.1 训练误差与泛化误差
- 5.1.2 偏差和方差
- 5.2 评估方法
- 5.2.1 训练集、验证集和测试集划分
- 5.2.2 交叉验证
- 5.3 性能度量
- 5.3.1 常用性能度量
- 5.3.2 查准率和查全率
- 5.3.3 ROC和AUC
- 5.4 偏差与方差折中
- 5.4.1 偏差方差诊断
- 5.4.2 正则化与偏差和方差
- 5.4.3 学习曲线
- 习题
- 第6章 K-均值算法和EM算法
- 6.1 聚类分析
- 6.1.1 K-means算法
- 6.1.2 K-means算法的应用
- 6.1.3 注意事项
- 6.2 EM算法
- 6.2.1 基本EM算法
- 6.2.2 EM算法的一般形式
- 6.2.3 混合高斯模型
- 习题
- 第7章 决策树
- 7.1 决策树介绍
- 7.2 ID3算法
- 7.2.1 信息熵
- 7.2.2 信息增益计算示例
- 7.2.3 ID3算法描述
- 7.2.4 ID3算法实现
- 7.3 C4.5算法
- 7.3.1 基本概念
- 7.3.2 剪枝处理
- 7.3.3 C4.5算法描述
- 7.3.4 C4.5算法实现
- 7.4 CART算法
- 7.4.1 CART算法介绍
- 7.4.2 CART算法描述
- 7.4.3 CART算法实现
- 习题
- 第8章 神经网络
- 8.1 神经网络介绍
- 8.1.1 从一个实例说起
- 8.1.2 神经元
- 8.1.3 神经网络结构
- 8.1.4 简化的神经网络模型
- 8.1.5 细节说明
- 8.2 神经网络学习
- 8.2.1 代价函数
- 8.2.2 BP算法
- 8.2.3 BP算法实现
- 8.3 神经网络实现
- 8.3.1 MNIST神经网络实现
- 8.3.2 逻辑异或的神经网络实现
- 习题
- 第9章 隐马尔科夫模型
- 9.1 隐马尔科夫模型基本概念
- 9.1.1 离散马尔科夫过程
- 9.1.2 扩展至隐马尔科夫模型
- 9.1.3 HMM的组成和序列生成
- 9.1.4 三个基本问题
- 9.2 求解HMM三个基本问题
- 9.2.1 评估问题
- 9.2.2 解码问题
- 9.2.3 学习问题
- 习题
- 第10章 支持向量机
- 10.1 支持向量机介绍
- 10.2 最大间隔超平面
- 10.2.1 SVM问题的形式化描述
- 10.2.2 函数间隔和几何间隔
- 10.2.3 最优间隔分类器
- 10.2.4 使用优化软件求解SVM
- 10.3 对偶算法
- 10.3.1 SVM对偶问题
- 10.3.2 使用优化软件求解对偶SVM
- 10.4 非线性支持向量机
- 10.4.1 核技巧
- 10.4.2 常用核函数
- 10.5 软间隔支持向量机
- 10.5.1 动机及原问题
- 10.5.2 对偶问题
- 10.5.3 使用优化软件求解软间隔对偶SVM
- 10.6 SMO算法
- 10.6.1 SMO算法描述
- 10.6.2 简化SMO算法实现
- 10.7 LibSVM
- 10.7.1 LibSVM的安装
- 10.7.2 LibSVM函数
- 10.7.3 LibSVM实践指南
- 习题
- 第11章 推荐系统
- 11.1 推荐系统介绍
- 11.1.1 什么是推荐系统
- 11.1.2 数据集描述
- 11.1.3 推荐系统符号
- 11.2 基于用户的协同过滤
- 11.2.1 相似性度量
- 11.2.2 算法描述
- 11.2.3 算法实现
- 11.3 基于物品的协同过滤
- 11.3.1 调整余弦相似度和预测
- 11.3.2 Slope One算法描述与实现
- 11.4 基于内容的协同过滤算法与实现
- 11.4.1 算法描述
- 11.4.2 算法实现
- 习题
- 第12章 主成分分析
- 12.1 主成分分析介绍
- 12.2 本征值与奇异值分解
- 12.2.1 本征值分解
- 12.2.2 奇异值分解
- 12.3 PCA算法描述
- 12.3.1 PCA算法
- 12.3.2 从压缩表示中重建
- 12.3.3 确定主成分数量
- 12.4 PCA实现
- 12.4.1 假想实例
- 12.4.2 MNIST实例
- 习题
- 第13章 集成学习
- 13.1 集成学习介绍
- 13.1.1 集成学习简介
- 13.1.2 个体学习器
- 13.1.3 集成学习的基本原理
- 13.1.4 融合个体学习器的方法
- 13.2 装袋
- 13.2.1 装袋算法描述
- 13.2.2 装袋算法实现
- 13.3 提升
- 13.3.1 提升算法描述
- 13.3.2 AdaBoost算法实现
- 13.4 随机森林
- 13.4.1 随机森林算法描述
- 13.4.2 随机森林算法实现
- 习题
- 附录1 符号表
- 附录2 习题参考答案
- 参考文献
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。