可以朗读
语音朗读
275千字
字数
2020-03-01
发行日期
展开全部
主编推荐语
使机器学习算法通过Python实现真正“落地”的书,侧重于介绍如何在Python环境下使用机器学习方法库,助你夯实基础。
内容简介
本书介绍了数据科学领域常用的所有重要机器学习算法以及TensorFlow和特征工程等相关内容。涵盖的算法包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、k均值、随机森林等,这些算法可以用于监督学习、非监督学习、强化学习或半监督学习。
在本书中,你将学会如何使用这些算法来解决所遇到的问题,并了解这些算法的工作方式。本书还将介绍自然语言处理和推荐系统,这些内容将帮助大家进行多种算法的实践。
目录
- 版权信息
- 译者序
- 前言
- 第1章 机器学习简介
- 1.1 简介——经典机器和自适应的机器
- 1.1.1 描述性分析
- 1.1.2 预测性分析
- 1.2 关于学习
- 1.2.1 监督学习
- 1.2.2 无监督学习
- 1.2.3 半监督学习
- 1.2.4 强化学习
- 1.2.5 计算神经科学
- 1.3 超越机器学习——深度学习和基于生物启发的适应系统
- 1.4 机器学习和大数据
- 1.5 本章小结
- 第2章 机器学习的重要元素
- 2.1 数据格式
- 2.2 可学习性
- 2.2.1 欠拟合和过拟合
- 2.2.2 误差度量和成本函数
- 2.2.3 PAC学习
- 2.3 统计学习方法介绍
- 2.3.1 最大后验概率学习
- 2.3.2 最大似然学习
- 2.4 类平衡
- 2.4.1 可置换的重采样
- 2.4.2 合成少数类过采样
- 2.5 信息论的要素
- 2.5.1 熵
- 2.5.2 交叉熵和互信息
- 2.5.3 两个概率分布的散度
- 2.6 本章小结
- 第3章 特征选择与特征工程
- 3.1 scikit-learn的toy数据集
- 3.2 创建训练集和测试集
- 3.3 管理分类数据
- 3.4 管理缺失特征
- 3.5 数据缩放和归一化
- 3.6 特征选择和过滤
- 3.7 主成分分析
- 3.7.1 非负矩阵分解
- 3.7.2 稀疏PCA
- 3.7.3 核PCA
- 3.8 独立成分分析
- 3.9 原子提取和字典学习
- 3.10 使用t-SNE可视化高维数据集
- 3.11 本章小结
- 第4章 回归算法
- 4.1 线性模型
- 4.2 一个二维的例子
- 4.3 基于scikit-learn的线性回归和更高维
- 4.3.1 决定系数
- 4.3.2 可解释方差
- 4.3.3 回归的解析表达
- 4.4 Ridge回归、Lasso回归和ElasticNet
- 4.4.1 Ridge回归
- 4.4.2 Lasso回归
- 4.4.3 ElasticNet
- 4.5 稳健回归
- 4.5.1 随机抽样一致算法
- 4.5.2 Huber回归
- 4.6 贝叶斯回归
- 4.7 多项式回归
- 4.8 保序回归
- 4.9 本章小结
- 第5章 线性分类算法
- 5.1 线性分类
- 5.2 逻辑回归
- 5.3 实现和优化
- 5.4 随机梯度下降算法
- 5.5 被动攻击算法
- 5.6 通过网格搜索找到最优超参数
- 5.7 评估分类的指标
- 5.7.1 混淆矩阵
- 5.7.2 精确率
- 5.7.3 召回率
- 5.7.4 F-Beta
- 5.7.5 Kappa系数
- 5.7.6 分类报告
- 5.7.7 学习曲线
- 5.8 ROC曲线
- 5.9 本章小结
- 第6章 朴素贝叶斯和判别分析
- 6.1 贝叶斯定理
- 6.2 朴素贝叶斯分类器
- 6.3 scikit-learn中的朴素贝叶斯
- 6.3.1 伯努利朴素贝叶斯
- 6.3.2 多项式朴素贝叶斯
- 6.3.3 高斯朴素贝叶斯
- 6.4 判别分析
- 6.5 本章小结
- 第7章 支持向量机
- 7.1 线性支持向量机
- 7.2 scikit-learn实现
- 7.3 基于内核的分类
- 7.3.1 径向基函数
- 7.3.2 多项式核
- 7.3.3 Sigmoid核
- 7.3.4 自定义核
- 7.3.5 非线性例子
- 7.4 受控支持向量机
- 7.5 支持向量回归
- 7.6 半监督支持向量机简介
- 7.7 本章小结
- 第8章 决策树和集成学习
- 8.1 二元决策树
- 8.1.1 二元决策
- 8.1.2 不纯度的衡量
- 8.1.3 特征重要度
- 8.2 基于scikit-learn的决策树分类
- 8.3 决策树回归
- 8.4 集成学习简介
- 8.4.1 随机森林
- 8.4.2 AdaBoost
- 8.4.3 梯度树提升
- 8.4.4 投票分类器
- 8.5 本章小结
- 第9章 聚类原理
- 9.1 聚类基础
- 9.2 k-NN算法
- 9.3 高斯混合
- 9.4 k-means
- 9.5 基于样本标记的评价方法
- 9.5.1 同质性
- 9.5.2 完整性
- 9.5.3 修正兰德指数
- 9.6 本章小结
- 第10章 高级聚类
- 10.1 DBSCAN
- 10.2 谱聚类
- 10.3 在线聚类
- 10.3.1 mini-batch k-means
- 10.3.2 BIRCH
- 10.4 双聚类
- 10.5 本章小结
- 第11章 层次聚类
- 11.1 分层策略
- 11.2 凝聚聚类
- 11.2.1 树形图
- 11.2.2 scikit-learn中的凝聚聚类
- 11.2.3 连接限制
- 11.3 本章小结
- 第12章 推荐系统介绍
- 12.1 朴素的基于用户的系统
- 12.2 基于内容的系统
- 12.3 无模式(或基于内存的)协同过滤
- 12.4 基于模型的协同过滤
- 12.4.1 奇异值分解策略
- 12.4.2 交替最小二乘法策略
- 12.4.3 用Apache Spark MLlib实现交替最小二乘法策略
- 12.5 本章小结
- 第13章 自然语言处理简介
- 13.1 NLTK和内置语料库
- 13.2 词袋策略
- 13.2.1 标记
- 13.2.2 停止词的删除
- 13.2.3 词干抽取
- 13.2.4 向量化
- 13.3 词性
- 13.4 示例文本分类器
- 13.5 本章小结
- 第14章 NLP中的主题建模与情感分析
- 14.1 主题建模
- 14.1.1 隐性语义分析
- 14.1.2 概率隐性语义分析
- 14.1.3 隐性狄利克雷分配
- 14.2 使用Gensim的Word2vec简介
- 14.3 情感分析
- 14.4 本章小结
- 第15章 神经网络介绍
- 15.1 深度学习简介
- 15.2 基于Keras的MLP
- 15.3 本章小结
- 第16章 高级深度学习模型
- 16.1 深层结构
- 16.2 基于Keras的深度卷积网络示例
- 16.3 基于Keras的LSTM网络示例
- 16.4 TensorFlow简介
- 16.4.1 梯度计算
- 16.4.2 逻辑回归
- 16.4.3 用多层感知器进行分类
- 16.4.4 图像卷积
- 16.5 本章小结
- 第17章 创建机器学习架构
- 17.1 机器学习框架
- 17.1.1 数据收集
- 17.1.2 归一化
- 17.1.3 降维
- 17.1.4 数据扩充
- 17.1.5 数据转换
- 17.1.6 建模、网格搜索和交叉验证
- 17.1.7 可视化
- 17.1.8 GPU支持
- 17.1.9 分布式架构简介
- 17.2 用于机器学习架构的scikit-learn工具
- 17.2.1 管道
- 17.2.2 特征联合
- 17.3 本章小结
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。