展开全部

主编推荐语

使机器学习算法通过Python实现真正“落地”的书,侧重于介绍如何在Python环境下使用机器学习方法库,助你夯实基础。

内容简介

本书介绍了数据科学领域常用的所有重要机器学习算法以及TensorFlow和特征工程等相关内容。涵盖的算法包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、k均值、随机森林等,这些算法可以用于监督学习、非监督学习、强化学习或半监督学习。

在本书中,你将学会如何使用这些算法来解决所遇到的问题,并了解这些算法的工作方式。本书还将介绍自然语言处理和推荐系统,这些内容将帮助大家进行多种算法的实践。

目录

  • 版权信息
  • 译者序
  • 前言
  • 第1章 机器学习简介
  • 1.1 简介——经典机器和自适应的机器
  • 1.1.1 描述性分析
  • 1.1.2 预测性分析
  • 1.2 关于学习
  • 1.2.1 监督学习
  • 1.2.2 无监督学习
  • 1.2.3 半监督学习
  • 1.2.4 强化学习
  • 1.2.5 计算神经科学
  • 1.3 超越机器学习——深度学习和基于生物启发的适应系统
  • 1.4 机器学习和大数据
  • 1.5 本章小结
  • 第2章 机器学习的重要元素
  • 2.1 数据格式
  • 2.2 可学习性
  • 2.2.1 欠拟合和过拟合
  • 2.2.2 误差度量和成本函数
  • 2.2.3 PAC学习
  • 2.3 统计学习方法介绍
  • 2.3.1 最大后验概率学习
  • 2.3.2 最大似然学习
  • 2.4 类平衡
  • 2.4.1 可置换的重采样
  • 2.4.2 合成少数类过采样
  • 2.5 信息论的要素
  • 2.5.1 熵
  • 2.5.2 交叉熵和互信息
  • 2.5.3 两个概率分布的散度
  • 2.6 本章小结
  • 第3章 特征选择与特征工程
  • 3.1 scikit-learn的toy数据集
  • 3.2 创建训练集和测试集
  • 3.3 管理分类数据
  • 3.4 管理缺失特征
  • 3.5 数据缩放和归一化
  • 3.6 特征选择和过滤
  • 3.7 主成分分析
  • 3.7.1 非负矩阵分解
  • 3.7.2 稀疏PCA
  • 3.7.3 核PCA
  • 3.8 独立成分分析
  • 3.9 原子提取和字典学习
  • 3.10 使用t-SNE可视化高维数据集
  • 3.11 本章小结
  • 第4章 回归算法
  • 4.1 线性模型
  • 4.2 一个二维的例子
  • 4.3 基于scikit-learn的线性回归和更高维
  • 4.3.1 决定系数
  • 4.3.2 可解释方差
  • 4.3.3 回归的解析表达
  • 4.4 Ridge回归、Lasso回归和ElasticNet
  • 4.4.1 Ridge回归
  • 4.4.2 Lasso回归
  • 4.4.3 ElasticNet
  • 4.5 稳健回归
  • 4.5.1 随机抽样一致算法
  • 4.5.2 Huber回归
  • 4.6 贝叶斯回归
  • 4.7 多项式回归
  • 4.8 保序回归
  • 4.9 本章小结
  • 第5章 线性分类算法
  • 5.1 线性分类
  • 5.2 逻辑回归
  • 5.3 实现和优化
  • 5.4 随机梯度下降算法
  • 5.5 被动攻击算法
  • 5.6 通过网格搜索找到最优超参数
  • 5.7 评估分类的指标
  • 5.7.1 混淆矩阵
  • 5.7.2 精确率
  • 5.7.3 召回率
  • 5.7.4 F-Beta
  • 5.7.5 Kappa系数
  • 5.7.6 分类报告
  • 5.7.7 学习曲线
  • 5.8 ROC曲线
  • 5.9 本章小结
  • 第6章 朴素贝叶斯和判别分析
  • 6.1 贝叶斯定理
  • 6.2 朴素贝叶斯分类器
  • 6.3 scikit-learn中的朴素贝叶斯
  • 6.3.1 伯努利朴素贝叶斯
  • 6.3.2 多项式朴素贝叶斯
  • 6.3.3 高斯朴素贝叶斯
  • 6.4 判别分析
  • 6.5 本章小结
  • 第7章 支持向量机
  • 7.1 线性支持向量机
  • 7.2 scikit-learn实现
  • 7.3 基于内核的分类
  • 7.3.1 径向基函数
  • 7.3.2 多项式核
  • 7.3.3 Sigmoid核
  • 7.3.4 自定义核
  • 7.3.5 非线性例子
  • 7.4 受控支持向量机
  • 7.5 支持向量回归
  • 7.6 半监督支持向量机简介
  • 7.7 本章小结
  • 第8章 决策树和集成学习
  • 8.1 二元决策树
  • 8.1.1 二元决策
  • 8.1.2 不纯度的衡量
  • 8.1.3 特征重要度
  • 8.2 基于scikit-learn的决策树分类
  • 8.3 决策树回归
  • 8.4 集成学习简介
  • 8.4.1 随机森林
  • 8.4.2 AdaBoost
  • 8.4.3 梯度树提升
  • 8.4.4 投票分类器
  • 8.5 本章小结
  • 第9章 聚类原理
  • 9.1 聚类基础
  • 9.2 k-NN算法
  • 9.3 高斯混合
  • 9.4 k-means
  • 9.5 基于样本标记的评价方法
  • 9.5.1 同质性
  • 9.5.2 完整性
  • 9.5.3 修正兰德指数
  • 9.6 本章小结
  • 第10章 高级聚类
  • 10.1 DBSCAN
  • 10.2 谱聚类
  • 10.3 在线聚类
  • 10.3.1 mini-batch k-means
  • 10.3.2 BIRCH
  • 10.4 双聚类
  • 10.5 本章小结
  • 第11章 层次聚类
  • 11.1 分层策略
  • 11.2 凝聚聚类
  • 11.2.1 树形图
  • 11.2.2 scikit-learn中的凝聚聚类
  • 11.2.3 连接限制
  • 11.3 本章小结
  • 第12章 推荐系统介绍
  • 12.1 朴素的基于用户的系统
  • 12.2 基于内容的系统
  • 12.3 无模式(或基于内存的)协同过滤
  • 12.4 基于模型的协同过滤
  • 12.4.1 奇异值分解策略
  • 12.4.2 交替最小二乘法策略
  • 12.4.3 用Apache Spark MLlib实现交替最小二乘法策略
  • 12.5 本章小结
  • 第13章 自然语言处理简介
  • 13.1 NLTK和内置语料库
  • 13.2 词袋策略
  • 13.2.1 标记
  • 13.2.2 停止词的删除
  • 13.2.3 词干抽取
  • 13.2.4 向量化
  • 13.3 词性
  • 13.4 示例文本分类器
  • 13.5 本章小结
  • 第14章 NLP中的主题建模与情感分析
  • 14.1 主题建模
  • 14.1.1 隐性语义分析
  • 14.1.2 概率隐性语义分析
  • 14.1.3 隐性狄利克雷分配
  • 14.2 使用Gensim的Word2vec简介
  • 14.3 情感分析
  • 14.4 本章小结
  • 第15章 神经网络介绍
  • 15.1 深度学习简介
  • 15.2 基于Keras的MLP
  • 15.3 本章小结
  • 第16章 高级深度学习模型
  • 16.1 深层结构
  • 16.2 基于Keras的深度卷积网络示例
  • 16.3 基于Keras的LSTM网络示例
  • 16.4 TensorFlow简介
  • 16.4.1 梯度计算
  • 16.4.2 逻辑回归
  • 16.4.3 用多层感知器进行分类
  • 16.4.4 图像卷积
  • 16.5 本章小结
  • 第17章 创建机器学习架构
  • 17.1 机器学习框架
  • 17.1.1 数据收集
  • 17.1.2 归一化
  • 17.1.3 降维
  • 17.1.4 数据扩充
  • 17.1.5 数据转换
  • 17.1.6 建模、网格搜索和交叉验证
  • 17.1.7 可视化
  • 17.1.8 GPU支持
  • 17.1.9 分布式架构简介
  • 17.2 用于机器学习架构的scikit-learn工具
  • 17.2.1 管道
  • 17.2.2 特征联合
  • 17.3 本章小结
展开全部

评分及书评

评分不足
2个评分

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。