科技
类型
5.3
豆瓣评分
可以朗读
语音朗读
179千字
字数
2017-08-01
发行日期
展开全部
主编推荐语
用流行的Python库scikitlearn解决机器学习问题。
内容简介
本书主要内容包括:机器学习算法以及如何算法如何用于评估实际问题;预测模型及其实战场景剖析;如何用无监督模型做市场分割;探索多种数据可视化技术;如何构建推荐引擎;文本数据交互以及分析文本数据的模型的搭建;用隐藏马尔可夫模型识别语音数据等等。
目录
- 版权信息
- 译者序
- 前言
- 第1章 监督学习
- 1.1 简介
- 1.2 数据预处理技术
- 1.2.1 准备工作
- 1.2.2 详细步骤
- 1.3 标记编码方法
- 1.4 创建线性回归器
- 1.4.1 准备工作
- 1.4.2 详细步骤
- 1.5 计算回归准确性
- 1.5.1 准备工作
- 1.5.2 详细步骤
- 1.6 保存模型数据
- 1.7 创建岭回归器
- 1.7.1 准备工作
- 1.7.2 详细步骤
- 1.8 创建多项式回归器
- 1.8.1 准备工作
- 1.8.2 详细步骤
- 1.9 估算房屋价格
- 1.9.1 准备工作
- 1.9.2 详细步骤
- 1.10 计算特征的相对重要性
- 1.11 评估共享单车的需求分布
- 1.11.1 准备工作
- 1.11.2 详细步骤
- 1.11.3 更多内容
- 第2章 创建分类器
- 2.1 简介
- 2.2 建立简单分类器
- 2.2.1 详细步骤
- 2.2.2 更多内容
- 2.3 建立逻辑回归分类器
- 2.4 建立朴素贝叶斯分类器
- 2.5 将数据集分割成训练集和测试集
- 2.6 用交叉验证检验模型准确性
- 2.6.1 准备工作
- 2.6.2 详细步骤
- 2.7 混淆矩阵可视化
- 2.8 提取性能报告
- 2.9 根据汽车特征评估质量
- 2.9.1 准备工作
- 2.9.2 详细步骤
- 2.10 生成验证曲线
- 2.11 生成学习曲线
- 2.12 估算收入阶层
- 第3章 预测建模
- 3.1 简介
- 3.2 用SVM建立线性分类器
- 3.2.1 准备工作
- 3.2.2 详细步骤
- 3.3 用SVM建立非线性分类器
- 3.4 解决类型数量不平衡问题
- 3.5 提取置信度
- 3.6 寻找最优超参数
- 3.7 建立事件预测器
- 3.7.1 准备工作
- 3.7.2 详细步骤
- 3.8 估算交通流量
- 3.8.1 准备工作
- 3.8.2 详细步骤
- 第4章 无监督学习——聚类
- 4.1 简介
- 4.2 用k-means算法聚类数据
- 4.3 用矢量量化压缩图片
- 4.4 建立均值漂移聚类模型
- 4.5 用凝聚层次聚类进行数据分组
- 4.6 评价聚类算法的聚类效果
- 4.7 用DBSCAN算法自动估算集群数量
- 4.8 探索股票数据的模式
- 4.9 建立客户细分模型
- 第5章 构建推荐引擎
- 5.1 简介
- 5.2 为数据处理构建函数组合
- 5.3 构建机器学习流水线
- 5.3.1 详细步骤
- 5.3.2 工作原理
- 5.4 寻找最近邻
- 5.5 构建一个KNN分类器
- 5.5.1 详细步骤
- 5.5.2 工作原理
- 5.6 构建一个KNN回归器
- 5.6.1 详细步骤
- 5.6.2 工作原理
- 5.7 计算欧氏距离分数
- 5.8 计算皮尔逊相关系数
- 5.9 寻找数据集中的相似用户
- 5.10 生成电影推荐
- 第6章 分析文本数据
- 6.1 简介
- 6.2 用标记解析的方法预处理数据
- 6.3 提取文本数据的词干
- 6.3.1 详细步骤
- 6.3.2 工作原理
- 6.4 用词形还原的方法还原文本的基本形式
- 6.5 用分块的方法划分文本
- 6.6 创建词袋模型
- 6.6.1 详细步骤
- 6.6.2 工作原理
- 6.7 创建文本分类器
- 6.7.1 详细步骤
- 6.7.2 工作原理
- 6.8 识别性别
- 6.9 分析句子的情感
- 6.9.1 详细步骤
- 6.9.2 工作原理
- 6.10 用主题建模识别文本的模式
- 6.10.1 详细步骤
- 6.10.2 工作原理
- 第7章 语音识别
- 7.1 简介
- 7.2 读取和绘制音频数据
- 7.3 将音频信号转换为频域
- 7.4 自定义参数生成音频信号
- 7.5 合成音乐
- 7.6 提取频域特征
- 7.7 创建隐马尔科夫模型
- 7.8 创建一个语音识别器
- 第8章 解剖时间序列和时序数据
- 8.1 简介
- 8.2 将数据转换为时间序列格式
- 8.3 切分时间序列数据
- 8.4 操作时间序列数据
- 8.5 从时间序列数据中提取统计数字
- 8.6 针对序列数据创建隐马尔科夫模型
- 8.6.1 准备工作
- 8.6.2 详细步骤
- 8.7 针对序列文本数据创建条件随机场
- 8.7.1 准备工作
- 8.7.2 详细步骤
- 8.8 用隐马尔科夫模型分析股票市场数据
- 第9章 图像内容分析
- 9.1 简介
- 9.2 用OpenCV-Pyhon操作图像
- 9.3 检测边
- 9.4 直方图均衡化
- 9.5 检测棱角
- 9.6 检测SIFT特征点
- 9.7 创建Star特征检测器
- 9.8 利用视觉码本和向量量化创建特征
- 9.9 用极端随机森林训练图像分类器
- 9.10 创建一个对象识别器
- 第10章 人脸识别
- 10.1 简介
- 10.2 从网络摄像头采集和处理视频信息
- 10.3 用Haar级联创建一个人脸识别器
- 10.4 创建一个眼睛和鼻子检测器
- 10.5 做主成分分析
- 10.6 做核主成分分析
- 10.7 做盲源分离
- 10.8 用局部二值模式直方图创建一个人脸识别器
- 第11章 深度神经网络
- 11.1 简介
- 11.2 创建一个感知器
- 11.3 创建一个单层神经网络
- 11.4 创建一个深度神经网络
- 11.5 创建一个向量量化器
- 11.6 为序列数据分析创建一个递归神经网络
- 11.7 在光学字符识别数据库中将字符可视化
- 11.8 用神经网络创建一个光学字符识别器
- 第12章 可视化数据
- 12.1 简介
- 12.2 画3D散点图
- 12.3 画气泡图
- 12.4 画动态气泡图
- 12.5 画饼图
- 12.6 画日期格式的时间序列数据
- 12.7 画直方图
- 12.8 可视化热力图
- 12.9 动态信号的可视化模拟
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。