科技
类型
8.1
豆瓣评分
可以朗读
语音朗读
259千字
字数
2018-03-01
发行日期
展开全部
主编推荐语
一本通俗易懂的机器学习和数据分析技巧参考书。
内容简介
机器学习是近年来的热门技术话题,R语言是处理其中大量数据的有力工具。本书为读者提供机器学习和R语言的坚实算法基础和业务基础,内容包括机器学习基本概念、线性回归、逻辑回归和判别分析、线性模型的高级选择特性、K最近邻和支持向量机等,力图平衡实践中的技术和理论两方面。
本书适合试图理解和表述机器学习算法的IT人士、想在分析中发挥R强大威力的统计学专家。即使是同时精通IT技术和统计学的读者,在本书中仍然可以发现一些有用的窍门和技巧。
目录
- 版权信息
- 前言
- 本书内容
- 准备工作
- 目标读者
- 排版约定
- 读者反馈
- 客户支持
- 下载示例代码
- 勘误
- 反盗版
- 问题
- 电子书
- 第1版前言
- 定义机器学习
- 机器学习注意事项
- 失败的特征工程
- 过拟合与欠拟合
- 因果关系
- 本书内容
- 准备工作
- 目标读者
- 排版约定
- 读者反馈
- 客户支持
- 下载示例代码
- 勘误
- 反盗版
- 问题
- 第1章 成功之路
- 1.1 流程
- 1.2 业务理解
- 1.2.1 确定业务目标
- 1.2.2 现状评估
- 1.2.3 确定分析目标
- 1.2.4 建立项目计划
- 1.3 数据理解
- 1.4 数据准备
- 1.5 建模
- 1.6 评价
- 1.7 部署
- 1.8 算法流程图
- 1.9 小结
- 第2章 线性回归:机器学习基础技术
- 2.1 单变量回归
- 业务理解
- 2.2 多变量线性回归
- 2.2.1 业务理解
- 2.2.2 数据理解和数据准备
- 2.2.3 模型构建与模型评价
- 2.3 线性模型中的其他问题
- 2.3.1 定性特征
- 2.3.2 交互项
- 2.4 小结
- 第3章 逻辑斯蒂回归与判别分析
- 3.1 分类方法与线性回归
- 3.2 逻辑斯蒂回归
- 3.2.1 业务理解
- 3.2.2 数据理解和数据准备
- 3.2.3 模型构建与模型评价
- 3.3 判别分析概述
- 判别分析应用
- 3.4 多元自适应回归样条方法
- 3.5 模型选择
- 3.6 小结
- 第4章 线性模型中的高级特征选择技术
- 4.1 正则化简介
- 4.1.1 岭回归
- 4.1.2 LASSO
- 4.1.3 弹性网络
- 4.2 商业案例
- 4.2.1 业务理解
- 4.2.2 数据理解和数据准备
- 4.3 模型构建与模型评价
- 4.3.1 最优子集
- 4.3.2 岭回归
- 4.3.3 LASSO
- 4.3.4 弹性网络
- 4.3.5 使用glmnet进行交叉验证
- 4.4 模型选择
- 4.5 正则化与分类问题
- 逻辑斯蒂回归示例
- 4.6 小结
- 第5章 更多分类技术:K最近邻与支持向量机
- 5.1 K最近邻
- 5.2 支持向量机
- 5.3 商业案例
- 5.3.1 业务理解
- 5.3.2 数据理解和数据准备
- 5.3.3 模型构建与模型评价
- 5.3.4 模型选择
- 5.4 SVM中的特征选择
- 5.5 小结
- 第6章 分类回归树
- 6.1 本章技术概述
- 6.1.1 回归树
- 6.1.2 分类树
- 6.1.3 随机森林
- 6.1.4 梯度提升
- 6.2 商业案例
- 6.2.1 模型构建与模型评价
- 6.2.2 模型选择
- 6.2.3 使用随机森林进行特征选择
- 6.3 小结
- 第7章 神经网络与深度学习
- 7.1 神经网络介绍
- 7.2 深度学习简介
- 深度学习资源与高级方法
- 7.3 业务理解
- 7.4 数据理解和数据准备
- 7.5 模型构建与模型评价
- 7.6 深度学习示例
- 7.6.1 H2O背景介绍
- 7.6.2 将数据上载到H2O平台
- 7.6.3 建立训练数据集和测试数据集
- 7.6.4 模型构建
- 7.7 小结
- 第8章 聚类分析
- 8.1 层次聚类
- 距离的计算
- 8.2 K均值聚类
- 8.3 果瓦系数与围绕中心的划分
- 8.3.1 果瓦系数
- 8.3.2 PAM
- 8.4 随机森林
- 8.5 业务理解
- 8.6 数据理解与数据准备
- 8.7 模型构建与模型评价
- 8.7.1 层次聚类
- 8.7.2 K均值聚类
- 8.7.3 果瓦系数和PAM
- 8.7.4 随机森林与PAM
- 8.8 小结
- 第9章 主成分分析
- 9.1 主成分简介
- 主成分旋转
- 9.2 业务理解
- 数据理解与数据准备
- 9.3 模型构建与模型评价
- 9.3.1 主成分抽取
- 9.3.2 正交旋转与解释
- 9.3.3 根据主成分建立因子得分
- 9.3.4 回归分析
- 9.4 小结
- 第10章 购物篮分析、推荐引擎与序列分析
- 10.1 购物篮分析简介
- 10.2 业务理解
- 10.3 数据理解和数据准备
- 10.4 模型构建与模型评价
- 10.5 推荐引擎简介
- 10.5.1 基于用户的协同过滤
- 10.5.2 基于项目的协同过滤
- 10.5.3 奇异值分解和主成分分析
- 10.6 推荐系统的业务理解
- 10.7 推荐系统的数据理解与数据准备
- 10.8 推荐系统的建模与评价
- 10.9 序列数据分析
- 序列分析应用
- 10.10 小结
- 第11章 创建集成多类分类
- 11.1 集成模型
- 11.2 业务理解与数据理解
- 11.3 模型评价与模型选择
- 11.4 多类分类
- 11.5 业务理解与数据理解
- 11.6 模型评价与模型选择
- 11.6.1 随机森林
- 11.6.2 岭回归
- 11.7 MLR集成模型
- 11.8 小结
- 第12章 时间序列与因果关系
- 12.1 单变量时间序列分析
- 理解格兰杰因果关系
- 12.2 业务理解
- 数据理解与数据准备
- 12.3 模型构建与模型评价
- 12.3.1 单变量时间序列预测
- 12.3.2 检查因果关系
- 12.4 小结
- 第13章 文本挖掘
- 13.1 文本挖掘框架与方法
- 13.2 主题模型
- 其他定量分析
- 13.3 业务理解
- 数据理解与数据准备
- 13.4 模型构建与模型评价
- 13.4.1 词频分析与主题模型
- 13.4.2 其他定量分析
- 13.5 小结
- 第14章 在云上使用R语言
- 14.1 创建AWS账户
- 14.1.1 启动虚拟机
- 14.1.2 启动Rstudio
- 14.2 小结
- 附录 R语言基础
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。