人工智能
类型
8.8
豆瓣评分
可以朗读
语音朗读
301千字
字数
2018-01-01
发行日期
展开全部
主编推荐语
机器学习入门书,以Python语言介绍。
内容简介
本书主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。
目录
- 版权信息
- O'Reilly Media, Inc. 介绍
- 前言
- 第1章 引言
- 1.1 为何选择机器学习
- 1.2 为何选择Python
- 1.3 scikit-learn
- 1.4 必要的库和工具
- 1.5 Python 2与Python 3的对比
- 1.6 本书用到的版本
- 1.7 第一个应用:鸢尾花分类
- 1.8 小结与展望
- 第2章 监督学习
- 2.1 分类与回归
- 2.2 泛化、过拟合与欠拟合
- 2.3 监督学习算法
- 2.4 分类器的不确定度估计
- 2.5 小结与展望
- 第3章 无监督学习与预处理
- 3.1 无监督学习的类型
- 3.2 无监督学习的挑战
- 3.3 预处理与缩放
- 3.4 降维、特征提取与流形学习
- 3.5 聚类
- 3.6 小结与展望
- 第4章 数据表示与特征工程
- 4.1 分类变量
- 4.2 分箱、离散化、线性模型与树
- 4.3 交互特征与多项式特征
- 4.4 单变量非线性变换
- 4.5 自动化特征选择
- 4.6 利用专家知识
- 4.7 小结与展望
- 第5章 模型评估与改进
- 5.1 交叉验证
- 5.2 网格搜索
- 5.3 评估指标与评分
- 5.4 小结与展望
- 第6章 算法链与管道
- 6.1 用预处理进行参数选择
- 6.2 构建管道
- 6.3 在网格搜索中使用管道
- 6.4 通用的管道接口
- 6.5 网格搜索预处理步骤与模型参数
- 6.6 网格搜索选择使用哪个模型
- 6.7 小结与展望
- 第7章 处理文本数据
- 7.1 用字符串表示的数据类型
- 7.2 示例应用:电影评论的情感分析
- 7.3 将文本数据表示为词袋
- 7.4 停用词
- 7.5 用tf-idf缩放数据
- 7.6 研究模型系数
- 7.7 多个单词的词袋(n元分词)
- 7.8 高级分词、词干提取与词形还原
- 7.9 主题建模与文档聚类
- 7.10 小结与展望
- 第8章 全书总结
- 8.1 处理机器学习问题
- 8.2 从原型到生产
- 8.3 测试生产系统
- 8.4 构建你自己的估计器
- 8.5 下一步怎么走
- 8.6 总结
- 关于作者
- 关于封面
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。