科技
类型
可以朗读
语音朗读
206千字
字数
2019-07-01
发行日期
展开全部
主编推荐语
寓复杂问题于简单实践,轻松掌握Python数据分析和机器学习技能。
内容简介
本书深入讨论数据挖掘与人工智能相关的60多个主题,介绍了使用Python进行数据分析和高效的机器学习,首先从一节Python速成课开始,然后回顾统计学和概率论的基础知识,接着深入讨论与数据挖掘和机器学习相关的60多个主题,包括贝叶斯定理、聚类、决策树、回归分析、实验设计等。
提供三大实战案例:使用真实的电影评分数据创建一个电影推荐系统;创建一个能实际运行的维基百科数据搜索引擎;创建一个垃圾邮件分类器,可以对邮件账户中的垃圾邮件和正常邮件进行正确的分类。
本书涵盖准备分析数据、训练机器学习模型和可视化分析结果等主题,有助你提高使用Python高效地进行数据分析和机器学习的能力,并建立信心以更好地分析自己的机器学习模型。
目录
- 版权信息
- 前言
- 目标读者
- 排版约定
- 读者反馈
- 客户支持
- 勘误
- 举报盗版
- 问题
- 电子书
- 第1章 入门
- 1.1 安装Enthought Canopy
- 1.2 使用并理解IPython/Jupyter Notebook
- 1.3 Python基础——第一部分
- 1.4 理解Python代码
- 1.5 导入模块
- 1.6 Python基础——第二部分
- 1.7 运行Python脚本
- 1.8 小结
- 第2章 统计与概率复习以及Python实现
- 2.1 数据类型
- 2.2 均值、中位数和众数
- 2.3 在Python中使用均值、中位数和众数
- 2.4 标准差和方差
- 2.5 概率密度函数和概率质量函数
- 2.6 各种类型的数据分布
- 2.7 百分位数和矩
- 2.8 小结
- 第3章 Matplotlib与概率高级概念
- 3.1 Matplotlib快速学习
- 3.2 协方差与相关系数
- 3.3 条件概率
- 3.4 贝叶斯定理
- 3.5 小结
- 第4章 预测模型
- 4.1 线性回归
- 4.2 多项式回归
- 4.3 多元回归和汽车价格预测
- 4.4 多水平模型
- 4.5 小结
- 第5章 使用Python进行机器学习
- 5.1 机器学习及训练/测试法
- 5.2 使用训练/测试法防止多项式回归中的过拟合
- 5.3 贝叶斯方法——概念
- 5.4 使用朴素贝叶斯实现垃圾邮件分类器
- 5.5 均值聚类
- 5.6 基于收入与年龄进行人群聚类
- 5.7 熵的度量
- 5.8 决策树——概念
- 5.9 决策树——使用Python预测录用决策
- 5.10 集成学习
- 5.11 支持向量机简介
- 5.12 使用scikit-learn通过SVM进行人员聚集
- 5.13 小结
- 第6章 推荐系统
- 6.1 什么是推荐系统
- 6.2 基于项目的协同过滤
- 6.3 基于项目的协同过滤是如何工作的
- 6.4 找出电影相似度
- 6.5 改善电影相似度结果
- 6.6 向人们推荐电影
- 6.7 改善推荐结果
- 6.8 小结
- 第7章 更多数据挖掘和机器学习技术
- 7.1 最近邻的概念
- 7.2 使用KNN预测电影评分
- 7.3 数据降维与主成分分析
- 7.4 对鸢尾花数据集的PCA示例
- 7.5 数据仓库简介
- 7.6 强化学习
- 7.7 小结
- 第8章 处理真实数据
- 8.1 偏差-方差权衡
- 8.2 使用折交叉验证避免过拟合
- 8.3 数据清理和标准化
- 8.4 清理Web日志数据
- 8.5 数值型数据的标准化
- 8.6 检测异常值
- 8.7 小结
- 第9章 Apache Spark——大数据上的机器学习
- 9.1 安装Spark
- 9.2 Spark简介
- 9.3 Spark和弹性分布式数据集
- 9.4 MLlib简介
- 9.5 在Spark中使用MLlib实现决策树
- 9.6 在Spark中实现均值聚类
- 9.7 TF-IDF
- 9.8 使用Spark MLlib搜索维基百科
- 9.9 使用Spark 2.0中的MLlib数据框API
- 9.10 小结
- 第10章 测试与实验设计
- 10.1 A/B测试的概念
- 10.2 检验与值
- 10.3 使用Python计算统计量和值
- 10.4 确定实验持续时间
- 10.5 A/B测试中的陷阱
- 10.6 小结
- 看完了
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。