展开全部

主编推荐语

本书深入浅出地介绍Python数据分析的相关知识和应用。

内容简介

全书共9章,主要内容包括Python概述、科学计算库、开源科学集、数据分析利器、数据分析的可视化、基于回归的数据分析、基于分类的数据分析、基于聚类的数据分析、数据特征分析等。通过学习本书,读者可领略到Python的简单、易学、易读、易维护等特点,同时也可感受到利用Python实现数据分析应用领域广泛,功能强大。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 第1章 掀开Python面纱
  • 1.1 Python环境搭建
  • 1.1.1 Python的安装
  • 1.1.2 pip安装第三方库
  • 1.1.3 编辑器Jupyter Notebook
  • 1.2 寻求帮助
  • 1.3 基本命令
  • 1.3.1 数字
  • 1.3.2 变量
  • 1.3.3 运算符
  • 1.4 数据类型
  • 1.5 字符串操作
  • 1.6 元素的集合
  • 1.6.1 列表
  • 1.6.2 元组
  • 1.6.3 字典
  • 1.6.4 集合
  • 第2章 科学计算库
  • 2.1 必需库的安装
  • 2.2 NumPy概述
  • 2.3 NumPy的数据类型
  • 2.4 NumPy数组
  • 2.4.1 NumPy数组的创建
  • 2.4.2 NumPy切片
  • 2.4.3 NumPy索引
  • 2.4.4 NumPy迭代
  • 2.4.5 NumPy数组操作
  • 2.4.6 NumPy算术函数
  • 2.5 NumPy统计函数
  • 2.6 NumPy排序
  • 2.7 NumPy线性代数
  • 2.7.1 矩阵和向量积
  • 2.7.2 行列式
  • 2.7.3 求解线性方程
  • 2.7.4 矩阵特征值和特征向量
  • 2.8 矩阵分解
  • 2.8.1 Cholesky分解
  • 2.8.2 QR分解
  • 2.8.3 SVD(奇异值)分解
  • 2.9 范数和秩
  • 2.9.1 矩阵的范数
  • 2.9.2 矩阵的秩
  • 第3章 开源科学集
  • 3.1 SciPy常量模块
  • 3.1.1 常量
  • 3.1.2 单位类型
  • 3.2 SciPy优化器
  • 3.3 SciPy稀疏矩阵
  • 3.3.1 coo_matrix存储方式
  • 3.3.2 csr_matrix存储方式
  • 3.3.3 csc_matrix存储方式
  • 3.3.4 lil_matrix存储方式
  • 3.3.5 dok_matrix存储方式
  • 3.3.6 dia_matrix存储方式
  • 3.3.7 bsr_matrix存储方式
  • 3.4 SciPy图结构
  • 3.4.1 邻接矩阵
  • 3.4.2 连接组件
  • 3.4.3 Dijkstra最短路径
  • 3.4.4 Floyd Warshall算法
  • 3.4.5 Bellman-Ford算法
  • 3.5 SciPy空间数据
  • 3.5.1 三角测量
  • 3.5.2 凸包
  • 3.5.3 K-D树
  • 3.5.4 距离矩阵
  • 3.6 SciPy插值
  • 3.6.1 一维插值
  • 3.6.2 二维插值
  • 3.6.3 样条插值
  • 3.7 SciPy显著性检验
  • 3.7.1 统计假设
  • 3.7.2 t检验
  • 3.7.3 KS检验
  • 3.8 边缘检测
  • 第4章 数据分析利器
  • 4.1 Pandas数据结构
  • 4.1.1 系列
  • 4.1.2 数据结构
  • 4.1.3 面板
  • 4.2 统计性描述
  • 4.3 Pandas重建索引
  • 4.4 Pandas迭代与排序
  • 4.4.1 Pandas迭代
  • 4.4.2 Pandas排序
  • 4.5 Pandas统计函数
  • 4.6 Pandas分组与聚合
  • 4.7 数据缺失
  • 4.7.1 数据缺失的原因
  • 4.7.2 检查缺失值
  • 4.7.3 缺失值的计算
  • 4.7.4 清理/填充缺失数据
  • 4.7.5 丢失缺失的值
  • 4.7.6 替换丢失/通用值
  • 4.8 Pandas连接
  • 4.9 Pandas CSV文件
  • 4.10 Pandas的JSON文件
  • 第5章 数据分析的可视化
  • 5.1 初识Matplotlib
  • 5.2 基本二维绘图
  • 5.2.1 折线图
  • 5.2.2 散点图
  • 5.2.3 条形图
  • 5.2.4 饼图
  • 5.2.5 箱线图
  • 5.2.6 等高线图
  • 5.3 三维绘图
  • 5.3.1 三维坐标轴
  • 5.3.2 三维点和线
  • 5.3.3 三维等高线图
  • 5.3.4 表面三角测量
  • 5.3.5 非结构化图像
  • 5.3.6 三维体元素
  • 5.4 小提琴图
  • 第6章 基于回归的数据分析
  • 6.1 简单线性回归
  • 6.1.1 线性回归概述
  • 6.1.2 简单线性回归的实现
  • 6.2 多元回归
  • 6.2.1 多项式回归概述
  • 6.2.2 多项式回归的实现
  • 6.3 广义线性回归
  • 6.3.1 函数模型
  • 6.3.2 边界决策函数
  • 6.3.3 广义回归的实现
  • 6.4 岭回归
  • 6.5 套索回归
  • 6.5.1 全子集算法
  • 6.5.2 贪心算法
  • 6.5.3 正则化
  • 6.6 非线性回归
  • 6.6.1 K最近邻回归
  • 6.6.2 核回归
  • 第7章 基于分类的数据分析
  • 7.1 KNN分类器
  • 7.2 线性分类器
  • 7.3 逻辑分类
  • 7.3.1 逻辑回归概述
  • 7.3.2 逻辑回归原理
  • 7.3.3 逻辑分类的实现
  • 7.4 贝叶斯分类
  • 7.4.1 贝叶斯分类相关知识
  • 7.4.2 贝叶斯原理
  • 7.4.3 贝叶斯分类的实现
  • 7.5 决策树
  • 7.5.1 决策树概述
  • 7.5.2 树的相关术语
  • 7.5.3 决策树算法
  • 7.5.4 信息熵
  • 7.5.5 信息增益
  • 7.5.6 信息增益率
  • 7.5.7 决策树的应用
  • 7.6 随机森林
  • 7.6.1 随机森林概述
  • 7.6.2 特征重要评估
  • 7.6.3 随机森林的实现
  • 第8章 基于聚类的数据分析
  • 8.1 聚类的分类
  • 8.2 k-means聚类
  • 8.2.1 k-means聚类的基本原理
  • 8.2.2 算法流程
  • 8.2.3 随机分配聚类质心
  • 8.2.4 k-means算法的优缺点
  • 8.2.5 k-means算法的变体
  • 8.3 Mean Shift聚类
  • 8.3.1 Mean Shift算法介绍
  • 8.3.2 Mean Shift算法的思想
  • 8.3.3 概率密度梯度
  • 8.3.4 Mean Shift向量的修正
  • 8.3.5 Mean Shift算法流程
  • 8.4 谱聚类
  • 8.4.1 谱聚类的原理
  • 8.4.2 谱聚类算法描述
  • 8.4.3 谱聚类算法中的重要属性
  • 8.4.4 谱聚类的实现
  • 8.5 层次聚类算法
  • 8.5.1 自顶向下的层次聚类算法
  • 8.5.2 自底向上的层次聚类算法
  • 8.5.3 簇间相似度的计算方法
  • 8.5.4 层次聚类算法的实现
  • 8.6 密度聚类
  • 8.6.1 密度聚类的原理
  • 8.6.2 DBSCAN密度定义
  • 8.6.3 DBSCAN密度聚类的思想
  • 8.6.4 DBSCAN聚类算法
  • 8.6.5 DBSCAN聚类的实现
  • 第9章 数据特征分析
  • 9.1 数据表达
  • 9.1.1 哑变量转换类型特征
  • 9.1.2 数据的装箱处理
  • 9.1.3 数据的分箱处理
  • 9.2 交互式与多项式特征
  • 9.2.1 添加交互式特征
  • 9.2.2 添加多项式特征
  • 9.3 自动化特征选择
  • 9.3.1 单变量特征选择
  • 9.3.2 基于模型的特征选择
  • 参考文献
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。