互联网
类型
可以朗读
语音朗读
80千字
字数
2024-05-01
发行日期
展开全部
主编推荐语
本书讲解数据分析基础知识,针对数据分析与可视化的初学者介绍相关方法及概念。
内容简介
全书共分9章,内容包含数据分析概述、数据集的存储与读取、NumPy数组与矩阵运算、Pandas高性能的数据结构和数据分析工具、数据预处理、Matplotlib可视化绘图、机器学习与数据挖掘以及就业分析综合实战和电商数据分析两项综合实战。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 数据分析概述
- 1.1 初识数据分析
- 1.1.1 为什么会有数据分析
- 1.1.2 怎样去做数据分析
- 1.2 数据分析的常用方法
- 1.2.1 5W1H分析法
- 1.2.2 逻辑树分析法
- 1.2.3 对比分析法
- 1.2.4 群组分析法
- 1.3 Python的安装与使用
- 1.3.1 Python的下载与安装
- 1.3.2 检验安装是否成功
- 1.3.3 第一个Python程序
- 1.4 数据分析工具库
- 1.4.1 NumPy
- 1.4.2 Matplotlib
- 1.4.3 Pandas
- 1.4.4 scikit-learn
- 1.5 Anaconda
- 1.5.1 初识Anaconda
- 1.5.2 Anaconda的安装与使用
- 1.6 本章小结
- 1.7 习题
- 第2章 数据集的获取与存储
- 2.1 数据获取
- 2.1.1 内部数据的获取方法
- 2.1.2 外部数据的获取方法
- 2.2 数据存储格式
- 2.2.1 CSV格式与Excel格式
- 2.2.2 HTML格式与JSON格式
- 2.2.3 二进制格式
- 2.3 数据库
- 2.3.1 建立数据库及数据表
- 2.3.2 使用Python连接数据库
- 2.4 本章小结
- 2.5 习题
- 第3章 NumPy
- 3.1 初识NumPy
- 3.1.1 NumPy简介
- 3.1.2 安装NumPy
- 3.2 NumPy数组操作
- 3.2.1 数组的概念
- 3.2.2 数组的属性
- 3.2.3 创建数组
- 3.2.4 数组运算
- 3.2.5 数组的切片和索引
- 3.2.6 数组重塑
- 3.2.7 数组迭代
- 3.3 NumPy矩阵操作
- 3.3.1 矩阵的创建
- 3.3.2 矩阵的运算
- 3.3.3 矩阵的转置与求逆
- 3.4 NumPy常用统计函数
- 3.5 NumPy
- 3.6 本章小结
- 3.7 习题
- 第4章 Pandas
- 4.1 初识Pandas
- 4.2 Pandas数据结构的基本操作
- 4.2.1 Series对象的创建
- 4.2.2 Series对象的属性
- 4.2.3 DataFrame对象的创建
- 4.2.4 DataFrame对象的基本操作
- 4.3 Pandas的计算与统计
- 4.3.1 DataFrame对象的基本计算
- 4.3.2 DataFrame对象与Series对象之间的基本计算
- 4.3.3 Pandas中常用的统计方法
- 4.4 Pandas其他常用函数
- 4.4.1 Pandas数据重复值处理
- 4.4.2 Pandas数据排序
- 4.4.3 Pandas数据合并
- 4.4.4 Pandas日期数据处理
- 4.5 实战1:泰坦尼克号乘客数据处理与分析
- 4.5.1 任务说明
- 4.5.2 任务实现
- 4.6 本章小结
- 4.7 习题
- 第5章 数据预处理
- 5.1 数据准备
- 5.1.1 数据的加载
- 5.1.2 堆叠合并数据
- 5.1.3 重叠合并数据
- 5.2 数据变换
- 5.2.1 数据分析与挖掘体系位置
- 5.2.2 数据变换的方法
- 5.2.3 常见操作
- 5.2.4 数据基本字段
- 5.2.5 数据类型转换
- 5.3 数据清洗
- 5.3.1 导入与查看数据集
- 5.3.2 缺失值处理
- 5.3.3 重复值处理
- 5.3.4 异常值处理
- 5.4 数据标准化
- 5.4.1 数据标准化的原因
- 5.4.2 数据标准化的方法
- 5.4.3 数据标准化的区别与意义
- 5.5 实战2:运动员数据分析预处理
- 5.5.1 任务说明
- 5.5.2 任务实现
- 5.6 实战3:豆瓣读书数据预处理
- 5.6.1 任务说明
- 5.6.2 任务实现
- 5.6.3 直观数据分析
- 5.7 本章小结
- 5.8 习题
- 第6章 Matplotlib
- 6.1 Matplotlib的安装
- 6.2 Matplotlib的绘制流程
- 6.2.1 绘图结构——Figure、Axes、Axis、Artist
- 6.2.2 绘图流程
- 6.2.3 第一个交互式图表
- 6.2.4 其他常用操作
- 6.3 Matplotlib基础图表的绘制
- 6.3.1 散点图的绘制
- 6.3.2 直方图的绘制
- 6.3.3 折线图的绘制
- 6.3.4 饼图的绘制
- 6.3.5 箱线图的绘制
- 6.3.6 正弦图和余弦图的绘制
- 6.3.7 误差条形图的绘制
- 6.3.8 玫瑰图的绘制
- 6.3.9 词云的绘制
- 6.4 Matplotlib高级图表
- 6.4.1 等值线图
- 6.4.2 风杆图
- 6.4.3 多序列条形图
- 6.4.4 多序列堆积条形图
- 6.4.5 多面板图
- 6.5 实战4:我国地区生产总值数据可视化
- 6.5.1 任务说明
- 6.5.2 任务实现
- 6.6 实战5:餐厅小费赠予情况数据可视化
- 6.6.1 任务说明
- 6.6.2 任务实现
- 6.7 本章小结
- 6.8 习题
- 第7章 机器学习与数据挖掘
- 7.1 机器学习概述
- 7.2 监督学习
- 7.2.1 k近邻算法
- 7.2.2 决策树
- 7.2.3 回归分析
- 7.2.4 其他常见的分类与预测算法
- 7.3 聚类与关联分析
- 7.3.1 k均值聚类分析
- 7.3.2 Apriori关联分析
- 7.4 数据结构与算法
- 7.4.1 树结构
- 7.4.2 排序
- 7.5 本章小结
- 7.6 习题
- 第8章 综合实战:就业分析
- 8.1 研究背景
- 8.2 分析目标
- 8.3 数据获取
- 8.4 数据处理
- 8.5 数据分析
- 8.6 本章小结
- 第9章 综合实战:电商数据分析
- 9.1 电商平台用户行为数据分析
- 9.1.1 研究背景
- 9.1.2 分析目标
- 9.1.3 数据处理
- 9.1.4 数据分析
- 9.2 网店商品售卖数据分析
- 9.2.1 研究背景
- 9.2.2 分析目标
- 9.2.3 数据处理
- 9.2.4 数据分析
- 9.3 本章小结
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。