互联网
类型
可以朗读
语音朗读
241千字
字数
2022-05-01
发行日期
展开全部
主编推荐语
本书详尽介绍了Pytho数据分析的基础知识,以及开发技巧。
内容简介
全书围绕着“数据分析三剑客(NumPy、Pandas、Matplotlib)”进行细致的介绍。这三款工具的知识点非常多,本书尽量系统细致地介绍精华的知识点,以便为读者构建一个完善的知识体系,并且为后续的工作打下坚实的基础。每一章后面的实战题以及练习题,经过精心设计,可以锻炼读者的数据分析实战能力,对于巩固基础以及锻炼技术是非常有帮助的。
目录
- 版权信息
- 作者简介
- 前言
- 资源与支持
- 第一部分 NumPy篇
- 第1章 数据分析概述
- 1.1 数据分析简介
- 1.2 课程介绍
- 1.3 使用VSCode
- 第2章 NumPy基础
- 2.1 NumPy是什么?
- 2.2 创建数组
- 2.3 数组属性
- 2.4 元素操作
- 2.5 数组操作
- 2.6 各种运算
- 2.7 遍历数组
- 2.8 大小排序
- 2.9 本章练习
- 第3章 NumPy进阶
- 3.1 浅拷贝和深拷贝
- 3.2 axis的值
- 3.3 广播机制
- 3.4 读写文件
- 3.5 矩阵简介
- 3.6 本章练习
- 第二部分 Pandas篇
- 第4章 Pandas简介
- 4.1 Pandas是什么?
- 4.2 Series
- 4.3 DataFrame
- 4.4 DataFrame的数据操作
- 4.5 遍历行列
- 4.6 深入了解
- 4.7 本章练习
- 第5章 获取数据
- 5.1 数据分析流程
- 5.2 读写数据简介
- 5.3 读写JSON
- 5.4 读写CSV
- 5.5 读写Excel
- 5.6 读写HTML
- 5.7 深入文件读取
- 5.8 读取数据库
- 5.9 本章练习
- 第6章 筛选数据
- 6.1 筛选数据简介
- 6.2 获取行、列:loc[]、iloc[]和df[]
- 6.3 重新索引:reindex()
- 6.4 获取首尾数据:head()和tail()
- 6.5 随机抽样:sample()
- 6.6 逻辑比较
- 6.7 过滤操作
- 6.8 模式匹配
- 6.9 本章练习
- 第7章 处理数据
- 7.1 处理数据简介
- 7.2 操作行名和列名
- 7.3 类型转换
- 7.4 行列转置:T
- 7.5 大小排序:sort_values()
- 7.6 数据排名:rank()
- 7.7 数据替换:replace()
- 7.8 数据移动:shift()
- 7.9 数据清洗
- 7.10 数据合并
- 7.11 字符串处理
- 7.12 自定义函数
- 7.13 实战题:处理天气数据
- 7.14 实战题:拆分数据
- 7.15 本章练习
- 第8章 分析数据
- 8.1 分析数据简介
- 8.2 基本统计函数
- 8.3 其他统计函数
- 8.4 整体情况
- 8.5 聚合函数:agg()
- 8.6 数据分组
- 8.7 实战题:求平均寿命
- 8.8 本章练习
- 第9章 时间序列
- 9.1 时间序列概述
- 9.2 重采样:resample()
- 9.3 移动计算:rolling()
- 9.4 分组器:Grouper()
- 9.5 实战题:求每个月的销量总和
- 9.6 本章练习
- 第10章 高级技术
- 10.1 透视表
- 10.2 交叉表
- 10.3 层次化索引
- 10.4 离散化处理
- 10.5 哑变量处理
- 10.6 实战题:创建透视表
- 10.7 本章练习
- 第11章 其他操作
- 11.1 广播机制
- 11.2 索引对象
- 11.3 inplace参数
- 11.4 缺失值
- 11.5 实战题:统计每一列的缺失值个数
- 11.6 本章练习
- 第三部分 Matplotlib篇
- 第12章 基础图表
- 12.1 Matplotlib简介
- 12.2 基本绘图(折线图)
- 12.3 通用设置
- 12.4 通用样式
- 12.5 散点图
- 12.6 柱形图
- 12.7 直方图
- 12.8 饼状图
- 12.9 实战题:绘制气温折线图
- 12.10 实战题:浏览器所占市场份额柱形图
- 第13章 高级图表
- 13.1 高级图表简介
- 13.2 箱线图
- 13.3 面积图
- 13.4 棉棒图
- 13.5 热力图
- 13.6 子图表
- 13.7 实战题:使用箱线图查找异常值
- 13.8 实战题:绘制每月销量的棉棒图
- 第四部分 工具篇
- 第14章 Jupyter Notebook
- 14.1 Jupyter Notebook简介
- 14.2 Jupyter Notebook的使用
- 14.3 应用场景
- 14.4 常用技巧
- 第五部分 附录
- 附录A 读写文件(Pandas)
- 附录B 统计函数(Pandas)
- 附录C 绘图函数(Matplotlib)
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。