4.3 用户推荐指数
互联网
类型
7.4
豆瓣评分
可以朗读
语音朗读
155千字
字数
2019-02-01
发行日期
展开全部
主编推荐语
既是系统学习数据分析流程操作的说明书,也是数据分析师案头必备的实操工具书。
内容简介
集Python、Excel、数据分析为一体是本书的一大特色。这样一本书既可以作为系统学习数据分析流程操作的说明书,也可以作为一本数据分析师案头必备的实操工具书,随时备查。
本书通过对比Excel功能操作去学习Python的实现代码,而不是直接上来就学习Python代码,大大降低了学习门槛,消除了读者对代码的恐惧心理。适合刚入行的数据分析师,也适合对Excel比较熟练的数据分析师,或从事其他岗位想提高工作效率的职场人。
目录
- 版权信息
- 内容简介
- 序言
- 前言
- 入门篇
- 第1章 数据分析基础
- 1.1 数据分析是什么
- 1.2 为什么要做数据分析
- 1.2.1 现状分析
- 1.2.2 原因分析
- 1.2.3 预测分析
- 1.3 数据分析究竟在分析什么
- 1.3.1 总体概览指标
- 1.3.2 对比性指标
- 1.3.3 集中趋势指标
- 1.3.4 离散程度指标
- 1.3.5 相关性指标
- 1.3.6 相关关系与因果关系
- 1.4 数据分析的常规流程
- 1.4.1 熟悉工具
- 1.4.2 明确目的
- 1.4.3 获取数据
- 1.4.4 熟悉数据
- 1.4.5 处理数据
- 1.4.6 分析数据
- 1.4.7 得出结论
- 1.4.8 验证结论
- 1.4.9 展示结论
- 1.5 数据分析工具:Excel与Python
- 实践篇
- 第2章 熟悉锅——Python基础知识
- 2.1 Python是什么
- 2.2 Python的下载与安装
- 2.2.1 安装教程
- 2.2.2 IDE与IDLE
- 2.3 介绍Jupyter Notebook
- 2.3.1 新建Jupyter Notebook文件
- 2.3.2 运行你的第一段代码
- 2.3.3 重命名Jupyter Notebook文件
- 2.3.4 保存Jupyter Notebook文件
- 2.3.5 导入本地Jupyter Notebook文件
- 2.3.6 Jupyter Notebook与Markdown
- 2.3.7 为Jupyter Notebook添加目录
- 2.4 基本概念
- 2.4.1 数
- 2.4.2 变量
- 2.4.3 标识符
- 2.4.4 数据类型
- 2.4.5 输出与输出格式设置
- 2.4.6 缩进与注释
- 2.5 字符串
- 2.5.1 字符串的概念
- 2.5.2 字符串的连接
- 2.5.3 字符串的复制
- 2.5.4 获取字符串的长度
- 2.5.5 字符串查找
- 2.5.6 字符串索引
- 2.5.7 字符串分隔
- 2.5.8 移除字符
- 2.6 数据结构——列表
- 2.6.1 列表的概念
- 2.6.2 新建一个列表
- 2.6.3 列表的复制
- 2.6.4 列表的合并
- 2.6.5 向列表中插入新元素
- 2.6.6 获取列表中值出现的次数
- 2.6.7 获取列表中值出现的位置
- 2.6.8 获取列表中指定位置的值
- 2.6.9 删除列表中的值
- 2.6.10 对列表中的值进行排序
- 2.7 数据结构——字典
- 2.7.1 字典的概念
- 2.7.2 新建一个字典
- 2.7.3 字典的keys()、values()和items()方法
- 2.8 数据结构——元组
- 2.8.1 元组的概念
- 2.8.2 新建一个元组
- 2.8.3 获取元组的长度
- 2.8.4 获取元组内的元素
- 2.8.5 元组与列表相互转换
- 2.8.6 zip()函数
- 2.9 运算符
- 2.9.1 算术运算符
- 2.9.2 比较运算符
- 2.9.3 逻辑运算符
- 2.10 循环语句
- 2.10.1 for循环
- 2.10.2 while循环
- 2.11 条件语句
- 2.11.1 if语句
- 2.11.2 else语句
- 2.11.3 elif语句
- 2.12 函数
- 2.12.1 普通函数
- 2.12.2 匿名函数
- 2.13 高级特性
- 2.13.1 列表生成式
- 2.13.2 map函数
- 2.14 模块
- 第3章 Pandas数据结构
- 3.1 Series数据结构
- 3.1.1 Series是什么
- 3.1.2 创建一个Series
- 3.1.3 利用index方法获取Series的索引
- 3.1.4 利用values方法获取Series的值
- 3.2 DataFrame 表格型数据结构
- 3.2.1 DataFrame是什么
- 3.2.2 创建一个DataFrame
- 3.2.3 获取DataFrame的行、列索引
- 3.2.4 获取DataFrame的值
- 第4章 准备食材——获取数据源
- 4.1 导入外部数据
- 4.1.1 导入.xlsx文件
- 4.1.2 导入.csv文件
- 4.1.3 导入.txt文件
- 4.1.4 导入sql文件
- 4.2 新建数据
- 4.3 熟悉数据
- 4.3.1 利用head预览前几行
- 4.3.2 利用shape获取数据表的大小
- 4.3.3 利用info获取数据类型
- 4.3.4 利用describe获取数值分布情况
- 第5章 淘米洗菜——数据预处理
- 5.1 缺失值处理
- 5.1.1 缺失值查看
- 5.1.2 缺失值删除
- 5.1.3 缺失值填充
- 5.2 重复值处理
- 5.3 异常值的检测与处理
- 5.3.1 异常值检测
- 5.3.2 异常值处理
- 5.4 数据类型转换
- 5.4.1 数据类型
- 5.4.2 类型转换
- 5.5 索引设置
- 5.5.1 为无索引表添加索引
- 5.5.2 重新设置索引
- 5.5.3 重命名索引
- 5.5.4 重置索引
- 第6章 菜品挑选——数据选择
- 6.1 列选择
- 6.1.1 选择某一列/某几列
- 6.1.2 选择连续的某几列
- 6.2 行选择
- 6.2.1 选择某一行/某几行
- 6.2.2 选择连续的某几行
- 6.2.3 选择满足条件的行
- 6.3 行列同时选择
- 6.3.1 普通索引+普通索引选择指定的行和列
- 6.3.2 位置索引+位置索引选择指定的行和列
- 6.3.3 布尔索引+普通索引选择指定的行和列
- 6.3.4 切片索引+切片索引选择指定的行和列
- 6.3.5 切片索引+普通索引选择指定的行和列
- 第7章 切配菜品——数值操作
- 7.1 数值替换
- 7.1.1 一对一替换
- 7.1.2 多对一替换
- 7.1.3 多对多替换
- 7.2 数值排序
- 7.2.1 按照一列数值进行排序
- 7.2.2 按照有缺失值的列进行排序
- 7.2.3 按照多列数值进行排序
- 7.3 数值排名
- 7.4 数值删除
- 7.4.1 删除列
- 7.4.2 删除行
- 7.4.3 删除特定行
- 7.5 数值计数
- 7.6 唯一值获取
- 7.7 数值查找
- 7.8 区间切分
- 7.9 插入新的行或列
- 7.10 行列互换
- 7.11 索引重塑
- 7.12 长宽表转换
- 7.12.1 宽表转换为长表
- 7.12.2 长表转换为宽表
- 7.13 apply()与applymap()函数
- 第8章 开始烹调——数据运算
- 8.1 算术运算
- 8.2 比较运算
- 8.3 汇总运算
- 8.3.1 count非空值计数
- 8.3.2 sum求和
- 8.3.3 mean求均值
- 8.3.4 max求最大值
- 8.3.5 min求最小值
- 8.3.6 median求中位数
- 8.3.7 mode求众数
- 8.3.8 var求方差
- 8.3.9 std求标准差
- 8.3.10 quantile求分位数
- 8.4 相关性运算
- 第9章 炒菜计时器——时间序列
- 9.1 获取当前时刻的时间
- 9.1.1 返回当前时刻的日期和时间
- 9.1.2 分别返回当前时刻的年、月、日
- 9.1.3 返回当前时刻的周数
- 9.2 指定日期和时间的格式
- 9.3 字符串和时间格式相互转换
- 9.3.1 将时间格式转换为字符串格式
- 9.3.2 将字符串格式转换为时间格式
- 9.4 时间索引
- 9.5 时间运算
- 9.5.1 两个时间之差
- 9.5.2 时间偏移
- 第10章 菜品分类——数据分组/数据透视表
- 10.1 数据分组
- 10.1.1 分组键是列名
- 10.1.2 分组键是Series
- 10.1.3 神奇的aggregate方法
- 10.1.4 对分组后的结果重置索引
- 10.2 数据透视表
- 第11章 水果拼盘——多表拼接
- 11.1 表的横向拼接
- 11.1.1 连接表的类型
- 11.1.2 连接键的类型
- 11.1.3 连接方式
- 11.1.4 重复列名处理
- 11.2 表的纵向拼接
- 11.2.1 普通合并
- 11.2.2 索引设置
- 11.2.3 重叠数据合并
- 第12章 盛菜装盘——结果导出
- 12.1 导出为.xlsx文件
- 12.1.1 设置文件导出路径
- 12.1.2 设置Sheet名称
- 12.1.3 设置索引
- 12.1.4 设置要导出的列
- 12.1.5 设置编码格式
- 12.1.6 缺失值处理
- 12.1.7 无穷值处理
- 12.2 导出为.csv文件
- 12.2.1 设置文件导出路径
- 12.2.2 设置索引
- 12.2.3 设置要导出的列
- 12.2.4 设置分隔符号
- 12.2.5 缺失值处理
- 12.2.6 设置编码格式
- 12.3 将文件导出到多个Sheet
- 第13章 菜品摆放——数据可视化
- 13.1 数据可视化是什么
- 13.2 数据可视化的基本流程
- 13.2.1 整理数据
- 13.2.2 明确目的
- 13.2.3 寻找合适的表现形式
- 13.3 图表的基本组成元素
- 13.4 Excel与Python可视化
- 13.5 建立画布和坐标系
- 13.5.1 建立画布
- 13.5.2 用add_subplot函数建立坐标系
- 13.5.3 用plt.subplot2grid函数建立坐标系
- 13.5.4 用plt.subplot函数建立坐标系
- 13.5.5 用plt.subplots函数建立坐标系
- 13.5.6 几种创建坐标系方法的区别
- 13.6 设置坐标轴
- 13.6.1 设置坐标轴的标题
- 13.6.2 设置坐标轴的刻度
- 13.6.3 设置坐标轴的范围
- 13.6.4 坐标轴的轴显示设置
- 13.7 其他图表格式的设置
- 13.7.1 网格线设置
- 13.7.2 设置图例
- 13.7.3 图表标题设置
- 13.7.4 设置数据标签
- 13.7.5 图表注释
- 13.7.6 数据表
- 13.8 绘制常用图表
- 13.8.1 绘制折线图
- 13.8.2 绘制柱形图
- 13.8.3 绘制条形图
- 13.8.4 绘制散点图
- 13.8.5 绘制气泡图
- 13.8.6 绘制面积图
- 13.8.7 绘制树地图
- 13.8.8 绘制雷达图
- 13.8.9 绘制箱形图
- 13.8.10 绘制饼图
- 13.8.11 绘制圆环图
- 13.8.12 绘制热力图
- 13.8.13 绘制水平线和垂直线
- 13.9 绘制组合图表
- 13.9.1 折线图+折线图
- 13.9.2 折线图+柱形图
- 13.10 绘制双坐标轴图表
- 13.10.1 绘制双y轴图表
- 13.10.2 绘制双x轴图表
- 13.11 绘图样式设置
- 进阶篇
- 第14章 典型数据分析案例
- 14.1 利用Python实现报表自动化
- 14.1.1 为什么要进行报表自动化
- 14.1.2 什么样的报表适合自动化
- 14.1.3 如何实现报表自动化
- 14.2 自动发送电子邮件
- 14.3 假如你是某连锁超市的数据分析师
- 14.3.1 哪些类别的商品比较畅销
- 14.3.2 哪些商品比较畅销
- 14.3.3 不同门店的销售额占比
- 14.3.4 哪些时间段是超市的客流高峰期
- 14.4 假如你是某银行的数据分析师
- 14.4.1 是不是收入越高的人坏账率越低
- 14.4.2 年龄和坏账率有什么关系
- 14.4.3 家庭人口数量和坏账率有什么关系
- 第15章 NumPy数组
- 15.1 NumPy简介
- 15.2 NumPy数组的生成
- 15.2.1 生成一般数组
- 15.2.2 生成特殊类型数组
- 15.2.3 生成随机数组
- 15.3 NumPy数组的基本属性
- 15.4 NumPy数组的数据选取
- 15.4.1 一维数据选取
- 15.4.2 多维数据选取
- 15.5 NumPy数组的数据预处理
- 15.5.1 NumPy数组的类型转换
- 15.5.2 NumPy数组的缺失值处理
- 15.5.3 NumPy数组的重复值处理
- 15.6 NumPy数组重塑
- 15.6.1 一维数组重塑
- 15.6.2 多维数组重塑
- 15.6.3 数组转置
- 15.7 NumPy数组合并
- 15.7.1 横向合并
- 15.7.2 纵向合并
- 15.8 常用数据分析函数
- 15.8.1 元素级函数
- 15.8.2 描述统计函数
- 15.8.3 条件函数
- 15.8.4 集合关系
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。