互联网
类型
可以朗读
语音朗读
119千字
字数
2024-04-01
发行日期
展开全部
主编推荐语
本书全面介绍了Python数据分析必备入门知识。
内容简介
全书共10章,包括数据分析基础、搭建Python数据分析环境、Pandas入门、Pandas进阶、可视化数据分析图表、图解数组计算模块NumPy、数据统计分析案例、机器学习Scikit-Learn、Python股票数据分析(Jupyter Notebook版)、京东电商销售数据分析与预测。
目录
- 版权信息
- 内容简介
- 前言
- 第1章 数据分析基础
- 1.1 什么是数据分析
- 1.2 数据分析的重要性
- 1.3 数据分析的基本流程
- 1.3.1 熟悉工具
- 1.3.2 明确目的
- 1.3.3 获取数据
- 1.3.4 数据处理
- 1.3.5 数据分析
- 1.3.6 验证结果
- 1.3.7 结果呈现
- 1.3.8 数据应用
- 1.4 数据分析的常用工具
- 1.4.1 Excel工具
- 1.4.2 Python语言
- 1.5 小结
- 第2章 搭建Python数据分析环境
- 2.1 快速了解Python
- 2.1.1 Python简介
- 2.1.2 Python的版本
- 2.1.3 Python的应用领域
- 2.2 搭建Python开发环境
- 2.2.1 下载和安装Python
- 2.2.2 第一个Python程序“hello world”
- 2.3 集成开发环境PyCharm
- 2.3.1 下载PyCharm
- 2.3.2 安装PyCharm
- 2.3.3 运行PyCharm
- 2.3.4 在PyCharm中创建一组学生成绩数据
- 2.4 数据分析标准环境Anaconda
- 2.4.1 下载Anaconda
- 2.4.2 安装Anaconda
- 2.5 Jupyter Notebook开发工具
- 2.5.1 认识Jupyter Notebook
- 2.5.2 新建一个Jupyter Notebook文件
- 2.5.3 在Jupyter Notebook中绘制7日天气走势图
- 2.6 小结
- 第3章 Pandas入门
- 3.1 认识Pandas
- 3.1.1 什么是Pandas
- 3.1.2 Pandas的功能与优势
- 3.1.3 安装Pandas模块
- 3.1.4 牛刀小试——轻松导入Excel数据
- 3.2 Series对象
- 3.2.1 图解Series对象
- 3.2.2 创建一个Series对象
- 3.2.3 手动设置Series对象的索引
- 3.2.4 Series对象的索引
- 3.2.5 获取Series对象的索引和值
- 3.3 DataFrame对象
- 3.3.1 图解DataFrame对象
- 3.3.2 创建一个DataFrame对象
- 3.3.3 DataFrame对象的重要属性和函数
- 3.4 外部数据读取
- 3.4.1 读取Excel文件
- 3.4.2 读取CSV文件
- 3.4.3 读取文本文件
- 3.4.4 读取HTML网页数据
- 3.5 数据抽取
- 3.5.1 抽取一行数据
- 3.5.2 抽取多行数据
- 3.5.3 抽取指定列数据
- 3.5.4 抽取指定行列数据
- 3.5.5 按指定条件抽取数据
- 3.6 数据的增加、修改和删除
- 3.6.1 增加数据
- 3.6.2 修改数据
- 3.6.3 删除数据
- 3.7 数据清洗
- 3.7.1 缺失值查看与处理
- 3.7.2 重复值处理
- 3.7.3 异常值的检测与处理
- 3.8 索引设置
- 3.8.1 索引的作用
- 3.8.2 重新设置索引
- 3.8.3 设置某列为行索引
- 3.8.4 数据清洗后重新设置连续的行索引
- 3.9 数据排序与排名
- 3.9.1 数据排序
- 3.9.2 数据排名
- 3.10 小结
- 第4章 Pandas进阶
- 4.1 数据计算
- 4.1.1 求和(sum()方法)
- 4.1.2 求均值(mean()方法)
- 4.1.3 求最大值(max()方法)
- 4.1.4 求最小值(min()方法)
- 4.1.5 求中位数(median()方法)
- 4.1.6 求众数(mode()方法)
- 4.1.7 求方差(var()方法)
- 4.1.8 求标准差(std()方法)
- 4.1.9 求分位数(quantile()方法)
- 4.2 数据格式化
- 4.2.1 设置小数位数
- 4.2.2 设置百分比
- 4.2.3 设置千位分隔符
- 4.3 数据分组统计
- 4.3.1 groupby()方法
- 4.3.2 对分组数据进行迭代
- 4.3.3 对分组的某列或多列使用聚合函数
- 4.3.4 通过字典和Series对象进行分组统计
- 4.4 数据移位
- 4.5 数据转换
- 4.5.1 一列数据转换为多列数据
- 4.5.2 行列转换
- 4.5.3 DataFrame转换为字典
- 4.5.4 DataFrame转换为列表
- 4.5.5 Excel数据转换为HTML网页格式
- 4.6 数据合并
- 4.6.1 merge()方法
- 4.6.2 concat()方法
- 4.7 数据导出
- 4.7.1 导出数据到Excel文件
- 4.7.2 导出数据到CSV文件
- 4.7.3 导出数据到多个工作表
- 4.8 日期数据处理
- 4.8.1 DataFrame的日期数据转换
- 4.8.2 dt()函数的使用
- 4.8.3 获取日期区间的数据
- 4.8.4 按不同时期统计并显示数据
- 4.9 时间序列
- 4.9.1 重采样处理
- 4.9.2 降采样处理
- 4.9.3 升采样处理
- 4.9.4 时间序列数据汇总(ohlc()方法)
- 4.9.5 移动窗口数据计算(rolling()方法)
- 4.10 小结
- 第5章 可视化数据分析图表
- 5.1 数据分析图表的作用
- 5.2 图表的基本组成
- 5.3 Matplotlib概述
- 5.3.1 Matplotlib简介
- 5.3.2 安装Matplotlib
- 5.3.3 Matplotlib图表之初体验
- 5.4 图表的常用设置
- 5.4.1 基本绘图plot()函数
- 5.4.2 设置画布
- 5.4.3 设置坐标轴
- 5.4.4 添加文本标签
- 5.4.5 设置标题和图例
- 5.4.6 添加注释
- 5.5 常用图表的绘制
- 5.5.1 绘制折线图
- 5.5.2 绘制柱形图
- 5.5.3 绘制直方图
- 5.5.4 绘制饼形图
- 5.5.5 绘制散点图
- 5.5.6 绘制面积图
- 5.5.7 绘制热力图
- 5.5.8 绘制箱形图
- 5.5.9 绘制3D图表
- 5.5.10 绘制多个子图表
- 5.6 小结
- 第6章 图解数组计算模块NumPy
- 6.1 初识NumPy
- 6.1.1 NumPy概述
- 6.1.2 安装NumPy
- 6.1.3 数组相关概念
- 6.2 创建数组
- 6.2.1 创建简单的数组
- 6.2.2 不同方式创建数组
- 6.2.3 按照数值范围创建数组
- 6.2.4 生成随机数组
- 6.2.5 从已有的数组中创建数组
- 6.3 数组的基本操作
- 6.3.1 数据类型
- 6.3.2 数组运算
- 6.3.3 数组的索引和切片
- 6.3.4 数组重塑
- 6.3.5 数组的增、删、改、查
- 6.4 NumPy矩阵基本操作
- 6.4.1 创建矩阵
- 6.4.2 矩阵运算
- 6.4.3 矩阵转换
- 6.5 NumPy常用统计分析函数
- 6.5.1 数学运算函数
- 6.5.2 统计分析函数
- 6.5.3 数组的排序
- 6.6 小结
- 第7章 数据统计分析案例
- 7.1 对比分析
- 7.2 同比、定比和环比分析
- 7.3 贡献度分析
- 7.4 差异化分析
- 7.5 相关性分析
- 7.6 时间序列分析
- 7.7 小 结
- 第8章 机器学习Scikit-Learn
- 8.1 Scikit-Learn简介
- 8.2 安装Scikit-Learn
- 8.3 线性模型
- 8.3.1 最小二乘法回归
- 8.3.2 岭回归
- 8.4 支持向量机
- 8.5 聚类
- 8.5.1 什么是聚类
- 8.5.2 聚类算法
- 8.5.3 聚类模块
- 8.5.4 聚类数据生成器
- 8.6 小结
- 第9章 Python股票数据分析(Jupyter Notebook版)
- 9.1 概述
- 9.2 项目效果预览
- 9.3 项目开发环境
- 9.4 前期准备
- 9.4.1 安装第三方模块
- 9.4.2 新建Jupyter Notebook文件
- 9.4.3 导入必要的库
- 9.4.4 获取股票历史数据
- 9.5 数据预处理
- 9.5.1 数据查看与缺失性分析
- 9.5.2 描述性统计分析
- 9.5.3 数据处理
- 9.5.4 异常值分析
- 9.5.5 数据归一化处理
- 9.6 数据统计分析
- 9.6.1 可视化股票走势图
- 9.6.2 股票收盘价格走势图
- 9.6.3 股票成交量时间序列图
- 9.6.4 股票涨跌情况分析图
- 9.6.5 股票k线走势图
- 9.7 关键技术
- 9.8 小结
- 第10章 京东电商销售数据分析与预测
- 10.1 概述
- 10.2 项目效果预览
- 10.3 项目开发环境
- 10.4 分析方法
- 10.5 项目实现过程
- 10.5.1 数据处理
- 10.5.2 日期数据统计并显示
- 10.5.3 销售收入分析
- 10.5.4 销售收入与广告费相关性分析
- 10.5.5 销售收入预测
- 10.5.6 预测评分
- 10.6 小结
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。