展开全部

主编推荐语

本书全面介绍了Python数据分析必备入门知识。

内容简介

全书共10章,包括数据分析基础、搭建Python数据分析环境、Pandas入门、Pandas进阶、可视化数据分析图表、图解数组计算模块NumPy、数据统计分析案例、机器学习Scikit-Learn、Python股票数据分析(Jupyter Notebook版)、京东电商销售数据分析与预测。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 第1章 数据分析基础
  • 1.1 什么是数据分析
  • 1.2 数据分析的重要性
  • 1.3 数据分析的基本流程
  • 1.3.1 熟悉工具
  • 1.3.2 明确目的
  • 1.3.3 获取数据
  • 1.3.4 数据处理
  • 1.3.5 数据分析
  • 1.3.6 验证结果
  • 1.3.7 结果呈现
  • 1.3.8 数据应用
  • 1.4 数据分析的常用工具
  • 1.4.1 Excel工具
  • 1.4.2 Python语言
  • 1.5 小结
  • 第2章 搭建Python数据分析环境
  • 2.1 快速了解Python
  • 2.1.1 Python简介
  • 2.1.2 Python的版本
  • 2.1.3 Python的应用领域
  • 2.2 搭建Python开发环境
  • 2.2.1 下载和安装Python
  • 2.2.2 第一个Python程序“hello world”
  • 2.3 集成开发环境PyCharm
  • 2.3.1 下载PyCharm
  • 2.3.2 安装PyCharm
  • 2.3.3 运行PyCharm
  • 2.3.4 在PyCharm中创建一组学生成绩数据
  • 2.4 数据分析标准环境Anaconda
  • 2.4.1 下载Anaconda
  • 2.4.2 安装Anaconda
  • 2.5 Jupyter Notebook开发工具
  • 2.5.1 认识Jupyter Notebook
  • 2.5.2 新建一个Jupyter Notebook文件
  • 2.5.3 在Jupyter Notebook中绘制7日天气走势图
  • 2.6 小结
  • 第3章 Pandas入门
  • 3.1 认识Pandas
  • 3.1.1 什么是Pandas
  • 3.1.2 Pandas的功能与优势
  • 3.1.3 安装Pandas模块
  • 3.1.4 牛刀小试——轻松导入Excel数据
  • 3.2 Series对象
  • 3.2.1 图解Series对象
  • 3.2.2 创建一个Series对象
  • 3.2.3 手动设置Series对象的索引
  • 3.2.4 Series对象的索引
  • 3.2.5 获取Series对象的索引和值
  • 3.3 DataFrame对象
  • 3.3.1 图解DataFrame对象
  • 3.3.2 创建一个DataFrame对象
  • 3.3.3 DataFrame对象的重要属性和函数
  • 3.4 外部数据读取
  • 3.4.1 读取Excel文件
  • 3.4.2 读取CSV文件
  • 3.4.3 读取文本文件
  • 3.4.4 读取HTML网页数据
  • 3.5 数据抽取
  • 3.5.1 抽取一行数据
  • 3.5.2 抽取多行数据
  • 3.5.3 抽取指定列数据
  • 3.5.4 抽取指定行列数据
  • 3.5.5 按指定条件抽取数据
  • 3.6 数据的增加、修改和删除
  • 3.6.1 增加数据
  • 3.6.2 修改数据
  • 3.6.3 删除数据
  • 3.7 数据清洗
  • 3.7.1 缺失值查看与处理
  • 3.7.2 重复值处理
  • 3.7.3 异常值的检测与处理
  • 3.8 索引设置
  • 3.8.1 索引的作用
  • 3.8.2 重新设置索引
  • 3.8.3 设置某列为行索引
  • 3.8.4 数据清洗后重新设置连续的行索引
  • 3.9 数据排序与排名
  • 3.9.1 数据排序
  • 3.9.2 数据排名
  • 3.10 小结
  • 第4章 Pandas进阶
  • 4.1 数据计算
  • 4.1.1 求和(sum()方法)
  • 4.1.2 求均值(mean()方法)
  • 4.1.3 求最大值(max()方法)
  • 4.1.4 求最小值(min()方法)
  • 4.1.5 求中位数(median()方法)
  • 4.1.6 求众数(mode()方法)
  • 4.1.7 求方差(var()方法)
  • 4.1.8 求标准差(std()方法)
  • 4.1.9 求分位数(quantile()方法)
  • 4.2 数据格式化
  • 4.2.1 设置小数位数
  • 4.2.2 设置百分比
  • 4.2.3 设置千位分隔符
  • 4.3 数据分组统计
  • 4.3.1 groupby()方法
  • 4.3.2 对分组数据进行迭代
  • 4.3.3 对分组的某列或多列使用聚合函数
  • 4.3.4 通过字典和Series对象进行分组统计
  • 4.4 数据移位
  • 4.5 数据转换
  • 4.5.1 一列数据转换为多列数据
  • 4.5.2 行列转换
  • 4.5.3 DataFrame转换为字典
  • 4.5.4 DataFrame转换为列表
  • 4.5.5 Excel数据转换为HTML网页格式
  • 4.6 数据合并
  • 4.6.1 merge()方法
  • 4.6.2 concat()方法
  • 4.7 数据导出
  • 4.7.1 导出数据到Excel文件
  • 4.7.2 导出数据到CSV文件
  • 4.7.3 导出数据到多个工作表
  • 4.8 日期数据处理
  • 4.8.1 DataFrame的日期数据转换
  • 4.8.2 dt()函数的使用
  • 4.8.3 获取日期区间的数据
  • 4.8.4 按不同时期统计并显示数据
  • 4.9 时间序列
  • 4.9.1 重采样处理
  • 4.9.2 降采样处理
  • 4.9.3 升采样处理
  • 4.9.4 时间序列数据汇总(ohlc()方法)
  • 4.9.5 移动窗口数据计算(rolling()方法)
  • 4.10 小结
  • 第5章 可视化数据分析图表
  • 5.1 数据分析图表的作用
  • 5.2 图表的基本组成
  • 5.3 Matplotlib概述
  • 5.3.1 Matplotlib简介
  • 5.3.2 安装Matplotlib
  • 5.3.3 Matplotlib图表之初体验
  • 5.4 图表的常用设置
  • 5.4.1 基本绘图plot()函数
  • 5.4.2 设置画布
  • 5.4.3 设置坐标轴
  • 5.4.4 添加文本标签
  • 5.4.5 设置标题和图例
  • 5.4.6 添加注释
  • 5.5 常用图表的绘制
  • 5.5.1 绘制折线图
  • 5.5.2 绘制柱形图
  • 5.5.3 绘制直方图
  • 5.5.4 绘制饼形图
  • 5.5.5 绘制散点图
  • 5.5.6 绘制面积图
  • 5.5.7 绘制热力图
  • 5.5.8 绘制箱形图
  • 5.5.9 绘制3D图表
  • 5.5.10 绘制多个子图表
  • 5.6 小结
  • 第6章 图解数组计算模块NumPy
  • 6.1 初识NumPy
  • 6.1.1 NumPy概述
  • 6.1.2 安装NumPy
  • 6.1.3 数组相关概念
  • 6.2 创建数组
  • 6.2.1 创建简单的数组
  • 6.2.2 不同方式创建数组
  • 6.2.3 按照数值范围创建数组
  • 6.2.4 生成随机数组
  • 6.2.5 从已有的数组中创建数组
  • 6.3 数组的基本操作
  • 6.3.1 数据类型
  • 6.3.2 数组运算
  • 6.3.3 数组的索引和切片
  • 6.3.4 数组重塑
  • 6.3.5 数组的增、删、改、查
  • 6.4 NumPy矩阵基本操作
  • 6.4.1 创建矩阵
  • 6.4.2 矩阵运算
  • 6.4.3 矩阵转换
  • 6.5 NumPy常用统计分析函数
  • 6.5.1 数学运算函数
  • 6.5.2 统计分析函数
  • 6.5.3 数组的排序
  • 6.6 小结
  • 第7章 数据统计分析案例
  • 7.1 对比分析
  • 7.2 同比、定比和环比分析
  • 7.3 贡献度分析
  • 7.4 差异化分析
  • 7.5 相关性分析
  • 7.6 时间序列分析
  • 7.7 小 结
  • 第8章 机器学习Scikit-Learn
  • 8.1 Scikit-Learn简介
  • 8.2 安装Scikit-Learn
  • 8.3 线性模型
  • 8.3.1 最小二乘法回归
  • 8.3.2 岭回归
  • 8.4 支持向量机
  • 8.5 聚类
  • 8.5.1 什么是聚类
  • 8.5.2 聚类算法
  • 8.5.3 聚类模块
  • 8.5.4 聚类数据生成器
  • 8.6 小结
  • 第9章 Python股票数据分析(Jupyter Notebook版)
  • 9.1 概述
  • 9.2 项目效果预览
  • 9.3 项目开发环境
  • 9.4 前期准备
  • 9.4.1 安装第三方模块
  • 9.4.2 新建Jupyter Notebook文件
  • 9.4.3 导入必要的库
  • 9.4.4 获取股票历史数据
  • 9.5 数据预处理
  • 9.5.1 数据查看与缺失性分析
  • 9.5.2 描述性统计分析
  • 9.5.3 数据处理
  • 9.5.4 异常值分析
  • 9.5.5 数据归一化处理
  • 9.6 数据统计分析
  • 9.6.1 可视化股票走势图
  • 9.6.2 股票收盘价格走势图
  • 9.6.3 股票成交量时间序列图
  • 9.6.4 股票涨跌情况分析图
  • 9.6.5 股票k线走势图
  • 9.7 关键技术
  • 9.8 小结
  • 第10章 京东电商销售数据分析与预测
  • 10.1 概述
  • 10.2 项目效果预览
  • 10.3 项目开发环境
  • 10.4 分析方法
  • 10.5 项目实现过程
  • 10.5.1 数据处理
  • 10.5.2 日期数据统计并显示
  • 10.5.3 销售收入分析
  • 10.5.4 销售收入与广告费相关性分析
  • 10.5.5 销售收入预测
  • 10.5.6 预测评分
  • 10.6 小结
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。