互联网
类型
可以朗读
语音朗读
263千字
字数
2020-03-01
发行日期
展开全部
主编推荐语
从数据处理的角度来讲解统计分析。
内容简介
本书详细讲解了Python数据分析的相关内容,共分为10章,第1~9章分别讲解了数据分析概述、Python与数据分析、Python语言基础、NumPy数组与矢量计算、用NumPy进行简单统计分析、数据可视化——Matplotlib库、pandas数据分析基础、用pandas进行数据预处理、机器学习库scikit-learn入门;第10章用一个综合案例——电影数据分析项目,带领读者灵活掌握本书所学内容。 本书适合作为高等院校本、专科计算机相关专业的教材,也可供爱好者自学使用。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 数据分析概述
- 1.1 数据的性质
- 1.1.1 数据的概念
- 1.1.2 数据的类型
- 1.2 数据分析
- 1.2.1 数据分析的概念
- 1.2.2 数据分析的过程
- 1.2.3 数据分析的作用
- 1.2.4 数据分析的常用工具
- 本章小结
- 思考练习
- 第2章 Python与数据分析
- 2.1 Python简介
- 2.1.1 Python语言的特点
- 2.1.2 Python解释器
- 2.2 Python与数据分析的关系
- 2.3 Python数据分析常用的类库
- 2.4 Python开发环境的搭建
- 2.5 Python集成开发环境的搭建
- 2.5.1 PyCharm的安装与使用
- 2.5.2 Jupyter Notebook的安装与使用
- 项目实践
- 本章小结
- 思考练习
- 第3章 Python语言基础
- 3.1 Python基础语法
- 3.1.1 Python的语法规则
- 3.1.2 常量、变量与标准数据类型
- 3.1.3 第一个Python程序
- 3.2 Python的数据类型
- 3.2.1 数字
- 3.2.2 字符串
- 3.2.3 Python的数据结构组成
- 3.2.4 列表
- 3.2.5 元组
- 3.2.6 字典
- 3.2.7 集合
- 3.3 Python流程控制语句
- 3.3.1 if条件语句
- 3.3.2 while循环控制语句
- 3.3.3 for循环控制语句
- 3.3.4 range()函数的作用
- 3.3.5 break、continue、pass语句
- 3.4 Python的函数
- 3.4.1 自定义函数
- 3.4.2 设置函数参数
- 3.4.3 返回函数值
- 3.4.4 调用自定义函数
- 3.4.5 局部变量和全局变量
- 3.4.6 函数嵌套
- 3.4.7 匿名函数
- 项目实践
- 本章小结
- 思考练习
- 第4章 NumPy数组与矢量计算
- 4.1 NumPy概述
- 4.1.1 NumPy简介
- 4.1.2 NumPy的安装与测试
- 4.1.3 SciPy简介及其安装与测试
- 4.1.4 NumPy的简单应用:一维数组相加
- 4.2 NumPy数组对象
- 4.2.1 创建数组对象
- 4.2.2 选取数组元素
- 4.2.3 数组的属性
- 4.2.4 创建数组的其他方法
- 4.2.5 NumPy的数据类型
- 4.3 NumPy数组操作
- 4.3.1 数组的索引和切片
- 4.3.2 修改数组形状
- 4.3.3 数组的展平
- 4.3.4 数组转置和轴对换
- 4.3.5 数组的连接
- 4.3.6 数组的分割
- 4.3.7 数组转换
- 4.3.8 添加/删除数组元素
- 4.4 NumPy数组的矢量计算
- 4.4.1 数组的运算
- 4.4.2 通用函数(ufunc)
- 4.5 NumPy矩阵创建、计算及操作
- 4.6 随机数的生成
- 项目实践
- 本章小结
- 思考练习
- 第5章 用NumPy进行简单统计分析
- 5.1 文件读写操作
- 5.1.1 使用NumPy读写文本文件
- 5.1.2 使用NumPy读写二进制格式文件
- 5.1.3 使用NumPy读写多维数据文件
- 5.2 NumPy常用的统计函数
- 5.3 使用NumPy函数进行统计分析
- 5.3.1 NumPy的排序函数
- 5.3.2 NumPy的去重与重复函数
- 5.3.3 NumPy的搜索和计数函数
- 5.4 简单的统计分析
- 项目实践
- 本章小结
- 思考练习
- 第6章 数据可视化——Matplotlib库
- 6.1 Matplotlib概述
- 6.1.1 Matplotlib简介
- 6.1.2 Matplotlib的测试、安装与导入
- 6.1.3 IPython及pylab模式
- 6.2 使用pyplot创建图形
- 6.2.1 创建简单图形
- 6.2.2 创建子图
- 6.3 Matplotlib参数配置
- 6.3.1 matplotlibrc配置文件
- 6.3.2 设置动态rc参数
- 6.4 分析变量间关系图
- 6.4.1 绘制散点图
- 6.4.2 绘制折线图
- 6.5 分析变量数据分布和分散状况
- 6.5.1 绘制直方图
- 6.5.2 绘制柱状图
- 6.5.3 绘制饼图
- 6.5.4 绘制箱线图
- 项目实践
- 本章小结
- 思考练习
- 第7章 pandas数据分析基础
- 7.1 pandas概述
- 7.1.1 pandas简介
- 7.1.2 pandas测试、安装与导入
- 7.2 pandas的数据结构及常用操作
- 7.2.1 Series对象及常用操作
- 7.2.2 DataFrame对象及常用操作
- 7.3 pandas的索引
- 7.3.1 Index索引对象
- 7.3.2 Index对象的属性和方法
- 7.3.3 重新索引
- 7.3.4 层级索引
- 7.4 pandas数据结构之间的运算
- 7.4.1 算术和数据对齐
- 7.4.2 算术运算方法
- 7.4.3 DataFrame与Series对象之间的运算
- 7.5 pandas的函数应用
- 7.5.1 数据筛选
- 7.5.2 apply()函数
- 7.5.3 数据统计函数
- 7.5.4 DataFrame格式化函数
- 7.5.5 排序和排名
- 7.6 数据读取与写入
- 7.6.1 读/写文本文件
- 7.6.2 读/写Excel文件
- 7.6.3 读/写数据库文件
- 7.6.4 读/写JSON文件
- 7.7 数据分析方法
- 7.7.1 基本统计分析
- 7.7.2 分组分析
- 7.7.3 分布分析
- 7.7.4 交叉分析
- 7.7.5 结构分析
- 7.7.6 相关分析
- 项目实践
- 本章小结
- 思考练习
- 第8章 用pandas进行数据预处理
- 8.1 数据清洗
- 8.1.1 重复值的处理
- 8.1.2 缺失值的处理
- 8.1.3 异常值的处理
- 8.2 数据合并
- 8.2.1 按键连接数据
- 8.2.2 沿轴连接数据
- 8.2.3 合并重叠数据
- 8.3 数据抽取
- 8.3.1 字段抽取与拆分
- 8.3.2 记录抽取
- 8.4 重塑层次化索引
- 8.5 映射与数据转换
- 8.5.1 用映射替换元素
- 8.5.2 用映射添加元素
- 8.5.3 重命名轴索引
- 8.6 排列与随机抽样
- 8.7 日期转换、日期格式化和日期抽取
- 8.8 字符串处理
- 8.8.1 内置的字符串处理方法
- 8.8.2 正则表达式
- 8.8.3 矢量化的字符串函数
- 项目实践
- 本章小结
- 思考练习
- 第9章 机器学习库scikit-learn入门
- 9.1 机器学习概述
- 9.2 scikit-learn概述
- 9.2.1 scikit-learn介绍
- 9.2.2 scikit-learn测试、安装和导入
- 9.3 第一个机器学习程序
- 9.4 使用scikit-learn进行机器学习
- 9.4.1 Seaborn绘图
- 9.4.2 准备数据集
- 9.4.3 选择模型
- 9.4.4 调整参数训练和测试模型
- 项目实践
- 本章小结
- 思考练习
- 第10章 电影数据分析项目
- 10.1 项目描述
- 10.2 准备数据
- 10.3 数据清洗
- 10.4 数据分析与数据可视化
- 本章小结
- 思考练习
- 参考文献
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。