互联网
类型
可以朗读
语音朗读
201千字
字数
2024-02-01
发行日期
展开全部
主编推荐语
详细介绍使用Python进行数据分析应该掌握的各方面技术。
内容简介
本书内容包括Python基础,用NumPy进行数据计算,用Pandas进行数据分析,用SciPy进行数据分析,用Scikit-learn进行数据分析、数据预处理、数据可视化,用Matplotlib进行可视化等内容。
本书示例丰富,所有涉及的程序代码都给出了详细的注释,读者可以轻松学习,快速提升开发技能。除此之外,本书还附配了教学视频、PPT课件和全书示例源码。
目录
- 版权信息
- 内容简介
- 前言
- 第1章 构建Python开发环境
- 1.1 理解数据分析
- 1.1.1 数据分析是什么
- 1.1.2 数据分析的步骤
- 1.2 安装Python及开发工具
- 1.2.1 安装Python 3
- 1.2.2 安装第三方开发工具
- 1.2.3 认识Python程序
- 1.3 Python语言基础
- 1.3.1 初识Python语法
- 1.3.2 保留字与标识符
- 1.3.3 变量
- 1.3.4 基本数据类型
- 1.3.5 运算符
- 1.3.6 基本输入与输出
- 1.4 从文件中读取数据
- 1.4.1 Python读取CSV文件
- 1.4.2 Python读取JSON文件
- 1.4.3 Python读取数据库文件
- 1.4.4 Python保存数据文件
- 1.5 本章小结
- 1.6 动手练习
- 第2章 控制语句
- 2.1 程序结构
- 2.2 选择语句
- 2.2.1 if语句
- 2.2.2 if…else语句
- 2.2.3 if…elif…else语句
- 2.2.4 if语句的嵌套
- 2.3 条件表达式
- 2.4 循环语句
- 2.4.1 while循环
- 2.4.2 for循环
- 2.4.3 循环嵌套
- 2.5 跳转语句
- 2.5.1 continue语句
- 2.5.2 break语句
- 2.6 pass语句
- 2.7 本章小结
- 2.8 动手练习
- 第3章 序列
- 3.1 序列概述
- 3.1.1 索引
- 3.1.2 切片
- 3.1.3 序列相加
- 3.1.4 乘法
- 3.1.5 检查某个元素是不是序列的成员
- 3.1.6 计算序列的长度、最大值和最小值
- 3.2 列表
- 3.2.1 创建与删除列表
- 3.2.2 访问列表元素
- 3.2.3 遍历列表
- 3.2.4 添加、修改和删除列表元素
- 3.2.5 对列表进行统计和计算
- 3.2.6 对列表进行排序
- 3.2.7 列表推导式
- 3.2.8 二维列表的使用
- 3.3 元组
- 3.3.1 创建与删除元组
- 3.3.2 访问元组元素
- 3.3.3 修改元组元素
- 3.3.4 元组推导式
- 3.3.5 元组和列表的区别
- 3.4 字典
- 3.4.1 字典的创建与删除
- 3.4.2 通过“键-值对”访问字典
- 3.4.3 遍历字典
- 3.4.4 添加、修改和删除字典元素
- 3.4.5 字典推导式
- 3.5 集合
- 3.5.1 创建集合
- 3.5.2 添加和删除集合元素
- 3.5.3 集合的交集、并集和差集运算
- 3.5.4 列表、元组、字典和集合的区别
- 3.6 本章小结
- 3.7 动手练习
- 第4章 函数
- 4.1 创建和调用函数
- 4.1.1 创建函数
- 4.1.2 调用函数
- 4.2 函数的参数
- 4.2.1 形式参数和实际参数
- 4.2.2 位置参数
- 4.2.3 关键字参数
- 4.2.4 为参数设置默认值
- 4.2.5 可变参数
- 4.2.6 Python中参数的总结
- 4.3 返回值
- 4.4 变量的作用域
- 4.4.1 局部变量
- 4.4.2 全局变量
- 4.5 匿名函数
- 4.6 程序模块化
- 4.6.1 模块概述
- 4.6.2 自定义模块
- 4.6.3 模块的搜索目录
- 4.7 Python中的包
- 4.7.1 python程序的包结构
- 4.7.2 创建和使用包
- 4.8 引用其他模块
- 4.8.1 导入和使用模块标准
- 4.8.2 第三方模块的下载与安装
- 4.9 本章小结
- 4.10 动手练习
- 第5章 字符串及正则表达式
- 5.1 字符串的常用操作
- 5.1.1 拼接字符串
- 5.1.2 计算字符串长度
- 5.1.3 截取字符串
- 5.1.4 分割、合并字符串
- 5.1.5 检索字符串
- 5.1.6 字符串大小写转换
- 5.1.7 去除字符串中的空格和特殊字符
- 5.2 字符串编码转换
- 5.2.1 encode()方法对字符串编码
- 5.2.2 decode()方法对字符串解码
- 5.3 正则表达式基础
- 5.3.1 元字符
- 5.3.2 行定位符
- 5.3.3 字符类
- 5.3.4 排除字符
- 5.3.5 选择字符
- 5.3.6 转义字符
- 5.3.7 分组
- 5.3.8 正则表达式语法
- 5.4 re模块
- 5.4.1 匹配字符串
- 5.4.2 替换字符串
- 5.4.3 分割字符串
- 5.5 本章小结
- 5.6 动手练习
- 第6章 用NumPy进行数据计算
- 6.1 安装NumPy
- 6.2 NumPy数组
- 6.2.1 ndarray数组基础及实例
- 6.2.2 矩阵
- 6.2.3 NumPy线性代数相关函数
- 6.3 NumPy函数
- 6.3.1 字符串函数及实例
- 6.3.2 数学函数及实例
- 6.3.3 算术函数
- 6.3.4 统计函数
- 6.3.5 排序条件筛选函数
- 6.4 本章小结
- 6.5 动手练习
- 第7章 用Pandas进行数据处理
- 7.1 安装Pandas
- 7.2 Pandas数据结构
- 7.2.1 Pandas数据结构—Series
- 7.2.2 Pandas数据结构—DataFrame
- 7.3 Pandas数据清洗
- 7.3.1 清洗空值
- 7.3.2 清洗格式错误数据
- 7.3.3 清洗错误数据
- 7.3.4 清洗重复数据
- 7.4 本章小结
- 7.5 动手练习
- 第8章 用SciPy进行科学计算
- 8.1 安装SciPy
- 8.2 SciPy数学模块
- 8.2.1 SciPy常量模块
- 8.2.2 SciPy优化模块
- 8.2.3 SciPy稀疏矩阵模块
- 8.2.4 SciPy图结构
- 8.2.5 SciPy插值模块
- 8.3 SciPy工程模块
- 8.3.1 SciPy Matlab数组
- 8.3.2 Scipy显著性检验
- 8.4 本章小结
- 8.5 动手练习
- 第9章 Matplotlib数据可视化
- 9.1 安装Matplotlib
- 9.2 Matplotlib绘图基础
- 9.2.1 Matplotlib Pyplot模块
- 9.2.2 Matplotlib绘图标记
- 9.2.3 Matplotlib绘制图线
- 9.2.4 Matplotlib轴标签和标题
- 9.3 Matplotlib网格线
- 9.4 Matplotlib绘制图形
- 9.4.1 Matplotlib绘制多个子图
- 9.4.2 Matplotlib散点图及实例
- 9.4.3 Matplotlib柱形图
- 9.4.4 Matplotlib饼图
- 9.5 本章小结
- 9.6 动手练习
- 第10章 用Scikit-learn进行数据分析
- 10.1 Scikit-learn简介
- 10.1.1 安装Scikit-learn
- 10.1.2 机器学习和Scikit-learn库
- 10.2 利用Scikit-learn进行数据分析的方法
- 10.2.1 决策树(Decision Trees (DTs))
- 10.2.2 支持向量机
- 10.2.3 朴素贝叶斯
- 10.3 聚类
- 10.3.1 概述
- 10.3.2 K-means
- 10.3.3 层次聚类
- 10.4 时间序列
- 10.4.1 时间序列概念
- 10.4.2 ARMA模型预测案例
- 10.5 主成分分析
- 10.5.1 主成分分析的概念
- 10.5.2 主成分分析案例
- 10.6 本章小结
- 10.7 动手练习
- 第11章 数据分析案例
- 11.1 案例1:IMDB电影数据分析
- 11.1.1 案例描述
- 11.1.2 准备数据
- 11.1.3 数据清洗
- 11.1.4 数据分析与数据可视化
- 11.1.5 思考练习
- 11.2 案例2:二手房房价预测分析
- 11.2.1 案例描述
- 11.2.2 系统设计
- 11.2.3 技术准备
- 11.2.4 二手房数据分析
- 11.2.5 案例小结
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。