科技
类型
可以朗读
语音朗读
222千字
字数
2018-06-01
发行日期
展开全部
主编推荐语
经典数据分析图书再升级,让你轻松应对大数据分析任务,掌握信号处理、时间序列、文本数据分析、机器学习等技能。
内容简介
Python作为一种程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,Python语言的数据分析功能也逐渐为大众所认可。
全书共12章,从Python程序库入门、NumPy数组和Pandas入门开始,陆续介绍了数据的检索、数据加工与存储、数据可视化等内容。同时,本书还介绍了信号处理与时间序列、应用数据库、分析文本数据与社交媒体、预测性分析与机器学习、Python生态系统的外部环境和云计算、性能优化及分析、并发性等内容。在本书的最后,还采用3个附录的形式为读者补充了一些重要概念、常用函数以及在线资源等重要内容。
本书延续了上一版示例丰富、简单易懂的优点,非常适合对Python语言感兴趣或者想要使用Python语言进行数据分析的读者参考阅读。
目录
- 版权信息
- 内容提要
- 作者简介
- 技术审稿人简介
- 前言
- 本书内容
- 读者须知
- 目标读者
- 排版约定
- 资源与支持
- 配套资源
- 提交勘误
- 与我们联系
- 关于异步社区和异步图书
- 第1章 Python程序库入门
- 1.1 安装Python 3
- 1.1.1 安装数据分析程序库
- 1.1.2 Linux平台或Mac OS X平台
- 1.1.3 Windows平台
- 1.2 将IPython用作shell
- 1.3 学习手册页
- 1.4 Jupyter Notebook
- 1.5 NumPy数组
- 1.6 一个简单的应用
- 1.7 从何处寻求帮助和参考资料
- 1.8 查看Python库中包含的模块
- 1.9 通过Matplotlib实现数据的可视化
- 1.10 小结
- 第2章 NumPy数组
- 2.1 NumPy数组对象
- NumPy数组的优势
- 2.2 创建多维数组
- 2.3 选择NumPy数组元素
- 2.4 NumPy的数值类型
- 2.4.1 数据类型对象
- 2.4.2 字符码
- 2.4.3 dtype构造函数
- 2.4.4 dtype属性
- 2.5 一维数组的切片与索引
- 2.6 处理数组形状
- 2.6.1 堆叠数组
- 2.6.2 拆分NumPy数组
- 2.6.3 NumPy数组的属性
- 2.6.4 数组的转换
- 2.7 创建数组的视图和拷贝
- 2.8 花式索引
- 2.9 基于位置列表的索引方法
- 2.10 用布尔型变量索引NumPy数组
- 2.11 NumPy数组的广播
- 2.12 小结
- 2.13 参考资料
- 第3章 Pandas入门
- 3.1 Pandas的安装与概览
- 3.2 Pandas数据结构之DataFrame
- 3.3 Pandas数据结构之Series
- 3.4 利用Pandas查询数据
- 3.5 利用Pandas的DataFrame进行统计计算
- 3.6 利用Pandas的DataFrame实现数据聚合
- 3.7 DataFrame的串联与附加操作
- 3.8 连接DataFrames
- 3.9 处理缺失数据问题
- 3.10 处理日期数据
- 3.11 数据透视表
- 3.12 小结
- 3.13 参考资料
- 第4章 统计学与线性代数
- 4.1 用NumPy进行简单的描述性统计计算
- 4.2 用NumPy进行线性代数运算
- 4.2.1 用NumPy求矩阵的逆
- 4.2.2 用NumPy解线性方程组
- 4.3 用NumPy计算特征值和特征向量
- 4.4 NumPy随机数
- 4.4.1 用二项式分布进行博弈
- 4.4.2 正态分布采样
- 4.4.3 用SciPy进行正态检验
- 4.5 创建掩码式NumPy数组
- 4.6 忽略负值和极值
- 4.7 小结
- 第5章 数据的检索、加工与存储
- 5.1 利用NumPy和pandas对CSV文件进行写操作
- 5.2 二进制.npy与pickle格式
- 5.3 使用PyTables存储数据
- 5.4 Pandas DataFrame与HDF5仓库之间的读写操作
- 5.5 使用Pandas读写Excel文件
- 5.6 使用REST Web服务和JSON
- 5.7 使用Pandas读写JSON
- 5.8 解析RSS和Atom订阅
- 5.9 使用Beautiful Soup解析HTML
- 5.10 小结
- 5.11 参考资料
- 第6章 数据可视化
- 6.1 Matplotlib的子库
- 6.2 Matplotlib绘图入门
- 6.3 对数图
- 6.4 散点图
- 6.5 图例和注解
- 6.6 三维图
- 6.7 Pandas绘图
- 6.8 时滞图
- 6.9 自相关图
- 6.10 Plot.ly
- 6.11 小结
- 第7章 信号处理与时间序列
- 7.1 statsmodels模块
- 7.2 移动平均值
- 7.3 窗口函数
- 7.4 协整的定义
- 7.5 自相关
- 7.6 自回归模型
- 7.7 ARMA模型
- 7.8 生成周期信号
- 7.9 傅里叶分析
- 7.10 谱分析
- 7.11 滤波
- 7.12 小结
- 第8章 应用数据库
- 8.1 基于sqlite3的轻量级访问
- 8.2 通过Pandas访问数据库
- 8.3 SQLAlchemy
- 8.3.1 SQLAlchemy的安装和配置
- 8.3.2 通过SQLAlchemy填充数据库
- 8.3.3 通过SQLAlchemy查询数据库
- 8.4 Pony ORM
- 8.5 Dataset:懒人数据库
- 8.6 PyMongo与MongoDB
- 8.7 利用Redis存储数据
- 8.8 利用memcache存储数据
- 8.9 Apache Cassandra
- 8.10 小结
- 第9章 分析文本数据和社交媒体
- 9.1 安装NLTK
- 9.2 NLTK简介
- 9.3 滤除停用字、姓名和数字
- 9.4 词袋模型
- 9.5 词频分析
- 9.6 朴素贝叶斯分类
- 9.7 情感分析
- 9.8 创建词云
- 9.9 社交网络分析
- 9.10 小结
- 第10章 预测性分析与机器学习
- 10.1 预处理
- 10.2 基于逻辑回归的分类
- 10.3 基于支持向量机的分类
- 10.4 基于ElasticNetCV的回归分析
- 10.5 支持向量回归
- 10.6 基于相似性传播算法的聚类分析
- 10.7 均值漂移算法
- 10.8 遗传算法
- 10.9 神经网络
- 10.10 决策树
- 10.11 小结
- 第11章 Python生态系统的外部环境和云计算
- 11.1 与MATLAB/Octave交换信息
- 11.2 安装rpy2
- 11.3 连接R
- 11.4 为Java传递NumPy数组
- 11.5 集成SWIG和NumPy
- 11.6 集成Boost和Python
- 11.7 通过f2py使用Fortran代码
- 11.8 PythonAnywhere云
- 11.9 小结
- 第12章 性能优化、性能分析与并发性
- 12.1 代码的性能分析
- 12.2 安装Cython
- 12.3 调用C代码
- 12.4 利用multiprocessing创建进程池
- 12.5 通过Joblib提高for循环的并发性
- 12.6 比较Bottleneck函数与NumPy函数
- 12.7 通过Jug实现MapReduce
- 12.8 安装MPI for Python
- 12.9 IPython Parallel
- 12.10 小结
- 附录A 重要概念
- 附录B 常用函数
- Matplotlib
- NumPy
- Pandas
- Scikit-learn
- SciPy
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。