互联网
类型
9.2
豆瓣评分
可以朗读
语音朗读
394千字
字数
2018-01-01
发行日期
展开全部
主编推荐语
从计算环境配置到机器学习的实战书籍,带你掌握计算机工具高效存储和分析数据,切实解决工作痛点 。
内容简介
一本对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。如何将数据格式读取到脚本中?如何操作、改变、清洗数据?如何对数据可视化?如何使用数据获得更深的洞察力、解答问题,或者开发统计或机器学习模型?本书涵盖了有效处理计算和统计的技巧,以常见用例为讲解手段,展示了可被用作分析、操作、可视化以及学习数据的众多开源Python工具。
目录
- 版权信息
- O'Reilly Media, Inc. 介绍
- 业界评论
- 译者序
- 前言
- 什么是数据科学
- 目标读者
- 为什么用Python
- 内容概览
- 使用代码示例
- 软件安装注意事项
- O'Reilly Safari
- 联系我们
- 电子书
- 第1章 IPython:超越Python
- 1.1 shell还是Notebook
- 1.2 IPython的帮助和文档
- 1.3 IPython shell中的快捷键
- 1.4 IPython魔法命令
- 1.5 输入和输出历史
- 1.6 IPython和shell命令
- 1.7 与shell相关的魔法命令
- 1.8 错误和调试
- 1.9 代码的分析和计时
- 1.10 IPython参考资料
- 第2章 NumPy入门
- 2.1 理解Python中的数据类型
- 2.2 NumPy数组基础
- 2.3 NumPy数组的计算:通用函数
- 2.4 聚合:最小值、最大值和其他值
- 2.5 数组的计算:广播
- 2.6 比较、掩码和布尔逻辑
- 2.7 花哨的索引
- 2.8 数组的排序
- 2.9 结构化数据:NumPy的结构化数组
- 第3章 Pandas数据处理
- 3.1 安装并使用Pandas
- 3.2 Pandas对象简介
- 3.3 数据取值与选择
- 3.4 Pandas数值运算方法
- 3.5 处理缺失值
- 3.6 层级索引
- 3.7 合并数据集:Concat与Append操作
- 3.8 合并数据集:合并与连接
- 3.9 累计与分组
- 3.10 数据透视表
- 3.11 向量化字符串操作
- 3.12 处理时间序列
- 3.13 高性能Pandas:eval()与query()
- 3.14 参考资料
- 第4章 Matplotlib数据可视化
- 4.1 Matplotlib常用技巧
- 4.2 两种画图接口
- 4.3 简易线形图
- 4.4 简易散点图
- 4.5 可视化异常处理
- 4.6 密度图与等高线图
- 4.7 频次直方图、数据区间划分和分布密度
- 4.8 配置图例
- 4.9 配置颜色条
- 4.10 多子图
- 4.11 文字与注释
- 4.12 自定义坐标轴刻度
- 4.13 Matplotlib自定义:配置文件与样式表
- 4.14 用Matplotlib画三维图
- 4.15 用Basemap可视化地理数据
- 4.16 用Seaborn做数据可视化
- 4.17 参考资料
- 第5章 机器学习
- 5.1 什么是机器学习
- 5.2 Scikit-Learn简介
- 5.3 超参数与模型验证
- 5.4 特征工程
- 5.5 专题:朴素贝叶斯分类
- 5.6 专题:线性回归
- 5.7 专题:支持向量机
- 5.8 专题:决策树与随机森林
- 5.9 专题:主成分分析
- 5.10 专题:流形学习
- 5.11 专题:k-means聚类
- 5.12 专题:高斯混合模型
- 5.13 专题:核密度估计
- 5.14 应用:人脸识别管道
- 5.15 机器学习参考资料
- 关于作者
- 关于封面
- 看完了
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。