科技
类型
5.4
豆瓣评分
可以朗读
语音朗读
127千字
字数
2017-11-01
发行日期
展开全部
主编推荐语
通过详细的案例学习如何解决web分析、社会科学、金融学以及经济学等领域的问题。
内容简介
本书涵盖数据采集、清洗、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python核心特性,文本数据、数据库、表格形式的数值等大数据的采集、清洗、可视化和分析,概率和统计,机器学习。
面向研究生和本科生、数据科学教员、刚入门的数据科学专业人员,以及那些想拥有一本参考手册来帮助记住所有Python 函数及参数的开发人员。
目录
- 版权信息
- 前言
- 关于本书
- 关于读者
- 关于软件
- 关于引号
- 关于本书的论坛
- 轮到你了
- 致谢
- 第1章 什么是数据科学
- 第1单元 数据分析步骤
- 第2单元 数据获取途径
- 第3单元 报告的结构
- 轮到你了
- 第2章 数据科学的Python核心
- 第4单元 理解基本的字符串函数
- 第5单元 选择合适的数据结构
- 第6单元 通过列表推导式理解列表
- 第7单元 使用计数器
- 第8单元 使用文件
- 第9单元 上网
- 第10单元 使用正则表达式实现模式匹配
- 理解正则表达式语言
- 使用模块re进行搜索、拆分和替换
- 第11单元 globbing文件名与其他字符串
- 第12单元 Pickling和Unpickling数据
- 轮到你了
- 第3章 使用文本数据
- 第13单元 处理HTML文件
- 第14单元 处理CSV文件
- 第15单元 读取JSON文件
- 第16单元 处理自然语言中的文本
- NLTK语料库
- 规范化
- 其他文本处理程序
- 轮到你了
- 第4章 使用数据库
- 第17单元 设置MySQL数据库
- 第18单元 使用MySQL数据库:命令行
- 插入
- 删除
- 变更
- 选择
- 连接
- 第19单元 使用MySQL数据库:pymysql
- 第20单元 改善文档存储:MongoDB
- 轮到你了
- 第5章 使用表格形式的数值数据
- 第21单元 创建数组
- 第22单元 转置和重排
- 第23单元 索引和切片
- 第24单元 广播
- 第25单元 揭秘通用函数
- 第26单元 理解条件函数
- 第27单元 数组的聚合与排序
- 第28单元 将数组用作集合
- 第29单元 数组的保存和读取
- 第30单元 生成合成正弦波
- 轮到你了
- 第6章 使用series和frame
- 第31单元 pandas数据结构
- series
- frame
- 第32单元 数据重塑
- 索引
- 重建索引
- 分层索引
- 堆叠和旋转
- 第33单元 处理缺失数据
- 删除缺失数据
- 插补缺失数据
- 替换数据
- 第34单元 组合数据
- 合并
- 连接
- 删除重复行
- 第35单元 数据的排序和描述
- 排序和分级
- 描述性统计量
- 唯一性、计数、会员资格
- 第36单元 数据转换
- 算术运算
- 数据聚合
- 离散化
- 映射
- 交叉表
- 第37单元 掌握pandas的文件读写功能
- 读取CSV和表格文件
- 分块
- 读取其他文件
- 轮到你了
- 第7章 使用网络数据
- 第38单元 概念剖析
- 图的元素、类型和密度
- 图的结构
- 中心性
- 第39单元 网络分析序列
- 第40单元 使用networkx
- 构建和修改网络
- 探索和分析网络
- 管理属性
- 团和社区结构
- 输入和输出
- 轮到你了
- 第8章 绘图
- 第41单元 使用PyPlot进行基本绘图
- 第42单元 了解其他绘图类型
- 第43单元 精通绘图装饰
- 第44单元 用pandas绘图
- 轮到你了
- 第9章 概率与统计
- 第45单元 回顾概率分布
- 均匀分布
- 正态分布
- 二项分布
- 第46单元 回顾统计度量
- 第47单元 以Python的方式完成统计
- 生成随机数
- 计算统计度量
- 轮到你了
- 第10章 机器学习
- 第48单元 设计预测实验
- 第49单元 线性回归拟合
- 普通最小二乘回归
- 脊回归
- 逻辑回归
- 第50单元 用k均值聚类实现数据分组
- 第51单元 在随机决策森林中生存
- 轮到你了
- 附录1 扩展阅读
- 附录2 单星项目的解决方案
- 参考文献
- 看完了
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。