展开全部

主编推荐语

通过详细的案例学习如何解决web分析、社会科学、金融学以及经济学等领域的问题。

内容简介

本书涵盖数据采集、清洗、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python核心特性,文本数据、数据库、表格形式的数值等大数据的采集、清洗、可视化和分析,概率和统计,机器学习。

面向研究生和本科生、数据科学教员、刚入门的数据科学专业人员,以及那些想拥有一本参考手册来帮助记住所有Python 函数及参数的开发人员。

目录

  • 版权信息
  • 前言
  • 关于本书
  • 关于读者
  • 关于软件
  • 关于引号
  • 关于本书的论坛
  • 轮到你了
  • 致谢
  • 第1章 什么是数据科学
  • 第1单元 数据分析步骤
  • 第2单元 数据获取途径
  • 第3单元 报告的结构
  • 轮到你了
  • 第2章 数据科学的Python核心
  • 第4单元 理解基本的字符串函数
  • 第5单元 选择合适的数据结构
  • 第6单元 通过列表推导式理解列表
  • 第7单元 使用计数器
  • 第8单元 使用文件
  • 第9单元 上网
  • 第10单元 使用正则表达式实现模式匹配
  • 理解正则表达式语言
  • 使用模块re进行搜索、拆分和替换
  • 第11单元 globbing文件名与其他字符串
  • 第12单元 Pickling和Unpickling数据
  • 轮到你了
  • 第3章 使用文本数据
  • 第13单元 处理HTML文件
  • 第14单元 处理CSV文件
  • 第15单元 读取JSON文件
  • 第16单元 处理自然语言中的文本
  • NLTK语料库
  • 规范化
  • 其他文本处理程序
  • 轮到你了
  • 第4章 使用数据库
  • 第17单元 设置MySQL数据库
  • 第18单元 使用MySQL数据库:命令行
  • 插入
  • 删除
  • 变更
  • 选择
  • 连接
  • 第19单元 使用MySQL数据库:pymysql
  • 第20单元 改善文档存储:MongoDB
  • 轮到你了
  • 第5章 使用表格形式的数值数据
  • 第21单元 创建数组
  • 第22单元 转置和重排
  • 第23单元 索引和切片
  • 第24单元 广播
  • 第25单元 揭秘通用函数
  • 第26单元 理解条件函数
  • 第27单元 数组的聚合与排序
  • 第28单元 将数组用作集合
  • 第29单元 数组的保存和读取
  • 第30单元 生成合成正弦波
  • 轮到你了
  • 第6章 使用series和frame
  • 第31单元 pandas数据结构
  • series
  • frame
  • 第32单元 数据重塑
  • 索引
  • 重建索引
  • 分层索引
  • 堆叠和旋转
  • 第33单元 处理缺失数据
  • 删除缺失数据
  • 插补缺失数据
  • 替换数据
  • 第34单元 组合数据
  • 合并
  • 连接
  • 删除重复行
  • 第35单元 数据的排序和描述
  • 排序和分级
  • 描述性统计量
  • 唯一性、计数、会员资格
  • 第36单元 数据转换
  • 算术运算
  • 数据聚合
  • 离散化
  • 映射
  • 交叉表
  • 第37单元 掌握pandas的文件读写功能
  • 读取CSV和表格文件
  • 分块
  • 读取其他文件
  • 轮到你了
  • 第7章 使用网络数据
  • 第38单元 概念剖析
  • 图的元素、类型和密度
  • 图的结构
  • 中心性
  • 第39单元 网络分析序列
  • 第40单元 使用networkx
  • 构建和修改网络
  • 探索和分析网络
  • 管理属性
  • 团和社区结构
  • 输入和输出
  • 轮到你了
  • 第8章 绘图
  • 第41单元 使用PyPlot进行基本绘图
  • 第42单元 了解其他绘图类型
  • 第43单元 精通绘图装饰
  • 第44单元 用pandas绘图
  • 轮到你了
  • 第9章 概率与统计
  • 第45单元 回顾概率分布
  • 均匀分布
  • 正态分布
  • 二项分布
  • 第46单元 回顾统计度量
  • 第47单元 以Python的方式完成统计
  • 生成随机数
  • 计算统计度量
  • 轮到你了
  • 第10章 机器学习
  • 第48单元 设计预测实验
  • 第49单元 线性回归拟合
  • 普通最小二乘回归
  • 脊回归
  • 逻辑回归
  • 第50单元 用k均值聚类实现数据分组
  • 第51单元 在随机决策森林中生存
  • 轮到你了
  • 附录1 扩展阅读
  • 附录2 单星项目的解决方案
  • 参考文献
  • 看完了
展开全部

评分及书评

评分不足
1个评分
  • 用户头像
    给这本书评了
    2.0
    数据科学简介

    讲原理的东西不是不好,但是对于非数据科学专业的读者来说还是有点难度。加上 Python 没有运用到位,感觉作者是半路出家的。步步拆解的同时用通俗易懂的语言,讲清楚一件复杂的事情是好的工具书的必备特征。

      转发
      评论

    出版方

    人民邮电出版社·图灵出品

    图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。