展开全部

主编推荐语

本书是介绍如何用Python进行数据处理和分析的学习实战指南。

内容简介

本书主要内容包括Python语言基础、数据处理、数据分析、数据可视化图形的制作,以及利用Python对数据库的的贝叶斯操作、利用深度学习技术对模型进行优化等内容。本书主要分为3部分:第1部分包括第1章主要讲解Python的基础知识,第2部分包括第2~6章为实战案例,第3部分包括第7~8章主要讲解利用深度学习和协同过滤技术对大数据分析进行为拓展与延伸。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 第1章 Python语法基础
  • 1.1 安装Anaconda
  • 1.1.1 代码提示
  • 1.1.2 变量浏览
  • 1.1.3 安装第三方库
  • 1.2 语法基础
  • 1.2.1 字符串、列表、元组、字典和集合
  • 1.2.2 条件判断、循环和函数
  • 1.2.3 异常
  • 1.2.4 特殊函数
  • 1.3 Python基础库应用入门
  • 1.3.1 NumPy库应用入门
  • 1.3.2 Pandas库应用入门
  • 1.3.3 Matplotlib库应用入门
  • 1.4 本章小结
  • 第2章 天气数据的获取与建模分析
  • 2.1 准备工作
  • 2.2 利用抓取方法获取天气数据
  • 2.2.1 网页解析
  • 2.2.2 抓取一个静态页面中的天气数据
  • 2.2.3 抓取历史天气数据
  • 2.3 天气数据可视化
  • 2.3.1 查看数据基本信息
  • 2.3.2 变换数据格式
  • 2.3.3 气温走势的折线图
  • 2.3.4 历年气温对比图
  • 2.3.5 天气情况的柱状图
  • 2.3.6 使用Tableau制作天气情况的气泡云图
  • 2.3.7 风向占比的饼图
  • 2.3.8 使用windrose库绘制风玫瑰图
  • 2.4 机器学习在天气预报中的应用
  • 2.4.1 线性回归的基本概念
  • 2.4.2 使用一元线性回归预测气温
  • 2.4.3 使用多元线性回归预测气温
  • 2.5 本章小结
  • 第3章 养成游戏中人物的数据搭建
  • 3.1 准备工作
  • 3.2 利用Pyecharts库进行数据基本情况分析
  • 3.2.1 感染人数分布图
  • 3.2.2 病情分布图
  • 3.2.3 病症情况堆叠图
  • 3.2.4 绘制出院、死亡情况折线图
  • 3.2.5 病情热力图
  • 3.2.6 病情分布象形图
  • 3.2.7 人口流动示意图
  • 3.3 感染病例分析
  • 3.3.1 基本信息统计
  • 3.3.2 使用直方图展示感染周期
  • 3.3.3 使用词云图展示死亡病例情况
  • 3.4 疫情趋势预测
  • 3.4.1 利用逻辑方程预测感染人数
  • 3.4.2 利用SIR模型进行疫情预测
  • 3.4.3 Logistic模型和SIR模型的对比
  • 3.5 本章小结
  • 第4章 航空数据分析
  • 4.1 准备工作
  • 4.2 基本情况统计分析
  • 4.2.1 查看数据的基本信息
  • 4.2.2 航空公司、机型分布
  • 4.2.3 展示各个城市航班数量的3D地图
  • 4.2.4 从首都机场出发的桑基图
  • 4.2.5 通过关系图展示航线
  • 4.3 利用Floyd算法计算最短飞行时间
  • 4.3.1 Floyd算法简介
  • 4.3.2 Floyd算法的流程
  • 4.3.3 算法程序实现
  • 4.3.4 结果分析
  • 4.4 本章小结
  • 第5章 市民服务热线文本数据分析
  • 5.1 准备工作
  • 5.2 基本情况分析
  • 5.2.1 数据分布基本信息
  • 5.2.2 每日平均工单量分析
  • 5.2.3 来电时间分析
  • 5.2.4 工单类型分析
  • 5.3 利用词云图展示工单内容
  • 5.3.1 工单分词
  • 5.3.2 去除停用词
  • 5.3.3 词频统计
  • 5.3.4 市民反映问题词云图
  • 5.3.5 保存数据
  • 5.4 基于朴素贝叶斯的工单自动分类转办
  • 5.4.1 需求概述
  • 5.4.2 朴素贝叶斯模型的基本概念
  • 5.4.3 朴素贝叶斯文本分类算法的流程
  • 5.4.4 程序实现
  • 5.5 基于K-Means算法和PCA方法降维的热点问题挖掘
  • 5.5.1 应用场景
  • 5.5.2 K-Means算法和PCA方法的基本原理
  • 5.5.3 热点问题挖掘算法的流程
  • 5.5.4 程序实现
  • 5.6 本章小结
  • 第6章 决策树信贷风险控制
  • 6.1 准备工作
  • 6.2 数据集基本情况分析
  • 6.2.1 查看数据大小和缺失情况
  • 6.2.2 绘制直方图查看数据的分布情况
  • 6.2.3 绘制直方图的3种方法
  • 6.2.4 通过箱型图查看异常值的情况
  • 6.2.5 异常值和缺失值的处理
  • 6.2.6 使用小提琴图展示预处理后的数据
  • 6.3 利用决策树进行信贷数据建模
  • 6.3.1 决策树原理简介
  • 6.3.2 决策树信贷建模流程
  • 6.3.3 利用scikit-learn库实现决策树风险控制算法
  • 6.3.4 模型优化
  • 6.4 本章小结
  • 第7章 利用深度学习进行垃圾图片分类
  • 7.1 准备工作
  • 7.2 深度学习的基本原理
  • 7.2.1 CNN的基本原理
  • 7.2.2 Keras库简介
  • 7.3 利用Keras库实现基于CNN的垃圾图片分类
  • 7.3.1 算法流程
  • 7.3.2 数据预处理
  • 7.3.3 CNN模型实现
  • 7.4 优化CNN模型
  • 7.4.1 选择优化器
  • 7.4.2 选择损失函数
  • 7.4.3 调整模型
  • 7.4.4 图片增强
  • 7.4.5 改变学习率
  • 7.5 模型应用
  • 7.6 本章小结
  • 第8章 协同过滤和矩阵分解推荐算法分析
  • 8.1 准备工作
  • 8.2 基于协同过滤算法的短视频完播情况分析
  • 8.2.1 基于用户的协同过滤算法的原理
  • 8.2.2 算法流程
  • 8.2.3 程序实现
  • 8.3 基于矩阵分解算法的短视频完播情况预测
  • 8.3.1 算法原理
  • 8.3.2 利用Surprise库实现SVD算法
  • 8.4 几种方法在测试集中的表现
  • 8.5 本章小结
  • 第9章 《红楼梦》文本数据分析
  • 9.1 准备工作
  • 9.1.1 编程环境
  • 9.1.2 数据情况简介
  • 9.2 分词
  • 9.2.1 读取数据
  • 9.2.2 数据预处理
  • 9.2.3 分词及去除停用词
  • 9.2.4 制作词云图
  • 9.3 文本聚类分析
  • 9.3.1 构建分词TF-IDF矩阵
  • 9.3.2 K-Means聚类
  • 9.3.3 MDS降维
  • 9.3.4 PCA降维
  • 9.3.5 HC聚类
  • 9.3.6 t-SNE高维数据可视化
  • 9.4 LDA主题模型
  • 9.5 人物社交网络分析
  • 9.6 本章小结
  • 附录A 抓取数据请求头查询
  • 附录B GraphViz库的安装方法
  • 附录C 在Windows 10中安装TensorFlow的方法
  • 参考文献
  • 致谢
展开全部

评分及书评

评分不足
1个评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。