互联网
类型
可以朗读
语音朗读
212千字
字数
2017-11-01
发行日期
展开全部
主编推荐语
这本书选取了机器学习和深度学习两大热门领域的核心内容,为读者进一步实现数据价值的深度分析和挖掘打下坚实基础。
内容简介
本书首先介绍了数据工程和Python语法,随后讲解如何获取和存储数据,并实现简单的静态可视化。文本作为一种极其重要的数据类型,也单独列出一章进行讨论。之后读者将学习到关于Web建站的一些基础和进阶知识,并基于多种工具完成丰富的动态可视化。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 写在前面
- 1.1 数据工程和编程语言
- 1.1.1 如何玩转数据
- 1.1.2 关于编程语言
- 1.2 带好装备——Python和Sublime
- 1.2.1 Python
- 1.2.2 Sublime
- 1.2.3 运行Python代码的方法
- 1.2.4 Hello World
- 1.3 数据结构和常见类型
- 1.3.1 数据的结构
- 1.3.2 数据的类型
- 第2章 学会Python
- 2.1 Python基础语法
- 2.1.1 Python的特点
- 2.1.2 中文编码
- 2.1.3 变量
- 2.1.4 注释
- 2.1.5 保留名
- 2.1.6 行和缩进
- 2.1.7 运算符
- 2.1.8 条件
- 2.1.9 循环
- 2.1.10 时间
- 2.1.11 文件
- 2.1.12 异常
- 2.1.13 函数
- 2.1.14 补充内容
- 2.2 实战:西游记用字统计
- 2.2.1 数据
- 2.2.2 目标
- 2.2.3 步骤
- 2.2.4 总结
- 第3章 获取数据
- 3.1 HTTP请求和Chrome
- 3.1.1 访问一个链接
- 3.1.2 Chrome浏览器
- 3.1.3 HTTP
- 3.1.4 URL类型
- 3.2 使用Python获取数据
- 3.2.1 urllib2
- 3.2.2 GET请求
- 3.2.3 POST请求
- 3.2.4 处理返回结果
- 3.3 实战:爬取豆瓣电影
- 3.3.1 确定目标
- 3.3.2 通用思路
- 3.3.3 寻找链接
- 3.3.4 代码实现
- 3.3.5 补充内容
- 第4章 存储数据
- 4.1 使用XAMP搭建Web环境
- 4.1.1 Web环境
- 4.1.2 偏好设置
- 4.1.3 Hello World
- 4.2 MySQL使用方法
- 4.2.1 基本概念
- 4.2.2 命令行
- 4.2.3 Web工具
- 4.2.4 本地软件
- 4.3 使用Python操作数据库
- 4.3.1 MySQLdb
- 4.3.2 建立连接
- 4.3.3 执行操作
- 4.3.4 关闭连接
- 4.3.5 扩展内容
- 第5章 静态可视化
- 5.1 在R中进行可视化
- 5.1.1 下载和安装
- 5.1.2 R语言基础
- 5.1.3 ggplot2
- 5.1.4 R语言学习笔记
- 5.2 掌握ggplot2数据可视化
- 5.2.1 图形种类
- 5.2.2 基本语法
- 5.2.3 条形图
- 5.2.4 折线图
- 5.2.5 描述数据分布
- 5.2.6 分面
- 5.2.7 R语言数据可视化
- 5.3 实战:Diamonds数据集探索
- 5.3.1 查看数据
- 5.3.2 价格和克拉
- 5.3.3 价格分布
- 5.3.4 纯净度分布
- 5.3.5 价格概率分布
- 5.3.6 不同切工下的价格分布
- 5.3.7 坐标变换
- 5.3.8 标题和坐标轴标签
- 第6章 自然语言理解
- 6.1 走近自然语言理解
- 6.1.1 概念
- 6.1.2 内容
- 6.1.3 应用
- 6.2 使用jieba分词处理中文
- 6.2.1 jieba中文分词
- 6.2.2 中文分词
- 6.2.3 关键词提取
- 6.2.4 词性标注
- 6.3 词嵌入的概念和实现
- 6.3.1 语言的表示
- 6.3.2 训练词向量
- 6.3.3 代码实现
- 第7章 Web基础
- 7.1 网页的骨骼:HTML
- 7.1.1 HTML是什么
- 7.1.2 基本结构
- 7.1.3 常用标签
- 7.1.4 标签的属性
- 7.1.5 注释
- 7.1.6 表单
- 7.1.7 颜色
- 7.1.8 DOM
- 7.1.9 HTML5
- 7.1.10 补充内容
- 7.2 网页的血肉:CSS
- 7.2.1 CSS是什么
- 7.2.2 基本结构
- 7.2.3 使用CSS
- 7.2.4 常用选择器
- 7.2.5 常用样式
- 7.2.6 CSS3
- 7.2.7 CSS实例
- 7.2.8 补充学习
- 7.3 网页的关节:JS
- 7.3.1 JS是什么
- 7.3.2 使用JS
- 7.3.3 JS基础
- 7.3.4 补充学习
- 第8章 Web进阶
- 8.1 比JS更方便的JQuery
- 8.1.1 引入JQuery
- 8.1.2 语法
- 8.1.3 选择器
- 8.1.4 事件
- 8.1.5 直接操作
- 8.1.6 AJAX请求
- 8.1.7 补充学习
- 8.2 实战:你竟是这样的月饼
- 8.2.1 项目简介
- 8.2.2 首页实现
- 8.2.3 月饼页实现
- 8.2.4 项目总结
- 8.3 基于ThinkPHP的简易个人博客
- 8.3.1 ThinkPHP是什么
- 8.3.2 个人博客
- 8.3.3 下载和初始化
- 8.3.4 MVC
- 8.3.5 数据库配置
- 8.3.6 控制器、函数和渲染模板
- 8.3.7 U函数和页面跳转
- 8.3.8 表单实现和数据处理
- 8.3.9 读取数据并渲染
- 8.3.10 项目总结
- 8.4 基于Flask的简易个人博客
- 8.4.1 Flask是什么
- 8.4.2 项目准备
- 8.4.3 渲染模板
- 8.4.4 操作数据库
- 8.4.5 完善其他页面
- 8.4.6 项目总结
- 第9章 动态可视化
- 9.1 使用ECharts制作交互图形
- 9.1.1 ECharts是什么
- 9.1.2 引入Echarts
- 9.1.3 准备一个画板
- 9.1.4 绘制ECharts图形
- 9.1.5 使用其他主题
- 9.1.6 配置项手册
- 9.1.7 开始探索
- 9.2 实战:再谈豆瓣电影数据分析
- 9.2.1 项目成果
- 9.2.2 数据获取
- 9.2.3 数据清洗和存储
- 9.2.4 数据分析
- 9.2.5 数据可视化
- 9.2.6 项目总结
- 9.3 数据可视化之魅D3
- 9.3.1 D3是什么
- 9.3.2 D3核心思想
- 9.3.3 一个简单的例子
- 9.3.4 深入理解D3
- 9.3.5 开始探索
- 9.4 实战:星战电影知识图谱
- 9.4.1 项目成果
- 9.4.2 数据获取
- 9.4.3 数据分析
- 9.4.4 数据可视化
- 9.4.5 项目总结
- 9.5 艺术家爱用的Processing
- 9.5.1 Processing是什么
- 9.5.2 一个简单的例子
- 9.5.3 Processing基础
- 9.5.4 更多内容
- 9.6 实战:上海地铁的一天
- 9.6.1 项目成果
- 9.6.2 项目数据
- 9.6.3 项目思路
- 9.6.4 项目实现
- 9.6.5 项目总结
- 第10章 机器学习
- 10.1 明白一些基本概念
- 10.1.1 机器学习是什么
- 10.1.2 学习的种类
- 10.1.3 两大痛点
- 10.1.4 学习的流程
- 10.1.5 代码实现
- 10.2 常用经典模型及实现
- 10.2.1 线性回归
- 10.2.2 Logistic回归
- 10.2.3 贝叶斯
- 10.2.4 K近邻
- 10.2.5 决策树
- 10.2.6 支持向量机
- 10.2.7 K-Means
- 10.2.8 神经网络
- 10.2.9 代码实现
- 10.3 调参比赛大杀器XGBoost
- 10.3.1 为什么要调参
- 10.3.2 XGBoost是什么
- 10.3.3 XGBoost安装
- 10.3.4 XGBoost模型参数
- 10.3.5 XGBoost调参实战
- 10.3.6 总结
- 10.4 实战:微额借款用户人品预测
- 10.4.1 项目背景
- 10.4.2 数据概况
- 10.4.3 缺失值处理
- 10.4.4 特征工程
- 10.4.5 特征选择
- 10.4.6 模型设计
- 10.4.7 项目总结
- 第11章 深度学习
- 11.1 初探Deep Learning
- 11.1.1 深度学习是什么
- 11.1.2 神经元模型
- 11.1.3 全连接层
- 11.1.4 代码实现
- 11.2 用于处理图像的CNN
- 11.2.1 CNN是什么
- 11.2.2 CNN核心内容
- 11.2.3 CNN使用方法
- 11.2.4 CNN模型训练
- 11.2.5 代码实现
- 11.3 用于处理序列的RNN
- 11.3.1 RNN是什么
- 11.3.2 RNN模型结构
- 11.3.3 LSTM
- 11.3.4 RNN使用方法
- 11.3.5 代码实现
- 11.4 实战:多种手写数字识别模型
- 11.4.1 手写数字数据集
- 11.4.2 全连接层
- 11.4.3 CNN实现
- 11.4.4 RNN实现
- 11.4.5 实战总结
- 第12章 数据的故事
- 12.1 如何讲一个好的故事
- 12.1.1 为什么要做PPT
- 12.1.2 讲一个好的故事
- 12.1.3 用颜值加分
- 12.1.4 总结
- 12.2 实战:有内容有颜值的分享
- 12.2.1 SODA
- 12.2.2 公益云图
- 12.2.3 上海BOT
- 12.2.4 总结
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。