科技
类型
可以朗读
语音朗读
81千字
字数
2022-05-01
发行日期
展开全部
主编推荐语
本书是大数据处理的基础教材。
内容简介
从介绍基础的大数据采集开始,关注数据的采集、数据预处理、数据的可视化、数据的标注,以及大数据的相关应用等大数据的处理知识。其中,既包括文本或数值相关数据的处理,也包括对图片这样的非结构化数据的梳理。知识内容涵盖面较为广泛。
本书以项目制的方式编写,浅显易懂,可以让没有相关经验的读者,比如高职高专的人工智能相关专业的学生,在短时间内了解人工智能数据处理相关知识,并在各自的领域提高工作效率和产出。
目录
- 版权信息
- 内容简介
- 前言
- 项目一 大数据采集认知
- 任务1.1 开始大数据采集认知
- 1.1.1 任务描述
- 1.1.2 知识准备
- 1.1.3 任务效果
- 任务1.2 了解大数据采集平台
- 1.2.1 任务描述
- 1.2.2 知识准备
- 1.2.3 任务实施
- 1.2.4 任务效果
- 任务1.3 认识大数据预处理
- 1.3.1 任务描述
- 1.3.2 知识准备
- 1.3.3 任务实施
- 1.3.4 任务效果
- 任务1.4 了解大数据预处理常用工具
- 1.4.1 任务描述
- 1.4.2 任务实施
- 1.4.3 任务效果
- 项目小结
- 习题
- 项目二 使用Apache Flume采集日志数据
- 任务2.1 Windows环境下的Apache Flume环境搭建
- 2.1.1 任务描述
- 2.1.2 知识准备
- 2.1.3 任务实施
- 2.1.4 任务效果
- 任务2.2 Apache Flume数据采集案例
- 2.2.1 任务描述
- 2.2.2 任务实施
- 项目小结
- 习题
- 项目三 使用Logstash采集日志数据
- 任务3.1 Logstash工具安装
- 3.1.1 任务描述
- 3.1.2 知识准备
- 3.1.3 任务实施
- 3.1.4 任务效果
- 任务3.2 Logstash数据采集工作
- 3.2.1 任务描述
- 3.2.2 任务实施
- 3.2.3 任务效果
- 项目小结
- 习题
- 项目四 使用爬虫工具完成网页数据获取
- 任务4.1 使用Web Scraper完成列车时刻表数据采集工作
- 4.1.1 任务描述
- 4.1.2 知识准备
- 4.1.3 任务实施
- 4.1.4 任务效果
- 任务4.2 使用八爪鱼工具采集数据
- 4.2.1 任务描述
- 4.2.2 知识准备
- 4.2.3 任务实施
- 4.2.4 任务效果
- 项目小结
- 习题
- 项目五 完成招聘数据预处理
- 任务5.1 使用OpenRefine完成数据清洗任务
- 5.1.1 任务描述
- 5.1.2 任务实施
- 5.1.3 任务效果
- 任务5.2 使用Kettle完成数据集成任务
- 5.2.1 任务描述
- 5.2.2 任务实施
- 5.2.3 任务效果
- 项目小结
- 习题
- 项目六 数据可视化处理
- 任务6.1 数据可视化认知
- 6.1.1 任务描述
- 6.1.2 知识准备
- 6.1.3 任务效果
- 任务6.2 熟悉Echarts数据可视化
- 6.2.1 任务描述
- 6.2.2 知识准备
- 6.2.3 任务实施
- 6.2.4 任务效果
- 任务6.3 使用Tableau Desktop完成数据可视化任务
- 6.3.1 任务描述
- 6.3.2 知识准备
- 6.3.3 任务实施
- 6.3.4 任务效果
- 项目小结
- 习题
- 项目七 数据标注
- 预备知识
- 任务7.1 安装Labelme图像标注工具
- 7.1.1 任务描述
- 7.1.2 知识准备
- 7.1.3 任务实施
- 任务7.2 使用Labelme标注工具完成数据标注任务
- 7.2.1 任务描述
- 7.2.2 知识准备
- 7.2.3 任务实施
- 项目小结
- 习题
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。