展开全部

主编推荐语

本书是大数据处理的基础教材。

内容简介

从介绍基础的大数据采集开始,关注数据的采集、数据预处理、数据的可视化、数据的标注,以及大数据的相关应用等大数据的处理知识。其中,既包括文本或数值相关数据的处理,也包括对图片这样的非结构化数据的梳理。知识内容涵盖面较为广泛。

本书以项目制的方式编写,浅显易懂,可以让没有相关经验的读者,比如高职高专的人工智能相关专业的学生,在短时间内了解人工智能数据处理相关知识,并在各自的领域提高工作效率和产出。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 项目一 大数据采集认知
  • 任务1.1 开始大数据采集认知
  • 1.1.1 任务描述
  • 1.1.2 知识准备
  • 1.1.3 任务效果
  • 任务1.2 了解大数据采集平台
  • 1.2.1 任务描述
  • 1.2.2 知识准备
  • 1.2.3 任务实施
  • 1.2.4 任务效果
  • 任务1.3 认识大数据预处理
  • 1.3.1 任务描述
  • 1.3.2 知识准备
  • 1.3.3 任务实施
  • 1.3.4 任务效果
  • 任务1.4 了解大数据预处理常用工具
  • 1.4.1 任务描述
  • 1.4.2 任务实施
  • 1.4.3 任务效果
  • 项目小结
  • 习题
  • 项目二 使用Apache Flume采集日志数据
  • 任务2.1 Windows环境下的Apache Flume环境搭建
  • 2.1.1 任务描述
  • 2.1.2 知识准备
  • 2.1.3 任务实施
  • 2.1.4 任务效果
  • 任务2.2 Apache Flume数据采集案例
  • 2.2.1 任务描述
  • 2.2.2 任务实施
  • 项目小结
  • 习题
  • 项目三 使用Logstash采集日志数据
  • 任务3.1 Logstash工具安装
  • 3.1.1 任务描述
  • 3.1.2 知识准备
  • 3.1.3 任务实施
  • 3.1.4 任务效果
  • 任务3.2 Logstash数据采集工作
  • 3.2.1 任务描述
  • 3.2.2 任务实施
  • 3.2.3 任务效果
  • 项目小结
  • 习题
  • 项目四 使用爬虫工具完成网页数据获取
  • 任务4.1 使用Web Scraper完成列车时刻表数据采集工作
  • 4.1.1 任务描述
  • 4.1.2 知识准备
  • 4.1.3 任务实施
  • 4.1.4 任务效果
  • 任务4.2 使用八爪鱼工具采集数据
  • 4.2.1 任务描述
  • 4.2.2 知识准备
  • 4.2.3 任务实施
  • 4.2.4 任务效果
  • 项目小结
  • 习题
  • 项目五 完成招聘数据预处理
  • 任务5.1 使用OpenRefine完成数据清洗任务
  • 5.1.1 任务描述
  • 5.1.2 任务实施
  • 5.1.3 任务效果
  • 任务5.2 使用Kettle完成数据集成任务
  • 5.2.1 任务描述
  • 5.2.2 任务实施
  • 5.2.3 任务效果
  • 项目小结
  • 习题
  • 项目六 数据可视化处理
  • 任务6.1 数据可视化认知
  • 6.1.1 任务描述
  • 6.1.2 知识准备
  • 6.1.3 任务效果
  • 任务6.2 熟悉Echarts数据可视化
  • 6.2.1 任务描述
  • 6.2.2 知识准备
  • 6.2.3 任务实施
  • 6.2.4 任务效果
  • 任务6.3 使用Tableau Desktop完成数据可视化任务
  • 6.3.1 任务描述
  • 6.3.2 知识准备
  • 6.3.3 任务实施
  • 6.3.4 任务效果
  • 项目小结
  • 习题
  • 项目七 数据标注
  • 预备知识
  • 任务7.1 安装Labelme图像标注工具
  • 7.1.1 任务描述
  • 7.1.2 知识准备
  • 7.1.3 任务实施
  • 任务7.2 使用Labelme标注工具完成数据标注任务
  • 7.2.1 任务描述
  • 7.2.2 知识准备
  • 7.2.3 任务实施
  • 项目小结
  • 习题
展开全部

评分及书评

评分不足
1个评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。