科技
类型
可以朗读
语音朗读
153千字
字数
2017-09-01
发行日期
展开全部
主编推荐语
人工智能参考书,大数据挖掘指导书。
内容简介
本书主要涉及数据工程、人工智能算法原理,大数据平台技术、人工智能算法在大数据平台上的实现、人工智能算法的应用于实践。 第一章是大数据与人工智能的历史、应用。第二章是数据工程。第三章是人工智能基础算法的原理介绍。第四章是大数据平台的介绍。第五章以第三章中的几种算法为例子,介绍了它们是如何在大数据平台上分布式实现的。第六章是当前热门的深度学习技术的介绍。第七章是实践。 本书针对1.对大数据和人工智能感兴趣、希望快速了解和入门本领域知识的在读本科生、研究生。2.希望从事大数据和人工智能岗位、需要快速提升理论基础和实战技能的求职者。3.计算机和互联网领域,对人工智算法感兴趣或工作中迫切需要一定本领域知识的工程师。本书主要涉及数据工程、人工智能算法原理,大数据平台技术、人工智能算法在大数据平台上的实现、人工智能算法的应用于实践。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 绪论
- 1.1 日益增长的数据
- 1.1.1 大数据基本概念
- 1.1.2 大数据发展历程
- 1.1.3 大数据的特征
- 1.1.4 大数据的基本认识
- 1.2 人工智能
- 1.2.1 认识人工智能
- 1.2.2 人工智能的现状与应用
- 1.2.3 当人工智能遇上大数据
- 1.3 大数据与人工智能的机遇与挑战
- 1.3.1 大数据与人工智能面临的难题
- 1.3.2 大数据与人工智能的前景
- 第2章 数据工程
- 2.1 数据的多样性
- 2.1.1 数据格式的多样性
- 2.1.2 数据来源的多样性
- 2.1.3 数据用途的多样性
- 2.2 数据工程的一般流程
- 2.3 数据的获取
- 2.3.1 数据来源
- 2.3.2 数据采集方法
- 2.3.3 大数据采集平台
- 2.4 数据的存储与数据仓库
- 2.4.1 数据存储
- 2.4.2 数据仓库
- 2.5 数据的预处理技术
- 2.5.1 数据预处理的目的
- 2.5.2 数据清理
- 2.5.3 数据集成
- 2.5.4 数据变换
- 2.5.5 数据规约
- 2.6 模型的构建与评估
- 2.6.1 模型的构建
- 2.6.2 评价指标
- 2.7 数据的可视化
- 2.7.1 可视化的发展
- 2.7.2 可视化工具
- 第3章 机器学习算法
- 3.1 机器学习绪论
- 3.1.1 机器学习基本概念
- 3.1.2 评价标准
- 3.1.3 机器模型的数学基础
- 3.2 决策树理论
- 3.2.1 决策树模型
- 3.2.2 决策树的训练
- 3.2.3 本节小结
- 3.3 朴素贝叶斯理论
- 3.4 线性回归
- 3.5 逻辑斯蒂回归
- 3.5.1 二分类逻辑回归模型
- 3.5.2 二分类逻辑斯蒂回归的训练
- 3.5.3 softmax分类器
- 3.5.4 逻辑斯蒂回归和softmax的应用
- 3.5.5 本节小结
- 3.6 支持向量机
- 3.6.1 间隔
- 3.6.2 支持向量机的原始形式
- 3.6.3 支持向量机的对偶形式
- 3.6.4 特征空间的隐式映射:核函数
- 3.6.5 支持向量机拓展
- 3.6.6 支持向量机的应用
- 3.7 集成学习
- 3.7.1 基础概念
- 3.7.2 Boosting
- 3.7.3 Bagging
- 3.7.4 Stacking
- 3.8 神经网络
- 3.8.1 生物神经元和人工神经元
- 3.8.2 感知机
- 3.8.3 BP神经网络
- 3.8.4 Sklearn中的神经网络
- 3.8.5 本节小结
- 3.8.6 拓展阅读
- 3.9 聚类
- 3.9.1 聚类思想
- 3.9.2 性能计算和距离计算
- 3.9.3 原型聚类:k-means
- 3.9.4 密度聚类:DBSCAN
- 3.9.5 层次聚类
- 3.9.6 Sklearn中的聚类
- 3.9.7 本节小结
- 3.9.8 拓展阅读
- 3.10 降维与特征选择
- 3.10.1 维数爆炸与降维
- 3.10.2 降维技术
- 3.10.3 特征选择算法
- 3.10.4 Sklearn中的降维
- 3.10.5 本节小结
- 第4章 大数据框架
- 4.1 Hadoop简介
- 4.1.1 Hadoop的由来
- 4.1.2 MapReduce和HDFS
- 4.2 Hadoop大数据处理框架
- 4.2.1 HDFS组件与运行机制
- 4.2.2 MapReduce组件与运行机制
- 4.2.3 Yarn框架和运行机制
- 4.2.4 Hadoop相关技术
- 4.3 Hadoop安装与部署
- 4.3.1 安装配置单机版Hadoop
- 4.3.2 单机版WordCount程序
- 4.3.3 安装配置伪分布式Hadoop
- 4.4 MapReduce编程
- 4.4.1 MapReduce综述
- 4.4.2 Map阶段
- 4.4.3 Shuffle阶段
- 4.4.4 Reduce阶段
- 4.5 HBase、Hive和Pig简介
- 4.5.1 HBase简介
- 4.5.2 Hive简介
- 4.5.3 Pig简介
- 4.6 Spark简介
- 4.6.1 Spark概述
- 4.6.2 Spark基本概念
- 4.6.3 Spark生态系统
- 4.6.4 Spark组件与运行机制
- 4.7 Spark安装使用
- 4.7.1 JDK安装
- 4.7.2 Scala安装
- 4.7.3 Spark安装
- 4.7.4 Winutils安装
- 4.7.5 使用Spark Shell
- 4.7.6 Spark文件目录
- 4.8 Spark实例讲解
- 第5章 分布式数据挖掘算法
- 5.1 K-Means聚类方法
- 5.1.1 K-Means聚类算法简介
- 5.1.2 K-Means算法的分布式实现
- 5.2 朴素贝叶斯分类算法
- 5.2.1 朴素贝叶斯分类并行化设计思路
- 5.2.2 朴素贝叶斯分类并行化实现
- 5.3 频繁项集挖掘算法
- 5.3.1 Apriori频繁项集挖掘算法简介
- 5.3.2 Apriori频繁项集挖掘的并行化实现
- 第6章 深度学习简介
- 6.1 从神经网络到深度神经网络
- 6.1.1 深度学习应用
- 6.1.2 深度神经网络的困难
- 6.2 卷积神经网络
- 6.2.1 卷积神经网络的生物学基础
- 6.2.2 卷积神经网络结构
- 6.3 循环神经网络
- 6.3.1 循环神经网络简介
- 6.3.2 循环神经网络结构
- 第7章 数据分析实例
- 7.1 基本数据分析
- 7.1.1 数据介绍
- 7.1.2 数据导入与数据初识
- 7.1.3 分类
- 7.1.4 回归
- 7.1.5 降维
- 7.2 深度学习项目实战
- 7.2.1 Tensorflow与Keras安装部署
- 7.2.2 使用卷积神经网络进行手写数字识别
- 7.2.3 使用LSTM进行文本情感分类
- 参考文献
- 附录A 矩阵基础
- 附录B 梯度下降
- 附录C 拉格朗日对偶性
- 附录D Python语法知识
- 附录E Java语法基础介绍
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。