展开全部

主编推荐语

Greenplum核心研发团队精心撰写,全面解读开源MPP大数据平台开发与实践。从大数据战略到落地,多维度助力企业数字化转型。

内容简介

本书分为四个部分。

第一部分介绍大数据战略。其中,第1章将分享作者对于ABC(人工智能、大数据和云计算)之间关系的理解以及对人和人工智能的思考。第2章将介绍进取型企业为什么需要大数据战略以及如何建立大数据战略。

第二部分介绍大数据平台。其中,第3章将以数据平台演进历史和未来趋势为主题,描述三次整合的背景及影响,介绍选择大数据平台需要考虑的因素,以及为什么Greenplum是理想的大数据平台。第4章为Greenplum数据库快速入门指南。第5章将介绍Greenplum架构的主要特点和核心引擎。第6章将介绍数据加载、数据联邦和数据虚拟化。第7章将介绍Greenplum的资源管理以及对混合负载的支持。

第三部分介绍机器学习与数据分析。其中,第8章介绍Greenplum的各种过程化编程语言(用户自定义函数),用户可以使用Python、R、Java等语言实现用户自定义函数,还可以通过容器化技术实现自定义函数的安全性和隔离性。第9章将介绍Greenplum内建的机器学习库MADlib,数据科学家可以使用内建的50多种机器学习算法基于SQL对数据进行高级分析,并介绍如何扩展MADlib以实现新算法。第10章和第11章将分别介绍Greenplum如何对文本数据和时空数据(GIS)进行存储、计算和分析。第12章将介绍Greenplum丰富的图计算能力。

第四部分介绍运维管理和数据迁移。其中,第13章将介绍各种监控和管理工具及相关企业级产品。第14章介绍数据库备份、恢复和迁移。第15章和第16章将分别介绍如何从Oracle和Teradata迁移到Greenplum。

目录

  • 版权信息
  • 编委会
  • 前言
  • 第一部分 大数据战略
  • 第1章 ABC:人工智能、大数据和云计算
  • 1.1 再谈云计算
  • 1.2 大数据
  • 1.3 人工智能
  • 1.4 ABC之间的关系
  • 1.5 AI和人
  • 第2章 建立基于大数据的高阶数字化战略
  • 2.1 基于云原生应用的数字化战略
  • 2.2 大数据和AI:企业未来的终极竞争点
  • 2.3 大数据战略的落地
  • 2.4 大数据和AI的展望
  • 第二部分 大数据平台
  • 第3章 数据处理平台的演进
  • 3.1 前数据处理时代
  • 3.2 早期的电子数据处理
  • 3.3 数据库
  • 3.4 NoSQL数据库
  • 3.5 SQL数据库的回归
  • 3.6 集成数据处理和分析平台
  • 3.7 数据平台的选型
  • 3.8 小结
  • 第4章 Greenplum数据库快速入门
  • 4.1 Greenplum数据库的发展和现状
  • 4.2 Greenplum数据库的特性
  • 4.3 Greenplum数据库的组成
  • 4.4 Greenplum数据库的安装与部署
  • 4.5 Greenplum数据库的常用操作
  • 4.6 Greenplum数据库的常用命令
  • 4.7 小结
  • 第5章 Greenplum的架构和核心引擎
  • 5.1 Greenplum的架构
  • 5.2 Greenplum查询计划
  • 5.3 Greenplum数据库查询处理的过程
  • 5.4 小结
  • 第6章 从ETL到数据联邦和数据虚拟化
  • 6.1 Greenplum中的ETL
  • 6.2 Greenplum的数据联邦
  • 6.3 Greenplum的数据虚拟化框架
  • 6.4 小结
  • 第7章 混合负载和资源管理
  • 7.1 混合负载的机遇和挑战
  • 7.2 混合负载的业务和技术要求
  • 7.3 资源管理
  • 7.4 并发管理
  • 7.5 小结
  • 第三部分 机器学习与数据分析
  • 第8章 Greenplum中的过程化编程语言
  • 8.1 PL/Python
  • 8.2 PL/R
  • 8.3 PL/Container
  • 8.4 小结
  • 第9章 MADlib机器学习库
  • 9.1 MADlib入门
  • 9.2 MADlib的架构
  • 9.3 MADlib应用
  • 9.4 小结
  • 第10章 Greenplum半结构化文本数据分析
  • 10.1 GPText文本分析概述
  • 10.2 GPText内置的全文检索引擎:Apache SolrCloud
  • 10.3 GPText架构:高速并行索引和查询
  • 10.4 数据准备
  • 10.5 GPText的使用:简单的SQL和UDF函数
  • 10.6 GPText的安装
  • 10.7 GPText索引
  • 10.8 GPText简单查询
  • 10.9 GPText高级查询
  • 10.10 GPText分区表查询
  • 10.11 GPText对自然语言处理的支持
  • 10.12 GPText定制化索引
  • 10.13 GPText管理工具
  • 10.14 GPText用于文本挖掘和分析
  • 10.15 小结
  • 第11章 地理空间数据分析和处理
  • 11.1 概述
  • 11.2 Greenplum PostGIS
  • 11.3 Greenplum PostGIS应用实例
  • 11.4 小结
  • 第12章 Greenplum数据库与图计算
  • 12.1 图的概念
  • 12.2 图的应用
  • 12.3 图数据的处理
  • 12.4 Greenplum对图数据的支持
  • 12.5 MADlib中的图结构和算法
  • 12.6 小结
  • 第四部分 Greenplum的运维和迁移
  • 第13章 Greenplum的监控和管理
  • 13.1 监控Greenplum集群的状态
  • 13.2 管理Greenplum集群
  • 13.3 Greenplum指令中心(GPCC)
  • 13.4 小结
  • 第14章 Greenplum数据库的备份、恢复和迁移
  • 14.1 非并行数据库备份
  • 14.2 非并行数据库恢复
  • 14.3 并行数据库备份
  • 14.4 并行数据库恢复
  • 14.5 高效的并行数据库备份和恢复工具gpbackup/gprestore
  • 14.6 新一代Greenplum数据迁移工具GPCOPY
  • 14.7 小结
  • 第15章 从Oracle迁移到Greenplum
  • 15.1 概述
  • 15.2 Oracle与Greenplum的架构对比
  • 15.3 从Oracle迁移到Greenplum的流程
  • 15.4 小结
  • 第16章 从Teradata迁移到Greenplum
  • 16.1 Teradata产品和用户面临的问题
  • 16.2 从Teradata迁移到Greenplum的可行性
  • 16.3 如何从Teradata迁移到Greenplum
  • 16.4 特殊场景
  • 16.5 小结
  • 附录A Greenplum社区
  • A.1 Greenplum的社区资源
  • A.2 向Greenplum贡献代码
  • A.2.1 Greenplum代码库
  • A.2.2 向Greenplum贡献代码有什么好处
  • A.2.3 如何向Greenplum提交代码
  • A.2.4 如何编译Greenplum代码
  • A.2.5 如何运行测试
  • A.2.6 从哪里开始
  • A.2.7 为何签署CLA协议
  • 附录B 外部表实例
  • B.1 演示环境
  • B.2 GPFDIST实战
  • B.3 可执行外部表实战
  • B.4 S3使用实战
  • 附录C Greenplum的SSL证书
  • C.1 准备工作
  • C.2 创建证书
  • 术语表
展开全部

评分及书评

尚无评分
目前还没人评分
  • 加载中...

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。