展开全部

主编推荐语

一线开发者多年实战经验的结晶,全方位介绍Prometheus的原理架构及应用场景。

内容简介

本书主要分三部分:第一部分是概述,重点阐述云计算时代监控系统的特点及其面临的挑战,Prometheus监控的基本概念、组成、部署。第二部分是Prometheus技术基础,重点介绍Prometheus生态系统涉及的Exporter、服务发现、PromQL数据查询、告警处理、Grafana可视化、Pushgateway等监控组件,详细讲解各组件的相关概念、实现原理、具体使用等。第三部分是监控综合实践,从常用的监控需求出发,讲解OpenStack云计算监控、Docker容器监控、Kubernetes监控、微服务及业务监控、日志监控的设计与实现,最后讲解Prometheus在生产环境中部署的实践。

目录

  • 版权信息
  • 前言
  • 第一部分 概述
  • 第1章 云计算时代的监控系统
  • 1.1 云计算时代的应用系统
  • 1.2 云计算监控的目标和挑战
  • 1.3 云计算监控的范围和架构
  • 1.4 百花齐放的开源监控软件工具
  • 1.5 Prometheus监控系统
  • 1.6 本章小结
  • 第2章 Prometheus基本概念及部署
  • 2.1 Prometheus架构
  • 2.2 Prometheus快速部署
  • 2.3 Prometheus相关概念
  • 2.4 Prometheus核心组件
  • 2.5 本章小结
  • 第二部分 Prometheus技术基础
  • 第3章 Exporter
  • 3.1 概述
  • 3.2 主机监控
  • 3.3 数据库监控
  • 3.4 Nginx监控
  • 3.5 Prometheus之黑盒监控
  • 3.6 本章小结
  • 第4章 服务发现
  • 4.1 基于文件的服务发现
  • 4.2 基于Consul的服务发现
  • 4.3 基于DNS的服务发现
  • 4.4 Relabelling
  • 4.5 本章小结
  • 第5章 PromQL
  • 5.1 时序数据库
  • 5.2 PromQL简介
  • 5.3 PromQL聚合操作
  • 5.4 PromQL运算符
  • 5.5 PromQL函数
  • 5.6 PromQL查询分析
  • 5.7 本章小结
  • 第6章 告警处理
  • 6.1 概述
  • 6.2 Alertmanager部署
  • 6.3 Alertmanager配置
  • 6.4 Prometheus告警规则
  • 6.5 告警接收器
  • 6.6 告警临时静默
  • 6.7 本章小结
  • 第7章 可视化
  • 7.1 概述
  • 7.2 Grafana安装
  • 7.3 Grafana基本概念
  • 7.4 Prometheus数据源
  • 7.5 仪表盘导入
  • 7.6 定制监控图表
  • 7.7 本章小结
  • 第8章 Pushgateway
  • 8.1 概述
  • 8.2 Pushgateway集成
  • 8.3 Pushgateway数据管理
  • 8.4 本章小结
  • 第三部分 监控综合实践
  • 第9章 OpenStack云计算监控
  • 9.1 OpenStack监控架构
  • 9.2 OpenStack Exporter
  • 9.3 OpenStack Helm监控
  • 9.4 本章小结
  • 第10章 Docker容器监控
  • 10.1 Docker容器架构与监控
  • 10.2 部署cAdvisor容器监控
  • 10.3 本章小结
  • 第11章 Kubernetes监控
  • 11.1 Prometheus与Kubernetes完美结合
  • 11.2 在Kubernetes上部署Prometheus的传统方式
  • 11.3 通过Operator方式部署Prometheus
  • 11.4 服务配置
  • 11.5 监控对象
  • 11.6 数据展现
  • 11.7 告警
  • 11.8 本章小结
  • 第12章 微服务及业务监控
  • 12.1 微服务监控
  • 12.2 构建Spring Boot微服务监控
  • 12.3 业务监控与运营指标
  • 12.4 在Spring Boot自定义Metrics
  • 12.5 本章小结
  • 第13章 日志监控的设计与实现
  • 13.1 概述
  • 13.2 mtail日志监控
  • 13.3 Fluentd日志监控
  • 13.4 grok_exporter日志监控
  • 13.5 本章小结
  • 第14章 Prometheus监控系统生产部署
  • 14.1 最佳实践原则
  • 14.2 数据存储
  • 14.3 构建联邦集群系统
  • 14.4 Thanos集群解决方案
  • 14.5 Alertmanager高可用
  • 14.6 Prometheus自动化部署
  • 14.7 在监控中实现异常检测
  • 14.8 本章小结
展开全部

评分及书评

评分不足
2个评分
  • 用户头像
    给这本书评了
    3.0

    可以作为入门和了解,以及一些配置查询。前半部分的基本介绍可以给初学者入门;后半部分大段配置文件,但没有展开解释,仅适合有类似生产经验的工程师参考。对于新手入门来说,总体上比啃官网要理解的更快。

      转发
      评论

    出版方

    机械工业出版社有限公司

    机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。