展开全部

主编推荐语

本书采用循序渐进的讲解方式,介绍了如何从零开始构建一个企业级监控平台的相关理论技术和实践方法。

内容简介

作者首先从监控系统总体设计原理出发,逐步介绍企业级监控系统的常用架构、各个组件模块作用、运行模式、监控体系的建设路线、监控信息的合并算法、监控颗粒度设置经验以及如何保障监控系统自身可靠性等内容;

随后自下而上依次对硬件设备、操作系统、虚拟机、常用数据库和中间件、容器和容器编排、系统和应用日志以及应用链路等常见监控领域实施监控的技术原理、常用监控指标以及实现方式等内容作了介绍;

最后对监控系统下阶段发展趋势也即智能监控,以及涉及相关技术原理及常用智能监控功能作了展望及介绍。

通过对本书的系统学习,可以对计算机监控系统的基本原理、设计思想、实现方式等方面有全面而深入的了解。

目录

  • 版权信息
  • 内容简介
  • 推荐序一
  • 推荐序二
  • 推荐序三
  • 前言
  • 第1章 监控系统规划及原理
  • 1.1 IT监控运维管理的发展历程
  • 1.1.1 新兴的中国市场(1985—1994年)
  • 1.1.2 运营商大建设期(1995—2000年)
  • 1.1.3 多元化的监控运维系统(2001—2010年)
  • 1.1.4 面向云和应用(2010年至今)
  • 1.2 监控体系总体规划
  • 1.2.1 IT运营体系的阶段性
  • 1.2.2 监控体系建设的阶段性
  • 1.3 监控系统的分类
  • 1.4 监控系统工作原理
  • 1.5 监控系统运行模式分类
  • 1.5.1 主动/被动监控
  • 1.5.2 有代理/无代理
  • 1.6 监控事件总线
  • 1.6.1 什么是集中监控事件总线
  • 1.6.2 事件总线的市场格局
  • 1.6.3 监控事件总线的功能设计
  • 本章小结
  • 第2章 计算机硬件设备监控
  • 2.1 计算机的分类
  • 2.2 数据中心常见的计算机种类
  • 2.2.1 大型机
  • 2.2.2 小型机、PC服务器
  • 2.2.3 RISC、CISC
  • 2.2.4 刀片机
  • 2.3 计算机硬件设备监控
  • 2.3.1 大型机设备监控
  • 2.3.2 小型机设备监控
  • 2.3.3 PC Server设备监控
  • 2.3.4 刀片机设备监控
  • 本章小结
  • 第3章 虚拟机监控
  • 3.1 虚拟化分类
  • 3.1.1 硬件虚拟化
  • 3.1.2 桌面虚拟化
  • 3.1.3 应用程序虚拟化
  • 3.1.4 网络虚拟化
  • 3.2 ESXi虚拟化监控
  • 3.2.1 ESXi虚拟化概述
  • 3.2.2 ESXi架构图及监控入口
  • 3.2.3 使用Zabbix监控ESXi
  • 3.3 KVM虚拟化监控
  • 3.3.1 KVM虚拟化概述
  • 3.3.2 使用Zabbix监控KVM
  • 本章小结
  • 第4章 操作系统监控
  • 4.1 操作系统的种类
  • 4.1.1 类UNIX系统
  • 4.1.2 Windows系统
  • 4.2 操作系统功能模块
  • 4.3 CPU监控
  • 4.3.1 CPU相关概念
  • 4.3.2 CPU状态
  • 4.4 内存监控
  • 4.4.1 内存相关概念
  • 4.4.2 内存状态
  • 4.5 进程监控
  • 4.5.1 进程相关概念
  • 4.5.2 进程状态监控
  • 4.6 文件属性监控
  • 4.6.1 Windows中的文件属性
  • 4.6.2 类UNIX中的文件属性
  • 4.7 文件系统监控
  • 4.7.1 文件系统概念
  • 4.7.2 文件系统状态
  • 4.8 网络模块监控
  • 4.9 监控系统如何监控操作系统
  • 4.9.1 Windows
  • 4.9.2 Linux
  • 本章小结
  • 第5章 数据库监控
  • 5.1 数据库分类
  • 5.1.1 关系型数据库
  • 5.1.2 非关系型数据库
  • 5.2 数据库状态指标分类
  • 5.3 当前连接数与最大允许连接数
  • 5.3.1 连接数的相关概念
  • 5.3.2 连接数指标实例
  • 5.4 QPS/TPS
  • 5.4.1 QPS/TPS的相关概念
  • 5.4.2 QPS/TPS指标实例
  • 5.5 慢查询
  • 5.5.1 慢查询的相关概念
  • 5.5.2 慢查询指标实例
  • 5.6 磁盘I/O监控
  • 5.6.1 磁盘I/O相关概念
  • 5.6.2 磁盘I/O的获取
  • 5.7 其他针对性指标
  • 5.7.1 Mysql Binlog cache的相关概念
  • 5.7.2 Mysql Binlog cache指标实例
  • 5.7.3 Oracle表空间的概念
  • 5.7.4 Oracle表空间指标实例
  • 5.7.5 Mysql MHA高可用集群的概念
  • 5.7.6 Mysql MHA高可用集群指标
  • 5.7.7 Oracle集群的概念
  • 5.7.8 Oracle集群指标实例
  • 本章小结
  • 第6章 中间件监控
  • 6.1 Nginx监控
  • 6.1.1 Nginx概述
  • 6.1.2 Nginx服务的进程及端口
  • 6.1.3 服务可用性监控
  • 6.1.4 Nginx日志监控
  • 6.1.5 Nginx状态页监控
  • 6.2 Tomcat监控
  • 6.2.1 Tomcat概述
  • 6.2.2 请求吞吐量指标和延迟指标
  • 6.2.3 线程池指标
  • 6.2.4 Errors错误率指标
  • 6.2.5 JVM内存使用情况指标
  • 6.2.6 JVM监控工具
  • 6.3 ActiveMQ监控
  • 6.3.1 ActiveMQ概述
  • 6.3.2 生产者数量监控
  • 6.3.3 消费者数量监控
  • 6.3.4 队列深度监控
  • 6.3.5 ActiveMQ监控实践
  • 本章小结
  • 第7章 Docker容器监控
  • 7.1 Docker容器运行状态
  • 7.2 Docker容器性能指标
  • 7.3 cAdvisor对容器监控
  • 7.3.1 CPU的监控
  • 7.3.2 内存的监控
  • 7.3.3 磁盘的监控
  • 7.3.4 网络的监控
  • 7.4 Docker容器内的应用日志监控
  • 本章小结
  • 第8章 Kubernetes监控
  • 8.1 Kubernetes简介
  • 8.2 Prometheus简介
  • 8.3 Prometheus部署
  • 8.4 Kubernetes集群监控
  • 8.4.1 宿主机监控
  • 8.4.2 容器监控
  • 8.4.3 集群资源监控
  • 8.4.4 API Server监控
  • 8.4.5 应用系统监控
  • 本章小结
  • 第9章 应用监控
  • 9.1 应用性能管理概述
  • 9.2 调用链路跟踪
  • 9.2.1 Span的概念
  • 9.2.2 Trace的概念
  • 9.3 APM系统的设计与实现
  • 9.3.1 APM系统通用架构
  • 9.3.2 Span的创建及SpanContext的传递逻辑
  • 9.3.3 TraceID和SpanID的生成方法
  • 9.3.4 代码注入方法
  • 9.3.5 APM系统性能优化
  • 本章小结
  • 第10章 日志监控
  • 10.1 日志的基本概念
  • 10.2 日志的作用
  • 10.2.1 运维监控
  • 10.2.2 资源管理
  • 10.2.3 入侵检测
  • 10.2.4 取证和审计
  • 10.2.5 挖掘分析
  • 10.3 常见日志类型及格式
  • 10.3.1 W3C Extended Log File格式
  • 10.3.2 Apache access log
  • 10.3.3 Syslog
  • 10.4 日志规范
  • 10.4.1 应用日志打印规范
  • 10.4.2 日志的轮转归档
  • 10.4.3 日志的爆发抑制
  • 10.5 日志监控基本原理
  • 10.5.1 前置式日志监控
  • 10.5.2 集中式日志监控
  • 10.5.3 日志监控的基本过程
  • 10.6 日志监控的常见场景
  • 10.6.1 关键字监控
  • 10.6.2 多节点日志监控
  • 10.6.3 应用系统性能监控
  • 10.6.4 应用系统业务量异常监控
  • 10.6.5 安全监控与异常IP自动封禁
  • 10.7 日志采集与传输
  • 10.7.1 拉式采集(PULL)
  • 10.7.2 推式采集(PUSH)
  • 10.7.3 日志过滤
  • 10.8 日志解析与日志监控策略
  • 10.8.1 日志解析工具
  • 10.8.2 正则表达式
  • 10.8.3 日志监控策略
  • 10.9 常见日志监控系统
  • 10.9.1 基于ELK的日志监控
  • 10.9.2 基于Splunk的日志监控
  • 本章小结
  • 第11章 智能监控
  • 11.1 智能监控概述
  • 11.1.1 Gartner AIOps
  • 11.1.2 NoOps
  • 11.1.3 智能监控实施路径
  • 11.2 监控数据治理
  • 11.2.1 大数据平台选型
  • 11.2.2 大数据平台设计
  • 11.2.3 监控运维数据治理
  • 11.3 监控动态基线
  • 11.3.1 动态阈值设计与计算
  • 11.3.2 基于动态阈值异常检测
  • 11.3.3 监控动态阈值案例
  • 11.4 监控自愈
  • 11.4.1 什么是自愈
  • 11.4.2 自愈的优势
  • 11.4.3 监控自愈模块设计
  • 11.4.4 监控自愈案例分享
  • 本章小结
  • 参考文献
展开全部

评分及书评

评分不足
2个评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。