计算机
类型
可以朗读
语音朗读
166千字
字数
2023-06-01
发行日期
展开全部
主编推荐语
从理论出发,以实战落脚,包括SRE事前治理、故障应急、可观测性、架构设计等多方面内容。
内容简介
本书从实践出发,包括了作者参与并主导的3家电商互联网公司架构从0到1的构建经历,从多个角度讲解稳定、性能、效率、成本四大职责落地经验,并结合Mikey金字塔进行了部分创新,很多内容都可以直接复用于实际工作。
本书分为7篇,分别是开端篇、监控篇、故障篇、容量篇、全局视角篇、性能篇和扩展篇。本书适合互联网行业内的运维人员、SRE和DevOps工程师、架构师、技术团队负责人及关注用户体验的相关开发者阅读,也适合掌握了一定的SRE方法论但在实践中无从下手的读者阅读。
目录
- 版权信息
- 内容简介
- 专家力荐
- 序
- 前言
- 开端篇 弱化边界感
- 第1章 引言
- 1.1 运维架构和SRE
- 1.2 理解业务,技术为业务服务
- 1.3 不设边界
- 1.4 SRE金字塔
- 1.5 总结
- 第2章 重视测试环境和预发布环境
- 2.1 提效和维稳的第一道门槛——测试环境
- 2.2 “守门员”——预发布环境
- 2.3 两大环境问题根本原因溯源
- 2.4 微拍堂测试环境治理思路介绍
- 2.5 总结
- 监控篇 底层逻辑的艺术
- 第3章 浅谈监控系统设计
- 3.1 梳理监控体系
- 3.2 梳理监控指标
- 3.3 变更监控
- 3.4 准实时系统监控
- 3.5 短时进程追踪工具
- 3.6 全链路监控
- 3.7 商业监控平台的选用建议
- 3.8 监控方式:白盒监控与黑盒监控
- 3.9 从监控数据中总结规律
- 3.10 黄金指标
- 3.11 总结
- 第4章 云原生可观测性开源工具
- 4.1 行业现状
- 4.2 Kindling解决方案——关联内核可观测性数据的Trace
- 4.3 Kindling探针的架构设计理念
- 4.4 Kindling探针架构
- 4.5 在线Demo介绍
- 4.6 案例分享
- 4.7 总结
- 第5章 高阶实战
- 5.1 案例:动态观测SQL质量流程设计
- 5.2 案例:WebP格式图片的规范和落地实践
- 5.3 案例:管道通信规范化实践
- 5.4 标准和规范治理平台
- 5.5 总结
- 第6章 挖掘Nginx的监控价值
- 6.1 URI指纹服务设计
- 6.2 Nginx日志分析指南
- 6.3 总结
- 故障篇 故障的生命周期
- 第7章 事前治理的方法论
- 7.1 从故障中总结经验
- 7.2 从系统资源层面和日志中巡检异常
- 7.3 从标准和规范中寻找闭环之路
- 7.4 从业务中挖掘基础服务的使用问题
- 7.5 技术风险防控运营成本
- 7.6 总结
- 第8章 变更管控设计思路
- 8.1 变更管控
- 8.2 JumpServer使用的艺术及工单交互
- 8.3 变更三板斧:运维团队的可监控、可灰度、可回滚实践
- 8.4 总结
- 第9章 轮值的设计思路
- 9.1 值班模式探究
- 9.2 值班机器人
- 9.3 提升值班价值——SRE需求池设计
- 9.4 总结
- 第10章 故障演练与应急预案
- 10.1 故障演练缘由
- 10.2 故障演练流程
- 10.3 应急预案
- 10.4 总结
- 第11章 应急响应流程实践
- 11.1 收拢故障上报来源
- 11.2 建立应急小组
- 11.3 故障噪点治理
- 11.4 控制应急节奏
- 11.5 应急“止血”的常见操作
- 11.6 总结
- 第12章 静态容灾降级系统
- 12.1 荆棘之路
- 12.2 设计之路
- 12.3 架构流程图
- 12.4 核心代码解说
- 12.5 静态容灾的智能关闭方案
- 12.6 替换爬虫的新思路
- 12.7 总结
- 第13章 基于OpenResty的动态限流设计思路
- 13.1 常见反向代理限流方案缺点分析
- 13.2 动态限流设计思路
- 13.3 多维度限流
- 13.4 智能感知响应能力动态控速设计方案
- 13.5 屏蔽慢请求带来的服务阻塞
- 13.6 总结
- 第14章 故障复盘
- 14.1 复盘前
- 14.2 复盘中
- 14.3 复盘后
- 14.4 自省
- 14.5 跨部门分享
- 14.6 故障库
- 14.7 总结
- 容量篇 性能与成本间的平衡
- 第15章 成本优化
- 15.1 成本优化事前准备
- 15.2 公有云基础资源优化实践
- 15.3 总结
- 第16章 智能伸缩平台
- 16.1 弹性伸缩平台关键路径盘点
- 16.2 基础设施建设
- 16.3 基于业务场景的实战
- 16.4 风险控制体系
- 16.5 总结
- 第17章 容量规划
- 17.1 容量规划现状
- 17.2 容量规划建设思路
- 17.3 应用系统容量规划说明
- 17.4 基于巡检模式的容量评估流程
- 17.5 对容量规划关注点的梳理
- 17.6 总结
- 第18章 编程能力
- 18.1 养成写伪代码的习惯
- 18.2 养成管理代码的习惯
- 18.3 编程能力分级
- 18.4 编程能力更深层的价值探讨
- 18.5 熟悉编程语言特性
- 18.6 通过系统分析倒推应用配置问题
- 18.7 总结
- 全局视角篇 运维破圈
- 第19章 开启测试视角
- 19.1 测试人员的职责边界
- 19.2 压力测试
- 19.3 自动化测试监控平台设计
- 19.4 破坏性测试探究
- 19.5 从前端的体验“找碴儿”
- 19.6 总结
- 第20章 开启用户视角
- 20.1 内外兼顾
- 20.2 建立反馈机制
- 20.3 产品体验——谷歌SRE的高阶思维
- 20.4 防御体系的“误伤”指南
- 20.5 关注客户端环境
- 20.6 总结
- 第21章 开启前端和App开发人员视角
- 21.1 概述
- 21.2 为什么要解决性能问题
- 21.3 缓存
- 21.4 网络请求
- 21.5 客户端计算
- 21.6 预加载
- 21.7 梳理技术风险
- 21.8 总结
- 第22章 DNS应用场景实践
- 22.1 利用DNS完成故障转移
- 22.2 使用HTTPDNS提升访问稳定性
- 22.3 提升测试、A/B测试等环境的切换效率
- 22.4 域名反向解析用途实践
- 22.5 内部DNS系统高可用实践
- 22.6 总结
- 性能篇 SRE进阶之路
- 第23章 高并发网关价值探究
- 23.1 通用功能介绍
- 23.2 网关中的聚合模式
- 23.3 兼顾缓存的网关设计思路
- 23.4 总结
- 第24章 高性能Varnish缓存系统
- 24.1 HTTP缓存对后端服务的价值分析
- 24.2 CDN缓存和Varnish缓存的共存模式
- 24.3 安装Varnish和所需模块
- 24.4 配置文件概览
- 24.5 稳定性建设所依赖的功能
- 24.6 最佳实践
- 24.7 总结
- 第25章 SRE漏斗优化法则
- 25.1 SRE性能优化之漏斗优化法则
- 25.2 漏斗优化法则的技术栈梳理
- 25.3 总结
- 第26章 awesome性能分析工具
- 26.1 站在巨人的肩膀上工作
- 26.2 Netdata
- 26.3 总结
- 第27章 性能优化实践锦集
- 27.1 TIME_WAIT优化方案扩展
- 27.2 利用Ngx_Lua缩短请求链路
- 27.3 eBPF在Kubernetes上的应用
- 27.4 善用CDN
- 27.5 记一次中台服务优化实战
- 27.6 总结
- 扩展篇 在团队间搭建桥梁
- 第28章 业务开发人员视角下的技术风险
- 28.1 了解业务开发人员
- 28.2 大淘客之旅
- 28.3 总结
- 第29章 SRE视角全篇总结
- 29.1 齐心协力
- 29.2 竞品分析——最后1公里
- 29.3 故障降级系统——来自监控的沟通艺术
- 29.4 重识CMDB价值
- 29.5 总结
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。