展开全部

主编推荐语

本书以提纲挈领式的全面讲解,呈现了基础运维工作的内容,并将各个要点有机串连起来,深入浅出地贡献给读者。

内容简介

本书涵盖了数据中心规划、基础服务、系统运维等多个方面。作者以十多年的经验告诉各位读者,弯路一定是会走的,但是如何能够尽早避免,并通过行之有效的方法进行解决,才是运维管理的王道。虽然IT界一直在不停地变化,但是运维的核心精神并没有变。本书就是作者多年的运维经验的积累和沉淀,总结出一套颇具心得的IT基础架构管理法。

目录

  • 版权信息
  • 本书赞誉
  • 前言
  • 第1章 混沌初开
  • 1.1 我眼中的基础架构
  • 1.2 写一本怎样的书
  • 1.2.1 英文书的伤痛
  • 1.2.2 有话直说——这就是我的忍道
  • 1.2.3 当行家说人话
  • 1.3 本书声明
  • 第2章 如何选择优质的数据中心
  • 2.1 概述
  • 2.2 空间环境评估
  • 2.2.1 地质环境
  • 2.2.2 空间结构
  • 2.3 基础设施评估
  • 2.3.1 电气系统
  • 2.3.2 空调系统
  • 2.3.3 消防系统
  • 2.3.4 弱电与综合布线系统
  • 2.4 网络建设评估
  • 2.5 服务保障评估
  • 2.6 本章小结
  • 第3章 数据中心的规划设计工作
  • 3.1 需求的不确定性
  • 3.2 如何避免变化打乱规划
  • 3.2.1 采购资源预留
  • 3.2.2 数据中心机柜区域的规划与布局
  • 3.2.3 规划布局案例
  • 3.3 规划设计心得
  • 3.4 本章小结
  • 第4章 网络规划细节对系统运维的影响
  • 4.1 案例复盘
  • 4.2 事情为什么弄得一团糟
  • 4.3 网络空间资源的规划
  • 4.3.1 PoD容量的计算方法
  • 4.3.2 地址空间的规划
  • 4.3.3 VLAN的规划
  • 4.4 网卡绑定
  • 4.4.1 网卡绑定模式的选择
  • 4.4.2 网卡绑定的实现
  • 4.5 本章小结
  • 第5章 服务器硬件选型
  • 5.1 如何选择合适的硬件配置
  • 5.1.1 选型的总体原则
  • 5.1.2 选型中值得注意的地方
  • 5.2 怎样的一款服务器产品才算是优秀的
  • 5.2.1 带外管理有多重要
  • 5.2.2 异构平台融合能力
  • 5.2.3 完善的信息数据展示
  • 5.2.4 软硬件环境兼容性
  • 5.2.5 用户体验
  • 5.3 产品测试那些事儿
  • 5.3.1 测试前的准备工作
  • 5.3.2 部署系统测试
  • 5.3.3 产品功能性测试
  • 5.3.4 能耗测试
  • 5.3.5 CPU性能测试
  • 5.3.6 内存性能测试
  • 5.3.7 磁盘性能测试
  • 5.3.8 网络性能测试
  • 5.3.9 测试后的收尾工作
  • 5.4 本章小结
  • 第6章 构建CMDB与Workflow
  • 6.1 谁拖了运维的后腿
  • 6.2 定海神针CMDB
  • 6.2.1 CMDB是一切运维的基石
  • 6.2.2 是什么毁了CMDB
  • 6.2.3 如何定义你的需求
  • 6.2.4 如何定义表结构
  • 6.2.5 设计思想原则
  • 6.3 多面娇娃Workflow
  • 6.3.1 一份周报中竟然80%的工作量都是在沟通
  • 6.3.2 Workflow能干什么
  • 6.3.3 Workflow是实例化的规范
  • 6.3.4 Workflow是领航员
  • 6.3.5 Workflow设计中的常见问题
  • 6.4 本章小结
  • 第7章 构建IaaS平台系统
  • 7.1 高效交付解决方案如何选型
  • 7.2 服务器设置详解
  • 7.2.1 IPMI
  • 7.2.2 racadmin
  • 7.2.3 SMASH CLP
  • 7.3 Cobbler部署系统详解
  • 7.3.1 理解Cobbler架构
  • 7.3.2 Cobbler的安装配置
  • 7.3.3 命名规范
  • 7.3.4 创建资源目录
  • 7.3.5 创建Cobbler部署模板与实例
  • 7.3.6 Cobbler里面出现的坑
  • 7.4 IaaS系统的设计要点
  • 7.4.1 交付工作流程定义
  • 7.4.2 Portal模块与各组件之间的调用关系
  • 7.5 制作KVM虚拟机模板
  • 7.5.1 虚拟机网络环境部署
  • 7.5.2 创建虚拟机镜像模板
  • 7.5.3 虚拟机克隆
  • 7.5.4 虚拟机设备调整
  • 7.5.5 VPC的支持
  • 7.6 本章小结
  • 第8章 构建域名解析服务
  • 8.1 写在前面的话
  • 8.2 首先做好一个传统的DNS管理员
  • 8.3 Anycast DNS在多数据中心中的应用
  • 8.3.1 什么是Anycast
  • 8.3.2 如何构建DNS over Anycast
  • 8.3.3 如何实施Anycast DNS
  • 8.3.4 如何守护quagga进程
  • 8.3.5 BGP在Anycast中的应用
  • 8.4 HTTP DNS
  • 8.4.1 传统DNS的缺陷
  • 8.4.2 HTTP DNS的优势
  • 8.4.3 HTTP DNS长什么样
  • 8.4.4 HTTP DNS会取代传统的DNS吗
  • 8.5 本章小结
  • 第9章 时间同步系统
  • 9.1 概述
  • 9.1.1 如何实现时间同步
  • 9.1.2 GPS卫星系统授时原理
  • 9.1.3 PTP
  • 9.1.4 为何要选用硬件时间源服务器
  • 9.1.5 如何选择硬件时间源服务器
  • 9.2 ntpd
  • 9.2.1 ntpd初始化
  • 9.2.2 ntpd配置文件
  • 9.2.3 使用ntpq查询时间同步的状态
  • 9.3 chronyd
  • 9.3.1 chronyd的优势
  • 9.3.2 chronyd配置文件
  • 9.3.3 使用key限制客户端访问
  • 9.3.4 跟踪时间同步过程
  • 9.3.5 检查时间同步状态
  • 9.4 如何处理闰秒
  • 9.4.1 闰秒是什么
  • 9.4.2 闰秒的危害
  • 9.4.3 前辈们是怎么解决闰秒的
  • 9.4.4 晦涩难懂的术语
  • 9.4.5 怎么解决闰秒问题
  • 9.5 本章小结
  • 第10章 配置管理
  • 10.1 本章目的
  • 10.2 expect与Parallel SSH
  • 10.2.1 expect
  • 10.2.2 Parallel SSH
  • 10.2.3 SSH的通病
  • 10.3 Ansible
  • 10.3.1 创建Host Inventory
  • 10.3.2 如何自动添加节点
  • 10.3.3 组织主机节点
  • 10.3.4 Ad-Hoc
  • 10.3.5 Playbook
  • 10.3.6 关于优化
  • 10.4 Puppet
  • 10.4.1 Puppet快跑
  • 10.4.2 初探Puppet
  • 10.4.3 使用Apache+Passenger替换WEBRick
  • 10.4.4 Mutil-Master&Mutil-CAServer
  • 10.4.5 排障
  • 10.5 SaltStack
  • 10.5.1 配置Minion
  • 10.5.2 管理Salt Key
  • 10.5.3 组织主机节点
  • 10.5.4 模块的调用
  • 10.5.5 Mutil-Masters
  • 10.5.6 级联
  • 10.5.7 SLS
  • 10.5.8 Grain
  • 10.5.9 Pillar
  • 10.5.10 排障
  • 10.6 我们真的能抗住海量节点吗
  • 10.6.1 集合编队
  • 10.6.2 汇报战况
  • 10.6.3 不必过度依赖模块
  • 10.7 解决方案的选择
  • 10.8 本章小结
  • 第11章 文件共享服务
  • 11.1 构建WebDAV服务
  • 11.1.1 基本构建
  • 11.1.2 WebDAV on HTTPS
  • 11.2 构建NFS服务
  • 11.2.1 NFS v4的新特性
  • 11.2.2 NFS常见问题处理
  • 11.2.3 NFS高可用方案
  • 11.2.4 NFS Cluster实施条件
  • 11.2.5 NFS Cluster的实施
  • 11.2.6 NFS Cluster故障排错
  • 11.3 构建SFTP服务
  • 11.3.1 Chroot SFTP和公钥访问的必要性
  • 11.3.2 构建Chroot SFTP
  • 11.3.3 SFTP容灾方案
  • 11.4 本章小结
  • 第12章 硬件故障告警与维修
  • 12.1 硬件故障的特点
  • 12.2 硬件故障告警
  • 12.2.1 告警方式
  • 12.2.2 事件类型和告警级别
  • 12.3 硬件故障分析
  • 12.3.1 常用分析手段
  • 12.3.2 常见故障错误分析
  • 12.4 传统维修的问题
  • 12.5 报修系统的需求定义
  • 12.5.1 故障申报环节的设计需求
  • 12.5.2 审批通告环节的设计需求
  • 12.5.3 提交报修环节的设计需求
  • 12.5.4 设备维修环节的设计需求
  • 12.5.5 数据查询统计的设计需求
  • 12.6 本章小结
  • 第13章 主机系统信息安全基础
  • 13.1 系统安全加固的基本要求
  • 13.2 关于安全配置的反思
  • 13.2.1 慎用账户锁定
  • 13.2.2 密码的烦恼
  • 13.2.3 sudo的意义
  • 13.3 sudo over LDAP的实现
  • 13.3.1 服务端配置
  • 13.3.2 客户端配置
  • 13.3.3 关于LDAP超时和连接数限制的问题
  • 13.4 密码学与数字证书
  • 13.4.1 密码学技术
  • 13.4.2 数据加密与数字签名
  • 13.4.3 公钥加密体系的安全性论述
  • 13.4.4 数字证书是什么
  • 13.4.5 数字证书是怎么产生的
  • 13.4.6 数字证书是怎么验证的
  • 13.5 人为因素
  • 13.5.1 运维红线
  • 13.5.2 安全操作
  • 13.5.3 运维工作中的常见问题
  • 13.6 本章小结
  • 第14章 性能校准
  • 14.1 队列理论
  • 14.2 CPU
  • 14.2.1 来自内核态的资源消耗
  • 14.2.2 用户态资源占用率高
  • 14.2.3 Cache与内存的三种映射关系
  • 14.2.4 CPU调度算法
  • 14.2.5 进程运行在哪个核心上
  • 14.2.6 strace的妙用
  • 14.3 内存
  • 14.3.1 NUMA
  • 14.3.2 Cache和Buffer
  • 14.3.3 虚拟地址空间
  • 14.3.4 大页
  • 14.3.5 内存分配
  • 14.3.6 内存回收
  • 14.3.7 内存超配了怎么办
  • 14.3.8 为什么会产生OOM
  • 14.4 存储
  • 14.4.1 磁盘调度算法
  • 14.4.2 I/O调度算法
  • 14.4.3 日志模式
  • 14.4.4 其他因素
  • 14.5 网络
  • 14.5.1 Jumbo Frames
  • 14.5.2 BDP
  • 14.5.3 qperf
  • 14.5.4 其他
  • 14.6 本章小结
  • 第15章 Shell编程
  • 15.1 参数传递
  • 15.1.1 shift
  • 15.1.2 eval
  • 15.1.3 getopt
  • 15.1.4 函数传参
  • 15.1.5 返回值
  • 15.2 文本处理三剑客
  • 15.2.1 grep
  • 15.2.2 sed
  • 15.2.3 awk
  • 15.3 字符处理
  • 15.3.1 字符的转义
  • 15.3.2 字符串截取
  • 15.4 数组
  • 15.5 算来算去
  • 15.5.1 比较
  • 15.5.2 字符串计算
  • 15.5.3 精度与长度
  • 15.5.4 进制转换
  • 15.6 表面文章
  • 15.7 典型案例
  • 15.8 本章小结
  • 第16章 修行之路
  • 16.1 系统工程师的自我修养
  • 16.1.1 工程师与管理员
  • 16.1.2 系统工程师的三颗心
  • 16.1.3 匠人精神
  • 16.2 未来时代
  • 16.2.1 前方高能——出现怪兽AlphaGo
  • 16.2.2 从现在开始就要改变自己
  • 16.2.3 开启你的管理模式
  • 16.3 写在最后的话
展开全部

评分及书评

评分不足
1个评分
  • 用户头像
    给这本书评了
    5.0

    从数据中心水电到网络,从服务器硬件到运维自动化,十八般武艺,既要求知识深度和广度,又事无巨细。本书以提纲挈领式的全面讲解,呈现了基础运维工作的内容,并将各个要点有机串连起来,深入浅出地贡献给读者,既可以作为基础运维工作的入门书籍,又可以作为日常运维工作的参考比照。

      转发
      评论

    出版方

    机械工业出版社有限公司

    机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。