运维员工离职交接清单

本文最后更新于:2025年4月30日 中午

概述

这里以负责 Zabbix 的员工离职为例。实际上这是通用的,你可以将 Zabbix 替换为任何业务系统,任何运维工具,任何其他场景。

为确保 Zabbix 监控系统平稳过渡,以下是离职员工必须移交的核心工作和资料清单,按优先级分类呈现:

一、基础访问权限移交

  1. 账户清单
    • Zabbix Web 控制台管理员账号
    • 被监控服务器的 SNMP/Agent 账号
    • 数据库(如 MySQL/PostgreSQL)读写权限
    • 关联的 LDAP/AD 集成账号(如有)
  2. SSH / 远程访问权限
    • Zabbix 服务器 / Proxy 的 SSH 密钥或密码
    • 跳板机 / VPN 访问权限(如适用)

二、系统配置文档

  1. 架构拓扑图
    • 标注 Zabbix Server/Proxy/Agent 分布
    • 网络流量走向和关键监控节点
  2. 配置文件备份
    • zabbix_server.conf zabbix_proxy.conf 关键参数说明
    • 自定义脚本路径(如 AlertScripts/ExternalScripts)
  3. 监控模板
    • 导出的 XML 模板文件(主机模板、应用集、监控项)
    • 第三方模板来源(如 GitHub/Gitee 链接)

三、关键运维流程

  1. 日常任务清单
    • 监控项阈值调整频率(如磁盘空间、CPU 告警)
    • 定期维护窗口(如数据库 Housekeeper 清理)
  2. 告警处理 SOP
    • 告警分级规则(如 P0-P3)
    • 通知渠道(邮件 / 短信 / 钉钉 / 企业微信配置)
    • 静默规则(如维护期屏蔽告警)
  3. 灾备恢复指南
    • Zabbix 数据库备份命令与周期
    • 快速重建 Zabbix Server 的 Ansible/Shell 脚本

四、数据与集成

  1. 历史数据
    • 数据库大小及保留策略(如趋势数据 30 天、历史数据 7 天)
    • Grafana 集成配置(如数据源 ID、仪表盘 JSON)
  2. API 与自动化
    • 常用 API 调用示例(如批量添加主机)
    • 自动化工具(如 Python 脚本、Zabbix CLI 命令)

五、验证与交接清单

  1. 测试用例
    • 模拟触发一条告警,验证通知链路
    • 手动添加一台测试主机,确认自动发现规则生效
  2. 联系人清单
    • 依赖 Zabbix 数据的团队接口人(如运维 / 开发 / 业务部门)
    • 供应商支持联系方式(如 Zabbix 原厂 / 云服务商)

交接时限建议

  • 至少预留 2 周重叠期
    第 1 周:文档审核 + 权限转移
    第 2 周:实操演练 + 问题修复
  • 至少确保 1 个月交接期

通过以上步骤,可最大限度降低交接风险。若时间紧迫,优先确保权限、配置文件、告警流程三项移交。


运维员工离职交接清单
https://ewhisper.cn/posts/7300/
作者
东风微鸣
发布于
2025年4月30日
许可协议