一、巡检到底看什么?
一句话总结:“资源、接口、日志、环境、配置、会话” 六大类,全部正常才算过关。
一图速查:常用命令对照表
巡检维度 |
华为命令 |
华三命令 |
备注(看到什么算异常) |
---|---|---|---|
设备版本/启动时间 |
display version |
|
版本不一致、启动时间异常重启需排查 |
CPU/内存 |
display cpu-usage |
display cpu-usage |
CPU>80%、内存>85%需持续关注 |
接口状态 |
display interface brief |
display interface brief |
端口down、error-packet 持续增长 |
日志/告警 |
display logbuffer |
display logbuffer |
大量error/down/up 日志 |
路由表 |
display ip routing-table |
display ip routing-table |
关键路由缺失、下一跳不可达 |
ARP/MAC |
display arp / display mac-address |
display arp / display mac-addressMAC |
漂移、ARP 冲突 |
温度/电源/风扇 |
display environment |
display environment |
温度>55℃、风扇/电源状态为 Absent/Failed |
当前配置备份 |
display current-configuration |
display current-configuration |
任何未经评审的新增配置 |
会话/连接数 |
display session statistics |
display session statistics |
会话数激增、大量半开连接 |
二、实战5 步法(每天 10 分钟)
1.登录设备
sshadmin@10.10.10.1
2.先跑三板斧
displayversion
displaycpu-usage
displayinterface brief
30 秒内判断版本、资源、端口有没有“爆红”。
3.再扫日志
display logbuffer |includeERROR|DOWN|FAIL
把关键字段高亮,异常一目了然。
4.环境体检
displayenvironment
夏天尤其要看温度,风扇坏了分分钟宕机。
5.配置备份
savesafely
# 或者
backup configuration to10.10.10.100
养成“改动必备份”的习惯,回滚只需 10 秒。
三、高频坑位提醒
-
CRC/Input Errors 持续增长
多半是光模块或双绞线老化,别只盯带宽。
-
MAC 地址漂移告警
环路或私接交换机,先shutdown 端口再排查。
-
BGP/OSPF 邻居突然 Down
先看链路MTU、再看 CPU 是否被打爆。
四、巡检注意事项
-
定期巡检建议保存配置:使用save 或 copy running-config startup-config 保存配置。
-
记录历史数据对比:CPU、内存、连接数等指标应形成趋势图。
-
关注错误计数:如CRC 错误、接口 down/up 记录。
-
结合网管系统:可配合Zabbix、eSight、iMC 等平台自动化巡检。
发表回复