Nagios监控系统:告警升级、依赖关系与被动测试详解
1. 告警升级管理
在Nagios监控系统中,当重要组件出现故障,而负责的管理员在规定时间内无法找到解决方案时,Nagios的告警升级功能就发挥作用了。这一功能可以提供多级支持,以应对不同情况。
1.1 短信通知格式
Nagios通过宏$CONTACTPAGER$获取电话号码或别名,由于短信长度不能超过150个字符,所以通知信息会比电子邮件大幅缩写。使用printf格式规范.150来截断文本,确保短信不超过150字符。例如,短信通知格式如下:
PROBLEM elimail[172.17.130.1]/UPS is CRITICAL /2005-03-30 17:00:53/ Connection refused1.2 升级机制原理
Nagios的升级机制不是按时间单位计算,而是根据已发送的消息数量。例如,对于linux01上的Database服务,配置如下:
define service{ host_name linux01 service_description Database notification_period 24x7 notification_interval 120 ... contac