Hardware ist nicht mein Ding. Daher lasse ich vieles machen oder mach mir das Leben einfach. So sind die Platten in meinem Server in Einschüben montiert. Damit kann ich diese ganz einfach austauschen, wenn mal eine kaputt geht. Nachdem der Server und damit die Einschübe schon ziemlich lange laufen sind mittlerweile die Lüfter ordentlich laut. Daher habe ich mich erst kürzlich gefragt, ob das ganze noch ausreichend gekühlt wird. Also nicht lange fragen, lieber überwachen. Die Temperatur der Platten lassen sich ganz einfach mit hddtemp überwachen. Fehlt also nur noch der Nagios Teil.
Um Fehler beim Abfragen zu vermeiden schreibe ich seit längerem schon keine Plugins mehr von Hand, wenn es sich irgendwie vermeiden lässt. Nachdem ich schon einiges bei meinem Server per SNMP abfrage habe ich die ganze Geschichte dort auch gleich so implementiert. Also folgende Zeilen in /etc/snmp/snmpd.conf ergänzen
exec hddtemp_sda /usr/sbin/hddtemp -n /dev/sda
exec hddtemp_sda /usr/sbin/hddtemp -n /dev/sdb
Danach den snmpd Daemon neu starten. Fertig. Schon liefert der Server die entsprechenden Werte per SNMP. Jetzt fehlt nur noch Nagios. Für snmp habe ich das Standard Command:
define command{
command_name check_snmp
command_line $USER1$/check_snmp -H $HOSTADDRESS$ $ARG1$
}
Daher sieht die Servicedefinition für die beiden Platten wie folgt aus:
define service {
use generic-service
host_name prv-maincan
service_description snmp hddtemp sda
check_command check_snmp!-w 40 -c 45 -l "Temp sda" -o .1.3.6.1.4.1.2021.8.1.101.1 -u C
}
define service {
use generic-service
host_name prv-maincan
service_description snmp hddtemp sdb
check_command check_snmp!-w 40 -c 45 -l "Temp sdb" -o .1.3.6.1.4.1.2021.8.1.101.2 -u C
}
Noch kurz Nagios reloaden und fertig. Schon wird die Temperatur überwacht. Nachdem ich für snmp auch ein Standard-Nagiosgrapher Template habe werden die beiden Platten auch gleich sauber aufgezeichnet.
Sind eigentlich 35C noch normal oder haben meine Platten schon Fieber?
Das ganze schreibe ich mir auf, damit ich noch mehr per snmp mache. Geht viel schneller als immer wieder neue Plugins mit neuen eigenen Fehlern zu schreiben.