Checks wie Disk oder ShelfBay zeigen auch wenn alles OK ist eine – je nach Ausbaustufe des Filers – lange bis sehr lange Liste an Instanzen in der Ausgabe an. Das wirkt zunächst einmal unübersichtlich lässt sich aber je nach Anforderung gestalten.

Sehen wir uns das an Hand eines sehr übersichtlichen Simulators einmal an. Die Ausgangslage ist diese hier:


$ ./check_netapp_pro.pl Disk -H sim812
NETAPP_PRO DISK CRITICAL - 14 disks checked, 1 critical and 0 warning
No SVC-ACK relevant changes in reason.
sim812 v5.16: not failed
sim812 v5.17: not failed
sim812 v5.18: not failed
sim812 v5.19: not failed
sim812 v5.21: not failed
sim812 v5.22: not failed
sim812 v5.24: not failed
sim812 v5.25: not failed
sim812 v5.26: not failed
sim812 v5.27: not failed
sim812 v5.28: not failed
sim812 v5.29: not failed
sim812 v5.32: not failed
sim812 v5.20: admin failed (CRITICAL)

Was mir hier nicht besonders gefällt, ist dass die kritische Instanz am Ende steht. Das lässt sich ändern wie folgt:


$ ./check_netapp_pro.pl Disk -H sim812 ‑‑sort_criterion=exit ‑‑sort_order=descending
NETAPP_PRO DISK CRITICAL - 14 disks checked, 1 critical and 0 warning
No SVC-ACK relevant changes in reason.
sim812 v5.20: admin failed (CRITICAL)
sim812 v5.16: not failed
sim812 v5.17: not failed
sim812 v5.18: not failed
sim812 v5.19: not failed
sim812 v5.21: not failed
sim812 v5.22: not failed
sim812 v5.24: not failed
sim812 v5.25: not failed
sim812 v5.26: not failed
sim812 v5.27: not failed
sim812 v5.28: not failed
sim812 v5.29: not failed
sim812 v5.32: not failed

Problembär senden

Wie kommen wir zu einer Alarmmeldung die kurz genug ist um per SMS versendet zu werden und dennoch auflistet, welche der Instanzen gerade Probleme macht? Also eine Meldung die in etwa so aussieht:


NETAPP_PRO DISK CRITICAL - 14 disks checked, 1 critical and 0 warning, sim812 v5.20: admin failed (CRITICAL)

Ich denke hierbei an einen Fileradmin der Alarmmeldungen auf seinem Mobiltelefon per SMS bekommt. Näheren wir uns der oben skizzierten Alarmmeldung Schritt für Schritt an:

Schritt 1:

Die gesamte Wurscht an CRITICAL und OK Instanzen hilft ihm nicht dabei, die Übersicht zu behalten. Daher werden die Notifications im Monitoringsystem oft so konfiguriert, dass nur der SERVICEOUTPUT per SMS versendet wird. Das wäre die erste Zeile, also alles bis zum ersten Newline. Im konkreten Beispiel also:

NETAPP_PRO DISK CRITICAL - 14 disks checked, 1 critical and 0 warning

Das ist schön kurz und knapp und nach einem Blick ins GUI weiss er genau was los ist.

Schritt 2:

Für jene, die sich den Blick ins GUI sparen wollen, kann man (ab dem stable Release 3.1.0) den Parameter --show_problems setzen, der die erste Zeile verändert wie folgt:

NETAPP_PRO DISK CRITICAL - 14 disks checked, 1 critical and 0 warning, sim812 v5.20: admin failed (CRITICAL)

Schritt 3:

Und wem die Anzeige des Status zu viel ist, kann dies mit ‑‑show_status=none ausblenden. Dann wird diese Nachricht noch kürzer:

NETAPP_PRO DISK CRITICAL - 14 disks checked, 1 critical and 0 warning, sim812 v5.20: admin failed

Nummerische Werte

Bei numerischen Werten greift ‑‑show_problems auf den Schalter ‑‑factor zurück, mit dem man den SI Faktor für die Schwellwerte und Anzeige einstellen kann, also ob man in Kilo-, Mega- oder Terabyte prüfen will. Auch das trägt zur übersichtlichen Darstellung bei:


$ ./check_netapp_pro.pl Usage ‑o volume ‑s vfiler0 ‑H sim812 ‑‑show_problems ‑‑show_status=none ‑‑factor=Gi ‑w 10 ‑c 20
NETAPP_PRO USAGE WARNING - 2 volumes checked, 0 critical and 1 warning, lun1: 15.2GiB

Zu lang für SMS?

Sollte die erste Zeile die Länge von 140 Zeichen überschreiten, wird sie abgeschnitten und diese durch das Anhängen der Zeichenfolge [...] gekennzeichnet. Diese Maximallänge ist im Skript check_netapp_pro.pl über den Parameter max_length_single_line einstellbar.

Grundlagenwissen

Der Artikel Grundlagen zur Steuerung der Textausgabe erklärt einige Begriffe und Grundlegendes zu diesem Thema.