Netzwerküberwachung mit Nagios

Wer ein Netzwerk betreibt, möchte gerne wissen, ob Server und Router reibungslos arbeiten. Das Monitoring-System Nagios beobachtet beliebige Bestandteile eines Netzwerkes und schlägt Alarm, wenn irgendetwas aus dem Ruder läuft.

In Pocket speichern vorlesen Druckansicht 16 Kommentare lesen
Lesezeit: 32 Min.
Von
  • Götz Rieger
Inhaltsverzeichnis

Ob Hard- oder Software, Ausfälle sind nicht zu vermeiden. Um auf eine Störung frühzeitig reagieren zu können, werden Monitoring-Systeme eingesetzt. Sie überwachen per Netzwerk die Verfügbarkeit von Diensten und informieren den Administrator, wenn etwas nicht mehr im grünen Bereich läuft. So erfährt er schnell, wenn der Web-Server nicht mehr antwortet, der Drucker klemmt oder eine Server-Platte vollgelaufen ist. Da das Monitoring-System solche Dienste ständig prüft, bemerkt es Ausfälle meistens, bevor sie den Usern Probleme bereiten. Und wenn das System Trends in der Verfügbarkeit erfasst, gibt es dem Admin sogar wertvolle Hinweise für die Kapazitätsplanung.

Als statusorientiertes, Plug-in-basiertes Monitoring-Framework hat sich in den letzten Jahren das unter der GPL stehende Nagios (früher Netsaint genannt) etabliert. Der Nagios-Prozess selbst kümmert sich nur um den Aufruf der Plug-ins für die eigentlichen Prüfungen und um die Auswertung der Ergebnisse und die Benachrichtigung, die wiederum über Plug-ins geschieht. Nagios läuft auf allen üblichen Unix-Varianten inklusive Linux. Es überwacht zusätzlich auch Windows-Systeme und Netzwerkkomponenten, die das Protokoll SNMP sprechen. Die mitgelieferten Plug-ins werden in einem eigenen Projekt auf Sourceforge gepflegt und bieten schon eine Vielzahl von Checks. Nagios-Plug-ins lassen sich auch einfach in beliebigen Programmiersprachen selbst entwickeln. Eine weitere Anlaufstelle für Plug-ins jeglicher Art ist das Portal NagiosExchange.org.

Nagios ruft ein Plug-in mit einer Reihe von konfigurierbaren Parametern wie etwa dem zu prüfenden Host auf, und erhält den Status zurück; entweder "OK", "Warning", "Critical" oder "Unknown". Nagios kennt zwei Status-Typen: "Soft" und "Hard", mit denen versucht wird, falsche Alarme zu vermeiden. Etwas vereinfacht geht der Zustand eines Checks nach einem Statuswechsel zunächst in den Typ Soft und erst nach einer definierbaren Anzahl von Wiederholungen, die das gleiche Ergebnis liefern, in den Typ Hard über.

Bei einem solchen Statuswechsel oder wenn der Zeitpunkt für eine erneute Benachrichtigung gekommen ist, durchläuft das Ereignis die Filterkette, die in der Abbildung rechts dargestellt ist. Erst wenn alle Filter eine Benachrichtigung erlauben, verschickt Nagios sie beispielsweise per E-Mail, SMS oder Pager an einzelne Kontaktpersonen oder Gruppen. Der gesamte Vorgang ist umfassend konfigurierbar; so können zum Beispiel verschiedene Kontaktgruppen zu unterschiedlichen Zeiten oder nacheinander benachrichtigt werden.