Nagios: das Schweizer Messer der Netzwerküberwachung

(http://www.zdnet.de/magazin/41501912/nagios-das-schweizer-messer-der-netzwerkueberwachung.htm)

von Michael Matzer, 31. August 2009

Nicht nur für kleine und mittelständische Unternehmen ist Nagios interessant, auch Großunternehmen verwenden es. Wichtigstes Plus des quelloffenen Monitoring-Tools: die breite Palette von Zusätzen, die es so vielseitig macht.

Jeder IT-Systemverwalter kennt den Fall: Oft wird er erst durch den IT-Benutzer auf Probleme im Netzwerk aufmerksam gemacht. Das verursacht Kosten, Arbeitsausfälle und nicht zuletzt Unzufriedenheit bei den betroffenen Mitarbeitern. Doch die Problemlösung beginnt erst mit der aufwändigen Suche nach der Ursache, und in der Regel ist bereits ein Schaden entstanden. Um auf Störungen oder Ausfälle rechtzeitig reagieren zu können, verwendet man daher sogenannte Monitoring-Systeme.

Diese Systeme überwachen beispielsweise die Verfügbarkeit von Diensten und informieren den Administrator, wenn definierte Parameter nicht mehr übereinstimmen. So erfährt er schnell, wenn der Mail-Server nicht mehr antwortet, eine Partition im Server keinen Speicherplatz mehr hat oder ein Netzwerkdrucker nicht mehr erreichbar ist. Es werden auch Statistiken über freie und verwendete Kapazitäten gesammelt, damit sich besonders kritische Bereiche frühzeitig erkennen und optimieren lassen.

Bei Nagios wird die Überwachung von Servern und Diensten mit den Plug-ins durchgeführt, die sowohl lokal auf dem Nagios Server, wie auch auf den zu überwachenden Hosts (Windows oder Linux) installiert werden können. Durch diesen Aufbau lässt sich Nagios einfach um zusätzliche Überwachungsfunktionen erweitern oder an individuelle Einstellungen anpassen.

Nagios überprüft diese Plug-ins mit einer Reihe von konfigurierbaren Parametern und erhält den entsprechenden Status zurück (entweder "OK", "Warning", "Critical" oder "Unknown). Tritt ein vordefiniertes Ereignis ein, verschickt Nagios eine Meldung, etwa per E-Mail oder SMS, an einzelne Kontaktpersonen oder Gruppen.

Nagios ist sozusagen das Schweizer Offiziersmesser für die Netzwerküberwachung. Es verfügt über so viele Add-ons und Plug-ins[1] dass es kaum einen technischen Bereich gibt, der sich damit nicht erfassen ließe. Selbst Anwendungen und Prozesse können sich nicht vor dem von Ethan Galstad entwickelten Allzwecktool verstecken. Im Unterschied zu den kommerziellen Werkzeugen von HP (früher "Openview" jetzt "Business Technology Optimization Software") und IBM ("Tivoli[2]") ist Nagios quelloffen und kostenfrei, die Lizenz steht unter GPL[3] zur Verfügung. Der Name ist von "net" und "hagios" (= Heiliger) abgeleitet, denn der ursprüngliche Name lautete "NetSaint".

Weltweit gibt es laut Nagios derzeit rund 250.000 User, die Zahl der Downloads liegt derzeit offiziell bei rund zwei Millionen. Nagios erfreut sich also einer großen Anwendergemeinde. Sie reicht von kleinen Unternehmen und Organisationen bis zu Großunternehmen mit 60.000 Nodes.

Einer der Gründe, warum Firmen Nagios nutzen ist, dass "für den Kunden das nötige Budget niedriger ist als für kommerzielle Software", sagt Julian Hein, Managing Director des Dienstleisters Netways[4]. Für die niedrigen Kosten sorgen zum einen die nicht zu entrichtenden Lizenzkosten. Außerdem findet Hein wichtig, dass "Limitierungen von Lizenzen ebenso wegfallen wie die Kosten für deren Pflege." Denn allein die Wartung von Lizenzen könne gerade in Großunternehmen erhebliche Kosten verursachen.

Ein dritter Grund, der für viele Kunden ausschlaggebend sei: "Auch die Flexibilität bei der Umsetzung von Kundenwünschen ist größer, so etwa bei der Integration mit den vorhandenen Systemen." Die Nagios-Schnittstellen seien offen und die Plug-ins und Add-ons auf Kooperation ausgerichtet, so dass sie Daten anderer Tools für Monitoring und Management verarbeiten können. "Nagios kann also an Tivoli Daten liefern und umgekehrt. Der Einsatz verschiedener Tools ist in Großunternehmen eher die Regel als die Ausnahme. Beispielsweise lassen sich Daten aus einer bereits implementierten CMDB[5] (configuration Management Database) für die Nagios-Konfiguration heranziehen."

Nagios ist im Prinzip für jede Überwachung von IP-Geräten gedacht - egal ob Server, Netzwerkkomponenten oder andere Systeme - und dadurch vielseitig einsetzbar. "Es gibt Anwender, die nur Klimaanlagen, Raumsensoren oder Heizungen überwachen", berichtet Franz Lew vom Regensburger Ingenieurbüro Bits & Bytes[6]. "Es gibt aber auch eine Vielzahl von Kombinationen von Servern, Netzwerken, Telefonanlagen, Videoüberwachung, Schließanlagen und so weiter." Diese Vielzahl an Lösungen mache Nagios so interessant für Unternehmen und Behörden.

Die
Die "Tactical Overview" von Nagios liefert einen guten Überblick über den Gesamtzustand des Netzwerks (Bild: Netways).
Bei der Oberschwaben Klinik[7] im Kreis Ravensburg wurde beispielsweise das Helpdesk-System OTRS mit Nagios integriert. Nagios-Meldungen lassen sich nun in diesem System weiterbearbeiten. Auch das Schnittstellensystem eGate zwischen dem SAP-System, das die Patientendaten verwaltet, und unzähligen anderen Subsystemen, wird von Nagios überwacht. "Durch den Einsatz von Nagios sehen wir auf einen Blick, welche Systeme unserer Aufmerksamkeit bedürfen", sagt Jörg Napp, Leiter des EDV-Bereichs der Klinik. Große Systeme wie Openview oder Unicenter schieden für ihn schon aufgrund des hohen Kostenaufwandes aus. Und da Nagios browserbasiert arbeitet, erforderte es auch keine Installation auf den Clients - ein weiterer Kostenvorteil.

Auch die Linde AG[8], weltweit Marktführer in Kältetechnik, hat Nagios den großen Wettbewerbern vorgezogen. Innerhalb von zwei Monaten nach der Einführung konnten damit nach Aussagen des Unetrnehmens fünf konkrete Ausfälle bereits im Vorfeld verhindert werden. Zudem werden die Administratoren bei den täglichen Routinearbeiten entlastet und können sich besser auf ihre Kernaufgaben konzentrieren. "Die Nagios-Anwendung hat unsere Erwartungen hinsichtlich Funktionalität und Effizienz vollständig erfüllt. Durch den Wegfall der Lizenzkosten und die kurze Implementierungszeit konnten wir einen nahezu unmittelbaren ROI erreichen", sagt Linde-CIO Jürgen Overfeld.

Sowohl bei Linde als auch bei der Oberschwaben Klinik agierte der Nürnberger Dienstleister Netways als Implementierer und Berater. "Wir betreuen Unternehmen aller Größen", berichtet Julian Hein. "Aber am ehesten kommt Nagios für Firmen in Betracht, die ein heterogenes Netzwerk haben, dessen Komponenten von verschiedenen Herstellern stammen." Nagios lasse sich nämlich leicht damit integrieren.

"Der Kern von Nagios ist klein und handlich, darum herum sind die Module angeordnet. Der Kunde kann leicht seine Auswahl unter den Add-ons und Plug-ins[9] treffen." Nagios komme nicht Out-of-the-box und schränke so niemanden ein. Allerdings gilt: "Nagios ist kein Managementwerkzeug. Es dient vielmehr der Überwachung in quantitavier und qualitativer Hinsicht, zum Beispiel, was die Performance anbelangt."

In der Statusmap zeigt Nagios alle überwachten Hosts inklusive ihrer Abhängigkeiten untereinander an (Bild: Netways).
In der Statusmap zeigt Nagios alle überwachten Hosts inklusive ihrer Abhängigkeiten untereinander an (Bild: Netways).

Ein so kleines Werkzeug scheint nicht dafür geeignet, großen Umgebungen zu überwachen. Doch Julian Hein versichert: "Limits hinsichtlich der Zahl verwaltbarer Nodes gibt es keine, denn Nagios skaliert linear: Wenn man mehr Nagios-Server einsetzt, kann man auch mehr Nodes überwachen."

Mit 60 Nagios-Servern überwache Netways beispielsweise bei einem Telekommunikationsanbieter 60.000 Nodes im WLAN-Bereich. Die 60 Server schicken ihre Daten an einen zentrale Sammelstelle, die sie auswertet. Wenn dabei Probleme auftauchen, dann liegen "die Schwächen nicht im System, sondern eher bei den IT-Anwendern", so Franz Lew. "Umso verschachtelter das System wird, umso schwieriger ist es, die Übersicht zu behalten."

Der Ausbau des Nagios-Ökosystems schreitet voran. "Die deutsche Community[10] produziert Plug-ins und Add-ons, um den Funktionsumfang und den Einsatzbereich von Nagios erheblich zu erweitern, etwa hinsichtlich Visualisierung, SLA-Überwachung oder Suchmaschinen", sagt Hein. Das Schweizermesser namens Nagios wird also immer vielseitiger.

Der Nagios-Verfügbarkeitsreport berechnet die Verfügbarkeit für jede konfigurierte Komponente. Zusätzlich werden alle relevanten Messwerte aufgelistet (Bild: Netways).
Der Nagios-Verfügbarkeitsreport berechnet die Verfügbarkeit für jede konfigurierte Komponente. Zusätzlich werden alle relevanten Messwerte aufgelistet (Bild: Netways).

URLs in diesem Artikel:
[1] = http://www.monitoringexchange.org/
[2] = http://www-01.ibm.com/software/de/tivoli/
[3] = http://de.wikipedia.org/wiki/GNU_General_Public_License
[4] = http://www.netways.de/
[5] = http://de.wikipedia.org/wiki/CMDB
[6] = http://www.bits-and-bytes.de/
[7] = http://www.oberschwabenklinik.de/
[8] = http://www.linde-kaeltetechnik.de/
[9] = http://exchange.nagios.org
[10] = http://www.nagios-portal.org/