Es wird schwerer, den Überblick zu behalten, denn immer neue Anwendungen und Technologien erhöhen die Komplexität im Rechenzentrum. Entsprechend drohen Lücken in der Security und Schatten-IT. Unternehmen benötigen daher umfassende Einblicke vom Data Center bis hin zur Multi-Cloud-Umgebung, die so genannte Full-Stack Observability (FSO). Damit haben IT-Teams sämtliche Systeme im Blick und können ihre Kundenangebote kontinuierlich optimieren.

Während Applikationen früher nur im eigenen Rechenzentrum liefen, befinden sie sich heute auch in Private und Public Clouds. Zur Verwaltung kommen häufig verschiedene Lösungen für die jeweiligen Infrastrukturen zum Einsatz. Entsprechend sind unterschiedliche Teams für die Management-Tools zuständig. Doch an der Collaboration hapert es zumeist. So entstehen zahlreiche Silos und der umfassende Überblick geht verloren. Gleichzeitig steigen damit die Security-Gefahren. So bemerken Unternehmen mit umfassenden Zero Trust- oder Secure Access Service Edge (SASE)-Architekturen Angriffe doppelt so schnell als solche mit Silo-Strukturen. Das ergab die Security Outcomes-Studie 2022 von Cisco.

Aber damit nicht genug: Nicht nur die Apps befinden sich überall, sondern auch die Nutzer. Auch wegen verschiedener Hybrid Work-Modelle greifen sie aus dem Büro, aus dem Homeoffice und von unterwegs aus auf die Apps zu. Dabei kommt es auf die jeweiligen Use Cases an, welche Anforderungen an Latenzzeit und Performance bestehen. Mag es bei einer Shopping-Seite für Kinderspielzeug noch in Ordnung sein, mehrere Sekunden zu warten, ist das für eine Börsenanwendung untragbar. Hier müssen Informationen schon nach Millisekunden zur Verfügung stehen.

Reibungslosen Betrieb gewährleisten

Um den reibungslosen Betrieb dieser komplexen Applikationslandschaften zu gewährleisten, ist eine siloübergreifende Sicht notwendig. Denn mögliche Engpässe können an vielen Faktoren liegen: an der Internetverbindung, dem Ost-West-Verkehr zwischen den Microservices, Programmierfehlern, Relokationen, Hardware-Ausfällen im Rechenzentrum, unzureichenden Storage- oder CPU-Ressourcen und vielem mehr.

Der erste Schritt zu mehr Transparenz ist dabei, sich die Komplexität bewusst zu machen. Zwar können einzelne Management-Tools für ihr jeweiliges Silo bei Problemen Warnmeldungen ausgeben. Allerdings hilft nur eine eine Full-Stack Observability (FSO) nötig, um die richtigen Schlüsse zur Optimierung der kompletten Landschaft zu ziehen.

Benötigt zum Beispiel eine Virtuelle Maschine mehr Ressourcen auf einem physikalischen Server, lässt sich dies über das entsprechende Management-Tool einfach zuweisen. Was jedoch übersehen wird: Diese Ressourcen werden den anderen Virtuellen Maschinen auf diesem Server entzogen. Das kann bis zu deren Ausfall führen. So hat der Vorteil für einen Bestandteil eventuell fatale Auswirkungen auf das Gesamtsystem. Nur eine FSO-Lösung kann solche Zusammenhänge erkennen und proaktiv vermeiden. Sie sammelt und analysiert Informationen aus allen Silos, um die Ressourcen für alle Elemente sämtlicher Infrastrukturen und Anwendungen zu optimieren.

Die Cloud Operations Platform

Die zentrale Komponente einer solchen FSO-Lösung ist die Cloud Operations Platform. Bei Cisco Intersight beispielsweise besteht diese aus mehreren Modulen. Das Basismodul klärt die Frage, wie sich Hardware und Server optimal konfigurieren lassen. Dies funktioniert mit dem Cisco Unified Computing System (UCS) ebenso wie für Hardware von Storage-Partnern und Drittanbietern. Dabei ermittelt die Lösung, welche Ressourcen zur Verfügung stehen und welchen Firmware-Stand die jeweilige Hardware besitzt. Die Antworten werden siloübergreifend in einer Plattform angezeigt.

Ein weiteres Modul steht für Infrastructure as a Service (IaaS) zur Verfügung. Es unterstützt Bare Metal as a Service, etwa für große Datenbanken wie SAP/HANA und Oracle, sowie VMaaS, Kubernetes Cluster und Container as a Service. Dies bietet die Grundlage für den Betrieb der Apps.

Das Management muss in einer hochdynamischen und komplexen Umgebung weitgehend automatisiert ablaufen. Dazu dient ein Modul für Infrastructure as Code, inklusive Version Control System. Damit lassen sich Abläufe und Reaktionen programmieren und über Intersight durchsetzen. Hier unterstützt der Intersight Cloud Orchestrator die automatisierte Durchführung komplexer Workflows und Prozesse auf Server-, Speicher- und Netzwerkebene.

Die 1000 Augen des Netzwerk-Wunderkindes

Neben den Hardware-Anforderungen sind auch blinde Flecken in den Netzwerken zu ermitteln. Dazu dient Ciscos Akquisition ThousandEyes. Mit Hilfe von Software-Agenten im eigenen Netzwerk und bei den Cloud-Providern lässt sich ein umfassendes Monitoring gewährleisten. So sieht das „Wunderkind“ vieles, was die IT ansonsten nicht erkennen kann. Dies reicht vom WAN über Clouds, Internet und Content Delivery Networks (CDNs) bis zu VPN-Verbindungen.

Auf Basis der Erkenntnisse aus den verschiedenen Ebenen im TCP/IP-Stack lassen sich Probleme proaktiv vermeiden. So erkennt die Lösung, ob eine Seite erreichbar ist und der Handshake funktioniert bis hin zur Performance auf Anwendungsebene. Die Sicht auf alle Punkte deckt schnell Überlastungen, Ausfälle, Engpässe, falsche Routen oder verlorene Datenpakete auf. Damit können Unternehmen nicht nur ihre eigenen Netzwerke optimieren, sondern auch ihre Cloud- und Internet-Anbieter oder andere Plattform-Betreiber auf mögliche Fehler in ihren Netzwerken hinweisen.

Der Programm-Checker

Die dritte Komponente einer FSO-Lösung besteht aus einer Code-Überprüfung. Schließlich nützt die performanteste Hardware und das beste Netzwerk nichts, wenn die App Programmierfehler hat. Cisco AppDynamics erstellt eine Grundlinie, wie das normale Verhalten einer Anwendung aussieht. So lassen sich schnell Anomalitäten erkennen und auf Programmänderungen zurückführen.

Ändert zum Beispiel ein Entwickler die Datenbank-Abfrage, damit die App mehr Informationen erhält, kann dies die Performance erheblich beeinträchtigen. Auch unliebsame Verknüpfungen, etwa die Nutzung von Test-Datenbanken in der Produktion, lassen sich damit aufdecken. Die Lösung kann sogar erkennen, an welcher Stelle genau NutzerInnen aussteigen, um den entsprechenden Code zu prüfen.

Eine Erweiterung scannt nicht nur die App, sondern auch alle genutzten Libraries auf Schwachstellen. Secure Application konnte so zum Beispiel Probleme mit der Java-Bibliothek Log4j schnell erkennen und die betroffenen Unternehmen frühzeitig warnen. So ließen sich die möglichen Schäden deutlich reduzieren.

„Unternehmen benötigen eine siloübergreifende Sicht auf den kompletten Technologie-Stack wie Clouds, Rechenzentren oder SaaS-Angeboten, da Apps in all diesen Umgebungen laufen können. Dabei sind sämtliche Workload-Formfaktoren von Bare Metal über VMs, Cloud-Instanzen und Container bis zu Functions as a Service zu berücksichtigen. Zusätzlich müssen die Infrastrukturen aller Elemente angebunden werden, also Netzwerk, Storage und Server. Erst dann ist eine vollständige Sicht auf die Anwendungslandschaft möglich, um fundierte Entscheidungen zu treffen, die sich bei Bedarf automatisiert umsetzen lassen“, betont Uwe Müller, Head of Sales & Pre Sales Datacenter, Cisco Deutschland.