Als Nutanix 2011 mit der ersten Version seines Betriebssystems auf den Markt kam, präsentierte das Unternehmen eine hyperkonvergente Lösung mit bis dahin nicht gekannter Flexibilität, Leistungsfähigkeit und hochgradiger Automatisierung. Dieses Ziel ist geblieben, doch die Infrastrukturtechnologien haben sich geändert.

Inzwischen ist die hybride Cloud zum Standard-Infrastrukturmodell geworden. Die Menge der generierten Daten wächst ständig, und damit auch die Anforderungen an Storage und ihre Anbindung. Dem trägt die Industrie durch die Entwicklung schnellerer Speicheranbindungen und höher integrierter, festplattenloser Speicherbausteine und -systeme Rechnung.

Mit AOS 6.1, dem aktuellen, im Februar des laufenden Jahres freigegebenen Release von AOS, passt Nutanix sein Betriebssystem an diese und weitere Entwicklungen an. Im Mittelpunkt steht wie immer das Ziel, Anwendern eine hochflexible und -automatisierte, trotzdem kostengünstige hyperkonvergente Infrastruktur zu bieten, die mit modernsten Technologien arbeitet. Dabei legt Nutanix Wert darauf, dass Kunden nicht in eine Hardwareabhängigkeit von einem Hersteller gedrängt werden, sondern in der Auswahl ihrer Hardwarekomponenten frei bleiben. Im Folgenden werden einige der neuen Funktionen beschrieben.

Overcommit auch für Memory

Viele moderne Storage-Systeme und auch AOS ermöglichen es den Anwendern, einem Server oder einer virtuellen Maschine logisch mehr Speicher zur Verfügung zu stellen als ihr physisch im entsprechenden Moment tatsächlich zugeordnet ist (sogenanntes Overcommit).

Dieselbe Funktion ermöglicht AOS 6.1 jetzt für den AHV-Hypervisor auch für Memory: wird der Arbeitsspeicher einer virtuellen Maschine nicht voll ausgenutzt, kann der freie Bereich währenddessen anderen VMs als Ressource zur Verfügung stehen. Dadurch lassen sich mehr VMs auf einem Host unterbringen. Nützlich ist dies besonders in Entwicklungs- und Testumgebungen. Die Overcommit-Funktion bezieht sich dabei jeweils auf eine spezifische VM, so dass sich die Funktion auf eine Untergruppe von Maschinen innerhalb eines Clusters begrenzen lässt.

Mehr Speed für MySQL: Threading bei einer vdisk

Eine weitere Verbesserung bezieht sich auf die Handhabung klassischer und weit verbreiteter Datenbanken wie MySQL. Ihre Architektur ist auf die Implementierung in Dreischicht-Architekturen zugeschnitten. Daher können sie nur eine virtuelle Festplatte (vdisk) und eine Datendatei nutzen. Für optimale Leistungen auf Nutanix-Infrastrukturen wird aber die Definition mehrerer vdisks für Datenbanken empfohlen.

Mit AOS 6.1 gibt es für dieses Dilemma eine Lösung: Nutanix hat die Handhabung der Ein-/Ausgabeanfragen verändert. Die Anfragen an die MySQL-vdisk werden jetzt nachträglich in mehrere Warteschlangen (Threads) aufgeteilt, die alle den Kern-Datenpfad nutzen. Das entspricht einem Datenbank-„Sharding“ ohne Eingriff des Administrators.

Ergebnis: Solche Workloads laufen nun erheblich schneller auf Nutanix HCI. Die Beantwortung von Anfragen beschleunigt sich erheblich. Bei MySQl, einer Datendatei und einer vdisk stieg die Leseleistung um 77 Prozent. Lagen acht Datenfiles auf einer vdisk, wurde die Leseleistung mehr als verdoppelt (+109 %), obwohl die Implementierung mit einer vdisk eigentlich nicht den Empfehlungen entspricht.

Neuerungen bei AES

Daten lagert AOS gruNDBätzlich möglichst in die Nähe der sie verarbeitenden Applikationen, um die Verzögerungszeiten gering zu halten. Die Vorteile dieses Vorgehens erhöhen sich durch neue, schnelle Speichertechnologien wie NVMe, Intel Optane und daran angepasste Innovationen wie Blockstore von Nuanix und Intels SPDK (Storage Performance Development Kit).

Die beiden letztgenannten Technologien sollen die Performance in Umgebungen mit Flash-Storage steigern. Sie sollen kurz erläutert werden, um Neuerungen in AOS 6.1 besser zu verstehen.

Blockstore basiert auf einer Weiterentwicklung von AOS, die mit AOS 5.11 begann. Damals wurde AES (Advanced Extent Store) eingeführt. AES betrifft die von AOS gespeicherten Metadaten. Sie werden durch AES in das Prinzip der Datenlokalität mit einbezogen, das vorher nur für die Applikationsdaten selbst galt: Die Metadaten landen nun nicht mehr in einem einzigen, sondern in einem verteilten Key-Value-Store mit zwei Ebenen. Die lokalen Daten liegen in einem hochleistungsfähigen Key-Value-Store auf Basis von eine RocksDB, die clusterweiten auf einem Key-Value-Store auf Cassandra-Basis. Die physischen Metadaten befinden sich so in der Nähe der Anwendung wie die Nutzerdaten. Das erhöht die Schreibleistung.

Auch bei AES gibt es mit AOS 6.1 Verbesserungen: Während bisher nur reine Flash-Cluster AES nutzen konnten, arbeitet die Funktion jetzt auch mit hybriden Clustern, in denen außer Flash auch Harddisks stecken. Das gilt unabhängig davon, ob sie neu eingerichtet werden oder bereits vorhanden sind.

Blockstore und SPDK: Datenzugriff ohne Systemaufrufe und Interrupts

Blockstore greift auf AES zurück. Das Ziel von Blockstore ist es, die bis dahin technisch notwendigen Interrupts und Systemaufrufe beim Abfragen von Daten auf Flash-Speicher zu vermeiden. Denn sie kosten Zeit. Blockstore verwaltet freien physischen Speicher auf den physischen Devices mit Block-Struktur.

Abfragen müssen dann nicht mehr über den Systemkern laufen, sondern greifen mittels Blockstore auf den Datenraum der Nutzer zu. Systemaufrufe und Interrupts während der Datenabfrage von Flash-Medien werden vermieden genau wie Memory-Kopien. Dadurch wurde AOS funktional den technischen Gegebenheiten von Flash-Speicher angepasst.

Blockstore arbeitet auf einem abstrakten linearen Adressraum, der zwei Schichten hat: Die Blockmanagementschicht weist Daten bestimmten Blocks zu oder entfernt sie aus diesen. Darauf liegt eine Filesystem-Schicht, die als POSIX-ähnliches API für Stargate, den Datenmanagement-Prozess von Nutanix AOS, dient. So werden Daten auch ohne Systemaufruf zugänglich.

SPDK von Intel dient demselben Ziel: Interrupts und Systemaufrufe sollen vermieden werden. Deshalb eröffnet SPDK den Weg, aus Nutzerprozessen heraus direkt auf NVMe-Medien zuzugreifen, ohne über den Systemkern gehen zu müssen. Nutanix hat aus diesem Grund SPDK implementiert.

Insgesamt steigert die Kombination der beiden Technologien laut Daten von ESG die Leistung von AOS bei leseintensiven Applikationen um 20 bis 25 Prozent und senkt die Latenzen. Bei einem Cluster mit Blockstore und SPDK mit NVMe-Speicher wurden 60 Prozent mehr IOPS und 45 Prozent weniger Latenz gemessen.

Separate Speicherschicht für Intel Optane

Zurück zu AOS 6.1: Bislang wurden Intel Optane SSD und NVMe-SSDs in dieselbe AES-Erweiterungsspeicherschicht einsortiert. Nun gilt Intel Optane wegen seiner höheren Leistung als separate Speicherschicht, auf die besonders häufig benötigte Daten verlagert werden. Das kann die Leseleistung im Durchschnitt um bis zu 30 Prozent erhöhen. Die Funktion gilt für alle Cluster mit mindestens einem Optane-Medium.

Weitere neue Funktionen dienen dazu, Unterbrechungen und Störungen des Betriebs möglichst vollständig zu vermeiden. Mit AOS 6.1 wird auch der Replikationsdatenverkehr in Disaster-Recovery-Umgebungen zwischen beiden Schutz-Domains und den Nutanix-Leap-Service automatisch verschlüsselt. Damit ist für den sicheren Transport dieser Daten kein Rückgriff auf teure externe VPNs oder SSL-Tunneling-Produkte mehr erforderlich.

VSS-Provider: Mehr Möglichkeiten

Verbessert wurde auch der VSS (Virtual Shadow Service)-Provider von AOS. Er unterstützt jetzt volle und inkrementelle Backups, Die granulare Datenwiederherstellung der applikationsspezifischen Daten wird durch die Blockade von Schreibvorgängen möglich. Außerdem lassen sich nun VSS-Metadaten erzeugen, beispielsweise ein Dokument, das die gesicherten Komponenten und eines, das die Metadaten der Schreibvorgänge auflistet. Beide lassen sich für Applikations-bezogene Sicherungsläufe und Wiederherstellungen verwenden.

Flexiblere Vernetzung

Außerdem wurden die Vernetzungsmöglichkeiten erweitert. Bisher konnte man verschiedene Subnetze, die auf Schicht 3 geroutet wurden, nur durch zwei automatisch bereitgestellte und gewartete VPCs (Vurtual Private Circuits) verbinden. Mit AOS 6.1 und Prism Central pc.2022.1 können Workoads über zwei oder mehr Standorte hinweg nun mittels Layer-2-Subnetzen verbunden werden. Das vereinfacht den Betrieb hybrider Clouds. Die eingebundenen Sites erscheinen dann als eine verbundene Layer-2-Domain, die man als erweitertes Subnetz bezeichnen kann. Dasselbe ist auch mit mehreren Standorten in Form eines Punkt-zu-Multipunkt-Netzes möglich, selbst wenn sich die einzelnen Standorte in unterschiedlichen Layer-3-Netzen befinden.

Technisch verbindet man dabei den Nutanix Flow Networking VPC oder das AHV-Netz mit einem Standard-Multipoint-VTEP (VXLAN Tunnel Endpoint)-Gateway über VXLAN. Befinden sich auf beiden Seiten einer Verbindung Flow Networking VPCs, kann man das Netzwerk-Gateway oder eine sichere VPN-Verbindung für die Erweiterung nutzen.

Vereinfacht wurde der Zugriff über externe Netzwerke. Bislang mussten sich Anwender entscheiden, ob sie den Zugriff über externe Netze mit oder ohne NAT (Network Address Translation) erlauben wollten. Nun können sie einen VPC zu einem externen Netz mit NAT für den Zugriff beispielsweise auf Internet-Services verwenden. Für ein zweites externes Netzwerk lässt sich der geroutete Zugriff auf interne Ressourcen ohne NAT konfigurieren. Damit können Anwender für mehr Zwecke virtuelle Vernetzung einsetzen. Beispiele sind mehrschichtige Web-Anwendungen und Softwareservices.

Mehr Infos, einfachere Handhabung beim Management

Auf Storage-Ebene bietet die Storage-Summary der Managementkonsole Prism Element mehr Detailinformationen. So können Administratoren jetzt genau sehen, wieviel Speicherraum die Snapshots verbrauchen.

Die Generation virtueller Maschinen wird vereinfacht: Ab Version gibt es 6.1 VM-Templates, die die bisher verwendeten Images ergänzen. Images konzentrieren sich auf die zu einer VM gehörenden Daten, Infrastrukturmerkmale wie Netzverbindungen müssen nachdefiniert werden. Anders als Images werden Templates aus bestehenden virtuellen Maschinen generiert. Sie erben automatisch alle Eigenschaften der kopierten virtuellen Maschine wie CPU, Memory und Netzwerkdetails, sparen also Administrationsarbeit.

Später kann ein Template entsprechend dem geplanten Gast-Betriebssystem konfiguriert werden und beispielsweise einen Windows-Lizenzschlüssel erhalten. Es lassen sich verschiedene Versionen eines Templates aufbewahren und pflegen, so dass Updates und Patches ohne Erzeugung eines neuen Templates durchgeführt werden können.

Cluster verkleinern und warten mit weniger Klicks

Müssen Cluster verkleinert werden, lassen sich mehrere Knoten nun in einem Schritt aus dem Cluster entfernen. Man markiert einfach, welche Knoten entfernt werden sollen. AOS übernimmt es, die Daten von diesen Knoten zu entfernen und einen neuen Platz für sie zu finden, so dass sie auch verfügbar sind, wenn der Knoten gerade gelöscht wird.

Zudem können jetzt mehrere Cluster vollständig zentral von Prism Central aus verwaltet werden. Das gilt durch das Zusammenspiel zwischen AOS 6.1 und Prism Central pc.2022.1 auch für das gesamte Containermanagement.

Sollen einzelne Knoten innerhalb eines Clusters gewartet werden, ohne dass deshalb die Verfügbarkeit oder die Leistung beeinträchtigt werden, geschieht dies im Wartungsmodus. Der musste bislang über die Befehlszeile aufgerufen werden. Ab AOS 6.1 kann dieser Aufruf nun direkt in Prism erfolgen. Während der Wartung verlagerte Knoten werden nun bei ihrer Beendigung automatisch zurückverlagert, was Wartungsvorgänge weiter beschleunigt und vereinfacht.

Neue Trigger für X-Play

Routineaufgaben lassen sich mit Nutanix X-Play, einem Low-Code-Tool automatisieren. Es definiert Befehlsfolgen, die bei Auslösen eines Triggers ablaufen. In AOS wurden mehrere neue Trigger definiert. So liefert jetzt der Lookup-Befehl zu Cluster, Host oder VMs automatisch dessen komplette Daten. Bislang waren mehrere manuelle Schritte erforderlich, um dieselben Daten zu erhalten. Mit dem Trigger Send Alert to Pager Duty werden Nutanix-Alerts automatisch an die Pager-Anwendung PagerDuty geschickt und erscheinen dort als Incidents.

So weit zu AOS 6.1. Dessen Verbesserungen bewegen sich auf Infrastruktur-Ebene. Aber durch die Flut der Daten und neuen Auswertemöglichkeiten tut sich auch bei den Anwendungen viel. Dies gilt besonders für die Datenbanken. Denn sie sollen ja die generierten Datenberge verwalten und erschließen. Immer öfter operieren sie in hybriden Multicloud-Infrastrukturen, was die Komplexität des Datenbankmanagements gerade in umfangreichen Umgebungen mit vielen Datenbanken erheblich erhöht.

Daraus resultieren eine Reihe von Problemen: Datenbankmanager sind notorisch überlastet, wozu besonders zeitraubende Arbeiten wie Patching und Cloning zählen. Backup und Restore verbrauchen dank steigender Datenmassen immer mehr Zeit, gleichzeitig gelten Kostenschranken. Außerdem kann das Datenbankmanagement häufig nicht mit den Anfragen nach der schnellen Bereitstellung neuer Datenbanken gerade für Entwicklung und Test mithalten. Fehlen den Entwicklern notwendige Datenbanken, beeinträchtigt dies aber ihre Leistung und damit die Time-to-Market neuer Applikationen.

Zentrales Datenbankmanagement mit NDB

Nutanix hat dieses Problem schon länger erkannt und mit dem Nutanix Database Service (NDB) darauf reagiert. Er wurde anfangs unter der Bezeichnung Nutanix Era angeboten.

NDB ermöglicht das zentrale Datenbankmanagement unterschiedlicher Datenbanken in hybriden Cloud-Umgebungen und fungiert als Multicloud-DBaaS (Database as a Service). Anwender können damit definieren, wo ihre Datenbanken jeweils laufen sollen – über eine für Microsoft SQL Server, Oracle, PostreSQL, MySQL und MongoDB einheitliche Oberfläche.

In der letzten Zeit wurde NDB bereits um viele wichtige Funktionen erweitert: 2021 kamen Failover-Möglichkeiten in Form eines hochverfügbaren DBaaS-API und einer dezugehörigen Konsole hinzu. Umschalten kann man zwischen Nutanix Cloud Infrastructure-Clustern in unterschiedlichen Rechenzentren und Regionen.

Auch die Datenbank-Governance wurde verbessert: Zugriffe erfolgen jetzt rollenbasiert. So können Entwickler nun Backups gemeinsam nutzen und mit wenig Aufwand Datenbanken klonen oder die Daten in ihren Testumgebungen auffrischen.

Ein Plugin integriert NDB mit Service Now. Damit sind Standard-Workflows möglich, die die Bereitstellung von Datenbanken vereinfachen.

NDB 2.4: Leistungsverbesserungen und neue Funktionen

In NDB 2.4 sind viele Leistungsverbesserungen und neue Funktionen hinzugekommen. So lassen sich nun mit Nutanix Cloud Clusters (NC2) Hunderte von Datenbanken auf Nutanix-Clustern beim Kunden oder in der Cloud gleichzeitig verwalten.

Snapshots erleichtern jetzt die Wiederherstellung von Datenbanken auf Nutanix-Clustern. Anwender können ihre Backups auf Storage-optimierte Nutanix-Cluster im Hintergrund umleiten. Von dort aus lassen sich Datenbanken oder Datenbank-Cluster bei Bedarf so wieder herstellen, wie sie zu einem bestimmten Zeitpunkt waren.

Gleichzeitig werden die Backup-Regeln gelockert: Backup-Daten können nun auf jedem Nutanix-Cluster in einer NDB-Multi-Cluster-Umgebung gelagert werden. Die Daten lassen sich dann zurückspielen, unabhängig davon, ob sie auf dem lokalen Datenbankserver liegen oder auf einem Nutanix-Cluster im Hintergrund liegen.

Diese Backup-Daten kann man jetzt einfach dadurch sicher teilen, dass man auf die Entity-Sharing-Seite geht, eine Time Machine, den Empfänger und den Zugriffslevel auswählt. Wurde eine Datenbank zum Teilen bestimmt, können sich Entwickler über Konsole oder API in NDB einloggen, zu der geteilten Time Machine durchklicken und Clone- oder Refresh-Vorgänge starten. Backup-Daten lassen sich mit unterschiedlichen Gruppen oder Nutzern teilen. Das ermöglicht unter anderem Entwicklern, Datenbank-Clones ohne Eingriff des Administrators zu erzeugen.

Der Weg zum organisationseigenen DBaaS

Letztlich können Datenbank-Verantwortliche in Unternehmen und Organisationen mit den neuen Funktionen von NDB 2.4 ihren eigenen Datenbank-Service (DBaaS) definieren. Ihre Kunden profitieren dann von den beliebten Selbstbedienungs-Mechanismen, die sie aus der Public Cloud kennen, ohne ihr Unternehmen gleichzeitig den Risiken einer reinen Public-Cloud-Implementierung auszusetzen. Davon profitieren unter anderem Entwicklungsabteilungen, was dem gesamten Unternehmen durch schnellere Innovationen zugutekommt.

Flexibilität, Schnelligkeit und Automatisierung bei gleichzeitig umfassendem Überblick über das Geschehen bringen die Datenbank-Administratoren mit NDB 2.4 wieder vor das Geschehen. Sie können sich um das Wesentliche kümmern, statt sich ermüdenden, zeitraubenden und arbeitsintensiven Routineaufgaben zu widmen. Denn diese erledigt zu großen Teilen Nutanix NDB 2.4.