Go to Top

Wo sind die Daten? Teil 2: Software-defined und hyperkonvergente Lösungen

hyperkonvergente Lösungen

Seit einigen Jahren schon versuchen IT Administratoren und Manager, ihre Kosten und Hardware in ihren Rechenzentren zu reduzieren. Immer mehr Server in Rechenzentren laufen nun als virtuelle Server, was zu weniger benötigten physischen Servern, weniger Energie-, Hardware- und Wartungskosten führt.

Um diese massiven Mengen an virtuellen Maschinen und virtuellen Servern zu verwalten, stellt eine Software-definierte Speicherlösung (SDS) eine Software-Ebene her, um alle notwendigen Rechenzentrumskomponenten wie Compute-Rechenleistung, Server, Storage, Networking und Sicherheitsdienste zu verwalten und zu kombinieren. Solche Lösungen sind softwarebasiert und können – theoretisch – auf verschiedenen Hardwareprodukten laufen. In Wirklichkeit ist es ratsam, eine Software-definierte Lösung auf Hardware zu verwenden, die bereits vom Softwarehersteller getestet und genehmigt wurde.

Hyper-konvergierte Infrastruktursysteme hingegen sind die jüngste Entwicklung in dem Bemühen, das Unternehmen effizienter und kostengünstiger zu gestalten. Charakteristisch für eine solche Lösung ist, dass es mehrere Technologien nutzt, alle diese Technologien nahtlos integriert und als ein einziges System verwaltet. Hyperkonvergierte Systeme verschmelzen alle bisher verwendeten Konzepte wie konvergierte und traditionelle Speicher sowie Software-basierte Lösungen in einer „serverisierten“ Lösung. Diese neue Lösung ist somit serverbasiert und technologisch miteinander verknüpft. Wie ein SDS basiert auch eine hyperkonvergente Lösung auf Virtualisierung und softwarebasiertem Management, aber sie ist mit der Hardware gekoppelt.

Einfach ausgedrückt sind hyper-konvergente Systeme Infrastruktur-Systeme mit software-zentrierter Architektur, die Compute (CPU), Speicher-, Netzwerk- und Virtualisierungs-Ressourcen und andere Technologien in einer Hardware-Box, die von einem Anbieter geliefert wird, integrieren.

Aus technischer Sicht gewinnen Anwender einer hyperkonvergierten Lösung nicht nur erhebliche Vorteile durch ein komplettes Management aller Infrastrukturressourcen und virtuellen Maschinen unter einem einzigen Verwaltungspunkt, sondern auch dadurch, dass alle Rechenzentrumsressourcen im Ressourcenstapel unter einem einzigen freigegebenen Ressourcenpool verwendet werden. Durch die Bereitstellung von Virtualisierung, Speicherung, Rechenleistung, Netzwerk, Management und Datenschutz in einer einfach zu verwaltenden, aber skalierbaren Anwendung kann ein Unternehmen nahtlos eine komplexe Infrastruktur verwalten.

Für ein Unternehmen, das eine hyperkonvergente Lösung einsetzt, bedeutet dies, dass weit weniger kostspielige Hardware benötigt wird, da solche Systeme auf gängige und preiswerte x86-Hardware angewiesen sind und die benötigte Hardware in viel kleineren Einheiten aufgerüstet oder im Falle eines Fehlers geändert werden können – im Gegensatz zu integrierten Systemen. Um es nochmal zusammenzufassen: Hyper-konvergente Lösungen brauchen nicht so viel Speicher und Bandbreite wie integrierte Lösungen und hier können Kosten für Hardware und Energie gespart werden. Wie bereits erwähnt, können zudem Ressourcen viel einfacher skaliert werden.

Aber wo sind die Daten in einem Software-definierten oder hyper-konvergenten Storage wirklich gespeichert?

Die Antwort auf diese Frage ist nicht ganz einfach. Es hängt stark vom verwendeten Produkt ab. Grundsätzlich bestehen SDS oder Hyper-konvergente Lösungen aus mehreren unterschiedlichen Datenstrukturen. Um es einfach zu halten, kann die Struktur mit einer russischen Matroschka-Puppe verglichen werden: Die Benutzerdaten befinden sich in der tiefsten Ebene, während andere Technologien darauf ihre Datenschichten hinzufügen. Wie man in der obigen Grafik sehen kann, ist bei Software-definierten Storages die höchste Datenschicht diejenige, die vom SDS-Controller erstellt wurde, einschließlich der Informationen über die virtuellen Speicher-Arrays. Die nächste Schicht ist die vom verwendeten Hypervisor erstellte Virtualisierungsschicht. Unter dieser Schicht befinden sich die Server-Layer, denen dann das Layer des physischen Mediums folgt. Insgesamt handelt es sich um vier Schichten, aus denen die endgültige Datenstruktur gebildet wird.

Im Gegensatz zu einer SDS-Lösung ist die Schicht, die der Hypervisor in einer hyperkonvergierten Lösung erstellt hat, die höchste und neueste Schicht der Datenstruktur. Unterhalb dieser Schicht wurde die Informationen der SDS-Steuerungssoftware hinzugefügt. Zusätzlich wurde eine Schicht aus einem der angeschlossenen Nodes erstellt und schließlich die Rohdaten im Inneren dieses gesamten „Daten-Containers“.

Und wenn das nicht schon kompliziert genug war, es wird noch schlimmer:
Ein weiteres Merkmal eines SDS oder einer hyperkonvergierten Lösung ist, dass einige proprietäre Dateisysteme verwenden. NetApp-Speicherlösungen nutzen beispielsweise ihr eigenes WAFL – Write Anywhere File Layout – System, das speziell für das Data Ontap Betriebssystem entwickelt und für den Einsatz in Netzwerkumgebungen optimiert wurde. Und es gibt noch mehr: NetApp bietet gleich zwei weitere Betriebssysteme mit jeweils eigenen Vorteilen an. VMware VSAN verwendet seit der Version 6 seiner SDS-Lösung ein eigenes Dateisystem namens on-disk Filesystem (VSAN FS). Dabei bietet Dell EMC beispielsweise VMware VSAN als Hypervisor-konvergente Speichertechnologie für seine PowerEdge Server-Produkte an. Die Big Data Storagelösung von Dell EMC – Isilon – hat ein anderes Dateisystem mit dem Namen Isilon OneFS (1 – Ein File/Dateisystem). In diesem Dateisystem werden die Metadaten über die vielen an das System angeschlossenen Nodes homogen verteilt.

Um es kurz und einfach zu halten: Fast jede SDS- oder Hyper-konvergierte Lösung nutzt ihre eigenen Datei- und / oder Betriebssysteme, die dann erst mal enträtselt werden müssen, wenn Daten verloren gehen und wiederhergestellt werden sollen.

Ist die Datenwiederherstellung in SDS oder bei hyperkonvergenten Lösungen möglich?

Es gibt viele Fälle, in denen die Spezialisten von Kroll Ontrack eine erfolgreiche Datenrettung eines High-End-Speichersystems mit mehreren Datenschichten vorgenommen haben. Einer dieser Fälle war ein fast brandneues VMware vSAN-System, das nur durch einen defekten SSD-Speicher, der als System-Cache-Speicher verwendet wird, vollständig ausgefallen war. VMware bietet die vSAN-Option für vSphere ESXi Server zur Organisation und Verwaltung von Lagern erst seit März 2014 an. Trotzdem scheiterte das System nur ein paar Monate später. Ein solches vSAN-System fasst Anwendungen oder Daten zusammen, die in virtuellen Maschinen in einem gemeinsamen, geclusterten Shared Storage Datastore gespeichert sind. Alle angeschlossenen Hostcomputer und ihre Festplatten sind Teil dieses gemeinsamen Datastore. Das bedeutet, dass bei einem Hardware-Fehler oder Datenverlust die Datenrettungs-Ingenieure mit einer zusätzlichen Informationsebene umgehen müssen. Dieses spezielle System bestand aus 15 Festplatten und 3 SSD-Speichern, aber mit dem Ausfall dieser einen SSD fielen gleich drei Host Computer / Knoten aus und es kam zu einem vorübergehenden Verlust von vier großen virtuellen Maschinen.

Um alle fehlenden Daten aus dem ausgefallenen Speichersystem wiederherzustellen und zu speichern, mussten Kroll Ontrack-Ingenieure neue Software-Tools entwickeln, um die für die Identifizierung und die Zusammenstellung der Daten notwendigen Beschreibungs- und Log-Dateien zu finden. Die Datenspeicher funktionierten als Container, so dass die Spezialisten zunächst die Links zu den enthaltenen virtuellen Maschinen identifizieren und sie dann im nächsten Schritt rekonstruieren mussten. Dank der neuen Tools konnten sie herausfinden, wie die virtuellen Maschinen im vSAN-Datenspeicher gespeichert und an die betroffenen Festplatten verteilt wurden. Dies ermöglichte es den Datenrettungsexperten, die notwendige Beschreibung und die Log-Dateien viel schneller als normalerweise zu finden, was den Wiederherstellungsprozess wesentlich erleichterte und auch künftig erleichtern wird. Mit diesen Werkzeugen konnten die Spezialisten die virtuellen Maschinen und alle auf dem vSAN-System gespeicherten Daten wiederherstellen.

Dieses Beispiel zeigt, dass die Wiederherstellung einer SDS- oder Hyper-konvergierten Lösung, die eine Vielzahl von Technologien und Datenschichten umfasst, möglich ist. Wie viele Schichten tatsächlich wiederhergestellt werden müssen, hängt vom jeweiligen Produkt und den eingesetzten Technologien ab. Jeder Datenverlust und Datenrettungsjob hat daher seine eigenen Herausforderungen. Aus diesem Grund ist es für eine erfolgreiche Datenrettung unerlässlich, sich für einen Datenrettungsspezialisten zu entscheiden, der bereits erfolgreich Daten aus dem jeweiligen Produkt wiederhergestellt hat und der sowohl über die notwendigen Werkzeuge als auch das Know-how für ein solches anspruchsvolles Projekt verfügt.

Bildnachweis: M. Großmann /pixelio.de