… und warum ist es so revolutionär?

Dieses Dokument zeigt, wie StrongLink das Daten- und Speichermanagement revolutionieren kann – überall und über sämtliche Dateisysteme und Workflows hinweg.

Einführung zur Problemstellung

Der dramatische Zuwachs an unstrukturierten Daten führt zu großen Herausforderungen für IT-Organisationen. Diese mühen sich mit verschiedenen unübersichtlichen und äußerst problematischen Fragen ab, die sowohl das Datenmanagement selbst als auch die Verwaltung von Daten über die verschiedensten verfügbaren Speichermöglichkeiten hinweg betreffen. Außerdem sind dabei unterschiedliche Anwendungsfälle und Preis-Leistungs-Anforderungen zu beachten.

Die erste Herausforderung ist, auf kosteneffektive Weise mit der massiven Flut unstrukturierter Daten umzugehen, die üblicherweise ca. 80 % sämtlicher Daten einer Organisation ausmachen. Dies wird durch eine jährliche Zuwachsrate von ca. 62 % verstärkt, die die Menge an unstrukturierten Daten etwa alle 18 Monate verdoppelt. Die Verwaltung sämtlicher unstrukturierter Daten ist an sich schon schwierig genug. Selbst wenn alle diese unstrukturierten Daten in einem einzigen Speichersystem vorliegen würden, wäre es eine Mammutaufgabe, Zugriff auf alles zu ermöglichen. Was die Aufgabe allerdings schier unlösbar erscheinen lässt, ist die Tatsache, dass die unstrukturierten Daten selten nur an einem Ort gespeichert sind. Üblicherweise liegen diese verteilt über mehrere Speichersilos, über hyperkonvergierte Systeme, Dateiserver und Hypervisor-Cluster hinweg vor. Entweder vor Ort, extern oder an verschiedenen geografischen Orten oder auch in einer Cloud. Das Problem ist, dass die einzelnen Silos üblicherweise nicht untereinander kompatibel sind, was deren Verwaltung zu einem komplexen manuellen Vorgang werden lässt.

Dabei ist zu beachten, dass zwar alle Daten einen Wert haben, manche allerdings wertvoller sind als andere. Außerdem verändert sich der Wert laufend und nimmt normalerweise im Laufe der Zeit ab. Dieser „Zeitwert“ verschärft das Datenverwaltungsproblem exponentiell. Zum Zeitpunkt ihrer Erstellung sind Daten am wertvollsten. Nach 72 Stunden beginnt ihr Wert zu sinken. In Abhängigkeit von der jeweiligen Branche sinkt der Wert nach 30 Tagen schnell und fällt nach 90 Tagen förmlich ins Bodenlose. Alle Jubeljahre werden die Daten dann plötzlich wieder zu heißen Daten. Um die Daten – einschließlich der warmen und kalten Daten – dennoch online und verfügbar zu halten, werden sie meist während ihres gesamtem Lebenszyklus auf Primärspeichern der ersten Ebene gehalten, bis letztlich eine technische Aufrüstung erfolgt.

Gartner und IDC schätzen, dass 75 % bis 90 % sämtlicher Daten in Datenzentren lediglich warme bis kalte Daten sind, obwohl sie möglicherweise auf teuren Speicherebenen vorgehalten werden. Allerdings sieht es ganz so aus, als ob das Verschieben der Daten mit abnehmendem Wert in der „Nahrungskette“ nach unten – auf kostengünstigere Speicher mit weniger Leistung oder auf Cloud-Speicher –, um Kosten zu senken, seinerseits eine arbeitsintensive, zeitaufwendige und teure Angelegenheit ist. Oft wird dazu ein sogenanntes hierarchisches Speichermanagement (HSM) mit platzhalterbasiertem Verschieben der Daten eingesetzt. Dieses hinterlässt häufig fehlerhafte Daten oder verwaiste Dateien und Objekte. Würde eine Speicheroptimierung allerdings zu einer Unterbrechung führen, sodass die Anwender nachher erneut geschult und die Anwendungen neu konfiguriert werden müssten, so ist dies meist ein Ausschlusskriterium. Allein aus diesem Grund verbleiben ungenutzte Daten oft auf kostenintensiven Speichern.

Das Durchsuchen aller unstrukturierten Daten oder deren Analyse auf handlungsorientierte Erkenntnisse ist eine langwierige, oft frustrierende Angelegenheit, falls die Daten auf viele verschiedene Speichersilos verteilt sind. Mit genug Zeit und viel manuellem Aufwand ist es zwar machbar, die Suche und/oder Analyse auf jedem Speicher einzeln durchzuführen und die Ergebnisse jeweils manuell zusammenzutragen oder alle Daten manuell auf ein System zu migrieren, das einen Global Namespace für Suche und Analyse bieten kann. Aber beide Ansätze sind beschwerlich und werden schnell unhaltbar, je größer die Menge der unstrukturierten Daten wird. Willkommen beim „furchteinflößenden Albtraum der IT“! Und doch – dieses Problem kann man mit StrongLink lösen.

Es geht nicht um Speicher. Es geht um Daten

StrongLink ist das erste kognitive Datenmanagementsystem, das speziell dazu dient, die sich überlagernden Probleme im Bereich des Datenmanagements und der Speicherressourcen zu adressieren. StrongLink setzt auf eine daten- und metadatenzentrierte Strategie, die auf das gesamte Problem fokussiert und nicht nur den üblichen speicherzentrierten Ansatz verfolgt, der sich allein auf die Infrastruktur konzentriert.

Bei einem kognitiven Ansatz geht es stets um Daten und Metadaten. Speicheranbieter tendieren jedoch dazu, das Daten- und Metadatenmanagement mit der Speicherhardware zu verquicken, indem sie argumentieren, dass eine bessere Speicherausstattung der Schlüssel zur Lösung der Datenprobleme sei. Viele versprechen eine großartige Lösung für das Datenverwaltungsproblem, wollen aber lediglich sämtliche unstrukturierten Daten in ein neues Speichersystem verschieben. Einige dieser Systeme beziehen zwar einen Global Namespace, Suche, Analyse, ja sogar Cloud-Speicher-Tiering mit ein, aber nur, falls die eingepflegten Daten für die neue Plattform konsolidiert werden. Andere versprechen wiederum ein Cloud-Gateway oder etwas, was man euphemistisch eine integrierte Cloud-Speicherlösung nennen könnte. Aber in den meisten Fällen verlangen diese Anbieter, dass die gegenwärtig unstrukturierten Daten auf ein neues Speicher- oder Gateway-System migriert werden, oder wollen gar ein neues Silo erschaffen. Sämtliche künftigen Daten, die nicht originär von diesem neuen Speicher stammen, müssen also den Migrationsprozess durchlaufen, auf den neuen Speicher kopiert bzw. verschoben und vom originären Speicher gelöscht werden. Das ist keine banale Aufgabe. Diese Vorgehensweise ist zeitaufwendig, arbeitsintensiv und recht teuer.

StrongLinks daten- und metadatenzentrierter Ansatz eliminiert dieses Problem, indem sämtliche Daten über jedes beliebige Dateisystem in einem Global Namespace präsentiert werden. Anwender und Anwendungen haben stets Zugriff auf ihre Daten, unabhängig davon, in welchem Speichersilo diese sich befinden. Dies erleichtert es den Anwendern ungemein, ihre Daten zu durchsuchen. Hierzu genügt eine einzige Operation über sämtliche Speichersysteme und Speichertypen hinweg. Das erleichtert und verkürzt auch Stapelanalysen. Die Fähigkeit des maschinellen Lernens von StrongLinks Richtlinien-Modul reduziert die Menge an Daten, die analysiert werden muss. Anwender können auch eigene Metadaten zu Dateien und Objekten hinzufügen, um eine projektbasierte Workflow-Automatisierung anzustoßen. Dies kann z. B. bei Projekten mit Bezug zur neuen DSGVO (Datenschutz-Grundverordnung) der EU hilfreich sein, die seit 2018 in Kraft ist. StrongLink bietet zusätzlich eine Versionsverwaltung von Daten- und Metadaten, eine robuste Datensicherung einschließlich zeitpunktgenauer Rücksicherung von Dateien und Dateisystemen. Dies eliminiert die Notwendigkeit von zusätzlichen Backups. Weiterhin gibt es die Möglichkeit zur Bestimmung der Datenherkunft inklusive unveränderbarer Audit-Trails.

Einer der größten Vorteile von StrongLink liegt jedoch darin, dass IT-Administratoren in die Lage versetzt werden, die Speichersystem-Infrastruktur aktuell und künftig nahtlos über unterschiedliche Speichersysteme von verschiedenen Herstellern hinweg optimieren zu können, ohne dabei den Zugriff der Anwender einschränken zu müssen.

Mit StrongLink können Daten, basierend auf der Richtlinie für den Lebenszyklus, dem Anwendungsfall, den Anforderungen für den Datenschutz, die Performance vor Ort oder der Compliance, automatisch von ihrem originären Datei- oder Objektspeicher auf eine andere beliebige Speicherplattform migriert werden (ohne die Anwender zu beeinträchtigen). Bei dem eingesetzten Speicher kann es sich um jeden Datei-, Objekt-, Band- oder auch um jeden optischen Speicher eines beliebigen Anbieters handeln. Es spielt keine Rolle, wohin die Daten verschoben werden. StrongLink verändert nicht die Ansicht des Anwenders oder der Anwendungen auf die Daten. Für den Anwender sind die Daten einfach jederzeit „online“, unabhängig davon, wo die Daten sich aktuell befinden. Es besteht nach der Datenmigration keine Notwendigkeit, Einsprungpunkte zu ändern oder Anwendungen umzuleiten.

Die Funktionalitäten von StrongLink

Das StrongLink-Regelwerk für maschinelles Lernen

StrongLink vereint das Datenmanagement und das Speichermanagement in einer einheitlichen Plattform, die viele verschiedene Anbieter und Systeme überspannt. Es eliminiert die Abhängigkeit von einem Anbieter. IT-Administratoren müssen nicht länger eine universelle Speicherlösung für alle Arten von Daten finden. StrongLink lässt dem Administrator die Wahl: Er kann jeden Speicher auswählen, der zum Anwendungsfall und zum Budget passt. Der Anwender bleibt davon unberührt, und trotzdem wird die Komplexität der IT nicht weiter erhöht.

Die Implikationen dieser Funktion sind tiefgreifend. Mit StrongLink können unstrukturierte Daten automatisch archiviert werden, basierend auf Richtlinien wie etwa zur Nutzungshäufigkeit und zum Alter. Trotzdem sind Daten stets „online“, und die Anwender haben Zugriff darauf. Es gibt allerdings Bedingungen, bei denen eine Archivierung früher stattfinden kann und auch sollte. Nehmen wir als Beispiel Daten im Bereich Internet der Dinge (Internet of Things, IoT). Viele dieser Daten sind Statusdaten, die zwar kurzzeitig wichtig sind, die aber vermutlich später niemals mehr angesehen werden – außer vielleicht für historische oder Trendanalysen. Das StrongLink-Daten-Modul erkennt Muster und Trends, die es dazu befähigen können, Richtlinien für solche Daten vorzuschlagen, basierend auf dem historischen Zugriffsmuster und den Geschäftsregeln. Diese Fähigkeiten sind integraler Bestandteil der StrongLink-Software. Hierfür wird keine weitere Archivierungssoftware oder Lizenz benötigt.

Ein anderes Beispiel bezieht sich auf die Vielzahl von Mediendateien, die während eines Produktionsablaufs im Bereich der Unterhaltung generiert werden. Diese werden üblicherweise auf verschiedenen Arten von Speichern und an verschiedenen Orten gespeichert. Die Unterstützung von Arbeitsabläufen ist bei solchen Projekten ein Muss, und es werden ständig Dateien manuell zwischen Anwendern und Orten verschoben. Indem ein virtualisierter Global Namespace zur Verfügung gestellt wird, der verschiedene Arten von Speichern und Örtlichkeiten überspannt, befähigt StrongLink IT-Organisationen, mit den Bedürfnissen der Anwender Schritt zu halten und gleichzeitig Speicher effizient zu betreiben. Das StrongLink-Richtlinien-Modul kann von Anwendern erstellte Metadaten nutzen, um Aktionen über verschiedene Orte und Datensilos hinweg zu automatisieren. StrongLink überblickt die Speicherinfrastruktur und fokussiert auf die Daten. Die Tools für maschinelles Lernen erkennen Muster von Metadaten und können so die automatisierte Platzierung von Daten, die Konsolidierung und Minimierung von Dateiverschiebungen sowie die Aggregation von verschiedenen Projektdateien auf einem Speicher und/oder im Archiv vorschlagen.

Der Datenschutz ist ein anderes Beispiel, das den Wert des StrongLink-Richtlinien-Moduls verdeutlicht. Zusätzlich zur zeitpunktgenauen Versionsverwaltung und zu kompletten Audit-Trails verfügt StrongLink über Richtlinien zur Verwaltung von Dateikopiervorgängen oder von multiplen Datenkopien für Dokumentanforderungen sowie die Remote-Zusammenarbeit. StrongLink-Richtlinien sind metadatengetrieben und können Replikationsereignisse in Bezug auf Effizienz, Datenhaltbarkeit, Dauerhaftigkeit, Zugriffsleistung, Wiederbereitschaftszeit nach einer Wiederherstellung (RTO) oder auch auf verlangte Wiederherstellungszeitpunkte (RPO) anhand von gelernten Mustern anpassen. Hinweis: Hierzu sind keine zusätzlichen Lizenzen für Datenschutz- bzw. Datensicherungssoftware erforderlich.

Die äußerst beschwerliche IT-Aufgabe der Datenmigration von einem alten Speichersystem auf ein neues im Zuge einer technischen Umstellung ist vielleicht das beste Beispiel, das klar zeigt, wie revolutionär StrongLink eigentlich ist. Eine Datenmigration ist äußerst zeitaufwendig und meist eine langwierige Angelegenheit, die viel manuellen Aufwand erfordert. Eine Datenmigration belastet die IT-Belegschaft und hat Auswirkungen auf den Zugriff der Benutzer auf die Daten. StrongLink geht dieses große Problem an der Wurzel an. StrongLink automatisiert die Datenmigration vollständig und transparent für den Anwender. Das Umrüsten auf eine neue Speicherinfrastruktur, ein System- oder Anbieterwechsel, ein Umzug in die Cloud etc. verlaufen mit StrongLink reibungslos und transparent. Es besteht keine Notwendigkeit mehr für eine anschließende Server-Wiederherstellung, das erneute Einbinden von Dateifreigaben oder Objektspeichern, das erneute Anlegen von Pfaden, Erteilen von Berechtigungen, Eingeben von ACL-Informationen etc. Ganz im Gegenteil haben die Benutzer laufend Zugriff auf ihre Dateien und Objekte – vor, während und nach der Datenmigration.

So löst StrongLink das Problem unstrukturierter Daten

StrongLink virtualisiert und abstrahiert den Global Namespace über multiple Datei- und Objektspeichersysteme, Anbieter und Cloud-Speicher-Dienstanbieter hinweg. Da Dateien und Objekte während ihres Lebenszyklus vermutlich vielfach verschoben werden, automatisiert und minimiert dieser virtuelle Global Namespace dieses Verschieben in einer für den Benutzer und für die Anwendungen transparenten Weise. Der Benutzer muss sich keine weiteren Gedanken darüber machen, wo die Daten aktuell gespeichert sind, da StrongLink den Datei- und Objektort zuordnet, ganz ähnlich einem Domain-Name-Server (DNS), der vom Webnamen auf dessen TCP/IP-Adresse leitet. Benutzer sehen ihre Dateien einfach an den erwarteten Einstiegspunkten, unabhängig vom tatsächlichen aktuellen Speicherort.

StrongLink ist in der Datenkommunikation in der Lage, Out-of-Band, In-band („außerhalb oder innerhalb des Kommunikationsbandes“) oder in einer Kombination von beiden Wegen zu operieren, und bietet damit das Beste aus beiden Welten. Out-of-Band macht Sinn bei Anwendungen, die höchste Leistung verlangen und nicht einmal die kleinste Verzögerung von wenigen zusätzlichen Millisekunden tolerieren können. In den Fällen, in denen Datenherkunft, sofortige Replikation, Echtzeit-Analytik oder Null-RPO-Datenschutz garantiert werden müssen oder eine reduzierte Netzwerk-Bandbreite zur Verfügung steht, macht In-Band mehr Sinn. Da beides zur Verfügung steht, muss das eine nicht für das andere geopfert werden.

StrongLink nutzt eine Peer-to-Peer-Netzarchitektur ohne Master, die auf offenen Standards basiert. Dies ermöglicht eine nahezu unbegrenzte Skalierbarkeit. Ein einzelner physischer oder virtueller Knoten wird als „Stern“ bezeichnet. Multiple Knoten werden zu einer „Konstellation“ zusammengefasst. Multiple Konstellationen (vor Ort oder verteilt auf viele Orte) werden zu einer „Galaxie“ verbunden. Sämtliche Knoten einer Galaxie sind im Global Namespace gleichwertige Partner. Solange mindestens zwei Knoten vorhanden sind, gibt es niemals eine einzelne Schwachstelle.

Der unvergleichliche finanzielle Vorteil von StrongLink

StrongLink hat zahlreiche Vorteile. Es löst viele Probleme, die auf unstrukturierte Daten zurückgehen. Der finanzielle Vorteil nach der Lösung solcher Probleme ist substanziell. Rufen Sie sich in Erinnerung, dass 75 % bis 90 % aller unstrukturiert vorliegenden Daten lediglich warme bis kalte Daten sind, die teuren Primärspeicher belegen. Indem Daten automatisch vom Primärspeicher auf Sekundär- oder Tertiärspeicher, in die Cloud, auf Band- und Objekt- oder optische Speicher verschoben werden, ergibt sich eine riesige Kostenersparnis. Die Kostenunterschiede für die beschriebenen Arten von Speichern bewegen sich in Bereichen zwischen 80 % und 98 %. Das summiert sich schnell und reduziert die Speicherkosten zwischen 60 % und 88 %. Die Kostenersparnis geht aber noch weiter. Es ergeben sich große Einsparungen im Bereich der Wartungskosten für Speicher und der Speicherinfrastrukturkosten (Stellflächen, Netzwerke, Verwaltung, IT-Personal oder auch künftige technische Aufrüstungen).

Weitere Einsparungen entstehen durch entfallende Kosten für Archivsoftwarelizenzen, Cloud-Gateways, Datensicherungs- und Datenschutzlizenzen und nicht zuletzt durch den Wegfall von Gebühren für die Verlagerung von Daten in die Cloud. Gebühren für den Export von unstrukturierten Daten in öffentliche Cloud-Speicher werden per Terabyte berechnet. Die mit StrongLink realisierbare Automatisierung führt außerdem zu Einsparungen bei den Kosten für Personalschulungen.

StrongLink spart auch kräftig bei den Lizenzierungskosten. StrongBox Data Solutions hält nichts von Lizenz- oder Gebührenmodellen, die sich an Kapazitäten oder an Terabytes orientieren, obwohl dies in der Speicherbranche und im Datenmanagement weit verbreitet ist. StrongLink-Lizenzen basieren auf den genutzten CPU-Kernen, Konstellationen und Galaxien. Im Vergleich zur Software von Wettbewerbern verursacht StrongLink üblicherweise nur rund ein Viertel der Kosten.

Schlussfolgerungen

StrongLink löst Probleme, die auf die problematische Verwaltung von unstrukturierten Daten und der zugehörigen Speicher zurückzuführen sind. Dabei finanziert sich StrongLink über bislang unvergleichliche Einsparungen quasi selbst.

Die StrongLink-Wissensbasis

Lizenzierung

StrongLink wird als Lizenznutzungsgebühr pro Jahr auf Basis von Cores berechnet.

Weitere Informationen

Kontakt

Gerne stehen wir Ihnen für Ihre Fragen zur Verfügung oder lassen Ihnen weitere Informationen zukommen. Nutzen Sie dafür bitte eines unserer Kontaktformulare oder unsere allgemeinen Kontaktinformationen: Cristie Data GmbH, Nordring 53-55, 63843 Niedernberg, Telefon: +49 6028 97950, Fax: +49 6028 9795799, E-Mail: info@cristie.de.