Strukturierte versus unstrukturierte Daten: Was moderne Unternehmen wissen müssen




Strukturierte versus unstrukturierte Daten: Was moderne Unternehmen wissen müssen

Von Fabrice Gourlay, VP of Sales EMEA, Qumulo

Die meisten modernen Innovationen und Dienstleistungen sind heute digital. Sie beginnen, sie entwickeln sich und sie enden mit Rohdaten. Unstrukturierte Daten stellen dabei die treibende Kraft der digitalen Transformation dar. Um allerdings neue Medikamente herzustellen, Krankheiten zu behandeln, Kommunikationsmöglichkeiten auf das nächste Level zu heben sowie intelligente Maschinen zu entwickeln, die es ermöglichen, schneller, intelligenter und nachhaltiger zu arbeiten, ist es zunächst erforderlich, unstrukturierte Daten nicht nur zu sammeln, sondern sie auch bestmöglich in nutzbaren Wert umzuwandeln.

Ist die Welt bereit für den unstrukturierten Datenberg?

Unstrukturierte Daten bilden die Grundlage von Innovationen in unzähligen Lebensbereichen. Die Genkartierung etwa wurde für die Impfstofferstellung verwendet. Kartierte Gendaten werden in einem unstrukturierten Format gespeichert. Filme von Mobiltelefonen sowie Sicherheitsaufnahmen von Kameras werden zunehmend in hoher 8K-Qualität aufgenommen – genau wie die neuesten Blockbuster, die es auf die Kinoleinwand schaffen. Die Speicherung von Videodateien erfolgt ebenfalls in einem unstrukturierten Format. Datensätze, die Einsatz finden beim Training von Maschinen, sei es im Kontext autonomen Fahrens oder auch zur Bestimmung des optimalen Ortes bei Ölbohrungen, nutzen riesige Mengen unstrukturierter Daten als Teil ihrer Trainingssätze.

Innovation gekoppelt mit Kosten- und Zeitoptimierung als Ziel

Gut verwaltet und transformiert, können unstrukturierte Daten bei der Gestaltung unserer modernen Welt von entscheidender Bedeutung sein. Die Krux: die meisten modernen Technologien wurden nicht mit Blick auf die Nutzung unstrukturierter Daten entwickelt. Als direkte Folge werden unstrukturierte Daten bislang nicht nur viel zu wenig genutzt, sie müssen auch im Zusammenhang mit zahlreichen Herausforderungen betrachtet werden. Moderne Unternehmen allerdings, die das Potential unstrukturierter Daten bereits heute besser ausschöpfen können, sind nicht nur hochgradig innovativ, sie arbeiten auch optimiert mit Blick auf Kosten und Zeit.

Eine Frage der Definition: nicht alle Daten sind gleich

Wenn Menschen an Daten denken, haben sie normalerweise automatisch strukturierte Daten im Sinn. In Wirklichkeit erzeugen Unternehmen, Kunden und Privatmenschen aber weitaus mehr unstrukturierte Daten. Sowohl strukturierte als auch unstrukturierte Daten sind von unschätzbarem Wert. Allerdings unterscheiden sie sich deutlich. Als eine Gemeinsamkeit bergen beide Cloud-Potential.

Laut Fintech Futures machen unstrukturierte Daten etwa 80 % aller Datenbanken aus. Wenn es darum geht, den Wert unstrukturierter Daten freizusetzen, nutzen allerdings bislang nur sehr wenige Unternehmen vollumfänglich die gesammelten Informationen. In einem Beitrag auf Fintech Futures stellt Ryan Stewart, Financial Services Lead bei Cloud Technology Solutions, fest: „Das größte Hindernis beispielsweise mit Blick auf den Bankensektor ist eine umfangreiche und veraltete IT-Infrastruktur, da 92 % der 100 führenden Banken weltweit immer noch auf Legacy-Systeme angewiesen sind.“

Strukturierte und unstrukturierte Daten im Vergleich

Strukturierte Daten liegen in standardisierter Form vor, folgen einer vorab definierten Struktur, sind insgesamt einfach zugänglich und vergleichsweise relativ leicht zu analysieren. Sie können in Zeilen, Spalten, Tabellen, Tabellenkalkulationen und Datenbanken gespeichert werden. Nahezu die gesamte Datentechnologie der letzten Dekade wurde entwickelt, um sie zu verwalten.
Unstrukturierte Daten Hierbei handelt es sich um ein natives Dateiformat und damit quasi um den exzentrischen Cousin strukturierter Daten. 80 % aller Unternehmensdaten sind heute unstrukturiert. Die Speicherung in Data Lakes bietet sich an. Unstrukturierte Daten stellen die Substanz des globalen Wandels, der Innovation, der Zusammenarbeit sowie der Transformation dar.

Unstrukturierte Daten als Motor der Zukunft

In allen Branchen nehmen unstrukturierte Daten explosionsartig zu. Laut führenden Analysten werden Unternehmen bis 2024 ihre unstrukturierten Daten (On-Premises, Edge oder Cloud-gespeichert) verdreifachen. In einer Welt, in der Remote-Arbeit zu einer nicht mehr wegzudenkenden Realität geworden ist, ist die Cloud zudem nicht mehr optional.
Die Nutzung und Verwaltung unstrukturierter Daten steckt allerdings noch in den Kinderschuhen. Und wie unzählige Organisationen, die Daten mit veralteten Systemen verwalten und speichern, festgestellt haben, ist die Datentransformation leichter gesagt als getan.
Eine Herkulesaufgabe meistern: Bewusstmachung der Problemfelder
Nachfolgend sind sieben der häufigsten Gründe aufgezeigt, die veranschaulichen, weshalb viele Unternehmen das Potential unstrukturierter Daten nicht voll ausschöpfen können.

1. Unternehmen straucheln mit Speicherkapazität und Datenzugänglichkeit
Rohdaten – oft von Sensoren, Kameras, Sequenzern, Autos oder Maschinen erfasst – sind zunächst von nachgeordneter Bedeutung. Die Umwandlung dieser Daten in Erkenntnisse, welche direkt Innovationen befördern, erfordert die präzise Zusammenarbeit über riesige Datenmengen hinweg. Dateninnovation setzt aber in erster Linie Datenzugänglichkeit voraus. Unternehmen sammeln oft Hunderte Terabyte oder gar ein Petabyte an Daten, die sie auf unbestimmte Zeit speichern müssen. Nur zum Vergleich: dabei handelt es sich um das Speicheräquivalent von 1000 Laptops. Weil die Datenmenge wächst, muss entsprechend auch der Speicherplatz dynamisch mitwachsen, ohne dass die Datenzugänglichkeit leidet.

2. Legacy-Systeme wurden nicht für moderne Workloads oder die Cloud entwickelt
Die alte Garde der Scale-out- und Scale-up-Lösungen war nie darauf ausgelegt, die heutigen Anwendungen, Dateitypen, Workloads und Volumen zu bewältigen. Mit Blick auf die beiden Hauptmethoden zum Speichern und Verwalten unstrukturierter Daten – Objektspeicher und Dateispeicher – sind nur Dateisysteme darauf ausgelegt, Daten in ihrem nativen Dateiformat zu bearbeiten. Legacy- und Objektspeichersysteme können nicht die Leistung, Sichtbarkeit, Portabilität, Kontrolle oder Skalierbarkeit bieten, die modernes Datenmanagement sowie die Cloud-Migration erfordern.

3. Legacy-Architektur schlägt der Skalierbarkeit ein Schnippchen
Legacy-Architekturen sind oft On-Premises und hardwaregebunden. Speicher unterliegt demnach der Größe einer Rechenzentrumsarchitektur. Wenn die Rechenleistung skaliert wird, muss auch der Speicher skaliert werden. Aber Rechenzentrumsimmobilien sind kostenintensiv. Diese Grenzen können die Kreativität und die Erforschung neuer Möglichkeiten im Kontext unstrukturierter Daten direkt im Keim ersticken.

4. Datensilos verhindern reibungslosen Zugriff und Zusammenarbeit
Um Herausforderungen bei der Skalierbarkeit zu bewältigen, haben sich einige Unternehmen auf Speicher-Arrays oder aber mehrere Rechenzentren konzentriert. Während diese Lösungsansätze vorübergehend Speicherprobleme beheben können, erschweren Datensilos und unterschiedliche Speicherarrays im Umkehrschluss den Echtzeitzugriff sowie die Zusammenarbeit. Um Dateneinblicke zu optimieren und nutzbar zu machen, sind konsolidierte Daten ideal.

5. Konsolidierte Daten schränken die Optionen der Speicherung ein
Allerdings bergen auch konsolidierte Daten im Kontext von Aggregation, Datenbereinigung und Datenanreicherung Einschränkungen, vor allem mit Blick auf Speicheroptionen und Speicherkapazitäten. Weder Rechenzentren noch Öffentliche Clouds bieten mehr als eine Handvoll begrenzter Speicheroptionen.

6. Den Anschluss nicht verpassen: die Konkurrenz migriert in die Cloud!
Führende Analysten prognostizieren, dass öffentliche Cloud-Dienste für 90 % der Daten- und Analyseinnovationen bald unerlässlich sein werden. Zukunftsorientierte Unternehmen und Wettbewerber haben diese Prognose verinnerlicht. Sie verlagern Workflows in die Public Cloud. Unstrukturierte Daten beschleunigen diese Migration. Je schneller Unternehmen zur Public Cloud gelangen, desto mehr Wettbewerbsvorteile erzielen sie.

7. Top-Talente favorisieren häufig Remote-Work
Im Homeoffice fehlt es oft noch an ausreichender Infrastruktur, um mit großen Datenmengen produktiv zu sein. Top-Talente der Industrie favorisieren allerdings häufig Cloud-basierte Arbeitsplätze, die für Remote-Arbeit ausgelegt sind und die Zusammenarbeit erleichtern.
Ausblick auf Morgen: wer hat Angst vor unstrukturierten Daten?
Die Verwaltung, Speicherung und Umwandlung unstrukturierter Daten in großem Maßstab, um Innovationen voranzutreiben, mag für viele Unternehmen entmutigend erscheinen. Im Folgenden seien drei Ratschläge beleuchtet:

1. Bedachtsamkeit im Kontext der Zukunft ist Trumpf
Die Cloud ist heute nicht mehr wegzudenken. Mit AWS, Azure sowie Google Cloud Platform bestehen zahlreiche öffentliche Optionen. Aber was heute im Fokus steht, ist vielleicht morgen schon Teil einer größeren Transformation. IT-Entscheidungsträger tun gut daran, Bedachtsamkeit beim Blick auf die Zukunft walten zu lassen. Ideal ist der Fokus auf eine Infrastrukturstrategie, die zukünftige Flexibilität bietet.

2. Unternehmen müssen sich klar sein, worauf sie sich einlassen
IT-Entscheidungsträger müssen fokussiert und selektiv vorgehen im Kontext ihrer individuellen Strategien. Das Augenmerk sollte auf Anwendungen liegen, die einen Mehrwert für die jeweiligen Endnutzer schaffen. Infrastruktursoftware, mit der Praktiken standardisiert werden können und Komplexität zugleich reduziert erscheint, stellt immer einen Gewinn dar. Unternehmen sollten ferner eine stabile Dateidatenplattform wählen, die mit unstrukturierten Daten in ihrem nativen Dateiformat umgehen kann. Flexibler, kostengünstiger Speicher, der die Beschränkungen von Hardware, Rechenzentrum und Cloud überwindet, sollte im Mittelpunkt der Überlegungen stehen. Skepsis ist ferner geboten gegenüber Anbietern und Plattformen mit Lösungen, die diese Flexibilität missbrauchen.

3. Beim Wechsel in die Cloud zahlt sich in erster Linie Strategie aus
Wenn ein Unternehmen den Schritt in die Cloud wagt, hilft ein dreistufiges Framework:
Konsolidieren unstrukturierter Daten und Workloads an einem Ort. Dadurch werden die Kosten sowie die Komplexität der Verwaltung mehrerer Systeme reduziert.

Erweitern der Infrastruktur in die Public Cloud im Kontext unstrukturierter Daten. Dies kann durch Cloud-Bursts oder aber durch den Aufbau individueller Workloads erzielt werden.

Das Transformieren von Workflows und insgesamt das Verfolgen einer nachhaltigen
digitalen Transformation nimmt Zeit in Anspruch. Unternehmen sollten geduldig sein, strategische Schritte mit kühlem Kopf planen und darauf achten, nicht direkt zur Transformationsphase überzugehen.

Wo das Konzept stimmt, klappt Innovation im Wortsinn

IT-Entscheidungsträger, die bereit sind, ihre jeweiligen Infrastrukturstrategien bescheiden und bewusst anzugehen, und die darüber hinaus den Willen zeigen, strategische Maßnahmen zu ergreifen, um in die Cloud zu wechseln, können Zeit und Geld sparen und zugleich Top-Talente halten. Mit der richtigen Lösung können Unternehmen Schritt für Schritt die volle Kontrolle über ihre Daten erlangen und zugleich den Wert und die Freiheit unstrukturierter Daten nutzen, um Innovationen im Wortsinn voranzutreiben.

Über Qumulo, Inc.
Qumulo ist der wegweisende Marktführer bei der Vereinfachung der skalierbaren Datenverwaltung in ihrer nativen Dateiform in Hybrid-Cloud-Umgebungen. Die hochleistungsfähige Dateidatenplattform von Qumulo wurde entwickelt, um Workflows und Anwendungen mit Daten in ihrer nativen Dateiform On-Premises und in der Öffentlichen Cloud zu erstellen, zu speichern sowie zu verwalten. Fortune-500-Unternehmen, große Film- und Animationsstudios und einige der größten Forschungseinrichtungen der Welt vertrauen auf Qumulo, um den gesamten Datenlebenszyklus ganz einfach zu verwalten – mit kosteneffizienter Kapazität, dynamischer Skalierbarkeit, automatischer Verschlüsselung, Echtzeit-Transparenz und einer fortschrittlichen API, die es Kunden ermöglicht, Qumulo einfach in ihr Ökosystem und ihre Workflows zu integrieren. www.qumulo.com

Kontakt
Qumulo
Morgan Butterfield
4th Ave #1600 1501
WA 98101 Seattle, WA 98101, United States
425.444.8799
mbutterfield@qumulo.com
https://qumulo.com

Über den Veröffentlicher

PR-News

Pressemitteilungen und Unternehmensnews per Klick parallel auf +250 Presseportalen, Newsdiensten und Social Media veröffentlichen. http://www.pr-gateway.de