Home / Allgemein / Gartner warnt vor Data Lakes  

Gartner warnt vor Data Lakes  

Einige Anbieter vermarkten vermehrt  sogenannte Data-Lake-Konzepte, mit denen sich Big-Data-Analyse sehr viel einfacher und preiswerter durchführen lassen sollen. Gartner warnt indes vor derartigen Daten-Seen: Die Anbieter würden weder eine einheitliche Definition anbieten, noch würde deutlich, welchen Nutzen Anwender daraus ziehen könnten.

Data Lakes werden als Datenmanagement-Plattformen vermarktet, mit denen sich verschiedene Datenquellen in ihren jeweils nativen Formaten analysieren lassen. „Die Idee dahinter ist einfach,“ erklärt Nick Heudecker, Research Direktor bei Gartner: „Anstatt bestimmte Datentypen in einem dafür vorgesehenen Speicher abzulegen, speichert man sie  in einem sogenannten Data Lake in ihrem ursprünglichen Format. Das spart die Vorabkosten für die Transformation der Daten. Sobald sie in diesen See eingeflossen sind, stehen sie, so das Konzept, für jeden innerhalb des Unternehmens zur Verfügung.“ Data-Lakes sollen vor allem 2 wesentliche Probleme lösen helfen: Datensilos und Informationsvielfalt. Während Datensilos bekanntermaßen weitgefasste Analysen be- oder sogar verhindern, weil sie in den unterschiedlichen Datentöpfen unterschiedlich organisiert und abgelegt sind, ist das Thema Informationsvielfalt neueren Ursprungs. Es tritt bei großen Big Data-Initiativen auf, beiden man am Anfang noch nicht genau weiß, wonach gesucht wird. Dabei werden sehr viele verschiedenartige Informationen gesammelt, bei denen anfangs nicht genau definiert ist, aus welchen Datenarten sie bestehen. Speichert man diese Informationen in strukturierten Datenbanken behindert das eventuell künftige Analysen, weil diese vielleicht ganz anderen Fragen nachgehen.

„Die IT-Abteilungen sehen sicher Vorteile in der Nutzung der Data-Lakes, müssen sie doch nicht mehr verstehen, wie die Business-Seite die Informationen nutzen möchte – die Daten werden einfach in den See gekippt“, versucht White die Versuchung zu erklären, die das Konzept auf IT-Leute ausübt. Aus den Daten Informationen herauszudestillieren und sie so für das Unternehmen wertvoll zu machen ist dann Sache des Business. Doch  ohne die richtigen Governance-Strukturen funktioniert das nicht, selbst bei hohem zusätzlichen Technologieeinsatz nicht.  „Dann wird aus dem Daten-See ein Datensumpf, eine Ansammlung nicht verknüpfter Datenpools“, warnt White. Unternehmen würden dann immer noch unter Daten-Silos leiden, nur eben an einer Stelle.

 

 

 

 

Share

Leave a Reply

Your email address will not be published. Required fields are marked *

*