Hadoop ist derzeit der „Rising Star“ am Firmament des Big-Data-Kosmos. Das Hadoop-Ökosystem gilt als technologischer Wegbereiter, mit der Unternehmen die Früchte der Big-Data-Revolution ernten können. Allerdings sind noch viele Fragen offen.
Das zentrale Versprechen lautet: mittels Hadoop fast beliebig große Datenmengen, mit beliebiger Struktur schnell, effizient und kostengünstig verwalten, nutzen und auswerten zu können. Eine Quelle für alle Formen analytischer Aufgabenstellungen; eine Art technologisches Rückgrat der Digitalisierung und Big-Datafizierung der Wirtschaft.
Da Hadoop eine sehr junge Technologie ist, fällt es Unternehmen häufig schwer, zwischen medialer Überhöhung und tatsächlich realisierbaren Mehrwert zu unterscheiden. Es liegen bislang erst wenige Erfahrungen vor, wie und wo Hadoop wirklich Sinn macht, welche Stolpersteine und Hürden bei der Implementierung lauern und welche potenziellen Vorteile sich in der Praxis tatsächlich ergeben.
Mit 261 Teilnehmern aus der DACH-Region und einer breit gefächerten Branchenverteilung gehört die Studie „Hadoop als Wegbereiter für Analytics“ des Business Application Research Center (Barc) nun zu einer der ersten Untersuchungen, die sich speziell Hadoop widmen. 78 Prozent der Befragten (171 Unternehmen) setzen danach Hadoop bereits ein oder planen dies bzw. können sich zumindest den Einsatz von Hadoop vorstellen.
Hadoop wird aktuell vor allem durch die IT getrieben (52 Prozent) und soll vorrangig technische Themen adressieren. Häufigstes Ziel ist die Nutzung als Plattform für eine einfachere Verwaltung großer Datenvolumina (68 Prozent) sowie semi-/unstrukturierter Datenquellen (61 Prozent).
An dritter Stelle folgen dann fachlich-analytische Anforderungen wie eine größere Flexibilität bei der Datenanalyse (44 Prozent) und nach erweiterten Analysefunktionen (42 Prozent), die Hadoop ermöglichen soll. Seltener als erwartet wollen Unternehmen hingegen durch das Framework ihre Kosten für die analytische Infrastruktur senken (37 Prozent).
Die Hadoop-Nutzung befindet sich insgesamt noch in der Klärungs- und Experimentierphase. So sehen etwa drei Viertel der befragten Unternehmen Hadoop momentan noch als ein weniger bzw. überhaupt nicht wichtiges Thema an. Dies lässt den Schluss zu, dass der Mehrwert von Big-Data-Initiativen und Analytics respektive das genaue Einsatzgebiet von Hadoop in vielen Unternehmen noch unklar sind.
Dort scheint es aus Sicht der Studienautoren schlicht an mehr und besserer Aufklärung über den Nutzen Hadoops zu fehlen. Umgekehrt nimmt das Framework bei jedem vierten Unternehmen mindestens einen wichtigen Stellenwert ein, was ein durchaus beachtlicher Wert ist für das junge Thema.
Erste Anwendungsbeispiele für Hadoop
Dabei finden sich durchaus schon erste produktive Systeme bzw. Unternehmen, die den Hadoop-Einsatz konkret vorbereiten und dabei ein durchaus breites Spektrum abbilden. Unter diesen Vorreitern ist die Nutzung von Hadoop als Ablaufumgebung für fortgeschrittene Analyse/Exploration aktuell die häufigste Anwendung (24 Prozent). Dies entspricht dem Wunsch vieler Fachbereiche nach einer eigenen, neben dem Data Warehouse existierenden Explorationsumgebung. Ein weiteres wichtiges Einsatzgebiet betrifft allgemein die erweiterte Nutzung von Daten – sei es als Staging/Landing Area oder zur Datenintegration polystrukturierter Daten (je 20 Prozent).
Technisches und fachliches Know-how gefordert
Insgesamt belegt die BARC-Studie, dass fehlendes technisches (68 Prozent) und fachliches Know-how (65 Prozent) aktuell die bei weitem häufigsten Probleme sind, über die Unternehmen klagen um das komplexe und technische Hadoop letztendlich nutzbar machen zu können. Hier werden die fehlende Marktreife und der Mangel an Aufklärung beim Thema Hadoop deutlich.
„Unternehmen müssen dringend einen Weg finden, diese Wissenslücke zu schließen, denn ohne entsprechendes Know-how ist an den produktiven Einsatz einer wenn auch noch so vorteilhaften Technologie nicht zu denken“, betont Timm Grosser, Senior Analyst Datenmanagement und Co-Autor der Studie.
Auch die dritthäufigste Antwort „Fehlende überzeugende Einsatzszenarien“ (43 Prozent) deute auf fehlendes Wissens über Hadoop im Besonderen und Big Data im Allgemeinen hin. Im Gegensatz zu klar strukturierten BI-Projekten sind Big-Data- und Hadoop-Initiativen sehr viel stärker explorativer Natur. Big-Data- und Hadoop-Projekte sollen durch ihren explorativen Charakter gerade dazu beitragen, konkrete Einsatzmöglichkeiten, Zusammenhänge und Erkenntnisse aufzudecken.
Was Barc empfiehlt:
Die Studie zum kostenlosen Download gibt es hier.