Die Flut von IoT-Lösungen auf elektronischer Ebene bietet nicht nur die Möglichkeit, mehrere Geräte miteinander zu vernetzen, sondern auch die Pflicht, über die Datenströme der Lösungen entsprechend nachzudenken. Diese Auseinandersetzung mit den Daten sollte bereits im Vorfeld angestoßen werden und Teil der Lösung von Tag eins an sein. Die Herkunft der Daten sollte dabei zwar genauestens geprüft und protokolliert werden, jedoch ist die Quelle an sich nicht so relevant wie der Wert der Daten selbst. Daher ist es möglich, verschiedene Szenarien in Betracht zu ziehen, wenn man über die Erzeugung eines neuen Dienstes oder Produkts nachdenkt.
Auf der einen Seite gibt es im Unternehmen bereits etliche Daten, die ggf. nur neu aufbereitet werden müssen. Dann wiederum gibt es Daten, die erst mit dem Produkt selbst und der Nutzung erzeugt werden. Und ferner gibt es noch Daten, die vielleicht nicht im eigenen Besitz liegen und auch nicht Kern des eigenen Geschäftsmodells sind, dennoch aber ein wichtiger Bestandteil des Produktes sein sollen. Diese Daten werden dann erworben oder zumindest die Nutzungsrechte (Lizenz) für diese.
Der Wert von Daten
Doch wie genau legt man den Wert von Daten fest? Wann macht es Sinn, Daten nur einzukaufen oder zu lizensieren? Wann lohnt sich die Aufbereitung der bestehenden historischen Daten im Unternehmen? Die Berechnung von Speicherkosten ist durch die Cloud Computing-Anbieter deutlich simpler geworden. Entweder kann man die Kosten direkt ablesen oder sie mit Hilfe von Kalkulationsprogrammen bestimmen.
Ebenso mussten Storage-Anbieter hier deutlich transparenter werden, damit die On-premise-Lösungen auch bei den ROI-Betrachtungen zum Vergleich herangezogen werden können und nicht hinten über fallen. Ebenso verhält es sich mit Backup-Kosten oder den Personalkosten für die Speicherung, Bereitstellung, Pflege von Daten und die darin involvierten Systeme.
Schwieriger wird es bei den Daten selbst. Sind diese extern zu erwerben, dann hängt zwar ein aktuelles Preisschild dran, jedoch ist auch hier in den nächsten Jahren eine Wertsteigerung denkbar. Sollten wir alle in Daten investieren und nicht mehr in Immobilien?
Wenn es bei der Daten-getriebenen Organisation zur Betrachtung von Daten und deren Wert kommt, dann sollte jedoch alle Formen der geschäftlichen Werte zur Kalkulation herangezogen werden. Unternehmen sollten sich dazu mit den unterschiedlichsten Fragestellungen beschäftigen, um eine Antwort nach eigener Fasson zu finden. Beispiele für die Betrachtung könnten etwa die folgenden Fragen bieten:
- Was ist der Wert einer Aktion? (Klicken, Licht einschalten, Strom ablesen, Umdrehungszahl auslesen, etc.) Lässt sich dies überhaupt beziffern? Wenn nicht, was fehlt, um die Aktion monetarisieren zu können?
- Was ist der Wert dieses Models, wenn es eigene Daten nutzt? Kann ich eigene Daten überhaupt einen Wert zumessen?
- Was ist der zu erwartende Wert, wenn das Modell fremde/externe Daten nutzt? Haben ich diese Daten für alle Ewigkeiten erworben und kann diese Daten für alle Zwecke gebrauchen? Fallen ggf. weitere Kosten in Zukunft an?
- Wieviel Mehrwert bringt die Anreicherung eines Dienstes durch das Hinzufügen von weiteren Aktionen oder Daten?
Daten verstehen
Wenn man sich über den Wert und damit zwangsläufig auch über die Bedeutung von Daten für das eigene Unternehmen ein Bild gemacht hat, dann geht es im nächsten Schritt um ein Verständnis für die Daten. Daten sind vielschichtige Wesen, die unterschiedliche Gestalten annehmen und in divergente Rollen schlüpfen können. Auf der einen Seite sind sie einfach und klar und können schon bei einer kleinen Änderung von äußeren oder inneren Umständen mutieren. Betrachten wir einige der Einflussfaktoren zur Klassifizierung von Daten, dann erscheinen sofort die Punkte:
- Sicherheit,
- Vielfalt,
- Geschwindigkeit sowie
- Zeit und Relevanz
vor dem geistigen Auge.
Die Sicherheit ist eine der wichtigsten Eigenschaften von Daten und sollte gerade bei IoT-Anwendungen einen besonders hohen Stellenwert besitzen. Wo vielleicht die Klassifizierung eines einzelnen Datums recht einfach nach „vertraulich“ oder „öffentlich“ geschehen kann, so ist die Kombination von Daten aus unterschiedlichen Kategorien schon wieder komplexer und unterliegt logischen Regeln und Abhängigkeiten.
Bei der Vielfalt ist die Zuordnung in der Regel wesentlich einfacher. Ob und in wieweit die Speicherung von Daten in einer einheitlichen Struktur sinnvoll ist, bleibt vielen anderen Faktoren geschuldet, wie beispielsweise der zugrundeliegenden digitalen IT-Plattform selbst. Bei der Geschwindigkeit kommt auch immer leicht die Anwendungsarchitektur mit ins Spiel. Wann muss welche Datenquelle welche Daten bereitstellen können, um die Weiterverarbeitung im Ablauf nicht zu stören? Bei einer reinen Batch-Anwendung ist dies noch leicht zu beantworten. Wenn jedoch noch Daten aus Echtzeitsystemen oder sozialen Netzwerken hinzukommen, dann wird das Design der Applikation selbst wesentlich komplexer. Ausschlaggebend sind hier stets die langsamste Komponente und der Zeitpunkt an dem der Kunden eine Information bekommen soll.
Hier knüpft sich auch gleich der nächste Punkt an: die Relevanz von Daten.
- Wann sind die Daten, welche für die Gewinnung einer Information notwendig sind, noch so frisch und aktuell, dass diese auch einen Nutzen bieten?
- Wann ist dies nicht mehr der Fall?
- Kann dieses Datum dann gelöscht werden oder kann dieses Datum in Zukunft noch einmal eine Rolle spielen?
- Ist dieses Datum nur für diese Applikation ab einen gewissen Zeitpunkt irrelevant oder für alle aktuellen und zukünftigen Applikationen?
Daten-bezogenes Denken
Verteilte Systeme werden im Zeitalter von IoT immer relevanter. Daten fallen an unterschiedlichen Stellen innerhalb einer Applikationslandschaft an und können zum Teil auch an Ort und Stelle, also beispielsweise auf dem IoT-Endgerät selbst, direkt verarbeitet werden. Dabei ist stets auf die Korrektheit der Daten in allen Arbeitsschritten zu achten. Nur wenn die Qualität der Daten über den gesamten Prozess hinweg gut ist, kann auch eine sinnvolle Information extrahiert werden.
Die Aktualität der Daten ist dabei von entscheidender Bedeutung. Nur frische Daten sind auch wertvoll. Die Überwachung der Qualität und der Aktualität geht dabei direkt bei der Erzeugung der Daten los. Sollte diese nicht der eigenen Handlungshoheit unterliegen, sollten definitiv Qualitätsprüfungen beim Eintritt in das Unternehmensuniversum durchgeführt werden. Diese Qualitätsschranken sind unablässig für den erfolgreichen Betrieb von Daten-basierten Applikationen.
Ebenso ist hier bei externen Datenquellen die Markierung der Herkunft notwendig, um einen Nachvollziehbarkeit zu gewährleisten. Diese sollte ebenso für die internen Datenquellen protokolliert werden.
Die Priorisierung von Daten ist der nächste Schritt bei der Analyse und der Nutzung von Daten innerhalb von Applikationen. Manche Daten müssen nicht in Echtzeit verarbeitet werden, sondern es genügt eine spätere Bearbeitung, man denke z.B. an Versicherungsprämien.
In puncto Sammelleidenschaft von Daten ist stets zu prüfen, welche Daten wirklich für eine Langzeitarchivierung notwendig sind. Darüber hinaus kann es ebenso sinnvoll sein, Daten zu erheben, die über die Zeit verloren gehen würden. Gerade bei einem hohen Grad von SaaS-Lösungen im eigenen IT-Portfolio sollte geprüft werden, ob nicht die eine oder andere Transaktion oder Information aus dem System in Zukunft interessant sein könnte. Einige Systeme vergessen nach einer gewissen Frist, was einmal bekannt war.
Empfehlung für Unternehmen
Daten sind nicht gleich Daten und auch wenn das eigene Unternehmen bereits viel mit Daten jongliert, sollte eine ganzheitliche Betrachtung im Fokus zukünftiger Vorhaben stehen. Die modernen Applikationen kreieren immer mehr Daten, und die Datenflut schwappt über die Unternehmen. Um bei dieser Sturmflut nicht zu ertrinken, ist eine Datenstrategie elementar wichtig.
Moderne IT-Betriebskonzepte ermöglichen ferner die Nutzung von Software und Diensten nach Bedarf (SaaS). Doch neben der Integration von SaaS-Lösungen mit bestehenden Systemen ist auch die Archivierung von Daten aus diesen Lösungen in die Betrachtung von Datenarchitekturen mit einzubeziehen.
Daten bilden in ausreichender Form und Güte die Grundlage von Machine Learning-Verfahren, welche einen entscheidenden Wertanteil in zukünftigen Produkten haben werden. Es ist daher zwingend erforderlich sich strategisch, kontinuierlich und ausführlich mit Daten auseinanderzusetzen.