Home / Allgemein / Was Siri, Cotana, Ok Google und Cortana heute können – und was nicht

Was Siri, Cotana, Ok Google und Cortana heute können – und was nicht

Alle Smartphone-Nutzer kennen „ihren“ digitalen Assistenten. Viele nutzen sie, um Suche und einfache Aufgaben zu erledigen. Doch die Assistenten können inzwischen mehr und werden langsam auch für Unternehmen interessant. Björn Böttcher von Crisp Research beschreibt, was die Smarten Services können und wie Unternehmen damit umgehen können. 

16_08_20 Björn Böttcher Crisp

von Björn Böttcher, Crisp Research

Wie häufig sprechen Sie mit ihrem Smartphone, wenn kein anderer Mensch in der Leitung ist? „Hey Siri“ oder „Ok Google“ sind Ihnen nicht unbekannt? Sie sprechen also mit Maschinen? Nun ich mache es gerade. Ich diktiere diesen Text in meinen Computer. Wenn ich mich zurück erinnere an die Zeiten, wo ich mir ein teures Headset und die dazugehörige Software kaufen musste, diese dann nach der Installation stundenlang trainieren durfte, damit das Diktat dann einigermaßen funktioniert, so bin ich froh, dass heutzutage nur noch ein Knopfdruck oder ein „Hotword“ zum Diktieren notwendig ist. Diese sogenannten Bots und Assistenten sind jedoch aktuell nur bedingt und nur für einen vertikalen Anwendungsfall zu gebrauchen. Meistens beschränkt sich dieser auf die Suche.

Von Siri, Ok Google, Cortana und Co.

16_08_20 Tweet Bot CrispMit Siri ging nicht alles los, aber Siri konnte als eines der ersten Systeme eine breite Masse von Menschen begeistern, belustigen und unterstützen. Denn ein Assistent wie Siri hilft dabei Dinge zu erledigen, für die man eben gerade keine Hand frei hat. Der klassische Anwendungsfall ist die SMS oder E-Mail im Auto. Auch ein Termin ist schnell diktiert und eingetragen. Jedoch nur, wenn man sich mit Standardtools im Ökosystem des Anwenders bewegt. Doch auch das Verständnis ist manchmal nicht so einfach. Denn die Sprache ist aktuell noch eine große Hürde. Dies gilt für Apple, Google, Amazon und Microsoft. Eben für alle. Während Schlüsselwörter recht gut verstanden werden, ist ein Akzent schon mal hinderlich. Schwierig wird es, wenn die gewünschten Wörter noch in einer anderen Sprache geborgt sind. Dann kann auch ein einfacher Tweet schnell zu einem Problem werden, den man nur mit einer manuellen Korrektur auflösen kann. Hier sollte z.B. ein Tweet mit dem Hashtag #machinelearning versehen werden. Nun es ist ein Maschinenring geworden und Siri hilft mir auch nur beim Tüten und somit nicht beim Twittern.

 

Die beste Spracherkennung hat meiner Auffassung nach Google. Erst kürzlich wurde auf der Google Konferenz io16 bekannt gegeben, dass 20% der Suchanfragen über das Smartphone per Sprache gestellt werden. Wenn ich über mein persönliches Umfeld nachdenke, so fallen mir schon Menschen ein, die dazugehören. Und überraschenderweise nicht unbedingt junge Menschen. Google hat den Vorteil, dass es durch sehr clevere strategische Schachzüge die richtigen Daten erheben konnte, um zum Beispiel das Sprachverständnis einer Maschine verbessern zu können. Microsoft hat dagegen eine sehr gute Handschriftenerkennung. So hat jeder Anbieter eine Strategie und unterschiedlich gute Assistenten oder Bots, die mehr oder weniger hilfreiche Dinge für den Menschen im Alltag erledigen können. Kritisch wird es immer, wenn die Assistenten das Ökosystem verlassen. Auch sind die Komplexität und die Anzahl der Fragen, die man stellen kann beschränkt. Ein paar nette kleine Spielereien sollen helfen, den persönlichen Assistenten ein wenig „menschlicher“ wirken zu lassen, wenn Siri zum Beispiel eine Geschichte erzählen soll. Und auf Konkurrenz reagieren die Systeme auch ein wenig verwirrt.

 

Viv, Cortana und Allo – Next Generation Assistenten

Einige ehemalige Entwickler von Siri haben einen neuen Assistenten entwickelt, der automatisch ein wenig Programmcode erzeugen kann, um für den gewünschten Kontext der Anfrage eine Antwort erzeugen zu können. Diese dynamische Programmerzeugung hilft dabei, komplexere Fragestellungen zu beantworten oder Aufgaben zu erledigen, die auf  personalisiertes Wissen vom Nutzer zurückgreifen. Ein demonstriertes Beispiel war die Bestellung und Bezahlung durch den Assistenten von Blumen für die Mutter des Referenten. Mit zwei Sprachbefehlen war dieser Prozess vollständig abgeschlossen. Auch Microsofts Cortana kann mehr Kontext in Anfragen miteinbeziehen und auch Aufgaben gezielter abarbeiten. So weiß der Bot z.B. wenn ich nach einem Restaurant suche, welche Speisen ich bevorzuge und schlägt dann direkt ein italienisches Restaurant in der Nähe vor. Auch hier sind natürlich persönliche Daten des Nutzers notwendig. Google hat mit Allo einen neuen Assistenten vorgestellt, der auf den aktuellen Machine Learning-Verfahren des Konzerns beruht. Dieser ist sehr interaktiv und verbindet viele Informationen des Nutzers mit denen der gesamten Nutzer aus dem Google-Universum. So ist es beispielsweise durch die Nutzung von 200 Millionen Nutzern des Google Fotodienstes möglich gewesen, Bilder und deren Inhalte von Maschinen erkennen zu lassen. Dadurch kann nun auch auf eine Bildnachricht eine Antwortoption vorgeschlagen werden. Bei allen neuen Bots und Assistenten spielen die Daten eine wichtige Rolle. Daher ist die Frage nach der Datenethik bedeutsamer als je zuvor. Daten sind überall. Unternehmen müssen klar kategorisieren, ob Daten, die zwar durch technische Möglichkeiten erhoben werden können, auch aus rechtlicher und ethischer Sicht zu verwenden sind. Bei Google stellt beispielsweise die Menge der Daten über die Gesamtanzahl der Nutzer einen entscheidenden Mehrwert bereit.

 

Die Wertschöpfung

16_08_20 BotsystemeWertschoepfung CrispSind Assistenten und Bots eine Technologie für jedes Unternehmen? Wie sieht die Wertschöpfung aus? Assistenten und Bots leben sehr stark von Daten und Verfahren des Machine Learning. Die aufbereiteten und analysierten Daten stehen dem Framework zur Verfügung, mit dessen Hilfe gesamte Workflows oder einzelne Aufgaben automatisiert werden können. Wichtige Bausteine sind dabei zum Teil auch SaaS-Plattformen, die helfen das Routing zwischen den Plattformen und Ökosystemen zu überbrücken. Dazu zählen z.B. IFTTT und Microsoft Flow. Durch die Vereinigung unterschiedlicher Schnittstellen und APIs hat man so über ein Framework die Möglichkeit, einzelne Aufgaben oder komplette Workflows  zu automatisieren. Dies geschieht alles ohne das Handeln oder Eingreifen des Nutzers und beruht nur auf Daten der Allgemeinheit des Ökosystems sowie auf personalisierten Ausprägungen des einzelnen Nutzers.

 

Relevanz für Unternehmen?

Unternehmen, die häufig wiederkehrende Arbeitsabläufe haben, sollten in jedem Fall über eine Automatisierung mittels Bots nachdenken. Diese können auch im Sinne eines Agenten agieren und mit anderen Bots dann gemeinsam Aufgaben lösen.  Die Empfehlung lautet also, auch und gerade in Hinblick auf die Digitalisierung, Machine Learning und Assistenten bzw. Bots einzusetzen. Denn diese können mittlerweile einen Teil von Aufgaben automatisieren. Die Ökosysteme werde größer, die Plattformen öffnen sich und die unterstützenden Technologien aus dem Bereich des Machine Learning und der Open Source Community sollten Unternehmen dazu veranlassen, sich nun ausgiebig mit den Möglichkeiten und Einsatzbereichen zu beschäftigen und in die Strategie mit einzuplanen.

Share

Leave a Reply