Das Projekt Data Mining und Wertschöpfung der Universität Leipzig erarbeitet gemeinsam mit 1000°DIGITAL einen Prototypen, welcher Informationen aus unstrukturierten Quellen vollautomatisch in ein Chatbot-System integriert, zum Beispiel von Websites, Foren oder Dokumentationen. Auf diese Weise soll sich der digitale Assistent auch für individuelle Anwendungen von Unternehmen eigenen können und den anfallenden Konfigurationsaufwand reduzieren. Das Forschungsprojekt, welches sich über einen Zeitraum von zwei Jahren erstreckt, wurde nun gestartet.
Erste Versuche mit DocChat
Die Projektgruppe prüft und implementiert zunächst einen bestehenden Ansatz namens DocChat. In dem Forschungsbeitrag werden verschiedene Technologien in einem Ensemble eingesetzt. Dazu gehören klassische Methoden aus dem Information Retrieval (IR) wie TF/IDF gewichtete Wortvergleiche, Convolutional Neural Networks (CNN) for Text, Werkzeuge aus der automatischen Übersetzung, z.B. Giza++ von IBM oder etwa Topic Modelle (TM). Durch die Implementierung des DocChat-Ansatzes soll ergründet werden, welche dieser Technologien den größten Einfluss auf eine erfolgreiche chatbasierte Suche in unstrukturierten Text-Daten haben.
Am Beispiele wird gezeigt, wie mit Hilfe des DocChat Ansatzes aus einer Sammlung von 1000 Wikipedia Artikeln eine richtige Antwort akquiriert wird. Die Methode ist eng verwandt mit dem Open Question Answering und dem Information Retrieval. Nur eben auf der Basis von dialogbasierter Kommunikation. Der folgende Projektablauf sieht vor, weitere ähnliche Ansätze zu prüfen und zu erproben.
Neue grafische Schnittstellen für die Konfiguration
Die Nachvollziehbarkeit von Entscheidungen, die innerhalb der Kommunikation mit einem Dialogsystem getroffen werden, ist eine nötige Information für die Pflege und den Betrieb dieser Systeme. Anhand der sequenziellen Abfolge von Entscheidungen und Nutzereingaben versteht der Chatbot-Betreiber, welche Dauer, Dynamik, Umwege und Fehler die Kommunikation mit sich bringt.
Fehler und die Dauer der Konversation können im laufenden Betrieb, wie mit einem Debugger, korrigiert werden. Die Nutzererfahrung wird während des Betriebs kontinuierlich verbessert.
Zur Darstellung der Logdateien sollen in der künftigen DocBot-Anwendung gerichtete Graphen genutzt werden. Die in den Logdateien enthaltenen historischen Nutzereingaben und Chatbotantworten können in Form eines Dialogbaums abgebildet werden. Dabei sollen vor allem Abschnitte im Graph hervorgehoben werden, die für eine problematische Nutzererfahrung stehen (z.B. besonders lange Dialoge oder Schleifen). Mit dieser Unterstützung kann der Betreiber deren Ursachen erkennen, entfernen und das System verbessern.
Durch die Darstellung als gerichteter Graph kann weiterhin untersucht werden, ob genügend Spracherkennungsregeln definiert sind, damit die definierten Intents im Chatbotsystem trennscharf sind oder ob ein Nutzer unerwünscht zwischen verschiedenen Informationsbereichen springen kann.
In einer ersten Implementierung widmen wir uns der Darstellung komplexer Dialog-Bäume und wie bestimmte Visualisierungsmerkmale (wie z.B. Zoom, Pan und View) bei der Arbeit helfen können.