"Wie besprochen"​: So profitieren Unternehmen von KI-generierten Gesprächs-Zusammenfassungen
Ein Jahr lang arbeitete das Team von Tucan.ai an einer Lösung für KI-generierte Gesprächszusammenfassungen. Seit Mitte September 2022 ist diese nun online, als erstes smartes Software-Produkt seiner Art auf deutschsprachigen Markt.

"Wie besprochen": So profitieren Unternehmen von KI-generierten Gesprächs-Zusammenfassungen

Automatische Gesprächszusammenfassungen und Meeting Minutes werden bei immer besserer Leistung auch unter Verbrauchern zunehmend populär, speziell in Zeiten von vermehrter Remote Work. In diesem Beitrag erfahren Sie, was hinter KI-basierter Ergebnisprotokollierung steckt, wie sie unternehmerisch klug genutzt werden kann und in welchen Branchen sie besonders gerne eingesetzt wird.

Der technologische Fortschritt im Bereich automatischen Sprach- und Sprechererkennung, die Verbesserung von Audioaufnahmen, die zunehmende Beliebtheit von natürlicher Sprache als Computerschnittstelle sowie die Zunahme an Tele- bzw. Remote-Work im Zuge der Corona-Pandemie haben in den vergangenen Jahren dazu geführt, dass das Interesse an automatisierter Gesprächszusammenfassung stark angestiegen ist.

Vereinfacht ausgedrückt, wird dabei ein Text mithilfe eines vorab trainierten Datenmodells und maschinellen Lernens zu einer umfassenden Zusammenfassung verdichtet. Im Kern geht es darum, die wichtigsten Inhalte menschlicher Sprache zu identifizieren und in einer komprimierten Form auszuformulieren. Zusammenfassungen sind meist besser verständlich als direkte Wortprotokolle, da sie keine irrelevanten Inhalte, Pausen, Unregelmäßigkeiten und Wiederholungen beinhalten, die beim Sprechen sehr häufig vorkommen. 

No alt text provided for this image

NLP: Großer Nutzen für Unternehmen

Für Unternehmen ist die rechnerische Verarbeitung natürlicher Sprache bzw. Natural Language Processing (NLP), welches das Fundament der KI-Spracherkennung bildet, in eine Vielzahl von Prozessen integrierbar und auf unterschiedliche Weise nützlich. 

Spracherkennung

NLP wird bereits von einigen Zeitungen und Zeitschriften eingesetzt, um Interviews zu transkribieren, so dass die Fragen und Antworten nicht mehr manuell aufgeschrieben werden müssen. Da NLP den Text analysieren kann, ist es in der Lage, die wichtigen Teile des Gesprächs hervorzuheben. 

Chatbots

Als eine der ersten für Verbraucher*innen entwickelten NLP-Lösungen sind Chatbots in der Lage, einfache Anfragen zu verstehen und Kund*innen richtig weiterzuleiten, sodass Mitarbeiter*innen komplexere Anfragen priorisieren können. 

“Erkennt die Software ein Thema, kann sie z.B. informieren, dass über diese Punkte bereits in einer anderen Abteilung gesprochen wurde.”


Vorschläge

Eine Schreibblockade kommt in vielen Branchen vor, und NLP könnte ein Weg sein, sie zu durchbrechen. Mit der suggestiven Eingabe können die Benutzer über eine Reihe von Satzstrukturen entscheiden. Dies kann auch im akademischen Bereich eingesetzt werden, um Literatur vorzuschlagen, die zum Thema passt.

Zusammenfassungen

Wie bereits erwähnt, ist NLP in der Lage, den Text zu analysieren und die relevanten Teile herauszufiltern. In Branchen, die mit langen Dokumenten zu tun haben, wie z. B. in der Rechtsbranche, könnte die Fähigkeit, die meisten unnötigen Seiten zu umgehen, den Prozess beschleunigen. 

„Wir befinden uns in einer schnelllebigen Epoche, in der wir zunehmend Zeit mit alltäglicher Kommunikation verbringen. Was genau vor ein paar Monaten oder Jahren besprochen worden war, wissen wir jedoch selten, weil unsere Kommunikation nicht gut genug dokumentiert und archiviert wurde”, erklärt Michael Schramm, CTO und Mitgründer von Tucan.ai. 

Bei Tucan.ai geht es im Großen und Ganzen darum, sämtliche Informationen, die einem Unternehmen zur Verfügung stehen, intelligent zu verknüpfen, sodass Wissen richtig weitervermittelt wird und keine unnötigen Missverständnisse aufkommen. “Erkennt die Software dann beispielsweise ein bestimmtes Gesprächsthema”, erläutert Michael die Vision, “kann sie quasi in Echtzeit darüber informieren, dass über diese Punkte bereits schon einmal in einer anderen Abteilung gesprochen worden war.”

No alt text provided for this image


Anwendungsfälle der KI-Gesprächszusammenfassung

Wie auch andere Anbieter stellt Tucan.ai bereits seit mehreren Monaten KI-generierte Wortprotokolle und Transkripte zur Verfügung. Was das Tech-Startup jedoch von seinen Mitstreitern am deutschsprachigen Markt unterscheidet – neben einer ausgeklügelten Sprecher-, Akzent- und Dialekterkennung –, ist die einzigartige Fähigkeit, automatisch Ergebnisprotokolle und Zusammenfassungen von Meetings, Telefonaten, Interviews usw. erstellen zu können. 

"Es geht darum, die wesentlichen Inhalte zu identifizieren. Was wir alle am Ende einer Besprechung brauchen, ist eine Zusammenfassung der wichtigsten Punkte, kurz und prägnant auf einer Seite. Und das möglichst automatisiert, so dass man nicht viel Zeit für die Nachbearbeitung aufwenden muss”, sagt Michael, der für Tucan.ai in Wien die Stellung hält. Derzeit dauert es noch ein paar Minuten bis diese fertiggestellt sind. Erklärtes Ziel ist es aber, sie möglichst bald auch in Echtzeit anbieten zu können.

KI-Zusammenfassungen werden bereits jetzt in immer mehr Bereichen eingesetzt, etwa in Nachrichtenmedien, auf Konferenzen und im Gesundheitswesen. Die Vorteile reichen von Kostenreduktion und Effizienzsteigerung in Call Centers über einfachere Lernprozesse in Online-Kursen bis hin zu mehr Prozessübersicht und Klarheit im Projektmanagement. 

No alt text provided for this image


Mediale Berichterstattung 

In der Medienwelt können automatische Gesprächszusammenfassungen auf viele verschiedene Arten und Weisen eingesetzt werden, um Prozesse zu vereinfachen und zu optimieren. Einer der naheliegendsten Anwendungsfälle ist dort die rasche und verlässliche Aufbereitung und Archivierung von Audio- und Videomaterial, das über Agenturen online weltweit und oftmals in Echtzeit verbreitet wird. Im Sportjournalismus eignen sich KI-Systeme auch zur schnellen Zusammenfassung von Höhepunkten und Erstellung von Live-Tickern, ebenso in der heutigen Politik- und Wirtschaftsberichterstattung. 

Patienten-Kontakt und Anamnese 

Im Gesundheitsbereich hat die Zusammenfassung von Sprache beispielsweise das Potenzial, eine neue Generation von “digitalen Schreiberlingen” (Systeme, die klinische Aufzeichnungen machen) und sogenannten “Conversational Agents” (Dialog-Systeme, die mit Patienten interagieren können) zu schaffen. 

Telefonischer Kundenkontakt

Insbesondere in Call Centers bzw. Kundenkontaktzentren erfreuen sich Software-Tools für die automatische Zusammenfassung von Gesprächen großer Beliebtheit. Sie helfen hier nämlich bei der Identifizierung von wichtigen Gesprächsthemen und automatischen Bewertung der Kundenzufriedenheit (Sichtwort “Sentiment-Analyse”) sowie auch bei der Leistungskontrolle von Agent*innen und Kundenbetreuer*innen. 

Konferenzen, Vorträge und Kurse 

Ebenso für die Verschriftlichung und gezielte Verbreitung von Inhalten aus Konferenzen, Vorträgen und Kursen eignen sich KI-Zusammenfassungen besser als Wortprotokolle. Bei TED-Talks erfreuen sie sich schon seit geraumer Zeit sehr großer Beliebtheit. Und auch in traditionellen Online-Kursen und Vorlesungen werden Meeting bzw. Summary Minutes mit zunehmender Präzision mehr und mehr genutzt; insbesondere in den USA, aber auch in Europa steigt die Nachfrage unter Verbraucher*innen rasant. 

No alt text provided for this image

Meetings im Projektmanagement

Ergebnisprotokolle bzw. Meeting (Summary) Minutes sind ein zentraler Bestandteil des klassischen Projektmanagements. Eine der wichtigsten Voraussetzungen für effektives Projektmanagement ist es, dass sich alle Beteiligten auf dem gleichen Wissensstand befinden, vor allem dann, wenn es um die Zuteilung von Zuständigkeiten geht. Erfolgreiche Projekte basieren auf einem einheitlichen Verständnis und einer uniformen Ausführung von Aktivitäten durch unterschiedliche Beteiligte. Ein gut ausgeprägtes Verständnis der Voraussetzungen und Vorgehensweisen ist hierfür wesentlich. 

Florian Polak, der gemeinsam mit ihrem dritten Mitgründer im Bund, Lukas Rintelen, die Unternehmenszentrale in Berlin aufgebaut hat, über ihre ursprüngliche Idee für das neue Summary-Tool: “Im Laufe der Gründungsphase war unsere Zeit in Meetings nach ein paar Monaten auf über 17 Stunden pro Woche angestiegen, und es fiel uns immer schwerer, alle relevanten Punkte und Informationen längerfristig im Blick zu behalten. Das veranlasste uns erstmal darüber nachzudenken, wie wir unsere Besprechungen, Notizen und Follow-Ups mithilfe von KI verbessern können.” 

Informationen sinnvoll verknüpfen

Im Allgemeinen geht es Tucan.ai darum, sämtliche Informationen, die einem Unternehmen zur Verfügung stehen, intelligent auszulesen und zu verknüpfen, sodass Wissen richtig weitervermittelt wird und keine vermeidbaren Informationsverluste und Missverständnisse aufkommen.“Erkennt die Software dann zum Beispiel ein bestimmtes Gesprächsthema”, erläutert Schramm seine Vision, “kann sie Mitarbeiter darüber informieren, dass darüber schon einmal in einer anderen Abteilung gesprochen wurde.”

Tucan.ai ist auf Enterprise-Projekte spezialisiert und bietet neben einem Cloud-Service auch individuelle on-premise Lösungen sowie API-Integrationen an. Unter den ersten großen Enterprise-Kunden von Tucan.ai befinden sich namhafte Unternehmen, wie die CreditPlus, die BWI GmbH des deutschen Verteidigungsministeriums und Telefónica Deutschland, sowie eine Reihe an wissenschaftlichen Forschungseinrichtungen, u.a. an der Universität Wien und der TU Dresden. 

“Wir alle verbringen immer mehr Zeit in Meetings. Eine kontrolliert trainierte Spracherkennungs-KI kann helfen, externe wie interne Kommunikationsprozesse simpler und produktiver zu gestalten", sagt Florian Polak, CEO und Mitgründer des jungen Startups. "Insbesondere die Zusammenarbeit in Meetings wird durch die neue Summary-Funktion sehr viel einfacher und schneller. Unsere Erfahrung der letzten Monate hat gezeigt, dass die generelle Nachfrage von Unternehmen und öffentlichen Stellen nach automatischer Dokumentation und Zusammenfassung immer größer wird, und das obwohl viele Menschen wieder in die Büros ihrer Arbeitgeber zurückgekehrt sind.” 

Mit Tucan.ai können Kunden entweder eigene Audio- und Video-Dateien in einer App hochladen oder Online-Meetings direkt auf gängigen Plattformen wie MS Teams, Zoom und Google Meet aufzeichnen, protokollieren und dokumentieren lassen. Dank dem neuen Summary-Tool erstellt die Software nun auch automatisch abstraktive Inhaltszusammenfassungen. Diese können nahtlos auf andere Systeme überspielt oder unkompliziert mit Kollegen und Stakeholdern geteilt werden. 

Zum Anzeigen oder Hinzufügen von Kommentaren einloggen

Ebenfalls angesehen

Themen ansehen