Weiterentwicklung von Speech-to-Text zur Verbesserung der Kommunikation an Bord

News date

Siri und Alexa sind vielleicht die bekanntesten Beispiele für die Verwendung von Speech-to-Text-Technologie zur Bewältigung alltäglicher Aufgaben oder Fragen im Business-to-Consumer-Bereich. Wir von Televic GSP sind der festen Überzeugung, dass die Grundprinzipien dieser Technologie ein altbekanntes Problem im Bahnbereich lösen können: schlecht zu verstehende Durchsagen in Zügen. Unser Forschungsleiter Steven Lauwereins berichtet über die Vorteile von Speech-to-Text für die Kommunikation im Zug und verrät den Ansatz, den sein Team dabei verfolgt.

Durchsagen, die für alle verständlich sind

„Durchsagen des Zugpersonals an die Passagiere werden über Beschallungsanlagen (z. B. Lautsprecher) übertragen. Diese Mitteilungen betreffen den Fahrgastkomfort sowie Reise- und Sicherheitsinformationen und sind für das Fahrerlebnis von entscheidender Bedeutung“, betont Steven Lauwereins. „Das Zugpersonal macht die Durchsagen dabei oft live, weil es den persönlichen Kontakt zu den Passagieren pflegen möchte.“

„Dennoch können verschiedene Faktoren der Verständlichkeit dieser Informationen im Wege stehen: Störgeräusche, Fahrgäste tragen Kopfhörer, Hörprobleme oder Sprachbarrieren, um nur einige zu nennen. Einige Lösungen – wie zum Beispiel induktive Höranlagen – sind teuer und nicht für ein breites Publikum geeignet. Televic GSP möchte mit Hilfe von Speech-to-Text die Kommunikation im Zug für alle zugänglich machen.“

„Wenn Untertitel auf Basis einer Transkription den Fahrgästen dabei helfen, während der Fahrt einem YouTube-Video auf ihrem Smartphone oder einem Online-Meeting bei Microsoft Teams zu folgen... warum sollten wir dann nicht die Transkription auch nutzen, um Informationen über die Zugfahrt selbst bereitzustellen?“, fragt Steven Lauwereins. „Das Ziel ist eine qualitativ hochwertige Transkription von Durchsagen. In diesem Sinne war uns klar, dass der Bahnsektor einige spezifische Anforderungen aufweist, denen wir in unserem Forschungsprojekt Rechnung tragen.“

„Wenn Untertitel den Fahrgästen dabei helfen, während der Fahrt einem Video oder einem Meeting zu folgen... warum sollten wir dann nicht auch die Transkription nutzen, um Informationen über die Zugfahrt selbst bereitzustellen?“– Steven Lauwereins, Forschungsleiter bei Televic GSP

Die Grundpfeiler unserer Forschung:

  • Ein einzigartiger Datensatz mit typischen Live-Durchsagen, der als relevante Trainingsmenge zur Verbesserung der Genauigkeit dient
  • Kontextbezogene Informationen ermöglichen es den Algorithmen, die Transkriptionsgenauigkeit über die Grenzen des aktuellen Stands der Technik hinaus zu verbessern
  • Systemintegration: Die Verbindung zwischen der Transkription und unseren eigenen Monitoren im Fahrzeug bietet einen entscheidenden Vorteil ​​​​​​​

Steven: „Letztendlich optimieren wir jeden Schritt in unserem Workflow von der Aufzeichnung bis zur Transkription. Durch den Einsatz eines eigens entwickelten Korrekturprogramms optimieren wir die neuesten Modelle für Anwendungen im Bahnbereich. Wir testen sowohl vorab aufgezeichnete- als auch Live-Durchsagen in englischer Sprache. In der Zukunft werden wir dies auch auf andere Sprachen ausweiten.“

 „Wir verwenden kontextbezogene Informationen, um modernste Speech-to-Text-Modelle so zu verbessern, dass sie nahezu perfekte Transkriptionen liefern.“ – Steven Lauwereins, Forschungsleiter bei Televic GSP

Mehr als nur ein Fahrgastinformationssystem

„Die Speech-to-Text-Lösung, die aus einem Forschungsprojekt in Zusammenarbeit mit dem Zugbetreiber Transpennine Express hervorgegangen ist, fügt sich perfekt in unsere breite Palette von FIS-Lösungen ein“, sagt Steven. „Durch die Kommunikation mit sämtlichen anderen Systemen wird eine zusätzliche Ebene hinzugefügt. Das fängt mit den Live-Durchsagen in öffentlichen Verkehrsmitteln an, geht dann über die Audiosysteme und endet mit der visuellen Nachricht auf dem Monitor mittels qualitativ hochwertiger Transkription.“

Vorreiter im Bahnbereich

Steven: „Die Sprachverarbeitung erfreut sich im Business-to-Consumer-Bereich bereits großer Beliebtheit. Für uns ist es ein aufregendes Projekt, durch die Optimierung der Transkription eine Vorreiterrolle auf dem Business-to-Business-Markt im Bahnsektor zu übernehmen. Unser Ziel ist es, den Ton für eine für alle zugängliche Kommunikation zu setzen – unabhängig vom Grund der Unverständlichkeit der Durchsagen. „Wir entwickeln die Leistungsfähigkeit unserer Lösung aktiv weiter. Sie dürfen gespannt sein!“

Hier ein kleiner Vorgeschmack:

Das Wort „Conductor“ ist dank des eigens von Televic GSP entwickelten Korrekturprogramms richtig geschrieben. Gleiches gilt für Ortsnamen oder bestimmte Abkürzungen.

INTERESSIERT? BESUCHEN SIE UNS PERSÖNLICH AUF DER INNOTRANS 2022

TREFFEN SIE UNS AN STAND 510, HALLE 2.1.

Wenn Sie im Voraus einen Termin vereinbaren möchten, füllen Sie bitte dieses Formular aus:

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Latest articles