Aus dem Facharchiv: Elektropraxis
Vic Control – Industrial und Go
Die Bedienung technischer Geräte mittels natürlicher Sprache ist im Alltag geradezu omnipräsent. Ob Alexa, Google Home oder Siri, Spracherkennungssysteme machen manches leichter oder sind eben einfach nur schick. Im Gegensatz dazu ist die Anwendung der Sprachsteuerung im industriellen Umfeld bisher kaum verbreitet. Dabei muss es aber nicht bleiben.
Die in der sächsischen Landeshauptstadt Dresden beheimatete Gesellschaft Voice Interconnect (eigene Schreibweise voice INTER connect) ist eine Ausgründung der Technischen Universität Dresden und ein typisches Technologie-Start-up. Das Unternehmen beschäftigt am Standort Dresden Expertinnen und Experten aus verschiedenen Fachrichtungen wie etwa Elektrotechnik, Akustik und Informatik. Zudem existiert eine Vertriebsniederlassung in der Nähe von Stuttgart. Die seit zwei Jahrzehnten bestehende Firma versteht sich selbst als Dienstleister und Technologielieferant und beschäftigt derzeit etwa 30 Mitarbeiterinnen und Mitarbeiter. Tätigkeitsschwerpunkte sind neben der Elektronik- und Softwareentwicklung, die Schaffung von Lösungen für Intercom-Produkte (in Aufzügen oder für Notrufsäulen usw.). Zentrum aller technischen Aktivitäten ist aber die Sprachverarbeitung mit allen damit im Zusammenhang stehenden Aspekten wie etwa Akustik und maschinelles Lernen. Für die Elektro- und Automatisierungsbranche sind die unter der Bezeichnung „vicCONTROL go“ (Sprachsteuerung als Hardwarelösung) bzw. „vicCONTROL industrial“ (reines Softwareangebot) bekannt gewordenen Entwicklungen von Interesse.
Anwendung erstellen
Vic Control Industrial ist gleichermaßen eine Software zur Spracherkennung und zur Sprachausgabe. Vic Control Go kann darüber hinaus als Ein- und Ausgabeeinheit einer Steuerungseinrichtung genutzt werden. Anhand von Schlüsselwörtern und Parametern können – wie auf Knopfdruck – bestimmte vorprogrammierte Reaktionen einer Steuerungseinrichtung ausgelöst werden. Die dazu nötige Kommunikation zwischen Sprach- und Ablaufsteuerung wird über das MQTT-Protokoll realisiert. Die grundsätzliche Vorgehensweise zur Realisierung einer integrierten Sprachsteuerung ist im Bild 1 dargestellt. Dabei lassen sich sechs Schritte unterscheiden:
1. Schritt: Anlernen. Mit dem Entwicklungswerkzeug „visSDC“ werden die Sprachdialoge mit den umzusetzenden Steuerungsaufgaben in Beziehung gesetzt. Das beginnt mit der Festlegung der gewünschten Sprache und der Auswahl eines Aktivierungswortes (Wake-up-Phrase). Es umfasst Schritt für Schritt alle Aktivitäten, die per Sprachdialog realisiert werden sollen.
2. Schritt: Übersetzen. Die Kompilierung des erstellten Projektes erfolgt unter Nutzung von KI-basierten Verfahren. Darüber hinaus wird eine Fehlerprüfung realisiert. Damit unterschiedliche Personen ohne Einhaltung einer festen Reihenfolge beim Sprechen die Spracheingabe nutzen können, werden Variationen der natürlichen Sprache erstellt.
3. Schritt: Übertragen. Das übersetzte Programm wird auf den Steuerrechner (Linux SBC, Box PC, Panel PC usw.) aufgespielt.