Wieso reagieren Sprachassistenten auf ihren Namen?

Unser Software Entwickler Marcel erklärt alles zum Thema Wake Word Erkennung von Sprachassistenten.

Was ist ein Wake Word?

Ein Wake Word, Trigger oder auch Aktivierungswort ist ein fest definierter Sprachbefehl, welcher den Sprachassistenten ohne eine haptische Eingabe aktiviert. Berühmte Wake Words sind z. B. “OK Google” von Google oder Apples “Hey Siri”. Bei einer erfolgreichen Erkennung des Wake Words verarbeitet das System automatisch die nachfolgende Anfrage und reagiert mit der passenden Antwort oder Aktion. Nach der Abfrage deaktiviert sich die Anwendung wieder. Idealerweise erkennt ein Sprachassistent sein Wake Word immer fehlerfrei und aktiviert sich, abgesehen von der manuellen Aktivierung, niemals ohne dieses.

Wie erkennt der Sprachassistent das richtige Wake Word?

Die Prüfung nach dem Wake Word läuft dauerhaft auf dem Audiostream, der über das Mikrofon aufgenommen wird. Dabei werden aus den aufgenommenen Schallwellen Bilder in kleinen, in sich versetzten Zeitintervallen erzeugt. Diese nennt man MFCCs und repräsentieren unsere sprachlichen Laute über einen bestimmten Zeitraum hinweg.

Mit ML-Methoden (z.B. Deep Learning zur Bilderkennung) werden die Bilder dauerhaft mit einem trainierten Modell abgeglichen, welches gelernt hat, wie Bilder des Wake Words aussehen. In einigen Verfahren werden aus den MFCCs über Deep Learning auch direkt konkrete Laute ermittelt, wobei die Prüfung des Wake Words über den Vergleich der Laute erfolgt. Das Gesprochene wird demnach nicht semantisch ausgewertet, der Sprachassistent erkennt beim Zuhören lediglich grafische Muster. Da der Stream dauerhaft läuft und ausgewertet wird, ist es wichtig, dass der gesamte Prozess möglichst wenig Energie benötigt.

Wake Word vs. Speech To Text

Im Vergleich zur Wake Word Erkennung ermitteln Speech to Text (STT) Engines konkrete Worte und verarbeiten den Audiostream in semantischen Teilabschnitten, wie z. B. Sätze oder Absätze. Dadurch wird es möglich Gewichtungen aufgrund von Wahrscheinlichkeiten vorzunehmen, um zu entscheiden, welche Wörter in welcher Reihenfolge sinnig sind. Die Bedeutung des Gesprochenen wird dabei also tatsächlich erkannt und ausgewertet. Dieser gesamte Prozess verbraucht deutlich mehr Zeit und Energie. Aus diesem Grund wird STT häufig in Kombination mit einem vorher definierten Wake Word genutzt.

Individuelle Wake Words als Marketingmittel

Möchte man sich als Unternehmen von den großen Playern wie Google und Apple unabhängig machen, kann es sinnvoll sein, den eigenen Sprachassistenten mit einem Custom Wake Word auszurüsten. Dabei ist es wichtig, ein Wake Word zu wählen, welches einerseits von Nutzenden leicht zu merken ist und andererseits vom Sprachassistenten gut erkannt werden kann. Auch die Länge des Wake Words ist entscheidend. Ist das Wort zu kurz, kann es für das System schwierig werden, das richtige Muster in Umgebungsgeräuschen und Gesprächen eindeutig zu erkennen. Zu lange Wörter oder Sätze sind wiederum für Nutzer:innen umständlich und führen zu einer schlechteren User Experience. Erfüllt z. B. der eigene Unternehmensname die Kriterien, kann das Wake Word als wertvolles Marketingmittel eingesetzt werden, da Nutzende zum Starten des Systems stetig den Namen aussprechen und automatisch verinnerlichen.

Kurz zusammengefasst

What is Webflow and why is it the best website builder?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

What is your favorite template from BRIX Templates?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

How do you clone a template from the Showcase?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

Why is BRIX Templates the best Webflow agency?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

When was Webflow officially launched?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

How do you integrate Jetboost with Webflow?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

What is Webflow and why is it the best website builder?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

What is your favorite template from BRIX Templates?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

How do you clone a template from the Showcase?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

Why is BRIX Templates the best Webflow agency?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

When was Webflow officially launched?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

How do you integrate Jetboost with Webflow?

Vitae congue eu consequat ac felis placerat vestibulum lectus mauris ultrices. Cursus sit amet dictum sit amet justo donec enim diam porttitor lacus luctus accumsan tortor posuere.

Entdecken
Zurück zur Stories-Übersicht
Startet euer Projekt mit uns!
Wir freuen uns auf euch!
Bild vom Geschäftsführenden Gesellschafter Henrik Johannsen
Deine Ansprechperson
Henrik Johannsen
Kontakt
Teaser Bild der Story oder des Projektes
Chatbots und Sprachassistenten „made in Germany“
Chatbots und Sprachassistenten „made in Germany“
Chatbots und Sprachassistenten „made in Germany“
Chatbots und Sprachassistenten „made in Germany“
Digitale KI Assistenten

Um unseren Kunden unabhängig von den amerikanischen Softwaregiganten wie Amazon, Google und Apple Produkte wie Chatbots und Sprachassistenten anbieten zu können, entwickeln wir eigene NLU-Engines (Sprachverständniseinheiten). So kann die Verarbeitung auf eigener Infrastruktur oder sogar lokal beim Nutzer im Smartphone durchgeführt werden.

EntdeckenEntdecken
Entdecken
Teaser Bild der Story oder des Projektes
„Wie Design und doch ganz anders“
„Wie Design und doch ganz anders“
„Wie Design und doch ganz anders“
„Wie Design und doch ganz anders“
Digitale KI Assistenten

Ein Interview mit der UX-/UI-Designerin Paula über die Entwicklung eines Voice Assistenten.

EntdeckenEntdecken
Entdecken

Kontakt

Wir freuen uns auf euch!

Bild vom Geschäftsführenden Gesellschafter Henrik Johannsen
Deine Ansprechperson
Henrik Johannsen
PROJEKTIONISTEN® GmbH
Schaufelder Straße 11
30167 Hannover
Vielen Dank für deine Nachricht! Wir werden uns so schnell wie möglich bei dir melden.
Ihre Nachricht konnte nicht gesendet werden. Schreibe uns bitte per Mail (info@projektionisten.de).