Von Ralf Keuper

Es scheint, als stün­den die Sprach­er­ken­nungs­sys­te­me vor einem neu­en Durch­bruch. Wie Bloom­berg in Speech Reco­gni­ti­on Bet­ter Than a Human’s Exists. You Just Can’t Use It Yet berich­tet, kön­nen Sprach­as­sis­ten­ten in naher Zukunft mit den Nut­zern Kon­ver­sa­ti­on betrei­ben. Ein Pro­jekt­team bei Goog­le arbei­tet der­zeit an einem Sprach­sys­tem, das auf recur­rent neu­ral net­works basiert. Auf die­se Wei­se kann das Sprach­sys­tem mehr Infor­ma­tio­nen und län­ge­re wie auch kom­ple­xe­re Sequen­zen spei­chern. Goo­gles Lösung berück­sich­tigt auch den Kon­text, in dem sich der Nutzer/​Sprecher bewegt. Dane­ben trifft das Sys­tem Annah­men dar­über, in wel­che Rich­tung sich das Gespräch ent­wi­ckeln könnte.

Durch die Anwen­dung seman­ti­schen Wis­sens erhofft sich das For­scher­team einen wei­te­ren, ent­schei­den­den Schritt nach vor­ne, so dass es am Ende mög­lich ist, ganz ohne Tas­ta­tur mit tech­ni­schen Objek­ten zu kommunizieren.

Das eröff­net auch für das Ban­king neue Mög­lich­kei­ten. Schon seit eini­ger Zeit setzt die USAA mit Erfolg die vir­tu­el­le Assis­ten­tin Nina ein. Bei der BBVA unter­stützt das Sprach­er­ken­nungs­sys­tem Lola die Kunden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert