Bis vor wenigen Wochen wurde das Thema Spracherkennung noch vergleichsweise stiefmütterlich behandelt. Nur relativ wenige Anwender hatten sich mit der Spracheingabe und Sprachsteuerung am Computer schon einmal bewusst beschäftigt. Leidiglich eine vergleichsweise kleine Anwendergruppe verfügte über Erfahrung mit derartiger Software.
Mit der Einführung von Siri auf dem iPhone hat sich dies schlagartig geändert. Plötzlich wurde vielen Leuten bewusst, welche Möglichkeiten eine Spracherkennung bietet und wie vielseitig sie genutzt werden kann. Allerdings ist diese Art der Steuerung gar nicht so neu. Im Grunde befinden sich Heimanwender bereits seit Jahren in der Lage, ähnliche Systeme auf ihrem PC einzusetzen.
Das verlinkte Video wirkt selbstverständlich ein wenig reißerisch – so schnell wird ein Piratenkapitän sicherlich nirgendwo durch die Türe preschen. Allerdings macht es sehr schön deutlich, mit welcher Genauigkeit und vor allem auch mit welcher Geschwindigkeit in Verbindung mit Sprachsoftware am PC gearbeitet werden kann. Eine moderne Spracherkennungssoftware befindet sich in der Lage, Wörter praktisch in Echtzeit zu erkennen und beispielsweise in Software zu integrieren.
Wie schon erwähnt wurde, gibt es derartige Lösungen bereits seit Jahren. Meine erste Spracherkennungssoftware erlangte ich in den 1990er Jahren mit ViaVoice von IBM. Mein damaliger Pentium 100 wurde bis an seine Grenzen getrieben, damit ein paar ins Mikrofon gesprochene Worte letztlich auf dem Bildschirm erschienen. Flaschenhals war eindeutig die Rechenleistung der Computer – die Leistung in Sachen Spracherkennung war damals schon sehr beeindruckend.
Zum damaligen Zeitpunkt konnte sich Spracherkennungssoftware noch nicht auf dem Markt behaupten bzw. war der Markt äußerst klein. IBM hatte daraufhin entschlossen, diesen Markt zu verlassen. Das damalige Konkurrenzprodukt DragonNaturally Speaking galt als vergleichbar – allerdings hat der Anbieter an seinem System festgehalten.
Mittlerweile gibt Nuance mit seiner Dragon Software ganz klar den Ton an. Die im Video zu sehende Software stammt selbstverständlich von Nuance zeigt sehr schön auf, was heutzutage genau möglich ist. Wartezeiten von Minuten sind passé, stattdessen wird das gesprochene Wort sofort in Textdokumente eingefügt oder man steuert gleich den Computer.
Anwender können bei Dragon aus verschiedenen Produkten rund um die Spracherkennung wählen. Den Einstieg schafft Dragon NaturallySpeaking Home, das für die sprachgesteuerte Textverarbeitung konzipiert wurde. Die Premium Version unterscheidet sich von der Home Version dahingehend, dass noch einige Features rund um die Steuerung des Systems integriert wurden, um beispielsweise Programme zu starten oder zu beenden. Außerdem gibt es auch noch eine Mac Version. Zwar kann Apple dank Siri mit einem eigenen Produkt aufwarten, aber für die Texterstellung wurde Siri nicht entwickelt.
November 22nd, 2011 at 19:07
Bei Dragon Naturally Speaking kann man einstellen, wie sehr sich der PC sozusagen anstrengen soll bei der Erkennung. Das ist sehr sinnvoll, weil der Rechner so nicht völlig ausgebremst wird durch die doch anspruchsvolle Aufgabe der Spracherkennung.
Wer den Regler auf maximale Genauigkeit stellt, erhält heute wirklich schon überraschend gute Ergebnisse. Dafür braucht man dann allerdings einen leistungsstarken PC.
Ganz wichtig: ein gutes Mikrofon. Es lohnt sich, hier ein paar Euro auszugeben, denn Störgeräusche oder schlechte Aufnahmequalität verschlechtern stark die Erkennung. Damit der Computer einen gut versteht, muss man ihm ein sauberes Signal bieten.
Wenn man mit der Erkennungsgenauigkeit unzufrieden ist, sollte man es daher einmal mit einem anderen bzw. besseren Mikrofon probieren – vielleicht kann man sich das bei einem Freund ausleihen für den Test. Ich rate zu einem guten Standmikro statt zu einem Headset, das ist auf Dauer angenehmer, finde ich. Platziert man dieses hinter der PC-Tastatur, ist man noch nah genug dran.