Diktier-Software im Vergleich
{{commentsTotalLength}}
-
heise Download Content Team

Diktiersoftware im Vergleich

Schreibarbeit sparen mit der richtigen Diktiersoftware

Das klassische Diktat ist nach wie vor eine sinnvolle Methode, um die Gedanken fließen zu lassen – und sich lästige Schreibarbeit zu sparen. Mit Diktiersoftware können Computer und Smartphones/Tablets diese Aufgabe übernehmen und Personaleinsatz sparen.

💡 Das Wichtigste in Kürze
  • Diktiersoftware transkribiert gesprochenen Text in Echtzeit in geschriebenen Text – und das weitestgehend fehlerfrei.
  • Intelligente Spracherkennung durch künstliche Intelligenz hilft Diktiersoftware dabei, bestmögliche Ergebnisse zu erzielen.
  • Wer Diktiersoftware nutzt, sollte darauf achten, ein hochwertiges Mikrofon zu verwenden, damit die Software das Gesagte optimal verstehen kann.
  • Es gibt Diktiersoftware, die mit Cloud-Technologie arbeitet und Standalone-Software, die ausschließlich lokal auf dem Rechner des Anwenders arbeitet.
  • Zur Liste: ➤ Diktiersoftware in der Übersicht

Das klassische Diktat ist nach wie vor die angenehmste Methode, Texte zu schreiben. Gerade Nutzer, die Mühe beim Schnelltippen haben, schätzen die Hilfe beim Gedankenfluss, die das Diktat bietet. Längst wird dafür kein Angestellter aus dem Vorzimmer mehr benötigt: Moderne Computer und die Cloud sind leistungsfähig genug, um gesprochenes Wort direkt und ohne Verzögerung in geschriebenen Text zu verwandeln. Das demokratisiert nicht nur das Diktat an sich – schließlich muss niemand mehr das Diktat aufnehmen – sondern erlaubt auch Anwendern, die sich mit dem geschriebenen Wort schwertun oder wenig Übung an der Tastatur haben das flüssige „Schreiben“ von Briefen, E-Mails, Dokumentationen oder Artikeln.

Ideal für Menschen mit Einschränkungen

Zudem gibt es auch eine spezielle Nutzergruppe, für die Diktiersoftware besonders sinnvoll ist, und das sind Menschen mit körperlichen Einschränkungen. Wer seine Hände nicht vollständig nutzen kann, ist in der Bedienung der Tastatur deutlich eingeschränkt. Auch chronische Krankheiten wie Parkinson, Multiple Sklerose oder Lähmungen können die Schreibfähigkeit mit der Tastatur deutlich einschränken. Diktiersoftware kann hier das Leben um einiges erleichtern und dafür sorgen, dass wieder mit Freude geschrieben werden kann. Umgekehrt kann Diktiersoftware aber auch Nutzern ohne motorische Einschränkungen ein gesünderes Leben erlauben: Wer lange Texte im Stehen oder Gehen einsprechen kann, statt am Rechner zu tippen, schont seine Wirbelsäule und Gelenke – und kann maximal ergonomisch arbeiten.

Diktiersoftware: Alexa und Siri auf Steroiden

Grundsätzlich ist Diktiersoftware also eine wunderbare Sache, denn sie erleichtert das Leben erheblich. Sie beinhaltet immer eine Spracherkennung in Form einer deutlich erweiterten Variante dessen, was Smart-Assistenten wie Amazon Alexa, Apple Siri, Google Assistant oder Microsoft Cortana zum Leben erweckt. Denn anders als bei Sprachbefehlen ist es bei Diktiersoftware wichtig, dass sie das gesprochene Wort nicht nur hört und in einen Befehl übersetzt, sondern auch in Teilen versteht, worüber der Nutzer spricht. Anderenfalls ist es zum Beispiel nicht möglich, sogenannte Homophone – Worte mit gleichem Klang, aber unterschiedlicher Bedeutung, etwa „Waage“ und „wage"– voneinander zu unterscheiden. Was ein Muttersprachler dem Kontext entnimmt, ist für den Computer Schwerstarbeit. Das gleiche gilt übrigens für die Sprachsteuerung der Diktiersoftware selbst: Sie muss erkennen, dass „Neuer Absatz“ als Befehl gedacht ist und nicht ausgeschrieben in den Text gehört.

Nichts läuft ohne das Erlernen von Steuerbefehlen

Genau hier ist auch der Nutzer gefragt: Er muss willens sein, die Diktiersoftware kennenzulernen. Die cloudbasierten Lösungen funktionieren zumeist „out of the Box“. Dennoch: Diktiersoftware versucht möglichst gezielt zu erkennen, ob es sich jetzt um einen Steuerbefehl oder ein zu schreibendes Wort handelt. Dies ist jedoch nicht immer korrekt, weshalb es wichtig ist, Steuerbefehle nicht nur auswendig zu lernen, sondern eben auch so auszusprechen, dass die Software damit zurechtkommt. Wer schon Siri und Co. genutzt hat, weiß, dass man dazu neigt, mit dem Computer zu reden, als sei er schwer von Begriff, also langsam und artikuliert. Zwar versucht gute Diktiersoftware, auf die natürlichen Sprechgewohnheiten des Nutzers einzugehen, allerdings kann hier trotzdem eine gewisse Achtsamkeit notwendig sein.

💡 Achtung, Verwechslungsgefahr!
Diktiersoftware, Transkriptionssoftware und Spracherkennung werden gerne miteinander verwechselt. Wir ordnen die Begriffe kurz ein:
 
  • In eine Diktiersoftware spricht man einen Text samt Satz- und Formatierungszeichen deutlich ein, um daraus automatisch einen geschrieben Text zu erstellen.
  • Transkriptionssoftware erstellt aus natürlich gesprochenem Text sowie natürlichen Gesprächen mit mehreren Teilnehmern eine Mitschrift.
  • Spracherkennungs-Software ist der Oberbegriff für alle sprachverarbeitenden Programme. Handelt es sich dabei nicht um eine Diktier- oder Transkriptionssoftware, so wird diese in der Regel zur Steuerung eines Systems bzw. einer anderen Software benutzt – etwa, um das Smart Home oder Virtual-Reality-Spiele zu bedienen.

Diktiersoftware ist nicht gleich Diktiersoftware

Grundsätzlich gibt es mehrere Möglichkeiten, Diktate am Computer einzusprechen. So besitzen MacOS und Windows eigene Diktierfunktionen, die sich allerdings nur für kurze Texte eignen. Genau deshalb ist es sinnvoll, auf eine dedizierte Diktiersoftware für die sprachgesteuerte Texteingabe am Rechner zu setzen. Hier gibt es zwei Kategorien. Zum Einen Cloud-basierte Lösungen, die alle Eingaben des Anwenders an einen Server beim Anbieter schicken. Zum Anderen Lösungen, die ausschließlich auf dem lokalen Rechner des Nutzers oder in einem Unternehmensnetzwerk laufen. Cloud-Lösungen – auch die Funktionen von MacOS und Windows zählen dazu – bedienen sich aus einem riesigen Fundus bereits erfolgter Eingaben und werden dabei dank Deep Learning und KI-Funktionen immer treffsicherer. Lokale Lösungen benötigen hingegen in aller Regel ein gewisses Training, da sie den Sprecher erst „kennenlernen“ müssen. Moderne Diktiersoftware reduziert diese Art des Trainings aber in aller Regel auf ein Minimum.

Unterscheidung zur Transkription

Übrigens: Unter dem Label „Diktiersoftware“ wird oft auch Transkriptionssoftware geführt. Zwar sind Produkte wie Dragon oder Voice Pro für beides geeignet, allerdings gibt es auch „Diktiersoftware“ zur manuellen Transkription. Dabei handelt es sich im Grunde um einen leicht steuerbaren Audio-Player mit einem Texteingabe-Feld. Diese sollen Anwendern das händische Abtippen gesprochener Diktate, Interviews und ähnlichem maximal erleichtern. Dabei besitzen sie jedoch keinerlei KI-Funktionen oder Spracherkennung. Diese erfolgt natürlich durch den Anwender. Wer also direkt in den Rechner diktieren möchte, muss eine Lösung wählen, die Sprache erkennt und in geschriebenes Wort übersetzt.

Grenzen der Spracherkennung

Grundsätzlich ist Spracherkennung ein statistisches System, auch wenn Deep Learning-Routinen hier die Wahrscheinlichkeiten intelligent gewichten können. An ihre Grenzen kommt die Spracherkennung immer dort, wo Wortkonstrukte oder -formen neu gebildet werden, etwa bei der Lyrik. Künstler und Schriftsteller können ihre Werke zwar grundsätzlich auch diktieren, allerdings dürfte in diesen Fällen eine nicht unerhebliche Nachbearbeitung notwendig sein. Das gleiche gilt für Texte, in denen viele fremdsprachige Begriffe vorkommen. Die Software hat einen gewissen Wortschatz und weiß, in welcher Sprache ein Nutzer den Text einspricht. Sind Fremdworte nicht Teil des normalen Vokabulars, kommen selbst smarte Systeme ins Stolpern.

Wer lieber spricht als schreibt, sollte also sachliche und vor allem grammatikalisch korrekte Sprache verwenden. Wortkunst ist nichts für Computer – das weiß jeder, der sich schon mit der Autokorrektur von Smartphones herumgeschlagen hat. Genau deshalb bieten die Anbieter von Diktiersoftware inzwischen auch spezielle Produkte für Anwender an, die eine Fachsprache nutzen, etwa im juristischen oder medizinischen Bereich. Die Produkte benötigen besondere Fähigkeiten, etwa das Erkennen lateinischer Fachbegriffe, die von normaler Diktiersoftware nicht abgedeckt wird.

Diktiersoftware in der Übersicht


Im folgenden Abschnitt stellen wir einige Diktiersoftware-Kandidaten vor, die sich für das Umwandeln von Sprache in Schrift eignen.


Dragon Professional: Spracherkennung optimal

🛈 Windows | 999,00 € (Einmalzahlung)

(Bild: Nuance)

Wer sich mit Diktiersoftware und Spracherkennung befasst, wird schnell auf Dragon Professional* stoßen: Hersteller Nuance setzt bei seinen Dragon-Produkten seit geraumer Zeit auf cloudbasierte Spracherkennung mit Deep-Learning-Algorithmen, also Künstlicher Intelligenz. Das gesprochene Wort wird an die Nuance-Server übermittelt, dort analysiert und anschließend als Text niedergeschrieben. Das hat den Vorteil, dass für die Nutzung von Dragon Professional kein Training vonnöten ist und trotzdem „bis zu 99% Genauigkeit“ gewährleistet wird. Bei Bedarf kann ein zusätzliches Training diese Genauigkeit nochmals verbessern. Dragon Professional arbeitet auch bei Sprechern mit Akzent oder Dialekt zuverlässig. Zudem passt Nuance die Algorithmen zentral an, wodurch der Anwender jederzeit vom neuesten Stand der Spracherkennung profitiert.

Dragon Professional ist dabei das Zugpferd der Dragon-Produktlinie und richtet sich an professionelle Anwender, die die Software ausgiebig nutzen, etwa weil sie häufig Text, Briefe und Nachrichten diktieren oder bei wissenschaftlicher Arbeit oder Dokumentationen freie Hände benötigen, um etwa Quellen durchzublättern. Dabei beinhaltet Dragon Professional einen ausgesprochen großen Wortschatz und besitzt einen Filter für Hintergrundgeräusche, wodurch sich das Produkt auch in „lauten“ Büros einsetzen lässt. Bei Bedarf kann ein optimiertes USB-Headset oder ein hochwertiges Mikrofon mitbestellt werden. Dragon Professional ist auch in optimierten Versionen für Gruppen und Thin-Clients sowie als optimierte Version für Juristen und Mediziner erhältlich.

➤ Dragon Professional*
Für 999,00 € kaufen

Dragon Home & Dragon Anywhere: Zuhause ganz einfach diktieren

🛈 Dragon Home: Windows | 199,00 € (Einmalzahlung); Dragon Anywhere: iOS, Android | 150,00 € (pro Jahr)

Update vom 20.04.2023: Das Produkt Dragon Home wurde mittlerweile eingestellt. Für den privaten Gebrauch steht nur noch die mobile App Dragon Anywhere* zur Verfügung.

(Bild: Nuance)

Wer nicht gewillt ist, die relativ hohen Kosten für eine Lizenz von Dragon Professional zu tragen, findet mit den Produkten Dragon Home und Dragon Anywhere zwei Alternativen, die sich für kleinere Alltags-Diktate im Privatgebrauch eignen. Dragon Home* ist dabei im Grunde das „Basisprodukt“, das ein schnelles Diktieren von Hausaufgaben, E-Mails oder sogar universitärer Arbeit ermöglicht. Gegenüber der Professional-Linie fehlen einige Funktionen, die die Arbeit mit der Spracherkennung vereinfachen, etwa das Einsetzen individueller Wörterbücher, eigenen Vokabulars und Kommandos für die Verwendung in Programmen wie Microsoft Excel. Auch auf eine automatische Transkription von Aufnahmen müssen Home-Nutzer verzichten. Anwender, die einfach nur in den Computer diktieren möchten, können auf diese Funktionen aber in aller Regel verzichten – und erhalten die Deep-Learning-basierte Spracherkennung von Nuance zu einem Bruchteil des Preises. Gegen Aufpreis ist auch dieses Produkt mit einem Headset oder Mikrofon zu haben.

Dragon Anywhere* ist die cloudbasierte Lösung für Heimanwender und Profis, die auf einem Smartphone oder Tablet verwendet werden kann. Hier fällt eine monatliche Abo-Gebühr an. Hier ist die Synchronisation mit Dragon Professional möglich, auch fachspezifisches Vokabular lässt sich nutzen.

➤ Dragon Home*
Für 199,00 € kaufen

Linguatec Voice Pro Premium: Diktiersoftware ohne Cloud

🛈 Windows | 149,00 € (Premium, Einmalzahlung)

(Bild: Linguatec)

Update vom 03.12.2021: LinguaTec Voice Pro für Privatnutzer wurde eingestellt. Stattdessen ist mit Linguatec Voice Pro Enterprise nur noch eine Variante für Unternehmen erhältlich. Wir haben die Links entsprechend angepasst. Der Leistungsumfang der Enterprise-Version kann von der hier beschriebenen, eingestellten Version für Einzelnutzer abweichen.

Voice Pro von Linguatec ist der große Mitbewerber zu den Nuance-Produkten. Der Kernunterschied ist die Tatsache, dass Voice Pro ausschließlich auf der Infrastruktur des Nutzers arbeitet, also keine Cloud zum Einsatz kommt. Dadurch muss Voice Pro bis zu einem gewissen Grad vor der eigentlichen Verwendung trainiert werden. Dafür gibt es hier aber keine Probleme mit dem Datenschutz: Da die Anwendung ausschließlich auf dem Desktop oder – bei Unternehmens-Lizenzen – den Servern des Unternehmens bleibt, ist auch anbieterseitig keine Infrastruktur notwendig. Das macht Voice Pro deutlich preiswerter als das vergleichbare Nuance-Produkt. Auch Linguatec spricht von 99% Zuverlässigkeit bei der Spracherkennung.

Das Grundvokabular von Voice Pro beinhaltet bereits eine Reihe von Fachtermini aus zahlreichen Berufszweigen. Zudem ist die Software auch als Spezialversion mit speziellem Fachvokabular für juristische oder medizinische Einsätze erhältlich, allerdings zu einem deutlich höheren Preis. Bei allen Voice-Pro-Produkten gibt es die Möglichkeit, Textbausteine in Textblöcke umzuwandeln, wenn diese vorab definiert wurden: So sorgt das Einsprechen eines einzelnen Befehls dafür, dass standardisierte Absätze eingefügt werden können. Auch Diktiergeräte unterstützt das Programm: MP3-, WAV- und WMA-Dateien können ganz einfach automatisch transkribiert werden.

➤ Voice Pro Enterprise
Ab 999,00 € kaufen

DictaNet: Klassisches Diktat modernisiert

🛈 Windows | ab 9,00 € (pro Monat)

(Bild: DictaNet)

DictaNet verfolgt einen anderen Ansatz als die Mitbewerber: Hier liegt der Fokus auf dem juristischen Bereich und auf dem Diktier- und Transkribiervorgang an sich. So ist das Basisprodukt eine reine Diktiersoftware ohne Spracherkennung. Stattdessen besteht sie aus einer Diktiergerät-Software, mit der die Diktate eingesprochen werden können sowie einer Player-Software, die genutzt wird, um die Diktate manuell in Text umzuwandeln. Allerdings kann optional auch eine Spracherkennung eingeschaltet werden: Als sogenannte „Vordergrunderkennung“ arbeitet die DictaNet Spracherkennung wie die Nuance-Produkte – auf deren Technik es zurückgreift – cloudbasiert und transkribiert den Text direkt sichtbar. Als „Hintergrunderkennung“ arbeitet die Spracherkennung unsichtbar im Hintergrund und gibt den transkribierten Text nach Fertigstellung ans Sekretariat weiter, von wo aus er weiterbearbeitet werden kann.

Das gesamte Konzept von DictaNet ist dafür gedacht, Juristen das Leben zu erleichtern, dementsprechend ist auch das Fachvokabular der Spracherkennung vorwiegend juristischer Natur. Alternativ kann aber auch eine nicht-fachspezifische Spracherkennung gebucht werden. Gegenüber den Einmalkäufen von Nuance und Voice Pro hat DictaNet zudem den Vorteil, als Abomodell monatlich abgerechnet zu werden.

➤ DictaNet
Ab 9,00 € / Monat kaufen

DictNow: Profi-Spracherkennung für Business-Kunden

🛈 iOS, Android | Preis auf Anfrage

(Bild: DictNow)

Auch DictNow* setzt auf ein Fachpublikum aus dem professionellen Bereich, allerdings ist die Spracherkennung für verschiedene Berufszweige optimiert, etwa Kanzleien, Compliance- und Rechtsabteilungen, Steuerberatung und medizinische Einrichtungen. Hersteller Wolter Kluwer ist in diesen Segmenten ein namhafter Software-Anbieter, dementsprechend richtet sich die Software ausschließlich an entsprechende Business-Kunden. Ähnlich wie bei DictaNet gibt es auch bei DictNow sowohl eine manuelle als auch eine automatische Option zur Transkribierung. Anwender können wahlweise auf das Vorzimmer oder die Spracherkennungs-Technologie von DictNow zurückgreifen. Für ersteres gibt es die passenden Software-Produkte, die bei Bedarf durch letzteres ergänzt werden können. Interessant ist die Möglichkeit, zwischen Cloud und lokaler Infrastruktur für die Spracherkennung zu wählen – auf diese Weise finden alle potenziellen Kunden das für sie passende Paket zum Diktieren von Texten. Wolters Kluwer schlüsselt einzelne „Diktiertypen“ auf, geht also auf das jeweilige Verhalten von Anwendern ein und bedient diese optimal. Von der klassischen Schriftsatzerstellung über das Sekretariat und das schnelle mobile Diktieren bis hin zur autonomen papierlosen Büroführung ohne Schreibdienst möchte der Hersteller so jede Nutzergruppe mit der optimalen Lösung versorgen.

➤ DictNow
Informationen beim Hersteller einholen

Smarte Diktiergeräte

Übrigens gibt es zur Spracherkennung bei Diktaten inzwischen auch eine smarte Alternative: Sogenannte smarte Diktiergeräte sind der nächste Entwicklungsschritt bei der Erstellung von Diktaten. Bei der – noch nicht sonderlich weit verbreiteten – Geräteklasse handelt es sich um mehr oder weniger beschnittene Mobilgeräte, vergleichbar mit einem Smartphone, die mit einem besonders hochwertigen Mikrofon, speziellen Bedienelementen und einer zentralen Diktiersoftware ausgestattet sind. Geräte dieser Art gibt es etwa in der SpeechAir-Reihe von Philips: Aufgenommene Diktate können automatisch per WLAN an die cloudbasierte Transkriptionssoftware übermittelt und dort in Text umgewandelt werden.

Im Grunde ersetzt das Gerät die Software auf dem PC oder Smartphone und besitzt durch die spezielle Hardware deutlich bessere Möglichkeiten zur Diktataufzeichnung als etwa ein reines Smartphone mit einer App. SpeechAir greift auf den Philips-Transkriptionsservice SpeechLive zurück, es gibt jedoch auch Alternativen von anderen Anbietern, etwa einige Geräte der DS-Reihe von Olympus, die bei Bedarf mit einem Transkriptionsmodul ausgestattet werden können. Mit passenden Apps und gegebenenfalls einem Mikrofon für den Lightning-, USB- oder Klinken-Anschluss können aber auch reguläre Smartphones entsprechende Funktionen einsetzen, wenn auch nicht mit dem Komfortgewinn der smarten Diktiergeräte.


Kostenlose Diktiersoftware

Gibt es auch kostenlose Diktiersoftware? Grundsätzlich eher nicht: Diktiersoftware ist eine ausgefeilte Technologie, die eine Menge Know-How und – bei cloudbasierten Lösungen – auch Hardware benötigt. Dementsprechend dünn ist der Markt für Gratis-Lösungen. Die Hersteller entsprechender Software bieten allerdings manchmal Testversionen an, die mit Einschränkungen funktionieren. Ebenfalls kostenlos, allerdings auch nicht besonders leistungsfähig, sind natürlich die Diktierfunktionen der Betriebssysteme. Am ehesten mit einer kostenlosen Diktierlösung vergleichbar ist daher die Diktierfunktion von Google Docs: Sie schreibt Texte in beliebiger Länge und funktioniert erstaunlich reibungslos. Der Preis ist hier, wie immer bei Google, natürlich die Preisgabe der Daten, zudem wird der Chrome-Browser vorausgesetzt.


Fazit

Insgesamt zeichnen sich alle Diktiersoftware-Produkte durch ihren relativ hohen Preis aus. Das hängt damit zusammen, dass die Entwicklung aufwendig und der Betrieb eventueller Serverfarmen ein nicht unerheblicher Kostenpunkt sind. Wer professionell am Computer diktieren will, muss also in die Tasche greifen. Allerdings relativieren sich die Kosten schnell, wenn durch die Leistung der Software auf Personal verzichtet werden kann: Egal ob Schreibdienst oder eigenes Vorzimmer – im Vergleich zu den Kosten menschlicher Transkription sind Dragon & Co. echte Schnäppchen. Und in vielen Fällen auch inzwischen leistungsfähig genug, um eine manuelle Transkription weitestgehend überflüssig zu machen.


Zurück zur Liste: Diktiersoftware in der Übersicht

* Mit einem Stern markierte Links sind Affiliate-Links, für die wir unter Umständen eine Provision erhalten. Der Kaufpreis erhöht sich dadurch nicht!

Redaktion & Aktualisierung: heise Download-Team

( )

Wie bewertest Du die Qualität des Beitrags?

Pflichtlektüre! ({{threeCount}})
Gut zu wissen ({{twoCount}})
Geht gar nicht! ({{oneCount}})
Vielen Dank für Deine Bewertung.
Deine Bewertung wurde gelöscht.

Kommentare

{{commentsTotalLength}} KommentarKommentare

Kommentare öffnen Weitere Kommentare laden...