Transkriptions-Software im Vergleich
{{commentsTotalLength}}
-
heise Download Content Team

Vergleich: Die beste Transkriptionssoftware

Transkriptions-Programme für Windows, Mac, Linux und Mobile

Wer gesprochenes Wort in Text umwandeln will, war lange Zeit auf menschliche Hilfe angewiesen. Inzwischen gibt es Transkriptionssoftware, die diese Aufgabe übernimmt. Doch welche Produkte eignen sich am besten, um gesprochene Worte in Text zu verwandeln?

💡 Das Wichtigste in Kürze
  • Transkriptionssoftware unterstützt Anwender bei der der Verschriftlichung des gesprochenenen Worts.
  • Manuelle Transkriptionssoftware besitzt Audio- und Textverarbeitungsfunktionen, um die Verschriftlichung per Hand zu vereinfachen.
  • Transkriptionssoftware mit Spracherkennung kann Sprache automatisch in Text verwandeln.
  • Zwar sollte ein Mensch automatisch erstellte Transkripte abschließend prüfen, die Zeitersparnis macht Automatik-Lösungen für Unternehmen und große Projekte dennoch lohnenswert.
  • Zur Liste: ➤ Transkriptionssoftware in der Übersicht

„Fräulein, zum Diktat!“ Diese Zeiten sind zum Glück schon lange vorbei: Einerseits, weil das Wort „Fräulein“ völlig zurecht verpönt ist. Und andererseits, weil sich auch die Zeiten des Diktats dem Ende neigen. Im professionellen Umfeld kommt nämlich immer häufiger Transkriptionssoftware zum Einsatz: Damit erstellt man einfach eine Audioaufzeichnung, die anschließend in Text überführt wird, was die Arbeit des Personals im Vorzimmer deutlich erleichtert.

Unterschiede bei der Transkriptionssoftware

Die klassische Form der Transkription, also des Umschreibens von Wort in Text, ist das Diktat. Mit zunehmender technologischer Entwicklung konnte das dank Diktiergerät und Schreibmaschine bald zeitversetzt erfolgen. Diese händische Verschriftlichung unterstützen einfache Transkriptionsprogramme: Sie bestehen aus einem Audio-Player mit verschiedenen Wiedergabegeschwindigkeiten und ausgefeilten Spul-Funktionen, sind manchmal sogar über Fußpedale steuerbar und helfen so, die Audio-Wiedergabe an das eigene Tipp-Tempo anzupassen. Eine Steigerung dieser Transkriptionshilfen sind die automatischen Transkribierer.

Software für automatische Transkription

Integriert man nämlich eine Spracherkennung in ein Transkriptionsprogramm, spart man sich das Abtippen idealerweise komplett und lässt die Software das gesprochene Wort automatisch in Text umwandeln. Entsprechende Produkte sind inzwischen relativ treffsicher, was die Umsetzung von Sprache in Text angeht. Eine besondere Herausforderung stellen aber Bereiche mit Fachvokabular dar – etwa die Medizin oder allgemein die Wissenschaft. Auch Gespräche mit vielen Teilnehmern, die möglicherweise noch undeutlich oder mit Dialekt sprechen, unterbrochen werden oder gleichzeitig reden, stellen Automatik-Lösungen mitunter vor Probleme.

Künstliche Intelligenz hilft, (Kon-)Text zu verstehen

Gegenlesen sollte man eine Transkription deshalb grundsätzlich immer – selbst, wenn die Transkriptionsautomatik gute Ergebnisse erzielt. Denn obwohl die Anbieter solcher Software große Fortschritte machen, fehlt dem Computer das Sprachgefühl: Schlecht Verstandenes kann er nur anhand von Algorithmen prüfen, nicht aufgrund von Erfahrung und Interpretation. Dieses Problem wird inzwischen oft durch Cloud-Anbindung, künstliche Intelligenz und Machine Learning abgefedert, was die Ergebnisse deutlich verbessert. Dennoch sollte die letzte Prüfinstanz ein Mensch sein.

💡 Achtung, Verwechslungsgefahr!
Diktiersoftware, Transkriptionssoftware und Spracherkennung werden gerne miteinander verwechselt. Wir ordnen die Begriffe kurz ein:
 
  • In eine Diktiersoftware spricht man einen Text samt Satz- und Formatierungszeichen deutlich ein, um daraus automatisch einen geschrieben Text zu erstellen.
  • Transkriptionssoftware erstellt aus natürlich gesprochenem Text sowie natürlichen Gesprächen mit mehreren Teilnehmern eine Mitschrift.
  • Spracherkennungs-Software ist der Oberbegriff für alle sprachverarbeitenden Programme. Handelt es sich dabei nicht um eine Diktier- oder Transkriptionssoftware, so wird diese in der Regel zur Steuerung eines Systems bzw. einer anderen Software benutzt – etwa, um das Smart Home oder Virtual-Reality-Spiele zu bedienen.

Nicht jede Spracherkennung transkribiert!

Anwender müssen außerdem zwischen reiner Spracherkennung und Transkriptionssoftware unterscheiden. So erkennen etwa Sprachassistenten wie Alexa, Cortana, Google Assistant und Siri das gesprochene Wort. Für lange Gespräche sind diese Tools aber nicht geeignet und auch nicht ausgelegt. Anders sieht es zum Beispiel unter MacOS und iOS aus: Hier ist seit langem eine Diktierfunktion an Bord, allerdings ist diese deutlich weniger leistungsfähig als die sogenannte Sprachsteuerung: Diese erlaubt es tatsächlich, ganze Dokumente per Spracheingabe zu erstellen und zu bearbeiten. Eigentlich soll die Funktion vor allem Menschen mit eingeschränkter Motorik helfen, eignet sich aber auch als praktische Diktierfunktion und damit als rudimentäre Form der Transkriptionssoftware. Apples Sprachsteuerung stolpert allerdings wie viele Diktier-Lösungen recht schnell bei unsauberer Aussprache, Fremdwörtern und Fachbegriffen.

Drittanbieter sind meist leistungsfähiger

Genau deshalb gibt es für MacOS und Windows Drittanbieter-Software, die auf automatische Transkription spezialisiert ist. Am wohl bekanntesten und leistungsfähigsten sind die Lösungen von Nuance, einem Hersteller, der sich auf Sprachverarbeitung spezialisiert hat. Für Transkription juristischer und rechtliche Unterlagen sowie den medizinischen Bereich bietet Nuance eigene Anwendungen an, die auf das jeweilige Fachvokabular trainiert sind. Es gibt jedoch weitere Anbieter, die jeweils eigene Lösungen anbieten. Gemeinsam haben sie, dass sie Sprachverarbeitung und Transkription zu einem Paket schnüren – und versuchen, optimale Ergebnisse zu erzielen.

Transkriptionssoftware im Vergleich


Im Folgenden stellen wir Programme vor, die sich für das Umwandeln von Sprache in Text beziehungsweise die automatische Transkription von Gesprächen in verschiedenen Fachumfeldern eignen. Auch nennen wir Lösungen für die manuelle Transkription.


Nuance Dragon: Das Nonplusultra der kommerziellen Sprachverarbeitung

🛈 | Windows, iOS, Android | ab 199,00 € (Einmalzahlung)

Update vom 20.04.2023: Das Produkt Dragon Home wurde mittlerweile eingestellt. Für den privaten Gebrauch steht nur noch die mobile App Dragon Anywhere* zur Verfügung.

(Bild: Nuance)

Die Dragon-Reihe von Nuance ist eine der leistungsfähigsten Lösungen für die automatische Transkription. Von relativ einfachen Produkten wie Dragon Anywhere für iOS und Android über das große Dragon Professional für Einzelplätze oder Unternehmen bis zu spezialisierten Lösungen im juristischen und medizinischen Bereich für das Verfassen juristischer Briefe oder die klinische Dokumentation bietet Nuance eine Vielzahl von Produkten an, die für den jeweiligen Einsatzzweck optimiert sind. Im Hintergrund arbeiten Deep-Learning-Routinen – also K.I.-Funktionen – die das Produkt mit der Zeit immer leistungsfähiger machen.

Privatanwender, die nicht mehr als eine Diktiersoftware benötigen, können zu Dragon Home greifen: Das Produkt erlaubt das klassische Diktieren von Text als eine Art „Transkription light“.

Wer eine Transkription natürlicher Gespräche benötigt, muss allerdings zu Dragon Professional greifen. Die starke Leistung seiner Produkte sind bei Nuance Alleinstellungsmerkmal und es steckt viel Entwicklungsarbeit im Hintergrund. Daher ist die Software berechtigterweise relativ teuer und lohnt sich erst, wenn sie wirklich häufig zum Einsatz kommt.

➤ Dragon Professional*
999,00 €

Linguatec Voice Pro: Die preiswerte Alternative

🛈 | Windows | 149,00 € (Einmalzahlung)

(Bild: Linguatec)

Update vom 03.12.2021: LinguaTec Voice Pro für Privatnutzer wurde eingestellt. Stattdessen ist mit Linguatec Voice Pro Enterprise nur noch eine höherpreisige Variante für Unternehmen erhältlich. Wir haben die Links entsprechend angepasst. Der Leistungsumfang der Enterprise-Version kann von der hier beschriebenen, eingestellten Version für Einzelnutzer abweichen.

Deutlich preiswerter als die Dragon-Produkte ist die Voice-Pro-Reihe von Linguatec. Die ebenfalls auf KI basierende Spracherkennung hilft beim Diktieren und Transkribieren gesprochenem Wort in Text. Genau wie Nuance bietet auch Linguatec seine Lösung in drei Varianten an: Es gibt eine Version für juristische Diktate und Transkripte sowie eine für medizinische Anwendungen. Voice Pro Premium ist als Allround-Lösung für viele andere Anwendungen gedacht. Für Unternehmen gibt es zudem Voice Pro Enterprise, das auch lokal auf den Servern des Unternehmens installiert werden kann. Dadurch bleibt die Verarbeitung der oft sensiblen Text- und Sprachdaten im Unternehmen, was dem Datenschutzbeauftragten sicherlich gut gefallen dürfte.

Voice Pro passt sich automatisch an die Sprechgewohnheiten des Nutzers an unterstützt Textbausteine, die vorab definiert werden können. Dadurch sind zum Beispiel formelle Briefe schnell erstellt. Zudem besitzt das Programm eine Funktion für verschiedene Schreibweisen: Durch eine Kontext-Sortierung kann das Tool gleichklingende Worte mit unterschiedlichen Schreibweisen recht treffsicher unterscheiden.

➤ Linguatec Voice Pro Enterprise
Ab 999,00 €

NCH Express Scribe: Manuelle Transkriptionssoftware

🛈 | Windows, Mac | 50,21 € (Einmalzahlung)

(Bild: NCH)

Express Scribe ist eine ganz klassische Transkriptionssoftware, die zwar nicht automatisch transkribiert, dafür aber die manuelle Verschriftlichung deutlich erleichtert: Das Programm unterstützt das Abspielen in verschiedenen Geschwindigkeiten und passt dabei die Tonhöhe an, besitzt eine Unterstützung für verschlüsselte Diktatdateien und kann sogar mit einer Vielzahl analoger und digitaler Sprachrekorder und anderer Audio- und Videoquellen zusammenarbeiten. Zudem können Audio-Aufzeichnungen jederzeit über beliebige Quellen – etwa E-Mail, FTP oder Intranet – übernommen werden. Bei Bedarf kann das Programm diese auch automatisch abrufen.

Interessant ist die Unterstützung für USB-Fußschalter, mit denen die Wiedergabe gesteuert werden kann, ohne die Hände von der Tastatur nehmen zu müssen. Eine Textverarbeitung ist mit an Bord, Express Scribe arbeitet aber auch mit Word, Lotus WordPro und anderen Windows-Textverarbeitungsprogrammen zusammen. Dabei erlaubt das Tool auch Kurzbefehle, mit deren Hilfe wiederkehrende Textbausteine per Tastenkombination eingefügt werden können.

➤ NCH Express Scribe*
50,21 €

Dr. Dresing & Pehl GmbH f4x: Professionelle Transkription für jeden Geschmack

🛈 | Windows, Mac, Linux | ab 29,90 € (Einmalzahlung)

(Bild: Dr. Dresing & Pehl GmbH)

Mit seiner f4x-Produktreihe liefert die Dr. Dresing & Pehl GmbH drei Lösungen für die Arbeit mit Text, von denen zwei für die direkte Transkription gedacht sind: Die Produkte f4x und f4transkript decken sowohl die manuelle als auch die automatische Transkription von Sprache zu Text ab. Bei f4transkript handelt es sich um eine klassische Transkriptionshilfe zum Abtippen von Texten, die mit variablem Tempo, Zeitmarken und USB-Fußschalterunterstützung arbeitet. Diese wird für MacOS, Windows und Linux angeboten. Bei f4x handelt es sich um eine rein cloudbasierte automatische Transkriptionslösung, die auf Technologie des Fraunhofer-Instituts basiert und laut Hersteller vor allem auf die Nutzung von Interview-Aufzeichnungen geeignet ist.

Der Hersteller wirbt mit DSGVO-Konformität durch Server in Deutschland und sofortige Ergebnisse ohne Trainings- und Lernaufwand. Zudem ist f4x auf deutsche Sprecher optimiert und damit bestens für den deutschen Sprachraum geeignet. Im c’t-Test wurde dem Dienst unkomplizierte Transkription mit ordentlicher Erkennungsqualität attestiert.

➤ Dresing & Pehl f4
ab 29,90 €

Philips SpeechLive: Transkription per Cloud

🛈 | Windows | ab 7,99 € (pro Monat, Abo)

(Bild: Philips)

Der niederländische Elektronikkonzern Philips ist seit Jahrzehnten auch zuverlässiger Lieferant von Diktiergeräten. Da liegt es nur nahe, dass der Anbieter auch eine eigene Transkriptionssoftware anbietet. Mit Philips SpeechLive können Nutzer Diktate in der Cloud speichern und mit einem Online-Transkriptionsplayer ganz klassisch manuell Sprache in Text umwandeln. Richtig interessant wird der Dienst aber im Zusammenspiel mit dem Speech-to-Text-Add-On-Paket: Hier kommt die automatische Transkription von Audiodateien in verschiedenen europäischen Sprachen. Praktisch: Anders als bei anderen Anbietern wird der Dienst als „Fair-use-Flatrate“ angeboten, sprich: Die Zahl der Transkriptionen im Abo ist erst einmal nebensächlich.

Falls komplexere Sprachaufnahmen zur Umwandlung in Text anstehen, bietet Philips einen Schreibservice an, der die Aufnahmen bei Bedarf manuell transkribiert. Das ist ein recht teures Vergnügen, kann sich aber zum Beispiel dann lohnen, wenn Mitschriften von komplexen Gruppenbesprechungen zu erstellen sind. Damit bietet Philips ein hübsches Gesamtpaket, das vor allem für Unternehmen interessant sein dürfte.

➤ SpeechLive
ab 7,99€ / Monat

Trint: Automatische Transkription online

🛈 | Windows | ab 44,00 € (pro Monat, Jahres-Abo)

(Bild: Trint)


Der Online-Service Trint konzentriert sich auf cloudbasierte Transkription von Sprache in Text. Dabei setzt der Dienst vollständig auf künstliche Intelligenz. Interessant ist, dass auch Videodateien verwendet werden können. So lassen sich auch Transkripte von per Video aufgezeichneten Gesprächen oder Meetings sowie Live-Inhalte komfortabel transkribieren. Trint wirbt mit seiner Echtzeit-Transkription: Live-Inhalte sollen binnen drei Sekunden als Text abgelegt sein, womit der Service „Mitschreiben“ kann. Zudem können Nutzer ihr eigenes Vokabular einfügen: Unternehmen und Organisationen haben nicht selten eigene Fachbegriffe und „Slang“, für den sich so die Erkennungsrate steigern lässt.

Interessant ist auch der Editor, der das Transkript online ausgibt und mittels klassischer Transkriptionsverfahren das Korrekturlesen deutlich erleichtert. Zudem können die fertigen Transkripte direkt geteilt oder weitergeleitet werden. Dank dieser Sharing-Optionen können auch Teammitglieder Anmerkungen in die Transkripte einfügen, zudem sind weitere Teamfunktionen für die Bearbeitung und Freigabe integriert, die doppelte Arbeit verhindern sollen. Der Erfolg gibt Trint recht: Einige große Unternehmen wie Airbnb, Nike oder The Washington Post nutzen den Service im Produktiveinsatz.

➤ Trint
ab 44,00€ / Monat

Kostenlose Transkriptionssoftware ist rar

Neben den kommerziellen Lösungen gibt es natürlich auch kostenlose Möglichkeiten zur Transkription. Automatische Transkription sucht man allerdings vergebens: Die zumeist cloudgestützten Lösungen sind selten kostenlos zu haben, von wenigen Ausnahmen wie Apples Sprachsteuerung einmal abgesehen, die aber auch nur zum Diktieren herhält. Dienste wie Otter.ai und descript bieten allerdings kostenlose monatliche Kontingente, mit denen zumindest gelegentliche Transkripte kein Problem sind. Zusätzlich bieten einige der Cloud-Dienste kostenlose Trialversionen, die zumindest für einen gewissen Zeitraum kostenlose automatische Transkripte ermöglichen, wenn diese nur punktuell benötigt werden, etwa im Studium. Wer mehr will, wird zur Kasse gebeten.

(Bild: descript)

Gratis-Lösungen für die manuelle Transkription

Anders sieht es bei Lösungen für die manuelle Transkription aus: Der Klassiker zum Transkribieren ist, ganz klar, das Abhören eines Diktiergeräts und Schreiben in einer Textverarbeitung – und dafür eignet sich natürlich jedes technische Gerät, das Audio aufzeichnen kann. So etwa die Sprachmemo-Apps auf modernen Smartphones. Hier gibt es auch eine Vielzahl von Diktiergerät-Apps, die zusätzliche Funktionen wie verlangsamte Wiedergabe bieten. Wer Transkripte in einem Rutsch am Rechner erstellen will, kann zu Tools wie easytranscript oder dem Online-Service oTranscribe greifen: Beide Optionen erlauben das gezielte und fokussierte Transkribieren mittels Audio/Videoplayer und Texteingabe-Feld.


Fazit

Grundsätzlich gilt: Als eines der wenigen Software-Genres ist Transkription nicht wirklich kostenlos zu bekommen. Entweder zahlt man für die Technologie der automatisierten Transkription oder es wird Personaleinsatz - sei es durch Angestellte oder eigene Arbeit – benötigt. Automatische Lösungen können aber ebenso wie spezialisierte Transkriptionssoftware den Workflow deutlich erleichtern und damit Zeit und Geld sparen. Aber auch automatische Lösungen können keine Wunder wirken, weshalb ein Mensch Formulierungen, Interpunktion und Fachbegriffe prüfen sollte. Dennoch lohnen sich entsprechende Lösungen besonders im professionellen Einsatz aufgrund der Zeitersparnis.


Zurück zur Liste: Transkriptionssoftware in der Übersicht

* Mit einem Stern markierte Links sind Affiliate-Links, für die wir unter Umständen eine Provision erhalten. Der Kaufpreis erhöht sich dadurch nicht!

Redaktion & Aktualisierung: heise Download-Team

( )

Wie bewertest Du die Qualität des Beitrags?

Pflichtlektüre! ({{threeCount}})
Gut zu wissen ({{twoCount}})
Geht gar nicht! ({{oneCount}})
Vielen Dank für Deine Bewertung.
Deine Bewertung wurde gelöscht.

Kommentare

{{commentsTotalLength}} KommentarKommentare

Kommentare öffnen Weitere Kommentare laden...