Beste Diktiersoftware für Mac (2026) — 6 Apps im Test
Sprechen ist etwa dreimal schneller als Tippen. Egal ob E-Mails, juristische Texte, Arztbriefe oder einfach Notizen — wer diktiert statt tippt, spart jeden Tag Zeit. Aber welche Diktiersoftware lohnt sich auf dem Mac wirklich?
Nicht alle Diktiertools arbeiten gleich. Manche schicken die Stimme in die Cloud. Manche nehmen Screenshots des Bildschirms auf. Manche schreiben mit KI um, was man gesagt hat. Manche verlangen ein Abo für immer — für Software, die auf der eigenen Hardware läuft.
Wir haben die sechs relevantesten Mac-Diktierprogramme 2026 unter realen Bedingungen getestet: lange Texte, Programmier-Diktat, Fachbegriffe, deutsch-englisch gemischtes Diktat und ein Bluetooth-Headset im fahrenden Zug. Diese Seite fasst zusammen, was wir gefunden haben.
Kurzantwort
Wenn es nur eine Empfehlung sein darf: SpeakUp ist 2026 die beste Diktiersoftware für Mac für die meisten Anwender. Sie läuft vollständig auf dem Mac, transkribiert originalgetreu (keine KI-Umschreibung), kostet 29 € einmalig ohne Abo und funktioniert offline. 14 Tage kostenlos testen — ohne Kreditkarte.
Wer KI-Polierung will und ein Abo nicht stört, ist mit Wispr Flow gut beraten — zu 180 $/Jahr, mit Audio und Screenshots in der Cloud.
Für alles andere macht die Tabelle die Kompromisse explizit.
Vergleich auf einen Blick
| App | Preis | Verarbeitung | Datenschutz | Offline | iPhone-Begleitung | Am besten für |
|---|---|---|---|---|---|---|
| SpeakUp | 29 € einmalig | Lokal (whisper.cpp) | Keine Daten verlassen den Mac | Ja | Kostenlos (App Store) | Datenschutz-bewusstes Alltags-Diktat |
| Wispr Flow | 180 $/Jahr | Cloud | Audio + Screenshots an Server | Nein | Ja (kostenpflichtig) | KI-Textbearbeitung, Multi-Plattform |
| Dragon | 200–500+ € | Lokal (Legacy) | Lokal | Ja | Nein | Windows-Enterprise (Mac eingestellt) |
| Superwhisper | 99 $/Jahr | Lokal (whisper.cpp) | Lokal | Ja | Nein | Lokal mit optionaler KI-Bearbeitung |
| Apple Diktat | Kostenlos | Hybrid | Kann Cloud nutzen | Teilweise | iOS integriert | Kurze Sätze |
| MacWhisper | Kostenlos + Bezahl | Lokal (Whisper) | Lokal | Ja | Nein | Transkription von Audiodateien |
Wie wir getestet haben
Jede Aussage in diesem Vergleich kommt aus praktischen Tests, nicht aus Feature-Listen. Der Testablauf war bewusst breit angelegt:
- Langtexte. 1.500-Wörter-Blogentwürfe in Deutsch und Englisch komplett diktiert.
- Fachvokabular. Software-Begriffe (Kubernetes, PostgreSQL, mlflow, pydantic) und medizinische Terminologie auf Deutsch (Tachykardie, Hyponatriämie, aszendierendes Aortenaneurysma).
- Code-nahes Diktat. Klassen- und Funktionsnamen, gemischte Zeichensetzung, eingebetteter Code.
- Mehrsprachiges Wechseln. Zwei Sätze Englisch / zwei Sätze Deutsch im Wechsel, ohne Einstellungen zu ändern.
- Reale Bedingungen. Bluetooth-Headset im fahrenden Zug, AirPods im Café, MacBook-Mikrofon im ruhigen Büro, externes USB-Mikrofon am Schreibtisch.
- Offline. WLAN aus für die Hälfte der Tests. Cloud-abhängige Tools entsprechend markiert.
Für deutsche medizinische Fachsprache haben wir zusätzlich eine umfangreiche Benchmark-Studie durchgeführt — 7 Modelle, 200+ Sätze, 8 deutsche Muttersprachler-Stimmen.
1. SpeakUp — Testsieger
- Preis: 29 € einmalig, kein Abo
- Verarbeitung: 100 % lokal (whisper.cpp + Metal GPU + Apple Neural Engine via Core ML)
- Datenschutz: Keine Netzwerkfähigkeit — mit jedem Netzwerk-Monitor überprüfbar
- Kostenlose Testphase: 14 Tage, ohne Kreditkarte
SpeakUp läuft komplett auf dem eigenen Mac. Whisper.cpp läuft mit dem Encoder auf der Apple Neural Engine via Core ML und dem Decoder auf der Metal-GPU — das macht die Transkription 2–3× schneller als reine CPU-Whisper-Implementierungen. Kein Internet, kein Konto, kein Cloud-Server zu irgendeinem Zeitpunkt. Audio wird lokal verarbeitet und sofort verworfen.
Die Philosophie nennt das Team unsichtbares Diktieren: Die Software macht genau eine Sache — Sprache originalgetreu in Text umwandeln. Kein KI-Umschreiben, keine „Verbesserungen", keine stilistische Bearbeitung. Was man sagt, wird geschrieben.
Für 29 € einmalig ohne wiederkehrende Kosten entspricht das über drei Jahre ungefähr 16 Cent pro Monat (gegenüber rund 15 $/Monat für Wispr Flow). 14 Tage kostenlos testen — ohne Kreditkarte, ohne Konto.
Was gut ist
- 100 % lokal. Keine Netzwerkverbindungen, niemals. Die App hat keine Bildschirmaufnahme-Berechtigung, keinen vollständigen Festplattenzugriff und keine ausgehende Netzwerkfähigkeit. Selbst überprüfbar mit Aktivitätsanzeige oder Little Snitch.
- Kein Abo. 29 € einmalig, lebenslange Nutzung.
- Originalgetreue Transkription. Kein KI-Umschreiben. Output = das Gesagte.
- Offline. Flugzeug, Zug, Krankenhaus, Keller — überall, wo der Mac läuft.
- Lexika für Fachvokabular. Eingebaute Wörterbücher für Medizin (Deutsch) und Software (Englisch) fangen Begriffe ab, die generisches Whisper verfehlt. Recht-Lexikon in Arbeit.
- Kostenlose iPhone-Begleitung. Die SpeakUp-Tastatur für iPhone ist im App Store kostenlos — unterwegs diktieren, am Schreibtisch fertigstellen.
- Mehrsprachig. 30+ Sprachen, Deutsch und Englisch voll optimiert. Auto-Erkennung pro Äußerung.
- Native macOS-App. Swift, sandboxed, schlanke Menüleisten-App. Kein Electron.
Worauf zu achten ist
- macOS und iOS heute. Windows in der Vorlaunch-Phase, Android auf der Roadmap.
- Kleinere Sprachliste als Cloud-Konkurrenten. Wispr Flow listet 100+; SpeakUp konzentriert sich auf 30+ mit tieferer Optimierung pro Sprache.
Fazit. Die klare Wahl für Mac-Nutzer, die schnelles, präzises lokales Diktieren zum fairen Einmalpreis wollen. Die Kombination mit einer kostenlosen iPhone-Tastatur bietet einen Alltags-Workflow, den keine andere App auf dieser Liste hat.
SpeakUp 14 Tage kostenlos testen → · SpeakUp für iPhone ansehen →
2. Wispr Flow
- Preis: 14,99 $/Monat (180 $/Jahr), 360 $ über zwei Jahre
- Verarbeitung: Cloud
- Datenschutz: Audio + Active-Window-Screenshots werden an Server übertragen
Wispr Flow ist ein gut finanziertes Startup (~81 Mio. $ Risikokapital) mit Apps für Mac, Windows, iOS und Android. Über 100 Sprachen unterstützt und KI-Textbearbeitung, die das Diktierte nach der Transkription umschreibt.
Der Kompromiss: Alles läuft über die Cloud. Die Stimme geht an externe Server zur Transkription, und Wispr Flow nimmt zusätzlich Screenshots des aktiven Fensters als Teil seiner „Kontextbewusstsein"-Funktion auf. Die Screenshots helfen der KI, den Text zur aktiven App passend zu formatieren — und sie verlassen den Mac.
Was das für Entwickler, Anwälte und alle bedeutet, die mit vertraulichem Material arbeiten: Macht Wispr Flow Screenshots? Ja — und das bedeutet das.
Was gut ist
- Plattformübergreifend — Mac, Windows, iOS, Android.
- 100+ Sprachen.
- KI-Textbearbeitung, wenn man das will.
Worauf zu achten ist
- Cloud-abhängig. Audio in die Cloud. Internet erforderlich.
- Screenshots des Bildschirms sind Teil des Produkts.
- 180 $/Jahr. Über drei Jahre 540 $ — gegenüber 29 € einmalig für SpeakUp.
- KI schreibt um, was man gesagt hat. Output ist nicht immer das, was gesagt wurde.
- Konto erforderlich, ohne geht nichts.
Fazit. Sinnvoll, wenn man aktiv KI-Bearbeitung will und Cloud-Verarbeitung akzeptiert. Abo-Preise und Datenschutz-Kompromisse sind signifikant, wenn die Arbeit vertrauliches Material berührt.
Vollständige Aufschlüsselung: SpeakUp vs Wispr Flow.
3. Dragon NaturallySpeaking
- Preis: 200–500+ € auf Windows; Mac-Version eingestellt
- Verarbeitung: Lokal (Legacy-Engine)
- Datenschutz: Lokal
Dragon war jahrzehntelang der Goldstandard der Spracherkennung. Nuance (heute Teil von Microsoft) baute eine leistungsfähige lokale Engine mit umfangreichen Sprachbefehlen, auf die Juristen und Ärzte jahrelang vertrauten.
Die Realität 2026: Dragon für Mac existiert nicht mehr. Nuance hat es eingestellt. Die Windows-Version wird noch ausgeliefert, hat sich aber zum Enterprise-Gesundheitswesen und zu Unternehmenslizenzen verschoben. Privatanwender auf Mac haben keinen Dragon-Pfad mehr.
Was gut ist
- Mächtige Sprachbefehle und individuelles Vokabular (auf Windows).
- Jahrzehnte der Verfeinerung.
Worauf zu achten ist
- Auf Mac eingestellt. Nicht mehr für macOS kaufbar oder herunterladbar.
- Teuer selbst auf Windows (200–500+ € mit kostenpflichtigen Upgrade-Zyklen).
- Alternde Engine im Vergleich zu Whisper-basierten Alternativen.
- Komplexe Einrichtung mit Sprachtraining und Konfiguration.
Fazit. Auf Windows noch eine Legacy-Wahl. Auf Mac keine Option mehr. Moderne Whisper-Tools haben die Genauigkeitslücke geschlossen und Dragon bei Bedienbarkeit überholt.
SpeakUp vs Dragon, falls man von Dragon migriert.
4. Superwhisper
- Preis: 9,99 $/Monat oder 99 $/Jahr
- Verarbeitung: Lokal (whisper.cpp)
- Datenschutz: Lokal
Superwhisper ist eine Mac-native Diktier-App, die ebenfalls whisper.cpp nutzt. Die Transkriptionsqualität ist gut — gleiche Engine-Grundlage wie SpeakUp — und es bietet einen optionalen KI-Bearbeitungsmodus, der Output umformatiert oder umschreibt.
Das ökonomische Argument ist schwerer zu verteidigen: Man zahlt ein Abo für Software, die vollständig auf der eigenen Hardware läuft und eine Open-Source-Engine nutzt. Über drei Jahre rund 297 $ — etwa zehnmal so viel wie SpeakUp einmalig.
Was gut ist
- Lokale Verarbeitung (whisper.cpp).
- Solide macOS-Oberfläche.
- Optionale KI-Textbearbeitung, falls gewünscht.
Worauf zu achten ist
- Abo-Preise (99 $/Jahr) für Software, die auf der eigenen Hardware läuft.
- Nur macOS.
- KI-Bearbeitungsmodus verändert die Worte, wenn aktiviert.
Fazit. Architektonisch ähnlich zu SpeakUp auf der Engine-Seite. Der entscheidende Unterschied ist der Preis: Abo für immer vs. 29 € einmalig.
Vollständige Aufschlüsselung: SpeakUp vs Superwhisper.
5. Apple Diktat
- Preis: Kostenlos (in macOS integriert)
- Verarbeitung: Lokal + Cloud Hybrid
- Datenschutz: Kann Audio an Apple-Server senden, je nach Kontext
Apple Diktat ist in jeden Mac eingebaut. Diktier-Taste drücken (Standard: fn fn) und lossprechen. Kostenlos, keine Installation, funktioniert in jedem Textfeld.
Für einen kurzen Satz oder eine Suchanfrage reicht es. Für alles darüber hinaus zeigen sich die Grenzen. Apple Diktat verarbeitet amerikanisches Englisch akzeptabel; bei Akzenten, Fachvokabular, Deutsch und anderen europäischen Sprachen schwächelt es deutlich. Zum Wechseln der Diktatsprache muss man die Systemtastatur umstellen — Reibung bei jedem Sprachwechsel.
macOS Sequoia (2025) brachte ein 60-Sekunden-Limit für Offline-Diktate und nutzt für längere Sitzungen Cloud-Verarbeitung — selbst „On-Device" sendet also kontextabhängig Audio an Apple-Server.
Was gut ist
- Kostenlos und integriert.
- Keine Installation.
- Funktioniert in jedem Textfeld.
Worauf zu achten ist
- Schwache Genauigkeit bei Akzenten und Nicht-Englisch.
- Schwache Deutsch-Unterstützung.
- Systemtastatur muss zum Sprachwechsel umgestellt werden.
- 60-Sekunden-Offline-Limit auf neueren macOS-Versionen; längere Diktate können Cloud nutzen.
- Inkonsistente Zeichensetzung und Großschreibung.
Fazit. Okay für „Such X" oder eine einzeilige Antwort. Kein ernsthafter Daily Driver, wenn man mehr als ein paar Sätze auf einmal schreibt.
Vollständige Aufschlüsselung: SpeakUp vs Apple Diktierfunktion.
6. MacWhisper
- Preis: Kostenlose Basisversion + Bezahlpläne
- Verarbeitung: Lokal (Whisper)
- Datenschutz: Lokal
MacWhisper ist eine macOS-App, die OpenAIs Whisper-Modell zur lokalen Transkription von Audiodateien nutzt. Kostenlose Basisversion mit Grundfunktionen, Bezahlpläne schalten größere Whisper-Modelle und zusätzliche Features frei.
Der entscheidende Unterschied: MacWhisper ist auf die Transkription aufgezeichneter Audiodateien ausgelegt (Meetings, Podcasts, Interviews), nicht auf system-weites Live-Diktat. Eine einstündige Meeting-Aufnahme transkribieren? MacWhisper. Live in eine E-Mail diktieren? Falsches Tool.
Was gut ist
- Kostenlose Basisversion für gelegentliche Datei-Transkription.
- Gut für Audio-Datei-Transkription (Meetings, Podcasts, Interviews).
- Lokale Verarbeitung.
Worauf zu achten ist
- Nicht für Live-Diktat ausgelegt. Kein system-weiter Hotkey-in-Cursor-Workflow.
- Anderes Tool für einen anderen Zweck.
Fazit. Das richtige Werkzeug für Aufnahmen-Transkription. Das falsche Werkzeug, wenn man „in jede App sprechen und Text am Cursor sehen" will.
Preise über drei Jahre
Ein Abo, das pro Monat klein aussieht, summiert sich. Über drei Jahre typischer Nutzung:
| App | Pro Monat | 3-Jahre-Gesamt |
|---|---|---|
| SpeakUp | — | 29 € einmalig |
| Wispr Flow | 14,99 $ | ~540 $ |
| Superwhisper | 9,99 $ | ~297 $ |
| Apple Diktat | — | Kostenlos |
| Dragon (Mac) | n/v | n/v (eingestellt) |
Drei Jahre Wispr Flow reichen, um SpeakUp 18-mal zu kaufen. Die Ökonomie eines Diktier-Abos lohnt sich nur, wenn die KI-Umschreibung den Output wirklich verändert — für unsichtbares, originalgetreues Diktieren zahlt man ein Abo für nichts, was die zugrundeliegende Engine nicht ohnehin tut.
Unsere Empfehlung
Wer Datenschutz schätzt, originalgetreue Transkription will (statt KI-Umschreibung) und lieber einmal zahlt statt für immer, für den ist SpeakUp 2026 die beste Diktiersoftware für Mac.
Es läuft komplett auf der eigenen Hardware. Es telefoniert nie nach Hause. Es schreibt nicht um, was man sagt. Es kostet weniger als zwei Monate Wispr Flow. Und es paart sich mit der kostenlosen SpeakUp-Tastatur für iPhone, sodass derselbe Workflow auch unterwegs verfügbar ist.
Wer explizit KI-Umschreibung und Cloud-Komfort möchte, ist mit Wispr Flow am besten beraten — zum Preis von 180 $/Jahr und Audio plus Screenshots in der Cloud. Wer Audiodateien transkribieren will statt live zu diktieren, hat in MacWhisper ein zweckmäßiges Werkzeug.
Aber für die Kernfrage — Taste drücken, sprechen, Worte am Cursor sehen — würden wir jedes Mal SpeakUp wählen.
Weiterführende Seiten: Datenschutz-Architektur · SpeakUp Funktionen · Macht Wispr Flow Screenshots? · Diktiersoftware für Anwälte · Diktiersoftware für Ärzte
Häufig gestellte Fragen
Was ist die beste Diktiersoftware für Mac 2026?
Für die meisten Anwender ist SpeakUp die beste Diktiersoftware für Mac 2026. Sie läuft vollständig lokal, kostet 29 € einmalig ohne Abo und transkribiert originalgetreu ohne KI-Umschreibung. Wispr Flow ist die führende Cloud-Alternative, wenn man KI-polierten Text will und Abos akzeptiert.
Gibt es kostenlose Diktiersoftware für Mac?
Apple Diktat ist kostenlos und in macOS integriert. Für kurze Sätze reicht es, aber bei Akzenten, Fachvokabular und deutschen Texten schwächelt es. SpeakUp bietet 14 Tage kostenlosen Test mit vollem Funktionsumfang. Die SpeakUp-Tastatur für iPhone ist im App Store komplett kostenlos.
Hat der Mac eine eingebaute Diktiersoftware?
Ja. Mit der Diktier-Taste (Standard: fn fn) startet macOS Diktat. Es nutzt einen Hybrid-Ansatz aus lokal und Cloud. Für Englisch akzeptabel, für Deutsch und andere europäische Sprachen deutlich limitiert — und zum Wechseln der Diktatsprache muss man die Systemtastatur umstellen.
Gibt es Dragon NaturallySpeaking noch für Mac?
Nein. Nuance hat Dragon für Mac eingestellt. Die Windows-Version existiert noch, richtet sich aber überwiegend an das Enterprise-Gesundheitswesen. Mac-Nutzer sind mit modernen Whisper-basierten Alternativen wie SpeakUp oder Superwhisper besser bedient.
Welche Diktiersoftware für Mac ist am datenschutzfreundlichsten?
SpeakUp kann architektonisch keine Audiodaten irgendwohin senden — die App hat keine Netzwerkfähigkeit, keine Bildschirmaufnahme-Berechtigung und keine Cloud-Infrastruktur. Audio wird lokal auf der GPU verarbeitet und sofort verworfen. Mit jedem Netzwerk-Monitor überprüfbar.
Was kostet Wispr Flow?
Wispr Flow kostet 14,99 $/Monat bzw. rund 180 $/Jahr. Über drei Jahre sind das 540 $ gegenüber einmalig 29 € für SpeakUp. Wispr Flow verarbeitet Audio in der Cloud und nimmt Screenshots des aktiven Fensters für den Kontext auf.
Funktioniert Diktiersoftware für Mac offline?
Lokale Tools wie SpeakUp, Superwhisper und MacWhisper funktionieren vollständig offline. Cloud-basierte Tools wie Wispr Flow benötigen Internet. Apple Diktat ist hybrid — kurze Sätze laufen lokal, längere Diktate gehen typischerweise über die Cloud.
Kann ich auf dem Mac deutsch diktieren?
Ja. SpeakUp erkennt Deutsch besonders zuverlässig — Komposita, Umlaute und deutsche Sprachmelodie werden gut erkannt, weil Whisper auf mehrsprachigen Daten trainiert wurde. Apple Diktat unterstützt Deutsch, mit spürbaren Genauigkeits-Einbußen; Wispr Flow per Cloud.