So funktioniert es
SpeakUp mit Cursor zu nutzen erfordert drei Schritte:
- Klicken Sie in Cursors Chat-Panel (oder ein anderes Textfeld — Inline-Edit, Terminal, Befehlspalette).
- Drücken Sie Ihren SpeakUp-Hotkey und sprechen Sie Ihren Prompt. Beschreiben Sie, was Cursor bauen, reparieren oder refaktorisieren soll.
- Drücken Sie den Hotkey erneut. Ihre Worte erscheinen als getippter Text im Chat-Panel. Enter drücken, und Cursor generiert den Code.
SpeakUp simuliert Tastatureingaben direkt — keine Zwischenablage, kein Einfügen. Es funktioniert in jedem Cursor-Textfeld: Chat-Panel, Inline-Edit-Prompts, integriertes Terminal und Befehlspalette.
Warum nicht Cursors integrierte Sprachfunktion
Cursor hat ein experimentelles Spracheingabe-Feature eingeführt, aber die Entwickler-Community hat es als unzuverlässig erlebt. Forenbeiträge und Community-Diskussionen berichten, dass 70 bis 80 Prozent der Spracheingaben leer ankommen — keine Transkription. Die Funktion benötigt eine Netzwerkverbindung und sendet Audio extern zur Verarbeitung.
SpeakUp nutzt OpenAIs Whisper-Modell lokal auf der GPU Ihres Macs via whisper.cpp und Metal-Beschleunigung. Es gibt keine Netzwerkabhängigkeit. Die Transkription ist konsistent und präzise — egal ob Sie im Flugzeug sitzen, hinter einer Firmen-Firewall oder in einem Cafe mit schwachem WLAN arbeiten.
Warum nicht Wispr Flow
Wispr Flow richtet sich gezielt an Entwickler, bringt aber zwei Probleme mit, die beim Programmieren relevant sind:
Screenshots Ihres Bildschirms. Wispr Flow nimmt Screenshots Ihres aktiven Fensters auf und sendet sie an Cloud-Server. Wenn Sie in Cursor arbeiten, bedeutet das: Ihr Code, Ihre Dateistruktur, Ihre Terminal-Ausgabe und alles andere auf Ihrem Bildschirm wird extern übertragen. Wenn Sie an proprietärem Code, Kundenprojekten oder NDA-geschütztem Material arbeiten, ist das ein Sicherheitsrisiko.
Prompt-Umschreibung. Wisprs KI „bearbeitet" Ihre Diktate automatisch und schreibt Ihre Worte um, bevor sie eingefügt werden. Bei einem Cursor-Prompt kommt es auf Präzision an. Wenn Sie sagen „füge einen Try-Catch um den Stripe-Webhook-Handler hinzu", brauchen Sie exakt diese Worte — keine umformulierte Version, der der Funktionsname oder die Service-Referenz fehlt.
SpeakUp hat keinen Bildschirmzugriff, keine Netzwerkverbindungen und keine KI-Umschreibung. Ihre Worte werden exakt so eingefügt, wie Sie sie sprechen.
Der SpeakUp-Vorteil
Lokale Verarbeitung. Audio wird durch whisper.cpp auf der GPU Ihres Macs verarbeitet. Nichts verlässt Ihren Rechner. Ihr Code, Ihre Prompts und Ihre Sprachdaten bleiben privat.
Originalgetreue Transkription. SpeakUp transkribiert exakt, was Sie sagen. Kein Umformulieren, keine Auto-Korrektur, keine KI-„Verbesserungen". Technische Begriffe, Framework-Namen und spezifische Anweisungen kommen korrekt an.
Ein Preis, für immer. SpeakUp kostet einmalig 29 €. Kein Abo, keine monatliche Abrechnung. Sie zahlen bereits 20 $ im Monat für Cursor Pro — eine weitere laufende Gebühr für Spracheingabe brauchen Sie nicht.
Prompts, die per Sprache besonders gut funktionieren
Diktieren eignet sich hervorragend für ausführliche, beschreibende Prompts — genau die Art, die bei Cursor die besten Ergebnisse liefert, sich aber mühsam tippt:
- „Füge Paginierung zur User-List-Komponente hinzu mit 20 Einträgen pro Seite und zeige die Gesamtzahl im Footer"
- „Schreibe einen Unit-Test für die calculateTax-Funktion, der Randfälle für negative Werte und Null abdeckt"
- „Refaktorisiere diese Komponente auf React Query statt dem manuellen useEffect-Fetch-Pattern"
- „Erstelle eine Middleware, die das JWT-Token validiert und bei Ablauf einen 401 mit klarer Fehlermeldung zurückgibt"
- „Füge ein Loading-Skeleton zum Dashboard hinzu, das dem Layout des eigentlichen Inhalts entspricht"
Jeder dieser Prompts dauert 5 bis 10 Sekunden gesprochen. Getippt sind es 30 bis 60 Sekunden. Über einen vollen Tag Vibe Coding summiert sich die Zeitersparnis erheblich.
Weiterführende Seiten: Spracherkennung für Vibe Coders · SpeakUp für Entwickler