Waarom de ingebouwde Dictation van Apple niet volstaat voor dagelijks gebruik
Apple Dictation werkt. Het draait op het apparaat op elke Mac met een M1-chip of nieuwer, de transcriptie is acceptabel voor korte uitbarstingen, en het kost niets. Voor een snel tekstbericht of een zoekopdracht van één regel doet het zijn werk.
Het houdt op te volstaan zodra je het probeert te gebruiken voor echt werk.
Het eerste waar je tegenaan loopt, is de onderbreking bij stilte. De documentatie van Apple geeft aan dat Dictation op Apple Silicon geen harde tijdslimiet heeft, maar het systeem stopt automatisch na 30 seconden gedetecteerde stilte - en "stilte" omvat de natuurlijke pauzes die je maakt tijdens het formuleren. Er is geen instelling om de onderbreking te verlengen. Een e-mail van meer dan twee alinea's dicteren betekent dat je het twee of drie keer opnieuw moet activeren. Verschillende discussies op de eigen supportforums van Apple merken op dat de gevoeligheid van de onderbreking is veranderd in de loop van de updates van iOS 18 en macOS Tahoe.
Het tweede is de nauwkeurigheid bij alles wat technisch is. Apple Dictation doet het goed bij duidelijke, algemene spraak en is merkbaar minder goed bij code, jargon, Engels met een accent en domeinspecifiek vocabulaire - precies de soorten inhoud waarvoor developers, artsen en advocaten dicteren ook echt gebruiken. Tools van derden die moderne modellen van de Whisper-klasse draaien, zijn veel beter bij diezelfde inhoud. We houden precieze WER-cijfers op deze pagina achter de hand tot we een reproduceerbare benchmark-methodologie publiceren - anderen hebben hun eigen vergelijkingen al gepubliceerd (VoicePrivate, Voicci, PromptQuorum hebben tests uit 2026), maar we citeren liever geen cijfers die we niet onder gecontroleerde omstandigheden hebben gereproduceerd.
Het derde is de grens van de integratie. Apple Dictation werkt in de apps van Apple en in de meeste native tekstvelden van macOS. Het heeft geen samenhangende sneltoets-flow om te plakken in webapps, Electron-apps of terminals. Je schakelt het uiteindelijk uit op de helft van de plekken waar je het wilt gebruiken.
Er bestaat een goede ingebouwde dicteer-tool voor incidenteel gebruik, en er bestaat een aparte categorie tools gemaakt voor wie voor de kost typt. Die categorie bestaat omdat de incidentele tool nooit bedoeld was om de tweede te zijn.
Wat een echte dicteer-app voor Mac doet
Een dicteer-app voor Mac is een tool die spraak omzet in getypte tekst in elke applicatie via een globale sneltoets, met het spraakherkenningsmodel dat lokaal op Apple Silicon draait. De drie componenten die de categorie definiëren zijn: een universele sneltoets die werkt in elke macOS-app, inclusief webapps, Electron-apps en terminals; een spraakherkenningsmodel met meer dan 95% nauwkeurigheid op schone Engelse audio; en een lokale verwerkingspijplijn die de audio op je apparaat houdt.
Een sneltoets die in elke app op dezelfde manier werkt. Je drukt hem één keer in, de opname start. Je drukt hem opnieuw in, de opname stopt. Je getranscribeerde tekst verschijnt op de positie van de cursor, ongeacht in welke app je zit. Geen app-specifieke configuratie, geen menubomen, geen wachten.
Een spraakherkenningsmodel dat echt goed is. Het gratis plan van moderne dicteer-apps voor Mac wordt geleverd met compacte Whisper-modellen die meer dan 95% nauwkeurigheid halen op schone Engelse audio. De betaalde plannen voegen grotere modellen toe, extra talen en nabewerking voor het verwijderen van stopwoorden en interpunctie. Het doel is om helemaal niet meer aan het model te hoeven denken zodra het draait.
Een lokale pijplijn die geen internet nodig heeft. De audiobuffer blijft in RAM, het model draait op de GPU of de Neural Engine van je Mac, en de tekst verschijnt in het actieve tekstveld. Niets verlaat je machine, tenzij je expliciet kiest voor een functie in de cloud.
Dit derde deel is wat de categorie definieert. Als je een tool hebt die het model op je eigen hardware draait, verandert het privacyverhaal van "we beloven je audio niet te misbruiken" naar "je audio verlaat het apparaat niet". Dat is een ander argument, met andere gevolgen.
Apple Silicon maakt lokale Whisper echt snel
Grote Whisper-modellen lokaal draaien op Windows betekent meestal CUDA installeren, een compatibele NVIDIA-GPU vinden en de batchgroottes afstellen. Op Mac is dezelfde flow al kant-en-klaar.
De whisper.cpp-engine, die de meeste moderne dicteer-apps voor Mac aandrijft, de onze inbegrepen, compileert standaard met Apple Metal GPU-versnelling op Apple Silicon. Metal is de GPU-API van Apple en steunt op de M-serie chips rechtstreeks op de verenigde geheugenpool, wat betekent dat de gewichten van het model en de audiobuffer in hetzelfde fysieke geheugen leven als de code van je applicatie. Er is geen geheugenkopie tussen CPU en GPU voor elke inferentie. Dit ene architectuurdetail is de reden waarom een MacBook Air M1 Whisper Large v3 Turbo in realtime kan draaien, terwijl hetzelfde model op een Windows-laptop meestal een aparte NVIDIA-GPU nodig heeft.
Op elke Mac met Apple Silicon vanaf de M1 kun je het Whisper small- of medium-model lokaal draaien en de latency nooit voelen. De tekst verschijnt op het moment dat je stopt met spreken. Het verschil tussen een M1 Air en een M5 Pro is of je ook de grote modellen kunt draaien zonder erbij na te denken, niet of het dicteren wel of niet werkt.
De andere kant van dit verhaal zijn de oudere Intel-Macs. De eigen documentatie van Apple geeft aan dat Intel-Macs die Apple Dictation draaien audio naar de servers van Apple sturen, omdat het pad op het apparaat alleen op Apple Silicon werkt. Apps van derden die whisper.cpp gebruiken, hebben ook Metal-versnelling nodig om in realtime bruikbaar te zijn. De realistische minimale hardware voor modern lokaal dicteren op Mac is de M1 of nieuwer.
Lokaal vs cloud - waarom het uitmaakt voor dagelijks dicteren
Een dicteer-tool in de cloud stuurt elke spreekbeurt naar een externe server, transcribeert die daar en stuurt de tekst terug. Het model dat in de cloud draait is vaak groter dan het model dat je lokaal kunt draaien, wat een licht nauwkeurigheidsvoordeel kan betekenen onder rumoerige omstandigheden. De prijs in latency is de heen-en-terugreis, doorgaans 200-800ms op een goede verbinding, meer op een slechte.
Een lokale dicteer-tool draait het model op je Mac. De latency is alleen de inferentietijd, die op Apple Silicon meestal sneller is dan de heen-en-terugreis naar een server in de cloud. De audio blijft op je apparaat. Er zijn geen inferentiekosten boven op de elektriciteit om de chip te laten draaien.
Voor dagelijks dicteren stapelt de lokale aanpak zich op in de loop van de tijd. Als je 8000 woorden per dag dicteert op je werk, voer je duizenden inferentie-aanroepen uit. Een lokale tool verwerkt dat gratis op hardware die je al bezit. Een cloud-tool brengt ofwel een abonnement in rekening, of verbruikt API-credits die je hebt gekocht bij OpenAI of een andere aanbieder. Over een jaar telt het kostenverschil voor een intensieve gebruiker op tot honderden dollars, en het privacyverschil valt in de categorie "alles wat je het hele jaar hebt gezegd, op een server" tegenover "niets heeft je apparaat verlaten".
Er blijven gevallen waarin de cloud in het voordeel is. Bij zeer sterke accenten waar de compacte lokale modellen moeite mee hebben, of bij minder gangbare talen zoals Vietnamees of Bengaals, waar lokale Whisper bekende nauwkeurigheidshiaten heeft, overtreffen de grotere modellen in de cloud nog steeds wat een lokale app vandaag kan. De juiste tool hangt af van wat je daadwerkelijk dicteert.
Hoe we dicteren voor Mac en Windows tegelijk hebben gebouwd
SnailText werkt op Mac en Windows vanuit één codebase, met functiepariteit vanaf de eerste dag. De meeste dicteer-apps voor Mac kwamen eerst uit op Mac en voegden jaren later Windows toe: MacWhisper is alleen Mac, SuperWhisper lanceerde Windows in november 2025 (ongeveer twee jaar na de macOS-versie), Voibe en Aqua Voice zijn alleen Mac. De markt voor dicteer-apps voor Mac is al jaren volwassen; de Windows-kant is een recente uitbreiding.
Wij volgden een andere weg. SnailText is vanaf de eerste dag gebouwd als een Tauri-app met één kern in Rust die wordt gedeeld tussen Mac en Windows. Dezelfde whisper.cpp-engine draait op beide platforms, met Metal-versnelling op Mac en Vulkan op Windows. De sneltoets, de interface van de overlay, de geschiedenis, het woordenboek, de snippets - dat is allemaal identiek. Er is geen functiekloof van het type "eerst Mac-app, daarna Windows-app".
Voor wie alleen Mac gebruikt, maakt deze ontwerpkeuze niet veel uit. Voor wie allebei gebruikt, of werkt in een huishouden of team waar sommigen op Mac en anderen op Windows zitten, of wie in de toekomst van platform kan wisselen, betekent het één tool in plaats van twee.
Wat je dagelijks echt doet met dicteren op Mac
Wie op Mac dicteert, besteedt het grootste deel van zijn invoertijd aan vijf gebruiksscenario's: antwoorden in e-mail en Slack (de hoogste frequentie, bespaart ongeveer een uur per dag voor typisch kenniswerk), eerste concepten van lange teksten op 2-3× de typsnelheid, code-gerelateerde taken in natuurlijke taal zoals commit-berichten en prompts voor AI-agents, spraaknotities die de flow van opnemen-overzetten-transcriberen overslaan, en toegankelijkheidsgebruik tijdens herstel van RSI of als blijvende invoervoorkeur.
Antwoorden in e-mail en Slack. Het scenario met de hoogste frequentie. Een antwoord van twee zinnen waar je 30 seconden over zou doen om te typen, kost 5 seconden om te dicteren. Over een werkdag met 40-80 korte antwoorden bespaar je een uur.
Lange teksten. Eerste concepten van blogartikelen, essays, documentatie of notities. De meeste schrijvers dicteren sneller dan ze typen, vaak op 2-3×. De transcriptie blijft ruw en heeft bewerking nodig, maar bewerken gaat sneller dan het eerste concept produceren zou zijn geweest.
Code-gerelateerd dicteren. Niet code teken voor teken schrijven, maar de delen in natuurlijke taal van het werk met code: commit-berichten, PR-beschrijvingen, opmerkingen die een ingewikkelde logica uitleggen, prompts voor AI-codeassistenten zoals Cursor of Claude. Onze pagina voor vibe-coders behandelt dit gebruiksscenario in detail.
Spraaknotities naar tekst. Je laat de hond uit, je krijgt een idee, je drukt op de sneltoets, je praat 30 seconden. De tekst staat in een notitie als je terugkomt. De flow van Apple Voice Memos vereist dat je opneemt, overzet, transcribeert en nakijkt. Een tool voor realtime dicteren schrapt die stappen.
Toegankelijkheid. Polsletsel, RSI, herstel na een operatie, of gewoon de voorkeur voor je stem als belangrijkste invoer. Een goede lokale dicteer-tool is een echt toegankelijkheidshulpmiddel, en het offline-aspect telt hier zwaarder dan waar dan ook.
Hoe je begint op Mac
De download staat op onze downloadpagina voor Mac. We verspreiden een genotariseerd DMG, dus er is geen Gatekeeper-waarschuwing bij de eerste start op macOS Sequoia of Tahoe. Apple Silicon is vereist (M1 of nieuwer). De app is ongeveer 150MB en pakt uit tot ongeveer 600MB met het standaardmodel Whisper Small inbegrepen.
De eerste start vraagt om twee machtigingen: toegang tot de microfoon (logisch) en toegankelijkheidstoegang (zodat we tekst in andere apps kunnen plakken). Beide zijn standaard machtigingsverzoeken van macOS. We vragen verder niets.
De standaard sneltoets is Option+Space. Je kunt hem wijzigen bij Instellingen als hij botst met iets. Druk de sneltoets één keer in om te beginnen, druk hem opnieuw in om te stoppen. De tekst verschijnt bij je cursor.
Het gratis plan is onbeperkt dicteren met compacte lokale modellen, zonder account, zonder tijdslimieten. Het Pro-plan ($7.49/mo · $89/yr, 3 apparaten) voegt grotere modellen toe, ondersteuning voor meerdere talen, snippet-uitbreiding, woordenboekitems en een terugbetalingsgarantie van 30 dagen op de eerste betaling.
FAQ
Werkt het op Intel-Macs?
Technisch wel, in een afgeslankte versie. De whisper.cpp-engine werkt op Intel-CPU's, maar de inferentiesnelheid zonder Metal-versnelling is veel lager. Realtime dicteren met het small-model is net acceptabel op een hoogwaardige Intel-iMac uit 2019 of 2020. We raden Apple Silicon (M1 of nieuwer) aan voor de ervaring die op deze pagina wordt beschreven.
Wat is het verschil met Apple Dictation?
Apple Dictation is geïntegreerd in macOS, draait op het apparaat op Apple Silicon en is gratis. De documentatie van Apple geeft aan dat er geen harde tijdslimiet is, maar Dictation stopt automatisch na 30 seconden stilte - en nadenkpauzes tellen mee. Er is ook geen uitbreidbaarheid (geen persoonlijk vocabulaire, geen snippets, geen aanpassing van de sneltoets buiten de basis-toggle). SnailText draait grotere modellen van de Whisper-klasse, heeft geen onderbreking bij stilte, ondersteunt persoonlijk vocabulaire en snippets, en werkt met één gemeenschappelijke sneltoets in alle apps.
Sturen jullie mijn audio ergens naartoe?
Nee. Lokale Whisper draait in onze app, op je Mac. De audiobuffer blijft in RAM tijdens de opnamesessie en wordt niet naar de schijf geschreven. We sturen in geen enkele modus audio naar een server, gratis of betaald. Een optionele STT in de cloud voor Pro-gebruikers met lastige audiogevallen staat op onze roadmap, maar maakt vandaag geen deel uit van het product.
En HIPAA, AVG, gereguleerde sectoren?
De eenvoudigste weg naar naleving bij steminvoer is de audio nergens naartoe te sturen. Lokale Whisper doet precies dat - geen Business Associate Agreement nodig, geen Data Processing Agreement, geen beoordeling van grensoverschrijdende gegevensoverdracht. Onze privacypagina behandelt de juridische details; kort samengevat: data die je apparaat nooit verlaat, is de data die het makkelijkst conform te houden is.
Hoe verhoudt de nauwkeurigheid zich tot die van Wispr Flow of SuperWhisper?
Voor schone Engelse audio evenaren onze compacte lokale modellen Apple Dictation (ongeveer 95%) en evenaren de medium- en large-modellen Wispr Flow en SuperWhisper Pro (ongeveer 97-99%). Bij zeer sterke accenten of achtergrondgeluid houden de modellen in de cloud nog een licht voordeel op de lokale modellen in onze categorie. Voor al het andere is het verschil klein genoeg dat privacy- en kostenvraagstukken zwaarder wegen.
Werkt het met persoonlijk vocabulaire?
Ja, in Pro. Je kunt persoonlijke termen toevoegen (de naam van je bedrijf, productnamen, de voornamen van je kinderen) en snippet-uitbreidingen (typ een trigger, ontvang een langere zin). Beide worden tijdens de transcriptie toegepast, niet erna.
En dicteren in meerdere talen?
Het Pro-plan ondersteunt meer dan 25 talen met Parakeet TDT v3, dat ongeveer 10× sneller is dan Whisper voor Europese talen. Het gratis plan is alleen Engels, met de compacte Whisper-modellen.
Hoe dicteer je op een Mac?
Op twee manieren. De ingebouwde weg: open Systeeminstellingen, schakel Toetsenbord → Dictee in, druk dan op de dicteer-sneltoets (Control tweemaal, standaard) in een willekeurig tekstveld en begin te spreken. Apple Dictation draait op het apparaat op Apple Silicon, maar stopt na 30 seconden stilte en werkt alleen betrouwbaar in bepaalde apps. De weg via derden: installeer een lokale dicteer-app zoals SnailText, druk op je globale sneltoets in een willekeurige app, spreek, en de tekst wordt bij je cursor geplakt - zonder onderbreking bij stilte, met grotere Whisper-modellen, en met audio die je Mac nooit verlaat.
Wat is de beste dicteersoftware voor Mac?
Dat hangt af van wat je nodig hebt. Voor gratis, ingebouwd, incidenteel gebruik volstaat Apple Dictation. Voor het transcriberen van bestanden en vergaderingen is MacWhisper de meest gewaardeerde Mac-tool. Voor continu live dicteren in elke app, met grotere lokale Whisper-modellen en zonder onderbreking bij stilte, is een specifieke tool zoals SnailText de beste keuze - en, anders dan de meeste opties, werkt het op Mac en Windows met dezelfde ervaring. De juiste keuze hangt ervan af of je incidenteel ingebouwd dicteren wilt, bestanden transcriberen of de hele dag live dicteren.