Comment ça marche

Trois étapes. C'est tout.

Un raccourci, un microphone, un champ de texte. Tout le reste reste masqué jusqu'à ce que vous en ayez vraiment besoin.

Le déroulé

Appuyez, parlez, collez.

01

Appuyez sur le raccourci

⌥ Space

Par défaut : ⌥ Space sur Mac, Ctrl Space sur Windows. Personnalisable dans les Réglages. La pastille en bas de votre écran s'éveille - couleur neutre d'abord, puis elle passe au rouge quand l'enregistrement démarre. Votre curseur reste exactement là où vous étiez en train de taper.
02

Parlez naturellement

Parlez comme si vous expliquiez quelque chose à un collègue. Ne dictez pas la ponctuation - elle déduit les virgules, les points et les points d'interrogation à partir de votre parole. Les longs silences sont coupés automatiquement (c'est notre VAD qui fait son travail) ; les reprises et les "euh" se corrigent dans la même passe d'édition que celle que vous feriez après avoir tapé.
03

Relâchez, collez

⌥ Space

Appuyez de nouveau sur le raccourci. La pastille devient violette pendant la transcription - généralement moins d'une seconde sur GPU, 1 à 3 secondes sur un CPU moderne. Puis le texte arrive. Là où était votre curseur, avec tous les mots que vous avez dits.

Dans les coulisses

Comment la dictée hors ligne fonctionne vraiment.

Les détails techniques, en langage clair. Si vous survolez cette partie, c'est exactement le but. Rien ici ne change la façon dont vous utilisez l'app.

01 — Moteur

whisper.cpp tournant sur votre machine

Nous utilisons whisper.cpp, le portage C++ open source de Whisper d'OpenAI. Il tourne entièrement sur votre CPU ou GPU - aucune connexion internet requise une fois le modèle téléchargé. L'audio est traité en RAM et supprimé dès que nous avons votre texte. Rien sur le disque, rien sur un serveur.

whisper.cpp sur GitHub →

02 — Silence

Silero VAD coupe le silence

La détection d'activité vocale (VAD) décide de ce qui est de la parole et de ce qui ne l'est pas avant que Whisper ne le voie. Sans elle, Whisper hallucine des mots à partir du bruit de fond - le classique "thank you for watching" qui surgit de nulle part. Silero VAD s'exécute en quelques millisecondes et coupe les blancs silencieux avant qu'ils n'atteignent le modèle.

03 — Matériel

GPU quand vous en avez un, CPU quand vous n'en avez pas

Sur Windows nous utilisons Vulkan ; sur Mac nous utilisons Metal. Les deux sont détectés automatiquement et fonctionnent avec n'importe quel GPU que vous avez - NVIDIA, AMD, Intel Arc, Apple Silicon. Aucun pilote à installer. Si votre machine n'a pas de GPU exploitable, nous basculons sur le CPU. Les modèles compacts tournent très bien sur un CPU ordinaire, en 1 à 3 secondes pour des phrases courtes.

Want to go deeper? Read Offline dictation — voice typing without the cloud for the architectural argument, GDPR and HIPAA implications, and how to verify any dictation app is actually offline. For Mac specifics, see Dictation for Mac.

Le second modèle

Ensuite, un modèle de langage le peaufine.

La reconnaissance vocale vous donne une transcription brute. Un second modèle, lui aussi local, la retravaille jusqu'à la rendre prête à envoyer. C'est cette seconde étape qui en fait de la dictée IA. C'est une fonctionnalité Pro, en bêta, et vous pouvez la désactiver.

01 — Nettoyage

Tics de langage dehors, ponctuation dedans

Un modèle Gemma compact lit la transcription et la met au propre : les "euh" et "genre" supprimés, la ponctuation et les majuscules réparées, les fautes de grammaire corrigées, les noms de marques mis dans la bonne casse (github devient GitHub). Il tourne sur votre matériel, donc la transcription n'est jamais envoyée comme elle l'est dans les outils de dictée IA dans le cloud.

Gemma sur ai.google.dev →

02 — Profils

Cinq profils thématiques, le style de votre choix

Choisissez un profil qui correspond à ce que vous dictez : Général, Développement et IT, Rédaction, Business ou Académique. Le profil Développement restaure les identifiants de code dans votre convention (snake_case, camelCase, kebab-case, PascalCase), ainsi "recording completed" devient recording_completed. Rédaction préserve votre voix et ignore complètement la réécriture des identifiants.

03 — Contrôle

Conservateur par défaut, désactivable quand vous voulez

Le nettoyage est réglé pour préserver votre sens, pas pour le réécrire, et il laisse le texte tranquille quand il est déjà propre. Il peut aussi changer le ton ou traduire. Vous voulez plutôt les mots exacts ? Désactivez l'étape et obtenez de la reconnaissance vocale verbatim. La dictée IA est un mode que vous activez, pas un filtre auquel vous êtes condamné.

Qu'est-ce que la dictée IA ? →

Modes

Un raccourci, plusieurs personnalités.

Un mode est une combinaison enregistrée : quel modèle, quelle langue, quel dictionnaire, quels snippets. Basculez entre eux directement depuis la pastille.

Code

Verrouillé en anglais. Dictionnaire chargé avec kubectl, gRPC, async/await, les noms des API de votre équipe. Zéro erreur de reconnaissance sur le jargon technique que vous utilisez tous les jours.

Rédaction longue

Modèle plus grand pour une meilleure précision. Dictionnaire chargé avec les noms et les termes de votre projet. Snippets prêts pour les titres, les encadrés et les phrases récurrentes.

Slack rapide

Modèle compact pour une réponse instantanée. Snippets pour votre modèle de standup, votre modèle de refus de réunion, votre signature /sig.

Les modes eux-mêmes (modèle + langue) fonctionnent dans toutes les formules. La substitution automatique du dictionnaire et des snippets sont des fonctionnalités Pro.

Dictionnaire et snippets Pro

Remplacez et développez à la volée.

La substitution automatique se fait pendant la transcription sur la formule Pro.

Dictionnaire

Corrections au niveau du mot

Dites à SnailText que "see plus plus" doit toujours devenir C++. Ou que "k eight s" doit se développer en k8s, pas en "kates". Des correspondances personnalisées pour le jargon technique, les noms de produits ou les noms de collègues que Whisper entend mal à répétition. Respecte les limites de mots, préserve la casse. Pas besoin de regex.

dites "see plus plus"

→ C++

Snippets

Modèles déclenchés à la voix

Des déclencheurs vocaux qui se développent en textes plus longs. Dites "slash sig" et votre signature email complète apparaît. Dites "slash standup" et votre modèle de standup matinal apparaît. Les mots déclencheurs n'apparaissent pas dans le résultat final.

dites "slash sig"

→ Best,
Pavel
—
Software Architect

Erreurs

Il se trompera sur quelque chose. Vous gardez le contrôle.

Whisper est bon. Il n'est pas parfait. Les longues phrases techniques, les noms rares, le jargon inhabituel - il peut trébucher. Trois choses aident.

Dictionnaire personnalisé (Pro)

Ajoutez vos mots à problèmes une fois ; ils cessent d'être des erreurs. Le vocabulaire propre à votre stack, les noms de collègues, les noms de code de projets - tout s'ajoute une fois et se comporte bien pour toujours. La substitution automatique se fait sur la formule Pro.

Modèles Pro plus grands

La courbe de précision est réelle - les modèles locaux avancés captent ce que les modèles compacts laissent passer, surtout dans les langues autres que l'anglais et sur les longues phrases techniques.

Édition manuelle après collage

Le texte arrive dans votre éditeur habituel - votre curseur, votre clavier, vos raccourcis d'édition de toujours. Corrigez ce qui ne vous plaît pas de la même façon que vous corrigeriez n'importe quelle faute de frappe.

Il n'y a pas d'auto-édition par IA entre vous et le texte. Ce que vous avez dit est ce qui est collé.

C'est tout

C'est tout le produit.

Une trentaine de secondes pour installer. Quelques minutes de plus pour vous habituer au raccourci. Puis un raccourci pour le reste de votre vie.

Télécharger pour Mac Ou pour Windows →

Encore hésitant ? Voir les tarifs →