SnailText
FR

Dictée vocale sur Windows

Dictée vocale sur Windows - et ce qui manque dans ce que Windows propose

·

Windows a une dictée intégrée. Elle marche pour des phrases courtes en anglais dans les applis Microsoft. Pour le travail soutenu, les autres langues ou l'usage hors ligne, elle a des limites structurelles documentées. SnailText est l'alternative locale avec Whisper.

En bref

Windows propose deux fonctions vocales souvent confondues. Voice Typing (Win+H) est basé sur le cloud - l'audio part vers Azure à chaque dictée, couvre l'anglais et ~43 langues dans le cloud, et s'arrête après environ 5-10 secondes de silence (non personnalisable). Voice Access (Windows 11 22H2+ uniquement) fonctionne hors ligne mais ne prend en charge que 11 langues - variantes de l'anglais, deux espagnols, allemand, français, italien, japonais et deux chinois. Pas de russe, pas de portugais, aucune langue slave, aucune langue nordique. La fonction "Fluid Dictation" (la correction automatique de la ponctuation de 2025) exige un PC Copilot+ avec NPU. SnailText exécute le modèle Whisper en local sur tout PC Windows récent, fonctionne dans toute appli, prend en charge toute langue de Whisper et ne dépend pas de l'écosystème de modules linguistiques de Microsoft.

Deux fonctions vocales sous Windows, toutes deux limitées sur le fond

La plupart des articles confondent Voice Typing et Voice Access. Ce sont des outils différents avec des modèles de traitement différents. Tous deux viennent avec Windows ; aucun ne couvre ce dont un flux de dictée quotidien a besoin en 2026.

FonctionVoice Typing (Win+H)Voice Access (Win 11 22H2+)SnailText
TraitementCloud - audio vers Azure à chaque dictée, exige internetHors ligne - tourne sur l'appareilHors ligne - Whisper tourne en local sur votre PC
Couverture linguistique~43 langues dans le cloud (Microsoft ne les énumère pas en un seul endroit)11 langues seulement : variantes de l'anglais, espagnol (ES/MX), allemand, français (FR/CA), italien, japonais, chinois simplifié et traditionnelToute langue prise en charge par Whisper (100+) - russe, portugais, polonais, néerlandais, langues nordiques, tout y est
Délai d'inactivitéEnviron 5-10 secondes de silence mettent fin à la session ; non personnalisableMême coupure non personnalisableIllimité - tourne jusqu'à ce que vous appuyiez de nouveau sur le raccourci
RaccourciWin+H, non personnalisableActivation par commande vocale seulement ; la barre d'outils doit être visibleCtrl+Space global (configurable sur n'importe quelle combinaison)
Où ça marcheLa plupart des champs de texte, mais avec des lacunes documentées (Anki, certains champs Word, certains champs de navigateur affichent un avertissement de "fonctionnalité limitée")Surtout les applis Microsoft ; le comportement varie avec les applis tiercesTout champ de texte dans toute appli - par collage, comme Ctrl+V
Ponctuation automatiqueOption disponible, mais peu fiable ; la commande "virgule" est peu fiable selon les forums MicrosoftMême option, même fiabilitéWhisper déduit la ponctuation de la prosodie - aucune commande à mémoriser
Finition "Fluid Dictation" (correction grammaticale, suppression des tics de langage)PC Copilot+ uniquement (NPU requise : Snapdragon X, Intel Core Ultra, AMD Ryzen AI). Anglais uniquement.Non disponibleDictionnaire personnalisé + snippets (offre Pro) pour un résultat similaire, sur tout matériel
Prise en charge de Windows 10OuiNon - Windows 11 22H2+ uniquement. Windows 10 a l'ancien outil de Reconnaissance vocale, une fonction différenteOui - Windows 10 (1903+) et Windows 11

Sources des affirmations sur Microsoft : liées dans la section de texte ci-dessous. La "coupure à 5-10 secondes de pause" est documentée dans des fils de forums d'utilisateurs et des réponses du Microsoft Q&A, pas dans les supports marketing de Microsoft.

Deux fonctions de dictée vocale sous Windows : ce que chacune est vraiment

Windows en 2026 propose deux fonctions de dictée distinctes. La plupart des articles en ligne les traitent comme un seul produit. Ce n'en est pas un.

Voice Typing (activé par Win+H) est un outil de dictée basé sur le cloud. Microsoft le documente explicitement : pour utiliser Voice Typing, vous devez être connecté à internet. À chaque session de dictée, l'audio de votre micro est envoyé aux services Azure Speech de Microsoft pour la transcription. Le texte revient et est collé dans le champ de texte actif, et l'audio (selon Microsoft) est dé-identifié et non conservé sans consentement - mais il a quitté votre appareil.

Voice Access est la fonction plus récente, ajoutée dans Windows 11 22H2 (octobre 2022). C'est un outil d'accessibilité plus large qui inclut la dictée, mais permet aussi de contrôler le système d'exploitation à la voix : ouvrir des applis, cliquer sur des boutons, faire défiler, naviguer. La partie dictée de Voice Access tourne sur l'appareil, hors ligne. Elle n'existe pas sous Windows 10. Sous Windows 10, vous avez l'ancien outil "Reconnaissance vocale Windows", une fonction différente.

La différence pratique : Voice Typing prend en charge plus de langues mais a toujours besoin d'internet. Voice Access tourne hors ligne mais prend en charge moins de langues. Aucun des deux ne fait les deux.

La couverture linguistique : le vrai sujet

Voice Access - l'option hors ligne - ne prend en charge que 11 langues : six variantes de l'anglais (États-Unis, Royaume-Uni, Inde, Nouvelle-Zélande, Canada, Australie), deux espagnols (Espagne, Mexique), allemand, français (France et Canada), italien, japonais, chinois simplifié et chinois traditionnel (Taïwan). C'est tout.

Ce qui manque : russe, portugais (Brésil et Portugal), polonais, néerlandais, suédois, danois, norvégien, finnois, tchèque, hongrois, grec, turc, hindi, arabe, coréen, thaï, vietnamien et des dizaines d'autres. Microsoft a confirmé sur son propre forum de support que les limites linguistiques de Voice Access sont voulues, sans engagement de feuille de route pour les étendre.

Voice Typing - l'option cloud - prend en charge davantage de langues (~43, dont le portugais, le coréen, le thaï, le turc, le vietnamien, le hindi). Mais il envoie votre audio à Microsoft à chaque dictée. Pour quiconque dicte des informations clients, des notes médicales, du code source ou tout contenu sensible, "STT cloud sans option hors ligne" est la mauvaise architecture.

SnailText exécute Whisper en local. Whisper est multilingue par conception - le même modèle qui traite l'anglais traite 100+ langues, y compris toutes celles que l'option hors ligne de Microsoft ne couvre pas. La dictée en français fonctionne dans SnailText. Le russe, le polonais, le néerlandais : tout sur la même installation. Aucun module linguistique à télécharger. Aucun détour par le cloud.

Le délai d'inactivité de Win+H - la plainte la plus citée

Voice Typing de Windows a un délai d'inactivité non personnalisable qui met fin à la session de dictée après environ 5 à 10 secondes de pause. Le nombre exact ne figure pas dans les supports marketing de Microsoft, mais c'est le sujet de plusieurs fils d'utilisateurs. La réponse dans tous : impossible de le modifier.

Pour rédiger un e-mail de plus de deux paragraphes, cela signifie réactiver Win+H deux ou trois fois dans le même message. Pour les flux où l'on réfléchit en dictant - notes de recherche, plans de traitement, brouillons où les pauses de réflexion sont normales - la coupure donne l'impression que l'outil lutte contre vous.

SnailText tourne tant que vous maintenez le raccourci enfoncé, ou jusqu'à ce que vous appuyiez de nouveau pour arrêter. Il n'y a pas de délai d'inactivité. Un vidage d'idées de cinq minutes se dicte en une seule session.

"Fluid Dictation" exige du matériel spécial - la plupart des PC ne sont pas éligibles

La campagne marketing de Microsoft en 2025 pour Voice Typing s'est concentrée sur "Fluid Dictation" - une couche de finition qui ajoute la ponctuation automatique, supprime les tics de langage (euh, hum) et corrige la grammaire en temps réel. Les avis sur cette fonction sont positifs quand elle marche.

La documentation de Microsoft indique que Fluid Dictation exige un PC Copilot+ - c'est-à-dire une NPU (unité de traitement neuronal) dédiée dans le matériel : Snapdragon X (portables Surface de 2024+), Intel Core Ultra avec NPU ou AMD Ryzen AI. Et elle n'est disponible qu'en anglais.

En 2026, le parc de PC Copilot+ reste réduit. Un PC Windows 11 standard acheté en 2022 ou 2023, sans NPU, a l'expérience de base de Voice Typing - sans correction grammaticale automatique, sans suppression des tics, sans finition en temps réel. Le marketing de 2025 s'applique à peut-être 5-10 % du parc Windows.

Comment SnailText comble les lacunes de la dictée vocale sous Windows

Traitement local. SnailText exécute le modèle Whisper sur votre PC - CPU sur les machines plus anciennes, Vulkan sur les iGPU AMD et Intel, CUDA sur les GPU NVIDIA. L'audio est capté dans un buffer en RAM, traité par le modèle, le texte transcrit est collé au curseur et l'audio est supprimé. Vérifiez dans votre moniteur réseau - aucun trafic sortant pendant la dictée.

Toute langue prise en charge par Whisper. Plus de 100 langues sur la même installation, sans module à télécharger. Le russe fonctionne comme l'anglais. Le portugais fonctionne comme le français. Aucune lacune par région - voyez aussi notre page dictée hors ligne pour l'argument d'architecture.

Sans délai d'inactivité. Appuyez sur le raccourci, parlez aussi longtemps que vous voulez - cinq secondes ou cinq minutes - appuyez de nouveau pour arrêter. La transcription est un bloc unique.

Raccourci configurable. Par défaut Ctrl+Space ; réattribuez-le à toute combinaison qui n'entre pas en conflit avec vos autres raccourcis.

Fonctionne dans toute appli. SnailText colle dans le champ de texte actif, comme Ctrl+V. Slack, Chrome, VS Code, Cursor, émulateurs de terminal, formulaires web, Anki - partout où un clavier fonctionne, la dictée fonctionne.

Gratuit au départ. Le modèle Whisper Base compact couvre la dictée du quotidien en français et en anglais ; Pro ajoute des modèles Whisper plus grands et plus de 25 langues européennes via Parakeet TDT.

Comment configurer la dictée vocale sous Windows en 60 secondes

1. Téléchargez l'installeur SnailText sur snailtext.app/download/windows/.

2. Lancez l'installeur. Windows SmartScreen peut alerter parce que SnailText n'a pas encore de signature Authenticode délivrée par une autorité de certification reconnue par Microsoft - cliquez sur "Informations complémentaires" → "Exécuter quand même".

3. Au premier lancement, SnailText télécharge le modèle Whisper par défaut (Base, environ 80 Mo) et le charge.

4. Définissez votre raccourci global dans les Réglages. Par défaut Ctrl+Space.

5. Ouvrez n'importe quelle appli - Slack, Chrome, Word, Notion, votre IDE. Appuyez sur le raccourci. Parlez. Appuyez de nouveau. Le texte transcrit apparaît au curseur.

Questions fréquentes

Est-ce que ça marche sous Windows 10 ?

+

Oui. SnailText prend en charge Windows 10 (64 bits, 1903 ou plus récent) et Windows 11. Voice Access - l'option hors ligne de Microsoft - est réservé à Windows 11 22H2+. Sous Windows 10, SnailText est l'une des rares options à offrir une dictée moderne de qualité Whisper.

Quelle différence avec Voice Typing (Win+H) ?

+

Voice Typing exige une connexion internet et envoie votre audio aux serveurs Azure de Microsoft à chaque dictée. SnailText exécute le modèle Whisper en local - l'audio ne quitte jamais votre PC. Voice Typing a un délai d'inactivité non personnalisable de 5-10 secondes ; SnailText tourne jusqu'à ce que vous appuyiez sur le raccourci pour arrêter. Voice Typing prend en charge environ 43 langues dans le cloud, mais sans mode hors ligne ; SnailText prend en charge toute langue de Whisper (100+) hors ligne.

Quelle différence avec Voice Access ?

+

Voice Access est réservé à Windows 11 22H2+ et ne prend en charge que 11 langues hors ligne (variantes de l'anglais, espagnol, allemand, français, italien, japonais, chinois). Si vous avez besoin du russe, du portugais, du polonais, du néerlandais ou d'une langue nordique ou slave, Voice Access ne vous couvre pas. SnailText exécute Whisper, qui prend en charge plus de 100 langues hors ligne sur la même installation.

Pourquoi l'option hors ligne de Microsoft prend-elle en charge si peu de langues ?

+

Microsoft a confirmé sur ses propres forums de support que la liste limitée de langues de Voice Access est voulue, sans feuille de route publique pour l'étendre. Voice Typing dans le cloud a une couverture plus large, mais au prix de l'envoi de tout l'audio vers Azure. SnailText contourne cela en exécutant Whisper, qui était multilingue et open source dès le premier jour.

La fonction "Fluid Dictation" est-elle disponible sur mon PC ?

+

Probablement pas, à moins d'avoir acheté un PC Copilot+ en 2024 ou après - c'est-à-dire un portable avec une NPU dédiée (Snapdragon X, Intel Core Ultra avec NPU ou AMD Ryzen AI). La documentation de Microsoft limite explicitement Fluid Dictation au matériel Copilot+, et elle n'est disponible qu'en anglais. Un portable Windows 11 standard de 2022-2023 a l'expérience de base de Voice Typing sans la finition.

Envoyez-vous mon audio quelque part ?

+

Non. Whisper tourne en local dans SnailText sur votre PC. Le buffer audio reste en RAM pendant la session d'enregistrement et n'est pas écrit sur le disque. Nous n'envoyons d'audio vers aucun serveur, dans aucun mode, gratuit ou payant. Vous pouvez le vérifier dans votre moniteur réseau - aucun trafic sortant pendant la dictée.

Est-ce que ça marche sans GPU NVIDIA ?

+

Oui. SnailText détecte automatiquement l'accélération GPU disponible. NVIDIA CUDA est la plus rapide, mais Vulkan (iGPU AMD et Intel de 2020 et plus récentes) et le repli CPU fonctionnent aussi. Sur un portable Windows typique de 2022+, vous obtiendrez des performances Whisper Medium plusieurs fois plus rapides que le temps réel, même sans GPU dédiée.

Windows SmartScreen va-t-il signaler l'installeur ?

+

C'est possible au premier lancement, parce que SnailText n'a pas encore de signature Authenticode délivrée par une autorité de certification reconnue par Microsoft. La démarche "Informations complémentaires" → "Exécuter quand même" fonctionne. La certification Authenticode est en cours.

Puis-je l'utiliser pour dicter du code dans VS Code ou Cursor ?

+

Oui - SnailText colle dans n'importe quel champ de texte, y compris les champs de VS Code et Cursor. Le dictionnaire personnalisé (Pro) est utile pour le code : ajoutez des termes comme "kubectl", "gRPC", "async/await" et SnailText remplace les versions mal comprises avant qu'elles n'arrivent dans l'éditeur.

Dictée vocale sur Windows. En local. Toute langue. Gratuit au départ.

Téléchargez pour Windows 10 ou 11. Le modèle Whisper compact tourne sur tout PC récent. Sans module linguistique, sans détour par le cloud, sans délai d'inactivité.