L'extraction automatique de factures est présentée comme résolue depuis plusieurs années. En pratique, les performances varient fortement selon le type de document. Cet article dresse un état des lieux honnête : ce qui atteint une fiabilité de production, ce qui reste expérimental, et les spécificités du marché suisse.
Trois types de documents, trois réalités
La performance d'un système OCR se mesure par type de document entrant. En environnement suisse, trois catégories dominent :
| Type de document | Taux de reconnaissance correct | Commentaire |
|---|---|---|
| PDF natif (généré par logiciel) | 97 à 99 % | Texte extrait directement, pas d'OCR optique nécessaire |
| Scan bureau (300 dpi et plus) | 88 à 94 % | Qualité dépend du matériel et de l'alignement |
| Photo smartphone en conditions normales | 72 à 84 % | Éclairage, angle, résolution variables |
La différence entre PDF natif et photo smartphone est massive. Les systèmes qui agrègent ces trois types sans distinction annoncent des taux moyens trompeurs. Ce qui compte pour la production est le taux sur le canal principal de votre clientèle.
La QR-facture suisse : un standard qui simplifie l'extraction
Depuis le 1er octobre 2022, le bulletin de versement orange et le bulletin de versement rouge ont été remplacés par la QR-facture en Suisse. Ce changement a une implication directe sur l'extraction automatique : le code QR encapsule les données structurées de la facture (IBAN, montant, référence, données créancier et débiteur) dans un format standardisé lisible par machine.
Pour un système d'extraction bien conçu, une QR-facture bien imprimée atteint un taux de lecture proche de 100 % sur les champs structurés. La seule limite est la qualité d'impression du code lui-même, qui peut se dégrader sur des impressions de faible résolution ou des documents photocopiés plusieurs fois.
La QR-facture a été la meilleure chose qui soit arrivée à l'automatisation comptable en Suisse. En 2022, on discutait encore de taux de reconnaissance. En 2026, sur les QR-factures, c'est un non-sujet. Analyse Alisia, retour d'expérience cabinets partenaires 2025
Ce que l'OCR extrait, et ce qu'il ne "comprend" pas
L'extraction de caractères est une chose. La classification comptable en est une autre. Un bon système d'OCR lit : numéro de facture, date, montant, IBAN, nom du fournisseur, lignes de détail. Ce qu'il ne déduit pas automatiquement sans modèle entraîné : le compte de charge approprié, le taux TVA applicable (8.1 %, 3.8 %, 2.6 % ou exonéré), le centre de coût, la répartition analytique.
C'est la couche de classification IA, entraînée sur les données historiques d'un cabinet ou d'une PME, qui produit l'écriture comptable complète. L'OCR est la fondation. La classification est la valeur ajoutée.
Les limites actuelles en 2026
Trois catégories restent problématiques :
- Factures manuscrites ou partiellement manuscrites : encore présentes chez certains artisans et prestataires informels. Taux de reconnaissance inférieur à 60 %.
- Documents multi-langues sur une même pièce : factures franco-allemandes, italiano-françaises. La détection de langue peut induire des erreurs sur les montants ou les descriptions.
- Relevés bancaires PDF protégés : certaines banques suisses (particulièrement dans le segment PME) exportent des PDF avec protection contre l'extraction de texte. L'OCR optique doit alors s'appliquer à ce qui devrait être un document natif.
Comment évaluer un système avant de l'adopter
Trois tests pratiques permettent d'évaluer la fiabilité réelle d'un système sur votre volume :
- Soumettre un lot de 50 factures représentatives de votre clientèle (mix PDF, scans, photos) et mesurer le taux d'écritures proposées sans correction.
- Tester spécifiquement 10 QR-factures, 10 factures étrangères en EUR, et 5 notes de frais photographiées.
- Vérifier que le système distingue automatiquement les trois taux TVA suisses et gère les prestations exonérées sans intervention manuelle.
Un taux d'acceptation inférieur à 85 % sur votre mix réel signifie que le gain de temps sera marginal. Un taux supérieur à 92 % sur le canal principal (PDF natif pour la plupart des cabinets) justifie l'adoption.