Chatbot facture électronique pour experts-comptables : un assistant IA sur les textes officiels
La réforme de la facture électronique (e-invoicing, CHORUS Pro) génère des centaines de questions techniques pour les experts-comptables et les entreprises. Julien Casanova, développeur IA freelance, j'ai conçu un chatbot RAG (l'IA connectée directement aux documents source, pas à ses connaissances générales) branché sur les textes officiels de la DGFiP (Direction Générale des Finances Publiques) : 87 documents indexés, plus de 2 300 chunks vectorisés, des réponses sourcées en moins de 15 secondes contre 15 à 30 minutes de recherche manuelle. L'outil est indépendant de tout éditeur de logiciel comptable.
Dernière mise à jour :
Le problème : une réglementation dense, des questions sans fin
La facture électronique devient obligatoire pour toutes les entreprises en France à partir de 2026. Les textes réglementaires (ordonnances, décrets, spécifications techniques de la DGFiP, FAQ officielles) représentent des centaines de pages denses et techniques. Le calendrier de déploiement, les formats acceptés (Factur-X, UBL, CII), les obligations selon la taille de l'entreprise, le rôle des PDP (Plateformes de Dématérialisation Partenaires) : chaque sujet génère des dizaines de questions spécifiques.
Les experts-comptables sont en première ligne. Leurs clients les sollicitent quotidiennement sur des points précis : « Mon entreprise est-elle concernée dès septembre 2026 ? », « Quel format de facture dois-je utiliser ? », « Comment choisir une PDP ? ». Répondre à chaque question exige de retrouver le bon passage dans le bon texte, de le croiser avec les dernières mises à jour, et de formuler une réponse claire. Un travail chronophage et répétitif, exactement le type de tâche où l'IA apporte une vraie valeur.
Le calendrier de la réforme, défini par la DGFiP, prévoit une obligation de réception des factures électroniques pour toutes les entreprises à partir de septembre 2026, puis une obligation d'émission progressive selon la taille de l'entreprise. Les spécifications techniques (formats Factur-X, UBL, CII) et les modalités de raccordement aux plateformes de dématérialisation partenaires (PDP) sont détaillées dans les textes publiés par l'administration fiscale.
Les solutions existantes posent problème. ChatGPT répond à partir de connaissances générales, souvent obsolètes ou approximatives sur un sujet qui évolue en permanence. Les chatbots des éditeurs de logiciels comptables orientent systématiquement vers leur propre solution. Il manquait un outil neutre, connecté aux sources officielles, capable de répondre avec précision et de citer ses sources.
La solution : un chatbot RAG sur les sources officielles
Architecture technique
Le chatbot repose sur une architecture RAG (Retrieval-Augmented Generation) classique mais rigoureuse. Quand un utilisateur pose une question, le système recherche d'abord les passages les plus pertinents dans la base de connaissances via une recherche vectorielle (embeddings). Ces passages sont ensuite injectés dans le prompt du LLM, qui génère une réponse synthétique et sourcée. Le LLM ne répond jamais « de tête », uniquement à partir des documents officiels.
Stack technique
Frontend & Backend
Next.js (App Router). Interface conversationnelle réactive, streaming des réponses en temps réel, hébergement Vercel.
LLM
Claude Haiku (Anthropic), choisi pour son excellent ratio précision/coût sur les tâches de compréhension réglementaire. Architecture multi-fournisseurs : possibilité de basculer vers un autre modèle sans refonte.
Base vectorielle
PostgreSQL + pgVector. Les documents sont découpés en chunks, transformés en embeddings, et indexés pour une recherche sémantique rapide. Pas de service tiers : tout reste dans la même base de données.
Sources de données
Textes officiels DGFiP, BOFiP, spécifications techniques (formats Factur-X, UBL, CII), FAQ publiées par l'administration fiscale. Chaque source est datée et versionnée pour garantir la fraîcheur des réponses.
Choix techniques et justifications
Pourquoi du RAG plutôt que du fine-tuning ? Parce que la réglementation évolue. Un modèle fine-tuné est figé au moment de son entraînement, et il faut le ré-entraîner à chaque mise à jour. Avec le RAG, il suffit de mettre à jour les documents dans la base vectorielle. La réponse reflète immédiatement la dernière version du texte. C'est aussi plus transparent : chaque réponse peut citer le passage exact dont elle est issue, ce qui est essentiel pour un usage professionnel en expertise comptable.
Pourquoi Claude Haiku ? Sur un corpus réglementaire français, Claude excelle en compréhension fine et en synthèse fidèle au texte source. Haiku, le modèle le plus rapide et le moins coûteux de la gamme Anthropic, offre une précision suffisante pour ce cas d'usage tout en maintenant des coûts d'API compatibles avec un usage à fort volume. L'architecture multi-fournisseurs permet de tester d'autres modèles (Mistral, GPT) sans modifier le code applicatif.
Neutralité et indépendance
Le chatbot est indépendant de tout éditeur de logiciel comptable. Il ne recommande aucune PDP, aucun outil, aucune solution commerciale. Il répond à partir des textes officiels, point. Cette neutralité est un choix délibéré : un expert-comptable doit pouvoir faire confiance à l'outil sans se demander s'il est orienté vers un produit particulier. C'est ce qui distingue ce chatbot des assistants IA proposés par les éditeurs de logiciels, qui mélangent inévitablement information réglementaire et promotion de leur solution.
Méthode et durée du projet
Le projet a demandé une vingtaine d'heures de travail sur deux semaines, de la phase de développement jusqu'à la mise en production. La majeure partie du temps n'a pas été consacrée au code, mais à la recherche et au fact-checking des sources : identifier les textes officiels de référence, vérifier leur version en vigueur, structurer le corpus pour que le RAG fonctionne avec précision. C'est une réalité souvent sous-estimée dans les projets de chatbot IA sur mesure : la qualité des réponses dépend d'abord de la qualité des sources, pas de la puissance du modèle.
Résultats et chiffres clés
87
documents officiels indexés (DGFiP, BOFiP, AIFE (Agence pour l'Informatique Financière de l'État))
< 15 s
pour une réponse sourcée (vs 15-30 min en recherche manuelle)
95 %+
de citation correcte des sources, mesuré sur un échantillon de 200 questions
Le corpus couvre plus de 500 pages de réglementation, découpées en 2 300 chunks vectorisés via pgVector. Chaque question posée au chatbot déclenche une recherche sémantique qui identifie les 5 à 10 passages les plus pertinents, puis le LLM génère une synthèse fidèle au texte source. Le pipeline intègre les spécifications CHORUS Pro et les formats e-invoicing (Factur-X, UBL, CII).
Pour un expert-comptable, obtenir une réponse fiable sur le calendrier d'obligation, le choix d'une PDP ou les mentions obligatoires d'une facture électronique prend désormais quelques secondes au lieu de 15 à 30 minutes de recherche dans les textes éparpillés entre DGFiP, BOFiP et AIFE. Le coût de fonctionnement (API Claude Haiku + hébergement Vercel + base PostgreSQL) est inférieur à 150 € par mois.
Ce que ce projet démontre
Ce chatbot est un produit en cours de développement, pas une mission client classique. C'est un choix délibéré : construire un outil concret sur un sujet réel pour démontrer ce qu'un chatbot IA sur mesure peut apporter à un secteur professionnel. Les experts-comptables font face à un afflux de questions sur la réforme de la facture électronique. Ce chatbot répond à ce besoin avec une approche technique rigoureuse.
RAG en conditions réelles
Pas un POC sur des données fictives. Un corpus réglementaire réel, dense, en français, avec des subtilités juridiques. Le RAG fonctionne sur des questions pointues comme « Quel est le calendrier d'obligation pour les micro-entreprises ? » et cite le texte exact.
Maîtrise du fact-checking
Un chatbot réglementaire ne tolère pas l'approximation. Chaque source est vérifiée, datée, versionnée. Le pipeline d'ingestion est conçu pour détecter les doublons et les versions obsolètes. C'est cette rigueur qui rend l'outil utilisable par des professionnels du chiffre.
Expertise sectorielle
Comprendre la facture électronique ne s'improvise pas. Ce projet montre la capacité à plonger dans un domaine métier complexe, à identifier les bonnes sources, et à construire un outil qui parle le langage des professionnels du secteur.
Leçons apprises
La qualité du corpus fait 80 % du résultat
Le réflexe naturel est de se concentrer sur le choix du LLM ou le tuning des prompts. En réalité, la majorité du travail (et de la valeur) se situe en amont : trouver les bonnes sources, les structurer correctement, les découper en chunks pertinents pour le RAG. Un corpus bien préparé avec un modèle moyen donne de meilleurs résultats qu'un corpus approximatif avec le meilleur modèle du marché.
Les sources officielles sont dispersées et pas toujours cohérentes
La réglementation sur la facture électronique est répartie entre plusieurs sites (DGFiP, BOFiP, impots.gouv.fr, AIFE), avec des versions qui se chevauchent et des mises à jour non signalées. Identifier la version en vigueur d'un texte demande un travail de vérification méthodique. C'est exactement le type de problème que le RAG résout ensuite pour l'utilisateur final, mais il faut d'abord le résoudre soi-même en amont.
Claude Haiku est sous-estimé pour le RAG
Sur ce cas d'usage (synthèse de passages réglementaires injectés en contexte), Haiku produit des réponses d'une qualité comparable aux modèles plus lourds, à une fraction du coût. La clé : des prompts bien structurés et des chunks de bonne qualité. Le modèle n'a pas besoin d'être « intelligent » : il doit être fidèle au texte source. Haiku excelle dans ce rôle.
Questions fréquentes
Comment le chatbot évite-t-il les hallucinations sur la réglementation ?+
Pourquoi Claude plutôt que GPT pour un chatbot réglementaire ?+
Ce chatbot peut-il être adapté à une autre réglementation ?+
Combien coûte un chatbot RAG sur un corpus réglementaire ?+
Qu'est-ce que la réforme de la facture électronique en France ?+
Quelle différence entre Factur-X, UBL et CII ?+
Pourquoi ne pas utiliser ChatGPT directement pour des questions fiscales ?+
Un chatbot IA pour votre secteur d'activité ?
Ce chatbot sur la facture électronique illustre ce qu'un RAG bien construit peut faire sur un corpus réglementaire. Votre secteur a ses propres textes, ses propres questions répétitives, ses propres besoins d'automatisation. Parlons-en.
Cas client RelanceZen · Toutes mes prestations IA · Chatbot IA sur mesure · IA pour experts-comptables
Réserver un appel découverte