Formation · XPair / EnerJ-meeting
Rendre 3 600+ pages de cours techniques CVC interrogeables en langage naturel par les équipes SAV et commerciales — sur une stack 100 % européenne.
Conception et build du pipeline d'ingestion documentaire et de l'assistant interne (RAG).
- Qdrant (base vectorielle)
- Mistral OCR
- Mistral LLM
Le défi
Les équipes SAV et commerciales doivent répondre vite, et juste, à des questions clients précises : combien de cours sur tel sujet, telle réglementation est-elle traitée, quel module couvre tel besoin. Sans outil dédié, ces réponses dépendaient de la mémoire des équipes, allongeaient l'onboarding et remontaient sans cesse vers le responsable métier — un goulot d'étranglement.
Ce que j'ai livré
- Ingestion de la documentation — cours, supports, infos de service — via Mistral OCR pour les documents non structurés.
- Indexation dans une base vectorielle Qdrant (RAG).
- Chatbot interne propulsé par Mistral LLM : interrogation en langage naturel.
- Configuration, prompts et paramétrage = propriétaire, boîte noire.
Une stack souveraine
L'ensemble repose sur des briques européennes (Mistral, Qdrant). Sur un usage interne touchant des données de service et de formation, c'est un choix de souveraineté et de maîtrise — pas de dépendance à un LLM hébergé hors UE. L'illustration concrète de la posture « RAG souverain / LLMs européens ».
Les chiffres
| Base ingérée | 255 cours / 3 600+ pages | cours techniques CVC + doc service + annexes (CPF, certifications) |
|---|---|---|
| Escalades vers le responsable métier | ~4-5/jour → ~0 | quasi-totalité du niveau 1 sans escalade |
| Latence de réponse | quelques minutes → quelques secondes | |
| Temps récupéré (responsable métier) | ~3 h/semaine | estimation |
| Équipe outillée | 4 personnes | 2 SAV + 2 commerciaux |
Ce que ça transpose
Le cœur n'est pas la formation. C'est rendre une base documentaire métier interrogeable en langage naturel, sur une stack souveraine. Applicable à :
- l'assistant doc technique / réglementaire pour un bureau d'études ;
- la base de connaissance support d'un service client ou SAV ;
- l'onboarding sur un référentiel métier dense (normes, procédures, catalogue).
Ce que ce projet démontre
- Pipeline d'ingestion documentaire complet, OCR inclus.
- RAG opérationnel sur base vectorielle (Qdrant).
- Assistant métier sur LLM souverain (Mistral).
- Impact organisationnel mesurable : moins d’escalades, onboarding plus rapide.