Depuis une décennie, la gouvernance des données s'est imposée comme une priorité dans les grandes organisations. On parle de catalogues de données, de lignage, de qualité des données sources, de conformité RGPD. C'est nécessaire - et même indispensable. Mais à l'ère des grands modèles de langage (LLMs), il manque une couche complémentaire que peu d'entreprises ont encore formalisée : la gouvernance du contexte.
Ce que fait la gouvernance des données
La gouvernance des données s'intéresse aux données elles-mêmes : leur structure, leur qualité à la source, leur cycle de vie, qui y a accès, comment elles circulent dans les systèmes. Un bon programme de gouvernance des données garantit que vos données sont exactes, traçables et conformes.
C'est un travail au niveau du stockage et de la production des données. Il répond à la question : « Nos données sont-elles fiables ? »
Ce que fait la gouvernance du contexte
La gouvernance du contexte s'intéresse à quelque chose de différent : quelles informations sont transmises à un LLM au moment d'une requête, sous quelle forme, avec quelle pertinence, et avec quelle traçabilité.
Un LLM ne lit pas votre base de données. Il reçoit un prompt - un message textuel. Ce message contient ou ne contient pas le contexte dont il a besoin pour répondre correctement. La gouvernance du contexte répond à la question : « Ce que nous donnons à notre IA pour répondre est-il pertinent, complet et vérifiable ? »
Pourquoi c'est une discipline distincte
Imaginons une entreprise qui a investi massivement dans son lac de données. Les données sont propres, cataloguées, auditables. L'équipe déploie ensuite un assistant IA basé sur un LLM. L'assistant répond mal, hallucine des contrats, mélange des versions de produits.
Le problème n'est pas dans les données - il est dans le contexte transmis au LLM. Peut-être que le bon document n'a pas été récupéré. Peut-être que le contexte injecté dans le prompt est trop vague, trop long, ou contient des informations contradictoires. C'est un problème de gouvernance du contexte, pas de gouvernance des données.
Les quatre piliers de la gouvernance du contexte
- Pertinence : Le contexte transmis répond-il vraiment à la question posée ? Mesurable via des métriques comme RAGAS (context relevance).
- Fidélité : La réponse du LLM est-elle strictement fondée sur le contexte fourni, sans invention ? Mesurable via le score de faithfulness.
- Traçabilité : Peut-on savoir quel document, quelle version, quel chunk a été utilisé pour générer cette réponse précise ?
- Mise à jour : Le contexte est-il synchronisé avec les dernières versions de vos sources ? Un contexte obsolète produit des réponses obsolètes.
Ce que cela implique concrètement
Mettre en place une gouvernance du contexte ne remplace pas la gouvernance des données - elle la complète. Vous avez besoin des deux :
- Vos données doivent être fiables (gouvernance des données).
- La façon dont vous les présentez à vos LLMs doit être structurée, pertinente et traçable (gouvernance du contexte).
Les organisations qui déploient des assistants IA sans gouvernance du contexte découvrent rapidement deux problèmes récurrents : des hallucinations sur des sujets pourtant bien documentés, et une impossibilité à déboguer les mauvaises réponses car rien n'est traçable.
Conclusion
La gouvernance du contexte est la discipline que la plupart des entreprises n'ont pas encore formalisée - mais dont elles ressentent déjà les conséquences. Si vos LLMs produisent des réponses approximatives malgré des données de qualité, regardez comment vous gérez le contexte que vous leur transmettez. C'est souvent là que se cache le vrai problème.