Le fichier llms.txt est une proposition de standard initiee en 2024 par Jeremy Howard (cofondateur de fast.ai) et adoptée progressivement par Anthropic, Vercel, Mintlify, Cloudflare et Stripe. Il joue le role d'une carte editoriale a destination des agents LLM : il indique les contenus prioritaires d'un site, leur structure et leur version la plus fraiche, dans un format Markdown consommable par les agents IA. En 2026, il est considéré comme une bonne pratique GEO recommandée sans être obligatoire.
Origine du standard llms.txt
Le standard llms.txt a été proposé en septembre 2024 par Jeremy Howard sur le site llmstxt.org. L'inspiration est double : robots.txt (indication aux crawlers) et sitemap.xml (indication des URLs prioritaires). La différence : llms.txt s'adresse spécifiquement aux agents LLM qui consomment les contenus au moment de la requete, et pas seulement aux crawlers qui indexent en amont. Le format Markdown a été choisi car les LLMs le parsent nativement et il se prete aux listes hiérarchiques de liens avec description. En avril 2026, on recense environ 180 000 sites publics avec un llms.txt selon l'annuaire llmstxt.directory — une adoption encore modeste mais en croissance rapide. Voir définition 2026 du GEO.
Différence entre llms.txt et llms-full.txt
Deux fichiers coexistent dans la pratique. llms.txt est un index : il liste les URLs clés du site avec une description courte (Markdown de 1 a 5 Ko typiquement). Il sert de point d'entree pour un agent qui veut "voir la carte du site". llms-full.txt est un corpus concatene : il contient le texte complet des articles et pages clés, formate en Markdown, pour permettre a un agent de lire l'integralite du contenu en un seul fichier sans faire N requetes HTTP. Sa taille varié de 20 a 500 Ko selon le site. Transacts publie par exemple un llms-full.txt de 57 Ko contenant ses 185 articles, génère automatiquement au moment du build via un script prebuild.
Syntaxe du fichier llms.txt
Le format officiel (llmstxt.org) suit une structure simple en Markdown. Première ligne : H1 avec le nom du projet. Puis une description blockquote ("> Description courte"). Puis des sections H2 qui groupent les liens par thème. Chaque lien est au format - [Titre](URL) : description. Une section "Optional" peut lister des ressources secondaires. Exemple minimal :
# Transacts
> Agence digitale a Paris depuis 1999.
## Articles clés
- [Définition GEO 2026](https://www.transacts.fr/blog/generative-engine-optimization-définition-2026) : définition complète du GEO
La syntaxe est volontairement simple pour être lisible aussi bien par les humains que par les LLMs. Elle ne remplacé pas le sitemap.xml mais le complète pour les agents conversationnels. Voir Schema.org pour GEO.
Ce que contient un llms-full.txt
Un llms-full.txt bien conçu contient cinq briques. Brique 1 : en-tete avec nom de marque, description et date de génération. Brique 2 : identité de l'entreprise (SIREN, adresse, téléphone, services) structuree en liste Markdown. Brique 3 : sommaire des pages principales (a propos, services, contact). Brique 4 : corpus des articles en Markdown, chaque article introduit par ## Titre + URL + contenu texte. Brique 5 : FAQ globale et réponses formulees pour être extraites. La génération doit être automatisee au moment du build : un script parse les fichiers JSON/MDX, concatene, et écrit le fichier dans /public/. Transacts utilisé un script Node.js generate-llms-full.mjs execute en prebuild.
Comment générer un llms.txt en Next.js
En Next.js, deux approches. Approche 1 : fichier statique dans /public/llms.txt, maintenu manuellement. Simple pour les petits sites (moins de 20 pages clés). Approche 2 : génération programmatique. Créer un script prebuild (Node.js ou TypeScript) qui lit les fichiers de contenu (MDX, JSON, CMS headless), compose le Markdown et écrit dans /public/llms.txt et /public/llms-full.txt. Ajouter une entree "prebuild": "node scripts/generate-llms.mjs" dans package.json. Le script Transacts fait environ 180 lignes et génère les deux fichiers en moins de 2 secondes. Voir optimiser son site pour ChatGPT Search.
Cas Transacts : llms-full.txt de 57 Ko
Transacts a déployé son llms-full.txt en mars 2026. Contenu : identité entreprise (SIREN, SIRET, TVA, adresse, téléphone), 8 pages métier avec description structurree, et les 185 articles du blog en Markdown, chaque article avec titre, URL canonique, date de publication et corps texte. Taille finale : 57 Ko. Le fichier est génère automatiquement en prebuild via le script generate-llms-full.mjs. Impact mesure entre mars et avril 2026 : 3 moteurs (Perplexity, Claude, un moteur tiers) ont effectivement sollicite le fichier, visible dans les logs serveur. Le trafic "agent-refere" reste marginal (quelques dizaines de sessions par mois) mais le signal sur la detection d'entite est déjà mesurable.
Impact réel sur la visibilité LLM
L'impact de llms.txt sur la citation LLM reste partiel en avril 2026. Aucun moteur generatif n'a confirme officiellement utiliser llms.txt dans son classement. Perplexity et Claude semblent consulter le fichier quand il existe, ChatGPT et Google AI Overviews n'ont pas documente d'usage. L'intérêt stratégique reste donc secondaire par rapport aux 4 piliers principaux du GEO (passages citables, schemas, brand mentions, entites). Publier un llms.txt est toutefois recommandé pour deux raisons : (1) coût marginal très faible (1 a 3 jours d'ingénierie initiale), (2) signal positif envoyé aux agents IA qui peuvent intégrer le fichier dans leurs évolutions 2027-2028. Voir 12 KPIs GEO.
Comment Transacts accompagne sur llms.txt
Transacts proposé l'audit et la mise en place d'un llms.txt + llms-full.txt dans une prestation de 3 a 5 jours. Livrables : audit du contenu existant, script de génération automatise (Node.js adapté au stack client), déploiement initial avec monitoring des acces serveur, intégration continue au pipeline de build. Nos clients beneficient aussi du template Transacts (57 Ko de référence) et des optimisations deployees sur transacts.fr. Pour aller plus loin : page métier SEO IA & GEO.
Questions fréquentes llms.txt
llms.txt est-il obligatoire en 2026 ?
Non, llms.txt n'est pas obligatoire. Aucun moteur generatif ne penalise l'absence du fichier en 2026. Il s'agit d'une bonne pratique recommandée, similaire au sitemap.xml dans le SEO classique : optionnelle mais professionnellement attendue sur un site GEO-optimisé. Les entreprises qui ne publient pas de llms.txt ne perdent pas de citations a court terme, mais elles risquent d'être en retard si un moteur décide en 2027 de privilegier les sites structures. Le coût marginal etant faible (quelques jours d'ingénierie), la publication est recommandée même sans impact immediat.
Quelle différence avec sitemap.xml ?
Sitemap.xml liste toutes les URLs publiques indexables, sans contexte, au format XML, destine aux crawlers SEO. llms.txt liste les URLs prioritaires et contextualisees, au format Markdown lisible par les agents LLM, avec une description courte pour chaque lien. Les deux fichiers sont complementaires : sitemap.xml pour l'indexation exhaustive, llms.txt pour la hiérarchie editoriale. Publier les deux est la configuration standard en 2026. Le llms.txt ne remplacé pas le sitemap.xml — un site qui n'aurait que llms.txt serait sous-indexe sur Google.
Quelle taille maximale pour llms-full.txt ?
Il n'y a pas de limite technique officielle, mais la pratique converge vers une taille inférieure a 500 Ko pour rester consommable par un agent LLM en une requete. Au-dela, le fichier risque de dépasser la context window de certains agents (typiquement 128k a 200k tokens, soit environ 400-600 Ko de texte). Pour les sites a très gros corpus (1 000+ articles), la bonne approche est de segmenter : llms-full-blog.txt, llms-full-produits.txt, llms-full-support.txt. Transacts maintient un seul fichier de 57 Ko qui couvre les 185 articles, dans la fenetre optimale.
Faut-il ajouter llms.txt dans robots.txt ?
Non, robots.txt indique aux crawlers ce qui est autorisé ou bloque, pas ce qui est important. llms.txt est accessible directement a l'URL /llms.txt, les agents IA savent ou le chercher. Vous pouvez en revanche ajouter une référence dans votre sitemap index ou dans le head de votre page d'accueil via un meta tag <link rel="llms" href="/llms.txt">, même si cette pratique n'est pas encore standardisee. Transacts publie simplement sous /llms.txt et /llms-full.txt et observe une detection correcte par les agents qui consultent ces fichiers.
Doit-on mettre a jour le fichier a chaque article ?
Idéalement oui, via la génération automatisee au build. Un llms.txt date de plusieurs mois signale au modele que le site n'est pas a jour, ce qui peut réduire la priorite de citation (surtout sur Perplexity qui valorise la fraîcheur). La bonne pratique : executer le script de génération a chaque déploiement, ce qui garantit une fraîcheur inférieure a 24 heures. Transacts regenere llms-full.txt a chaque build Vercel, soit en moyenne 3 a 5 fois par semaine. Voir audit GEO pas-a-pas pour les checkpoints de maintenance.