Ce robots.txt checker analyse votre fichier en direct et vous dit, en un clic, si ChatGPT, Claude, Perplexity, Gemini et les autres moteurs IA sont autorisés à lire votre site. Un robots.txt mal configuré peut vous rendre invisible dans les réponses des IA.
Là où un testeur robots.txt classique se concentre sur Googlebot, ce checker est spécialisé dans les robots des IA génératives : ceux qui décident si votre site peut être lu et cité par ChatGPT, Claude, Perplexity ou Gemini. Saisissez votre domaine, il récupère votre fichier en direct et affiche :
Le statut de chaque robot
Autorisé ou bloqué, pour chaque crawler d'IA connu, sur votre domaine.
La règle qui bloque
La ligne exacte de votre robots.txt (Disallow, User-agent) responsable du blocage.
Le fichier récupéré
Le robots.txt brut lu sur votre domaine, pour vérifier sa syntaxe d'un coup d'œil.
Le robots.txt est le tout premier fichier qu'un crawler lit avant d'explorer un site. Placé à la racine du domaine (à l'adresse votredomaine.com/robots.txt), il dicte qui peut explorer quelles pages. Les moteurs de recherche le respectent, et les moteurs d'IA aussi.
Or les IA ont leurs propres robots. GPTBot et OAI-SearchBot alimentent ChatGPT, ClaudeBot alimente Claude, PerplexityBot alimente Perplexity, et Google-Extended couvre Gemini et les AI Overviews. Chacun lit votre robots.txt avant de décider s'il explore votre site.
Bloquer ces robots, volontairement ou par héritage d'un vieux fichier, revient à retirer votre site du champ de vision des IA. Vos pages existent toujours, mais les modèles ne les voient plus et ne peuvent donc plus vous citer dans leurs réponses. C'est exactement ce que cet outil détecte.
Pour être réellement cité par les IA, il faut aussi des contenus que les LLM jugent dignes de confiance. C'est exactement ce que nous faisons via Reddit. Réservez un audit gratuit pour voir où vous en êtes.
Comment autoriser les IA dans votre robots.txt
Localisez le fichier à l'adresse votredomaine.com/robots.txt. S'il renvoie une erreur 404, aucun robots.txt n'existe : tous les robots sont alors autorisés par défaut.
Repérez les groupes User-agent qui contiennent un Disallow: / visant un robot d'IA (GPTBot, ClaudeBot, PerplexityBot, Google-Extended...).
Autorisez ces robots en remplaçant la règle par Allow: /, ou en ajoutant un bloc dédié par robot. Voici un exemple de configuration correcte :