Question 1

Onde coloco o arquivo robots.txt?

Accepted Answer

O arquivo robots.txt deve ficar no diretório raiz do seu site, acessível em https://seudominio.com/robots.txt. Ele não funciona em subdiretórios. Se seu site está em subdomínio, cada subdomínio precisa do seu próprio robots.txt.

Question 2

O robots.txt impede páginas de aparecer no Google?

Accepted Answer

Não exatamente. Robots.txt bloqueia CRAWLING, não INDEXAÇÃO. Se outros sites linkam para uma página que você bloqueou, o Google ainda pode mostrá-la nos resultados (sem snippet). Para bloquear indexação completamente, use a meta tag 'noindex' na página.

Question 3

O que significa 'User-agent: *'?

Accepted Answer

O asterisco (*) é um curinga que combina com todos os crawlers. Regras sob 'User-agent: *' aplicam a todo bot que não tenha sua própria seção específica no arquivo.

Question 4

Devo bloquear crawlers de IA como GPTBot?

Accepted Answer

Depende da sua preferência. Se você não quer seu conteúdo usado para treinar IA, adicione 'User-agent: GPTBot' com 'Disallow: /' para bloquear o crawler da OpenAI. Regras similares existem para outros bots de IA como Google-Extended e CCBot.

Question 5

O que é Crawl-delay?

Accepted Answer

Crawl-delay pede aos bots que esperem um número específico de segundos entre requisições. É suportado por Bing e Yandex mas ignorado pelo Google. Use se crawling agressivo está sobrecarregando seu servidor.

Question 6

Posso usar curingas nos caminhos do robots.txt?

Accepted Answer

Google e Bing suportam curingas limitados: * combina qualquer sequência de caracteres, e $ marca o fim de uma URL. Por exemplo, 'Disallow: /*.pdf$' bloqueia todos os arquivos PDF. Nem todos os bots suportam essas extensões.

Question 7

Como bloquear uma pasta inteira?

Accepted Answer

Use 'Disallow: /nome-da-pasta/' (com barra no final). Isso bloqueia a pasta e tudo dentro dela. Exemplo: 'Disallow: /wp-admin/' bloqueia toda a área administrativa do WordPress.

Question 8

Como verificar se meu robots.txt está funcionando?

Accepted Answer

Use a ferramenta de teste do Google Search Console (antiga Webmaster Tools). Cole seu robots.txt e uma URL para verificar se está bloqueada ou permitida. Você também pode acessar seusite.com/robots.txt direto no navegador para confirmar que está no lugar certo.

Gerador de Robots.txt

Sobre esta ferramenta

Como usar

Formula

Perguntas frequentes

Ferramentas relacionadas

Gerador de Expressão Cron

Calculadora de Permissões Chmod