Question 1

robots.txtファイルはどこに置く？

Accepted Answer

robots.txtファイルはウェブサイトのルートディレクトリに配置し、https://yourdomain.com/robots.txt でアクセスできる必要があります。サブディレクトリに置いても機能しません。

Question 2

robots.txtでページをブロックするとGoogleの検索結果に表示されない？

Accepted Answer

正確には違います。robots.txtはクロールをブロックしますが、インデックス登録をブロックするわけではありません。他のサイトからDisallowしたページへのリンクがある場合、Googleは（スニペットなしで）検索結果に表示することがあります。完全にインデックスをブロックするには、'noindex'メタタグを使用してください。

Question 3

'User-agent: *'とは？

Accepted Answer

アスタリスク（*）はすべてのクローラーにマッチするワイルドカードです。'User-agent: *'の下のルールは、ファイル内に専用セクションがないすべてのボットに適用されます。

Question 4

GPTBotなどのAIクローラーをブロックすべき？

Accepted Answer

それはあなたの判断次第です。コンテンツをAI学習に使われたくない場合は、'User-agent: GPTBot'と'Disallow: /'を追加してOpenAIのクローラーをブロックできます。Google-ExtendedやCCBotなど他のAIボット用にも同様のルールがあります。

Question 5

Crawl-delayとは？

Accepted Answer

Crawl-delayは、ボットにリクエスト間で指定秒数待つよう伝えます。BingとYandexはサポートしていますが、Googleは無視します。過度なクロールでサーバーに負荷がかかっている場合に使用してください。

Question 6

robots.txtのパスでワイルドカードは使える？

Accepted Answer

GoogleとBingは限定的なワイルドカードをサポートしています：*は任意の文字列にマッチし、$はURLの終端を示します。例えば、'Disallow: /*.pdf$'はすべてのPDFファイルをブロックします。すべてのボットがこれらの拡張機能をサポートしているわけではありません。

robots.txt ジェネレーター

このツールについて

使い方

よくある質問

関連ツール

htaccessリダイレクトジェネレーター

IPサブネット計算機

cron式ジェネレーター