登録日： 2025-03-17 最終更新日： 2025-03-19

robots.txt とは？

robots.txt は、ウェブサイトの管理者が検索エンジンのクローラー（ロボット）に対して、どのページをクロール（巡回・取得）してよいか、またはクロールしてほしくないかを指示するためのテキストファイルです。

robots.txt の役割

robots.txt は User-agent（対象のクローラー）と Disallow（アクセス禁止のパス）を記述する単純なテキストファイルです。

基本的な書き方


User-agent: *
Disallow: /admin/
Disallow: /private/
Allow: /public/

Sitemap: https://example.com/sitemap.xml

Memo：

robots.txt はサイトのルートディレクトリに設置する必要があります。


User-agent: *
Disallow: /


User-agent: *
Disallow: /login
Disallow: /signup


User-agent: Googlebot
Disallow: /private/


User-agent: Googlebot-Image
Disallow: /images/


User-agent: *
Disallow:
Sitemap: https://example.com/sitemap.xml

robots.txt でページのインデックスを完全に防げるわけではない！

以下のHTMLを

内に記述すれば、そのページのインデックスを防ぐことができます。


<meta name="robots" content="noindex, nofollow">

自分の robots.txt が正しく機能しているかを確認するには、以下の方法があります。

Google Search Console の robots.txt テスター
Google Search Console の「robots.txt テスター」を使うと、設定が正しいか確認できます。
直接URLにアクセス
ブラウザで https://example.com/robots.txt にアクセスし、内容を確認する。