SEO 2025年07月11日

【インデックス効率最大化】XMLサイトマップの正しい作り方・設置とSEO効果

MIP編集部

この記事を書いた人

株式会社MIPのマーケティング専門チームです。デジタルマーケティング業界で5年以上の実務経験を持つ専門家が、実践的で価値のある情報をお届けしています。SEO、広告運用、コンテンツマーケティングの分野で数多くの企業様の成果向上をサポートし、その知見を記事として発信しています。

マーケティング専門家 実務経験5年以上 コンサルティング実績多数

Webサイトの成功は、Googleに「存在するページ」をすべて見つけてもらうことから始まります。そのための最も強力で基本的なツールが「XMLサイトマップ」です。

XMLサイトマップは、特に新規ページや、通常の内部リンク構造からは辿りにくいページをGoogleに漏れなく知らせるための、検索エンジン専用のページの目録です。これが正しく設置されていないサイトは、Googleから「このサイトの全貌がわからない」と判断され、重要なページのインデックスが遅れたり、見過ごされたりするリスクを負います。

この記事では、Webマーケターや経営者の方々が、XMLサイトマップの基本的な役割から、Googleの公式ガイドラインに準拠した最新の作成・送信方法、そしてSearch Consoleを活用した運用管理までを徹底解説します。御社のWebサイトのクロール効率を最大化し、インデックス漏れを根絶しましょう。


そもそもXMLサイトマップとは?SEOにおける重要性と役割

XMLサイトマップは、Webサイトの基盤を支えるインフラです。その定義と、SEO戦略における位置づけを明確に理解します。

XMLサイトマップの定義:検索エンジンへの「ページの目録」

XMLサイトマップ(sitemap.xml)とは、Webサイト内のクロール可能なURLをXML形式でリスト化したファイルです。これは、主に検索エンジン(Google Botなど)に向けて作成されます。

人間がWebサイトを閲覧するためのナビゲーションではなく、クローラーが効率よく、かつ漏れなくページを巡回・発見するための「案内図」として機能します。

特に以下のようなサイトでは、XMLサイトマップの設置が不可欠です。

  • 大規模サイト: 内部リンクだけではクローラーが全てのページを辿りきれない可能性がある場合。
  • 新規サイト: ページ数が少なく、外部からの被リンクが少ないため、クローラーの巡回頻度が低い場合。
  • 孤立したページがあるサイト: サイト構造上の理由で、他のページからリンクされていない「孤立ページ」が存在する場合。

HTMLサイトマップとの違い:目的が異なる2種類のサイトマップ

Webサイトには「XMLサイトマップ」と「HTMLサイトマップ」の2種類が存在します。目的が全く異なるため、混同しないようにしましょう。

種類目的主な対象SEOへの影響
XMLサイトマップ検索エンジンにURLを教え、インデックス効率を高めるGoogle Botなどのクローラー間接的に重要(クロール効率向上)
HTMLサイトマップユーザーが目的のページを探すためのナビゲーションサイト訪問者ユーザビリティ向上、離脱率低下

XMLサイトマップは必ずサーバーのルートディレクトリにアップロードし、Googleに送信する必要があります。HTMLサイトマップは、ウェブページのコンテンツとして設置し、サイトフッターなどからリンクされるのが一般的です。


Google公式のXMLサイトマップの正しい作成・記述ルール

XMLサイトマップは、GoogleとSitemap Protocolで定められたルールに従って正確に記述する必要があります。

XMLサイトマップの基本的な構造と記述すべき必須要素

XMLサイトマップは、最低限、以下の3つの要素を含む必要があります。

  1. <urlset>: ファイル全体のラッパー(開始タグと終了タグ)。
  2. <url>: 各URLのエントリ(URLごとの開始タグと終了タグ)。
  3. <loc>: ページのURL(絶対URLで記述。必須要素)。

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.example.com/</loc>
    </url>
  <url>
    <loc>https://www.example.com/blog/article-1/</loc>
  </url>
</urlset>

引用元: Google 検索セントラル「サイトマップの作成と送信」

URL: https://developers.google.com/search/docs/crawling-indexing/sitemaps/build-sitemap?hl=ja

XMLサイトマップには、インデックスさせたい正規URL(canonical URL)のみを記述するようにしましょう。重複コンテンツのURLや、noindexタグが設定されているURLは含めるべきではありません。

Googleが「重視していない」最新の記述要素(changefreq/priority)の扱い

XMLサイトマップの記述には、かつて重要視されていたものの、現在Googleが推奨していない要素が存在します。

記述要素役割Googleの現在の推奨
<changefreq>ページの更新頻度(daily/weeklyなど)無視される傾向にある。正確な情報ではないため、基本不要。
<priority>ページ間の相対的な優先度(0.0~1.0)無視される傾向にある。リンク構造などからGoogleが独自に判断するため、基本不要。
<lastmod>最終更新日時推奨される。ページが更新されたことをクローラーに知らせるシグナルになる。

Googleの公式見解では、changefreqpriorityといった要素は、クロールやランキングの決定にはほとんど影響しないとされています。現在、サイトマップで最も重視すべきは、正しいURLと、更新日時を示す<lastmod>です。

大規模サイト向けの分割ルール:5万URL・50MBの壁とインデックスファイルの利用

単一のXMLサイトマップファイルには、以下の制限があります。

  • URL数: 50,000 URLまで
  • ファイルサイズ: 圧縮していない状態で50MBまで

この制限を超える大規模サイトの場合、XMLサイトマップを複数のファイルに分割し、それらを束ねるための「サイトマップインデックスファイル」を作成する必要があります。

サイトマップインデックスファイル(sitemap_index.xml)の例:

XML

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>https://www.example.com/sitemap_1.xml</loc>
   </sitemap>
   <sitemap>
      <loc>https://www.example.com/sitemap_2.xml</loc>
   </sitemap>
</sitemapindex>

このインデックスファイルをSearch Consoleに送信すれば、Googleは自動的に配下の複数のXMLサイトマップファイルをクロールします。


XMLサイトマップの設置とSearch Consoleへの正確な送信手順

XMLサイトマップの作成後、それをGoogleに認識させるための手順は、SEO運用における必須タスクです。

XMLサイトマップのアップロードと「robots.txt」での場所指定

作成したXMLサイトマップファイルは、Webサイトのサーバーのルートディレクトリ(最上位の階層)に配置するのが一般的です。ファイル名は慣習的に「sitemap.xml」とします。

さらに、クローラーが迷うことなくサイトマップを見つけられるように、robots.txtファイルにその場所を明記します。

robots.txtへの追記例:

User-agent: *
Disallow: /wp-admin/
Sitemap: https://www.example.com/sitemap.xml

これにより、Search Consoleでの送信とは別に、Google Botや他の検索エンジンクローラーに対して、サイトマップの存在を通知できます。

Search Consoleの「サイトマップ」機能を使った登録と送信

GoogleにXMLサイトマップを正式に送信・登録する最も確実な方法は、Google Search Console(サチコ)の機能を利用することです。

  1. ログインと選択: Search Consoleにログインし、対象のWebサイトプロパティを選択します。
  2. 送信画面へ: 左側のメニューから「サイトマップ」を選択します。
  3. URLを入力し送信: 「新しいサイトマップの追加」セクションに、サイトマップのファイル名(例: sitemap.xml)を入力し、「送信」ボタンをクリックします。

これにより、Googleは送信されたサイトマップファイルをもとに、クロール作業を開始します。


運用とトラブルシューティング:Search Consoleでのステータス確認とエラー対策

XMLサイトマップは一度送信して終わりではありません。Search Consoleを使って継続的にステータスをチェックし、問題があれば対処することが重要です。

送信後に「保留中」や「エラー」が表示される場合のチェックポイント

サイトマップを送信した後、ステータスが「保留中」からなかなか変わらない、あるいは「エラー」が表示される場合があります。

ステータス主な原因と対策
保留中Googleのクロールを待っている状態。数日〜数週間で解消されることが多い。待っても変わらない場合は、サイトマップのURLがrobots.txtでブロックされていないかを確認。
エラーXMLの書式が間違っている、またはサイトマップ内にGoogleがクロールできないURLが含まれている可能性が高い。XMLの書式(タグの閉じ忘れなど)と、URLが404エラーになっていないか、あるいはnoindexタグが設定されていないかを確認。

特に、エラーが発生している場合は、Search Consoleのレポートで具体的にどのURLで問題が発生しているかが確認できるため、その情報を基に迅速に修正することが求められます。

インデックスされたURL数を確認し、クロール効率を計測する

サイトマップの真の効果は、「送信済み」のURL数と「インデックスされた」URL数を比較することで確認できます。

  • 確認箇所: Search Consoleの「サイトマップ」レポートで、送信したサイトマップファイル名の下に表示される「検出されたURL」と「インデックスに登録されたURL」の数を確認します。
  • 理想的な状態: 「検出されたURL」と「インデックスに登録されたURL」の数がほぼ一致しているのが理想です。
  • 対策が必要な状態: 検出されたURLに対してインデックスされたURLの数が極端に少ない場合、コンテンツの質が低い、重複コンテンツがある、またはクロールに問題があることを示唆しています。

XMLサイトマップの運用は、単にファイルを置くことではなく、この「検出 vs. インデックス」のギャップを埋めるための、継続的な品質管理サイクルの一部なのです。


まとめ:XMLサイトマップは「SEOの土台」を支える重要なインフラ

XMLサイトマップは、ウェブサイトの裏側で静かに、しかし決定的にSEOに影響を与え続ける重要なインフラです。

  • XMLサイトマップは、クロール効率とインデックス漏れの解消に直結する。
  • 正規URLと最終更新日時(lastmod)を正確に記述し、changefreqpriorityは過度に意識しない。
  • Search Consoleを通じて登録・送信し、継続的にエラーとインデックス率を監視する。

この土台となるインフラを疎かにすれば、どんなに優れたコンテンツもGoogleに見つけてもらえません。今すぐ自社のXMLサイトマップの有無と、その正確性を確認し、Webサイトのインデックス状況を万全にしましょう。

もし、XMLサイトマップの複雑な作成・管理や、それに関連する技術的なSEOの問題解決にお悩みであれば、私たち株式会社MIPにご相談ください。Googleの公式ガイドラインと、実務的な改善ノウハウに基づき、貴社のWebサイトのインデックス体制を最適化いたします。

マーケティングの運用でお困りですか?

当社の専門チームが、あなたのビジネスに最適な戦略をご提案いたします。

無料相談を申し込む