greenの日記

ブログ運営/投資/株主優待/REIT・インフラファンド/アドセンス の話し

【ブログ運営】インデックスとサイトマップって何?(気になって眠れないことはない!)

こんにちは、greenです。ブログやアフィリエイトをしている人は、グーグルの検索流入について、気になるのではないでしょうか
私のブログには、グーグルさんの検索流入が少ないため、グーグルさんが私のサイトを見つけられないのでは?と心配になってしまいます。
そんな時にGoogle Search Consoleのカバレッジ詳細に「インデックス登録されましたが、サイトマップに送信していません」のメッセージを発見し、検索流入が少ないのはこれが原因?と気になりましたので、調べました。
タイトルに書いた通り、でも夜はぐっすり眠れますよ😴実際の画面表示👇

インデックス登録されましたが、サイトマップに送信していません

今回の記事を読んで欲しい人は、同じように、インデックス登録されましたが、サイトマップに送信していません」のメッセージが気になる人インデックスサイトマップの違いが気になる人になります。
※sitemap.xmlとsitemap_index.xmlのファイル名のどちらが、正しいか気になる人も
記事の内容としては、最初にまとめインデックスとは?、サイトマップとは?サイトマップの構成、気になって調べたことの順に書いていきます。

(目次)

まとめ

早速ですが、まとめ3つです。

  1. サイトマップはインデックス登録する手段になる。言い換えると、別の方法でインデックス登録できればよいので、さほど重要でない
  2. 記事を新規で作成または更新した場合は、URL検査ツール/Fetch as Google新規作成した記事のURLを登録する。(こちらの方がサイトマップより、インデックス登録が早い感じがします。)
    Google Search Console(新)は、URL検査ツールを使用する。
    Google Search Console(旧)は、Fetch as Googleを使用する。
  3. サイトマップは重要でないと書きましたが、サイトマップの重要性が上がる?可能性もあるので、サイトマップも理解しておきましょう

まとめを書くまでの確認結果が気になる人は、以降も読んでいただければ😫
Googleの検索の基本(Youtube)を見たことがない人は、見ておいた方が良いと思います。

インデックスとは?

インデックスとは、グーグルが検索時に使用する索引になります。つまりインデックス登録されていないとグーグルの検索では、表示されません

👇Googleの検索の基本です(3分14秒)。日本語の字幕表示も出来ます。

インデックス

Google クローラ(「Googlebot」)がページにアクセスすると、Google により、ページのインデックス登録が行われ、コンテンツや意味が分析された後、ページが Google のインデックスに保存されます。インデックス ページは Google 検索結果に表示されます(Google のウェブマスター向けガイドライン(品質に関するガイドライン)に準拠している場合)。ほとんどのページでは、クロール後にインデックス登録が行われますが、Google ではコンテンツにアクセスすることなく、ページのインデックスを登録する場合もあります(たとえば、ページが robots.txt ディレクティブでブロックされている場合)。

Search Consoleヘルプより

サイトマップとは?

サイトマップとは、Google クローラさんが使用するそのサイトの地図です。多分、Google クローラさんは方向音痴でないので、サイトマップがなくてもインデックス登録できる。でも地図がないので時間がかかるのでしょう。

サイトマップについて

サイトマップとは、サイト上のページや動画などのファイルについての情報や、各ファイルの関係を伝えるファイルです。Google などの検索エンジンは、このファイルを読み込んで、より高度なクロールを行います。サイトマップはサイト内のどのファイルが重要かをクローラに伝えるだけでなく、重要なファイルについての貴重な情報(ページの最終更新日、ページの変更回数、すべての代替言語ページなど)も提供します。

Search Consoleヘルプより

以降の内容は、サイトマップのファイル構成と動きが気になる人だけ読んでください。

 

サイトマップの構成

このサイトで、はてなブログのサイトマップの構成について確認しました。
  1. robots.txtサイトマップインデックスを指定

    robots.txtによりサイトマップを指定

  2. sitemap_index.xmlサイトマップ(sitemap.xml?page=1、sitemap_page.xml)を指定

    sitemap_index

  3. サイトマップ(sitemap.xml?page=1、sitemap_page.xml)で各ページのURL指定
    sitemap.xml?page=1👇(トップページ、aboutページ、記事を指定)sitemap.xmlの内容
    sitemap_page.xml👇(固定ページを指定)

    f:id:greenupf:20190110233123p:plain

ファイルの構成とファイルの記載内容から推測すると、robots.txt→サイトマップインデックス→サイトマップ→URLの情報をGoogle クローラさんが利用していると思われる。

 

気になって、調べたこと

  1. 私は、サイトマップインデックスもサイトマップも作成していない。誰が作った?
    【調べて、想像】
    WordPressの場合Google XML Sitemapsをインストールし、設定をすることで、記事を作成すると自動でサイトマップを更新してくれるらしい。
    はてなブログもサイトマップインデックスとサイトマップを自動で作成してくれているはず。さらに、ページ数が多くなった時用に「sitemap.xml?page=1」のファイル名にしていると想像します。記事数が多くなれば、「sitemap.xml?page=2」ができると思います。
  2. robots.txtとサーチコンソールで指定しているサイトマップのファイル名一致しない。ファイル名(sitemap_index.xml≠sitemap.xml)が一致しないのはおかしい!
    【調べて、妄想】
    下のイメージのように、サーチコンソールで送信できたサイトマップは、sitemap.xmlとsitemap.xml?page=1の2つで、robots.txtに記載されているsitemap_index.xmlは送信できませんでした。送信されたサイトマップsitemap_index.xmlの送信に失敗したので、ファイルがあるか確認すると以下の様に表示されるのでファイルはありますサイトマップの内容
    sitemap.xmlの記載内容を見ると、sitemap_index.xmlと同じでした。サイトマップインデックスの内容
    もともとsitemap_index.xmlを使用していたが、グーグルサーチコンソールのサイトマップ送信で問い合わせが多かったので、sitemap.xmlも作ったとか妄想。🤔
    気になって調べたことには、推測、想像、妄想がありますので、必要に応じてグーグルさんにご確認ください。

 

はてなブログのサイトマップ構成が変わっていましたので、👇の記事で確認しました。

www.green-up1.com

 

最後まで、読んでいただきありがとうございます。