Googleは半日で10ページをクロールしインデックス
Googleのインデックス(キャッシュ)状況
ドメイン「cms-ia.info」を取得して6日目、DESIGN IT! Forum 2009の告知ページからたった1本の被リンクを受けて半日後、合計10ページがGoogleによってインデックスされていたことを8/1の昼に確認しました。
合計10ページを時系列に並べてみます(キャッシュ日時は日本時間です)。
- 2009-07-29 02:04:12 タグ:Webnode
- 2009-07-29 02:07:09 RSSフィード一覧
- 2009-07-29 02:08:39 ブログ
- 2009-07-29 02:10:10 ホーム(TOP)
- 2009-07-29 02:11:40 サイトマップ
- 2009-07-29 02:12:24 実践プロジェクト紹介
- 2009-07-29 02:16:10 このサイトについて
- 2009-07-29 02:19:55 講演・執筆活動
- 2009-07-29 02:22:55 コンテンツのアーカイブ
- 2009-07-29 06:18:12 タグ:Analytics
Google Webmaster Toolsをまだ導入していないので、今回は「site:www.cms-ia.info」で検索して調べました。
(FTPできないCMSなのでルートにファイルをUPできず、CMSのテンプレートをハックする必要があるのです)
分かったこと
- 被リンクを受けたのはTOPページなのに、なぜかキャッシュ日はタグ一覧のページから始まっている。
- www.cms-ia.infoで検索すると、このうちTOPページとRSSフィード一覧のみがヒット。ブログ一覧は補欠表示される。
- キャッシュされたタイミングと、それが検索結果に表示され始めるタイミングには数日の時差がある(8月1日に初めて確認)
仮説
- TOPのみ、もっと早いタイミングですでにキャッシュされていた?
- クロールの順番とキャッシュ保存のタイミングは別?
- クロール間隔は90秒?
生ログを入手できないので深追いはやめておきますが、更新がどれくらい検索順位や流入に影響を与えるかは引き続き調査します。
8/4 23:21調査
更新した2ページのみ、Googleのキャッシュ日が更新されました。2009-08-01 02:16更新のブログ記事が反映されています。クロールはするけど更新されたページのみキャッシュに反映する、ということですね。
- 2009-08-01 16:16:02 コンテンツのアーカイブ
- 2009-08-02 06:31:33 ブログ
8/6 02:20調査
- 2009-07-31 12:43:36 タグ:IA
- 2009-07-31 15:23:27 Google Analyticsと「なかのひと」を導入
- 2009-08-01 16:16:02 コンテンツのアーカイブ
- 2009-08-02 02:47:57 JAGAT 『PAGE 2006』
8/6 20:10調査
クロールしキャッシュした時点と、それがインデックスに反映されるまでの時差は3日程度です。
- 2009-08-02 06:20:33 このサイトについて
- 2009-08-03 07:53:30 ホーム(TOP)
- 2009-08-03 08:31:05 進行中プロジェクト
- 2009-08-03 13:46:24 講演・執筆活動
- 2009-08-03 21:59:52 コンテンツのアーカイブ