SiteCatalystの検索キーワードの文字化けを直す3種類の方法

2011年11月19日 11:47

Google検索の不具合により、リファラーに含まれる検索キーワードが二重エンコードされる件に関するSiteCatalystでの対策についてまとめました。

分かったこと

  • リファラが二重でURIエンコードされるため、エンコードされた状態のキーワードが計測される
  • 8月位から発生し始め、10/19に約30%まで急増、11/18に収束
  • google.comなど他国のドメインでも発生する
  • ブラウザの種類とも関係なさそう、発生条件は不明
  • Googleの仕様変更ではなく、バグ

3種類の対策

以下の方法で対応できます。最初の2つは過去データを判読可能にする方法、3つ目の方法は計測前に修復する方法です。

1. サイトカタリストのレポート画面上で直す

エイチさん(@hlwme)が公開されたGA用ブックマークレットをSiteCatalyst用に改造しました。

以下のリンクをブックマークし、レポート画面でクリックしてください。

サイカタKW修復 (v14用)

図:使い方:

  • 画面上でサクッと確認できるのが手軽
  • ページを移動すると元に戻るので毎回実行する必要がある
  • 再集計は行わないため、同じ検索キーワードは合算する必要がある
  • ダウンロードやメール配信、Excelクライアント、データ抽出、ダッシュボード、グラフなどは直らない

参考:GoogleAnalyticsの検索クエリの文字化けを1clickで直す方法 (hlw.me)

2. Excelに落としてから直す

ExcelクライアントやReportBuilder、データ抽出やDataWarehouseを使ってデータをエクセルに落とした後に、マクロを使って文字化けを直す方法です。

Excelで修復!GoogleAnalyticsの文字化け対策(カグア!)

記事はGA向けですが、マクロ部分はセルの値をデコードするだけなので、SiteCatalystでも使えます。

  • 一度実装してしまえば、継続的な運用ができる
  • さらに工夫すれば同じキーワードを合算する集計も可能

3. s_code.jsのプラグインで直してから計測する

データそのものを直す方法です。11/18に直った今では、不要になりました。

Googleのキーワードが二重エンコードされてる問題(俺のメモ代わり的な何か)

  • 正しく集計され、レポートやグラフ、DataWarehouseなどすべてが正常値になる
  • 公式プラグインではないので、自己責任で

12/6追記:11/18に修正されたようです。

図:文字化けキーワードの推移:

11/19以降は文字化けしたキーワードがほぼゼロに戻りました。