SiteCatalystの検索キーワードの文字化けを直す3種類の方法
Google検索の不具合により、リファラーに含まれる検索キーワードが二重エンコードされる件に関するSiteCatalystでの対策についてまとめました。
分かったこと
- リファラが二重でURIエンコードされるため、エンコードされた状態のキーワードが計測される
- 8月位から発生し始め、10/19に約30%まで急増、11/18に収束
- google.comなど他国のドメインでも発生する
- ブラウザの種類とも関係なさそう、発生条件は不明
- Googleの仕様変更ではなく、バグ
3種類の対策
以下の方法で対応できます。最初の2つは過去データを判読可能にする方法、3つ目の方法は計測前に修復する方法です。
1. サイトカタリストのレポート画面上で直す
エイチさん(@hlwme)が公開されたGA用ブックマークレットをSiteCatalyst用に改造しました。
以下のリンクをブックマークし、レポート画面でクリックしてください。
サイカタKW修復 (v14用)
図:使い方:
- 画面上でサクッと確認できるのが手軽
- ページを移動すると元に戻るので毎回実行する必要がある
- 再集計は行わないため、同じ検索キーワードは合算する必要がある
- ダウンロードやメール配信、Excelクライアント、データ抽出、ダッシュボード、グラフなどは直らない
参考:GoogleAnalyticsの検索クエリの文字化けを1clickで直す方法 (hlw.me)
2. Excelに落としてから直す
ExcelクライアントやReportBuilder、データ抽出やDataWarehouseを使ってデータをエクセルに落とした後に、マクロを使って文字化けを直す方法です。
Excelで修復!GoogleAnalyticsの文字化け対策(カグア!)
記事はGA向けですが、マクロ部分はセルの値をデコードするだけなので、SiteCatalystでも使えます。
- 一度実装してしまえば、継続的な運用ができる
- さらに工夫すれば同じキーワードを合算する集計も可能
3. s_code.jsのプラグインで直してから計測する
データそのものを直す方法です。11/18に直った今では、不要になりました。
Googleのキーワードが二重エンコードされてる問題(俺のメモ代わり的な何か)
- 正しく集計され、レポートやグラフ、DataWarehouseなどすべてが正常値になる
- 公式プラグインではないので、自己責任で
12/6追記:11/18に修正されたようです。
図:文字化けキーワードの推移:
11/19以降は文字化けしたキーワードがほぼゼロに戻りました。