不要なパラメータ付きのurlを正規化する方法

SEOならSEOパック
2016年04月13日 2024年06月07日

不要なパラメータ付きのurlを正規化する方法

只今タイムセールを実施中です。

ドメインやURLの正規化を検討するケースは、wwwのあり・なしやindex.html(php)のファイル名のあり・なしなどの他に、パラメーターのあり・なしも考えられます。
そしてドメイン(URL)の正規化は、SEO対策において初期段階のうちに正規化対応しておきたいところです。

そこで、本記事ではパラメータのあり・なしに関する正規化についてご紹介したいと思います。
wwwのありなしに関しては下記の記事も参考にしてみてください。

あなたのサイトは「wwwあり・なし」どちらでもアクセスできる状態ですか?サイトを公開した際に、ドメインはデフォルトで以下のようなurlでもそれぞれアクセスできてしまいます。example.comwww.example.comしかしこれでは、クローラーがそれぞれ別のサイト(ページ)と判断して「重複コンテンツ」と認識してしまう可能性も考えられますし、正しく検索エンジンにインデックスされるまでに余計な時間もかかってしまいます。サーバーによっては自動で正規化(URLを統一)してくれるところもあるようですが、別々のurlに被リンクが設定され...
不要なパラメータ付きのurlを正規化する方法

ドメインやURLを正規化する理由

はじめに、ドメインやURLを正規化する理由を整理します。

同じ内容のコンテンツが別々のURLでサイト内に複数存在すると、
クローラーがそれぞれ別のページと判断して情報を収集し「重複コンテンツ」と認識してしまう可能性が考えられます。
また、正規ページが正しく検索エンジンにインデックスされるまでに余計な時間もかかってしまいます。
初期段階のうちに正規化対応しておきたい理由はここにあります。
その他、正規化されていない事で生じるデメリットとしては次のような事が考えられます。

  • 複数存在する事により評価が分散する
  • 意図しないページがgoogle検索結果に表示される
  • 余計なページがクロールされる事で本来クロールされるべきページがクロールされない

URL正規化をしていなければ、このようなデメリットが生じる可能性が考えられる為、SEO対策を進める上で対応すべき施策となります。

パラメータとは

パラメータとは、日本語で言うところの「引数」となります。
呼び出し元から渡された値を受け取る為に宣言された変数となりますが、パラメータはプログラミングの分野やデータ解析の分野で非常に重要な役割を担っています。
webサイトのURLや、アドワーズなどの広告用に生成したurlを設定する際に見かけますが、urlの後ろに半角のクエスチョンマークを付けた「?~」の部分がパラメータと呼ばれる部分になります。

パラメータの種類

パラメータの種類は、その使用状況や目的により異なります。
プログラミングにおける主なパラメータには、入力パラメータや出力パラメータがあり、
データ解析における主なパラメータには、データ解析モデルの特性や設定を特定するための変数である「モデルパラメータ」があります。

本記事で取り上げるパラメータは、WebアプリケーションにおけるURLパラメータです。

URLパラメータ

URLの一部として送信され、サーバー側で処理の指示を行うために使用されます。URLパラメータはさらに以下の「アクティブパラメータ」「パッシブパラメータ」の2つに分類されます。

アクティブパラメータ
指定したパラメータの値によって表示されるWebサイトの内容が変化するタイプのパラメータです。例えば、ECサイトで商品の色や形を絞り込むために使用されます。その他、関連商品を表示したり、商品を人気順に表示するなどといった場合はアクティブパラメータを設定します。

アクティブパラメータが設定される例としては、
ECサイト(example.com)でバッグ(/category/bag/)を検索する際に、色を黒(?color=black)にフィルタをかけるとします。
その場合、「example.com/category/bag/?color=black」といったURLにより黒色のバッグにフィルタがかけられたページが表示されます。

パッシブパラメータ
サーバー上のプログラムが内部的に使用するパラメータで、パラメータの値によって表示されるコンテンツの内容が変化することはありません。その為、パッシブパラメータはダミーパラメータとも呼ばれます。このパッシブパラメータは、例えば、アクセス解析ツールで、トラッキングIDごとの結果を分類するような処理において使用されます。

「動的URL」と「静的URL」

URLパラメータの内、「動的URL」「静的URL」という言葉を耳にした事があるのではないかと思います。
「動的URL」「静的URL」どちらもWebページの形式を指す言葉ですが、

「動的URL」というのは、ユーザーの行動に応じてその都度、毎度異なるURLがプログラミングで生成されるため「?」や「&」が含まれたURLとなります。これはパラメータ名やパラメータ値が吐き出されているURLです。

例えば、ECサイトの場合、ユーザーがアクセスしたときの行動(商品検索など)に応じてデータベースから内容を抽出して表示する必要があるため、動的URLを採用しているケースが多いでしょう。

反対に「静的URL」というのはパラメータ名やパラメータ値が吐き出されていないURLとなり、どんなユーザーがどこで見ても同じコンテンツが表示されるwebページとなります。

ここで多くのウェブマスターは「動的URL」「静的URL」でSEO評価を考慮するならどちらを採用すべきか、という悩みが出てきますが、

Googleはクローラーと呼ばれるプログラムを使ってWebサイトを回遊し、コンテンツを検索エンジンのデータベースにインデックス(登録)や評価を下しています。
今まで「静的URL」がSEO対策上有利だと言われている理由は、静的URLが優れているのではなく「動的URLが複雑なためクローラーに認識されづらい」という理由からです。
動的URLは出力するURLがユーザーごと、あるいは行動ごとに違うためGoogleのクローラーは認識しづらく、結果としてコンテンツがインデックスされづらいと考えられてきました。
しかし、現在では動的URLの認識技術が向上し、どちらの方がSEO対策上有利ということは無くなったとGoogleが公言しています。

ここまで「動的URL」「静的URL」についてどちらがSEO対策上有利ということは無いと簡単に説明しましたが、「動的URL」には注意が必要です。
「動的URL」は条件によりパラメータ名やパラメータ値が吐き出されているURLですが、
例えば日付のパラメータが付く事により大量のページが生成されるケースが考えられます。
検索エンジンにとって、パラメータの付いているURLは別のURLと見なされる為、
このようなケースの場合は大量に生成される無駄なページにクロールがされインデックスに影響を及ぼす可能性がありますし、コンテンツの中身がそれほど変わらない重複ページが大量発生します。
このような問題が起きてしまった際には、URLの正規化やrobots.txtでパラメータを制御する対策を取る事をお勧めいたします。

パラメータが付く条件とは

urlにパラメータが付く場合とは、主に以下の2パターンが考えられます。

  • パラメータで異なるページを管理している場合(内容の並べ替えなど)
  • パラメータを付けて簡易的にどこから来たのか調べる場合

前者の場合、ページによってはもちろんインデックスされて良いものですが、後者は内容が全く同じなため、インデックスされてはSEO的には無駄になります。

そして、何らかの原因でパラメータ付きのurlが意図せずインデックスされてしまった場合、数ページならサーチコンソールからページの削除を行うだけ解決しますが、膨大なページがインデックスされてしまっては大変だと思います。

では、このような状態になってしまった時の対策方法をご紹介します。

\無料診断の活用で課題を明確に/

外部リンク、内部状況、コンテンツ状況からSEO対策の課題が見えてくる無料調査です。
「対策ページの弱点は何か...」などお悩みをお持ちの方は、一度「SEOパーソナル診断」をご利用ください。

rel=”canonical”タグを使いURL正規化する方法

内容が同じパラメータ付きURLが大量にインデックスされてしまったケースの場合、対処法としては「URL正規化」をする事が挙げられます。
URL正規化の方法は「canonical」の他「301リダイレクト」をする方法もありますが、URLパラメータによる重複コンテンツの問題を改善するなら「canonical」を設定すると良いでしょう。

まず、パラメータの正規化には自己参照canonicalを設定する方法が考えられます。
この「canonical(カノニカル)」タグは内容が同じようなページ(例えば色違いの商品ページなどを異なるパラメータで管理している場合など)に対して正規ページとして優先してクロールしてもらいたいのかを指定します。

canonicalタグの設定方法は、該当htmlファイルのhead内に優先させたいurl(正規URL)を記述します。

<link rel=”canonical” href=”https://seopack.jp/” />

パラメータが付いたURLの例1: https://seopack.jp/?12345

パラメータが付いたURLの例2: https://seopack.jp/?abcde

正規ページURLの例: https://seopack.jp/

このようにcanonicalタグを設定をする方法で、複数のインデックスされてしまったパラメータ付きのurlもカノニカルを記述することで、メタタグに記載したurlに従ってクロールを行います。
これによって検索結果に希望通りのurlが表示されるようになります。

Googleアナリティクス4でURLパラメータ作成

Googleアナリティクスなどの解析ツールで流入元や経路などの分析の為、パラメータを発行しているケースがあります。
SEOのコンテンツマーケティングに力を入れているサイトは詳細な行動分析が重要となりますが、
このパラメータはイベントパラメータと呼ばれますが、確認したいイベントが発生した際に細かく情報を確認する事ができます。
具体的な設定方法は「utmパラメータ」をURLの末尾に付けて情報を取得するのですが、utmパラメータにはいくつか種類があります。
主要なutmパラメータをご紹介します。

必須utm_source:
トラフィックのソースを指定します。これは訪問者がどのウェブサイトから来たのかを示します(例:google、newsletterなど)。
必須utm_medium:
マーケティングの媒体を指定します。これは訪問者がどんな種類のメディアからのトラフィックかを示します(例:cpc、emailなど)。
必須utm_campaign:
特定のキャンペーン名を特定します。これは訪問者が参加している具体的なマーケティングキャンペーンを示します(例:summer_saleなど)。
utm_term:
有料のキーワードを特定したいときに設定します。
utm_content:
広告のコンテンツを指定したいときに設定します

URLパラメータ発行ツール「Campaign URL Builder」

さて、URLパラメータを発行するのは、「Campaign URL Builder」を利用すると便利です。

「Campaign URL Builder」は、Googleが無料で提供するURLパラメータ生成ツールです。
ウェブサイトURLやキャンペーン名、参照元、媒体名などを入力すると簡単にパラメータ付きURLが生成できます。

URL発行の注意点としては「大文字・小文字は区別される点」があります。
「Google」と「google」など表記に注意しましょう。
また、設定するパラメータはユーザーが目にする部分であるため、長すぎたり不快な表現となるパラメータは避けた方が無難です。

サーチコンソールでパラメータ付きurlを制御

パラメータが付いたページurlがインデックスされると困る理由は重複ページや被リンクなどの分散が懸念されます。

この、アクセス可能なパラメータ付きのurlへのクロールをサーチコンソール内の「URLパラメータツール」で制御することができたのですが、
2022年4月26日にツールの提供が終了しました。

今後、URLパラメータを細かく制御したい場合はrobots.txtの使用を推奨しています。

\無料診断の活用で課題を明確に/

外部リンク、内部状況、コンテンツ状況からSEO対策の課題が見えてくる無料調査です。
「対策ページの弱点は何か...」などお悩みをお持ちの方は、一度「SEOパーソナル診断」をご利用ください。

robots.txtでURLパラメータを制御

robots.txtは、クローラーにアクセスできるURL、アクセスしてほしくないサイト(URL)を指示するファイルとなりますが、
robots.txt上で該当のURLをアクセス拒否すると、クローラーの巡回がブロックされます。
具体的には「Disallow」で以下のように記述します。

Disallow: /*?

上記をrobots.txtに記載していると全てのパラメータ付きURLが除外されます。
全てのパラメータ付きURLが対象となると、本来アクセスしてほしいページURLもブロックされるのでそれは困る!という場合は、
以下のようにパラメータの一部を指定してブロックの指示を出す方法もあります。

Disallow: /?user=*

これは「?user」パラメータだけ制御している指示となります。

パラメータ付きのurlの正規化についてまとめ

ここまでパラメータ付きのURL正規化について解説してきました。
URLを正規化する理由は「重複コンテンツ」と見なされる可能性が高いからです。
重複コンテンツと判断された場合、最悪のケースではペナルティの対象となる可能性があります。
このため、事前にリスクを回避する手段としてURLの正規化を実施する事をお勧めいたします。

パラメータが付いたurlがインデックスされることはあまりありませんが、定期的にsite:(ドメイン)をwwwあり・なしで検索してみてページ数の確認、不要なページがインデックスされていないかなども確認してみましょう。

SEOパーソナル診断
SEO内部対策 トップに戻る

SEOツール無料トライアル

プロも個人も、高機能なSEOツールを体験ください。

コンテンツ分析や内部SEO対策、競合分析ができるSEOツールが7日間体験可能!

seodoor by SEO Pack

登録申し込み後自動でログインされます。アカウント情報はご登録のメールアドレスへ自動送信されておりますのでご確認ください。

SEO Packキャンペーン
内部修正サービス

公式SNS

Twitter

facebook