URLの決め方

テクニカル SEO では、クローラーが認識しやすく、インデックス登録されやすい URL を使うことが大切です。また、複数の URL を link タグで関連付けたり、サイトマップでクローラーに URL を通知することも、クローラビリティ改善につながります。

この記事では、SEO と URL の関係や影響、設定方法を紹介します。

概要

URL について、Googleは以下の8つのルールに対応することを推奨しています。

  1. URL にローマ字表記を使わない
  2. 2 単語以上はハイフンを付ける
  3. index.html に canonical タグを記述する
  4. canonical タグでは日本語は UTF-8 形式を使う
  5. PC 版/モバイル版 URL を link タグで指定する
  6. HTTPS に対応する
  7. サイトマップを作成する
  8. 絞り込みパラメータを含む URL を robots.txt でブロックする

ルール① URLにローマ字表記を使わない

概要

URLは ”syouhin” のようなローマ字表記ではなく ”product” のような英語表記にします。

Googleはローマ字を認識しない

Google は URL に含まれるローマ字を日本語ではなく、英語として解釈します。そのため、ローマ字表記をすると、その URL がどのキーワードに関係しているのか認識されないばかりか、ローマ字表記によっては別の意味に誤解される可能性もあります。

仮に ”syouhin” で検索しても、検索結果には”商品”で検索した結果が代わりに表示されるので、URL にローマ字を積極的に使う理由はありません。

URLは英語表記を使う

ローマ字表記の代わりに短い英語表記にします。

例:

https://example.com/printing-service
×https://example.com/insatsu-sabisu

ルール② 2単語以上はハイフンを付ける

概要

URL の一部が 2 単語以上続くときは、単語と単語の間をハイフンで区切ります。

URLのハイフンの前後で単語を識別する

英語表記では、単語が 2 つ以上連続するとき、単語と単語の間にスペースが入ります。「URL は英語表記にする」というルールを先ほど説明しましたが、URL には仕様上、スペースが入れられません。

そこで、URL はスペースをハイフン「-」に置き換えて表現します。Google は、URL 中のハイフンの前後をそれぞれ単語として認識できるようになります。

なお、区切り文字のない /goingonapicnic.html のような URL は、Googleが ”go” や ”picnic” という単語を認識できず、この URL が誤った検索インデックスに登録されることがあります。また、アンダースコアも区切り文字として認識されません。

アンダースコア区切りではなくハイフン区切り

複数の単語を連結した URL にするときは、ハイフンを使って間を区切ります。

例:

https://example.com/going-on-a-picnic
×https://example.com/going_on_a_picnic
×https://example.com/goingonapicnic

ルール③ index.html に canonical タグを記述する

概要

/ と /index.html のどちらのURLでもアクセスできる場合、canonical タグを追加します。

GoogleはURLごとにページを評価する

Google は URL ごとに検索インデックスに登録します。TOP ページの URL が / と /index.html の2種類あるときも、Google は2つの URL を別々のページとみなして処理します。

そしてページの評価は URL に対して行われます。同じページなのに複数の URL があると、外部リンクなどの評価が分散してしまい、結果的に検索順位がなかなか上がらないといった不利益を受けます。

canonical タグで正規化したURLを指定する

「2つの URL が同じページであること」を検索エンジンに伝える方法が、canonical タグです。これを「URL の正規化」と呼びます。

index.html は特殊なファイルで、 https://example.com/ のように index.html のない URL でも、 https://example.com/index.html のように index.html をつけた URL でも表示できます。「2つの URL は同じページ」なので、URL の正規化を行います。

URL の正規化をするときは、よく使われる方の URL を 1 つ選び、その URL を canonical タグで指定します。通常、短い表記の URL を canonical タグで指定します。

例:https://example.com/ と https://example.com/index.html が同じページで、正規化するURLを https://example.com/ に設定する場合

<link rel="canonical" href="https://example.com/">

ルール④ canonical タグでは日本語はUTF-8形式を使う

概要

canonical タグの URL で日本語を指定するとき、UTF-8 形式で記述します。

URLは英数字のみで表記する

URL は仕様上、英数字や記号のみで表現することになっていて、日本語を含める場合は UTF-8 形式(パーセントエンコーディングと呼びます)に置き換える必要があります。

canonical タグで正規化 URL を指定するときも、同じように UTF-8 形式で URL を指定します。

URL の書式を間違えると canonical タグの指定が無効になり、ページの評価分散といった問題が解決できません。

日本語はパーセントエンコーディングする

URL のパーセントエンコーディングは、ブラウザのアドレスバーからコピーするのが簡単です。

たとえば、ブラウザのアドレスバーに example.com/換気扇/ と表示されている部分をコピーし、ペーストすると次のようなURLが得られます。

https://example.com/%E6%8F%9B%E6%B0%97%E6%89%87%E6%8E%83%E9%99%A4/

これがパーセントエンコーディングされたURLです。

例:

■正しい例
<link rel="canonical" 
      href="https://example.com/%E6%8F%9B%E6%B0%97%E6%89%87%E6%8E%83%E9%99%A4/">

■間違った例
<link rel="canonical" 
      href="https://example.com/換気扇/">

ルール⑤ PC版/モバイル版ページをlinkタグで指定する

概要

PC 版とモバイル版が別々の URL になっているとき、相互の URL を link タグで指定します。

別々のURLとしてインデックス登録される

PC 版とモバイル版の URL が存在するとき、Google は 2 つの URL をインデックスに登録します。何も対処しない場合、検索結果に PC 版とモバイル版の両方の URL が表示されたり、PC で検索するとモバイル版の URL が表示されたりするなど、検索したユーザーにとって不便な結果が起こります。

alternate タグとcanonicalタグを記述する

PC 版ページにはモバイル版の URL を alternate タグで指定し、モバイル版ページには PC 版の URL を canonical タグで指定します。

例:PC版が https://example.com/ で、モバイル版ページが https://example.com/sp/ の場合

■PC版の記述
<link rel="alternate" media="only screen and (max-width: 640px)"     href="https://example.com/sp/">

■モバイル版の記述
<link rel="canonical" href="https://example.com/">

また、PC版ページにスマホからアクセスされた場合、スマホ版へリダイレクトし、スマホ版ページにPCブラウザからアクセスされた場合は、PC版へリダイレクトしておきます。

ルール⑥ HTTPSに対応する

概要

すべてのページを SSL に対応し、https:// で表示できるようにします。

GoogleはSSL対応サイトを優遇する

通信を SSL で暗号化すると、ネットワーク経路での改ざんを防げるため、SSL に対応していないサイトに比べ、安全なサイトと言えます。

Google は SSL に対応したサイトを優遇しています。既に大半のサイトは SSL に対応し、また SSL に必要なサーバー証明書も安価になってきています。

SSL に対応しないと、検索順位で不利な扱いとなり、ブラウザにも「保護されていない通信」とラベル表示されます。

Let’s Encrypt でSSL対応する

サーバー証明書を取得して、サーバーにインストールします。

Let’s Encrypt は、Mozilla や Cisco Systems が出資する認証局(サーバー証明書の発行を行う団体)で、サーバー証明書を無料で取得・更新できます。

当サイトでも、Let’s Encrypt を使っています。

ルール⑦ サイトマップを作成する

概要

クローラーがページを巡回しやすくするために、「XML サイトマップ」と呼ばれる URL 一覧を作成します。

サイト巡回の仕組み

クローラーは、人間と同じように、サイト内のリンクをたどりながら、新しいページを発見します。

また、大規模なサイトでは、ページを巡回する頻度が低くなり、検索結果に反映されるまでに時間がかかることがあります。

「XMLサイトマップ」と呼ばれるファイルがあると、クローラーがこのファイルを参考にして、サイト内を効率的に巡回できます。

XMLサイトマップを生成する

「XMLサイトマップ」はツールを使って作成し、サーバーにファイルをアップロードします。サイトマップの場所を Search Console で登録すると、Google がサイトマップを認識できます。

ルール⑧ 絞り込みパラメータを含むURLをrobots.txtでブロックする

概要

絞り込み検索で複雑な条件を指定したときなど、重要度の低いURLをクローリング対象外にして、サイト全体のクロール速度を上げます。

大規模なECサイトはサイト巡回が困難

EC サイトなどでは、多数のパラメータを含む URL(例えばカテゴリと価格と色で絞り込んだ URL など)があるので、サイト全体の URL 数が多くなり、全ページをクローリングするのに時間がかかります。結果として、新商品の追加や価格の変更、キャンペーン追加といったサイトの変更を行っても、検索結果へ反映されるまで時間がかかることになります。

数千~数万点以上の商品を販売する EC サイトが該当します。

優先度の低いURLをブロックする

複雑な条件で絞り込んだ URL のように、Google 検索でヒットすることも少ないURL をクローリング対象から外すと、クローリングする URL 数を減らせます。

例:最低価格を示すパラメータ min-price が含まれるURLをクローリングの対象外にするときの robots.txt の設定

User-Agent: *
Allow: /
Disallow: /*?min-price=
Disallow: /*?*&min-price=

まとめ

以上、SEO に効く URL の決め方と関連する設定を説明しました。

なお、既に公開された URL の変更は、ミスが起きやすいことに注意しましょう。

URL を変更する前に、現時点でランキングやクローラーの巡回に影響が出ているかどうかを調べてみることをお勧めします。

そのうえで URL を変更する場合、必ずサーバー側の設定で 301 リダイレクトを行い、旧 URL から新 URL へ評価が引き継がれるようにしてください。

弊社では既存コンテンツの内部構造を再設計してビッグワードを狙うSEO対策サービス「Cluster SEO」を提供しています。「SEOの成果が上がらない…」というお悩みをお持ちでしたら、ぜひご利用ください!
ビッグワードを狙うSEOサービス「Cluster SEO」