構造化データとは?メリットも解説
この記事をご覧の皆さん、構造化データとはどのようなものかご存知でしょうか。この構造化データについて、近年注目度が高まりつつあります。
なぜなら、サイトのクリック率やコンバージョン率を高めるのに構造化データが役立つからです。
インターネット上には、数多くのWebサイトが存在します。その中で、自社サイトを目立たせるのは容易なことではありません。
しかし、構造化データを上手く活用すれば、Googleを始めとする検索エンジンがサイトを認識しやすくなり評価されやすくなります。
そんな、構造化データという用語を一度は耳にしたことがあるものの、詳しい意味が分からずお困りの方も多くいらっしゃるかと思います。
そこで今回は、「構造化データとは?メリットも解説」と題して、構造化データの定義を明らかにします。
その上で、セマンティックWebや構造化データのメリット・デメリットなど周辺知識も交えてご紹介させていただきます。
構造化データとは
構造化データとは?
構造化データとは、「検索エンジンにWebサイトの情報をわかりやすく伝えるため、HTMLにマークアップする専用のコードのこと」です。
構造化データについて詳しく見ていく前に、まずHTMLとは何か明らかにしていきます。
そもそもHTML(Hyper Text Markup Language)とは、WEBサイトを作成するために開発された言語のことです。
現在、インターネット上で公開されているWEBサイトの殆どは、HTMLで作成されたものです。
記述の仕方は以下の通りです。
〈h1〉HTMLとは?〈/h1〉 〈p〉タグとは?〈/p〉
まず、文字をタグで囲います。そうすることで、単なる文字がh1(見出し)やp(段落)などの意味を持つようになります。
他にも、コンテンツにリンクを挿入する〈a〉タグや箇条書きにする〈li〉タグ、文字を太くする〈strong〉タグなど、タグの種類は多岐にわたります。一般的にタグは、100種類以上あると言われています。
このようにHTMLでは、「コード」「ソースコード」の記述を通じてコンピューターに文章(テキスト)の構造を指定します。
ここで言うソースコード(Source code)とは、プログラミング言語で書かれた、コンピュータプログラムであるテキストまたはテキストファイルのことで、「ソース」「コード」と呼ばれることもあります。
英語の文字が画面いっぱいに羅列されているイメージを浮かべると分かり易いかと思います。しかし、あれは英文を並べているのではなく、プログラミング言語を入力しているという点に留意していただきたいです。
実際にアプリが動作するまでの流れは、以下の通りです。
人間がプログラミング言語で書いたソースコードをコンピューターが理解できるように、コンパイラを始めとするソフトウェアを通じて、0や1などの機械語に翻訳する必要があります。
この一連の流れを踏むことで、当初プログラムした動作をさせることができます。
このようにソースコードとは、プログラムにどんな動作をさせるかを処理する言語とも言えます。
また、ソースコードは知的財産権の観点から多くの企業にとって重要な機密とされていますが、一部ではオープンソース化されているものもあります。
そうした企業ではソースコードを一般に公開することで、誰でも自由にプログラムの改良・修正・再頒布をできるようにしています。
一方サイトの見栄えをよくするCSSは、視覚的に見やすいWebページを作成する上で欠かせません。
なぜなら、CSSを使わずにHTMLだけでWebページを作成すると、真っ白な背景に黒色のフォントが映し出されただけで見た目が簡素なものになってしまうからです。
CSSを実装することで、Webページは劇的に見やすくなり、ユーザーに与える印象やイメージも変化します。
新たにWebサイトを作成したい方は、CSSと併せて積極的に活用するようにしましょう。
そんなHTMLで書かれた文字列は従来まで、単なる文字列としてしか認識されませんでした。しかし、構造化データが一般に活用されるようになってから、HTMLを始めとするテキストデータにタグを付け、データに意味を持たせられるようになりました。
もともと構造化データは、セマンティックWebという考え方から生まれました。
構造化マークアップがされることで、クローラーがWebサイトのコンテンツを認識しやすくなり、Webページのインデックス登録が促進されます。そしてGoogleに評価されやすくなり、最終的にSEO効果が見込めます。
逆に、構造化データをマークアップ(記述)しなければ、クローラビリティ(クローラーによる巡回のしやすさ)が高まりません。そうなるとインデックス登録されないため、Googleからも評価されづらくなってしまいます。
そもそもクローラー(Crawler)とは、インターネット上でWEBサイトのあらゆる情報を周期的に収集して、検索用データベースインデックスを作成する自動巡回プログラムのことです。
クローラーは収集した情報をもとに、どのWebサイトを検索エンジンの上位に表示させるかを決めています。
別名で、ボット、スパイダー、ロボットなどとも呼ばれており、元々は「這う」を意味する英単語クロール(Crawl)の派生語であることから、インターネットという情報の海をクローラーが泳ぐイメージが浮かんでくるかと思います。
ちなみに、日本の検索エンジンの9割がGooglebotで運用されていて、シェアの大部分を占めていることになります。
このようにクローラーは、巡回→解析という一連の流れを踏んだ上で、検索結果に反映させています。このとき、インターネット上を回遊し、解析したWebサイトをデータベースとして記録・分類しています。
その際、Webサイトを上位に表示させるためには、クローラーによる巡回のしやすさ(クローラビリティ)を改善する必要があり、これが有効なSEO対策になります。
具体的には以下の7つが挙げられます。
被リンクを増やす
他のページからの回遊率が上がり、クローラーも巡回しやすくなります。
URLの見直しを行う
マイナス評価を受ける重複コンテンツをなくし、複数あるURLを1つに統一しましょう。
サイトを3階層の構造にする
階層が浅いページは、クローラーも巡回しやすいです。
Google search consoleを活用する
巡回してもらいたいWebサイトの存在をGoogleに知らせましょう。
画像リンクではなく、テキストリンクを使う
クローラーは、テキストを優先的に巡回します。
アンカーテキストの改善
キーワードを盛り込むなど、ひと工夫を加えましょう。
パンくずリストの作成
設置することで、クローラーがサイト内を巡回しやすくなります。
このように、ただコンテンツの作成に当たるのではなく、どんなWebサイトがクローラーによる巡回がされやすいのかポイントを把握した上で、SEO対策を講じる必要があります。
構造化タグの種類
構造化タグはいくつか種類がありますが、その中の1つであるタイトルタグ(Title tag)は、WEBサイト名や各WEBページのタイトル部分を記述するHTMLタグのことです。
HTMLのソースでは以下のように表されます。
〈title〉○○〈/title〉
上記のように、タイトルを〈title〉〈/title〉で囲んで記述すればタイトルタグを設定することができます。
○○の部分が検索エンジンの検索結果画面で説明文の上部に表示されるタイトルに該当します。
そんなタイトルタグは一番目に付く場所に位置するため、ユーザーにサイトをアクセスしてもらえるかどうかを左右します。
それだけでなく、Googleを始めとする検索エンジンによってサイトが上位に表示されるかどうかに大きく影響します。
そのため、タイトルタグを設定する際には幾つかの注意点に気を付ける必要があり増す。以下の通りです。
・長すぎて「・・・」と表示されないように、文字数を30字前後に収める。
・タイトルタグが重複しないようにする。
・ユーザーの検索意図を考慮する。
このようにタイトルタグは、ユーザーと検索エンジンの両方にページの内容を伝える役割を担います。
そのため、ユーザーの利便性とSEOの両面で最適化したいとお考えのサイト運営者は、重要なキーワードや訴求したい内容をタイトルの中に盛り込むようにしましょう。
その他の代表的な構造化タグは以下の通りです。
〈section〉 見出し
〈article〉 記事
〈aside〉 補足情報
〈nav〉 ナビゲーション
〈header〉 ヘッダー
〈footer〉 フッター
このように構造化タグの種類は多岐にわたります。また、タグで文字を囲むことによって検索エンジンはその文字の意味を認識しやすくなります。
セマンティックWebとは
構造化データの定義が明らかになったところで、続いて構造化データが生まれるきっかけとなった考え方である、セマンティックWebについてご紹介させていただきます。
セマンティックWebとは?
セマンティックWebとは「コンピューターシステムがWebページの情報を自動的により詳しく解釈できるようにすること。または、文字の意味や文脈、背景まで理解させようとする考え方のこと」です。
そもそも構造化データを作成したり、管理したりする公式の団体である「schema.org」には、複数のボキャブラリー(プロパティ/キー(属性)とバリュー(属性値))が定義されています。
ちなみに、セマンティックWebはXML、XML Schema、RDF、RDF Schema、OWLなどから構成されています。その中から用途に合わせてマークアップします。
このとき、検索エンジンが理解できるようにWeb上のデータを意味づけるため、単なる文字列として検索エンジンにテキストを認識させることはありません。
そもそも検索エンジン(Search engine)とは、インターネット上の情報を検索するためのプログラムやシステムのことを言います。GoogleやYahoo!、goo、Bingが代表的な例です。
検索エンジンを語る上で欠かせないのが、SEO(Search Engine Optimization)です。「検索エンジン最適化」とも呼ばれます。
Googleを始めとする検索エンジンにおいて、検索結果ページの上位表示の順位に自社のWEBサイトが表示されるように工夫することで、そのための技術やサービスを言います。
そんなSEOには幾つかメリットがあります。以下の通りです。
・無料または低コストで始められる。
・サイトが上位に表示されると、ブランディング効果を得られる。
反対にデメリットもあります。以下の通りです。
・効果が現れるまでに時間がかかる。
・検索エンジンのアップデートやアルゴリズムに左右される可能性がある。
そしてSEOは、大きく2種類に分類されます。以下の通りです。
・内部施策 Webサイトの内部を改善して最適化させること。代表例はコンテンツマーケティング。
・外部施策 Webサイトに対する被リンクの質、量を増やして向上させること。
このようにSEOで成果を上げるためには、内部施策と外部施策を講じる必要があります。
その中でも特に、ユーザーの目線に立って良質なコンテンツを提供し続けることが何より大切です。
その際、SEO対策したい検索キーワードを文脈に沿った形でコンテンツに含ませると効果的です。実際に、GoogleもそうしたWebサイトを高く評価します。
同時にユーザーには、自社の商品やサービスを知ってもらう機会を与え、最終的には見込み顧客をファン化させることができます。
Webサイトを検索順位の上位に表示させることで、集客効果を得たり、コンバージョン数を増やしたりしたいとお考えのサイト運営者は、SEO対策を講じるようにしましょう。
なお、セマンティックWebは、World Wide Webの考案者でもあるW3Cのティム・バーナーズ=リー氏が提唱しました。
World Wide Webとは?
そもそもWorld Wide Web(ワールド・ワイド・ウェブ)とは、インターネット上でWebページを利用する際の仕組みを意味します。
1990年12月にイギリスの有名な計算機科学者ティム・バーナーズ=リー博士によって、世界で初めてシステムが構築されました。
そして1991年8月6日には、世界初となるWebサイトが公開されました。
1994年には、Webの標準ルールを定めるために、非営利団体W3C(World Wide Web Consortium)を創設すると同時に、HTMLの標準規格を策定しました。
WWW(ワールド・ワイド・ウェブ)は、「世界中に広がるクモの巣」が由来だとされています。
インターネット上に存在する無数のコンテンツ同士が張り巡らされた様子が複雑に絡み合うクモの巣に似ていることから名付けられました。W3とも呼ばれます。
そんなWWW(ワールド・ワイド・ウェブ)は、以下の3つによって構成されています。
・HTML マークアップ言語
・HTTP 通信プロトコル
・URL インターネット上の住所
なお、サイトによってWWWが有るものと無いものが見受けられますが、有り無しによる違いはほとんどありません。
このように、ハイパーテキストという記述方法で書かれたWebページ同士をリンクさせる仕組みを持つWWWが誕生したことにより、ユーザーはハイパーリンクの機能を通じて別のコンテンツに遷移したり相互に閲覧したりできるようになりました。
構造化データのメリット・デメリット
構造化データのメリット
そんな構造化データには、メリットが大きく2つあります。以下の通りです。
検索エンジンがサイト上のコンテンツを認識しやすくなる
構造化データを使うと検索エンジンがコンテンツを認識しやすくなります。このとき適切に記述すれば、単なる文字列以上の意味まで検索エンジンは認識します。
リッチスニペットが検索結果に表示されることがある
構造化データを使うと、検索結果にリッチスニペットが表示される場合があります。
そもそも、リッチスニペット(Rich snippet)とは、ユーザーが検索結果の画面からどのページをクリックするか、その判断が解かるためのページ内容が想像できるような情報のことです。
検索結果の画面では、ヒットしたWEBページのタイトル下部分に数行のテキストが表示されます。
そもそもsnippetとは「断片」「切れ端」を意味する英単語で、ページタイトルの下に表示される要約文のことです。
網羅性が高いと情報をより豊かにすることができるという前提の下で、スニペットの表現が豊か(rich)になるため、リッチスニペットと呼ばれるようになりました。
そんなリッチスニペットの種類は多岐にわたり、30種類ほどあります。代表的なものは以下の通りです。
会社概要・パンくずリスト・写真・画像・動画・商品レビュー・評価・価格・料理のレシピ・求人情報 例)Google for jobs・検索窓・イベントスケジュール・よくある質問(FAQ)
実際に、検索結果をリッチスニペット化するには、検索エンジンにコンテンツの内容を伝える必要があります。
そのために、主要タグの記述を行った上で、構造化データを設定する必要があります。しかし、必ずしも検索結果に反映されるわけではないので注意が必要です。
このようにリッチスニペットが表示されると、検索結果で目立つことができ、クリック率の向上を見込めます。
ここで言うクリック率(Click Through Rate)とは、ネット広告が表示された回数のうち何回クリックされたかの割合のことです。
CTRと略されることもあります。広告全体のうちユーザーの視点に立った広告がどれだけあるか表す指標となります。
クリック率の計算方法は以下の通りです。
・クリック率(%)=クリックされた回数/広告が表示された回数×100
例えば、表示回数が100回でクリック回数が6回の場合、クリック率は6%になりす。
クリック率を上げるメリットは以下の通りです。
・ページビューが増える。
・クリック単価を抑制できる。
クリック率と一括りに行っても、どれくらいあれば高いあるいは低いのか、イメージが沸かない方も多いかと思います。
そこで、クリック率の目安を自然検索とリスティング広告の2つに分けてみていきましょう。
まず、自然検索におけるクリック率は、掲載順位が高いサイトほどクリック率が高い傾向にあります。
次に、リスティング広告における平均クリック率を見てみましょう。
最も高いのは「デート・出会い」業界の6.05%であるのに対して、最も低いのは「技術」業界の2.09%です。
このようにクリック率は、業界によって目安となる数値が異なります。
クリック率を上げるには、適切なキーワードが使われているか、ターゲットが合っているか、どうかの2点を心掛けましょう。
同時に、情報量を豊富にして競合サイトとの差別化を図りたいと考えるサイト運営者は、リッチスニペットを積極的に活用してみましょう。
GTM(Googleタグマネージャ)とは?活用メリットや機能・導入方法を紹介
構造化データのデメリット
反対に、デメリットもあります。
デザインの設計や改修など実装や見直しに工数がかかってしまう
構造化データの記述方法に関する専門知識の習得が求められる
構造化データの形式によって記述方法が異なるため、複数のボキャブラリー(属性や属性値)を覚えていく必要があります。
したがって、構造化データを導入してからコンバージョンを獲得できるまでに時間がかかってしまいます。
ここで言うコンバージョン(conversion)とは、WEBサイトにおけるゴール達成のことです。
見込み顧客から顧客への変換・転換・転化を意味し、最終的な成果として使われます。
コンバ―ジョンに多いのはお問い合わせ、資料請求、商品やサービスの購入、イベントへの参加申し込みなどで、CVをコンバージョンとして呼びます。
そんなージョンには大きく5つの種類があります。以下の通りです。
直接コンバージョン
Webサイトに出稿した広告経由で、ユーザーによって商品が購入されることを意味します。
間接コンバージョン
いったん離脱したが、再びサイトに戻ってきたユーザーによって商品が購入された場合である点において、直接コンバージョンと異なります。
ユニーク・コンバージョン
あるWebサイトで2つの商品が購入された場合であっても、アクションごとに2と見なすのではなく、一人のユーザーを1とカウントする点が特徴的です。
クリックスルー・コンバージョン
ある広告をクリックした先のWebサイトで、ユーザーによってなされたコンバージョンのことです。
ビュースルー・コンバージョン
ある広告を見て、後にWebサイトでユーザーによってなされたコンバージョンのことです。
このとき、ユーザーは広告を見ただけであり、クリックしてはいません。
コンバージョンを最大化させるためには、コンテンツを最適化したり、ユーザーをWebサイトに導いてあげたりする必要があります。
ロジックツリーを活用することで、最終的な成果に至るまでの道筋を細分化した上で、それぞれの段階や要素ごとでの改善が期待されます。
このように、コンバージョンはWebマーケティングにおいて、企業がどれだけ成果を獲得できているかを数値化して表す指標となります。
ボキャブラリーとシンタックスについて
構造化データを理解する上で重要な言葉が2つあります。以下の通りです。
ボキャブラリーとは?
ボキャブラリーとは、「構造化データの設定をする際に何についての情報なのかを明確に記述する規格のこと」です。
Googleがサポートしている「schema.org」という規格が主流です。schema.orgでマークアップする際には、タイプトプロパティを指定します。
例えば、会社情報を構造化マークアップする場合には、社名や住所、電話番号などを指定すると良いです。
かつて「data-vocabulary.org」という規格もありましたが、2020年4月6日をもってサポートが終了することをGoogleが発表しました。
これに伴い、Googleは「data-vocabulary.org」のユーザーにGoogle Search Consoleで警告を出し、「schema.org」への移行を促しました。
シンタックスとは?
ボキャブラリーは値を定義しますが、シンタックスは、「実際にマークアップする際の仕様のこと。マークアップできる構造化データの形式やおよび仕様のこと」を意味します。
Googleがサポートしていてシンタックスの中でも「schema.org」によって定められているのは、「Microdata」「JSON―LD」「RDFa Lite」の3つです。この中でもGoogleは「JSON―LD」を推奨しています。
このようにボキャブラリーとシンタックスは、構造化データを理解する上で欠かせない重要なキーワードだと言えます。
構造化データのマークアップ方法とツールの紹介
構造化データのマークアップ方法とは?
構造化データの書き方は大きく2つあります。
HTML上に直接マークアップする方法
3形式とも独自の特徴を持っています。それぞれのメリット・デメリットは以下の通りです。
「Microdata」
schema.orgが最初に仕様統一を図ったマークアップ方法で多くのWebサイトに普及しています。
構造化データと実際のHTMLが一致しやすいというメリットがある一方で、ソースが煩雑になるというデメリットもあります。
「JSON―LD」
Microdataと比較してコンピューターが読み取りやすい形式となっています。
ソースと分離でき、不可視のデータに関して記述が少なくて済みます。しかしこのとき、可視データは同じ内容を2カ所に記述する必要があります。
「RDFa Lite」
1999年にW3Cによって規格化されている形式となっています。
構造化データと実際のHTMLが一致しやすく、XHTMLでも使えます。ところが、ソースが煩雑になってしまう、Googleの構造化マークアップ支援ツールでサポートされていないといった点もあります。
構造化データマークアップ支援ツールを活用する方法
構造化データマークアップ支援ツールを活用すれば、画面上の簡単な操作をするだけでWebサイトに合わせた構造化マークアップができます。使い方の手順は以下の通りです。
・Webサイトが該当するジャンルにチェックを入れる。
・対象のページを入力する。
・タグ付け開始をクリックする。
・ページが読み込まれた後にマークアップしたい部分を選択する。
・どの項目を定義しているのかを選択する。
このようにしてマークアップした情報が保存されていきます。
マークアップが完了したら、出力されたコードのコピーをHTMLファイルに貼り付けましょう。
ツール紹介
以下では、構造化データを記述せずに検索エンジンに伝えられるツールを1つと検証ツールを2つご紹介いたします。
「データハイライター」
データハイライターとは「構造化データをHTMLに記述しなくても検索エンジンに伝えることができるツール」のことです。
データハイライターを活用すれば、正確にコードを記述できない人やHTMLファイルを修正したことない方も構造化マークアップができます。
その点で初心者向けのツールだと言えます。一方で、HTMLソースが複雑であったりURLに規則性がなかったりした場合には、複数ページをまとめてマークアップすることができないなど幾つかデメリットもあります。
「構造化データテストツール」
構造化マークアップが正しく行われているか検証するツール。
使い方の手順は以下の通りです。
・構造化データテストツールにアクセスする。
・URLを入力する。
・「テストを実行」をクリックする。
「Google Search Console」
構造化データの設定が正しく行えたか否かをチェックできます。
Webサイト内の構造化データの設定を一覧で確認することができます。その点において、1つのURLまたはHTMLコードしか確認できない構造化データテストツールよりもGoogle Search Consoleは優れています。
そもそもSearch Consoleとは、Googleが無償で提供する、ウェブマスターやフロントエンドデザイナー、および事業主向けの、高機能な公式サイト管理ツールのことです。
また、Googleにて2015年5月20日変更される以前までの名称は、ウェブマスターツールと呼ばれていました。しかし、それに伴う大きな変化はなく、仕様や機能もGoogleウェブマスターツールとほとんど変わりありません。
ウェブマスターツールとは、Googleが提供していた無料ツールの1つであり、Googleウェブマスターツールのことです。
ウェブマスターツールに登録することにより、自社のWEBサイトの現状と、訪問するユーザーについてのすべてが分かります。
そんなSearch Consoleを活用することで分かる内容は大きく5つあります。以下の通りです。
・どのページの閲覧が多いか、どんなキーワードでの流入が多いかがわかる。
・自社のWEBサイトに向けられている外部リンク、サイト内の内部リンクがわかる。
・WEBサイトにクローラーを呼ぶことができ、インデックス(index)を促進することができる。
・どんなキーワードで表示されているか(検索クエリ)がわかる。
・表示されている検索クエリから、どれぐらいのクリックがされたかCTR(クリック率)がわかる。
このようにサイト運営者は、自社が管理するWebサイトの認証をGoogleにしてもらうことで、あらゆる便利な機能を活用することができるようになります。
SEO対策でキーワード選定やアクセス解析に必要なツールとは?
まとめ
今回は、構造化データの定義を明らかにした上でセマンティックWebや構造化データのメリット・デメリットなど周辺知識も交えてご紹介させていただきましたが、いかがでしたでしょうか。
構造化データは、検索順位に直接の影響は与えませんが、設定することで検索エンジンにコンテンツの内容を正しく伝えることができます。
同時にリッチスニペットが表示されると、サイトのクリック率やコンバージョン率の向上につながります。
このように構造化データを活用することで、検索エンジンに自身のWebサイトを認識してもらい易くなります。
そして、直接的にSEO効果を実感することはできなくても、間接的なSEO効果を期待することができます。
最終的には、自身のWebサイトが多くのユーザーの目につき、SEO効果が高まります。
また、コードを記述できなかったり修正したことがなかったりしたとしても、ツールを活用すれば、初心者でも簡単に構造化マークアップできます。
構造化データを試みたことがない方はこの機会に、自社コンテンツに導入することも検討してみてはいかがでしょうか。
【株式会社セレクト・ワン】
東京本社:03-5953-7160
株式会社セレクト・ワンの社員によってオススメ情報を執筆している【編集チーム】です。”初心者の方にもわかりやすく”をモットーに、記事を読んだら直ぐに実践できるWEBマーケティング関連の情報を紹介しています。
また、弊社の実績や導入事例から見る・コンテンツマーケティング・SEO対策・WEB制作など、様々な最新情報やノウハウも発信していきます。