ホーム >  SEO >  google検索の仕組みとクローラー・インデックスとは?

投稿日:   |  最終更新日:

google検索の仕組みとクローラー・インデックスとは?

SEO

a0002_000474

Google検索、Yahoo検索、スマートフォンが普及した現在、ほとんどの人が使います。しかし、いまいちどのような仕組みかわかりづらいと思います。

検索エンジンはどんな仕組みで成り立っているのか、Googleを参考に解説します。

検索順位は検索エンジンによって決められている

日本で有名な検索エンジンと言えば「Google(グーグル)」と「Yahoo(ヤフー)」です。一昔前までは、GoogleとYahooは別々の検索エンジンの仕組みを使用していました。このことは、映画「アキハバラ@DEEP」でも語られています。

しかし、2010年11月末に、YahooもGoogleの検索エンジンのシステムを導入しました。

GoogleとYahooの検索結果が違うのは何故?

GoogleもYahooも同じ検索エンジンを使っているのに、検索結果が違います。結果が異なる理由は、Yahooが特殊なフィルターとアルゴリズムを施しているからです。

たとえば、Yahooの表示順はYahoo!カテゴリの登録サイトが有利です。また、Googleはパーソナライズ検索を使っているため、ユーザーによって検索結果が変わります。一方、Yahooのパーソナライズ検索は一つのリンクに限定されます。

そのほかにもYahooは独自のフィルターをかけて、検索結果を変えています。

検索エンジンの2つの仕組み

検索エンジンは、膨大で複雑なプログラムで作られていますが、我々が知っておくべき仕組みはたったの二つです。1つが「クロール」で、もう1つが「インデックス」です。

クロールとは?

Googleなど検索エンジンは、データベースを作成します。そのため世界中のありとあらゆるサイトの情報を収集します。この情報収集作業をクロールと呼びます。

また、この情報収集するプログラムのことをクローラー(Crawler)と呼びます。最もよく知られているクローラーは「Googlebot」という巡回ロボットです。

robot

※空想

検索エンジンは、クローラー(ロボット)に仕事を依頼します。クローラーロボットの仕事は、世界中のWEBサイトの情報を集める作業を開始します。

indexandrobot

クローラーは、世界中に張り巡らされたリンクを巡回し、それぞれのWEBサイトの情報をかき集めてきます。

クローラーは1回来ただけでは意味がない

クローラーロボットは、そこまでハイスペックではありません。一回巡回した程度では、ページ情報の一部しか収集することができません。だから、ページの情報を持ち帰ってもらうため、何度もクローラーに来てもらう必要があります。

インデックスとは?

インデックスとは日本語で索引という意味ですが、googleでは検索エンジンに記録された世界中のWEBサイトの情報を意味します。

インデックスは、クローラーが集めてきたWEBサイトの情報を記録します。

index

ロボットが持ち帰った情報を、インデックスに登録されるされることを「インデックスされる」と言います。インデックスに登録されるデータとは、「どのWEBサイトが」「どんな情報を持っていて」「どんな話題を扱っているのか」です。

インデックスされなければ意味がない

ユーザーが検索をしたとき、検索エンジンは検索に使われたキーワードと関係するWEBサイトをインデックスから見つけます。そして、最適な検索結果を表示します。

つまり、索結果に表示されるWEBサイトは、インデックスに記録されたWEBサイトだけであり、インデックスされていなければ検索結果には出ません。

次回は、インデックスされたか調べる方法と対処方法を紹介します。

あなたのサイトは検索結果に出ていますか?

トラックバック用のURL
プロフィール

名前:イワサキ ユウタ 職業:システムエンジニア、ウェブマスター、フロントエンドエンジニア 誕生:1986年生まれ 出身:静岡県 特技:ウッドベース 略歴 20

最近の投稿
人気記事
カテゴリー
広告