SEOではサイト構造やメタタグ設計などが重要になりますが、それと同じかそれ以上に、単語リスト・データベースを用意できるかが肝になります。例えば不動産メディアであればマンション名のリスト、医療系サイトであれば病名リスト、芸能ニュースメディアであれば芸能人リスト、などです。それらの情報を効率的に集める方法をご紹介します。
なぜ単語リスト・データベースが重要かというと、SEO対策がうまくいった際の想定効果をあらかじめ知ることができるからです。多くの人が検索しているということがわかればそれなりの工数をかける価値があると言えますし、逆にうまくいってもわずかな流入しか期待できない場合は、そもそもSEO対策は意味がないと言えるでしょう。それを事前に知っておくためにはキーワード検索回数を調べる必要があり、そのためには単語データベースが必要になります。(超簡易的に想定効果を調べる方法としてベンチマークサイトの想定流入を調べるというものもあります)
単語リストを集めようとしたときに威力を発揮するのがスクレイピングです。Web上にリストに関する情報があったときに、欲しい部分の情報だけを集めることができるからです。
ウェブスクレイピング(英: Web scraping)とは、ウェブサイトから情報を抽出するコンピュータソフトウェア技術のこと。
引用:wikipedia
実際スクレイピングをしたいと思ったときに、ツールは強力な武器になります。Octoparseなどいくつかツールがあるのでそれを使うのも手ですし、特定案件のためのスクレイピングツールを外注することもあります。
もしくは、ある程度ITスキルがある人であれば正規表現を使って特定の情報だけを抽出することもできます。手軽にチャレンジするならやはりツールを使うのが簡単です。
ある程度スクレイピングをやっていると、役に立つのがプロキシという技術です。通常はプロキシを必要とすることは多くないと思いますが、こういった知識も持っていると何かあった際に対処しやすくもなります。
さて、SEOとスクレイピングに関して書いてみました。やや難しい内容だったかもしれませんが、何かの気づきになれば幸いです。SEOはやるべきことが幅広く、要求されるスキルセットも多岐にわたります。うまく技術を使って少しでも楽に対処していきたいですね。
それでは、Have a nice SEO life!