以前より、googleの所有する特許について、SEO業界に限らず噂が飛び交っておりました。




※googleの特許:英語サイトですが、特許原文
簡単に言えば、
画像や映像(動画)の中に含まれる文字(テキスト)を認識・識別する技術をgoogleは開発しました。
ということです。
前々から、気になってはいたので暇を見ては実験をしていた訳ですが、最近、日本語でもかなり正確に読み込めるようになってきたので新記事で投稿することにしました。
グダグダと説明を書くよりも、見てみたほうがわかりやすく、早いので例を挙げてみて行きましょう。
ケース1:ロゴを認識
自社で運営していますホームページ制作サービス「さくぽ」http://hp.citych.com/ 内に次のような画像が御座います。

これは、カード決済や銀行決済で楽天銀行が使えることを示している画像です。
この画像を、googleで検索してみます。
検索窓で画像をドラッグすることで画像を検索します。
その検索結果がこれです。

類似画像に楽天のロゴが多数出てきます。
googleは、楽天のロゴ画像を認識している証拠です。
次に、次のようなケースがありました。
ケース2:カタカナ、漢字の認識
ここでは、弊社運営の398hp.com(携帯サイト制作サービス)http://398hp.com 内の「お申込みフォーム」ボタンです。
まずは、検索する画像です。

同じように画像検索をかけます。
その検索結果がこちらです。

弊社とは一切関係の無い、サイトばかりが並びました。
共通点は、
申込み、申し込み
の文字がある画像が並んでいます。
※申込みと申し込みの微妙なテキストの差については、以前、同義について述べています。ご参考に。http://k-seotaisaku.com/blog/2011/07/post-11.html
さらに、ここで注目したいのは、
リフォーム
と書かれたボタン画像が結果に出ています。
googleの画像内テキストの認識は
リフォーム
と
フォーム
が、同一文字列がある
と判定した訳です。
言葉の意味は全く違えど、文字列は完全に一致している訳です。
このことから、漢字もカタカナも、画像内の文字をgoogleは読める
と、言えると思います。
ただし、
非常に小さい文字の場合や、斜めになった文字(POPなどにある右上がりの文字)などでは、まだ認識があまいものもあります。
しかし、ここまでの結果から見るに、近い将来画像内のテキストはしっかり読み込まれることになるでしょう。
最後に少し補足を。
画像のサイズを変えただけでは、検索結果に大きな違うは出ませんでした。(例、200px×200px画像を300px四方にした場合などの実験結果)
通常のテキストによる画像検索へこの特許はまだ活用されていない?または活用程度が低いと考えられます。従来通り、altタグや近接文字、画像へのアンカーテキストリンクによる影響が高い状態のままです。
最後の最後にどうでもいい追記:
右上にソーシャルブックマークボタンや、ツイッター、facebookシェアボタンを設置しました。(いまさらと、言わないでくださいね)