MediaLab Love Chapter 2

Assistance of MediaLab Love about Javascript test and more...

WWW2009開催記念 ケータイのググり方、パソコンのググり方

前回はアメリカの話でしたが、次は日本の話です。
Yahoo! Researchの方が書いた "A Study of Mobile Search Queries in Japan" (PDF) *1という論文です。
2006年のYahoo! Japanで検索された単語をパソコンからのものと、携帯電話からのものに分けて解析を行っています。
例によって要点をまとめると

  • 検索単語数(スペースが単語の切り分けではない)*2の平均値が、携帯電話は2.293, パソコンは2.249と差はない。
  • 検索文字数の平均値が携帯電話は7.928, パソコンは9.623と少し多い。
  • カタカナ、ひらがな、漢字、ローマ字*3を一つでも含む検索語の比率は、
メディア カタカナ ひらがな 漢字 ローマ字
携帯電話 46.6% 13.3% 66.3% 16.5%
パソコン 52.1% 8.7% 72.6% 10.5%

という結果。

  • 検索語をカテゴリ別に分けると、以下の図のようになる。


分け方はdmoz.orgで定義されているカテゴリに分けた*4。検索カテゴリランキング2位以下の比率は2つとも変わらない、1位はArtのカテゴリでパソコンの方が多い。Artがおおざっぱすぎるので見てみると、「コミック」「パフォーミングアート*5」「ビジュアルアート」「音楽」が主なサブカテゴリのようである。パソコンユーザはこれらのことについて、携帯電話ユーザよりもググっているのだろうか?

  • なお他の研究によると、携帯電話では「アダルト」カテゴリが突出していたが、上図では「アダルト」カテゴリが存在しなかった。これはdmoz.orgのカテゴリに存在しないからであって、決して日本人がエロい言葉でググらないという訳ではないので注意してください。
  • ちなみにこのことを誤解して「日本人はエロい言葉でググらない」という解釈が広まっています。この前紹介した論文*6では「日本の携帯コンテンツ検索は成熟している *7」との見解がなされています。Googleの中の人はちゃんと論文読んでくださいね(`・ω・´)

*1:Ricardo BaezaYates, Georges Dupret, Javier Velasco. 2007 "A Study of Mobile Search Queries in Japan" Query Log Analysis: Social and Technological Challenges WWW 2007 [http://research.yahoo.com/pub/476:title=Yahoo!] [http://www.google.co.jp/search?hl=ja&safe=off&client=firefox-a&rls=org.mozilla%3Aja%3Aofficial&hs=NE2&q=%22A+Study+of+Mobile+Search+Queries+in+Japan%22&btnG=%E6%A4%9C%E7%B4%A2&lr=:title=Google Scholar]

*2:chasenで単語の切り分けを行っているので、例えば「愛の泉」ならば3語となるはずです。

*3:論文中ではRomaji,アルファベットのことだと思われます

*4:分類は"standard binomial language model"という手法を使用。これについてググったが詳細不明。論文中の参考文献は、 W. Bruce Croft and John Lafferty, editors. "Language Modeling for Information Retrieval" Kluwer Publishers, 2004.

*5:演劇、コスプレ、お笑い等

*6:Maryam Kamvar, Melanie Kellar, Rajan Patel, Ya Xu. 2009. "Computers and iPhones and Mobile Phones, oh my!" User Interfaces and Mobile Web. WWW 2009

*7:Japanese mobile search is considered to be a more mature market