MediaLab Love Chapter 2

Assistance of MediaLab Love about Javascript test and more...

WWW2009開催記念 Google論文で見るiPhoneユーザの特徴

開催記念と言っても先週で全て終わってしまいましたが、おもしろそうな論文を見つけたので紹介します。
GoogleとStanfordの方が書いた, "Computers and iPhones and Mobile Phones, oh my!" *1という論文です。この論文ではGoogleの検索ログを元に、アクセス元をパソコン、iPhone、普通の携帯電話の3つに分けそれぞれの特徴を議論するというものです。但し、アメリカ国内からのアクセスに限定してあります。
論文を不正確さを承知で一言でまとめると
iPhoneユーザはパソコンと同じようにググっている」
となります。もっと言うと、iPhoneユーザのググり方は携帯電話のそれよりもパソコンのそれに近い、といえるでしょう。
分からないところも多々あったので概要だけ記すと、

  • 検索クエリの語数、文字数ともにパソコンもiPhoneも差がない。携帯電話は少し落ちる。*2
  • 検索している単語をカテゴリ別に分け、それらを占める割合を見る。パソコンとiPhoneで比較すると、「コンピュータと電子」では2%程iPhoneが低い、「エンターテインメント」「地域」「食べ物飲み物」「スポーツ」「通信」では2%程iPhoneが高い。
  • パソコンと携帯電話では「コンピュータと電子」が5%程、「社会」は2%程携帯電話が低い。「インターネット」「オンラインコミュニティー」「通信」は5%程携帯電話が高い。「アダルト」カテゴリーが突出していて、11.6%携帯電話の方が高い*3
  • 検索クエリのばらつきは、パソコンもiPhoneも同程度。携帯電話が他の2つに比べてばらついていない(つまり、同じような検索語を使用している)。
  • 1セッション*4あたりの検索クエリ数はどれも変わらない。
  • Googleをよく使うユーザ*5の、35日間のセッション数はパソコンが18.10で圧倒的に多く、iPhoneが8.06、Mobileが5.79である。
  • さらにクエリのばらつきを見るためにentro-percentを定義*6。先ほどと同じようにばらつきが高いパソコンとiPhoneが、entro-percentも高く、ばらつきの低い携帯電話は、entro-percentも低いです*7
  • Googleをあまり使わないユーザ*8がそれぞれを占める割合は、パソコンが29.4%, iPhoneは22.89%, 携帯電話が42.6%だった。

*1:Maryam Kamvar, Melanie Kellar, Rajan Patel, Ya Xu. 2009. "Computers and iPhones and Mobile Phones, oh my!" User Interfaces and Mobile Web. WWW 2009

*2:平均値と中央値でp<0.0001の信頼性

*3:これは先行論文でも同様のようです。この論文と同じ著者の書かれた論文をご覧ください。Maryam Kamvar, Shumeet Baluja. 2006. "Large Scale Study of Wireless Search Behavior: Google Mobile Search" CHI 2006. 701-709 [http://scholar.google.co.jp/scholar?hl=ja&lr=&safe=off&q=%22A+Large+Scale+Study+of+Wireless+Search+Behavior%3A+Google+Mobile+Search%22&btnG=%E6%A4%9C%E7%B4%A2&lr=:title=Google Scholar]

*4:5分間操作をしなかった場合、1セッションが切れるとした。詳しくは Craig Silverstein, Monika Henzinger. 1999. "Analysis of a Very Large Web Search Engine Query Log" SIGIR Forum, Vol. 33 No. 1 pp. 6-12. [http://scholar.google.co.jp/scholar?q=%22Analysis+of+a+Very+Large+Web+Search+Engine+Query+Log%22&hl=ja&lr=&btnG=%E6%A4%9C%E7%B4%A2&lr=:title=Google Scholar](私は未確認です)

*5:35日間で、10task以上。taskという言葉が理解できませんでした。

*6:平均情報量(エントロピー)を発展させたものだと思うのですが、式の分母が理解できませんでした。

*7:これらの解釈は平均情報量に則ったものです。

*8:35日間で、1taskのみ。