2009年5月12日火曜日

注目の新検索エンジン“WolframAlpha”データ版の客観的評価について

 
 最近わが国のブログで紹介され始めた話題(筆者注1)で、5月18日にサービス開始する“WolframAlpha”と“Google” はどちらが検索エンジンとして機能面等で優れているか、また“Google”の世界戦略はどのような影響を受けるのかといった問題につき各方面から解説が行われている。
 5月11日に筆者に届いたドイツのメディア“SIEGEL ONLINE”(国際版)を読んでみると、ドイツらしいロジカルかつ辛口の記事が目に留まったので紹介する。Google自体話題性の多い企業であること(米国型企業戦略でもある)は言うまでもないが、“SPIGEL”が比較において使用した項目は単にわが国等関係者が従来指摘している以上に重要な視点が含まれているという判断から専門外ではあるが、あえてとりあげるものである。
 なお、“SPIGEL”の記事では10項目に分けて比較等を行っているが、そのうち主要な7項目のみ取り上げる。

1.“WolframAlpha”の開発者の本当の開発目的は何か
米国の理論物理学者兼実業家Stephen Wolfram (筆者注2)が開発した検索エンジン“WolframAlpha”は、“ Google の 殺し屋”ではない。また検索エンジン機能だけでもない。「コンピュータ自身による知識エンジン(computational knowledge engine)」すなわち彼自身が自ら主張する「コンピュータの使用とウェブのための新しい理論的枠組み(a new paradigm for the use of computers and the Web)」である。その最終的な目標はコンピュータの先駆者が1950年代に指摘した約束(コンピュータ自身が質問し答えを出させる)の達成である。彼は数学パッケージソフトウェア“Mathematica”を開発した。同ソフトは、統計学者、科学者や数学者が課すあらゆる数学上の普遍的問題解決ツールである。同プログラムは膨大な処理能力を必要とするため、いくつかのコンピュータ雑誌がPCの容量と能力をテストするのに利用するほどである。
 “WolframAlpha”の「回答マシン」は理論上“Google”と同じかまたはより以上のことをなしうるのか、SPEAGELは①選挙結果、②会社の売上高、③テレビの視聴率、④オリンピックのメダル数等をテストしてどのくらいの事柄を導き出せるか確認を行った。

2.政冶特に選挙に関する検索結果
 “presidential election 2008 results”と質問してみた。答は「あなたの入力内容が理解できません」であった。次に“presidential election”で検索してみたが、失敗であった。さらに“election”で検索した結果、最終的に説明がなされた。なお、“Government”で検索したところ、答は「この話題は調査中です」と言う不可解なメッセージが出た。一方、“Google”で最初の質問をしたとこころCNNの選挙の概要ページにリンクした。またGoogleは全米および州単位の選挙結果も直接リンクできた。
 “WolframAlpha”の残念な検索結果として、次のようなものが見られた。
①”Democratic Party?”・・・まだ記録されていません。
②“CDU”(ドイツの中道右派党のキリスト教民主同盟)・・・Camden Airport in Australiaが答であった(それも地元の現在の天気情報付)(筆者注3)
③“New York crime rate?”・・・結果がありません。
④“Mew York mayor?”・・・・知りません。一方、“Google” は市長Michael Bloombergの公式サイトにリンクする。
ドイツ語での質問に答がないという点を差し引いても米国の州や世界の国々の選挙結果やデータベースへのアクセスは必要であろう。さらに“WolframAlpha”の欠点は詳細な国のプロフィールや誰が現在の政治の指導者等について答えを持たない点である。

3.うかがわし統計データ
 “WolframAlpha”は、個別国について非常に詳しい情報が提供できる。例えば「ドイツ」で検索するとキロで表示される隣国との国境線の距離や10大都市(人口統計も含む)が引き出される。
他方で疑わし統計の例もある。ドイツ語の文化圏に関する記述で次のような意味不明の記述がある。
①German 96% ②Upper Saxon(筆者注4) 2.6% ③Kölsh 0.31% ④Polish 0.31%
パーセントはなにを意味するのか、相互の関連について説明がない。また、ポーランド語はドイツの方言なのか。
 一方、“Google” で“Germany”を入力すると最初にWikipediaの記事にリンクする。
“WolframAlpha”の特徴的な点は、同時に2,3の異なる国を探せる能力である。「米国対中国」「米国対中国対ドイツ対ロシア」と入力すると独自に複数国間に関連するすべての有効データを独自につくりあげた結果ページを提供する。閲覧者は一目でどの国の失業率が最も高いか、市民の平均寿命が最も低いか等を知ることができる。“Google”にはそれに匹敵するものはない。
 さらに“WolframAlpha”は同様な方法で複数の都市を比較する。ハンブルグとサンフランシスコを入力すると単に人口統計の比較だけでなく、両都市間の飛行時間や現地時間の時差等を説明する。

4.“WolframAlpha”のとりわけ得意分野(経済比較、ただし情報源は疑問)
 明確に定義された変数の比較に関して、“WolframAlpha”は輝いて見える。「ノキアとモトローラ」の入力により収益や従業員数の比較が直接できる。“Google”で同じことを行ってみる。最初の答は2006年のブログで「誰がボスですか」である。
 “WolframAlpha”は様々な米国の新聞の循環統計(circulation statistics)を比較してみることは可能である。米国資本の日刊紙「ニューヨーク・ヨークタイムズ」「ウォールストリートジャーナル」「ワシントンポスト」「ロスアンゼルスタイムズ」等の比較データを見る限り最も低いランクといえる。時間枠のなかでの正確な情報がなくなっており、ジャ―ナリステックや科学的目的から見ると無用な内容である。また個々の刊行物に示された循環統計を表示することができるが、役にたつ時間的要素が放置されている。
 同様の比較に関しテレビチャンネルの視聴率の比較はできない。“CNN VS CBS(TV)”で検索してみた。“CNN”は英国の不動産会社“Caledonian Trust”とされた。
 経済問題についてさらに検索してみた。“Germany import value vs export value”と入力すると実際2つの結果が出て来た。しかし、輸出額は2007年推定値であり輸入の額は添付されていない。ちなみに米国の同様のデータを検索したが同じ結果であった。

5.コンピュータの比較結果(Macsは潤滑油(Lubricans)?)
 インターネットと技術に関する質問で“Google”と “WolframAlpha”の相違点がより明らかになる。
“WolframAlpha”で“Microsoft”と“Google”と入力すると両社の財務データの詳細を回答するとともに市場業績(market performance)を追跡する。“Google”の検索メカニズムは直接自社のホームページに質問を向ける。
 “Google”のPC市場おけるMacsの割合やアップル・コンピュータの販売台数の検索結果はテレビコマーシャルや顧客調査を含む娯楽面等の圧倒的豊富さを述べた。一方、“WolframAlpha”ではこれらについての確定的な情報が得られないし、さらに“Macs”について技術潤滑油の1タイプである「増殖アルキレート・シクロペタン(multiply alkylated cyclopetemtences)」の略語として、その要素に関する物理的データを提供するのである。この答自身は正しいが、質問に対する答としては誤りである。
 しかしながら、コンピュータ装置に関する”Bits”“Bytes”“Mebibytes”“Gibibytes”について、“WolframAlpha”はトップページにある。“Google”はまずWikipediaの記事をリストあげて各単位の要約にリンクしていく。

6.科学(アスピリンに関するすべて)
 “WolframAlpha”は科学的質問にはあざやかにかつ時間をかけずに答える。水の屈折率(refractive index:光学特性 )について正しい数値(1.333)を選択する。一方、“Google”は同じ用語について78万1,000以上のウェブサイトにリンクする。従って“Google”の場合は屈折率の要素の検索にあたり冒頭でユーザーは「水に関する数値」を求めていることを明確化する必要がある。水の濃度に関する検索について同様の表が表示される。“WolframAlpha”は数値(numerical value)だけでなく他のユニット-人体の水の濃度や相関図(phase diagram)と同様にいくつかの比較を踏まえ-のリストも提供する。この場合、“Google”はWikipediaを当てにしないが、最初の入力により英語の変換表に変わる。
 また、“WolframAlpha”のサイトは水の濃度だけでなくアンシュタインの有名な「質量・エネルギー等価方程式(Theory of mass-energy equivalence)e=mc²」も説明する。
 しかし、一方で“WolframAlpha”にも問題がある。薬品“aspirin”で検索すると十分な長い説明の後に、分子構造の空間モデル(Spatial model of the molecular structure)について科学的、構造的な公式にもとづきよく説明されている。しかし、唯一の問題はこの説明は一体何のためであろうかと言う疑問である。
 “Google”は、Wikipediaにリンクするだけでなく薬品製品の公式サイトに直接リンクできる。

7.結論(デザインには強いがデータベースとしては弱い)
 デモにおいて“WolframAlpha”は非常に印象的な方法で情報を提供する。検索エンジンは更なる情報を作るためにデータの増殖することができる。例えば複数の国の簡単な入力から統計的な比較データを作ることができるが、これは現在“Google”やその他の検索エンジンではできないことである。しかし、現行のベータ版はこの点をほとんど生かしきれていない。既存のデータベースに必要とするデータがあるときのみうまく行くのである。例えば、米国のテレビ局の視聴率について検索エンジン自体が正しく意味を理解していないのである。
  他方、“WolframAlp”は科学者に対し他の科学者のためのツールとなることが感じられる。実際、秘術面や科学に関する質問に対しすばらしい詳細な答が返ってくる。他方、前述したとおり政冶、経済や文化面の内容等多くの課題もあるが作成者は別の観点に重点を置いているようにも思える。
  いずれにせよ検索エンジンとして見た場合、“WolframAlp”は例えばドイツ語で入力された場合等なぜとんでもない答えを引き出してくるかについて説明ができないことは多くの点で課題でもある。非常によくできたソフトウェアではあるが、日常的に利用するものとしてはなお改善すべき方策があろう。


(筆者注1)ビジュアルかつ事業戦略面から紹介しているブログとしては、5月11日付“WIRED VISION”サイト“Internet Watch”があげられよう。なお、偶然にも“WIRED VISION”のサイトで紹介されているStephen Wolfram氏が米国ハーバード大学バークマン・センターで行った専門家向け講演「Computational Knowledge Engine」の内容は面白い(YouTube でデモ・質疑応答を含む講演内容(1時間45分)を見ることが可)。筆者は同センターのプロジェクト“The Center for Citizen Media”のディスカッション・メンバーであるが、同氏のスピーチの件は知らなかった。

(筆者注2)Stephen Wolfram氏は、日本語版Wikipedeia等でも紹介されているとおり米国Wolfram Researchの創設者(CEO)でありかつ天才的な理論物理学者である。数学パッケージソフト“Mathematica”の開発を1986年に行っている。

(筆者注3)筆者も自らGoogleで“CDU”を調べてみた。日本語のWikipediaの説明の少し後に“Christlich-Demokratische Union Deutschlands;CDU”のホームページが出てくる。

(筆者注4)“Upper Saxon”はドイツ語で北ザクセン語のことである。また“Kölsh”はケルン語である。

(筆者注5) SPEGELのサイトが引用しているアンシュタインの「質量・エネルギー保存則(E=mc²)」について関心の有る方はWikipediaで確認してほしい。


〔参照URL〕
http://www.spiegel.de/international/zeitgeist/0,1518,624065,00.html#ref=nlint

Copyright (c)2006-2009 福田平冶 All Rights Reserved.

0 件のコメント: