2011年2月21日月曜日

米国電子政府の科学情報検索サイトに連邦議会図書館「議会法案検索専門サイト」が追加された本当の意義


 




1月31日付けで手元に連邦議会図書館“Law Library of Congress”ブログから新情報が届いた。
初めはその意味が良く理解できなかったこともあり、そのまま放置していたのであるが、時間が出来たので改めて読み直してみた。内容自体は簡単な話であるが、一方「電子政府問題」として考えたとき、その重要性について認識したので参考までにやや詳しく紹介する。

この情報自体は、わが国では2月4日付けで独立行政法人科学技術振興機構(JST)が
「STI Updates 学術情報流通ニュース」で取上げている。基本的にはそこに書かれているとおりである(誤字(注1)は別にして)。しかし、実は米国連邦政府の電子政府の科学技術情報ポータルである“Science. gov”(注2)の歴史的なフォローがわが国における同様の問題を考える上で重要なことを再認識した。JSTの役割から考えても、このような観点から本格的に解説して欲しいと考えたが、その期待が満たされるにはなお時間がかかりそうである。

今回のブログは、このような観点から“Science.gov”の機能強化の歴史と同ポータルへの“THOMAS”機能の追加の意義等について筆者なりにまとめて簡単に説明するものである。

1.米国連邦電子政府サイトにおける“Science.gov”の基本的な役割
“Science.gov”は、連邦政府による科学情報と研究結果に関するゲートウェイウェブサイトである。
“Science.gov”は、14の連邦行政機関の18の科学分野研究機関が率先して取組む省庁横断的なゲートウェイである。これら連邦機関は同サイトを管理するため機関の協力による「共同同盟(Science.gov Alliance)」(注3)を組織化、役割分担している。

2008年9月に更新した第5世代(Science.gov 5.0)では次の主な特性と能力を備えた究極的といえる科学分野の検索サイトを実現している。(注4)
①1つの質問に対し、45以上の科学データベースにアクセス出来、2億ページにわたる科学分野情報にアクセスを可能とした。
②検索作業を支援するためユーザー入力による「副題」、「日付」での検索結果の集団化を実現した。
③検索用語に関連する“Wikipedia”の検索結果とリンクさせた。
④利用者が入力した検索用語に関係づけられた“EUREKA News”(注5)の結果を確認できるようにした。
(⑤以下は、一般的な内容なので省略する)

これらの連邦政府機関の多くは「CENDI」(注6)のメンバーである。“Explore Selected Science Websites by Topics”の部分はCENDIがメンテナンスしている。“Science.gov”ウェブサイトはテネシー州のオークリッジに本部を有する連邦エネルギー省科学技術情報局(OSTI)が担当し、また深層検索(deep Web Search)(注7)能力を提供する。

2.“Science.gov”の今日までの機能改良の経緯
(1)第一世代
2002年12月に連邦政府による初めての広く一般人がアクセスでき、政府が保有する科学・技術分野に関する広大な情報の一元的検索できるサービスが発足、稼動を開始した。
(2)第二世代
2004年5月に連邦政府科学検索に関するリアルタイムでの関連性の順位付け機能(real-time relevancy ranking)を導入した。この技術は連邦エネルギー省(DOE)により資金支援を受けたもので、一般市民が政府の保有する情報倉庫の内容を選別し、かつ利用者個人の要求を最も満たす結果を引き出すことを支援するものである。同時に、更なる検索機能(advanced search capability)やその他機能が追加された。
2005年2月には無料か使い勝手のよい「注意喚起情報メール提供」サービスを始めた。このサービスは、市民が自分が関心を持つ分野についての最新の科学開発情報が電子メールで受信できるサービスである。同サービスでは選択した情報源から最大25件の関連情報が送られてくる。注意喚起メールに添付された情報は個人化された保管ボックス(Archive)に6週間保管される。この保管庫サービスでは過去の利用実績が検証でき、また注意喚起して欲しい検索条件の編集の変更が随時可能である。

(3)第三世代
2005年11月に稼動したが、より精度が高いレベルの検索が可能となった。連邦科学データベースに対する質問が可能となり、加えて分野別検索が増強され、またユーザーによる広範囲なブール値(注8)を用いた検索方法が選択肢として追加された。

(4)第四世代
2007年2月、更なる洗練された検索質問サービスが導入された。初めて常連利用者は現データを検索することが可能となった。さらに関連結果の中で関連性の順位付けアルゴリズムは全文に対するランキングを可能として機能的にさらに洗練された。該当文書の日付は順位付け目的において優先された。また新機能として常連は仲間や友人と電子メールで検索結果を共有できるようになった。

3.今回の追加された内容の確認手順
(1)“science,gov”のポータルページを開く
(2)画面右上の“SCIENCE GOV WIDGET”NEWをクリックする。
(3) Science.gov Widgetの文中“authoritative U.S.government science information”をクリックする。
(4)“Federal Regulations and Legislation”に“NEW THOMAS,112th Congress”および“NEW THOMAS,111th Congress”が追加されている。


(注1)誤字の個所は2月4日付けSTI学術情報流通ニュースの「・・・現時点の検索対象は、第111回議会(2009-2010)と第12回議会(2011-2012)の法案。」で、第112回が正しい。ちなみに“Science.gov”の原文URLは、http://www.science.gov/thomas.html である。

(注2) 国立国会図書館の“Science.gov”の解説(2009年5月10日更新)は次のとおりである。
「米国連邦政府のポータルサイトFirst govの科学技術版で、政府系機関の有する文書、データベース、書誌情報などの信頼性の高いデータを対象に一元的な検索ができます。2002年12月に12省庁の17機関の相互協力により、Version.1が公開された後、2005年11月には現在のVersion.3にアップグレードされ、検索結果のランク付け手法やブール演算子による検索機能が改善されました。2006年3月時点で、28のデータベース、1,700以上のWebサイトの総計47,000,000ページ以上が検索対象となっています。」
しかし、本文で述べたとおりその内容はかなり古い。2000年に稼動開始した連邦政府の電子政府ポータル“First .gov.”は2007年1月に“USA.gov.”に名称が変わっており(国立国会図書館自身がこの件を報告している)、また“Science.gov”は2008年9月にバージョン5.0で新機能等が追加されている。1回の検索で、検索可能科学データベースは45で、総ページ数は2億ページ、リンクできる科学関係ウェブサイト数は計2,000以上となっている。(“Science.gov”の概要説明より抜粋)

(注3) 2008年09月16日付けSTI学術情報流通ニュースは次の内容を報じている。
「Science.govは、9月15日、サイエンスを強化し2億ページを検索するバージョン5.0を発表した。
第5.0版に搭載したのは、(1)7つの深層ウェブデータベース、(2)検索結果をサブトピックスや日付でグループ化し、必要な科学情報のみを探せるクラスタリング機能、(3)更新アラートサービス機能。
また、検索結果のeメール送信、個人用研究ファイルや引用ソフトウェアへのダウンロード、検索語に関するWiki最新情報の入手、検索語に関するEureka News最新版の閲覧が可能。」
最後に米国科学技術情報局 (Office of Scientific & Technical Information、OSTI)へのリンク情報を掲示している。
しかし、わが国でこの訳文だけを読んで具体的な内容が理解できる一般人はいかほどいるであろうか。STIの電子政府にかかる社会的な役割から見て、筆者がここで補足した程度の解説は都度実行して欲しいと考えるがいかがか。

(注4)わが国の“science .gov 5.0”の解説として、JST以外に独立行政法人 新エネルギー・産業技術総合開発機構(NEDO)も取上げている。説明内容はJSTに比べると各種の関係データを調べた結果がうかがえる。しかし、その内容において致命的なミスがある。1アクセスで検索できるページ数は2億ページである。200万ページではない。

(注5)“EUREKA”について補足しておく。
「ユーレカ・イニシャチブ(EUREKA)は参加国の企業と研究機関に対し、国境を越えて製品や工程技術やサービス等を開発するための市場志向の共同研究を行う道を開いている。ユーレカの目的は、欧州に存在する専門家人材やノウハウや研究施設及び資金を束ね、それを通じて先端技術に基礎をおいた製品や製造技術を開発し欧州産業の国際競争力を強化するために貢献することである。ユーレカは1985 年フランスの提案によりパリで開催された欧州理事会で設立が決定されているからEU フレームワークプログラムとほとんど同時に活動を開始している。
ユーレカは設立後EU と西欧の枠を越えた多数国の協力による共同研究開発活動として発展してきた。その特徴を示すキーワードは、市場性のある成果志向、企業参加者が研究の主体となり大学等科学基盤の能力を活用、企業ニーズを反映した研究テーマ提案のボトムアップ方式、柔軟な運営体制、研究資金が参加者の属する政府やEU からの補助金あるいは自費などである。」(2003年8月ジェトロ「EU の産業技術開発政策の動向」から一部(38ページ以下)抜粋)
“EUREKA”の具体的な活動内容については、 “EUREKA”のHP を参照されたい。

(注6)“CENDI”は,以下述べる14の米国連邦政府機関の科学技術情報担当シニア・マネージャーによる省庁間グループである。省庁別の専門図書館や情報局など12の機関が参加しており,連携や情報交換を通じて単独での活動よりも大きな力を発揮することに加え,効果的な科学技術情報の提供によって米国の科学技術プログラムを支援することを目的としている。1985年,4機関の覚書によって設立され,その後,順次他の機関が参加した。前身は1960年代初頭に設置された科学技術情報委員会(COSATI)にさかのぼる。定期的な運営会議,事務局を持ち,議会への働きかけなどを行うほか,著作権と知的所有権,科学技術情報政策,科学技術情報ポータルscience.govの運営などの5つのワーキンググループが活動している(独立行政法人 科学技術振興機構(JST)の解説から抜粋のうえ、“CENDI”のHP の内容に則して修正した。)
①国防総省・国防技術情報センター(DOD:defense Technical Information center)
②連邦環境保護庁・研究開発および環境情報局(EPA:Office of Environmental Information:OEI)
③政府印刷局(Government Printing Office)
④連邦議会図書館
NASA米国科学技術情報局(NASA Scientific and Technical Information Program)
⑥連邦農業省・国立農業図書館(National Agricultural Library)
国立公文書館(National Archives and Record Administration)
⑧連邦教育省・国立教育図書館(National Library of Education)
⑨連邦保健福祉省・国立医学図書館(National Library of Medicine)
全米科学財団(National Science Foundation)
⑪連邦商務省・技術情報局(National Technical Information Service)
⑫連邦運輸省・国立運輸図書館(National Transportation Library)
⑬連邦エネルギー省・科学技術情報局
⑭内務省・地質調査所(USGS/Biological Resources Discipline)

(注7)“deep Web Search”の具体的なアクセス方法は http://deepwebtech.com/で確認できる。

(注8) “Boolean capability”は論理演算の「真偽値」をいう。複雑な式が真になるか偽になるか判断することをブーリアン演算(論理演算)と呼ぶ。コンピュータの扱う処理や計算の多くは、最終的に論理演算に変換されて実行される。身近な例では、データベースサーチエンジンに複雑な検索を行わせる時に使われている。(Wikipedia から引用)

********************************************************
Copyright © 2006-2011 星野英二(Eiji Hoshino).All Rights Reserved.You may reproduce materials available at this site for your own personal use and for non-commercial distribution.

0 件のコメント: