TOP > 『図書館界』 > 51巻 > 5号 >

《コラム http://wwwsoc.nacsis.ac.jp/nal/》
『図書館界』51巻5号 (January 2000)

電子図書館とネットワーク情報資源

渡邊 隆弘

電子図書館と一口にいっても,出版される電子資料の提供や所蔵資料の電子化など,様々な機能・要素が考えられるが,そのうちの一つにネットワーク情報資源を組織化してその水先案内人を目指す方向性がある。少なくとも大学図書館や専門図書館の利用者の多くにとっては,WWWサイトを中心としたネットワーク情報資源は既に必要欠くべからざる情報源となっており,図書館が資料と利用者を結びつけるという使命を果たそうとすれば,これを無視することはできない。

1999年は,東京工業大学電子図書館(TDL http://tdl.libra.titech.ac.jp)における「理工学系ネットワークリソース検索」,図書館情報大学ディジタル図書館(http://lib.ulis.ac.jp/)における「メタデータ検索」,東京大学情報基盤センターにおける「インターネット学術情報インデックス(IRI)」(http://resource.lib.u-tokyo.ac.jp/iri/url_search.cgi),といった注目すべきプロジェクトがいくつも実運用を開始した年であった。

WWW情報空間における組織化の営みといえば,「リンク集」と「サーチエンジン」があげられる。WWWページの一つのスタイルともなっている「リンク集」は,規模も運営主体も様々なものが星の数ほどあるが,すぐれたリンク集はネットワーク上の道標として非常に有用性の高いものである。一方,網羅的な情報収集を主眼とするサーチエンジンも,情報量の爆発的な増大とともに欠かせない存在となっている。分類によるアクセスを中心とするもの(ディレクトリ型)は人海戦術による登録を行うが,キーワード検索に徹したものは通常「インデクシングロボット」と呼ばれるプログラムで情報を収集する(ロボット型)。これは,WWWページ間のリンクをたどって芋蔓式にページ内容を収集し続けるプログラムである。

相次いで動き出した東工大,図情大,東大のシステムは,いずれもネットワーク上の学術情報リソースを集めた検索サービスである。網羅的に情報収集を行うロボット型のサーチエンジンでは,どうしても玉石混淆となり,特に学術情報のみを検索したい場合にはロスが大きいという問題が根底にある。対象範囲は,東工大が理工学全般,図情大が図書館情報学,東大が全分野となっており,いずれも人手による収集・登録作業が行われている(図情大はロボット収集の結果を人手の篩にかけている)。メタデータ(目録情報)記述には,3機関ともDublin Core(インターネット情報資源の記述を主目的とする「コア・メ タデータ」)をベースとしており,主題情報や内容記述(概要)の入力も行われている。継続的な情報の収集・登録が非常に大変な作業なのは明らかだが,一貫した方針と形式によって作成されたメタデータの蓄積は貴重で,今後の発展を期待したい。ただし,広領域の情報源を1図書館が担うのは無理があり,収集面での図書館間協力が必要だと思われる。

一方,ロボット収集を利用して低コストで一定品質の検索サービスを模索する動きもある。リンクは関連サイトに対して行われているのだから,適切な「起点」からロボットを動かして適当な時点で収集を終了すれば,ある程度関連するWWWページをまとめて収集できるという発想である。先行例もいくつかあるが,筆者の勤務する神戸大学では,1999年に「阪神大震災関連」と「大学内サーバ」の2種類のサービスを開始した(http://titan.lib.kobe-u.ac.jp)。特定テーマに限ることで検索精度が増し,また小回りのきく分更新頻度を上げられると考えてのスタートであった。収集面にまだ問題点を抱えており(特に震災関連のように主題で制約した自動収集はなかなか難しい)試行錯誤の段階であるが,なお努力して精度と再現率を高めていきたいと考えている。

以上,新たな検索サービスの動きについて述べてきたが,図書館とネットワーク情報資源との関わりでは,今後ネットワーク情報の保存(アーカイブ)も大きな問題になっていくと思われる。そうした点も含めて新たな情報サービスを発展させていきたいと考える。

(わたなべ たかひろ 神戸大学附属図書館)