2013年3月16日土曜日

ビッグデータ

今週もまた小さな研究発表を三つも聞いた。その中の二つはデジタル人文学に関連するもので、しかもいずれもいま流行のビッグデータを対象とするものだった。一つ目は、中世英文学に現われた魔女をめぐるものを対象としたデーターベースの開発であり、二つ目は、これまた近世の英文学における小説という概念の出現や同時代の他のジャンルとの関連をデータ的に数値分析を試みたものである。データを纏めてさらなる研究の基礎を作り上げる、あるいは新しいタイプのデータをフルに活用して特定の発見を求めるという、二つの発表は期せずして現時点のビッグデータ利用の違う可能性をかなり具体的に提示した。

いわゆるビッグデータというものは、かなりのスピードで脚光を浴びている。いうまでもなくそのようなデータが存在することを前提とするものである。そのようなデータがビッグだと言える理由の基本には、個人や小さなグループがいくらこつこつとやっていても拵えることのできそうもない規模のデータなのである。さらに言えば、そのようなデータは、自然に狭い意味で集められたものではなく、むしろ新聞、社会活動の記録、あるいはこれまで記録に残ったすべての古典文献といった、まとまった集まりをベースにするものである。そこで、そのようなデータの利用の仕方が、今時の研究者の関心事を集めた。具体的にいえば、そのようなデータが存在してはじめて可能となる課題が現われてくる。一方では、どんなテーマでも、データ自体がテーマより前に存在していたので、それを使えるように整理したり、それを使用するための手段を開発したり、データを見つめる立脚点を見つけ出したりして、切り込みの方法から工夫しなければならない。データの整理と、使用のプロセスの確立、この二つはとりあえず現時点でのデジタル人文学の大きな課題なのだろう。

英文学の話ばかり聞いてきて、思わず日本のことを振り返った。残念なことに、著作権やらさまざまな考慮が躊躇をもたらして、そのようなビッグデータの出現は著しく遅れている。あえて言えば、大きな図書館での古典文献のデジタル画像による公開が見られたことだろうか。古典文献を電子テキストにしたのは、わずかに国文学研究資料館の実践があるのみで、これからの課題だと言わなければならない。

大系本文データベース

0 件のコメント: