2016年7月30日土曜日

システムを訓練する

数週間まえ、変体仮名の解読をサポートするユニークなサーチエンジンが公開され、古典へのアクセス、とりわけデジタル化された日本の古典籍の利用、活用に関心をもつ人々の中で少なからずのインパクトが走った。サーチエンジンの仕組みは、「ディープラーニングに基づいた字母の認識」であり、いわゆる深層学習を真正面から古典文字の読解に応用したものである。

システムの解説において、製作者は簡潔にオリジナルデータの由来とその使用に触れた。それを一読して、言いようのない新鮮感に心を打たれた。それは、製作者がなにげなく用いた「訓練」という一語に凝縮される。曰く、「ニューラルネットワークの訓練データ」、「約8,800画像の一部をベースとして訓練を行い」、そして、「当システムが学習していない漢字等」、云々。このような立場は、デジタル技術を驚いて眺めていたり、ひいてはいまだにパソコンに使わされていて苦労を嘆く人々には、とても思いつかない。新しいシステムには、まるで人格のようなものを与え、それと平等に付き合い、認識や処理の作業を分担してもらっている。

訓練を経て変体仮名の読解をものにしたシステムは、したがって肝心の変体仮名の知識についてシステム製作者に頼っていなかった。言い換えれば、製作者は、この特定のテーマについて、これまで貯蓄されてきた人間の知識を惜しみなくシステムに与え、覚えさせ、その上、そのような知識を持たない個々人に戻してもらう。記録や伝播に続くもう一つのデジタルのあり方をここに見たような思がする。

変体仮名の画像認識システム(α版)

2016年7月23日土曜日

デジタル・古典研究

明日から荷造りを始め、来週の前半には日本への短い渡航が予定されている。今度の目的は、国文学研究資料館主催の「大規模学術フロンティア促進事業」第二回国際集会への参加であり、一時間の報告枠をいただき、「デジタル時代と古典研究」をテーマとする発表をさせてもらうことになっている。

いまさらながら、大きなタイトルを付けてしまったものだと、勇気あると言うか、無謀としか言いようがないと感じる。そして、なによりも、このデジタル時代というものは、まるで生き物のように、どんどん変容し、進化する。一例として、今度は「くずし字」をめぐる諸研究を持ち出して議論を試みようと考えた。そもそもここ一、二年の間にこれへの関心がどんどん加熱し、鮮やかなアプローチが競うように現れた分野だから、これに注目したのだ。ただ、それにしてもたとえばあの「変体仮名の画像認識システム(α版)」の登場、そして「国文研データセット簡易Web閲覧」の迅速な対応など、次から次へとの展開には、目を瞠るようなものがあった。発表資料を一通り準備出来たあとになって、急いで対応し、しかも配布資料のレイアウトという単純な理由から、すでに用意した内容を割愛せざるをえない結果まで生まれた。

今度の集会は、聴講自由だけではなく、インターネットでのライブ放送まで予定されている。研究発表のオンライン放送は、これまでに何回か経験し、自分で主催する行事でも試みたことがある。ただ、いずれの場合もさほどの参加者は得られていなかった。今度はいかがだろうか。関心のある方々、ぜひ時間を見つけて覗いてください。

日本古典籍への挑戦―知の創造に向けて―

2016年7月16日土曜日

漢籍リポジトリ

ますます大きな規模のデジタルデータ公開が続き、古典研究を含むさまざまな分野においてその基盤がすこしずつ整い、オリジナルデータを整理したり、異なる次元の情報を付け加えたりするような課題は、つぎからつぎへと具体的になってきた。デジタル環境におけるつぎなる大きなうねりを迎えようとして、基本となる方法論を見定めることが要求されてくる。その一例として、今年三月から公開した「漢籍リポジトリ」の紹介文は、たいへん興味深い。

中国の古典籍を対象とするこの大きなリソースは、四庫全書のような底本を頼りにしつつ、デジタル環境でのテキストの未来形を探ろうとしている。そこで、いわゆる古典のありかたをめぐり、文献学的に理路整然と述べている。そこで使われている中心的なコンセプトは、つぎの四つのレベルに別れるものだ。いわく、著作、表現形、体現形、個別資料。かつて軍記ものをテーマに過ごした学生時代のことを思い出しながら、「平家物語」のありかたに添って上記の概念を説明するとなれば、「平家物語」とは著作、覚一本とは表現形、日本古典文学大系に収録されたのは体現形、そして架蔵の1976年第19刷の二冊は個別資料である。四つのレベルにあるこのような概念とその相互関係は、いたって明晰にして分かりやすい。ただ、文献学を体系的に勉強していないので、この四つの用語は、はたして十分に共有されているかどうか、にわかに答えを知らない。

あらためて紹介文を読みなおして、そのタイトルに「デジタル文献学」と大きく名乗っていることに気づく。デジタル時代の必要に応じての文献学、言い換えればデジタル環境の必要に備えての関連概念の整理だという理解も成り立つことだろう。そうなれば、デジタル環境の確立は、在来の文献学のさらなる発展に直接に繋がるという側面も、見逃してはならないだろう。

デジタル文献学が漢籍と出会う

2016年7月9日土曜日

サイドサドル

この街には年に一度の大きなお祭りがある。スタンピードという名前のロデオだ。それの開幕を宣言するのは、ダウンタウン中心を練り歩くパレードだ。今年のそれは、七百を超えるグループを数え、延々と二、三時間も続いた。好天に恵まれ、ついカメラを引っ掛けて見物に出かけてきた。

パレードは、さまざまな団体や会社によって各自に演出されるもので、言葉通りの多種多彩だった。手作り感溢れる幼稚で素朴なものを微笑ましい思いで眺めてみたら、そのつぎには長い列を成す軍人が闊歩し、りっぱな戦車が暴れだす。なんとも楽しい。その中には、まったく予知せず、知識ゼロのものも現われたりして、意外と知的な刺激を覚えたものもあった。例えば右の写真。颯爽とした美人の乗馬姿に感嘆して眺めたら、体を捻って左側に向かって馬上に座ったのを確認して、あっけに取られた。なにかの一時の戯れとしか思えなかった。しかしながら、同じグループのメンバーたちを見れば、女性たちは全員この乗り方をしていて、しかもいずれも古風な身なりをしていて、いかにもエレガント。これにはきっとしっかりした伝統に則っているものだと気づいた。調べて見ればたしかにその通りだ。古い記述は古代ギリシアの文献まで遡り、しかも現代ではイギリスの女王がこの格好をした写真がウェキペディアに掲載されている。通称は「サイドサドル」、この乗り方と、これのための鞍の両方を指す用語である。

ちなみに「サイドサドル」にたどり着くまでの経過を記しておきたい。この乗り方はきっとヨーロッパ的なものだと予想し、英語で「乗馬の姿勢、両足を同じ側」と漠然した言葉を入れてネット検索したら、一発でこの用語がヒットされた。一方では、同じ言葉を日本語で入れると、とても同じ結果には繋がらない。曖昧検索の実力と、言葉の違い、この二つのことを具体的に示した得難い実例だった。


2016年7月2日土曜日

ワッショイワッショイ

七月一日はカナダ・ディ。国の祝日であり、各地でさまざまな行事が取り行われた。気候が申し分ないこともあり、ちょっとだけ足を伸ばして、近くの温泉観光地に日帰りで行ってきた。地元の人や観光客が大勢集まり、ささやかなパレード、それから真夜中近くまで続く花火大会など、言葉通りの休日を楽しんだ。

パレードの先頭には、市長を載せたオープンカーとりっぱなバンドに続き、「日本人会」と名乗る浴衣姿の人々が一番乗りだった。同じグループによる行列は、ちょうど六年前にも目にしたことがあって、あの時の花によるお神輿は今年も同じく担ぎだされた。それに加えて、お神輿の数はさらに増え、右の写真のように、手作り感が溢れるものも登場した。「ワッショイ、ワッショイ」の掛け声は、たしかにお祭りそのものだが、巨大な折り鶴を鎮座させたことには、さすがに自由な想像力が伺われる。アニメや漫画とはまた違う、もう一つの日本像が隠されたような思いに、一瞬胸が打たれた。

カナダ・ディに限り、人々は口々に「Happy Canada Day」と挨拶を交わす。個人の誕生日やお正月なら、すなおに「おめでとう」と訳すものだが、これの場合、はたしてどのような日本語に置き換えるべきものかと、ちらっと困惑した。花火の最後の一発が空に消えたあと、数えきれない若者たちは、誰からともなく一斉に「オー・カナダ」を歌いあげた。これまたいかにもカナダらしい一時だった。