2016年7月30日土曜日

システムを訓練する

数週間まえ、変体仮名の解読をサポートするユニークなサーチエンジンが公開され、古典へのアクセス、とりわけデジタル化された日本の古典籍の利用、活用に関心をもつ人々の中で少なからずのインパクトが走った。サーチエンジンの仕組みは、「ディープラーニングに基づいた字母の認識」であり、いわゆる深層学習を真正面から古典文字の読解に応用したものである。

システムの解説において、製作者は簡潔にオリジナルデータの由来とその使用に触れた。それを一読して、言いようのない新鮮感に心を打たれた。それは、製作者がなにげなく用いた「訓練」という一語に凝縮される。曰く、「ニューラルネットワークの訓練データ」、「約8,800画像の一部をベースとして訓練を行い」、そして、「当システムが学習していない漢字等」、云々。このような立場は、デジタル技術を驚いて眺めていたり、ひいてはいまだにパソコンに使わされていて苦労を嘆く人々には、とても思いつかない。新しいシステムには、まるで人格のようなものを与え、それと平等に付き合い、認識や処理の作業を分担してもらっている。

訓練を経て変体仮名の読解をものにしたシステムは、したがって肝心の変体仮名の知識についてシステム製作者に頼っていなかった。言い換えれば、製作者は、この特定のテーマについて、これまで貯蓄されてきた人間の知識を惜しみなくシステムに与え、覚えさせ、その上、そのような知識を持たない個々人に戻してもらう。記録や伝播に続くもう一つのデジタルのあり方をここに見たような思がする。

変体仮名の画像認識システム(α版)

0 件のコメント: