2017年4月30日日曜日

文字化け

いまさらすぐには信じられないことだが、個人サイトには、突然文字化けが起こった。いくつかの纏めて作ったセットは一斉に読めなくなり、すっかり慌てた。一通り対応は出来たが、環境について大いに考えさせられる経験となり、とりあえず経緯だけここに書き留めておく。

まず妙な現象はこうだ。文字化けで一文字も読めない。これまでならブラウザの文字コードを調整すれば簡単に戻ってくるものだが、今度はどうも全然違う。そもそも文字コードを調整する機能そのものはブラウザから消えてしまった。どこに原因があるかと、違うブラウザ、違うOS、違うデバイスなど、順番に試してみたのだが、なんとどれも結果は同じだ。調べたら、ブラウザ側の公式見解としては、文字コードに関しての自動識別が十分できるようになったので、利用されない機能として削除されたとか。読めないならページの作者に変えるように要求するという、じつに理不尽なものだ。現にいままで識別できたものが出来ていないのだから、ページ作者の責任だと言われても困る。しかしそのような文句が通じる事情でもないので、自分で対応せざるをえない。

答えに辿りつくまでは、言葉通りの手探りで、苦労した。読めないページの中身を覗いたら、文字セットについて「charset=shift_jis」と指定してある。これをどうやら「utf-8」にすべきようだが、手動で変えても解決はできない。くりかえし試した結果、FrontPageでページプロパティを開き、言語のところで「utf-8」と指定すれば、奇跡的に文字が戻ってきた。ほっとすると同時に、仕事の量に嘆く。とりあえずは、気づいたセットになっているもので、数百のもののやり直しをせざるをえない。いまだこの単純な作業を黙々と続いている。

たしかにもうすこしサイト構築の知識があれば、まとまりのあるファイルの管理をすべて一元化し、そこから全体を仕切るべきだという理屈は分かる。百単位でファイルを作っていて、かつすこしずつ増やしていくような作業では、そのような対応はついつい手抜きになった。自分が反省しなければならない。しかしながら、はっきりと指定してある文字コードでも、ある日とつぜん読めなくなったといったような環境の変化は、どう考えても解せない。末恐ろしい。

2017年4月22日土曜日

陣中の露店

屏風絵の読み方というようなものはきっとあると思う。ただ、なかなか分からない。たしかに絵巻の流れを汲み、場合によっては絵巻そのものの構図までこっそり拝借したような作品まで作成されていた(「保元平治物語屏風」「帝鑑図・咸陽宮図屏風」など)。ただやはり特殊な作例にすぎない。対して名所絵、合戦絵などとなれば、はっきりした物語が添えられていない分、どうしてもとっつきにくい。

たとえばつぎの一コマである。「大阪冬の陣図屏風」(大阪城天守閣蔵)右隻一扇に描かれ、「陣中の露店」とでも名付けてよかろう。陣笠を被り、胴丸や鎧を纏い、太刀や槍を構えた若武者たちは、戦場を走り回るそのままの格好である。一方、そのような彼らを相手に熟練にあしらえているのは、余裕綽々の店主であり、後ろに張り巡らした幕により、専用の空間が作り出されている。しかも店と客との関係を強調しようと、わざわざ値を払う様子がクローズアップされ、一種の貨幣経済の様態まで活写されている。特定のストーリがない中、絵画表現は饒舌なほど状況の詳細を伝えようと訴えている。

しかしながら、このような構図をもって、大阪の陣の様子をそのまま理解してはたして構わないだろうか。「今昔物語」に収められた蛇の肉を太刀帯に売り歩くあのエピソードはすぐに思い出される。ただ、万人単位に集まった戦場において、このような状況の存在はあまりにも想像できない。はたして日常と非日常が融合された戦場風景の極致だろうか、はたまた絵をもって虚構された理想あるいは遊びの空言だろうか。

2017年4月15日土曜日

日本古典籍総合目録DB

年度終わりに合わせて、一つの小さなプロジェクトを完了させ、最後の作業として数十点の絵巻についての書誌データを整理した。これには、国文学研究資料館が運営している「日本古典籍総合目録DB」がなによりも頼もしい。日進月歩に進化するデジタル情報にまで一部対応しているのだから、一研究者としては、つねに感謝の念を抱いている。一方では、利用すれば不備などにも気づくようになるもので、備忘に三点ほど記しておきたい。

書名などの検索は、リソースの性格上、流行りのあいまい検索には対応していない。ただ、古典書籍の常として、複数の題名で伝わるものが多い。それについて、多くの場合「別書名」や「国書所在」に収録されている書名が対象となっているが、そうではない場合もあって、不安が絶えない(例:「奈与竹物語絵巻」)。

古典籍の存在に止まらず、それの所在まで対象にしているこのデータベースは、したがって所在の変遷が大きな課題になる。書籍媒体なら、読者として自ずから情報への期待が明確になるものだが、デジタルものになると、利用の方針に漠然の揺れが伴う(例:「男衾三郎絵詞」、「結城合戦絵詞」)。なお、国立歴史民俗博物館所蔵のものはなぜか複数の実例において収録されていない。行政組織の近隣性と考えあわせて、首を傾げる。

デジタル情報への対応は、おそらくこれからも日に日に大きな比重を占め、重要な課題となるだろう。公開されているものが対象にならないことなら、いずれそのうち収録されるに違いないという期待から、まだ理解があるのだろう。しかしながら、公開元の変化にどこまで対応するかは、真剣に取り掛かかるべきだ。一例として、筑波大学図書館所蔵の貴重書デジタル公開へのリンクは、いずれも白黒の古いバージョンのものである。高精細画像での公開はすでに三年以上続いていることから考えると、更新の方針など、はっきりしたものにしなければならない。

言うまでもなく、同データベースの母体は、あの『国書総目録』である。学生時代、あるクラスメートがこれを購入したのを聞いて、個人の書斎にこれを持ち込むことの経済的、空間的な余裕を想像して、すっかり驚いた記憶はいまなお鮮明に残っている。古典籍の所在を記す紙媒体特有の洗練された文体は、けっして親切だとは言えないが、その不思議な魅力をいまなお褪せない。

2017年4月8日土曜日

くずし字OCR

今週、伝わってきたニュースの一つには、慶応大学所蔵の奈良絵本のデジタル公開があった。公開の日付は4月6日、同大学のメディアセンター(図書館)所蔵の貴重書が一気に同時アクセス出来るようになり、中でもとりわけ「奈良絵本コレクション」がリストアップされている。サイトの解説には「50点あまり」とあるが、数えてみれば、あわせて110冊/巻、62タイトルである。大いに歓迎し、喜ぶべきことである。

この公開の中で、一際目を惹いたのは、単なるデジタル画像に止まらず、公開作品の一部だが、変体仮名全文に電子テキストが添えられていることである。解説では、これを「透明テキスト付PDF」と呼び、しかも「くずし字OCR(凸版印刷)の技術」によるものだと明記している。OCR(自動文字認識)は、ここにようやくと大型古典文献の公開に加わることになった。記念すべき大きな一歩である。

くずし字OCRについて、これまでずっと関心を抱いている(自動変換)。今度の公開についての詳細は、いずれ開発者やサイト構築関係者が正式に公表してくれるものだと想像している。そのような記述を待ちながら、ここに一読者としての観察を記しておきたい。

公開された奈良絵本は、どれもPDFファイルと高精細画像という二つの表示方法が用意され、ただ透明テキストが付いているものとそうでないものの区別は、特別に明記されていない。なんらかの公開方法による考慮からだろうか、ほぼ半分ぐらいのタイトルはPDFファイルにおいて白黒の画像だけ用いられ、それには電子テキストが添えられていない。一方では、電子テキストありのファイルとなれば、画面上をマウスで任意の行などを選ぶと、文字単位に付け加えられ、サイズや配置が違う枠が現われ、その分の文字をコピーしたり、貼り付けしたりすることができるようになっている。変体仮名で記された画像がいまやスタンダードなパソコン処理に対応してくれることには、少なからずの興奮を覚えざるをえない。

この電子テキストは、どこまでOCR技術に頼っているか、すぐには不明だが、かなりの精度をもつものであり、慎重な編集、校正のプロセスを経たと思われる。極端な実例を上げれば、「雨わかみこ」にみるシミが付いている文字(No.14終わりから5行目)、枠から完全に外れた文字(No.10終わりから3行目)などは正しく表記されている。それから、「もんしゆ姫」にみる「州」(No.9、5行目)、「森」(No.17、終わりから3行目)、「雪」(No.23終わりから3行目)などの異体字や癖のある書き方は、OCR認識に対応されているとは考えにくい。対して、二文字分の踊り字の表記は、電子テキストにおいてつねに悩ましい問題だが、ここではすべて「く」としている。混乱を招きかねない解決法であり、せめて「ゝゝ」か「々々」としてほしいものである。

「慶應義塾大学メディアセンターデジタルコレクション」は、大きな資料群の電子化と共に、新たな基準を示している。このブログでも、さっそく「注釈付き奈良絵本研究書デジタル底本」の内容を更新した。

奈良絵本コレクション(慶應義塾大学)

2017年4月1日土曜日

地名をめぐるビジュアル記憶

あらためて言うまでもないが、日本の古典の中に「道行き」と呼ばれる集約された文学表現あるいは文体が存在し、きわめてユニークな光景を形成している。同じ読み方を借りて画像資料のほうに目を向ければ、似たような審美感覚は絵巻の画面においても認められると考えられよう。

絵巻を読んでいくと、日本中の東西南北の地はじつに多く登場している。無造作に取り上げてみても、たとえば、すぐつぎのようなリストが浮かんでくる。「一遍聖絵」にみる洛中の四条京極釈迦堂(巻七第二十七段)、伊豆の三嶋(巻六第廿二段)、「西行法師行状絵巻」にみる四天王寺の江口(巻二第七段)、洛外の北白川(巻三第四段)、「頬焼阿弥陀縁起」に見る鎌倉の岩蔵寺(上巻第一段)、相模の大磯(下巻第五段)、「箱根権現縁起」にみる箱根大社(第十一段)、「真如堂縁起」にみる真如堂(下巻第三、四、五段)、などなど。ここに一つの明確な方向性がすぐ読み取れる。すなわち、雲遊する修行僧の伝記、功徳や霊験が記される社寺縁起、そして記憶されるべき大事件をテーマとするものは、まずは特定の空間の記述と結びつくものである。絵巻の表現からにして、どのような場についても、具体的な地理、地形についての記述を十分に残してくれることはないだろう。しかしながら、そのような不完全性の代わりに、ときにはそれを上回るほど、遠い昔の人々がもつその土地についての心のイメージが鮮明に描き込まれている。写真にみる北白川の清流は、まさに中の一好例だろう。

ずいぶん前のことだが、地図を専門とする研究者との会話のなかで、地図の抽象性について指摘されて、はっとした瞬間は忘れられない。地名をめぐるビジュアル記憶も、一種の抽象的なものだろう。地名も、そして物理的な地形も、変化を続けるものであるが、それに対する空間的な記憶は、抽象的だけに、より大事にされるべきものだろう。