日本漢文の世界:本の紹介

書名 日本の文化をデジタル世界に伝える
副題  
シリーズ名  
著者 永﨑 研宣(ながさき きよのり)
出版社 樹村房
出版年次 令和元年(2019年)
ISBN 9784883673278
定価(税抜) 2,300円
著者の紹介 著者(1971-)は一般財団法人人文情報学研究所主席研究員。
国立国会図書館 日本の文化をデジタル世界に伝える
Amazonへのリンク 日本の文化をデジタル世界に伝える
本の内容:

 文化資料のデジタルアーカイブ化には様々な関門があります。日本語の資料では、第一関門として漢字の異体字の問題があります。異体字は整理したうえで入力するのがよいのか、原資料の字形のままで入力するのがよいのか。本書では現在ではUnicodeで多くの字形が区別可能になっているので、できるかぎり原文の字形を尊重することが望ましいとしています。原文どおりの字形で入力したテキストに後からある一定の規則(たとえば同一の意味の漢字の字形を統一する等)を適用することは比較的容易ですが、先に一定の規則を決めて作業を進めてしまうと、原文に忠実な字形に戻したいと場合には、ほとんど最初からデータを作り直す作業が必要になるからです。(第2章14ページ、第3章59ページ)
 また、膨大なテキストデータを作成しても、それをどうやって校訂するのでしょうか。本書ではWikipediaのようなクラウドソーシングにより、テキスト修正を誰もが行うことができるような仕組みを設け、OCRで変換した膨大なテキストデータを多人数の協力を得て修正しようとする試みを紹介しています。(第3章、37ページ)
 技術革新によって古い技術でデジタル化した資料が陳腐化してしまうことも問題になります。Unicodeが普及したことにより、Unicode普及以前に多漢字フォント(古今文字鏡等)によってデジタル化されたテキストデータが陳腐化してしまったことなどが顕著な例です(第3章60ページ)。逆に「JPEG2000」による画像データのように、すぐれた先進技術にもかかわらず、十分に普及していないために、それを使用すると表示できないという問題がおきてしまう例もあります(第3章28ページ)。
 それから、サーバなどの情報インフラは数年ごとに更新が必要であり、そのたびに多大な費用と労力が必要となります(第4章70ページ)。
 こうした問題をクリアしてデジタルアーカイブを公開しても、それをいかにして継続させていくかが問題となります。公開継続にも費用と労力がかかるため、公開継続の仕組みについても熟考する必要があるのです。本書では解決へ向けての一つの提案として、コミュニティで情報を長期利用できるようにするOAISモデルについて紹介しています(第4章94ページ)。
 さらに本書第5章(97ページ以下)では、デジタルアーカイブを世界的に相互利用していくための国際標準としてのIIIFとTEIについて紹介しています。この部分こそが本書の肝要部分です。
 IIIF(トリプル・アイ・エフ International Image Interoperability Framework)は画像公開の方法を国際標準化したものであり、TEI(ティー・イー・アイ Text Encoding Initiative)とは注釈付きテキストの記述方法を国際標準化したものです。これらはどちらもISOに登録された国際規格ではなく、多くの研究者が策定に参加する「ガイドライン」という形式をとっています。
 IIIFに準拠して公開された画像は、引用先のWebサイトでIIIFに対応した画像ビューアで閲覧が可能となります(第5章111ページ)。それらの画像をオープン化して自由に使用できるようにしておけば、もとの公開サイトが消滅したとしても、他のWebサイトがその画像を公開しつづけることが可能となります。これはデジタルアーカイブの可用性(いつでも使える状態)を保持するうえで画期的なことです(第5章118ページ)。
 一方TEIは資料のテキストに注釈をつける方法を国際標準化したものです。TEIに準拠したマークアップをすることによってテキストの利用価値は飛躍的に高まります。たとえば、原文と訳文を対応させて表示したり、異本を対応させて表示したりする「パラレルコーパス」の利用(第5章149ページ)や、書誌情報のマークアップ(第5章155ページ)などのほか、IIIFとの連携により画像へのアノテーション(注釈づけ)にも利用できます。(第5章157ページ)
 第6章以下は、画像やアノテーション作成の具体的方法について述べています。
 このように、デジタルアーカイブの世界標準化は現在も進行中であり、それにのっとって公開されたデジタルアーカイブは世界中で同じように利用できるようになりつつあります。わが国においても関係者の努力により、短期間のうちにこうした国際標準に準拠したデジタルアーカイブが続々と公開されていることは、わが国の文化発信力の強さを示すものです。
 こうしたデジタルアーカイブ化の手法は、現在のところ資金や人材を擁する図書館や研究機関等の利用を想定したものですが、今後簡易的な利用手段が開発されることにより、個人でもデジタルアーカイブが作成・公開できるようになるかもしれません。今後もデジタルアーカイブの国際標準化の最新動向に注意を払っていく必要があります。

2022年8月31日公開

ホーム > 本の紹介 > 日本の文化をデジタル世界に伝える

ホーム > 本の紹介 > 日本の文化をデジタル世界に伝える