国立国会図書館デジタルコレクションの「有馬山温泉小鑑」の冒頭の目録部分を「みを」を使って試してみました。だいぶ読めます。いくつか間違っているところもありますが、修正機能もあり、テキスト化も可能です。90%前後解読します。しかし、書道の草書作品や手紙類はまだまだのようです。「こと」などの合字などはこれからの課題のようですが、これで大変助かる人もいるかと思います。同じようなくずしを文章の流れからどう読むかも課題であると思いました。
2019年「日本文化とAI”くずし字”」と題して日本でシンポジウムが開かれました。その時の様子がYouTubeで2021.8月現在も見ることができます。日本には今なお地震やその他歴史的試料が相当あり、解読できないままになっているということです。更にそれを読める人は日本の人口約1億人いるうちの1,000人程度というようです。そこでAIを活用してこれらの史料を読むコンペが開かれました。中国人が1位、2位はロシア人、3位が日本人でした。諸外国でも大学などで日本文化を学ぶ時くずし字を読む必要があり、大学や大学院で教えているところもあり、その学習用にスマホなどのアプリケーションを使ってはないのかという問い合わせもあった、と言います。私がくずし字に興味を持ったのは私の勤務していた大学の大学院に留学している院生が「有馬山温泉小鑑」の資料を使って論文を書く時に解読文を協力したこと直近のきっかけです。そこでは自分が書道で変体仮名や草書の作品を50年以上学んだり創作したりしてきたことが役立ちました。そこで大学を退官した昨年から、くずし字解読と筆跡鑑定、筆跡診断や書道療法等それらの基本となっている書道を中心に据えて総合的にそれらを研究しながら教える仕事を始めました。さらにAIで90%も読める時代になったことを、筆跡診断士の鈴木善和さんに教えて頂き、このシンポジウムの資料もいただきました。古文書を読んでいると版木などで印刷されたものは割と読みやすいのですが、個人が書いた直筆の手紙などは、その人の書き癖があり、これはAIでも最後は人間の判断も必要になってくるのではないかと思います。この精度が上がったとしても、AIは画像を処理して文字を判断していますので、文章の意味を考えてとなるとまだまだ難しいのではないでしょうか。そういうわけで、くずし字の解読も筆跡診断にも筆跡鑑定にも役立ちます。またこれらはこれからの時代において「書く」ことが少なくなる時代に「書く」という行動から見えてくるものも大きく影響してくる気がします。特に脱ハンコにより、サインが普通になってくると、名前は書かなくてはなりません。
当時のポスターです。
•手書きノートの解読が現在課題
•帳票構造認識も罫線が入るとその識別が課題
•手書き筆者の情報についてもビッグデータの活用で活用範囲が拡大する。
→年齢の影響
→性別の影響
→気力・感情・性格 の影響
→病気の影響
短歌会に入って毎月一回歌会に参加しています。いろいろと主宰や参加者から新しい知識や発想、意欲などで刺激を受け元気づけられています。また古文書を読んでいると和歌は結構出てきます。昔は源氏物語をはじめ万葉集、百人一首などたくさんの和歌が詠まれていました。千利休も茶道の心得の和歌百首作っています。そういうわけで短歌を学んでいると古文書の解読にも大いに役立っています。そこで千利休に倣って筆跡に関する自詠短歌を百首を目指しています。
くずし字解読をテーマに短歌を作ってみました。御批正をお願いいたします。
・くずし字はパソコン時代を巻き戻し書く癖が出る水茎の跡
・同じ字の多彩な書き方時空超え筆の動きは個性を運ぶ
・毛筆の微妙な動き呼吸まで心電図のごと紙に現る
・様々な文献に接し豊かなる心になった出会いに感謝
・くずし字を解読すればクイズより勝る喜び人との出会い
・古文書の筆跡なぞりいにしえの人柄偲び指しばしやむ
・いにしえの生活もまた多忙なり下へ下へと走る筆跡
・毛筆の生き生きとした線映えて強く逞しき生き様想う
・草書体くずせば同じ一本の縦画になる偏に苦戦す
・くずし字のAI解読九割も癖のある字の誤読発見
病夫に化身した薬師如来が行基の精誠の道心を知るための方便でいろいろな難題を与えた。その結果、認められ有馬のふもとの温泉の窟に行って、湯の山を開基して、末世の衆生の為に病痾の苦痛を助けよと言って姿を虚空に消えてしまった。そこで行基は仏のお告げに任せて有馬山の温泉の窟に行き、山を穿つったり、岩をくずしたりて湯脈を探りあてる。そこに石物を祀り、奉行如法経を書写して、温泉の底に埋めて、一切衆生諸病滅除の誓祈をたてるなど念入りに行い,そのため貴賤万民の抜苦与楽の聖地となり是より、三百七十年温泉が繁盛したという。ところで病夫に与えた半肉の魚をこやの池に放ったところ、たちまち金魚となって淵で喜び泳いだという。しかしこの池に住む魚はことごとく片目であると言い伝えられ、しかもこの魚を食べると癩病なるといわれ、だれも食べる者はいなかったという。次回第5回のくずし字解読講座は、その後、洪水で温泉が壊滅状態となり九十五年間荒れてしまうが、仁西上人が不思議な夢を見て再建をする話になります。
前回第3回は行基菩薩が一人の病夫と出会い、様々な難題で看病を依頼され、献身的に看病する様子でした。するとその病夫が突然薬師になったのです。病夫は有馬の薬師如来の化身であり、行基を試したのでした。ここまでが第3回で、第4回はそののち薬師如来から有馬山温泉の再興を依頼され、荒れた温泉を修復することになります。そこでもいろいろと不思議なことが起こるという話です。興味のある方はホームページの予約システムからお申し込みください。人数制限をしています。6人まで2時間3,000円です。
行基が病夫を看病し、病夫が薬師になる絵です。
崩し字の解読(古文書翻刻)を依頼されて解読していると、筆者の書き癖のある文字で苦労をすることがある。しかし、書き振りの特徴をつかむとだんだん解読のスピードが上がっていく。変体仮名や草書を一文字だけを抜き出して何という文字かと聞かれるとなかなか難しくどちらか判読しにくい文字もある。相当簡略化されると、サンズイも人偏もギョウ人偏も言偏等も同じ一本の縦画になってしまうからである。わずかな筆の動きにより異なる文字になることもあり、その筆先の動きを仔細にとらえる必要がある。したがって筆跡鑑定を志す者は、「くずし字解読(古文書翻刻)」を学んでおくと大変勉強になると考える。
今日、AIが古文書を80~90%解読できるようになった時代である。これからどんどん精度も上がっていくかと考えるが、個々人によって異なる筆癖を解読するには、そのような文字を相当集積しなくてはならないだろう。
現在、AIによるくずし字認識を研究開発するための基礎的なデータセットとして、人文学オープンデータ共同利用センターが「日本古典籍くずし字データセット」を公開しています。ひらがな(変体仮名)・カタカナ・漢字を文字または文字コードで検索できます。ただし、これまでは比較的読みやすいものが中心で、解読がより難しい字形も今後加えていくとのことです。
さらに、くずし字認識ビューアがあり、AIくずし字認識(一文字)機能を備えています。しかし、鮮明な画像でないと判読難しいようです。また、1ページ全体を認識したい場合は、「KuroNetくずし字認識サービス」を活用できるようです。しかしあくまで、日本古典籍データセットにある文字だけにしか対応していませんということです。まだまだこれからに期待したいですね。
これはパンフの一部拡大図です。1行目の解読「分」2行目の「分」後ろから2行目(前から6行目)の「今」すべて間違いで「介」で変体仮名の「け」と読む。「けり」「ければ」「ける」
前々回の「有馬山温泉始まりの事」の概略と前回第2回は行基菩薩が湯の山を開山する初めの部分で、一人の病夫が現れ、行基が理由を尋ね、菩薩の修業は抜苦与楽が広く人を救うという願い(弘願)として、食事を与えるところまででした。第3回はさらに行基が良薬を与え看病をしたところ、病夫からさらに新鮮な魚の肉を食べればこの病が癒えると言われ、行基がながすの浜へ魚を捕りに行った状況やそのうえ病夫の体に膿がたまり、かゆい上に虫が生じているので、膿をその虫を吸ってほしいと頼まれる。行基はそれも厭わず行った、その時、その病夫がたちまち、・・・実は病夫は・・・と続いていきます。
行基がこやの里で病夫に出会い、ながすの浜で魚を得ている図
第1回参加ありがとうございました。参加者の情報交換をしながらあっという間の2時間で、15分ほどオーバーしてしまいました。仮名の書道をやっていて、変体仮名の復習になったり、筆跡鑑定の個性的な崩し方の理解を深められるなどとそれぞれに何かを得られたのではないでしょうか。初めての方もいらっしゃたので、ゆっくり進めました。したがって、目録と書いてある目次部分と第1段落の「有馬山温泉はじまりの事」までしか進みませんでした。続きをというご要望もあり次回は第1回の復習の練習問題と第2段から始めます。参加申し込みはホームページの「ご予約はこちらから」のくずし字(古文書)解読の12月19日の日付を選んで申し込みをしてください。
国立国会図書館デジタルコレクションの一部を引用
古文書を読むことは昔の人との出会い、文化との出会いです。読めるようになることもうれしいですが、それ以上に内容も面白いものがあります。「温故知新」と孔子が言ったように、新しい発見もつかめるかもしれません。また一般社団法人古文書解読検定協会が実施している古文書解読検定を受験して自分の実力を知るのも一つの指針になるかとも思います。3級から1級までです。とにかく面白く内容も豊富です。
学ぶには、最初は変体仮名、次に漢字の草書体を学び、さらに独特なくずし字を学んでいくとよいかと思います。本なら検定協会の代表理事の小林正博による「これなら読める!くずし字・古文書入門」をお薦めします。
スマホで学習するなら、googleアプリでもAppStoreでも「くずし字学習支援アプリKuLA」をインストールして学習するとよいかと思います。アプリは例題が少ないかもしれませんが、「学ぶ」、「よむ」にさらに「つながる」という機能も付いています。
世界初の日本の古文書研究躍進のために、研究者と市民が協同して、それもAI技術を使用し、市民がオンラインで「みんなで」協同することで、くずし字で書かれた古文書を、活字化して現代の人たちに読めるようにするのが目的だそうです。国立歴史民俗博物館、京都大学古地震研究会、東京大学地震研究所のメンバーを中心に開発を進める古文書資料の市民参加型翻刻プラットフォーム「みんなで翻刻」が2017年1月に公開されたときは、約5,000人市民の参加で600万文字以上の「くずし字」で解読書かれた資料が解読されたそうです。今回は新バージョンとしてさらに多くの災害資料や「東大寺百合文書」の解読を、最新のAIを使った「くずし字」の自動認識機能も提供されて、新たに7月22日リニューアル公開されたのです。
古文書に関心のある人は、くずし字の解読により、先人の資料から様々なことを発見し学ぶことができると考えます。楽しみながら時に苦しみながら、翻刻したものを他の人が、みんなで添削もしてくれますので挑戦してみようではありませんか。
みんなで翻刻→ https://honkoku.org