RSSおすすめ記事です

スポンサーリンク

古文書や浮世絵に書かれた「崩し字」をAIで解読、立命館大と凸版印刷が開発

ニュースAI

スポンサーリンク

古文書や浮世絵に書かれた「崩し字」をAIで解読、立命館大と凸版印刷が開発

1 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:26:34.27 ID:Dd/F8ptD9.net

 古文書や浮世絵などに書かれた「崩し字」を、人工知能(AI)が画像から解読するシステムを立命館大文学部の赤間亮教授らのチームが、凸版印刷(東京)と共同開発したと13日、発表した。

 チームによると、同様の解読アプリなどは他にもあるが、AIの導入は全国初という。

 システムは、立命館大が所蔵する古文書や浮世絵など約76万件のデータベースと、凸版印刷が保有する崩し字を蓄積したデータをもとに開発。パソコンの画面に映った文書で読めない文字を1文字選択すると、崩し字データの中から形が似ているものをAIが抽出し、合致する可能性が高い文字を順に表示する仕組み。

http://news.livedoor.com/lite/article_detail/16453138/


スポンサーリンク

ネットの反応

3 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:28:29.90 ID:ObSdJG4/0.net
Left Caption

草書とかただのミミズがのたくった字にしか見えない

5 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:28:57.10 ID:Sf3Tc7Js0.net
Left Caption

書いた自分でも読めない崩し字も判別可能ですか?
メモの意味がありません

8 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:30:17.91 ID:qW+HKzT50.net
Left Caption

戦国時代の書状とか
受け取った人どーすんのこれ
みたいなのもあるな

25 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:46:58.75 ID:lWKFKIh90.net
Left Caption

>>8
ヨーロッパ中世の文書とか、崩し字でない上にラテン語だから使われてる字の種類が23なのに、さっぱし読めんよ

71 : 名無しのシステムエンジニアさん 2019/05/14(火) 22:47:19.72 ID:uur2YCZv0.net
Left Caption

>>25
ラテン語くらい読めなくて、研究するな。

俺はある世界に行きたかったが、「サンスクリットを読めるのは当たり前」と知って挫折した。

81 : 名無しのシステムエンジニアさん 2019/05/15(水) 12:55:15.69 ID:57GzB4Gc0.net
Left Caption

>>71
ローマ時代の碑文とかなら今のラテン字と書体が殆ど同じだから楽々読めるよ。
なんで中世のは縦画をぶっとく横画を細く短くして可読性悪くしてんだか。

10 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:31:22.13 ID:SVvbtco20.net
Left Caption

江戸時代の三陸の地震、伊達家の文書を読めた歴史学者等は知ってたけど
読めなかった地震学者は知らなかった、とかいうのがあったんだっけ

11 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:31:39.36 ID:FdejcIw30.net
Left Caption

デジャヴってAI 導入では初になるのか。
一般公開して家宝の書物とかを個人が読めるようになると面白いだろね。

19 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:41:06.02 ID:pvf7hkMS0.net
Left Caption

江戸時代中期以降の庶民向けの本は
基本的に漢字に全部振りなが振ってあるので
くずし字のイロハが読めるようになるとほとんど判読できるようになる
あとくずし字のイロハ覚えるのはアルファベットより簡単

53 : 名無しのシステムエンジニアさん 2019/05/14(火) 15:57:56.04 ID:OA3YU+n20.net
Left Caption

>>19
どれだけ現代人の教養が寂しいかって話だよなぁ
たかだか編変体がなも読み下せないとは

20 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:41:20.98 ID:C+6k5hVy0.net
Left Caption

江戸のくずし字入門なんて本買ったけど、崩し具合の幅が広すぎてすぐ挫折した

24 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:44:40.85 ID:o6c5m3b60.net
Left Caption

読める専門家が少なくて研究が進まないからねぇ
今はデジタルアーカイブ化で
閲覧可能の資料も増えたし

今までは専門家が所有者の許可とって読むしか無かったけど

28 : 名無しのシステムエンジニアさん 2019/05/14(火) 12:53:54.08 ID:cCOVV/TP0.net
Left Caption

右筆が書いたような綺麗なくずし字はちょっと勉強すれば読める
だけど、江戸時代の庄屋や商家に残ってる書状なんかは酷い
何通も比べながらなんとなく読み進めていくうちになぜか読めるようになるんだが、AIを活用すると言うのはこういうことができるようになるということなのか

30 : 名無しのシステムエンジニアさん 2019/05/14(火) 13:10:48.03 ID:7zfPAjhE0.net
Left Caption

こういうことされると俺の爺ちゃんの仕事がなくなって困るな・・・
平安朝や江戸期の古文書の解読で長年頑張ってきたのに
便利になるって誰かが犠牲になるもんなんだな

47 : 名無しのシステムエンジニアさん 2019/05/14(火) 14:57:22.98 ID:L/490Xie0.net
Left Caption

>>30
いや、その成果がAIとして継承されたんだろ
AIそのものは先人の成果が無けりゃなんもできん
AIからすりゃおまいさんの爺さんは神そのもの

39 : 名無しのシステムエンジニアさん 2019/05/14(火) 13:39:04.84 ID:hU97Ilth0.net
Left Caption

筆で字を書くことからああいう崩し字に必然的になったんだろう
あれが読めるのは文章がワンパターンだったからだ

58 : 名無しのシステムエンジニアさん 2019/05/14(火) 17:48:00.70 ID:lWKFKIh90.net
Left Caption

>>39
そうなのか?
江戸時代の庶民向けの印刷物、瓦版とか草子物とか春画のキャプションとか、そっちのが好まれるからと、
わざわざ崩し字で木版を彫って刷ってたというよ。
楷書で書くと、お寺の経文やらお役人が橋のところに掲げるお触書とかみたいでお固いから嫌がられたんだとか。

79 : 名無しのシステムエンジニアさん 2019/05/15(水) 08:48:23.40 ID:5/5ryT0I0.net
Left Caption

>>58
楷書だらけの現代の文章は仮に内容がアホアホだろうと字的に江戸の人からしたら超お固いってわけか
ポップ体さえ緩く感じないってなんか不思議だな

40 : 名無しのシステムエンジニアさん 2019/05/14(火) 13:39:50.66 ID:8JAxMirn0.net
Left Caption

くずし字の何が面倒かというと、元字の漢字が同じ
ひらがななのに、何種類もあってどれをクズしてひらがなに
当ててるのか見て覚えないといかんところな。
慣れるしか無い。
漢字の候文の方が読みやすくて意味が取れる。
スタンダードには価値があるってことだな。

44 : 名無しのシステムエンジニアさん 2019/05/14(火) 14:30:38.59 ID:cCOVV/TP0.net
Left Caption

>>40
それに手癖が合わさるから読めないのは本当に読めない
帳面とかはいいけど、書状のような私信は結構厳しい
江戸後期から明治ぐらいが厳しい

48 : 名無しのシステムエンジニアさん 2019/05/14(火) 14:59:25.28 ID:L/490Xie0.net
Left Caption

>>44
手癖を手癖として認識できないAIはどんどん変な学習をしていく
ちゃんと手癖として分別してくれるんかね

55 : 名無しのシステムエンジニアさん 2019/05/14(火) 16:59:03.39 ID:+jUqE9Lc0.net
Left Caption

こういう草書体や変体仮名が多用されるのって近世・近代ぐらいまでのイメージが強いけど、
昭和の年金の古い台帳を見ると崩し字や変体仮名が使われてるケースが結構あるよ
その結果が5000万件もの年金記録問題を生み出したけどw

56 : 名無しのシステムエンジニアさん 2019/05/14(火) 17:09:12.77 ID:FrbNWdNw0.net
Left Caption

>>48
その辺はかなり興味あるな
史料の原本じっくり見て墨の濃淡から書き順で判別したりするからそういうのができたりするとすごい

>>55
史料整理してた経験からすると戦後しばらくまではわりかし普通に使われてたような印象を受けるな

60 : 名無しのシステムエンジニアさん 2019/05/14(火) 17:57:02.38 ID:gtR9IpbX0.net
Left Caption

AIの得意分野でもあるが、学習のためのサンプルが少なすぎるから十分に育てられない
せいぜい人間の見落としチェックのための参考情報程度

68 : 名無しのシステムエンジニアさん 2019/05/14(火) 22:21:42.43 ID:XvNvkXXL0.net
Left Caption

ふーん、これは快挙じゃないかな。
というのも近世の文書ってのはもう本当に膨大に残ってるからね
膨大すぎてほとんど手付かず、当たり前か。

しかもだねその中には雑記随筆とか山のようにあるっていうんだから
その中には今の人間の鑑賞にたる捧腹絶倒クッソ面白い一大傑作、あると思うんだよなア

70 : 名無しのシステムエンジニアさん 2019/05/14(火) 22:43:17.22 ID:yoa02b750.net
Left Caption

こういう虱潰しはAI大得意だから良さげ

Posted by flac