HOME Twitter Facebook RSS 昭和年代別タイトル一覧 タイトル索引
ブログについて お知らせ 最新記事一覧 人気記事一覧 おすすめ記事



百数十年前まで使われていた「くずし字体」、現代人は読めずAIが読む時代に



1:名無しさん:2019/07/14(日) 01:00:41.97 ID:hBNz/6rV0.net BE:155743237-PLT(12000)
AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発

「日本では1千年にわたりくずし字という筆記体の文字を使ってきた。

しかし、現代の印刷システムではそれを使うことは難しく、20世紀に入って現代語へと変換が進められてきた。

その結果、くずし字で書かれた数百万の古文書や古書が現存するが、それらは人口の0.01%以下の人しか読むことができない」という問題を指摘した。

たとえば江戸時代の古典籍はくずし字と呼ばれる筆記体の日本語で書かれている。

文法などは現代語と大きな違いはない(厳密に言うと主語が省略されることが多いなど微妙な違いはある)のだが、そもそも文字が識別できないので読めないという問題がある。

大学などで専門に歴史を研究している研究者であれば、まずはそのくずし字に関して勉強をして読めるようになる(つまり0.01%以下の1人になる)だろうが、民間の研究者が歴史について学び、研究したいと考えて、1次資料である古文書を読もうとしても、まずはこの「くずし字」が読めないというハードルがある。

百数十年前までは皆が読めていた「くずし字」。今は人口の0.01%以下しか読めないという現実







(以上引用)

https://pc.watch.impress.co.jp/docs/news/1195499.html


3:名無しさん:2019/07/14(日) 01:04:31.26 ID:J3ogdd+I0.net
活字に直しても、さらに何を言ってるか分からないという問題もあるしなw
主語と目的語はっきりせえよw
4:名無しさん:2019/07/14(日) 01:04:55.01 ID:1DjuDc3v0.net
読める人が残っているうちに学習データの蓄積を
5:名無しさん:2019/07/14(日) 01:05:10.70 ID:XC0CifFP0.net
字を丁寧に書いてる現代人のほうが偉い
昔の奴らは糞
6:名無しさん:2019/07/14(日) 01:05:49.45 ID:ZvVAAEGZ0.net
AIこそが本物の日本人や
72:名無しさん:2019/07/14(日) 03:13:57.02 ID:frU8A+zk0.net
>>6
Yes, AI am.
7:名無しさん:2019/07/14(日) 01:06:05.60 ID:kiDegcDt0.net
これ重要だね
過去の文字を捨てることは知識の断絶につながる
漢字を捨てて過去の歴史がわからなくなってしまった某国のようになってはいけない
8:名無しさん:2019/07/14(日) 01:08:02.62 ID:oUkj/dI+0.net
勉強すれば読めるようになるらしいぞ
ソースは最近古文書に目覚めた俺の友達
9:名無しさん:2019/07/14(日) 01:08:31.94 ID:dSZO4J2n0.net
ばあちゃんと両親が近年なくなったけど
遺品とか漁ってても達筆すぎて全く読めない
昔の人ってなんでみんな習字の先生みたいな字なの?
俺はいつまでたっても楷書体だけど
13:名無しさん:2019/07/14(日) 01:10:04.60 ID:hyNUoidB0.net
正直言って読む気にもならん
16:名無しさん:2019/07/14(日) 01:13:01.21 ID://637o+I0.net
変体仮名が読めないし、旧字も読めないからなあ
こんなことではいけない
支那や朝鮮のようになってしまう
歴史修正主義国家になる前に学校教育に
導入すべきだ
17:名無しさん:2019/07/14(日) 01:13:11.71 ID:ZvVAAEGZ0.net
変体仮名が混じってるから
素人が字の形で推測しても読めないぞ
戦前教育世代は普通に変体仮名読めるが
27:名無しさん:2019/07/14(日) 01:28:10.95 ID:VQVElhuM0.net
>>17
ゑとか?
29:名無しさん:2019/07/14(日) 01:33:00.57 ID:ZvVAAEGZ0.net
>>27
ゑは通常の仮名文字だよ
惠の字を崩して仮名化したもの

変体仮名はゑと言うときに「衛」や「慧」を仮名仮名して使う
18:名無しさん:2019/07/14(日) 01:14:06.54 ID:PxAZryIA0.net
爺さん世代は読み書きしてたけどホント無理
ミミズがのたくってるようにしか見えん
22:名無しさん:2019/07/14(日) 01:19:51.24 ID:lYnmUhiL0.net
書道で草書を勉強していれば読めるよ。
草書体は崩すのも決まりがあって適当に崩している訳ではない。
大学にも書道学科があるから読める人がいなくなることは無い。
19:名無しさん:2019/07/14(日) 01:15:42.69 ID:24j7oeep0.net
木簡や竹簡も解読できたり間違いを指摘できるかも
24:名無しさん:2019/07/14(日) 01:23:19.92 ID:pY3wsNJZ0.net
これは日本だけじゃないだろ
ドイツ人もひげ文字読めないし
アメリカ人も筆記体読めないからな
37:名無しさん:2019/07/14(日) 01:55:57.67 ID:o8Ukslgy0.net
>>24
そういえば英語の筆記体は読めないアメリカ人多いって聞いた事はあるな
でも実際書くと自分でもブロック体で書いた方が読みやすいし早い

この記事の日本語もそうだと思うけど、日本人は筆、ガイジンは万年筆の文化だったから、シャーペンとかボールペンが普及した今の時代には必要無いんだろうと思う
25:名無しさん:2019/07/14(日) 01:25:07.42 ID:PYDulHMU0.net
おまいら三体字典買って読めばいいよ

面白いほど崩し字がわかるようになる
31:名無しさん:2019/07/14(日) 01:38:34.44 ID:ZvVAAEGZ0.net
お前らがひらがなだと思ってるのが漢字のくずし字の一形態だからな
本来は複数の崩しパターンがあるのでそれぞれのルールを覚えるのよ
昔からの日本人なら常識です
33:名無しさん:2019/07/14(日) 01:46:24.47 ID:YrK8XJ1S0.net
字としては1400年前の字の方が認識できるんだよなあ
読めないけど
34:名無しさん:2019/07/14(日) 01:50:27.56 ID:o8Ukslgy0.net
大和詞を知ってないと意味がわからないし、その意味を読み取る上では全て平仮名ってのもハードル高いんだが、それ以前に>>1の画像だと解像度低いのがキツい
AIの方はシンプルに凄いと思った
39:名無しさん:2019/07/14(日) 02:00:34.63 ID:ZvVAAEGZ0.net


の例だと

おとなにことを
おと那尓こと越

と一行目でも3箇所変体仮名使ってる

最後の行の月7日になりに
の末尾のにも変体仮名の耳の字
88:名無しさん:2019/07/14(日) 04:59:02.48 ID:mkCRu5Qw0.net
>>39
わっかんねー
42:名無しさん:2019/07/14(日) 02:05:51.20 ID:kqJ8/rIU0.net
昔の文が読めないのなんて当たり前だろ。
日本語(に限らないけど)が時代によって進化(変化)していくのだから。
それが違うと言うのであればなんで昔々の文章を解読とか言うんだよと。
なんで方言が理解できないんだよと。
46:名無しさん:2019/07/14(日) 02:12:13.56 ID:ZvVAAEGZ0.net
ちなみにひらがなくずし字は散文的な文章や非公式文章の主流で
公式文章や論理記述は江戸時代末までずっと漢文を使ってた

だから日本人は漢文が読めないと過去の公的文章は字体だけ直してもらっても意味読みとれない

学校で漢文教える理由がこれ
47:名無しさん:2019/07/14(日) 02:12:19.93 ID:IZwZNOZc0.net
ゆたぼん「わからなければAIに読ませればいい」
48:名無しさん:2019/07/14(日) 02:12:59.66 ID:n7/pQ8/00.net
50:名無しさん:2019/07/14(日) 02:27:54.98 ID:HtU9pT+p0.net
>>48
プーチンのメモ
53:名無しさん:2019/07/14(日) 02:33:34.84 ID:ZvVAAEGZ0.net
>>48
活字でも
лишил лилииだから
103:名無しさん:2019/07/14(日) 06:19:43.64 ID:8g2/fJlE0.net
>>48
文字の区切りをどこで判別するのかわからん
135:名無しさん:2019/07/14(日) 11:35:30.62 ID:jfNf6XNy0.net
ああ既に>>48で出てたかw
157:名無しさん:2019/07/14(日) 14:38:51.13 ID:8qTQUVMc0.net
>>48
ロシア語はAIの敵
55:名無しさん:2019/07/14(日) 02:34:25.74 ID:1DjuDc3v0.net
変体仮名は飲食店ののれんなんかに残ってる
明治あたりでかな文字の統合を行ったから初等中等学校では教わらない
最近Unicodeにも入れてもらえたみたいでなにより
68:名無しさん:2019/07/14(日) 03:05:41.83 ID:oUkj/dI+0.net
>>55
生そばとか天ぷらとか
この2つはほとんどの人が読めるな

65:名無しさん:2019/07/14(日) 02:56:39.74 ID:hyrbEmHs0.net
そもそも同世代でも字汚い奴の文字は読めないから
ちゃんと読めるように書いてあるのか判断不能
76:名無しさん:2019/07/14(日) 03:17:55.60 ID:9x1rsTTv0.net
読める読めない以前に
教育されてねえよ
12:名無しさん:2019/07/14(日) 01:09:52.41 ID:5mEbLMzY0.net
読むための教育受けなきゃ読めるわけ無いだろ
36:名無しさん:2019/07/14(日) 01:54:10.42 ID:Nmhgb68M0.net
ごめん、現代書体に直してもらっても何書いてあるか意味わかんない
87:名無しさん:2019/07/14(日) 04:49:40.71 ID:MD/dTTBV0.net
AIが読んでくれるなら大部分の人間は読めなくてよいということだ
70:名無しさん:2019/07/14(日) 03:10:17.92 ID:rPmgd92c0.net
AIが文化継承する時代が来るのか…

百数十年前まで使われていた「くずし字体」、現代人は読めずAIが読む時代に
引用元:http://hayabusa3.2ch.sc/test/read.cgi/news/1563033641
関連記事

おすすめ記事

コメント

16051

指摘されてるように、ルールに則ってくずしているので、AIで読むことが可能なんだよね

明治生まれの曾祖父が母の就職を祝っての書が残ってるけど、くずし字なので母も今となっては読めずに、くずし字辞典片手に苦戦してたなー

2019/07/17 (Wed) 07:15 | あの頃の名無し #- | URL | 編集

コメントの投稿


管理者にだけ表示を許可する