thumbnail

政府「コンピューターで漢字を6万文字使えるようにした、これで日本語の壁が取り払われる」|お金の総合まとめ

1 :5円まとめ 2017/12/24(日) 21:16:54 WeoWNgz40EVE
日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。
これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、
日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、戸籍で使われているものをはじめおよそ5万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、
ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。

このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進めた結果、
このほど15年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、
地名を含むビッグデータを正確に分析できたりするなどの効果が期待されています。

IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html?utm_int=news_contents_news-main_001

7 :5円まとめ 2017/12/24(日) 21:19:51 Xu9ftiHcrEVE
斎藤
斉藤
齊藤
12 :5円まとめ 2017/12/24(日) 21:21:08 bXwslhw5pEVE
>>7
斎の字ぜってえあんないらんわ
8 :5円まとめ 2017/12/24(日) 21:20:16 AgyLL5SI0EVE
欠陥言語を直せや
9 :5円まとめ 2017/12/24(日) 21:20:26 GWqY/6Ye0EVE
ふぉんとぉ?
10 :5円まとめ 2017/12/24(日) 21:20:30 piZ00BqY0EVE
15年もかけたんか
13 :5円まとめ 2017/12/24(日) 21:21:15 Lxk7G+FqaEVE
壮大な無駄遣い
16 :5円まとめ 2017/12/24(日) 21:22:23 lTQtE/fZ0EVE
戸籍統一文字はコード化されていないだけで前からあったやろ
17 :5円まとめ 2017/12/24(日) 21:22:25 UemwRPuW0EVE
無能政府
19 :5円まとめ 2017/12/24(日) 21:22:59 2eZM9oIT0EVE
IPAっていつもこんな仕事してんの?
22 :5円まとめ 2017/12/24(日) 21:23:19 trtlBwH+0EVE
これめんどいわ
山崎

山嵜
27 :5円まとめ 2017/12/24(日) 21:23:57 jLiJ+6vY0EVE
2byteで6万5千字やろ?ギリギリやな
32 :5円まとめ 2017/12/24(日) 21:24:26 8VZOzlFJ0EVE
絶対どの斎藤やねんとか、どの渡辺やねんとかいう時間が出てくるわ
33 :5円まとめ 2017/12/24(日) 21:24:29 x9406+bM0EVE
unicode出来てから何年経ってんねん
34 :5円まとめ 2017/12/24(日) 21:24:38 53lwrDif0EVE
この機会に無駄な漢字消せばよかったのに
41 :5円まとめ 2017/12/24(日) 21:25:43 ibS0HRa10EVE
ジャップの技術力低すぎやろ
46 :5円まとめ 2017/12/24(日) 21:26:06 OjT3bSDNrEVE
これ6万字登録するバイトあったらやってたのに
50 :5円まとめ 2017/12/24(日) 21:26:35 HT/Cw1gPdEVE
草剛
57 :5円まとめ 2017/12/24(日) 21:27:48 I4gCRWrwdEVE
ワイの渡辺も追加されるんやろか
60 :5円まとめ 2017/12/24(日) 21:28:15 lTQtE/fZ0EVE
(火へんに華)
65 :5円まとめ 2017/12/24(日) 21:28:55 VtRD3Qkw0EVE
もうこれから日本語を使うやつはどんどん減っていくだけやのに
まあ無駄なことするなあ…
66 :5円まとめ 2017/12/24(日) 21:28:59 Bk23LAmzaEVE
15年か
AIにやらせたらすぐ終わりそうやな
具体的にどんな作業か知らんけど
68 :5円まとめ 2017/12/24(日) 21:29:06 E31uqoZv0EVE
中国人の手作りフォントってとんでもない数の漢字はいってるで
70 :5円まとめ 2017/12/24(日) 21:29:12 axdgXQXY0EVE
どうでもいいような細かい違いなんて統一さして減らしていく方向にしろよ
アホちゃう
78 :5円まとめ 2017/12/24(日) 21:30:05 dq9wsZpC0EVE
日本人の生産性が上がらない理由がよくわかる
91 :5円まとめ 2017/12/24(日) 21:31:56 RAhrjCgp0EVE
渡辺
渡部
渡邉
渡邊
93 :5円まとめ 2017/12/24(日) 21:32:11 qyBccaTT0EVE
ワイ漢字めっちゃ得意なのに台湾行くとぜんぜんわからないからそれも対応させろ
99 :5円まとめ 2017/12/24(日) 21:32:53 GOIde5ER0EVE
旧字体の名前でIPAの受験用紙を書いたら
黒豆腐で帰って来た思い出
107 :5円まとめ 2017/12/24(日) 21:34:29 hdkyj4rr0EVE
字もまともにわからん奴が書いたもんを字もまともにわからん役人が写してりゃめちゃくちゃになるのは当たり前やな
今やるべきは公的文書での字体の統一やったんやね
111 :5円まとめ 2017/12/24(日) 21:34:57 8bwOkBnY0EVE
円記号とバックスラッシュ絶許
112 :5円まとめ 2017/12/24(日) 21:35:15 rG8r6lhG0EVE
15年てなんやねんあほか

こんなん15日で済ませる作業やろ

118 :5円まとめ 2017/12/24(日) 21:36:33 OEYBLc6y0EVE
細かい違いがたくさんある漢字って明治時代に書き間違えたまま登録されちゃった字とかなんやろ
そういうのむしろ無くしてほしいわアイデンティティ感じんわ
127 :5円まとめ 2017/12/24(日) 21:37:07 YueP9wo2dEVE
ワタナベが統一されたら佐藤抜いて苗字人口トップとかなるんかな
130 :5円まとめ 2017/12/24(日) 21:37:27 QyISZZRi0EVE
分家になるときに本家の漢字をちょっと変えてそれを名字にするからやなかったっけ
141 :5円まとめ 2017/12/24(日) 21:38:53 Ui8OFnc8dEVE
>>130
そらもあるけど
基本は書き間違えとか
「あっミスって墨落として変なとこ繋がったけどええわ」とか
「変なとこに点ついたけどええわ」
ってなって残っとるのが多い
140 :5円まとめ 2017/12/24(日) 21:38:46 5jjDxDdD0EVE
これを全部手作業でぽちぽち追加してたってまじ?
この国効率悪すぎやろ……
169 :5円まとめ 2017/12/24(日) 21:42:24 wxM1IXXV0EVE
どうでもいいことに金使うな
さいとうなんか全部斉藤でええわ
193 :5円まとめ 2017/12/24(日) 21:46:25 PXhiWlZepEVE
こんなアホな事に15年間も掛けてるから世界に取り残されるんだぞ

シェアしてください。

このエントリーをはてなブックマークに追加