17/12/24(日)18:24:17 コンピ... のスレッド詳細
削除依頼やバグ報告は メールフォーム にお願いします。個人情報、名誉毀損、侵害等については積極的に削除しますので、 メールフォーム より該当URLをご連絡いただけると助かります。
画像ファイル名:1514107457561.png 17/12/24(日)18:24:17 No.473908697
コンピューターで全漢字使用可に 6万字コード化 日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。 https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
1 17/12/24(日)18:25:38 No.473908930
普通6卍のうち半分も使わないよね
2 17/12/24(日)18:26:35 No.473909107
1万字だけとかマジ卍~
3 17/12/24(日)18:26:56 No.473909183
この中の70パーセントぐらいは読めないんだと思うとつらい
4 17/12/24(日)18:26:59 No.473909193
UTF16になるの?
5 17/12/24(日)18:27:18 No.473909251
勉強しよ
6 17/12/24(日)18:27:23 No.473909263
カタモノクロデフラグ
7 17/12/24(日)18:27:29 No.473909278
どうせsjisからは抜け出さない
8 17/12/24(日)18:27:31 No.473909281
戸籍に書き間違えて新しい字が発生とか不毛すぎない昔の人
9 17/12/24(日)18:27:59 No.473909366
全漢字使用可能になるのとビッグデータの活用が自分のなかで繋がらないんだが
10 17/12/24(日)18:28:23 No.473909429
個人情報見る機会あるけど確かに文字化けはものすごく多い ヘタすると一文字しか読めないのもある
11 17/12/24(日)18:28:24 No.473909430
極東の国がリソース食い過ぎる……
12 17/12/24(日)18:28:30 No.473909453
>どうせutf8からは抜け出さない
13 17/12/24(日)18:28:52 No.473909513
渡辺とか斉藤とか間違った漢字使った過去の人多すぎる・・・
14 17/12/24(日)18:29:20 No.473909595
>極東の国がリソース食い過ぎる…… 日中韓で6割7割ぐらいある…
15 17/12/24(日)18:29:26 No.473909617
ふたばまだSJISなんだよな…
16 17/12/24(日)18:29:47 No.473909676
フォントの方は対応できんのか
17 17/12/24(日)18:30:09 No.473909737
最近しったのは高が本来の字ではしごのほうは印刷技術が未発達だったときのときのだってこと
18 17/12/24(日)18:30:21 No.473909776
>日中韓で6割7割ぐらいある… CJKで一カテゴリまとめられるぐらいだもんな…
19 17/12/24(日)18:30:30 No.473909809
作業は2002年からか…大変だったな
20 17/12/24(日)18:30:55 No.473909883
逆によく使われる彁
21 17/12/24(日)18:31:01 No.473909900
これで斉藤さんが救われるのか
22 17/12/24(日)18:31:06 No.473909917
これで何が出来るようになるんだ
23 17/12/24(日)18:31:20 No.473909959
㌏㌐
24 17/12/24(日)18:31:27 No.473909981
>作業は2002年からか…大変だったな 無駄な努力ご苦労様です…
25 17/12/24(日)18:31:51 No.473910060
超漢字は少数民族向けも入ってるのかな
26 17/12/24(日)18:32:04 No.473910093
いまだにビッグデータとかほざいてんのか
27 17/12/24(日)18:32:17 No.473910130
超漢字は少数民族向けも入ってるのかな
28 17/12/24(日)18:32:19 No.473910136
よくゲームのwikiとかでキャラ名の特殊な漢字に対応してないからそこだけカタカナみたいなのも無くなるのかな?
29 17/12/24(日)18:32:21 No.473910145
韓国語って一音に一字だと思ってたけどめちゃくちゃいっぱいあるのね…
30 17/12/24(日)18:32:30 No.473910171
吉田 𠮷田
31 17/12/24(日)18:33:37 No.473910370
プログラマだけどUTF-8以外はサポートする気無いよ… そこんとこよろしく
32 17/12/24(日)18:33:52 No.473910417
実際登録されてない字の「」はいるんだろうか
33 17/12/24(日)18:34:10 No.473910467
>田 テストでバツ食らうやつ
34 17/12/24(日)18:34:17 No.473910489
なんで15年もかかったの
35 17/12/24(日)18:34:20 No.473910500
視力2.0でもルーペが要った記憶
36 17/12/24(日)18:34:31 No.473910525
>プログラマだけどUTF-8以外はサポートする気無いよ… >そこんとこよろしく お前の会社の客に言ってこいよ ハゲ
37 17/12/24(日)18:34:48 No.473910598
UTF-8は3バイト以上の文字を押し付けたんだから 2^24の1/3使えるとしても何百万字も定義出来るよ EUC-JPも3バイト4バイトに出来た筈
38 17/12/24(日)18:35:04 No.473910647
現代の康熈字典だな
39 17/12/24(日)18:35:22 No.473910706
>韓国語って一音に一字だと思ってたけどめちゃくちゃいっぱいあるのね… 要素だけなら一つに一字だけど最大四つの組み合わせになるので kimとか三つ組み合わさって一字になる
40 17/12/24(日)18:35:30 No.473910726
>実際登録されてない字の「」はいるんだろうか 一割か二割ぐらいはいると思う
41 17/12/24(日)18:36:09 No.473910866
何が絵文字だ馬鹿馬鹿しい!
42 17/12/24(日)18:36:25 No.473910929
ハングル網羅しようとしてえらいことになったって話は聞いたな 組み合わせ文字でしょあれ
43 17/12/24(日)18:37:22 No.473911119
変体仮名とかもやってたんだっけ
44 17/12/24(日)18:37:49 No.473911225
あまりに汎用性のない漢字は使っている人や物の名前を変えた方がいい気がする
45 17/12/24(日)18:38:18 No.473911328
パソコン対応した!プリンタが対応していない!
46 17/12/24(日)18:38:50 No.473911460
>パソコン対応した!フォントが対応していない!
47 17/12/24(日)18:38:59 No.473911496
ふぉんとつくって やくめ
48 17/12/24(日)18:40:07 No.473911695
IPAExとNoto Sansがやってくれるさ
49 17/12/24(日)18:40:14 No.473911721
諸橋を全部定義するって話? JIS X 2017になるの?
50 17/12/24(日)18:40:16 No.473911733
>プログラマだけどUTF-8以外はサポートする気無いよ… >そこんとこよろしく 今回の話は文字集合側の話だし符号化方式は別に直接関係ないだろ…?
51 17/12/24(日)18:40:22 No.473911747
必要かな・・
52 17/12/24(日)18:41:04 No.473911900
カタ富山
53 17/12/24(日)18:41:06 No.473911908
うちの会社の社長の名前がDBに入らないことに気づいてわしは頭を抱えたよ・・・
54 17/12/24(日)18:41:44 No.473912014
じゃあお前の字は今日からこれなって言われてうnと言える人ならまあ要らないだろう
55 17/12/24(日)18:41:58 No.473912051
>一割か二割ぐらいはいると思う 渡辺の異体字も沢山あるみたいね
56 17/12/24(日)18:42:35 No.473912162
藤のバリエーションも知らねえよそんな違いってのがたくさんある
57 17/12/24(日)18:44:09 No.473912453
きごう一覧を眺めてるだけでたのしい
58 17/12/24(日)18:44:33 No.473912540
記事を読んでもいまいちはっきりしないんだけど 要するにUnicodeの第4面辺りにどかっと定義して申請したのがUnicode.orgで通ったってことなのかな
59 17/12/24(日)18:44:52 No.473912600
>今回の話は文字集合側の話だし符号化方式は別に直接関係ないだろ…? まあJISで定義されたら直ぐにUnicodeに行くでしょうしね 実際に文字セットの画が出来るかは全然別だけど
60 17/12/24(日)18:45:37 No.473912741
>パソコン対応した!プリンタが対応していない! プレビューで内容確認ヨシ!印刷ゴー!!!!!!!!!
61 17/12/24(日)18:45:37 No.473912745
>要するにUnicodeの第4面辺りにどかっと定義して申請したのがUnicode.orgで通ったってことなのかな JISでしょ
62 17/12/24(日)18:45:43 No.473912769
6万もフォント作れるか!ばか!
63 17/12/24(日)18:45:53 No.473912805
>>パソコン対応した!プリンタが対応していない! >プレビューで内容確認ヨシ!印刷ゴー!!!!!!!!! ������
64 17/12/24(日)18:46:33 No.473912912
ならば⇒ ゆえに∴
65 17/12/24(日)18:47:22 No.473913071
>6万もフォント作れるか!ばか! 逆に考えるんだビジネスチャンスだと
66 17/12/24(日)18:47:30 No.473913093
登記簿に『そ』だか『ふ』を縦に潰したような字があってなんて読むのか悩んだ事はある
67 17/12/24(日)18:48:06 No.473913207
15年もやってたの…
68 17/12/24(日)18:49:02 No.473913399
OSXは10年以上前から2万字弱持ってるんだけど… あと異字体の扱いとかまとめないうちにAdobeとAppleがUnicodeに片っ端から漢字を放り込んで阿鼻叫喚なのも触れてくれよ
69 17/12/24(日)18:49:25 No.473913464
>15年もやってたの… まず字の収集もしなきゃならんしそんぐらいかかるかなぁ…
70 17/12/24(日)18:49:25 No.473913465
斎とか辺とか変な変形が有りすぎる…
71 17/12/24(日)18:49:28 [幽霊文字] No.473913473
>登記簿に『そ』だか『ふ』を縦に潰したような字があってなんて読むのか悩んだ事はある 手書きなの?よくある話だ
72 17/12/24(日)18:50:07 No.473913597
絵文字が普及したおかげで日本語がどこの国の端末でも使えるようになったそうな
73 17/12/24(日)18:50:28 No.473913665
AIにフォント作ってもらえばいいんじゃ
74 17/12/24(日)18:51:06 No.473913786
草なぎとかがちゃんと漢字表記されるようになるのか
75 17/12/24(日)18:51:32 No.473913866
ふにゃふにゃってした落書きみたいな字いいよね よくない
76 17/12/24(日)18:52:08 No.473913982
超超超超漢字~
77 17/12/24(日)18:52:30 No.473914046
Unicodeは日本に関してはJIS X 0208, 0212, 0213しか採用してないじゃないの? 0201の半角はどうなってるんだろう?
78 17/12/24(日)18:53:08 No.473914171
>極東の国がリソース食い過ぎる…… 今年の漢字って日本でよく年末にニュースやってるけど あれは中国、台湾、シンガポール、マレーシアでもやってて驚かされる
79 17/12/24(日)18:53:18 No.473914203
>絵文字が普及したおかげで日本語がどこの国の端末でも使えるようになったそうな 外国人に人気ですよね (ツ)
80 17/12/24(日)18:53:22 No.473914217
効果としては普段全然使わない漢字の変換候補がボンボン出てきてうっとうしくなるのでは?
81 17/12/24(日)18:53:44 No.473914296
合理的に考えたら外字は全部標準に統合すれば良かったんだけどな
82 17/12/24(日)18:53:48 No.473914306
漢字の数自体は中国の方が多いんだよなぁ
83 17/12/24(日)18:53:55 No.473914333
間違えてもいつもの事と笑って済ませてくれる人いいよね・・・
84 17/12/24(日)18:54:23 No.473914411
アラビア語よりタイ語の方がミミズみたいでヤバイ
85 17/12/24(日)18:54:36 No.473914462
コンピュータ時代に合わせて少し減らしてもいいのでは
86 17/12/24(日)18:54:39 No.473914472
>漢字の数自体は中国の方が多いんだよなぁ 30万文字だっけ
87 17/12/24(日)18:54:44 No.473914490
IPA明朝とか対応してくれるだろ それ使えよ IPAのフリーフォントは良いできだと思うし
88 17/12/24(日)18:55:03 No.473914553
>コンピュータ時代に合わせて少し減らしてもいいのでは 昔と違って容量増えてるんだから増やすに決まってるでしょ
89 17/12/24(日)18:55:05 No.473914559
>間違えてもいつもの事と笑って済ませてくれる人いいよね・・・ ゆるすよ いまはね
90 17/12/24(日)18:56:06 No.473914769
>コンピュータ時代に合わせて少し減らしてもいいのでは ITもある意味公共事業の一種だから反対勢力も居るんだろう
91 17/12/24(日)18:56:08 No.473914773
>>コンピュータ時代に合わせて少し減らしてもいいのでは >昔と違って容量増えてるんだから増やすに決まってるでしょ 字を入力するのは人間なんですけお・・・
92 17/12/24(日)18:56:19 No.473914806
斎藤って名字がめちゃくちゃめんどいので標準感じにまとめてくださいお願いします
93 17/12/24(日)18:56:53 No.473914922
>藤のバリエーションも知らねえよそんな違いってのがたくさんある 草冠が++で間がくっついてないのとかあるけど異字体として管理するかの以前にフォント側で行書だとくっついてなかったりして余計ややこしいよね
94 17/12/24(日)18:56:58 No.473914952
>草なぎとかがちゃんと漢字表記されるようになるのか 今サポートされてるのだって出てこないのに…
95 17/12/24(日)18:57:40 No.473915099
ちゅうごくじんこの真ん中あたりの漢字全部覚えてるの? ばかじゃないの?!
96 17/12/24(日)18:57:43 No.473915104
>>>コンピュータ時代に合わせて少し減らしてもいいのでは >>昔と違って容量増えてるんだから増やすに決まってるでしょ >字を入力するのは人間なんですけお・・・ 工数で計上しましょうねー
97 17/12/24(日)18:57:54 No.473915141
邊のバリエーションみたいな表記ミスや謎のオリジナリティで増えた字は纏めて良いのでは?
98 17/12/24(日)18:58:01 No.473915164
さいとうさんとわたなべさんはバリエーション多すぎる…
99 17/12/24(日)18:58:26 No.473915258
地名人名はアイデンティティにも関わるからなぁ
100 17/12/24(日)18:58:48 No.473915350
こないだ文字コード扱う協会みたいなのから㍻のあとの 新しいやつが今度できるからここ開けといてねみたいな通達あったな
101 17/12/24(日)18:58:51 No.473915357
>邊のバリエーションみたいな表記ミスや謎のオリジナリティで増えた字は纏めて良いのでは? 人権侵害とかで騒ぎ出すんじゃねえかな ハンコとか戸籍もモロに影響食うし
102 17/12/24(日)18:59:22 No.473915464
>斎藤って名字がめちゃくちゃめんどいので標準感じにまとめてくださいお願いします 了解!齋藤!
103 17/12/24(日)18:59:27 No.473915480
>邊のバリエーションみたいな表記ミスや謎のオリジナリティで増えた字は纏めて良いのでは? 異体字かフォントか別の字なんて誰が決める
104 17/12/24(日)18:59:46 No.473915543
まだ漢字はアジア圏が使ってるから良いけどアフリカ圏のたくさんあるよくわからん言語とか全部合わせればすごいことになるよ?
105 17/12/24(日)19:00:08 No.473915618
常用漢字だけでいいじゃん 公務員の文書規則も努めて常用漢字を用いることって言ってるじゃん 消し飛ばしてくれよ異字! エラーの元だよ!
106 17/12/24(日)19:00:17 No.473915649
まとめましょうわかったまでは行けるとしても じゃあどれに?となると殺しあいが発生する
107 17/12/24(日)19:00:33 No.473915709
バリエーションはサジェストしてくれないと検索で迷子になるな
108 17/12/24(日)19:01:45 No.473915964
超漢字は3のときにライセンスで揉めて2で使えた漢字が豆腐になったときにもうダメだと思った…
109 17/12/24(日)19:02:22 No.473916117
>ちゅうごくじんこの真ん中あたりの漢字全部覚えてるの? 現代のちゅうごくじんは漢字を日本より簡略化してるから昔のごちゃごちゃした漢字は義務教育受けただけでは読めないのだ! 機って字はごちゃごちゃしててめんどくさいから同じ読みの机に置き換えたりして識字率を上げる方を優先してる
110 17/12/24(日)19:02:22 No.473916118
法的に使える字を制限するのはともかく古典表記とか美的とか趣味とかアイデンティティとかあるからなぁ
111 17/12/24(日)19:02:44 No.473916199
何が人権侵害だと言いたい アメリカ人がオリジナルアルファベット作ったからアルファベット30字に増やせって言ったらアホだと思うだろ それと同じことやってんだ
112 17/12/24(日)19:02:48 No.473916216
もう手書きに戻れ
113 17/12/24(日)19:02:52 No.473916233
>まとめましょうわかったまでは行けるとしても >じゃあどれに?となると殺しあいが発生する なんつーか文化やら先祖から継いできた名字変えろと言われたら戦争になるよな…
114 17/12/24(日)19:03:23 No.473916352
中国の簡体字は簡単なんじゃないの? あそこ読みを覚える必要も無いみたいだし
115 17/12/24(日)19:03:54 No.473916478
康熙字典そのままつっこんどけ!
116 17/12/24(日)19:04:01 No.473916500
>それと同じことやってんだ ブロック体や筆記体に喩えるべきだなソレは
117 17/12/24(日)19:04:09 No.473916530
読みを覚えなくていい漢字ってどういうことだ
118 17/12/24(日)19:05:00 No.473916756
誤用で発生した漢字はまとめていいと思う
119 17/12/24(日)19:05:23 No.473916855
>もう手書きに戻れ つまり昨今のAI技術のはったつをかんがみて ライター側が全部グラフィックで出力するのをリーダー側が文字認識して…
120 17/12/24(日)19:05:24 No.473916859
6万字の統一作業と国民に消える漢字の説明をしていくよりそのままコード化しちゃった方が楽だし なんにせよ偉業には違いないと思う
121 17/12/24(日)19:05:31 No.473916904
「機械」って画数の暴力を何とかした中国は偉いと思う
122 17/12/24(日)19:06:18 No.473917128
大漢和辞典+それ以外にあるのなんでしょ
123 17/12/24(日)19:06:41 No.473917237
人名にしか使わない漢字なんなの
124 17/12/24(日)19:06:51 No.473917274
今はもう電算だから新たな表記の字が増えることもないか…?
125 17/12/24(日)19:07:51 No.473917570
>アメリカ人がオリジナルアルファベット作ったからアルファベット30字に増やせって言ったらアホだと思うだろ 文化が違う
126 17/12/24(日)19:08:36 No.473917782
ほんとこういうとこアホだと思う
127 17/12/24(日)19:08:59 No.473917864
アメリカはまずポンドヤード法を撤廃して欲しいんですけお! 新規格提案とかやめてくだち!
128 17/12/24(日)19:09:08 No.473917899
すげーけど実際役に立つのか?とは思う
129 17/12/24(日)19:09:09 No.473917903
>今はもう電算だから新たな表記の字が増えることもないか…? JISの有名な幽霊文字は幾つも誤解や転記ミスから生まれたそうだが
130 17/12/24(日)19:09:16 No.473917927
岐阜の阜もレア
131 17/12/24(日)19:09:34 No.473918005
変換ミスで氏名不一致が更に増えるのか
132 17/12/24(日)19:09:37 No.473918015
滅んだ言語のアルファベットも入れようねえ
133 17/12/24(日)19:10:11 No.473918150
>アメリカ人がオリジナルアルファベット作ったからアルファベット30字に増やせって言ったらアホだと思うだろ ローマ字はもともと大文字しかなかったなぁ
134 17/12/24(日)19:10:22 No.473918189
ローマ字制にするか!
135 17/12/24(日)19:10:28 No.473918209
渡辺姓で字が雑なやつは消えて欲しい それで名簿作って「あ、字違います」とかアホか 土下座でもなんでもするしお願いだから統一してくれ
136 17/12/24(日)19:10:32 No.473918227
>変換ミスで氏名不一致が更に増えるのか さあ全部マイナンバーで管理しようねえ
137 17/12/24(日)19:11:14 No.473918394
unicodeってやつ?
138 17/12/24(日)19:11:35 No.473918497
同じ意味で漢字色々あるのってほんとに必要なの?
139 17/12/24(日)19:12:49 No.473918772
NHKで今やってる
140 17/12/24(日)19:12:51 No.473918779
ただ叩きたいだけのバカが沢山いますね
141 17/12/24(日)19:13:00 No.473918812
>康熙字典そのままつっこんどけ! 文字コードでもめると結局これに行き着くんだよね これに各国の国字と簡体字と日本で簡略化した分とか追加して…スレ分にある6万字くらいか
142 17/12/24(日)19:13:13 No.473918851
>同じ意味で漢字色々あるのってほんとに必要なの? まあニュアンスが違うとかはあるから… 人名は知らん
143 17/12/24(日)19:13:17 No.473918867
言語学に関していえば絶対必要
144 17/12/24(日)19:13:32 No.473918907
外字対応しなくて済むのは助かる
145 17/12/24(日)19:13:47 No.473918965
>同じ意味で漢字色々あるのってほんとに必要なの? 英単語で意味は同じでもニュアンスと使う場面が違う単語いっぱいあるから必要かどうかだと要ると思う 問題はその言葉や字の持つ意味なんて数十年ぐらいで変遷してしく方かも
146 17/12/24(日)19:14:09 No.473919033
漢字減らして一番困るのはお前等が大好きなアニメキャラだぞ
147 17/12/24(日)19:14:48 No.473919221
康熙字典は結構間違いとか多いから今は他の方が権威みたいな話だったと思うが
148 17/12/24(日)19:15:31 No.473919391
俺が要らないから困らないから要らねぇてのはそのまま言い返されるからやめとけ
149 17/12/24(日)19:16:09 No.473919525
そのまま対応すると単純に変換候補が6倍になるのかな
150 17/12/24(日)19:16:44 No.473919669
これunicodeに入れて貰えるの?
151 17/12/24(日)19:17:06 No.473919756
>ただ叩きたいだけのバカにしたいバカが沢山いますね
152 17/12/24(日)19:17:32 No.473919886
㌏ あたりから物凄いギンガマン成分を感じる
153 17/12/24(日)19:17:33 No.473919892
接続相手から良く分からない文字がどかどか送られてきて文字化け祭りになったりする? しないならいいけどするなら勘弁して欲しい
154 17/12/24(日)19:18:48 No.473920219
現代フランス語は国際仕様に耐えるように 純化と論理化を行ってめっちゃ語数減らした
155 17/12/24(日)19:18:52 No.473920241
渡辺とかマジで全員渡辺に統一しろや
156 17/12/24(日)19:19:56 No.473920528
切ると斬ると伐るとかの使い分けはわかるんだけど 渡辺の渡はホント無駄だと思う
157 17/12/24(日)19:20:04 No.473920559
>これunicodeに入れて貰えるの? と思うけど中国とか中国とかで同じ様に申請するとどうするんだろう? 前みたいに統一は面倒くさそうだし
158 17/12/24(日)19:20:17 No.473920617
本人が無頓着で斎でも斉でもいいやってパターンもあるんだろうな
159 17/12/24(日)19:20:50 No.473920752
「なべ」の方だった…
160 17/12/24(日)19:20:52 No.473920757
みやざきは宮崎じゃなくて宮﨑なんですーファンなら間違えるなよなーとか俺もよくやるけど本当不毛だと思う
161 17/12/24(日)19:22:56 No.473921280
いざフォントが無え!ってときの代替フォントをどれにするかってのは表示側でデータベース持つしかないんだろうか unicodeの符号化方法を工夫してこのコードはBMPのこれのバリアントですよみたいのをコード自体に含めるとかできないのかな