ここでは虹裏imgのかなり古い過去ログを閲覧することができます。
20/06/11(木)22:19:12 No.698574616
昔のhtml開いたらUTFじゃなくて文字化けしちゃった
1 20/06/11(木)22:32:50 No.698579862
うんうん エンコード変えて開きなおそうねぇ
2 20/06/11(木)22:38:13 No.698581854
文字コードの自動判定は結構難しいからな…
3 20/06/11(木)22:41:29 [BOM付き] No.698583064
UTF-8に統一して…
4 20/06/11(木)22:42:30 No.698583486
今はBOMつけない方がいいんだったかな…
5 20/06/11(木)22:42:48 No.698583623
>UTF-8に統一して… BOMはやめろ
6 20/06/11(木)22:44:05 No.698584104
UTF-8って最初の頃は文句言われてた覚えがあるけど 普及しちゃうとこれに統一しろや!ってなるもんだな
7 20/06/11(木)22:44:16 No.698584164
>今はBOMつけない方がいいんだったかな… BOM自体UTF-16の残滓みたいなもんだからな… ASCIIとの互換重視でUTF-8作ったのにBOMついたら互換じゃないじゃんという
8 20/06/11(木)22:45:39 [ExcelのBOM付きCSV] No.698584666
>UTF-8に統一して…
9 20/06/11(木)22:45:58 No.698584791
UnicodeとUTFの皆さんの違いをよく理解していない… UTFも本当は16の方がいいのかな
10 20/06/11(木)22:47:31 No.698585436
本家VSの方がデフォルトだとBOM付きブリブリ生成するのが邪悪すぎる
11 20/06/11(木)22:47:39 ID:v01UG0gU v01UG0gU No.698585486
美乳って書いとくとかのあれか
12 20/06/11(木)22:48:14 No.698585723
>本家VSの方がデフォルトだとBOM付きブリブリ生成するのが邪悪すぎる マジか なんか不安になってきた
13 20/06/11(木)22:50:33 No.698586692
文字コードって何が一番偉いの? それに統一するから教えて
14 20/06/11(木)22:51:23 No.698587028
HTMLはもうUTF-8しか使えないことになってるらしいな
15 20/06/11(木)22:52:20 No.698587420
とりあえずUTF8先生に頭下げれば良さそうだな…
16 20/06/11(木)22:52:32 No.698587502
>UnicodeとUTFの皆さんの違いをよく理解していない… >UTFも本当は16の方がいいのかな Unicodeが文字の集合体でUTFはUnicodeで規定された文字を符号化する方式だよ UTF-16なら1文字16bit、UTF-8なら1文字8bitからの可変長 BOMはデータを頭から読むか後ろから読むかというビッグエンディアン/リトルエンディアンという過去の処理方式の歴史的経緯のためにあるバイトオーダーマークのことだ 昔はBOM付UTF-16が本命だったのでWindowsはこれを採用したが日中韓の漢字は全部同じだと思ってなめた設計だったとか3万ちょっとしかないそのフィールドにハングルを1万2千個も突っ込まれて大混乱が起きたとか色々あってUTF-8が生まれた
17 20/06/11(木)22:52:37 No.698587527
>文字コードって何が一番偉いの? >それに統一するから教えて UTF-9
18 20/06/11(木)22:53:53 No.698588042
>昔はBOM付UTF-16が本命だったのでWindowsはこれを採用したが日中韓の漢字は全部同じだと思ってなめた設計だったとか3万ちょっとしかないそのフィールドにハングルを1万2千個も突っ込まれて大混乱が起きたとか色々あってUTF-8が生まれた おおう… あと絵文字がなんかよくないそうだね… 政治的にも
19 20/06/11(木)22:53:58 No.698588076
EUC-JP「よっ!なんの話してんの?」
20 20/06/11(木)22:55:14 No.698588599
UTF-16も実質可変長みたいになってるしやめて欲しい
21 20/06/11(木)22:55:22 No.698588650
UTF-16とUTF-8って後者のほうが後から生まれたのか… 数字がでかいから16が後かと思ってた…
22 20/06/11(木)22:55:41 No.698588779
UTF-16は固定長にする予定だった 足りなかった
23 20/06/11(木)22:56:00 No.698588892
>UTF-16も実質可変長みたいになってるしやめて欲しい サロゲートペアいいよね…
24 20/06/11(木)22:56:36 No.698589118
>UTF-8って最初の頃は文句言われてた覚えがあるけど >普及しちゃうとこれに統一しろや!ってなるもんだな 文句言ってたのは大体環境変えたくない老害だった印象
25 20/06/11(木)22:56:58 No.698589262
>>UTF-16も実質可変長みたいになってるしやめて欲しい >サロゲートペアいいよね… よくねえよ! 文字コードの問題がアプリケーションロジックに影響してくるの怖すぎる
26 20/06/11(木)22:57:27 No.698589452
utf-8でいいよ
27 20/06/11(木)22:57:30 No.698589469
>>UTF-16も実質可変長みたいになってるしやめて欲しい >サロゲートペアいいよね… よくねーよマジでよくねーよ…
28 20/06/11(木)22:57:40 No.698589536
UTF-8に統一してって言うのはわかるけど まずはWinのデフォルト文字コードをSJISにしてるMSに文句言ってくれ
29 20/06/11(木)22:57:44 No.698589564
>UTF-8って最初の頃は文句言われてた覚えがある 興味としてなんで?
30 20/06/11(木)22:57:51 No.698589616
なんかスレ画文字コード判定の精度低くない?
31 20/06/11(木)22:57:57 No.698589654
emojiで完全にUTF-16/32は死んだ だって1文字表現するのに10バイト以上使うとかあるぜあれ
32 20/06/11(木)22:58:35 No.698589901
>emojiで完全にUTF-16/32は死んだ >だって1文字表現するのに10バイト以上使うとかあるぜあれ すみません肌の色が
33 20/06/11(木)22:59:04 No.698590091
>だって1文字表現するのに10バイト以上使うとかあるぜあれ ゴミ機能だと思ってたけど重要なのあれ…
34 20/06/11(木)22:59:35 No.698590301
>なんかスレ画文字コード判定の精度低くない? というか基本UTFしか読めない
35 20/06/11(木)23:00:10 No.698590523
UTFしか読めなければみんなUTFしか使わなくなる理論
36 20/06/11(木)23:00:19 No.698590584
>というか基本UTFしか読めない UTF16も結構判定ミスるな まあ難しいのかもしれないけど
37 20/06/11(木)23:00:19 No.698590585
JavaScriptで絵文字読んだら文字数がすごいことになった 複数文字扱いなのね
38 20/06/11(木)23:00:55 No.698590794
>だって1文字表現するのに10バイト以上使うとかあるぜあれ あれは複数文字で1文字を表現してるだけで文字コードはあまり関係ない
39 20/06/11(木)23:01:15 No.698590926
>UTF-16とUTF-8って後者のほうが後から生まれたのか… >数字がでかいから16が後かと思ってた… 16bitあれば地上の現存文字は全部表せるだろうと思った 表意文字を国ごとに入れたらフツーに足りなかったので慌ててサロゲートペアという32bit・48bitとつなげてく仕組みを作ったが泥縄で効率が悪い上に荒らし・嫌がらせ・混乱の元だった UTF-8もサロゲートペアを使うのでこれもCJK対応でバグの元だったがスマホの普及で絵文字が多用されるようになってこいつが合字やサロゲートペアの塊なのでCJK関連のバグも一緒になくなったという副次効果が発生した
40 20/06/11(木)23:02:31 No.698591433
>UTF-8に統一してって言うのはわかるけど >まずはWinのデフォルト文字コードをSJISにしてるMSに文句言ってくれ 日本語だけじゃねーか あと今は日本語でもUTF-8にできる
41 20/06/11(木)23:02:43 No.698591495
絵文字が世界を救う未来線があったなんて ガラケー時代には夢にも思わなかった
42 20/06/11(木)23:03:22 No.698591723
iosに絵文字が採用されたのが大きい
43 20/06/11(木)23:03:48 No.698591892
>まずはWinのデフォルト文字コードをSJISにしてるMSに文句言ってくれ MS「じゃあANSIなAPIはUTF-8ということにするね!」
44 20/06/11(木)23:04:04 No.698591988
>昔はBOM付UTF-16が本命だったのでWindowsはこれを採用したが日中韓の漢字は全部同じだと思ってなめた設計だったとか3万ちょっとしかないそのフィールドにハングルを1万2千個も突っ込まれて大混乱が起きたとか色々あってUTF-8が生まれた 愚かな質問かもしれないけど そのフィールドというのは簡単には増やせないの? 足りなくなったら増やせばいいじゃんと思ったのだけど
45 20/06/11(木)23:04:28 No.698592166
>まずはWinのデフォルト文字コードをSJISにしてるMSに文句言ってくれ アレは変えちゃうと既存アプリがぶっ壊れるからしょうがねえんだよ 実験機能でUTF-8にはできるがアプリ互換性は保証されない あとPowershellとかWSLはUTF-8がデフォになったからシェルだけで我慢しろ
46 20/06/11(木)23:05:09 No.698592428
元号の合字とか予約してまで必要だったの?
47 20/06/11(木)23:05:22 No.698592510
昔はWebサービスとか最低限ShiftJISとEUC-JPとUTF-8を考慮して開発しなくちゃいけなかったのにすっかり楽になったよな
48 20/06/11(木)23:05:29 No.698592545
英数字以外滅べば良いんだ
49 20/06/11(木)23:05:51 No.698592679
文字コードの厄介さは本当になんとかならんのと思う… 最近ようやくまとまってきてマシにはなってるけど
50 20/06/11(木)23:06:17 No.698592895
全角英数字滅ばないかな…
51 20/06/11(木)23:06:31 No.698592980
>足りなくなったら増やせばいいじゃんと思ったのだけど それがサロゲートペアです
52 20/06/11(木)23:06:33 No.698593000
今は丸数字も気軽に使えるからなー
53 20/06/11(木)23:06:57 No.698593161
>そのフィールドというのは簡単には増やせないの? 結果的にUnicodeのコードページ書き換えという大事件に発展して既に割り当ててあったハングルを別の場所に大移動させて定義しなおした、バグの元 >足りなくなったら増やせばいいじゃんと思ったのだけど これがサロゲートペアという仕組みの導入で無理やり領域を広げた、バグの元
54 20/06/11(木)23:07:19 No.698593318
>あとPowershellとかWSLはUTF-8がデフォになったからシェルだけで我慢しろ 確かbomなしだよね 新しめのバージョンでしか使えないっぽいけどこれ凄いありがたい やっとまともにpowershell使う気になる
55 20/06/11(木)23:07:21 No.698593333
データ生成部が数行でエンコーディング対応部が数十行のコード書いてると悲しくなる
56 20/06/11(木)23:07:46 No.698593482
割と無茶なことやってるんだな…
57 20/06/11(木)23:07:47 No.698593489
面倒すぎるからもう全部UTF-8にしてくだち
58 20/06/11(木)23:08:14 No.698593686
そういやChromeって2年ぐらい前からエンコード切り替えなくしたよね これときどきかなり困る
59 20/06/11(木)23:08:23 No.698593743
文字コード大統一時代が近づきつつある
60 20/06/11(木)23:08:29 No.698593789
サロゲートペアとか合成絵文字とかなんなの
61 20/06/11(木)23:08:36 No.698593834
たかが文字になんでこんな面倒ごとに
62 20/06/11(木)23:08:39 No.698593863
IPv6に切り替わるような時代になったら統一されるんだろうな
63 20/06/11(木)23:09:00 No.698594008
>面倒すぎるからもう全部UTF-8にしてくだち 1文字が固定長であってくれるとマジで楽なんだよ… 逆に可変長だとめちゃくちゃ面倒なんだよ…
64 20/06/11(木)23:09:15 No.698594138
絵文字が便利なばかりに一部地域の問題を世界中に押し付けてみんながようやく頑張り始めて万々歳という感じなのかな
65 20/06/11(木)23:09:44 No.698594345
確かにこれ何バイトだっけ?とはなる
66 20/06/11(木)23:10:08 No.698594525
こいつエンコードの自動判別だけはしょぼい気がする TeraPadのほうがよっぽど正確に開く
67 20/06/11(木)23:10:13 No.698594567
しかし絵文字って国際語にまでなってるのね
68 20/06/11(木)23:10:25 No.698594657
>そういやChromeって2年ぐらい前からエンコード切り替えなくしたよね >これときどきかなり困る この前これで困ったな… なんでなくしたんだろう…
69 20/06/11(木)23:10:34 No.698594712
そういえば昔はブラウジングしててやたら文字化けした気がする…
70 20/06/11(木)23:10:39 No.698594752
1文字8byteにすれば解決だな
71 20/06/11(木)23:10:43 No.698594768
visualStudioでテンプレートからファイル作ると文字コード違って悲しくなる時がある
72 20/06/11(木)23:10:50 No.698594806
昔テスト用のPGに読み込ませるファイルにいつの間にかBOMついててテストが動かなくなったのが本当にトラウマ
73 20/06/11(木)23:10:54 No.698594831
>MS「じゃあANSIなAPIはUTF-8ということにするね!」 おまえやっと最近のドキュメントでUTF-8とはANSIのことではありませんって断りを入れるようになったよな
74 20/06/11(木)23:11:34 No.698595134
>この前これで困ったな… >なんでなくしたんだろう… いい加減sjis使うのやめろやって怒りだと認識した
75 20/06/11(木)23:11:51 No.698595271
後は改行コードとか"~"とか"―"とか見た目がほぼ一緒なのに文字コードが違ったりしてそれに対応したりとか嫌な思い出が蘇ってきた…
76 20/06/11(木)23:11:58 No.698595323
文字コード関連のエラーってわかりにくいこと多いんだよね
77 20/06/11(木)23:12:10 No.698595403
こいつの自動判定はかなりアホだよね やたらSJISまともに認識されないこと多い
78 20/06/11(木)23:12:33 No.698595543
むしろBOM付けないとバグるから一括変換ツールでBOM付きUTF-8に変換してる
79 20/06/11(木)23:12:45 No.698595619
>そういやChromeって2年ぐらい前からエンコード切り替えなくしたよね >これときどきかなり困る ここにテキストファイルでSS貼られるとほぼ確で文字化けするんだよな
80 20/06/11(木)23:12:58 No.698595707
>なんでなくしたんだろう… IETFとW3CでWebサイトとはUTF-8で記述されるものってかなり昔に決まって標準外のサイトは段階的に切り捨てることになったから
81 20/06/11(木)23:14:01 [CP932] No.698596099
SJISです
82 20/06/11(木)23:15:16 No.698596614
そういやWin10でコマンドプロンプトにUTF8出せるようになったしひょっとして本気でSJISいらんのかな今
83 20/06/11(木)23:15:32 No.698596733
プログラミング初めて文字コードで悩まされてWindows嫌い!ってなった
84 20/06/11(木)23:16:21 No.698597061
>SJISです PHPで"SJIS"と"SJIS-WIN"で挙動が変わってバグってたの思い出した…
85 20/06/11(木)23:16:44 No.698597206
おのれケントンプソン…
86 20/06/11(木)23:16:54 No.698597265
>1文字8byteにすれば解決だな いまだにUTF-8だから1文字1Byteだな!ってバイトカウント=文字数にするマヌケプログラマはいる
87 20/06/11(木)23:16:56 No.698597274
Windowsのせいではないとおもう perlの頃一番苦しんだ