虹裏img歴史資料館

ここでは虹裏imgのかなり古い過去ログを閲覧することができます。新しいログはこちらにあります

20/06/11(木)22:19:12 昔のhtm... のスレッド詳細

削除依頼やバグ報告は メールフォーム にお願いします。個人情報、名誉毀損、侵害等については積極的に削除しますので、 メールフォーム より該当URLをご連絡いただけると助かります。

画像ファイル名:1591881552172.jpg 20/06/11(木)22:19:12 No.698574616

昔のhtml開いたらUTFじゃなくて文字化けしちゃった

1 20/06/11(木)22:32:50 No.698579862

うんうん エンコード変えて開きなおそうねぇ

2 20/06/11(木)22:38:13 No.698581854

文字コードの自動判定は結構難しいからな…

3 <a href="mailto:BOM付き">20/06/11(木)22:41:29</a> [BOM付き] No.698583064

UTF-8に統一して…

4 20/06/11(木)22:42:30 No.698583486

今はBOMつけない方がいいんだったかな…

5 20/06/11(木)22:42:48 No.698583623

>UTF-8に統一して… BOMはやめろ

6 20/06/11(木)22:44:05 No.698584104

UTF-8って最初の頃は文句言われてた覚えがあるけど 普及しちゃうとこれに統一しろや!ってなるもんだな

7 20/06/11(木)22:44:16 No.698584164

>今はBOMつけない方がいいんだったかな… BOM自体UTF-16の残滓みたいなもんだからな… ASCIIとの互換重視でUTF-8作ったのにBOMついたら互換じゃないじゃんという

8 <a href="mailto:ExcelのBOM付きCSV">20/06/11(木)22:45:39</a> [ExcelのBOM付きCSV] No.698584666

>UTF-8に統一して…

9 20/06/11(木)22:45:58 No.698584791

UnicodeとUTFの皆さんの違いをよく理解していない… UTFも本当は16の方がいいのかな

10 20/06/11(木)22:47:31 No.698585436

本家VSの方がデフォルトだとBOM付きブリブリ生成するのが邪悪すぎる

11 20/06/11(木)22:47:39 ID:v01UG0gU v01UG0gU No.698585486

美乳って書いとくとかのあれか

12 20/06/11(木)22:48:14 No.698585723

>本家VSの方がデフォルトだとBOM付きブリブリ生成するのが邪悪すぎる マジか なんか不安になってきた

13 20/06/11(木)22:50:33 No.698586692

文字コードって何が一番偉いの? それに統一するから教えて

14 20/06/11(木)22:51:23 No.698587028

HTMLはもうUTF-8しか使えないことになってるらしいな

15 20/06/11(木)22:52:20 No.698587420

とりあえずUTF8先生に頭下げれば良さそうだな…

16 20/06/11(木)22:52:32 No.698587502

>UnicodeとUTFの皆さんの違いをよく理解していない… >UTFも本当は16の方がいいのかな Unicodeが文字の集合体でUTFはUnicodeで規定された文字を符号化する方式だよ UTF-16なら1文字16bit、UTF-8なら1文字8bitからの可変長 BOMはデータを頭から読むか後ろから読むかというビッグエンディアン/リトルエンディアンという過去の処理方式の歴史的経緯のためにあるバイトオーダーマークのことだ 昔はBOM付UTF-16が本命だったのでWindowsはこれを採用したが日中韓の漢字は全部同じだと思ってなめた設計だったとか3万ちょっとしかないそのフィールドにハングルを1万2千個も突っ込まれて大混乱が起きたとか色々あってUTF-8が生まれた

17 20/06/11(木)22:52:37 No.698587527

>文字コードって何が一番偉いの? >それに統一するから教えて UTF-9

18 20/06/11(木)22:53:53 No.698588042

>昔はBOM付UTF-16が本命だったのでWindowsはこれを採用したが日中韓の漢字は全部同じだと思ってなめた設計だったとか3万ちょっとしかないそのフィールドにハングルを1万2千個も突っ込まれて大混乱が起きたとか色々あってUTF-8が生まれた おおう… あと絵文字がなんかよくないそうだね… 政治的にも

19 20/06/11(木)22:53:58 No.698588076

EUC-JP「よっ!なんの話してんの?」

20 20/06/11(木)22:55:14 No.698588599

UTF-16も実質可変長みたいになってるしやめて欲しい

21 20/06/11(木)22:55:22 No.698588650

UTF-16とUTF-8って後者のほうが後から生まれたのか… 数字がでかいから16が後かと思ってた…

22 20/06/11(木)22:55:41 No.698588779

UTF-16は固定長にする予定だった 足りなかった

23 20/06/11(木)22:56:00 No.698588892

>UTF-16も実質可変長みたいになってるしやめて欲しい サロゲートペアいいよね…

24 20/06/11(木)22:56:36 No.698589118

>UTF-8って最初の頃は文句言われてた覚えがあるけど >普及しちゃうとこれに統一しろや!ってなるもんだな 文句言ってたのは大体環境変えたくない老害だった印象

25 20/06/11(木)22:56:58 No.698589262

>>UTF-16も実質可変長みたいになってるしやめて欲しい >サロゲートペアいいよね… よくねえよ! 文字コードの問題がアプリケーションロジックに影響してくるの怖すぎる

26 20/06/11(木)22:57:27 No.698589452

utf-8でいいよ

27 20/06/11(木)22:57:30 No.698589469

>>UTF-16も実質可変長みたいになってるしやめて欲しい >サロゲートペアいいよね… よくねーよマジでよくねーよ…

28 20/06/11(木)22:57:40 No.698589536

UTF-8に統一してって言うのはわかるけど まずはWinのデフォルト文字コードをSJISにしてるMSに文句言ってくれ

29 20/06/11(木)22:57:44 No.698589564

>UTF-8って最初の頃は文句言われてた覚えがある 興味としてなんで?

30 20/06/11(木)22:57:51 No.698589616

なんかスレ画文字コード判定の精度低くない?

31 20/06/11(木)22:57:57 No.698589654

emojiで完全にUTF-16/32は死んだ だって1文字表現するのに10バイト以上使うとかあるぜあれ

32 20/06/11(木)22:58:35 No.698589901

>emojiで完全にUTF-16/32は死んだ >だって1文字表現するのに10バイト以上使うとかあるぜあれ すみません肌の色が

33 20/06/11(木)22:59:04 No.698590091

>だって1文字表現するのに10バイト以上使うとかあるぜあれ ゴミ機能だと思ってたけど重要なのあれ…

34 20/06/11(木)22:59:35 No.698590301

>なんかスレ画文字コード判定の精度低くない? というか基本UTFしか読めない

35 20/06/11(木)23:00:10 No.698590523

UTFしか読めなければみんなUTFしか使わなくなる理論

36 20/06/11(木)23:00:19 No.698590584

>というか基本UTFしか読めない UTF16も結構判定ミスるな まあ難しいのかもしれないけど

37 20/06/11(木)23:00:19 No.698590585

JavaScriptで絵文字読んだら文字数がすごいことになった 複数文字扱いなのね

38 20/06/11(木)23:00:55 No.698590794

>だって1文字表現するのに10バイト以上使うとかあるぜあれ あれは複数文字で1文字を表現してるだけで文字コードはあまり関係ない

39 20/06/11(木)23:01:15 No.698590926

>UTF-16とUTF-8って後者のほうが後から生まれたのか… >数字がでかいから16が後かと思ってた… 16bitあれば地上の現存文字は全部表せるだろうと思った 表意文字を国ごとに入れたらフツーに足りなかったので慌ててサロゲートペアという32bit・48bitとつなげてく仕組みを作ったが泥縄で効率が悪い上に荒らし・嫌がらせ・混乱の元だった UTF-8もサロゲートペアを使うのでこれもCJK対応でバグの元だったがスマホの普及で絵文字が多用されるようになってこいつが合字やサロゲートペアの塊なのでCJK関連のバグも一緒になくなったという副次効果が発生した

40 20/06/11(木)23:02:31 No.698591433

>UTF-8に統一してって言うのはわかるけど >まずはWinのデフォルト文字コードをSJISにしてるMSに文句言ってくれ 日本語だけじゃねーか あと今は日本語でもUTF-8にできる

41 20/06/11(木)23:02:43 No.698591495

絵文字が世界を救う未来線があったなんて ガラケー時代には夢にも思わなかった

42 20/06/11(木)23:03:22 No.698591723

iosに絵文字が採用されたのが大きい

43 20/06/11(木)23:03:48 No.698591892

>まずはWinのデフォルト文字コードをSJISにしてるMSに文句言ってくれ MS「じゃあANSIなAPIはUTF-8ということにするね!」

44 20/06/11(木)23:04:04 No.698591988

>昔はBOM付UTF-16が本命だったのでWindowsはこれを採用したが日中韓の漢字は全部同じだと思ってなめた設計だったとか3万ちょっとしかないそのフィールドにハングルを1万2千個も突っ込まれて大混乱が起きたとか色々あってUTF-8が生まれた 愚かな質問かもしれないけど そのフィールドというのは簡単には増やせないの? 足りなくなったら増やせばいいじゃんと思ったのだけど

45 20/06/11(木)23:04:28 No.698592166

>まずはWinのデフォルト文字コードをSJISにしてるMSに文句言ってくれ アレは変えちゃうと既存アプリがぶっ壊れるからしょうがねえんだよ 実験機能でUTF-8にはできるがアプリ互換性は保証されない あとPowershellとかWSLはUTF-8がデフォになったからシェルだけで我慢しろ

46 20/06/11(木)23:05:09 No.698592428

元号の合字とか予約してまで必要だったの?

47 20/06/11(木)23:05:22 No.698592510

昔はWebサービスとか最低限ShiftJISとEUC-JPとUTF-8を考慮して開発しなくちゃいけなかったのにすっかり楽になったよな

48 20/06/11(木)23:05:29 No.698592545

英数字以外滅べば良いんだ

49 20/06/11(木)23:05:51 No.698592679

文字コードの厄介さは本当になんとかならんのと思う… 最近ようやくまとまってきてマシにはなってるけど

50 20/06/11(木)23:06:17 No.698592895

全角英数字滅ばないかな…

51 20/06/11(木)23:06:31 No.698592980

>足りなくなったら増やせばいいじゃんと思ったのだけど それがサロゲートペアです

52 20/06/11(木)23:06:33 No.698593000

今は丸数字も気軽に使えるからなー

53 20/06/11(木)23:06:57 No.698593161

>そのフィールドというのは簡単には増やせないの? 結果的にUnicodeのコードページ書き換えという大事件に発展して既に割り当ててあったハングルを別の場所に大移動させて定義しなおした、バグの元 >足りなくなったら増やせばいいじゃんと思ったのだけど これがサロゲートペアという仕組みの導入で無理やり領域を広げた、バグの元

54 20/06/11(木)23:07:19 No.698593318

>あとPowershellとかWSLはUTF-8がデフォになったからシェルだけで我慢しろ 確かbomなしだよね 新しめのバージョンでしか使えないっぽいけどこれ凄いありがたい やっとまともにpowershell使う気になる

55 20/06/11(木)23:07:21 No.698593333

データ生成部が数行でエンコーディング対応部が数十行のコード書いてると悲しくなる

56 20/06/11(木)23:07:46 No.698593482

割と無茶なことやってるんだな…

57 20/06/11(木)23:07:47 No.698593489

面倒すぎるからもう全部UTF-8にしてくだち

58 20/06/11(木)23:08:14 No.698593686

そういやChromeって2年ぐらい前からエンコード切り替えなくしたよね これときどきかなり困る

59 20/06/11(木)23:08:23 No.698593743

文字コード大統一時代が近づきつつある

60 20/06/11(木)23:08:29 No.698593789

サロゲートペアとか合成絵文字とかなんなの

61 20/06/11(木)23:08:36 No.698593834

たかが文字になんでこんな面倒ごとに

62 20/06/11(木)23:08:39 No.698593863

IPv6に切り替わるような時代になったら統一されるんだろうな

63 20/06/11(木)23:09:00 No.698594008

>面倒すぎるからもう全部UTF-8にしてくだち 1文字が固定長であってくれるとマジで楽なんだよ… 逆に可変長だとめちゃくちゃ面倒なんだよ…

64 20/06/11(木)23:09:15 No.698594138

絵文字が便利なばかりに一部地域の問題を世界中に押し付けてみんながようやく頑張り始めて万々歳という感じなのかな

65 20/06/11(木)23:09:44 No.698594345

確かにこれ何バイトだっけ?とはなる

66 20/06/11(木)23:10:08 No.698594525

こいつエンコードの自動判別だけはしょぼい気がする TeraPadのほうがよっぽど正確に開く

67 20/06/11(木)23:10:13 No.698594567

しかし絵文字って国際語にまでなってるのね

68 20/06/11(木)23:10:25 No.698594657

>そういやChromeって2年ぐらい前からエンコード切り替えなくしたよね >これときどきかなり困る この前これで困ったな… なんでなくしたんだろう…

69 20/06/11(木)23:10:34 No.698594712

そういえば昔はブラウジングしててやたら文字化けした気がする…

70 20/06/11(木)23:10:39 No.698594752

1文字8byteにすれば解決だな

71 20/06/11(木)23:10:43 No.698594768

visualStudioでテンプレートからファイル作ると文字コード違って悲しくなる時がある

72 20/06/11(木)23:10:50 No.698594806

昔テスト用のPGに読み込ませるファイルにいつの間にかBOMついててテストが動かなくなったのが本当にトラウマ

73 20/06/11(木)23:10:54 No.698594831

>MS「じゃあANSIなAPIはUTF-8ということにするね!」 おまえやっと最近のドキュメントでUTF-8とはANSIのことではありませんって断りを入れるようになったよな

74 20/06/11(木)23:11:34 No.698595134

>この前これで困ったな… >なんでなくしたんだろう… いい加減sjis使うのやめろやって怒りだと認識した

75 20/06/11(木)23:11:51 No.698595271

後は改行コードとか"~"とか"―"とか見た目がほぼ一緒なのに文字コードが違ったりしてそれに対応したりとか嫌な思い出が蘇ってきた…

76 20/06/11(木)23:11:58 No.698595323

文字コード関連のエラーってわかりにくいこと多いんだよね

77 20/06/11(木)23:12:10 No.698595403

こいつの自動判定はかなりアホだよね やたらSJISまともに認識されないこと多い

78 20/06/11(木)23:12:33 No.698595543

むしろBOM付けないとバグるから一括変換ツールでBOM付きUTF-8に変換してる

79 20/06/11(木)23:12:45 No.698595619

>そういやChromeって2年ぐらい前からエンコード切り替えなくしたよね >これときどきかなり困る ここにテキストファイルでSS貼られるとほぼ確で文字化けするんだよな

80 20/06/11(木)23:12:58 No.698595707

>なんでなくしたんだろう… IETFとW3CでWebサイトとはUTF-8で記述されるものってかなり昔に決まって標準外のサイトは段階的に切り捨てることになったから

81 <a href="mailto:CP932">20/06/11(木)23:14:01</a> [CP932] No.698596099

SJISです

82 20/06/11(木)23:15:16 No.698596614

そういやWin10でコマンドプロンプトにUTF8出せるようになったしひょっとして本気でSJISいらんのかな今

83 20/06/11(木)23:15:32 No.698596733

プログラミング初めて文字コードで悩まされてWindows嫌い!ってなった

84 20/06/11(木)23:16:21 No.698597061

>SJISです PHPで"SJIS"と"SJIS-WIN"で挙動が変わってバグってたの思い出した…

85 20/06/11(木)23:16:44 No.698597206

おのれケントンプソン…

86 20/06/11(木)23:16:54 No.698597265

>1文字8byteにすれば解決だな いまだにUTF-8だから1文字1Byteだな!ってバイトカウント=文字数にするマヌケプログラマはいる

87 20/06/11(木)23:16:56 No.698597274

Windowsのせいではないとおもう perlの頃一番苦しんだ

↑Top