虹裏img歴史資料館 - imgの文化を学ぶ

ここでは虹裏imgのかなり古い過去ログを閲覧することができます。新しいログはこちらにあります

17/09/27(水)19:44:59 日本語... のスレッド詳細

削除依頼やバグ報告は メールフォーム にお願いします。個人情報、名誉毀損、侵害等については積極的に削除しますので、 メールフォーム より該当URLをご連絡いただけると助かります。

17/09/27(水)19:44:59 No.455768595

日本語は高圧縮言語 15字あれば大体伝わる(20字)

1 17/09/27(水)19:45:41 No.455768760

英語のレポートってなんで単語数でカウントするんだろう

2 17/09/27(水)19:47:06 No.455769046

575の17文字が最適

3 17/09/27(水)19:48:02 No.455769227

モーラで数えたらだいたい一緒になりそう

4 17/09/27(水)19:48:41 No.455769353

この日本語の15文字、英語34文字の値って何て言えばいいの? 中央値でも平均でも無いよね 統計でなんか呼び方あったっけ

5 17/09/27(水)19:48:49 No.455769374

バイト数では同じくらいじゃない?

6 17/09/27(水)19:49:13 No.455769449

ダヴィンチとかそんなやつ

7 17/09/27(水)19:49:52 No.455769584

2バイトだからほぼ一緒じゃん!

8 17/09/27(水)19:50:18 No.455769668

最頻値かな

9 17/09/27(水)19:50:50 No.455769778

15字以内で今日のできごとつぶやいてみてよ

10 17/09/27(水)19:51:02 No.455769808

今1バイトでも2バイトでも140文字制限なの?

11 17/09/27(水)19:51:16 No.455769854

もらしたおこられた

12 17/09/27(水)19:51:34 No.455769911

今日は何もない素晴らしい一日だった(17文字)

13 17/09/27(水)19:52:10 No.455770045

㌏㍂㌟㌞

14 17/09/27(水)19:52:25 No.455770101

>中央値でも平均でも無いよね 統計でなんか呼び方あったっけ ピークじゃ?

15 17/09/27(水)19:52:29 No.455770113

Unicodeのご時世だから3バイトかもしれない

16 17/09/27(水)19:52:38 No.455770142

英語以外の外国語勉強してると数字の読み方で日本語ほんと短けーなってなる

17 17/09/27(水)19:52:47 No.455770182

仕事、帰宅、めし(8)

18 17/09/27(水)19:53:26 No.455770317

文字数増やしてもレスポンチバトルが加速する未来しか見えない

19 17/09/27(水)19:54:25 No.455770529

>仕事、帰宅、めし(8) し、き、め 青森とかいくとこんなイメージ

20 17/09/27(水)19:54:41 No.455770603

おきたなう ごはんなう うんこなう

21 17/09/27(水)19:55:24 No.455770769

一番圧縮なのハングルじゃないかな

22 17/09/27(水)19:55:42 No.455770837

ヒって元々ほんとにつぶやきみたいな短いことを言うためのものだから英語基準でその字数になっているのであって 日本語だと本来上限50文字とかが適当なんじゃないかとふと思った

23 17/09/27(水)19:55:55 No.455770895

CJKはヒからハブられたの

24 17/09/27(水)19:56:19 No.455770969

アルファベット圏のツイート文字数が280文字になるんだっけ

25 17/09/27(水)19:56:21 No.455770976

ハングルは圧縮しすぎて前後の文章がないとよくわからないから・・・

26 17/09/27(水)19:56:50 No.455771080

ハブられたというかCJKが伝達効率良すぎるので それ以外を底上げしたんだ

27 17/09/27(水)19:57:12 No.455771167

ハングルはアルファベットと同じ子音と母音の組み合わせで最大4文字まで圧縮できるんだよな でも漢字には敵わない

28 17/09/27(水)19:57:44 No.455771285

英語って数字をわざわざアルファベット表記するよね

29 17/09/27(水)19:58:24 No.455771441

画数とか手間の面ではアルファベットとかの方が良いんだろうか

30 17/09/27(水)19:58:50 No.455771540

Twitterは日本語と相性いいんだよね 英語の140文字なんてほんと少ない

31 17/09/27(水)19:59:10 No.455771609

>英語って数字をわざわざアルファベット表記するよね 10未満の数字は単語で書くことが多い

32 17/09/27(水)19:59:11 No.455771613

>画数とか手間の面ではアルファベットとかの方が良いんだろうか 筆記体マジ便r…読めない!

33 17/09/27(水)19:59:15 No.455771624

ヘブライ語は

34 17/09/27(水)19:59:36 No.455771685

>画数とか手間の面ではアルファベットとかの方が良いんだろうか せいぜい50文字も覚えれば十分だからな…

35 17/09/27(水)20:00:09 No.455771790

電糞逃客勝

36 17/09/27(水)20:00:34 No.455771881

>仕事、帰宅、めし(8) ������

37 17/09/27(水)20:00:46 No.455771914

表意文字と表音文字を比べて何の意味が…?

38 17/09/27(水)20:01:07 No.455771987

あめりか人は筆記体分からないらしいな

39 17/09/27(水)20:01:30 No.455772076

>表意文字と表音文字を比べて何の意味が…? 表意文字と表音文字の圧縮率を比べる意味があるだろ

40 17/09/27(水)20:01:49 No.455772144

>あめりか人は筆記体分からないらしいな じゃあどんな文字使うの?

41 17/09/27(水)20:02:17 No.455772242

日本語のプログラミング言語つくったら流行る?

42 17/09/27(水)20:02:58 No.455772391

>じゃあどんな文字使うの?

43 17/09/27(水)20:02:59 No.455772394

流行らなかった

44 17/09/27(水)20:03:11 No.455772436

は?個人の自由だろ…

45 17/09/27(水)20:03:14 No.455772448

筆記体は誤解を招くのでオフィシャルな文書では推奨されない サインに使うくらい

46 17/09/27(水)20:03:50 No.455772586

>日本語のプログラミング言語つくったら流行る? 日本語入力クソ面倒臭い…

47 17/09/27(水)20:04:04 No.455772650

GJ部

48 17/09/27(水)20:04:07 No.455772659

ドイツ語も長いよね組み合わさった単語とか

49 17/09/27(水)20:04:12 No.455772684

まさかトランプから賄賂を…?

50 17/09/27(水)20:04:13 No.455772686

>筆記体は誤解を招くのでオフィシャルな文書では推奨されない >サインに使うくらい 中学の時授業で筆記体習ったけどあれはあんま意味なかったのか…

51 17/09/27(水)20:04:58 No.455772851

正式な表現がめちゃくちゃ長いだけで普段のカジュアルな短い呼び名があるとかじゃなくて本当に長いの?

52 17/09/27(水)20:05:06 No.455772871

ASCIIコードが日本語に置き換わった世界線にいこう

53 17/09/27(水)20:05:24 No.455772927

英語でつぶやくと言いたい事の2/3くらいで文字制限ひっかかる

54 17/09/27(水)20:05:24 No.455772932

日本人だけど草書体読めない

55 17/09/27(水)20:05:34 No.455772968

4 you

56 17/09/27(水)20:05:39 No.455772986

筆記体で見るのはサインと手紙?

57 17/09/27(水)20:06:05 No.455773085

4 u だった

58 17/09/27(水)20:06:10 No.455773107

4u

59 17/09/27(水)20:06:46 No.455773264

日本語は入力に手間がかかる代わりにバイト数はちょっと少なくなってお得ってとこだろうか?

60 17/09/27(水)20:07:36 No.455773446

>中学の時授業で筆記体習ったけどあれはあんま意味なかったのか… もともと速記のための技術という側面が強かった 今はデジタル文書あるから出番はない

61 17/09/27(水)20:10:37 No.455774114

it's datte 4 u

62 17/09/27(水)20:11:04 No.455774219

お あ し す

63 17/09/27(水)20:11:22 No.455774289

うにこーどでさらに圧縮された感がある

64 17/09/27(水)20:11:26 No.455774297

実際に発話した際の音の長さで調べた方がおもしろい気がするけど 標準的な話し言葉の早さの定義が存在しないから無理かな

65 17/09/27(水)20:11:31 No.455774308

この結果は日本語は高圧縮言語というよりも 言語によってあまり差はないっていう結果に見える…

66 17/09/27(水)20:11:58 No.455774383

プリンスが自分の歌に4だのuだのやたら使っててキモいなあと思ってたけど 今になって誰でも皆使うとはなー

67 17/09/27(水)20:12:18 No.455774446

次職場連絡待結局無履歴書書

68 17/09/27(水)20:12:27 No.455774473

ロシア語やジョージア語は子音が長い

69 17/09/27(水)20:12:54 No.455774582

日本語はutf-8で一文字最低2バイト最長6バイトあるから電子データ上では短くないよ

70 17/09/27(水)20:13:48 No.455774810

英語の筆記体は日常で普通に使われてるよ 英語圏で使ってないのアメリカぐらいだ

71 17/09/27(水)20:15:37 No.455775203

>実際に発話した際の音の長さで調べた方がおもしろい気がするけど 有名なのはベネディクト・カンバーバッチって書くとクソ長いけどあっちの人からすればベディカババって程度の短い名前なんよね

72 17/09/27(水)20:15:44 No.455775229

ちス気こ なんて英語なら hey! hey! hey~! it's transparent ,you know? hey you ~! なのにこれが4文字だぞ

73 17/09/27(水)20:16:40 No.455775444

>Unicodeのご時世だから3バイトかもしれない いいよねサロゲートペア…

74 17/09/27(水)20:16:47 No.455775472

>日本語はutf-8で一文字最低2バイト最長6バイトあるから電子データ上では短くないよ 6バイトのやつもあるの!? どうしてそこまで長くなったんだろう…

75 17/09/27(水)20:17:05 No.455775542

UTF-8にエンコードして何バイトになろうともTwitter上ではあくまでuser-perceived charactersが単位なので関係ないのだ

76 17/09/27(水)20:17:40 No.455775671

>10未満の数字は単語で書くことが多い あれは何でだろうねぇ なんか文化的な下地でもあるのかしら

77 17/09/27(水)20:17:55 No.455775715

モチラップとか相当意訳しないと絶対吹き出しに収まらないのは分かる

78 17/09/27(水)20:18:15 No.455775794

emojiも一般的だしUTFのデータ量はどうでもいいかなあ

79 17/09/27(水)20:18:30 No.455775841

>>10未満の数字は単語で書くことが多い >あれは何でだろうねぇ >なんか文化的な下地でもあるのかしら 日本で言うと第二次世界大戦は第2次世界大戦とはあまり書かないみたいなものだろうか

80 17/09/27(水)20:18:54 No.455775923

UTF-8の日本語文字はほぼ3バイトじゃないの

81 17/09/27(水)20:19:11 No.455775979

>>日本語のプログラミング言語つくったら流行る? >日本語入力クソ面倒臭い… 日本語入力はインクリメント検索がアルファベットほど快適でないのがつらい

82 17/09/27(水)20:19:58 No.455776137

プログラムは日本語をローマ字入力してんだからローマ字でいいだろって話なんよ…

83 17/09/27(水)20:20:22 No.455776226

触った事ないけどキューリみたいな名前の言語でしょ? 知ってるんだからそのくらい!

84 17/09/27(水)20:20:39 No.455776278

>ロシア語やジョージア語は子音が長い キリル語ってなんで2byte文字なのかしら 成り立ちからしたら1byteでもいけそうなのに

85 17/09/27(水)20:21:55 No.455776538

単純に長文はみんな分割投稿してるだけだと思う

86 17/09/27(水)20:22:24 No.455776654

漢字の種類多い時点でアルファベットで構成された文と比べてはいけない

87 17/09/27(水)20:23:31 No.455776880

>漢字の種類多い時点でアルファベットで構成された文と比べてはいけない なんで?

88 17/09/27(水)20:23:38 No.455776903

>日本語入力はインクリメント検索がアルファベットほど快適でないのがつらい ふっふっふ…migemoを知らない田舎者がなんとかかんとか…

89 17/09/27(水)20:24:22 No.455777061

イリヤの空でネタにされてたなそう言えば

90 17/09/27(水)20:25:37 No.455777342

日本語プログラミングだと記号の問題も大きいなあ 全部全角記号なのかってなる

91 17/09/27(水)20:25:46 No.455777383

>イリヤの空でネタにされてたなそう言えば 昔から言われてたことではある というか翻訳の本も英語版よりも文字を大きくしないと 本が薄くなるのでダメって言われる位に常識ではある

92 17/09/27(水)20:25:57 No.455777430

>漢字の種類多い時点でアルファベットで構成された文と比べてはいけない 漢字の種類が多いっていうのは一文字あたりのバイト数が多いことに反映されるから そこ含めて考えれば比べる意味はあるだろう

93 17/09/27(水)20:26:05 No.455777457

その理屈で行けば中国語ないし台湾語は日本語よりも短く済むんだよな

94 17/09/27(水)20:26:16 No.455777506

アラビア数字に関しては全角は死んでいいと思うんだ なんで全角があるんだよ

95 17/09/27(水)20:27:04 No.455777694

>その理屈で行けば中国語ないし台湾語は日本語よりも短く済むんだよな そうでもない 大抵の場合日本語よりも長くなりがち

96 17/09/27(水)20:27:22 No.455777769

>その理屈で行けば中国語ないし台湾語は日本語よりも短く済むんだよな そうなるね あと同じ見た目なのに言語圏でコード違うとかのクソ仕様が出来上がる

97 17/09/27(水)20:27:26 No.455777780

>大抵の場合日本語よりも長くなりがち えっなんで!?

98 17/09/27(水)20:28:22 No.455778007

>その理屈で行けば中国語ないし台湾語は日本語よりも短く済むんだよな むしろ日本語より文字が少ない分長くなるかもしれない

99 17/09/27(水)20:28:40 No.455778105

>えっなんで!? 俺も昔中国語の授業で聞いただけだからあれだが助詞とか接続詞が 割とカッチリ決まってて短縮が出来ず冗長になるんだと

100 17/09/27(水)20:28:53 No.455778165

フィンランド語とかアルファベット表記だけど 日本語並みに喋ると母音の多い言語だから めっちゃ単語が長い

101 17/09/27(水)20:28:54 No.455778167

しかし冗長性を考えれば文字が少なければいいというものでもないのでは?

102 17/09/27(水)20:29:22 No.455778274

和製漢字が短縮の肝だからな…

103 17/09/27(水)20:29:23 No.455778281

あぁ…日本の場合別にてにおはを省略しても割となんとかなるからな……

104 17/09/27(水)20:29:28 No.455778300

チョベリバ

105 17/09/27(水)20:29:43 No.455778348

>チョベリバ ヤバイ

106 17/09/27(水)20:30:06 No.455778437

今日雨だった という文も正確に言うと今日「は」雨だったになって中国語や台湾語はこの「は」を省略できないとかそういう意味?

107 17/09/27(水)20:30:30 No.455778529

>今日雨だった >という文も正確に言うと今日「は」雨だったになって中国語や台湾語はこの「は」を省略できないとかそういう意味? うn

108 17/09/27(水)20:30:51 No.455778614

プログラムだとそういう短縮は許されないんじゃないかな…

109 17/09/27(水)20:31:17 No.455778737

MK5

110 17/09/27(水)20:31:18 No.455778738

>プログラムだとそういう短縮は許されないんじゃないかな… 最初っからプログラムの話してないし

111 17/09/27(水)20:31:26 No.455778768

>プログラムだとそういう短縮は許されないんじゃないかな… プログラムの話じゃないでしょ 一度に許容される文字数の問題

112 17/09/27(水)20:31:27 No.455778770

日本語は適当すぎて逆に懐が深い気がする

113 17/09/27(水)20:31:53 No.455778886

今日は雨なのか今日も雨なのかで意味は違うと思うが

114 17/09/27(水)20:32:19 No.455778986

秋田弁だかがやたら短く出来るんだっけ

115 17/09/27(水)20:32:34 No.455779048

読む側もそこまで求めてないし良いんじゃね...

116 17/09/27(水)20:32:36 No.455779053

>今日は雨なのか今日も雨なのかで意味は違うと思うが 今日雨だったとその2つは全部意味が違うじゃん

117 17/09/27(水)20:32:52 No.455779130

>日本語は適当すぎて逆に懐が深い気がする 適当過ぎるからこそブレがあまり許されないプログラミングには不向きな 言語であるのも事実でな… もっと和文プログラミングのシステムが洗練されれば行けるかもしれんがな 多分AIがそこら辺を解決してくれると思う

118 17/09/27(水)20:32:58 No.455779155

>今日は雨なのか今日も雨なのかで意味は違うと思うが 日本語の場合この文中で言おうがどうしようがどうでもいい気もする そんへんもはっきりさせないといけないんだろうな中国語とか台湾語……

119 17/09/27(水)20:33:00 No.455779159

今日is雨だった

120 17/09/27(水)20:33:21 No.455779249

異国の人名のブレいいよね(明確に間違ってるのを放置しながら)

121 17/09/27(水)20:33:22 No.455779264

聞いてくれエブリワン!

122 17/09/27(水)20:33:36 No.455779321

>今日は雨なのか今日も雨なのかで意味は違うと思うが 緩すぎてあらゆる意味に取れてしまうので法律用語とか馬鹿みたいに冗長になるよね

123 17/09/27(水)20:33:56 No.455779410

言語的なガッチリさで言えばドイツ語らしいな

124 17/09/27(水)20:34:15 No.455779502

>異国の人名のブレいいよね(明確に間違ってるのを放置しながら) いい加減ベンサムなのかベンタムなのかはっきりせい 「サ」と「タ」は舌の使い方全く違うから「いやー片方はネイティブの発音でー」という逃げは打てない

125 17/09/27(水)20:34:17 No.455779515

多分中国語が冗長気味なのは他文化を取り込む関係上曖昧な表記は 容認されにくかったなんて経緯があるんだろうなぁ…

126 17/09/27(水)20:34:31 No.455779563

>言語的なガッチリさで言えばドイツ語らしいな ロシア語でなくて?

127 17/09/27(水)20:35:06 No.455779711

>>今日は雨なのか今日も雨なのかで意味は違うと思うが >緩すぎてあらゆる意味に取れてしまうので法律用語とか馬鹿みたいに冗長になるよね 言語が緩いと読みにくくなることもあるのか

128 17/09/27(水)20:35:27 No.455779814

>いい加減ベンサムなのかベンタムなのかはっきりせい 突き詰めるとサでもタでもなく表記できないってなる

129 17/09/27(水)20:35:43 No.455779890

日常的なもんだったら助詞を厳密に使わなくても前後の文脈である程度推測できるしね日本語

130 17/09/27(水)20:36:06 No.455779991

>言語が緩いと読みにくくなることもあるのか そら「このはしわたるべからず」みたいな文をお出しされるとね 法律の文言以限らずどっちとも解釈できる文をつくりやすいとはおもう

131 17/09/27(水)20:36:25 No.455780068

>突き詰めるとサでもタでもなく表記できないってなる なん…だと… 発音記号的にはどっちなの

132 17/09/27(水)20:36:26 No.455780071

昔の知識人が漢文を捨てなかったのは漢文ならではの 曖昧な部分の無さが必要だったなんて事は無いだろうか

133 17/09/27(水)20:37:02 No.455780211

>>突き詰めるとサでもタでもなく表記できないってなる >なん…だと… >発音記号的にはどっちなの ツァッ!

134 17/09/27(水)20:38:20 No.455780502

ま゛

135 17/09/27(水)20:38:22 No.455780504

普段なんとなしに使ってるけどよく考えれば不思議な言語だなほんと…

136 17/09/27(水)20:38:49 No.455780612

あとイギリスとアメリカで発音が違うからサもタもある意味正解とかあったり

137 17/09/27(水)20:38:51 No.455780622

ヒで日本語学習中のちゅうごくじんが日本人に「~はどういう意味か」と尋ねて「〇〇という意味だ」と回答を得たら「ならなぜ〇〇と言わず~と言った」と再質問してて日本人側が「ううn…」となってた光景を思い出した 「なんとなくだよ!!!!!」を言語学的な厳密な言い方するとどうなるのか知りたい

138 17/09/27(水)20:40:32 No.455781033

英語もも微妙にあいまいなところがあるのが困る refrainって単語も繰り返しと止めるの二つの意味があってどっちだよってなる

139 17/09/27(水)20:40:39 No.455781062

表記揺れ起こす発音が複数含まれてる単語はちょっと調べにくいよね…

140 17/09/27(水)20:41:12 No.455781228

>英語もも微妙にあいまいなところがあるのが困る >refrainって単語も繰り返しと止めるの二つの意味があってどっちだよってなる まあそこら辺は同音異語みたいなもんでさ

141 17/09/27(水)20:41:41 No.455781357

theを「ザ」と表記しだした人許さない

142 17/09/27(水)20:42:18 No.455781557

アレクシスアルゲリョという名ボクサーがいるけどこれ明らかに間違えで アルグエーリョのほうが正解だって最近知った

143 17/09/27(水)20:43:27 No.455781852

>theを「ザ」と表記しだした人許さない ボインだとザになるんだから許してやってくれんか

144 17/09/27(水)20:43:38 No.455781898

>theを「ザ」と表記しだした人許さない どうしろってんだ

145 17/09/27(水)20:43:47 No.455781941

「ダ」?

146 17/09/27(水)20:43:58 No.455781985

マトリックスをメイトリックスという日本人はいないのだ

↑Top