17/09/27(水)19:44:59 日本語... のスレッド詳細
削除依頼やバグ報告は メールフォーム にお願いします。個人情報、名誉毀損、侵害等については積極的に削除しますので、 メールフォーム より該当URLをご連絡いただけると助かります。
17/09/27(水)19:44:59 No.455768595
日本語は高圧縮言語 15字あれば大体伝わる(20字)
1 17/09/27(水)19:45:41 No.455768760
英語のレポートってなんで単語数でカウントするんだろう
2 17/09/27(水)19:47:06 No.455769046
575の17文字が最適
3 17/09/27(水)19:48:02 No.455769227
モーラで数えたらだいたい一緒になりそう
4 17/09/27(水)19:48:41 No.455769353
この日本語の15文字、英語34文字の値って何て言えばいいの? 中央値でも平均でも無いよね 統計でなんか呼び方あったっけ
5 17/09/27(水)19:48:49 No.455769374
バイト数では同じくらいじゃない?
6 17/09/27(水)19:49:13 No.455769449
ダヴィンチとかそんなやつ
7 17/09/27(水)19:49:52 No.455769584
2バイトだからほぼ一緒じゃん!
8 17/09/27(水)19:50:18 No.455769668
最頻値かな
9 17/09/27(水)19:50:50 No.455769778
15字以内で今日のできごとつぶやいてみてよ
10 17/09/27(水)19:51:02 No.455769808
今1バイトでも2バイトでも140文字制限なの?
11 17/09/27(水)19:51:16 No.455769854
もらしたおこられた
12 17/09/27(水)19:51:34 No.455769911
今日は何もない素晴らしい一日だった(17文字)
13 17/09/27(水)19:52:10 No.455770045
㌏㍂㌟㌞
14 17/09/27(水)19:52:25 No.455770101
>中央値でも平均でも無いよね 統計でなんか呼び方あったっけ ピークじゃ?
15 17/09/27(水)19:52:29 No.455770113
Unicodeのご時世だから3バイトかもしれない
16 17/09/27(水)19:52:38 No.455770142
英語以外の外国語勉強してると数字の読み方で日本語ほんと短けーなってなる
17 17/09/27(水)19:52:47 No.455770182
仕事、帰宅、めし(8)
18 17/09/27(水)19:53:26 No.455770317
文字数増やしてもレスポンチバトルが加速する未来しか見えない
19 17/09/27(水)19:54:25 No.455770529
>仕事、帰宅、めし(8) し、き、め 青森とかいくとこんなイメージ
20 17/09/27(水)19:54:41 No.455770603
おきたなう ごはんなう うんこなう
21 17/09/27(水)19:55:24 No.455770769
一番圧縮なのハングルじゃないかな
22 17/09/27(水)19:55:42 No.455770837
ヒって元々ほんとにつぶやきみたいな短いことを言うためのものだから英語基準でその字数になっているのであって 日本語だと本来上限50文字とかが適当なんじゃないかとふと思った
23 17/09/27(水)19:55:55 No.455770895
CJKはヒからハブられたの
24 17/09/27(水)19:56:19 No.455770969
アルファベット圏のツイート文字数が280文字になるんだっけ
25 17/09/27(水)19:56:21 No.455770976
ハングルは圧縮しすぎて前後の文章がないとよくわからないから・・・
26 17/09/27(水)19:56:50 No.455771080
ハブられたというかCJKが伝達効率良すぎるので それ以外を底上げしたんだ
27 17/09/27(水)19:57:12 No.455771167
ハングルはアルファベットと同じ子音と母音の組み合わせで最大4文字まで圧縮できるんだよな でも漢字には敵わない
28 17/09/27(水)19:57:44 No.455771285
英語って数字をわざわざアルファベット表記するよね
29 17/09/27(水)19:58:24 No.455771441
画数とか手間の面ではアルファベットとかの方が良いんだろうか
30 17/09/27(水)19:58:50 No.455771540
Twitterは日本語と相性いいんだよね 英語の140文字なんてほんと少ない
31 17/09/27(水)19:59:10 No.455771609
>英語って数字をわざわざアルファベット表記するよね 10未満の数字は単語で書くことが多い
32 17/09/27(水)19:59:11 No.455771613
>画数とか手間の面ではアルファベットとかの方が良いんだろうか 筆記体マジ便r…読めない!
33 17/09/27(水)19:59:15 No.455771624
ヘブライ語は
34 17/09/27(水)19:59:36 No.455771685
>画数とか手間の面ではアルファベットとかの方が良いんだろうか せいぜい50文字も覚えれば十分だからな…
35 17/09/27(水)20:00:09 No.455771790
電糞逃客勝
36 17/09/27(水)20:00:34 No.455771881
>仕事、帰宅、めし(8)
37 17/09/27(水)20:00:46 No.455771914
表意文字と表音文字を比べて何の意味が…?
38 17/09/27(水)20:01:07 No.455771987
あめりか人は筆記体分からないらしいな
39 17/09/27(水)20:01:30 No.455772076
>表意文字と表音文字を比べて何の意味が…? 表意文字と表音文字の圧縮率を比べる意味があるだろ
40 17/09/27(水)20:01:49 No.455772144
>あめりか人は筆記体分からないらしいな じゃあどんな文字使うの?
41 17/09/27(水)20:02:17 No.455772242
日本語のプログラミング言語つくったら流行る?
42 17/09/27(水)20:02:58 No.455772391
>じゃあどんな文字使うの? ?
43 17/09/27(水)20:02:59 No.455772394
流行らなかった
44 17/09/27(水)20:03:11 No.455772436
は?個人の自由だろ…
45 17/09/27(水)20:03:14 No.455772448
筆記体は誤解を招くのでオフィシャルな文書では推奨されない サインに使うくらい
46 17/09/27(水)20:03:50 No.455772586
>日本語のプログラミング言語つくったら流行る? 日本語入力クソ面倒臭い…
47 17/09/27(水)20:04:04 No.455772650
GJ部
48 17/09/27(水)20:04:07 No.455772659
ドイツ語も長いよね組み合わさった単語とか
49 17/09/27(水)20:04:12 No.455772684
まさかトランプから賄賂を…?
50 17/09/27(水)20:04:13 No.455772686
>筆記体は誤解を招くのでオフィシャルな文書では推奨されない >サインに使うくらい 中学の時授業で筆記体習ったけどあれはあんま意味なかったのか…
51 17/09/27(水)20:04:58 No.455772851
正式な表現がめちゃくちゃ長いだけで普段のカジュアルな短い呼び名があるとかじゃなくて本当に長いの?
52 17/09/27(水)20:05:06 No.455772871
ASCIIコードが日本語に置き換わった世界線にいこう
53 17/09/27(水)20:05:24 No.455772927
英語でつぶやくと言いたい事の2/3くらいで文字制限ひっかかる
54 17/09/27(水)20:05:24 No.455772932
日本人だけど草書体読めない
55 17/09/27(水)20:05:34 No.455772968
4 you
56 17/09/27(水)20:05:39 No.455772986
筆記体で見るのはサインと手紙?
57 17/09/27(水)20:06:05 No.455773085
4 u だった
58 17/09/27(水)20:06:10 No.455773107
4u
59 17/09/27(水)20:06:46 No.455773264
日本語は入力に手間がかかる代わりにバイト数はちょっと少なくなってお得ってとこだろうか?
60 17/09/27(水)20:07:36 No.455773446
>中学の時授業で筆記体習ったけどあれはあんま意味なかったのか… もともと速記のための技術という側面が強かった 今はデジタル文書あるから出番はない
61 17/09/27(水)20:10:37 No.455774114
it's datte 4 u
62 17/09/27(水)20:11:04 No.455774219
お あ し す
63 17/09/27(水)20:11:22 No.455774289
うにこーどでさらに圧縮された感がある
64 17/09/27(水)20:11:26 No.455774297
実際に発話した際の音の長さで調べた方がおもしろい気がするけど 標準的な話し言葉の早さの定義が存在しないから無理かな
65 17/09/27(水)20:11:31 No.455774308
この結果は日本語は高圧縮言語というよりも 言語によってあまり差はないっていう結果に見える…
66 17/09/27(水)20:11:58 No.455774383
プリンスが自分の歌に4だのuだのやたら使っててキモいなあと思ってたけど 今になって誰でも皆使うとはなー
67 17/09/27(水)20:12:18 No.455774446
次職場連絡待結局無履歴書書
68 17/09/27(水)20:12:27 No.455774473
ロシア語やジョージア語は子音が長い
69 17/09/27(水)20:12:54 No.455774582
日本語はutf-8で一文字最低2バイト最長6バイトあるから電子データ上では短くないよ
70 17/09/27(水)20:13:48 No.455774810
英語の筆記体は日常で普通に使われてるよ 英語圏で使ってないのアメリカぐらいだ
71 17/09/27(水)20:15:37 No.455775203
>実際に発話した際の音の長さで調べた方がおもしろい気がするけど 有名なのはベネディクト・カンバーバッチって書くとクソ長いけどあっちの人からすればベディカババって程度の短い名前なんよね
72 17/09/27(水)20:15:44 No.455775229
ちス気こ なんて英語なら hey! hey! hey~! it's transparent ,you know? hey you ~! なのにこれが4文字だぞ
73 17/09/27(水)20:16:40 No.455775444
>Unicodeのご時世だから3バイトかもしれない いいよねサロゲートペア…
74 17/09/27(水)20:16:47 No.455775472
>日本語はutf-8で一文字最低2バイト最長6バイトあるから電子データ上では短くないよ 6バイトのやつもあるの!? どうしてそこまで長くなったんだろう…
75 17/09/27(水)20:17:05 No.455775542
UTF-8にエンコードして何バイトになろうともTwitter上ではあくまでuser-perceived charactersが単位なので関係ないのだ
76 17/09/27(水)20:17:40 No.455775671
>10未満の数字は単語で書くことが多い あれは何でだろうねぇ なんか文化的な下地でもあるのかしら
77 17/09/27(水)20:17:55 No.455775715
モチラップとか相当意訳しないと絶対吹き出しに収まらないのは分かる
78 17/09/27(水)20:18:15 No.455775794
emojiも一般的だしUTFのデータ量はどうでもいいかなあ
79 17/09/27(水)20:18:30 No.455775841
>>10未満の数字は単語で書くことが多い >あれは何でだろうねぇ >なんか文化的な下地でもあるのかしら 日本で言うと第二次世界大戦は第2次世界大戦とはあまり書かないみたいなものだろうか
80 17/09/27(水)20:18:54 No.455775923
UTF-8の日本語文字はほぼ3バイトじゃないの
81 17/09/27(水)20:19:11 No.455775979
>>日本語のプログラミング言語つくったら流行る? >日本語入力クソ面倒臭い… 日本語入力はインクリメント検索がアルファベットほど快適でないのがつらい
82 17/09/27(水)20:19:58 No.455776137
プログラムは日本語をローマ字入力してんだからローマ字でいいだろって話なんよ…
83 17/09/27(水)20:20:22 No.455776226
触った事ないけどキューリみたいな名前の言語でしょ? 知ってるんだからそのくらい!
84 17/09/27(水)20:20:39 No.455776278
>ロシア語やジョージア語は子音が長い キリル語ってなんで2byte文字なのかしら 成り立ちからしたら1byteでもいけそうなのに
85 17/09/27(水)20:21:55 No.455776538
単純に長文はみんな分割投稿してるだけだと思う
86 17/09/27(水)20:22:24 No.455776654
漢字の種類多い時点でアルファベットで構成された文と比べてはいけない
87 17/09/27(水)20:23:31 No.455776880
>漢字の種類多い時点でアルファベットで構成された文と比べてはいけない なんで?
88 17/09/27(水)20:23:38 No.455776903
>日本語入力はインクリメント検索がアルファベットほど快適でないのがつらい ふっふっふ…migemoを知らない田舎者がなんとかかんとか…
89 17/09/27(水)20:24:22 No.455777061
イリヤの空でネタにされてたなそう言えば
90 17/09/27(水)20:25:37 No.455777342
日本語プログラミングだと記号の問題も大きいなあ 全部全角記号なのかってなる
91 17/09/27(水)20:25:46 No.455777383
>イリヤの空でネタにされてたなそう言えば 昔から言われてたことではある というか翻訳の本も英語版よりも文字を大きくしないと 本が薄くなるのでダメって言われる位に常識ではある
92 17/09/27(水)20:25:57 No.455777430
>漢字の種類多い時点でアルファベットで構成された文と比べてはいけない 漢字の種類が多いっていうのは一文字あたりのバイト数が多いことに反映されるから そこ含めて考えれば比べる意味はあるだろう
93 17/09/27(水)20:26:05 No.455777457
その理屈で行けば中国語ないし台湾語は日本語よりも短く済むんだよな
94 17/09/27(水)20:26:16 No.455777506
アラビア数字に関しては全角は死んでいいと思うんだ なんで全角があるんだよ
95 17/09/27(水)20:27:04 No.455777694
>その理屈で行けば中国語ないし台湾語は日本語よりも短く済むんだよな そうでもない 大抵の場合日本語よりも長くなりがち
96 17/09/27(水)20:27:22 No.455777769
>その理屈で行けば中国語ないし台湾語は日本語よりも短く済むんだよな そうなるね あと同じ見た目なのに言語圏でコード違うとかのクソ仕様が出来上がる
97 17/09/27(水)20:27:26 No.455777780
>大抵の場合日本語よりも長くなりがち えっなんで!?
98 17/09/27(水)20:28:22 No.455778007
>その理屈で行けば中国語ないし台湾語は日本語よりも短く済むんだよな むしろ日本語より文字が少ない分長くなるかもしれない
99 17/09/27(水)20:28:40 No.455778105
>えっなんで!? 俺も昔中国語の授業で聞いただけだからあれだが助詞とか接続詞が 割とカッチリ決まってて短縮が出来ず冗長になるんだと
100 17/09/27(水)20:28:53 No.455778165
フィンランド語とかアルファベット表記だけど 日本語並みに喋ると母音の多い言語だから めっちゃ単語が長い
101 17/09/27(水)20:28:54 No.455778167
しかし冗長性を考えれば文字が少なければいいというものでもないのでは?
102 17/09/27(水)20:29:22 No.455778274
和製漢字が短縮の肝だからな…
103 17/09/27(水)20:29:23 No.455778281
あぁ…日本の場合別にてにおはを省略しても割となんとかなるからな……
104 17/09/27(水)20:29:28 No.455778300
チョベリバ
105 17/09/27(水)20:29:43 No.455778348
>チョベリバ ヤバイ
106 17/09/27(水)20:30:06 No.455778437
今日雨だった という文も正確に言うと今日「は」雨だったになって中国語や台湾語はこの「は」を省略できないとかそういう意味?
107 17/09/27(水)20:30:30 No.455778529
>今日雨だった >という文も正確に言うと今日「は」雨だったになって中国語や台湾語はこの「は」を省略できないとかそういう意味? うn
108 17/09/27(水)20:30:51 No.455778614
プログラムだとそういう短縮は許されないんじゃないかな…
109 17/09/27(水)20:31:17 No.455778737
MK5
110 17/09/27(水)20:31:18 No.455778738
>プログラムだとそういう短縮は許されないんじゃないかな… 最初っからプログラムの話してないし
111 17/09/27(水)20:31:26 No.455778768
>プログラムだとそういう短縮は許されないんじゃないかな… プログラムの話じゃないでしょ 一度に許容される文字数の問題
112 17/09/27(水)20:31:27 No.455778770
日本語は適当すぎて逆に懐が深い気がする
113 17/09/27(水)20:31:53 No.455778886
今日は雨なのか今日も雨なのかで意味は違うと思うが
114 17/09/27(水)20:32:19 No.455778986
秋田弁だかがやたら短く出来るんだっけ
115 17/09/27(水)20:32:34 No.455779048
読む側もそこまで求めてないし良いんじゃね...
116 17/09/27(水)20:32:36 No.455779053
>今日は雨なのか今日も雨なのかで意味は違うと思うが 今日雨だったとその2つは全部意味が違うじゃん
117 17/09/27(水)20:32:52 No.455779130
>日本語は適当すぎて逆に懐が深い気がする 適当過ぎるからこそブレがあまり許されないプログラミングには不向きな 言語であるのも事実でな… もっと和文プログラミングのシステムが洗練されれば行けるかもしれんがな 多分AIがそこら辺を解決してくれると思う
118 17/09/27(水)20:32:58 No.455779155
>今日は雨なのか今日も雨なのかで意味は違うと思うが 日本語の場合この文中で言おうがどうしようがどうでもいい気もする そんへんもはっきりさせないといけないんだろうな中国語とか台湾語……
119 17/09/27(水)20:33:00 No.455779159
今日is雨だった
120 17/09/27(水)20:33:21 No.455779249
異国の人名のブレいいよね(明確に間違ってるのを放置しながら)
121 17/09/27(水)20:33:22 No.455779264
聞いてくれエブリワン!
122 17/09/27(水)20:33:36 No.455779321
>今日は雨なのか今日も雨なのかで意味は違うと思うが 緩すぎてあらゆる意味に取れてしまうので法律用語とか馬鹿みたいに冗長になるよね
123 17/09/27(水)20:33:56 No.455779410
言語的なガッチリさで言えばドイツ語らしいな
124 17/09/27(水)20:34:15 No.455779502
>異国の人名のブレいいよね(明確に間違ってるのを放置しながら) いい加減ベンサムなのかベンタムなのかはっきりせい 「サ」と「タ」は舌の使い方全く違うから「いやー片方はネイティブの発音でー」という逃げは打てない
125 17/09/27(水)20:34:17 No.455779515
多分中国語が冗長気味なのは他文化を取り込む関係上曖昧な表記は 容認されにくかったなんて経緯があるんだろうなぁ…
126 17/09/27(水)20:34:31 No.455779563
>言語的なガッチリさで言えばドイツ語らしいな ロシア語でなくて?
127 17/09/27(水)20:35:06 No.455779711
>>今日は雨なのか今日も雨なのかで意味は違うと思うが >緩すぎてあらゆる意味に取れてしまうので法律用語とか馬鹿みたいに冗長になるよね 言語が緩いと読みにくくなることもあるのか
128 17/09/27(水)20:35:27 No.455779814
>いい加減ベンサムなのかベンタムなのかはっきりせい 突き詰めるとサでもタでもなく表記できないってなる
129 17/09/27(水)20:35:43 No.455779890
日常的なもんだったら助詞を厳密に使わなくても前後の文脈である程度推測できるしね日本語
130 17/09/27(水)20:36:06 No.455779991
>言語が緩いと読みにくくなることもあるのか そら「このはしわたるべからず」みたいな文をお出しされるとね 法律の文言以限らずどっちとも解釈できる文をつくりやすいとはおもう
131 17/09/27(水)20:36:25 No.455780068
>突き詰めるとサでもタでもなく表記できないってなる なん…だと… 発音記号的にはどっちなの
132 17/09/27(水)20:36:26 No.455780071
昔の知識人が漢文を捨てなかったのは漢文ならではの 曖昧な部分の無さが必要だったなんて事は無いだろうか
133 17/09/27(水)20:37:02 No.455780211
>>突き詰めるとサでもタでもなく表記できないってなる >なん…だと… >発音記号的にはどっちなの ツァッ!
134 17/09/27(水)20:38:20 No.455780502
ま゛
135 17/09/27(水)20:38:22 No.455780504
普段なんとなしに使ってるけどよく考えれば不思議な言語だなほんと…
136 17/09/27(水)20:38:49 No.455780612
あとイギリスとアメリカで発音が違うからサもタもある意味正解とかあったり
137 17/09/27(水)20:38:51 No.455780622
ヒで日本語学習中のちゅうごくじんが日本人に「~はどういう意味か」と尋ねて「〇〇という意味だ」と回答を得たら「ならなぜ〇〇と言わず~と言った」と再質問してて日本人側が「ううn…」となってた光景を思い出した 「なんとなくだよ!!!!!」を言語学的な厳密な言い方するとどうなるのか知りたい
138 17/09/27(水)20:40:32 No.455781033
英語もも微妙にあいまいなところがあるのが困る refrainって単語も繰り返しと止めるの二つの意味があってどっちだよってなる
139 17/09/27(水)20:40:39 No.455781062
表記揺れ起こす発音が複数含まれてる単語はちょっと調べにくいよね…
140 17/09/27(水)20:41:12 No.455781228
>英語もも微妙にあいまいなところがあるのが困る >refrainって単語も繰り返しと止めるの二つの意味があってどっちだよってなる まあそこら辺は同音異語みたいなもんでさ
141 17/09/27(水)20:41:41 No.455781357
theを「ザ」と表記しだした人許さない
142 17/09/27(水)20:42:18 No.455781557
アレクシスアルゲリョという名ボクサーがいるけどこれ明らかに間違えで アルグエーリョのほうが正解だって最近知った
143 17/09/27(水)20:43:27 No.455781852
>theを「ザ」と表記しだした人許さない ボインだとザになるんだから許してやってくれんか
144 17/09/27(水)20:43:38 No.455781898
>theを「ザ」と表記しだした人許さない どうしろってんだ
145 17/09/27(水)20:43:47 No.455781941
「ダ」?
146 17/09/27(水)20:43:58 No.455781985
マトリックスをメイトリックスという日本人はいないのだ