ここでは虹裏imgのかなり古い過去ログを閲覧することができます。
23/05/11(木)14:03:42 No.1056074955
拡散モデルってなんなの
1 23/05/11(木)14:09:46 No.1056076076
ノイズをかけてノイズをとる
2 23/05/11(木)14:13:48 No.1056076882
めちゃくちゃ目の悪い人がアレは何ですか?と聞かれて それまで蓄積された経験からリンゴですと答えられる みたいな
3 23/05/11(木)14:17:04 No.1056077495
もっと数学的に説明して
4 23/05/11(木)14:18:38 No.1056077802
スレ画の次に完全ランダムな画像を見せて何が見えますか?ってやる つまり精神病患者を作る工程と同じ
5 23/05/11(木)14:19:05 No.1056077893
>めちゃくちゃ目の悪い人がアレは何ですか?と聞かれて >それまで蓄積された経験からリンゴですと答えられる >みたいな どっちかっていうと メガネなしでぼやけてる状態で「アレは林檎です」って教えて イメージした画像を出力させてる感じじゃね? 「あれは○○です」を変えたら同じノイズからでも別の画像が出る的な
6 23/05/11(木)14:19:48 No.1056078026
>スレ画の次に完全ランダムな画像を見せて何が見えますか?ってやる >つまり精神病患者を作る工程と同じ すまん全然理解出来なかったからもう2~3行説明を追加してくれ
7 23/05/11(木)14:20:29 No.1056078155
拡散モデル=AI絵出力じゃないからまた話がややこしい
8 23/05/11(木)14:21:06 No.1056078275
何を拡散してるのか未だにわからん ノイズを拡散するからだと今は認識してる
9 23/05/11(木)14:21:34 No.1056078361
>すまん全然理解出来なかったからもう2~3行説明を追加してくれ 画像にノイズをかける→ノイズから画像を復元するって訓練させる 次にノイズしかない画像を見せて復元させる →無から新しい絵ができた!
10 23/05/11(木)14:22:28 No.1056078529
調教されたAIには人間からすると単なるノイズにしか見えない画像から 「〇〇が見える!」と認識できるのだ
11 23/05/11(木)14:23:14 No.1056078661
>調教されたAIには人間からすると単なるノイズにしか見えない画像から >「〇〇が見える!」と認識できるのだ >つまり精神病患者を作る工程と同じ
12 23/05/11(木)14:24:53 No.1056078961
ノイズだらけの画像から特定の何かを見つけ出し それ以外のノイズを全部除去して実際に人間にも分かるようにしてくれるのがAI描画
13 23/05/11(木)14:25:33 No.1056079074
AIとか言ってる奴はモグリ
14 23/05/11(木)14:25:34 No.1056079077
ノイズ見せてここにはこんなものが書かれてますよ~って吹き込むとほなこういう感じかーって絵を出してくる
15 23/05/11(木)14:25:55 No.1056079136
動作があまりにも生物的じゃなさすぎて感覚的に理解しづらい
16 23/05/11(木)14:26:06 No.1056079162
ノイズ処理っていうと誤解の元だと思う 要するに絵が本来持つ情報量を極端に圧縮した状態だよ 圧縮の逆をやれば解凍して元の絵に戻せる 不可逆圧縮だから完全復元じゃないけど
17 23/05/11(木)14:26:22 No.1056079222
テレビの砂嵐から貞子が出てくるみたいな感じか
18 23/05/11(木)14:26:51 No.1056079310
段階的にノイズから情報を作るのはGANの潜在変数モデルと同じなのに拡散モデルが汎化できてる理由はなんなの
19 23/05/11(木)14:27:31 No.1056079445
>要するに絵が本来持つ情報量を極端に圧縮した状態だよ 相互情報量ってことなの
20 23/05/11(木)14:27:46 No.1056079487
数学式で表すのが一番しっくり来ると思うんだけど 絵として説明しようとするとなんか難しい
21 23/05/11(木)14:27:48 No.1056079497
考えた人頭いいなと思うけど脳科学的なパターン認識とはかけ離れたものにも見えてどうしてこれで知性を感じるのか不思議
22 23/05/11(木)14:28:47 No.1056079662
座った時に気が付いた床に落ちてる髪の毛とか一度目に入ると 立って離れても普通に認識出来るようになるのすごいね人体ってなる
23 23/05/11(木)14:28:54 No.1056079675
画像にノイズをかける過程をAIに学習させると完全なノイズからでも復元できるレベルの強力なノイズ除去が出来るようになる じゃああらゆる画像で学習させれば完全にノイズな画像からあらゆる画像を復元することが出来るんじゃね?みたいな技術
24 23/05/11(木)14:29:10 No.1056079725
これノイズ絵だからなんか絵描いてる風だけど実際はファイル圧縮技術の方面の話だよ
25 23/05/11(木)14:30:43 No.1056080007
VAEの真ん中って次元削減して情報落ちてるけどそれを相互情報量において行ったものって感じ?
26 23/05/11(木)14:33:12 No.1056080451
>段階的にノイズから情報を作るのはGANの潜在変数モデルと同じなのに拡散モデルが汎化できてる理由はなんなの GANは画像データだけで学んでたけどstable diffusionとかは CLIPっていうGPT使った文章データと紐づけされてるから一般化したんじゃないかな
27 23/05/11(木)14:34:55 No.1056080744
>ノイズをかけてノイズをとる AIってミヤギさんが育てたんだな…
28 23/05/11(木)14:37:20 No.1056081187
追加したノイズにそれぞれタグがついてるから 逆にデータの塊から逆に追加したノイズ分を削り落とすと元のような絵が出てくるってことだろうか
29 23/05/11(木)14:39:24 No.1056081547
Stable Diffusionが出る前はテキスト画像生成といえばCLIP+VQGANだったと思う あれもアーティスティックで好きだった
30 23/05/11(木)14:40:56 No.1056081841
>めちゃくちゃ目の悪い人がアレは何ですか?と聞かれて >それまで蓄積された経験からリンゴですと答えられる だからリンゴ以外の周辺情報で精度が上がるんだろうか 皿の上に乗ってる 果物ナイフが横に置いてある 判りましたこれはリンゴです! て感じで
31 23/05/11(木)14:42:37 No.1056082150
これ自体はデータの圧縮と解凍みたいなもんだよな
32 23/05/11(木)14:43:47 No.1056082369
元の画像とノイズ追加後の画像をしこたま学習させるとノイズ画像から元画像を想像して描けるようになる あくまで想像なんで正確かはわからない
33 23/05/11(木)14:45:19 No.1056082675
>GANは画像データだけで学んでたけどstable diffusionとかは そもそも別物 今のAIは元絵を圧縮して展開してそれっぽい絵に戻すときの過程を記録してそれを他のノイズ絵に使うみたいな 旧来のGANはそもそもランダムでノイズというかわかりやすく言えばキャンパスに色を置いてって 判定AIでokが出たらキャンパスを大きくしていく もうちょい詳しくGANの方はこんな感じ https://www.skillupai.com/blog/tech/gan-tips/ まあ細部違うけどおおよそそんな感じ
34 23/05/11(木)14:51:38 No.1056083831
フォトショの雲模様から雷やらいろいろ作れるんだったら もっと高度に畳み込みをかけて計算していけば何でもできるんじゃね? というゴリラパワー着想
35 23/05/11(木)14:56:25 No.1056084765
>もっと高度に畳み込みをかけて計算していけば何でもできるんじゃね? Diffusionは畳み込み必須じゃないぞ
36 23/05/11(木)14:59:53 No.1056085495
>CLIPっていうGPT使った文章データと紐づけされてるから一般化したんじゃないかな 一般化と汎化は違うしCLIPはGPTじゃねえ!
37 23/05/11(木)15:00:37 No.1056085657
今まで使ってきたハイテクアイテムの仕組みすらちゃんと理解せずに利用してきたので おそらくこれもそういう流れになると俺は思っている
38 23/05/11(木)15:01:40 No.1056085876
>今まで使ってきたハイテクアイテムの仕組みすらちゃんと理解せずに利用してきたので >おそらくこれもそういう流れになると俺は思っている そんなの産業革命からずっとだ 頭のいい人がうまく作ってくれる
39 23/05/11(木)15:02:56 No.1056086133
わからないことが多すぎて説明されてるところを読んでもレイズナーの第一話ラストのデビッドみたいになる
40 23/05/11(木)15:03:56 No.1056086371
真面目勉強するとベクトルとか出てきてウンザリする…
41 23/05/11(木)15:06:19 No.1056086866
ノイズ云々の解説は出てくるけど あくまでAIが描く手段であって、どういう学習してるのかとか 似てる似てないの判定をどうやってるのかとか、プロンプトって何とか その辺丸々抜け落ちてるのよね
42 23/05/11(木)15:06:44 No.1056086953
完全文系の俺には雰囲気ですら理解できないツールだ かろうじて成果物は理解できる
43 23/05/11(木)15:07:43 No.1056087173
>その辺丸々抜け落ちてるのよね 色んな技術の掛け合わせでその一つ一つの仕組みがもう理解できない…
44 23/05/11(木)15:07:59 No.1056087228
よくわかってないんだけど6本指はダメとかのネガティブプロンプトがあるってことはこの絵のこの部分はこういう構造だってのは理解してるってことなの?
45 23/05/11(木)15:09:06 No.1056087480
復元方法を勉強させる方法かあ
46 23/05/11(木)15:10:13 No.1056087762
ノイズから復元されるからセーフがよく繰り返されるけどコピペにおけるバイナリ変換とかを多数挟んで改変してる話はあんまり持ち出さないよね
47 23/05/11(木)15:10:21 No.1056087792
元々圧縮展開の技術っての後よくわからないけど暗号を複合させるみたいなのとはまた違うの?
48 23/05/11(木)15:13:09 No.1056088406
正直仕組みを勉強した上で言うがAIが学習元の画像を使用してないっていうのは欺瞞だよ
49 23/05/11(木)15:13:28 No.1056088482
>よくわかってないんだけど6本指はダメとかのネガティブプロンプトがあるってことはこの絵のこの部分はこういう構造だってのは理解してるってことなの? 全くしてない 特徴ベクトルという概念で比較してる
50 23/05/11(木)15:14:19 No.1056088681
普通の画像にいい感じの分布(大体は標準正規分布)から作ったノイズを何回もぶっかけることで標準正規分布から単発で生成したランダム画像と同一視できるところまで持っていくのが拡散過程 この逆の操作でノイズが超ぶっかけられた画像からスタートして大本の画像を再度取り戻すのが逆過程 この逆過程を学習させるとそれぞれの過程が画像空間と潜在特徴空間の間を繋ぐ変換になるから単発のノイズ画像でも何らかの画像に戻すことができる ってのが原初の拡散モデル(DDPM)の定性的な流れだと思ってる
51 23/05/11(木)15:15:26 No.1056088936
>よくわかってないんだけど6本指はダメとかのネガティブプロンプトがあるってことはこの絵のこの部分はこういう構造だってのは理解してるってことなの? 構造って言葉だと上手く言えないから明言できないけど 細部で判断してるような仕組みじゃないはず
52 23/05/11(木)15:15:41 No.1056088991
書き込みをした人によって削除されました
53 23/05/11(木)15:15:49 No.1056089024
画像空間ってのがわからないんだけど、単なる集合じゃなくてちゃんと基底張れるの?
54 23/05/11(木)15:17:09 No.1056089329
>正直仕組みを勉強した上で言うがAIが学習元の画像を使用してないっていうのは欺瞞だよ 入力から出力だしてそれがあってるかどうか評価点付ける って手法だから入力なしがあり得ないもんなー
55 23/05/11(木)15:17:13 No.1056089340
>正直仕組みを勉強した上で言うがAIが学習元の画像を使用してないっていうのは欺瞞だよ 理屈の上ではが別物だけど人間的には「それはないやろ…」って感じだと思う
56 23/05/11(木)15:19:16 No.1056089801
>特徴ベクトルという概念で比較してる 特徴ベクトルってあれか 顔の認識したり鼻歌で曲検索するやつか
57 23/05/11(木)15:19:53 No.1056089929
学習用にネットで拾ってきた画像を使ってるのはそう 学習済みのモデルデータにはネットで拾ってきた画像データは含んでない だってそれ丸ごと含むとモデルデータが数百倍以上のサイズにならないとおかしいから
58 23/05/11(木)15:20:08 No.1056089987
元画像をNNで学習させてノイズ入れた画像を復元するみたいなことさせられたけどその逆みたいな?
59 23/05/11(木)15:20:50 No.1056090147
スレッドを立てた人によって削除されました 動作が特殊すぎて現行法で判断できないから 昨今の影響力のままだったらいつかはAI基準で法の改正が検討されると思う
60 23/05/11(木)15:21:12 No.1056090238
こういう描き方のもっと単純なやつ fu2179384.jpg
61 23/05/11(木)15:21:26 No.1056090272
スレッドを立てた人によって削除されました AIによる学習は画像を使用しているで一律に決めたほうがいいと思うがね いまAI生成を介して復元することで従来だと考えられないレベルのデータ圧縮を可能にするなんて技術も作られてるし そのうち特徴量から肉眼で識別不可能なレベルで元画像を再現できるようになるだろうしそうなったらかなり面倒だぞ
62 23/05/11(木)15:21:59 No.1056090392
>学習済みのモデルデータにはネットで拾ってきた画像データは含んでない よくわかってないからベイズ統計の超すごいやつみたいな認識でごめん…
63 23/05/11(木)15:22:30 No.1056090506
スレッドを立てた人によって削除されました 同一のものではないと言われても再現度が高すぎるから納得いかねえよ状態だから 本当に法解釈をどうするか関係者が苦しんでそう
64 23/05/11(木)15:22:56 No.1056090599
スレッドを立てた人によって削除されました 具体的に法改正しようとすると引用の範囲をどう定義するかって議論になりそうだけどそこんとこはどうなの
65 23/05/11(木)15:23:22 No.1056090681
スレッドを立てた人によって削除されました 著作権はその権利者が親告する問題で権利のない「」が騒いでもな
66 23/05/11(木)15:23:58 No.1056090816
スレッドを立てた人によって削除されました AIはAIで別の法律にしないとAI基準で適用された既存の創作活動が吹き飛んでしまう…
67 23/05/11(木)15:24:07 No.1056090841
スレッドを立てた人によって削除されました >著作権はその権利者が親告する問題で権利のない「」が騒いでもな なんで「」に権利者がいないと言い切れる?
68 23/05/11(木)15:25:03 No.1056091073
スレッドを立てた人によって削除されました >AIはAIで別の法律にしないとAI基準で適用された既存の創作活動が吹き飛んでしまう… AIは特別扱いで何かしら縛るのがいい気はするね ちょっとインパクトが大きすぎるよ
69 23/05/11(木)15:25:08 No.1056091091
「」には人権もないから
70 23/05/11(木)15:25:27 No.1056091189
スレッドを立てた人によって削除されました >具体的に法改正しようとすると引用の範囲をどう定義するかって議論になりそうだけどそこんとこはどうなの わからん わからんから世界中で揉めてるんだと思う
71 23/05/11(木)15:25:29 No.1056091196
>AIってミヤギさんが育てたんだな… Pythonはコブラ会
72 23/05/11(木)15:25:38 No.1056091231
スレッドを立てた人によって削除されました >>著作権はその権利者が親告する問題で権利のない「」が騒いでもな >なんで「」に権利者がいないと言い切れる? ここでいう「」が全であるか個であるかという…
73 23/05/11(木)15:25:55 No.1056091295
スレッドを立てた人によって削除されました 文章生成AIは個人情報収集を抜かせばわりと受け入れられてる感じなんだけど絵だと問題視の方が強くなるのは やっぱり人間には目で見るインパクトってのが重要なんだな
74 23/05/11(木)15:26:48 No.1056091501
スレッドを立てた人によって削除されました >文章生成AIは個人情報収集を抜かせばわりと受け入れられてる感じなんだけど絵だと問題視の方が強くなるのは >やっぱり人間には目で見るインパクトってのが重要なんだな ハリウッド見てこい ハリウッド ストライキで一度でもいいから調べろ
75 23/05/11(木)15:26:59 No.1056091550
スレッドを立てた人によって削除されました 規制しろとはいうが、 データから特徴量だけ抜き出して扱う技術は幅広く使われてるのでその辺に影響が出ちゃうんだわ スマホの顔認証や指紋認証にも使われてる
76 23/05/11(木)15:27:08 No.1056091586
箱に小人さんが入ってるレベルの理解でいいや
77 23/05/11(木)15:27:41 No.1056091732
スレッドを立てた人によって削除されました >文章生成AIは個人情報収集を抜かせばわりと受け入れられてる感じなんだけど絵だと問題視の方が強くなるのは >やっぱり人間には目で見るインパクトってのが重要なんだな 真似できるわけがないと思っていたものが機械で真似できるようになったってインパクトもあると思う
78 23/05/11(木)15:27:58 No.1056091796
スレッドを立てた人によって削除されました 今までこれくらいちょびっとならセーフっしょって言われてた部分でセーフじゃないレベルの侵害ができるようになったのが今回の件かね
79 23/05/11(木)15:28:06 No.1056091826
スレッドを立てた人によって削除されました >文章生成AIは個人情報収集を抜かせばわりと受け入れられてる感じなんだけど絵だと問題視の方が強くなるのは >やっぱり人間には目で見るインパクトってのが重要なんだな 文は実用寄りで娯楽まではいってないからじゃないのか あの文豪の文体を真似る!とかできるのかな
80 23/05/11(木)15:28:14 No.1056091866
スレッドを立てた人によって削除されました ハリウッドは10年前にも最悪な脚本ストやってるけど 今回でAIに駆逐されて死滅すればいいよ
81 23/05/11(木)15:29:35 No.1056092163
スレッドを立てた人によって削除されました >ハリウッド ストライキで一度でもいいから調べろ ああ実際に脚本家は意を唱えてるのね不勉強だった
82 23/05/11(木)15:30:37 No.1056092386
文体精度は英語の方がはるかに上だからあっちで炎上してんのな
83 23/05/11(木)15:30:49 No.1056092446
>あの文豪の文体を真似る!とかできるのかな 邪神ちゃんの口調を真似るのはできてる https://webgl.jashinchan.chat/index.html
84 23/05/11(木)15:31:21 No.1056092570
法律の話じゃなくて技術の話がしたいんだわ
85 23/05/11(木)15:31:53 No.1056092684
書き込みをした人によって削除されました
86 23/05/11(木)15:32:01 No.1056092709
法律の話は判例が積み上がるのを待つしか無いね
87 23/05/11(木)15:32:43 No.1056092871
>画像空間ってのがわからないんだけど、単なる集合じゃなくてちゃんと基底張れるの? 実際に基底張れるかはDisentangleって別の話だけど基底張れることは仮定してる 多様体仮説がそれに近い話な気がする
88 23/05/11(木)15:33:22 No.1056093007
ガビガビキャッツ!
89 23/05/11(木)15:34:31 No.1056093289
このノイズ除去!復元!の延長線上で絵の精度って上がるの? なんか頭打ちがありそうだけど…
90 23/05/11(木)15:34:45 No.1056093334
ChatGPTも今はハイエンドサーバーでしか動かないけどじきにご家庭用ゲーミングPCレベルでも動くようになっていくから そうなると機密情報含んだドキュメントの処理が活発になるし 規制ナシAIでエンドレスにエッチな会話もできる!
91 23/05/11(木)15:35:25 No.1056093485
CLIPも画像化して動きを観察できるんだけど モデルデータと掛け合わせて計算する過程が 見てても不思議すぎて面白いねこれ
92 23/05/11(木)15:37:14 No.1056093866
画像ができるまでの工程眺めてると完成一段階前くらいのもやもやのほうが良くね?ってなる
93 23/05/11(木)15:37:36 No.1056093952
絵の解像度って意味ならデータを展開できるメモリ空間の広さに依存する 10~20GB程度積んだビデオカードではそこまで高解像度のは出せないから 低解像度の絵を高解像度にクリーンナップするAIに別途お願いする
94 23/05/11(木)15:37:53 No.1056094014
>画像ができるまでの工程眺めてると完成一段階前くらいのもやもやのほうが良くね?ってなる 人間の脳ってなんだかんだ都合よく補正する機能あるからな…
95 23/05/11(木)15:38:36 No.1056094169
>このノイズ除去!復元!の延長線上で絵の精度って上がるの? >なんか頭打ちがありそうだけど… 今はそこから先というか枝が生えて別個に指定していく感じの追加機能がいろいろ増えてる 人力要素が増えていくので全自動シコ絵装置が欲しいのにどんどん離れて行ってる感じがする
96 23/05/11(木)15:40:04 No.1056094478
>今はそこから先というか枝が生えて別個に指定していく感じの追加機能がいろいろ増えてる >人力要素が増えていくので全自動シコ絵装置が欲しいのにどんどん離れて行ってる感じがする なぁにその内口頭で指定したシチュからいい感じに呪文を作ってくれるAIが生まれる
97 23/05/11(木)15:40:31 No.1056094582
U-Netさんそんなに小さくて大丈夫か
98 23/05/11(木)15:41:28 No.1056094770
>このノイズ除去!復元!の延長線上で絵の精度って上がるの? >なんか頭打ちがありそうだけど… 絵の精度っていうのが結構評価難しいところだけど学習時の復元過程で使ってるのは大体モデル除去用のU-Netと条件付けのためのTransformerなのでパラメータ量を上げれば単純な復元精度もまあ上がらんことはないんじゃないか クオリティ的な話だとControlNetみたいに条件付のためのサブネットワークをつけたりするやり方とか強化学習と繋げたりするやり方とか色々あるね
99 23/05/11(木)15:42:31 No.1056094987
>U-Netさんそんなに小さくて大丈夫か すごいよね1Bたらずでこれだけ出せるの
100 23/05/11(木)15:42:34 No.1056095006
絵と文字データを同じベクトルデータとして扱ってるんよ だから(素晴らしい絵:1.2)みたいなベクトルデータの倍数処理で指定ができる
101 23/05/11(木)15:43:24 No.1056095195
>実際に基底張れるかはDisentangleって別の話だけど基底張れることは仮定してる >多様体仮説がそれに近い話な気がする 多様体仮説初めて聞いたけどおもしろそう 自然界も連続であって欲しいもんな
102 23/05/11(木)15:44:17 No.1056095399
TimeEncodingとかそんな簡単にU-Net制御できるの…?と思っちゃうけどできてるからすごい
103 23/05/11(木)15:45:07 No.1056095556
画像生成を途中でキャンセルすると分かりやすいと思う
104 23/05/11(木)15:47:14 No.1056096005
>このノイズ除去!復元! クイズ番組の問題かと思ったわ
105 23/05/11(木)15:47:52 No.1056096134
AI生成した塗りになんか特徴があるのは元データの問題なのかノイズから生成する構造上仕方ない事なのかよくわからん
106 23/05/11(木)15:49:37 No.1056096528
>AI生成した塗りになんか特徴があるのは元データの問題なのかノイズから生成する構造上仕方ない事なのかよくわからん 塗りはアニメ塗りとかに出来るんで誤魔化せるじゃんって思ってたんだけど それでも全体の色味がなんかぼんやりと影響しあってる感じは独特だなと思う
107 23/05/11(木)15:50:54 No.1056096791
>AI生成した塗りになんか特徴があるのは元データの問題なのかノイズから生成する構造上仕方ない事なのかよくわからん 復元過程を終えた画像にはピクセルレベルで細かな色のブレ(取りきれてないノイズ)があるね 人が塗る場合はそこまでランダムに色を振らすことがないから違和感の一つはそこにあるんだと思う
108 23/05/11(木)15:56:22 No.1056097965
AVのモザイクをはずす技術かと思った
109 23/05/11(木)16:00:18 No.1056098873
>AVのモザイクをはずす技術かと思った それもこれでやってる
110 23/05/11(木)16:06:29 No.1056100213
まあモザイクの下を想像で描いてるだけだけどな
111 23/05/11(木)16:06:59 No.1056100321
俺たちがカタログでやってることだよ
112 23/05/11(木)16:14:58 No.1056102060
冗談とかじゃないモザ消しマシンが出来るのか
113 23/05/11(木)16:15:34 No.1056102208
もうあるよ 正確にはモザイクを外すんじゃなくて上から適当におまんこ描くわけだが
114 23/05/11(木)16:18:08 No.1056102780
カタログトラップがすぐにできるから面白くなくなっちゃった感はある
115 23/05/11(木)16:25:21 No.1056104409
プロンプトの話になるとトランスフォーマー使った言語処理とかも入ってくるから複雑になるんだよね