ここでは虹裏imgのかなり古い過去ログを閲覧することができます。
23/11/10(金)20:52:29 No.1122663056
試しに学習させてみたけど再現性がやばすぎるねこれ…
1 23/11/10(金)20:54:56 No.1122664185
なんか皆気弱なオタクみたいに声震えてるのは仕様なのか中身なのか
2 23/11/10(金)20:56:14 No.1122664825
>なんか皆気弱なオタクみたいに声震えてるのは仕様なのか中身なのか そんなんならんけどなあ そういうのしか聞いたことないんじゃない?
3 23/11/10(金)20:59:44 No.1122666626
俺の喘ぎ声も女の子になる?
4 23/11/10(金)21:00:07 No.1122666822
>そういうのしか 初っ端から口が悪くてダメだった
5 23/11/10(金)21:00:50 No.1122667193
?
6 23/11/10(金)21:02:18 No.1122668016
学習データ作ったのすごいな…結構大変だよな
7 23/11/10(金)21:02:45 No.1122668264
声は変わっても心は「」のまま…
8 23/11/10(金)21:03:06 No.1122668487
>学習データ作ったのすごいな…結構大変だよな 学習に思ったより時間かかった LoRAみたいなの早く作れるようになって欲しい
9 23/11/10(金)21:03:17 No.1122668588
>学習データ作ったのすごいな…結構大変だよな むしろ他のに比べたら遥かに簡単ってのが特徴じゃなかったっけ
10 23/11/10(金)21:04:02 No.1122669054
データ作るの簡単ではあるけど質高めるのはむずいよ BGMなどない質のいい音声を複数用意しないといけない
11 23/11/10(金)21:04:43 No.1122669439
VoicevoxとかMMVCはめちゃくちゃ手間かかってたからな
12 23/11/10(金)21:05:02 No.1122669591
俺がくぎゅの声で喋れるってこと?
13 23/11/10(金)21:05:24 No.1122669786
>BGMなどない質のいい音声を複数用意しないといけない ちょっと待って版権ある声前提なの?
14 23/11/10(金)21:05:53 No.1122670081
>>BGMなどない質のいい音声を複数用意しないといけない >ちょっと待って版権ある声前提なの? 他にどんな利用用途が?
15 23/11/10(金)21:07:07 No.1122670728
適当な女性Vtuberの雑談から音声とるのが一番楽だから仕方ないね
16 23/11/10(金)21:07:52 No.1122671143
>他にどんな利用用途が? なんか反論しようと思ったけど何も思いつかない 同じ会社の誰かを素材にして忘年会のネタに使うとか…?
17 23/11/10(金)21:11:11 No.1122673127
RVCは他のと違って学習にちゃんとした朗読データとか必要ないから他人の声でも学習できるのよね 出た当初から言われてる
18 23/11/10(金)21:12:36 No.1122673872
本人に質の悪いマイク使わせたらぶっちゃけ聞き分け不能だと思う
19 23/11/10(金)21:13:27 No.1122674315
BGMの無い音声データも今ゲームに声当ててる声優ならほぼ100%可能だし本当に楽
20 23/11/10(金)21:13:57 No.1122674587
fu2780885.mp3 いいよね…RVC…自分も使ってる
21 23/11/10(金)21:14:20 No.1122674788
5分くらいの音声ファイル10個を200エポックで学習させると うちの環境だとほぼ丸一日かかるのがつらい 何か設定が悪いのか
22 23/11/10(金)21:15:34 No.1122675524
絵の生成はほぼstablediffusion一択だけど音声AIはまだいろいろ候補があるんだな
23 23/11/10(金)21:16:21 No.1122675991
RVCが凄すぎる上にまだハッテンの余地あるから現状RVC一択だよ
24 23/11/10(金)21:20:10 No.1122677975
というかイラストAIもそうだったけど音声AIも権利問題が大きすぎて人前では使いにくい それでいて声としては不自然な点も残るから有名な声優を使うほどその声に対する不気味の谷でむず痒くなる
25 23/11/10(金)21:22:17 No.1122679167
>それでいて声としては不自然な点も残るから有名な声優を使うほどその声に対する不気味の谷でむず痒くなる 不気味の谷の正体って日本語のイントネーションなんだよな でもそこも解決されようとしているのでもうすぐさらにやばいのが出る
26 23/11/10(金)21:23:56 No.1122680092
フェイクニュースを作るのか
27 23/11/10(金)21:24:06 No.1122680170
>fu2780885.mp3 >いいよね…RVC…自分も使ってる なんでこんなビブラートかかってんの…
28 23/11/10(金)21:24:57 No.1122680634
ボイチェンに関してはイントネーションより本人の元の声の安定性かな… なんだかんだ声で食ってる人は一定の声量とそれこそ一昔前のNHKのMADみたいに安定した喋り方してる
29 23/11/10(金)21:34:32 No.1122685780
RVCみたいな界隈が現状の健全性を得るんなら男→女とか可愛い声→渋い声みたいな用途だと思う ◯◯の声を使う!って発想だとどうしても元の声の持ち主と利害が生まれる それでもこれまでのAIボイチェンに比べると大幅に不自然さと手間は改善されてる
30 23/11/10(金)21:35:48 No.1122686426
>ボイチェンに関してはイントネーションより本人の元の声の安定性かな… >なんだかんだ声で食ってる人は一定の声量とそれこそ一昔前のNHKのMADみたいに安定した喋り方してる それはそれ そこを超えられない問題としてイントネーションがあるんだよ なぜかというとイントネーションが日本語で学習されてないから
31 23/11/10(金)21:41:17 No.1122689433
voicevoxとかもっとイントネーション良くならないかな…
32 23/11/10(金)21:45:02 No.1122691515
>voicevoxとかもっとイントネーション良くならないかな… 元が個人の趣味で作ってるレベルだからね… 商業だとどんどん自然になってきてるんだけど値段と処理の重さが…