【音声動画有り】音声生成AIの解説【マヤイヌ】
1投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2023年04月25日(火) 22時12分12秒
https://www.youtube.com/watch?v=IxwcBT7V1J0
これはすごい、暇だったらちょっとやってみて
暇無くても俺の声聞いてみて
2投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2023年04月25日(火) 22時22分26秒
ごめん、聞いたけどよくわからん。
要するに何がどうなるのよ?
3投稿者:ヾ(゚д゚)ノ゛アホー  投稿日:2023年04月25日(火) 22時26分46秒
ありがとうね

でもすごく分かり辛い
4投稿者:マヤイヌ  投稿日:2023年04月25日(火) 22時32分48秒
実は1の動画の音声は本当の俺の声じゃなくて、全部Barkってやつで作った合成音声なんです。
謎のキモい笑い、キモい咳払い、言葉に詰まって「え〜・・・」とか「あの〜」とか連発
これら全部勝手にAIがつけてくれて、より自然な喋り方となっているわけです!
5投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2023年04月25日(火) 22時37分11秒
あーそういうことね、完全に理解した
6投稿者:ヾ(゚д゚)ノ゛アホー  投稿日:2023年04月25日(火) 22時38分10秒
マジか
それはすごい
Barkに教える素材ってどれくらいの量必要だったの
7投稿者:マヤ犬  投稿日:2023年04月25日(火) 22時52分06秒
俺は教えてないッス、誰かが用意したやつがあってそれが使えるっす
↓Googleコラボがめんどい場合は生成時間はかなりかかりますが
https://huggingface.co/spaces/suno/bark
ここで文字(日本語でもOK)入れてSpeaker2(ja)←一番キモいを選んで送信を押しても出来ます。
ただhuggingfaceのPCをクラウド経由で使うことになるのでかなり遅いです
コラボの方が10倍速いので面白いとおもったら、1のやり方してみてね
8投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2023年04月25日(火) 22時53分56秒
え、じゃあマヤ犬の声の要素はゼロなの
9投稿者:マヤ犬  投稿日:2023年04月25日(火) 23時04分25秒
http://amezor-x.net/up/source/up3076.wav
10投稿者:マヤ犬  投稿日:2023年04月25日(火) 23時08分11秒
俺はつんくみたいに無言でキーボードをカタカタしてただけなんだぜーーっ!
11投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2023年04月25日(火) 23時55分39秒
今イチ何がすごいのかよくわからなくなった
12投稿者:マヤイヌ  投稿日:2023年04月26日(水) 01時39分24秒
チャットAIを音声付きでBarkみたいな話し方でスムーズに音声認識して応答出来るようになったら
近未来に人型アンドロイドが出来るとしたら「ワタシワ アシスタント ロボットデス」みたいな感じじゃなくて
「は〜、なるほど・・・ふぅん、え〜、じゃあ・・」みたいに、より人間と話してるような感じになるんやないかと
ドラえもんも「ボクワネコガタロボットデス」とか言わへんやん、人間みたいに喋るでしょう
13投稿者:マヤイヌ  投稿日:2023年04月26日(水) 01時47分37秒
Barkとは関係ないけど毎日進化してる画像生成AI、この動画もAI生成
これは文字を打ち込んだら動画が出来るわけじゃなくて
1枚1枚膨大な枚数を生成して繋ぎ合わせてあとはフレーム補間ソフトでなんとかしてるとみた
https://twitter.com/pink_engineer_/status/1650098289679949826?s=20
14投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2023年04月26日(水) 13時48分42秒
ちょっと音質が悪すぎて真贋判定とかできるレベルじゃないと思うけど
15投稿者:ヾ(゚д゚)ノ゛アホー  投稿日:2023年04月26日(水) 15時10分28秒
真贋というか偽物なんでしょ
16投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2023年04月26日(水) 16時01分13秒
だからそもそも真贋判定できるクオリティではなかったという話
それであとから「実は偽物でした!凄いでしょ!」とか言われてもなーと
17投稿者:マヤイヌ  投稿日:2023年04月26日(水) 19時16分32秒
きっと俺の説明の仕方だからだろう
この人ならどうだろう
https://www.youtube.com/watch?v=1AJUBJCqkXA
投稿者 メール ファイル
(゚Д゚) <
  レス全部を見る 掲示板に戻る 上へ