新しいものを表示

とりあえず今重宝されるのは平凡なほうかも。癖あるのはかなり難しい

ま、まぁ歌声DBのこともあるので気長に待ってて。。。

seiren voice、全部棒読みというかアナウンサー読みになっちゃって困ってる。。。

基本変なくせは付けないな確かに
というかイントネーションはめっちゃ気を使ってる

吐息の多いパターンと少ないパターンを用意して混ぜるといい具合になりそう

ぱっと一番しゃべりやすかった部分だけ
003
音量は確認してない

あまみやくんは癖とかなくて良いサンプルそうだな

もうイントネーションは結局使用者の演技次第になる、つまり演技のプロは仕事がなくならない!!!!

癖は、なんかめちゃ吐息多めの人だと、なんか吐息多めのが生成される。ゆかりさんがそうだった

リアルタイムな声変換なんかは部分的にしか捉えられない(未来の情報がない)ので性能に絶対限界がある

癖みたいなのはディープラーニング君も真似してしまうので、訛ってたらちょっと変なるかも。

じゃあ僕が訛っててもなんかかんかしてくれるんやな!

読み上げコーパスの音声がどんなイントネーションであっても、良い感じに対応関係を見出してくれるので、別に良いっていう

イントネーション、音声の部分的に捉えるのか全体的に捉えるかで結果変わりそう。

んで音声合成するときに、文章とイントネーションを与えたら、対応する音声が良い感じに生成される

「読む文章とイントネーションから音声を生成する」タスクの場合、「文章」と「イントネーション」と「音声」の対応関係をディープラーニングが獲得する

ディープラーニングは、複雑であってもしっかり対応関係を取る感じ

サラダチキンをガツガツ食べると口内炎になった
何故なのか

いっぱいの人が読めばそのぶん平均化されてくみたいなイメージなんかな

古いものを表示
friends.cafe

ちょっとしたティータイムに、ちょっとした待ち合わせに。そんな、ちょっとした時間に立ち寄ってお友達とお話してみませんか?friends.cafeへようこそ☕
⚠️ユーザ登録は承認制となっています。登録をご希望の方はサーバーのルールをお読み頂き,「意気込み」欄へ質問の回答を記入してください。❤️