音声の界隈でもAI学習についての問題が浮上しはじめてきたじゃないですか。
声優とかアイドルとかいろんな著名人の音声を学習させたAIボイチェンを使って、その人が実際に言っていないことをさも言ったかのように流布するのはもちろん論外のダメな行為だと思います。
著名人の声を使って「誰に何を歌わせてみた」ってのも、厳密に黒なんだけど、これはまだファンからの熱い気持ちによる二次創作の範疇であれば私は許したい気持ちもなくはない。ただやっぱりさも本物であるかのように振る舞うのはダメで、AI学習を使って歌声を生成してみたってしっかり表明してくれたらまあ、の気持ち。それはもちろん私の個人的な考えであって、世間的にはだいぶダメな行為であることは理解してる。とはいえファンの間で楽しまれてる部分もあって、もしかしたら公式も迷惑さえかけないでくれれば楽しんでくれ、って気付かないふりをしてくれてるだけかもしれないからわざわざ騒ぎ立てたり、正義感で「これいいんですか!?」ってお伺いを立てるようなこともしないけど。聞かれたらダメって言うしかなくなるだろうからね。
とまあ、現在問題視されてるのってだいたいこの、変換先の声としての学習じゃないですか。
じゃなくて、変換元としての学習っていまのところあんまり問題視されてなくない?私が知らないだけでだいぶ昔に問題視されてて今更だれも議論する余地もないほどダメって結論が出てるだけなのかなあ。
ようはね、今だと便利なプラグインとかあるじゃない、うたりすとか周波数トレーサーとか。そういうのを使えば、上手な歌唱データさえあればUTAU上での調教をあんまり苦労せずに再現できてしまうんじゃないかなって思ってて、でも、今までは「上手な歌唱データ」の用意がネックだなって思ってたの。
というのも、これがカバー曲であれば原曲というものがあるけど、オリジナル曲を作りたい人にとってはあんまり関係ない話なんじゃないかなって。自分が歌に自信あるなら自分で歌ってピッチ曲線をトレースすればいい話だけど、それが可能じゃない人もいっぱいいるでしょ。
だけど今だと、AIのちからでベタ打ちで上手な歌唱データってオリジナル曲でも準備できる時代になっちゃったわけよね。ボカロだって最新のものだったらベタ打ちで十分なクオリティだもん。
ただね、それを作品としてそのまま発表するのであれば、ちゃんと「歌唱データは何を使用しました」って表記すればいいって規約があって問題なく使えるとしても…
「歌唱の学習に何から出力した歌唱データを使用しました」って表記すると話は変わってくるでしょ。学習って単語に脊髄反射して叩き始める人も出ると思うし、規約をもって判断する公式側の人だって、ちゃんとやってることを理解してくれるかどうかわからない。今の時代、AI学習って言葉だけで嫌われて全部禁止全部禁止!ってなりかねない空気感があるのよ。
ボカロ時代から、原曲のあらゆる波形データをそのまま再現してみたら神調教になった、みたいな動画はあったと記憶してるけど、それも人力で目コピでやってたから許されてた話で、ツールで一発でなぞれる時代になったらまた話は変わってくるんじゃないかなあ。
実際のところ、そういう、AIによってベタ打ちでも上手な歌唱データを出力できるもの、その出力データの「歌い方」をトレースするのってNGなのかなあ?
コメント