AI 音楽はこれから登場するわけではありません。すでに存在しています。
クレジット: ステイシー・チュー
AIはどこにでも存在します。その見分け方をご紹介します。
この記事は、Lifehackerの「AIを暴く」シリーズの一部です。AIが生成する6種類のメディアを取り上げ、人工コンテンツと人間が作成したコンテンツを見分けるのに役立つ、共通の癖、副産物、そして特徴を取り上げます。
AI生成コンテンツの中で、AIミュージックは最も奇妙な存在かもしれません。ChatGPTにエッセイを書いてもらうように、コンピューターに何もないところから曲を作らせるなんて、不可能に思えますが、実際には可能です。Sunoのようなアプリは、簡単な指示だけでボーカル、インストゥルメンタル、メロディー、リズムまで揃った曲を生成してくれます。中には、あまりにもリアルすぎるものもあります。この技術が進歩すればするほど、AIミュージックに偶然出くわしても、それと見分けるのは難しくなるでしょう。
実際、判別は既にかなり困難です。確かに、分かりやすい例もあります(素晴らしいとはいえ、プランクトンが本当にこれらのカバー曲を歌っているとは誰も思わないでしょう)。しかし、AIが生成した曲の中には、一般のリスナーを騙すことが確実なものも数多く存在します。特に、デジタルな響きを持つインストゥルメンタル・エレクトロニック・ミュージックは判別が難しく、多くの倫理的問題や音楽業界の将来への懸念を引き起こします。
しかし、それはさておき、目の前の課題、つまり、世間で耳にした AI 音楽を見分けることに集中しましょう。
AIによる音楽生成の仕組み
曲をテキストで説明すると、AIツールがボーカルも含めた曲全体を生成してくれるなんて、まるで魔法のようです。でも、実はこれは機械学習の成果なんです。
他のAIジェネレータと同様に、AI音楽ジェネレータは膨大な量のデータで学習されたモデルに基づいています。これらのモデルは音楽サンプルで学習し、様々な楽器、ボーカル、リズムの音の関係性を学習します。例えば、AIカバーを生成するプログラムは特定のアーティストの声で学習されています。そのアーティストの声のサンプルを十分に提供すれば、プログラムはそれを再現しようとしているボーカルトラックにマッピングします。モデルが適切に学習され、十分なボーカルデータを与えれば、説得力のあるAIカバーを作成できるかもしれません。
これは過度に単純化した説明ですが、これらの「新しい」曲は、膨大な他のサウンドや楽曲のデータセットによって実現されていることを忘れてはなりません。曲全体がAIで生成されたか、ボーカルだけが生成されたかに関わらず、この技術を支えるモデルは、過去の学習に基づいて成果物を出力しています。これらの出力の多くは印象的ですが、注意深く耳を傾ければ、一貫した癖に気づくことができます。
音声の不具合や途切れ
ほとんどの生成AI製品には、そのデジタル起源を示唆するアーティファクトや不整合が見られます。AI音楽も例外ではありません。AIモデルが生成する音声は、時には非常に説得力のある音に聞こえることもありますが、よく耳を澄ませると、ところどころに違和感が感じられることがあります。
Sunoの曲「Ain't Got a Nickel Ain't Got a Dime」を例に挙げてみましょう。これはAIの出力であり、当然ながら、多くの人が本物だと信じてしまうほどの恐怖を抱くべきものです。しかし、ボーカルに注目してみてください。「歌手」の声は最初から最後まで震えていますが、人間の声とは思えないほどです。まるでオートチューンされているかのように声が変化していますが、デジタル加工されているというよりはロボットのような響きです。この音に耳を傾けるコツをつかめば、多くのAI曲でこの音が頻繁に使われていることに気づくでしょう。(とはいえ、このコーラス部分は非常にキャッチーなのは承知の上ですが。)
もう一つの例、「Stone」は、おそらく前の曲よりもさらに恐ろしいでしょう。この曲には、特に「I know it but what am I to do(分かっているけど、どうすればいいの)」というフレーズが非常にリアルに聞こえる箇所があります。しかし、その直後の「oh, my love」のあたりで、先ほどと同じ転調の問題がいくつか見られます。そのすぐ後に、奇妙なグリッチが発生し、歌手とバンド全員が間違った音程で歌い、演奏しているように聞こえます。
さらに重要なのは、2番目の「コーラス」が崩れていることです。「I know it but what am I to do(分かっているけど、どうすればいいの)」までは歌詞は同じですが、途中で「I know it, me one day(いつか分かっている、私も)」に変わり、別の歌詞に変化します。さらに、AIは元のコーラスがどうだったかを覚えていないようで、新しいメロディーを作り出してしまいます。この2回目の試みは、1回目ほどリアルではありません。
これは直感を信じるべきです。デジタルツールで編集されたボーカルがあまりにも多く、こうしたグリッチや変調を本物の人間の声と区別するのは難しい場合があります。しかし、もし何かが少し不気味の谷のように聞こえるなら、それはロボットの歌声かもしれません。
低品質オーディオ
最新のストリーミングサービスと良質なヘッドフォンをお持ちなら、非常に高品質な音楽再生に慣れているかもしれません。一方、AIが生成した音楽は、往年のMP3サウンドに近いものが多く、鮮明ではなく、ぼやけて、金属的で、平坦な音になっていることが多いです。
Soundfulが提供するサンプルのほとんどで、私の言いたいことが分かります。オプションをクリックしてみてください。YouTube動画の背景で聞こえるサンプルは気にならないかもしれませんが、どれも特に鮮明ではありません。Loudlyのサンプルは若干高品質ですが、それでも各トラックが低品質フォーマットに圧縮されているかのような、同じような効果があります。現在、AIによる最高のオールラウンドソングと言えるSunoのトラックの多くでさえ、Napsterからダウンロードされたように聞こえます(ただし、ベースのドロップはうまく処理されているようです)。
これまでのところどう思いますか?
もちろん、意図的に「低品質」なサウンドを目指す、純粋なローファイ音楽というジャンルも存在します。しかし、これはトラックがAIで生成されたかどうかを判断する際に注目すべき手がかりの一つにすぎません。
情熱の欠如
AIはボーカルを生成できるかもしれないし、それも比較的リアルなボーカルさえ生成できるかもしれないが、それでも完璧ではない。この技術は、リアルな変化のあるボーカルを生成することにまだ苦労している。情熱の欠如と言えるかもしれない。
この曲「Back To The Start」を聴いてみてください。歌声は全体的にロボットっぽいですが、特に何かが起こっているわけではありません。歌詞のほとんどは同じようなトーンで歌われています。確かにポップで軽快ですが、少し控えめで、退屈な感じさえします。
しかし、これはAIの出力が改善している分野の一つです。Sunoは、(常にではないものの)リアルな変化のあるボーカルを生成しています。Planktonでさえ、Chappell Roanを歌うときには情熱的な声を発しています。
もう一つ注意すべき点は、AIの曲で歌い手が「息切れ」しているように聞こえることです。多くの歌詞が完璧に歌えていないように聞こえます。この現象の原因はよく分かりませんが、多くのAIシンガーで見られる現象です。例えば、フランク・シナトラがデュア・リパのカバーで、歌詞の一つ一つに苦労しているのを聞いてみてください。
この歌は実際に意味があるのでしょうか?
AIについて書いていると、ある点を繰り返し考えていることに気づきます。AIは実際には何も「知っている」わけではないということです。これらの生成モデルは関係性を探すように訓練されており、その出力は学習した関係性の結果なのです。
したがって、これらの曲は、AIが実際に音楽の作り方や音楽の本来の仕組みを知っているという証拠にはなりません。AIが優れた作詞家やメロディー作曲の専門家になるわけではありません。むしろ、AIは過去の学習に基づいて、批判的な能力を一切持たずにコンテンツを生み出します。最近では、その結果として生まれた作品は、一聴すれば納得できるものが多いですが、もう一度聴いたり、耳の肥えた人で聴くと、何かが崩れてしまうかもしれません。AIが作ったかもしれないと思う曲を目にしたときは、曲の様々な要素について考えてみてください。歌詞は実際に意味を成していますか?音楽は論理的に流れていますか?
こうした点に気づくのに音楽の専門家である必要はありません。前述の「Stone」の例を考えてみましょう。Sunoは最初のコーラスがどう進むべきかを「忘れてしまった」ようで、実際には冒頭で決めていた歌詞を台無しにしてしまいました。最初のヴァースもメロディー的にもめちゃくちゃで、特に「without thinking of you(君のことを考えずに)」という奇妙なフレーズが目立ちます。さらに、ヴァースは短く、すぐにコーラスに移行します。AIの出力がいかに「優れている」かは驚くべきことですが、だからといってそれが「良い」曲であるとは限りません。
誰が「歌っている」のか?
AIによる有名人のカバーは印象的で、物まねをしている歌手とそっくりな場合が多いです。しかし、その曲に有名人の声を使用しているという事実自体が、ヒントになることもあります。テイラー・スウィフトがサブリナ・カーペンターをカバーしているなら、それはYouTube動画やInstagramのリールに収まるものではなく、ニュースになるでしょう。メジャーアーティストが本物の音楽をリリースすれば、Apple MusicやSpotifyなどのストリーミングプラットフォームで見つかる可能性が高いでしょう。少なくとも、アーティスト本人からカバーを実際に録音したという何らかの証明が得られるでしょう。
ダウンロードニュースレター 技術ニュースを見逃さない
ジェイク・ピーターソン
ジェイクとチームからの最新の技術ニュース、レビュー、アドバイスを入手してください。
ダウンロードニュースレター テクノロジー 関連のニュースを見逃さないでください。ジェイクとチームからの最新のテクノロジーニュース、レビュー、アドバイスをお届けします。
ジェイク・ピーターソン
シニアテクノロジーエディター
技術ニュース、ハウツーガイド、解説などを取り上げます。
ジェイクの完全な経歴を読む
ジェイクの他の記事