AIの話

AI作曲が「ガチャ」で終わる人と、狙って当てる人の差

イメージ画像

なめらかに頭の中で鳴っていた曲が、生成ボタンを押すと別物になる。この落差の正体は、たいてい「指示の言葉」にある。

「感情の言葉」より「音の言葉」

音楽生成モデルに「感動的に」「エモく」と頼んでも、効きは鈍い。当然で、モデルは感情を持たない。学習しているのは、言葉と音の物理的な特徴の相関だけだ。「epic」という単語は、たまたまブラスや深いリバーブ、四つ打ちのキックと一緒に現れることが多い。だからそれっぽく鳴る。裏を返せば、音との結びつきが薄い感情語は、ほぼノイズとして無視される。

効くのは具体的な「音の言葉」だ。楽器編成、テンポ、長調か短調か、制作年代、ミックスの質感。たとえば「切ない」を狙うなら、感情そのものではなく、それを生む部品に翻訳する——遅めのテンポ、短調、減衰の長いリバーブ、息混じりのボーカル。「70 BPM, minor, dusty piano, tape hiss」のように書けば、出力は一気に安定する。頭の中の気分を、音の部品へ分解できる人ほど狙いに近づく。

構造は外から与える

もう一つの壁が「展開しない」問題だ。生成モデルは局所的な自然さは得意でも、3分かけて緊張と解放を設計するのは苦手で、Aメロからサビへという長い物語は見通しが利きにくい。

だから構造は人間が外から渡す。セクションごとに分けて生成し、編集でつなぐ。あるいは「intro / build / drop / outro」と展開を明示する。リファレンス機能があれば、骨格になる曲を与える。要は作曲全体を丸投げせず、編曲音色の担当として使う。指揮棒は手放さない。

結局なにが作れるか

この二つを押さえると、AI音楽は「ガチャ」から「道具」に変わる。感情を音の部品へ翻訳し、構造は自分で握る。すると、頭の中にあった「ありえたかもしれない一曲」に、驚くほど近い場所まで寄せられる。偶然の一発を待つのではなく、狙って当てにいく作業になる。

お役立ち情報

天野 奏の他の記事

タグ一覧