世界を動かす技術を、日本語で。

エレヴン・ミュージック

概要

  • Eleven Music が正式リリース
  • 自然言語プロンプト で高品質な音楽生成が可能
  • ジャンルや構成、言語 など細かく制御可能
  • 商用利用 にも対応、幅広い用途で利用可能
  • APIや会話型AIとの連携 も今後提供予定

Eleven Music:AI音楽生成プラットフォームの新時代

  • Eleven Music は、最先端の AIオーディオプラットフォーム として登場
  • ビジネス、クリエイター、アーティスト、全ユーザー向けの音楽生成ツール
  • 自然言語プロンプト からスタジオ品質の音楽を自動生成
  • ジャンル、スタイル、構成 を自由に指定可能
  • ボーカル有無インストゥルメンタル も選択可
  • 多言語対応 (英語、スペイン語、ドイツ語、日本語など)
  • 楽曲全体や特定セクション の音や歌詞の編集も可能

Eleven Musicで生成された楽曲サンプル

  • Echoes of Midnight
    • ドリーミーでサイケデリックなスローインディーロック
    • リバーブの効いたボーカル、レトロなキーボード、印象的なコーラス
  • Saddles and Shadows
    • 西部劇向けエピックトラック
    • シネマティックなサウンドデザイン、ギターとオーケストラ要素が融合
  • Don’t Let Me Go
    • 1950年代風のレトロなトラック
    • クローナーボーカル、ヴィンテージ感とノスタルジー
  • Obsidian
    • 非常にダークで緊張感のあるシネマティックなインスト曲
    • 電子音とトレーラー向けサウンドデザイン
  • Wanderer of the Moor
    • 若いイギリス人女性によるフォークソング
    • 孤独感と美しさ、フィドルや伝統楽器を使用
  • Yellow Bus Jam
    • ニューヨーク市を走る黄色いスクールバスをテーマにしたジャムバンド
    • 2つの長いギターソロと多重ハーモニー

商用利用と活用範囲

  • レーベル、出版社、アーティスト と協力し商用利用も許諾済み
  • 映画、テレビ、ポッドキャスト、SNS動画、広告、ゲーム など幅広い用途
  • プランごとの利用範囲詳細は公式サイトで案内

今後の展開・利用方法

  • Eleven Music は公式サイトで提供中
  • パブリックAPI会話型AIプラットフォーム との統合も近日公開予定
  • プロンプトエンジニアリングガイド も公開、モデル活用の幅を拡大

まとめ

  • Eleven Music はAI音楽生成の新たなスタンダード
  • 多機能・高品質・商用対応 で幅広いユーザー層に対応
  • 今後のアップデートや連携機能にも注目

Hackerたちの意見

OT: 誰か逆のことを試したことある?AIに音楽を聴かせて、どの音やコードが演奏されているかを判断させるとか。誰かが楽器を演奏しているのを見て、どの音やコードを弾いているかをテキストで出力させるとか。

いっぱいあるよ。個人的には使ったことないけど、AnthemScore、ScoreCloud、Melody Scannerは、ちょっと検索したら見つけたやつの一部だよ。

これめっちゃいいな!2013年に解散したバンドの曲が好きで、そのライブパフォーマンスを見ながらトランスクリプトしてるんだけど、マンドリンやギターをアコースティックにしようとしてるのに、なかなかうまくいかないんだ。AIに「これをアレンジして、コードやタブを教えて」って言えるだけでも嬉しいな。

いや、それは役立つと思うけど、AIにはそれができないんだよね。

これにはすごく興味がある!単一の画像や人間の音声の録音を深く理解できるモデルが出始めてるけど、音楽を深く理解できるモデルはまだ見たことがない。Claude Codeがコードを反復して探求できるのと同じように、音楽のアイデアを反復的に探求できるAIシステムが見てみたいな。

似たような方向性の例を思い出すな。AIを使って音声処理をして、誰かの声以外を全部フィルタリングするやつ。確か、混雑した部屋の中で、いろんな人に焦点を合わせられたんだよね。音楽にも使われていて、楽器を選んでそれだけ聴くことができるみたいで、バンドの他の音は全部消せるんだ。

もういくつかのツールがこれをやってるよ - AnthemScore、Spleeter、CREPE、そしてGoogleのAudioLMも、楽器の複雑さや音質によって異なる精度で音楽をMIDIに変換できるんだ。

ちょっと前(たぶん1年くらい前)に、チャットGPTにタブ譜がない曲からギタータブを作ってもらったら、意外と上手くいったよ。

俺は週に何回も https://moises.ai/ を使って、練習したり、弾いてるコードを確認したりしてるよ。でも、ギターリフの音符みたいなものが存在するかは分からないな。

俺は大学の卒業制作でこれをやったんだ(https://www.deepjams.com/)。アップロードした既存の音楽からコード進行を抽出して、そのコードを元にリフを作ったんだ。こういうのに使えるオープンソースのライブラリもあるよ。

あなたが求めてるものとはちょっと違うけど、Spotifyにはこの曲をmidiに変換するツールがあるよ -> https://basicpitch.spotify.com/

機械学習のアルゴリズムが一般的な音楽を作り出すのって、まさにディストピアの極みだと思う。

これって、音楽家の軍団がこんなもの(https://www.chosic.com/free-music/presentation/)を作って生計を立てようとしているのと、どっちがディストピアなんだろう?会社のパワーポイントでQ3の木材チップの売上が期待を超えなかったことを説明するために。根本的な問題は、これがギターを持って楽しむ人間と競争すべきじゃないってことかも。競争する理由は、「生存」みたいな質問を、誰かが木材チップの収益報告を読むのを少しでも退屈じゃなくすることに結びつけているからじゃないかな?もっとコミュニティとしての別の方法を試すべきだと思う。

誰かがAI生成の曲をオートチューンするのを待ってるよ。

自動化して生活のあらゆる側面を商品化したいって言ってる人たちが、あなたが間違ってるって主張するコメントが殺到するのを待ってて。

焦らないで。まだロボコップやターミネーターには到達してないから。

僕が落ち込むのは、楽しめるものを作ったり武器を作ったりするためにエネルギーを使ってるのに、テクノロジー業界は未だに本当の問題を解決できずに、洗濯して、バスルームやトイレを掃除して、窓を洗ってくれる一般的な掃除ロボットすら作れないってこと。今あるのは、脚のある家具に引っかかったり、床に落ちてる靴下に引っかかったりする、クソみたいで役に立たない自動掃除機だけだよ。

間違ってるかもしれないけど、ここでの使い方は主に音楽が特に重要じゃない非アーティスト向けだと思う。例えば、ポッドキャスターやYouTuberが短いイントロトラックを欲しがるかもしれないし、エンターテイナーやマーケターが一般的な背景音楽や面白い音楽を求めるかも。プロデューサーやミュージシャンには使えるのかな?多分、コード進行やメロディのアイデアを得る手助けにはなるかもしれないけど、本物の音楽もそれをやってるし、もっと効果的だよね。

サウンドデザインのプロトタイピングには確かに役立つよね。すごく時間がかかるか、すごく高価なニッチな機材が必要になることもあるし。変わったドローンを作るのに、かなりの時間と労力がかかることもあるからね。「それを説明して」80%以上のところまで行けるのは大きな勝利だよ。もしサンプルや音をAbleton Pushとかで切り刻むことに集中してるなら、無限の可能性を持つツールになるね。

プレースホルダー的な音楽要素には役立つかもね(特定の音のパレットの中に何かが必要なことが多いから)。でも、ほとんどのスタジオバニーはOmnisphereみたいなサンプルライブラリをすでに暗記してるよ。

ジェネレーティブAIについての議論は、アートとエンターテインメントを分けて考えると良いかもしれないね。アートに関しては議論の価値があるけど、エンターテインメントはもう明らかだよね。エンタメは、大量生産されたクソみたいなものが通用する市場で、アートなんてほとんど評価されてないし。

こういう「全てを一気に解決」するモデルからは早く脱却したいな。もっと協力的で、反復的なものが欲しい。昔のバンド仲間と話してたんだけど、彼が今作ってる曲のことを話してたんだ。ギターも弾けるし、ちょっとベースもできるし、歌も歌える。ドラムだけが足りないんだよね。彼はデモをアップロードして、ドラムトラックのステムが返ってくるか、デモとドラムを組み合わせてくれるモデルを求めてる。今のモデルはツールというより、スロットマシンみたいだよね。お金と時間/忍耐があれば、何かできるかもしれないけど、もっと協力的でインタラクティブ、反復的なモデルが出てくるのを楽しみにしてる。

これにはGarageBandをおすすめするよ。

もしこれが実現したら、セッションミュージシャンはお疲れ様だね。いいドラマーなら、これが主な収入源の一つだから。

すごくいいこと言ったね。俺も同じ気持ちだよ。AIにギターリフを元にドラムグルーヴやドラムフィルを書いてほしいんだけど、今のAIツールは全部の曲を作っちゃうから、全然興味ないんだよね。作曲ってめっちゃ楽しいのに。

Sunoならもうそれができるよ。

最近のVSTドラムシーケンサーは、かなり強力なグルーヴライブラリを持ってるよね。モデルとかそういうのじゃなくて、パターンをミックスしたり修正したりするだけで、すごく良い結果が得られることもあるよ。

このタイプのコラボレーションアプローチを他の分野、例えば集団の理解に応用することについてどう思う?その分野で何か取り組んでるんだ。

Sunoみたいに、曲のスタイルを変えたカバーやメロディの即興演奏ができるのかな?ミュージシャンとしては、そこがSunoの一番魅力的なところだと思う。音楽のアイデアを試したり、新しい創造性を刺激するための協力ツールになってるんだ。出力を聴いて、気に入った部分を自分の作品に織り込むんだよね。プロンプトから全曲を生成するAI音楽ツールは面白いギミックだけど、上記の点では全然足りないよ。

ギターを23年やってるけど、そのページの音楽の大半がちょっと気持ち悪いんだよね。特に「Yellow Bus Jam」はね。ギターソロがすごく不自然で、フレージングが完全にランダムなんだ。ブルースミュージシャンは楽器を通して何かを伝えようとしてるけど、これは6本指の3本手ロボットが演奏したランダムなソロに過ぎない。いらないな、笑。

初期のYouTube時代のオーバーダブ動画を思い出すな。あれは面白かったけど、「Yellow Bus Jam」はなんか空虚で間違ってる感じがする。あの曲にはSteely Danの何かがある気がする。

それに慣れなよ。ミュージシャンよりもずっと安いし、一般の人にとっては「楽器を通して何かを伝えようとすること」と「ランダムに生成されたソロ」はほぼ同じことだから。

俺も同じ気持ちだったけど、1年前の生成された人間の手と今のを比べると違いがあることを思い出したよ。でも、そのソロは結構面白かったね。

リズム感があって、彼が本当に音楽に情熱を注いでいるって信じちゃいそうだったよ。あの大きな黄色いバスでね。

Suno試してみた? どうだった?

そうだよね? AIはまだ不気味の谷にいるよ。でもたまにAIで作られたものに出くわすことがあるんだ。証拠はないけど、ここにある曲はAIが作ったと思ってる:https://www.youtube.com/watch?v=hL1Fg1QnDig いい曲だけど、やっぱりAIっぽい感じがする。

それって人間が演奏してるように聞こえる?音の質を攻撃してるんじゃなくて、何を演奏してるかを問題にしてるんだよね。

まだ諦めたくなるよ。最近6ヶ月くらいでキーボードを学び始めて、シンセサイザーでゲーム音楽を作ろうとしてるんだけど、時間を無駄にしてる気がして辛い。ゲーム開発者はコストを考えるから、仕方ないよね。出力は完璧じゃないけど、今のジェネAIがこれをできるなら、1年後、2年後はどうなるんだろう?新参者にはちょっと厳しいよね。

このコメントを見てリンクをクリックして曲を聴いてみたんだけど、マジでひどかった。速いブルース/ロックの曲の個々の要素は揃ってるのに、音楽の仕組みを全く理解してない人が作った感じ。ギターソロも最悪だった。

歌のせいなのか気になるんだけど、リズムがめちゃくちゃで、すごく不協和音に感じるんだよね。

「黄金時代のスタイルでリズミカルなアルゼンチンタンゴを10秒作って」って頼んだんだ。(黄金時代のタンゴは1935年から1950年まで)。でも、出てきたのはひどいボールルームタンゴみたいなもので、テンポが目立って、パソドブレみたいだった。耳が痛くなるような典型的なボールルームタンゴの音。つまり、完全に失敗したってこと(アルゼンチンタンゴはこんなのじゃない)。追記:名前は言えないけど、D'Arienzoのことを頼んだんだ(「黄金時代」の代わりに)でも著作権の理由で拒否された。エダド・ドーロでも同じ理由で拒否された。つまり、これが何かのアーティストだと思ったみたい(「edad d'oro [de tango]」は黄金時代のタンゴのスペイン語名だから、どういうこと?)。著作権について言えば、2024年現在、1940年代のフアン・ダリエンソの録音はアルゼンチンではパブリックドメインだよ。

Sunoを使い始めてまだそんなに経ってないけど、正直言って、まだまだ遠いなって感じ。バージョン1を超えたら改善されるかもしれないけど、今まで慣れてきたステレオで高音質なものと比べると、時々過圧縮されたMP3みたいに聞こえて、数年前の音に感じる。

Udioを試してみて。あまり人気はないみたいだけど、質や多様性、音楽性がかなり高いと思うよ。

AIの本質って、人間がこういう仕事をして、ロボットがレンガを積んだり、鉱山で死んだりすることだと思ってたんだけど。

Eleven Musicみたいな会社がまた別のクローズドな重みモデルをリリースすると、コミュニティの革新や実験の機会を失って、ビジネスを豊かにするチャンスを逃しちゃうんだよね。AI音楽モデルのオープンソースエコシステムはかなり貧弱で暗い状況だし、こういう会社のAI音楽の出力が停滞してるのは、オープンソースモデルにもっと力を入れれば、音楽の創造性のルネッサンスが起こるかもしれない。