「ローカル環境でSuno AI 4.5相当の音楽が作れる」
そんな触れ込みで話題になっていた
ACE-Step 1.5。
正直、これは気になる。
Sunoはクオリティ高いけどクラウド依存だし、課金必須。
ローカルで同レベルなら革命じゃないか?
ということで、
実際にローカル環境を構築して試してみました。
結論から言うと――
Suno並みというのは言い過ぎじゃないか?
というのが感想。
ただし、
「ダメだった」で終わらせるのはもったいないので、
何ができて、何ができなかったのかを正直に書いていきます。
ACE-Step 1.5とは?
ACE-Step 1.5は、ローカル環境で動かせる音楽生成AIモデルで以下が特徴となってます。
- テキストプロンプトからBGM生成
- 最低4GのVRAMから利用可能
- 生成が速い
- 無料で商用利用可能
環境作成
1.ワークフローを開く
ComfyUIのテンプレートにあるので、Ace Step 1.5と入力すれば出てきます。今回はACE-Step 1.5 音楽生成 AIOを使いました。
※でてこなければ、ComfyUIをアップデートすれば出てきます

2.モデルのダウンロード
上記を開くと、モデルが見つかりません、みたいな警告がでるのでダウンロードしてComfyUIのmodelsフォルダにぶち込む。これだけで動きました。
細かい設定はほぼ不要で、モデルを入れてワークフローを開くだけで動くのはかなり楽でした。
実際に作ってみた
ここからは実際に作ってみた曲を紹介していきます。
ピアノメインの歌なしのBGM
作業用BGMを狙って作ってみました。
プロンプト
A quiet, melancholic instrumental background music.
Slow tempo, soft piano melody.
Ambient pads, subtle strings.
No vocals, no percussion, no strong rhythm.
Minimal, calm, emotional, cinematic.
Suitable for background music, studying, working, night atmosphere.
物悲しいBGMを狙ったが、音質が悪くホラー寄りのように聞こえなくもない…
いわゆる「BGMとして流し続ける」用途には正直厳しい印象です。
ケルト音楽
ケルト音楽はいけるのか?
プロンプト
celtic battle music, fast tempo,
bodhran drums, driving rhythm,
short fiddle motifs,
instrument layers subtly changing,
dark fantasy atmosphere,
loopable game background music,
no clear verse or chorus
悪くはないですが、単調ですね。
歌詞あり
プロンプト
japanese pop music,
mid-tempo,
simple chord progression,
female vocal, soft tone,
japanese lyrics, slow and clear pronunciation,
no dramatic emotion,
simple structure,
loopable
歌詞
朝の光が
カーテンを揺らす
いつもの道を
今日も歩いてく
特別じゃない
そんな日々でも
少しだけ
前を向けたらいい
前を向いて
前を向いて
日本語音声はやや怪しいものの、
「何を言っているかは分かる」レベルには達していました。
ただ、歌として自然かと言われると違和感は残ります。
パラメータ調整しても限界あり
KSamplerのステップ数を増やしたり、KeyやScale(例:E-minor)を指定してみましたが、劇的な改善は見られず。
スローテンポや感情系BGMは特に厳しく、Ace Stepは「雰囲気素材生成」に寄ったAIだと感じました。
「Suno AI並み」は本当?
結論から言うと、Sunoの代替にはならないと感じました。
Sunoが得意なのは、
- 曲構成(Aメロ、サビ)
- メロディの分かりやすさ
- 全体の完成度
一方ACE-Stepは、
- ローカルで動く
- BGM・ループ素材向け
- ダーク・戦闘・機械系は比較的得意
「Suno 4.5相当」という表現は、完成した“曲”ではなく、生成できる“ジャンルの幅”を指していると考えるのが現実的でしょう。
ACE-Stepが向いている人
- ローカル完結で音楽生成したい人
- ゲームBGM・動画用素材が欲しい人
- 編集・ループ前提で使う人
- ダーク系・戦闘系BGMが目的の人
逆に、「そのまま公開できる完成曲」を求めるなら、やはりSunoの方が圧倒的に楽ですね。
まとめ
今回は正直、Suno並み!?ってところに惹かれたものの微妙でした。プロンプトやパラメータでもっと高品質なものが作れるのかもしれませんが、簡単なプロンプトを入れてSuno並みの音楽が作れる、みたいなものではありませんでした。
ただ、触ってみたからこそ分かることも多かったし、「ローカル音楽生成AIの現状」を知る意味では価値がありました。今後、モデルの進化で化ける可能性はありますが、現時点では用途をかなり選ぶAIだと思いました。期待して飛びつく前に、この記事が判断材料になれば幸いです。
Sunoの代替を探している人にはおすすめしませんが、ローカル音楽生成AIに興味がある人には、一度触ってみる価値はあると思います。

コメント