【ComfyUI】Qwen-Image-2512をGGUFと爆速Qwen-Image-2512-Turboで使ってみた

本記事はComfyUIを既にインストールされている方が対象です。まだComfyUIをインストールされてない方はComfyUIのインストールをお願いします。

スポンサーリンク

Qwen-Image-2512とは

AIに聞いてみました。

AI
AI

このモデルが注目されている最大の理由は、「不自然なAI感(AI臭さ)」を徹底的に排除したリアリズムにあります。

  • 「AIテカテカ感」の解消
    • 従来の画像生成AIに多かった、肌の質感やライティングが過剰に綺麗すぎて「プラスチックのように見える」現象が劇的に改善されました。
  • 人物の圧倒的なリアリティ
    • 毛穴の質感、不揃いな毛並み、年齢相応のシワなど、生身の人間らしい「ノイズ」が自然に含まれるようになっています。
  • 文字(テキスト)レンダリングの進化
    • 画像の中に看板やロゴ、ポスターなどの文字を書き込む際、これまでのモデルより圧倒的に正確に、かつデザインに馴染んだ形で生成できます。
  • オープンソース最強クラスの評価
    • 外部の評価サイト(AI Arenaなど)で、Googleの「Imagen 4」といった最強レベルの商用モデルに匹敵、あるいは凌駕するスコアを叩き出しています。

なるほど、ローカルでAIっぽさがない画像を生成できることがウリのようです。

私のPCスペック

CPURyzen 5700X
グラボRTX 5060Ti 16G
メモリ32G

導入方法

適当なWorkflowを開いて下記画像のように「テンプレート→qwenと入力→Qwen-Imageテキストから画像」を選択します。

Workflowを開いたら、OOが足りないといわれるのでダウンロードします。
diffusion_modelとLoraは違うものを使うのでダウンロード不要です。
下記で別にダウンロードします。

GGUF版のダウンロード

GGUFは以下にあるものを使います。数字が大きいほど高画質になりますが、その分メモリを食うので自分のマシンと相談で。私はqwen-image-2512-Q4_K_M.ggufにしました。

unsloth/Qwen-Image-2512-GGUF at main
We???re on a journey to advance and democratize artificial intelligence through open source and open science.

爆速LoRA「Qwen-Image-2512-Turbo」のダウンロード

以下からダウンロードします。

Wuli-Qwen-Image-2512-Turbo-LoRA-4steps-V1.0-bf16_ComfyUi.safetensors ?? Wuli-art/Qwen-Image-2512-Turbo-LoRA at main
We???re on a journey to advance and democratize artificial intelligence through open source and open science.

ダウンロードしたファイルの格納場所

ダウンロードが終わったらそれぞれのファイルを下記の場所に移動します。

  • qwen_2.5_vl_7b_fp8_scaled.safetensors
    →ComfyUI\models\text_encoders
  • qwen_image_vae.safetensors
    →ComfyUI\models\vaes
  • diffusion_model(例:qwen-image-2512-Q4_K_M.gguf)
    →ComfyUI\models\diffusion_models
  • Wuli-Qwen-Image-2512-Turbo-LoRA-4steps-V1.0-bf16_ComfyUi.safetensors
    →ComfyUI\models\loras

Workflowの修正

GGUF版を使用するよう変更

Workflowでは拡散モデルを使用するようになっているので修正します。
まず以下は不要なので削除します。

代わりにWorkflowで右クリックして「ノードを追加→bootleg→Unet Loader(GGUF)」を選択して追加します。

追加したら「diffusion_model(例:qwen-image-2512-Q4_K_M.gguf)」を選んで隣のノードに接続します。

爆速LORA「Qwen-Image-2512-Turbo」を使用するよう変更

デフォルトではLoraが使用しないようになっているのでまずこれを解除します。
紫色になっているLoRAローダーモデルのみのノードの上で右クリック→バイパスをクリックします。

次に「Qwen-Image-2512-Turbo」を選択します。

これで終わりです。後はプロンプトを好きに入力して画像生成してください。

Loraなし、ありで生成してみた結果

プロンプトはそのままでLoraなし、ありで画像生成してみました。
結果がこちら。

約40秒くらい早く生成できるようになりました!
生成画像はどうでしょう、Loraありの方がくっきりしているような?

Loraなし
Loraあり

使用感

Z-Image-Turboも使いましたが、生成時間はあちらの方が断然早いですね。Qwenと聞くと以前のQwen-Image-2509はNano Bananaのように、別から画像持ってきて合成するとか、そういうことが特徴だったの思いますが、まだそれができるWorkflowは出ていないようです。

ちなみQwen-Image-2512ではプロンプトに日本語も使えました。
「女の子」と入れると下記画像が生成されました。

確かに一昔前のAIが生成した画像より、ほくろがったり毛が奇麗にまとまっていなかったり自然な感じはしますね。ただ一画像に5分以上かかるのは、ちょっと遅いと言わざるを得ない。。

コメント

タイトルとURLをコピーしました