【ComfyUI】Qwen-Image-2512をGGUFと爆速Qwen-Image-2512-Turboで使ってみた

本記事はComfyUIを既にインストールされている方が対象です。まだComfyUIをインストールされてない方はComfyUIのインストールをお願いします。

Qwen-Image-2512とは

AIに聞いてみました。

このモデルが注目されている最大の理由は、「不自然なAI感（AI臭さ）」を徹底的に排除したリアリズムにあります。

「AIテカテカ感」の解消
- 従来の画像生成AIに多かった、肌の質感やライティングが過剰に綺麗すぎて「プラスチックのように見える」現象が劇的に改善されました。
人物の圧倒的なリアリティ
- 毛穴の質感、不揃いな毛並み、年齢相応のシワなど、生身の人間らしい「ノイズ」が自然に含まれるようになっています。
文字（テキスト）レンダリングの進化
- 画像の中に看板やロゴ、ポスターなどの文字を書き込む際、これまでのモデルより圧倒的に正確に、かつデザインに馴染んだ形で生成できます。
オープンソース最強クラスの評価
- 外部の評価サイト（AI Arenaなど）で、Googleの「Imagen 4」といった最強レベルの商用モデルに匹敵、あるいは凌駕するスコアを叩き出しています。

なるほど、ローカルでAIっぽさがない画像を生成できることがウリのようです。

適当なWorkflowを開いて下記画像のように「テンプレート→qwenと入力→Qwen-Imageテキストから画像」を選択します。

Workflowを開いたら、OOが足りないといわれるのでダウンロードします。
diffusion_modelとLoraは違うものを使うのでダウンロード不要です。
下記で別にダウンロードします。

GGUFは以下にあるものを使います。数字が大きいほど高画質になりますが、その分メモリを食うので自分のマシンと相談で。私はqwen-image-2512-Q4_K_M.ggufにしました。

以下からダウンロードします。

ダウンロードが終わったらそれぞれのファイルを下記の場所に移動します。

qwen_2.5_vl_7b_fp8_scaled.safetensors
→ComfyUI\models\text_encoders
qwen_image_vae.safetensors
→ComfyUI\models\vaes
diffusion_model（例:qwen-image-2512-Q4_K_M.gguf）
→ComfyUI\models\diffusion_models
Wuli-Qwen-Image-2512-Turbo-LoRA-4steps-V1.0-bf16_ComfyUi.safetensors
→ComfyUI\models\loras