flux-2-klein
RunComfy上でFlux 2 Kleinを用いて、高速かつ高品質な画像生成を、モデルの特性に合わせたプロンプトで実現し、ステップ数やモデル選択の指針も示してくれる画像生成を支援するSkill。
📜 元の英語説明(参考)
Generate images with Flux 2 Klein (Black Forest Labs' distilled fast variant of Flux 2) on RunComfy — bundled with the model's documented prompting patterns so the skill gets sharper output than naive prompting against the same model. Documents Flux 2 Klein's strengths (sub-second latency, multi-reference brand styling, declarative subject-first prompts), the step-count strategy (4–8 for fast iteration, ~25 for polish), the 9B vs 4B variant trade-off, and when to route to Flux 2 Pro / Seedream 5 / GPT Image 2 instead. Calls `runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image` (or `/4b/`) through the local RunComfy CLI. Triggers on "flux 2 klein", "flux-2-klein", "flux klein", "BFL flux 2", or any explicit ask to generate with this model.
🇯🇵 日本人クリエイター向け解説
RunComfy上でFlux 2 Kleinを用いて、高速かつ高品質な画像生成を、モデルの特性に合わせたプロンプトで実現し、ステップ数やモデル選択の指針も示してくれる画像生成を支援するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o flux-2-klein.zip https://jpskill.com/download/10361.zip && unzip -o flux-2-klein.zip && rm flux-2-klein.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/10361.zip -OutFile "$d\flux-2-klein.zip"; Expand-Archive "$d\flux-2-klein.zip" -DestinationPath $d -Force; ri "$d\flux-2-klein.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
flux-2-klein.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
flux-2-kleinフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
Flux 2 Klein — RunComfy の Pro Pack
runcomfy.com · 9B model · 4B model · GitHub
Black Forest Labs の Flux 2 Klein (Flux 2 の蒸留された低遅延バリアント) は、RunComfy Model API でホストされています。API キーは不要で、非同期 REST です。
npx skills add agentspace-so/runcomfy-skills --skill flux-2-klein -g
このモデルを選ぶべき時 (他のモデルとの比較)
Flux 2 Klein の際立った強みは、レイテンシ優先のクリエイティブな反復です。1 秒未満のフィードバックにより、ライブのアートディレクションセッションや、バッチスタイルのモデルでは維持できない迅速な製品の視覚化が可能になります。反復速度が上限解像度よりも重要な場合に選択してください。
| 必要なもの | 使用するモデル |
|---|---|
| リアルタイム/ライブのアートディレクションセッション | Flux 2 Klein 4B |
| 最後に強力なディテールを備えた高速な反復 | Flux 2 Klein 9B |
| 一貫したルックを備えたマルチリファレンスブランドスタイリング | Flux 2 Klein |
| 2K〜4Kのヒーロー画像、最大解像度 | Seedream 5 |
| 最大限のプロンプト遵守 + 極端なディテール | Flux 2 Pro |
| 埋め込みテキスト、ロゴ、多言語サイネージ | GPT Image 2 |
| 超現実的なポートレート | Nano Banana Pro |
ユーザーが「Flux 2 Klein」/「BFL Klein」/「flux klein」と明示的に言った場合は、とにかくここにルーティングします。ユーザーが一般的に「Flux 2」と言った場合は、デフォルト設定する前に、Klein(高速) と Pro(最大品質) のどちらが必要か尋ねてください。
前提条件
- RunComfy CLI —
npm i -g @runcomfy/cli - RunComfy アカウント —
runcomfy loginは、ブラウザのデバイスコードフローを開きます。 - CI / コンテナ —
runcomfy loginの代わりにRUNCOMFY_TOKEN=<token>を設定します。
エンドポイント + 入力スキーマ
2 つのバリアント、同じエンドポイント形状、同じプロンプト文法です。
blackforestlabs/flux-2-klein/9b/text-to-image
忠実度優先のバリアントです。仕上げ/最終出力に使用します。
| フィールド | タイプ | 必須 | デフォルト | 注 |
|---|---|---|---|---|
prompt |
string | yes | — | 最大〜512 トークン。長すぎると劣化します。 |
steps |
int | no | 25 | 4〜50。ステップ蒸留アーキテクチャ — コンセプト作成には 4〜8 で十分です。仕上げには〜25。> 25 ではほとんど効果がありません。 |
width |
int | no | 1024 | 512〜1536 が一般的です。アスペクト比は 16:9 に制限されており、最大〜2K 合計です。 |
height |
int | no | 1024 | width のアスペクト比の意図に合わせてください。 |
blackforestlabs/flux-2-klein/4b/text-to-image
レイテンシ優先のバリアントです。1 秒未満の 4 ステップ推論。ライブの反復/コンセプト作成に使用します。
9B と同じフィールドセットです。デフォルトの steps は事実上 4 です。このバリアントはそのステップ数用に構築されています。
参照画像 (両方のバリアント)
スタイル転送/ガイド付きコンポジションのために、同じエンドポイントで最大 4 つの同時参照画像がサポートされています。JSON 本文の正確なフィールド名は、モデルの API タブ に記載されています。CLI を介してそのまま渡してください。参照画像を使用すると、個別の /edit エンドポイントなしで編集スタイルのワークフローが可能になります。
呼び出し方法
高速コンセプト作成 (4B、1 秒未満):
runcomfy run blackforestlabs/flux-2-klein/4b/text-to-image \
--input '{"prompt": "<user prompt>"}' \
--output-dir <absolute/path>
仕上げ/最終 (9B、〜25 ステップ):
runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image \
--input '{
"prompt": "<user prompt>",
"steps": 25,
"width": 1024,
"height": 1024
}' \
--output-dir <absolute/path>
ワイドフォーマットポスター:
runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image \
--input '{"prompt": "<user prompt>", "width": 1536, "height": 864}' \
--output-dir <absolute/path>
CLI は送信し、ターミナルに到達するまで 2 秒ごとにポーリングし、結果から *.runcomfy.net / *.runcomfy.com URL を --output-dir にダウンロードします。Stdout は結果 JSON です。Stderr は進捗状況です。
パイプフレンドリーな使用法:
runcomfy --output json run blackforestlabs/flux-2-klein/4b/text-to-image \
--input '{"prompt":"..."}' --no-wait | jq -r .request_id
プロンプト — 実際に機能するもの
これらは、出力品質を経験的に向上させるモデル固有のパターンです。
主語優先の宣言的な文法。 Flux 2 Klein がトレーニングされた構造は "Subject + action + scene + style + lighting + camera + quality" です。主語を最初にロードし、指示を後に続けます。例: "A vibrant hummingbird mid-flight sipping nectar from a bright pink hibiscus, iridescent feathers in morning sun, soft bokeh tropical garden, macro photography, razor-sharp detail, cinematic lighting"。
具体的な表現は、華やかな言葉よりも優れています。 「4k product photo, softbox lighting, reflective table, 35mm, f/2.8」は予測可能にガイドします。「A really pretty product image」はそうではありません。
フェーズごとのステップ数。
- コンセプト作成: 4B バリアントで 4〜8 ステップ — ライブ探索のための 1 秒未満のフィードバック。
- 洗練: 4B で引き続き 8〜15 ステップ、主語 + 構図をロックします。
- 仕上げ: 9B バリアントで〜25 ステップ — テクスチャ、マイクロディテール、細かいタイポグラフィ。
マルチリファレンスアライメント。 参照画像を渡す場合は、それらの美学を揃えてください。同じ呼び出しで水彩 + フォトリアル + 3D レンダリングを混在させると、エディターが混乱します。すべての参照で一貫した視覚レジスタを 1 つ選択します。
条件付き編集: 何が残るか、次に何が変わるかを述べます。"Same composition and lighting as reference, but change the background from beach to mountain studio." このパターンは構図を安定させます。
テキストレンダリングの場合 (Klein には 8B Qwen3 エンベッダーがあり、まともですが GPT Image 2 の領域ではありません): "crisp typography, high-contrast label" を追加し、テキストがぼやけている場合はステップ数を〜25 に増やします。ヘビーな場合
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Flux 2 Klein — Pro Pack on RunComfy
runcomfy.com · 9B model · 4B model · GitHub
Black Forest Labs' Flux 2 Klein (the distilled, low-latency variant of Flux 2) hosted on the RunComfy Model API — no API key, async REST.
npx skills add agentspace-so/runcomfy-skills --skill flux-2-klein -g
When to pick this model (vs siblings)
Flux 2 Klein's distinct strength is latency-first creative iteration: sub-second feedback enables live art-direction sessions and rapid product visualization that batch-style models can't sustain. Pick it when iteration speed matters more than ceiling resolution.
| You want | Use |
|---|---|
| Real-time / live art-direction sessions | Flux 2 Klein 4B |
| Fast iteration with strong detail at the end | Flux 2 Klein 9B |
| Multi-reference brand styling with consistent looks | Flux 2 Klein |
| 2K–4K hero images, max resolution | Seedream 5 |
| Maximum prompt adherence + extreme detail | Flux 2 Pro |
| Embedded text, logos, multilingual signage | GPT Image 2 |
| Hyperrealistic portrait | Nano Banana Pro |
If the user said "Flux 2 Klein" / "BFL Klein" / "flux klein" explicitly, route here regardless. If they said "Flux 2" generically, ask whether they want Klein (fast) or Pro (max quality) before defaulting.
Prerequisites
- RunComfy CLI —
npm i -g @runcomfy/cli - RunComfy account —
runcomfy loginopens a browser device-code flow. - CI / containers — set
RUNCOMFY_TOKEN=<token>instead ofruncomfy login.
Endpoints + input schema
Two variants, same endpoint shape, same prompt grammar.
blackforestlabs/flux-2-klein/9b/text-to-image
The fidelity-first variant. Use for polish / final output.
| Field | Type | Required | Default | Notes |
|---|---|---|---|---|
prompt |
string | yes | — | Up to ~512 tokens. Longer degrades. |
steps |
int | no | 25 | 4–50. Step-distilled architecture — 4–8 enough for concepting; ~25 for polish; >25 buys little. |
width |
int | no | 1024 | 512–1536 typical. Aspect ratio capped at 16:9, max ~2K total. |
height |
int | no | 1024 | Match width's aspect intent. |
blackforestlabs/flux-2-klein/4b/text-to-image
The latency-first variant. Sub-second 4-step inference. Use for live iteration / concepting.
Same field set as 9B. Default steps is effectively 4 — the variant is built for that step count.
Reference images (both variants)
Up to 4 simultaneous reference images are supported on the same endpoint for style transfer / guided composition. The exact field name in the JSON body is documented on the model's API tab — pass it through the CLI verbatim. Reference-image use enables editing-style workflows without a separate /edit endpoint.
How to invoke
Fast concepting (4B, sub-second):
runcomfy run blackforestlabs/flux-2-klein/4b/text-to-image \
--input '{"prompt": "<user prompt>"}' \
--output-dir <absolute/path>
Polish / final (9B, ~25 steps):
runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image \
--input '{
"prompt": "<user prompt>",
"steps": 25,
"width": 1024,
"height": 1024
}' \
--output-dir <absolute/path>
Wide-format poster:
runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image \
--input '{"prompt": "<user prompt>", "width": 1536, "height": 864}' \
--output-dir <absolute/path>
The CLI submits, polls every 2s until terminal, then downloads any *.runcomfy.net / *.runcomfy.com URL from the result into --output-dir. Stdout is the result JSON. Stderr is progress.
For pipe-friendly usage:
runcomfy --output json run blackforestlabs/flux-2-klein/4b/text-to-image \
--input '{"prompt":"..."}' --no-wait | jq -r .request_id
Prompting — what actually works
These are model-specific patterns that empirically improve output quality.
Subject-first declarative grammar. The structure Flux 2 Klein was trained on is "Subject + action + scene + style + lighting + camera + quality". Front-load the subject; trail with directives. Example: "A vibrant hummingbird mid-flight sipping nectar from a bright pink hibiscus, iridescent feathers in morning sun, soft bokeh tropical garden, macro photography, razor-sharp detail, cinematic lighting".
Specificity wins over flowery language. "4k product photo, softbox lighting, reflective table, 35mm, f/2.8" guides predictably. "A really pretty product image" doesn't.
Step-count by phase.
- Concepting: 4–8 steps on the 4B variant — sub-second feedback for live exploration.
- Refinement: 8–15 steps still on 4B, locking in subject + framing.
- Polish: ~25 steps on the 9B variant — texture, microdetail, fine typography.
Multi-reference alignment. When passing reference images, keep their aesthetics aligned. Mixing a watercolor + a photoreal + a 3D render in the same call confuses the editor. Pick one consistent visual register across all refs.
Conditional edits: state what stays, then what changes. "Same composition and lighting as reference, but change the background from beach to mountain studio." This pattern holds composition stable.
For text rendering (Klein has the 8B Qwen3 embedder, decent but not GPT Image 2 territory): add "crisp typography, high-contrast label" and bump steps to ~25 if the text comes out soft. For heavy in-image text or multilingual rendering, route to GPT Image 2 instead.
Anti-patterns:
- Don't conflict adjectives. "minimalist + ornate" cancels.
- Don't exceed ~512 tokens. The model degrades, doesn't truncate gracefully.
- Don't ask for 4K — the model's resolution ceiling is ~2K.
- Don't ask for ultra-wide (>16:9) — the model crops.
Where it shines
| Use case | Why Flux 2 Klein |
|---|---|
| Live art-direction sessions | Sub-second feedback (4B) enables real-time iteration |
| Interactive product visualization | Fast UI previews and product comps without batch waits |
| Multi-reference brand styling | Strong style consistency across references for unified asset packs |
| Rapid concepting → polish workflow | 4B for exploration, 9B for the final pass — same prompt grammar throughout |
| Consumer-GPU-friendly inference | 4B variant runs on modest hardware; relevant for self-host comparisons but RunComfy-hosted is fine |
Sample prompts (verified to produce strong results)
From the model page (BFL example):
A vibrant hummingbird mid-flight sipping nectar from a bright pink hibiscus
flower, iridescent emerald and sapphire feathers catching the morning sun,
soft bokeh tropical garden background, macro photography, razor-sharp
detail, cinematic lighting
Product-photo pattern:
A matte ceramic mug on a reclaimed-wood table, soft northern window light
from the left, shallow depth of field, 50mm prime, f/2.0, neutral
background, e-commerce ready, 4K product photography
Brand-consistent pair (multi-ref):
Same composition and lighting as the reference image, but the bottle
label is now blue with white sans-serif typography reading "AURA";
keep the bottle silhouette, table, and shadow exactly as in the reference
Limitations
- Resolution ceiling ~2K — for higher native res, route to Seedream 5.
- Aspect ratio cap 16:9 — extreme wide/tall ratios get cropped.
- Prompt cap ~512 tokens — longer degrades quality; doesn't truncate gracefully.
- Reference image cap 4 — more than 4 increases latency and dilutes guidance.
- Text rendering — the 8B Qwen3 embedder helps but GPT Image 2 still wins for embedded text precision.
Exit codes
The runcomfy CLI uses sysexits-style codes:
| code | meaning |
|---|---|
| 0 | success |
| 64 | bad CLI args |
| 65 | bad input JSON / schema mismatch (e.g. width: 4096 would 422) |
| 69 | upstream 5xx |
| 75 | retryable: timeout / 429 |
| 77 | not signed in or token rejected |
Full reference: docs.runcomfy.com/cli/troubleshooting.
How it works
- The skill invokes
runcomfy run blackforestlabs/flux-2-klein/<variant>/text-to-imagewith a JSON body matching the schema. - The CLI POSTs to
https://model-api.runcomfy.net/v1/models/blackforestlabs/flux-2-klein/<variant>/text-to-imagewith the user's bearer token. - The Model API returns a
request_id; the CLI pollsGET .../requests/<id>/statusevery 2 seconds. - On terminal status, the CLI fetches
GET .../requests/<id>/resultand downloads any URL whose host ends with.runcomfy.netor.runcomfy.cominto--output-dir. Other URLs are listed but not fetched. Ctrl-Cwhile polling sendsPOST .../requests/<id>/cancelso you don't get billed for GPU you stopped.
What this skill is not
Not a self-hosted Flux runner. Not a capability grant — depends on a working RunComfy account. Not multi-tenant.
Security & Privacy
- Token storage:
runcomfy loginwrites the API token to~/.config/runcomfy/token.jsonwith mode 0600 (owner-only read/write). SetRUNCOMFY_TOKENenv var to bypass the file entirely in CI / containers. - Input boundary: the user prompt is passed as a JSON string to the CLI via
--input. The CLI does NOT shell-expand the prompt; it transmits the JSON body directly to the Model API over HTTPS. No shell injection surface from prompt content. - Third-party content: image / mask / video URLs you pass are fetched by the RunComfy model server, not by the CLI on your machine. Treat external URLs as untrusted; image-based prompt injection is a known risk for any image-edit / video-edit model.
- Outbound endpoints: only
model-api.runcomfy.net(request submission) and*.runcomfy.net/*.runcomfy.com(download whitelist for generated outputs). No telemetry, no callbacks. - Generated-file size cap: the CLI aborts any single download > 2 GiB to prevent disk-fill from a malicious or runaway model output.