deploy-model
Unified Azure OpenAI model deployment skill with intelligent intent-based routing. Handles quick preset deployments, fully customized deployments (version/SKU/capacity/RAI policy), and capacity discovery across regions and projects. USE FOR: deploy model, deploy gpt, create deployment, model deployment, deploy openai model, set up model, provision model, find capacity, check model availability, where can I deploy, best region for model, capacity analysis. DO NOT USE FOR: listing existing deployments (use foundry_models_deployments_list MCP tool), deleting deployments, agent creation (use agent/create), project creation (use project/create).
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o deploy-model.zip https://jpskill.com/download/19681.zip && unzip -o deploy-model.zip && rm deploy-model.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/19681.zip -OutFile "$d\deploy-model.zip"; Expand-Archive "$d\deploy-model.zip" -DestinationPath $d -Force; ri "$d\deploy-model.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
deploy-model.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
deploy-modelフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 3
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[スキル名] deploy-model
モデルのデプロイ
すべての Azure OpenAI モデルデプロイワークフローの統合されたエントリーポイントです。ユーザーの意図を分析し、適切なデプロイモードにルーティングします。
クイックリファレンス
| モード | 使用する状況 | サブスキル |
|---|---|---|
| プリセット | 迅速なデプロイ、カスタマイズ不要 | preset/SKILL.md |
| カスタマイズ | 完全な制御: バージョン、SKU、容量、RAIポリシー | customize/SKILL.md |
| 容量検出 | 特定の容量でデプロイできる場所を見つける | capacity/SKILL.md |
意図検出
ユーザーのプロンプトを分析し、正しいモードにルーティングします。
User Prompt
│
├─ Simple deployment (no modifiers)
│ "deploy gpt-4o", "set up a model"
│ └─> PRESET mode
│
├─ Customization keywords present
│ "custom settings", "choose version", "select SKU",
│ "set capacity to X", "configure content filter",
│ "PTU deployment", "with specific quota"
│ └─> CUSTOMIZE mode
│
├─ Capacity/availability query
│ "find where I can deploy", "check capacity",
│ "which region has X capacity", "best region for 10K TPM",
│ "where is this model available"
│ └─> CAPACITY DISCOVERY mode
│
└─ Ambiguous (has capacity target + deploy intent)
"deploy gpt-4o with 10K capacity to best region"
└─> CAPACITY DISCOVERY first → then PRESET or CUSTOMIZE
ルーティングルール
| プロンプト内のシグナル | ルーティング先 | 理由 |
|---|---|---|
| モデル名のみ、オプションなし | プリセット | ユーザーは迅速なデプロイを希望しています |
| "custom", "configure", "choose", "select" | カスタマイズ | ユーザーは制御を希望しています |
| "find", "check", "where", "which region", "available" | 容量 | ユーザーは検出を希望しています |
| 特定の容量数値 + "best region" | 容量 → プリセット | 検出してから迅速にデプロイします |
| 特定の容量数値 + "custom" キーワード | 容量 → カスタマイズ | 検出してからオプション付きでデプロイします |
| "PTU", "provisioned throughput" | カスタマイズ | PTUにはSKU選択が必要です |
| "optimal region", "best region" (容量ターゲットなし) | プリセット | リージョン最適化はプリセットの専門分野です |
マルチモードの連結
一部のプロンプトでは、2つのモードを連続して実行する必要があります。
パターン: 容量 → デプロイ ユーザーが容量要件を指定し、かつデプロイを希望する場合:
- 容量検出を実行して、十分なクォータを持つリージョン/プロジェクトを見つけます。
- ユーザーに結果を提示します。
- 「クイックデフォルトでデプロイしますか、それとも設定をカスタマイズしますか?」と尋ねます。
- 回答に基づいてプリセットまたはカスタマイズにルーティングします。
💡 ヒント: ユーザーがどのモードを希望しているか不明な場合は、プリセット(迅速なデプロイ)をデフォルトとしてください。カスタマイズを希望するユーザーは、通常、「custom」、「configure」、または「with specific settings」のような明示的なキーワードを使用します。
プロジェクト選択 (すべてのモード)
デプロイの前に、どのプロジェクトにデプロイするかを解決します。これはすべてのモード(プリセット、カスタマイズ、容量検出後)に適用されます。
解決順序
PROJECT_RESOURCE_ID環境変数をチェック — 設定されている場合、それをデフォルトとして使用します。- ユーザープロンプトをチェック — ユーザーが特定のプロジェクトまたはリージョンを指定した場合、それを使用します。
- どちらでもない場合 — ユーザーのプロジェクトをクエリし、現在のプロジェクトを提案します。
確認ステップ (必須)
デプロイする前に、常にターゲットを確認してください。 ユーザーに何が使用されるかを示し、変更する機会を与えてください。
Deploying to:
Project: <project-name>
Region: <region>
Resource: <resource-group>
Is this correct? Or choose a different project:
1. ✅ Yes, deploy here (default)
2. 📋 Show me other projects in this region
3. 🌍 Choose a different region
ユーザーがオプション2を選択した場合、そのリージョン内の上位5つのプロジェクトを表示します。
Projects in <region>:
1. project-alpha (rg-alpha)
2. project-beta (rg-beta)
3. project-gamma (rg-gamma)
...
⚠️ ユーザーにどのプロジェクトが使用されるかを示さずにデプロイしないでください。 これにより、誤ったリソースへの意図しないデプロイを防ぎます。
デプロイ前検証 (すべてのモード)
デプロイオプション(SKU、容量)を提示する前に、常に以下の両方を検証してください。
-
モデルがSKUをサポートしているか — モデルカタログをクエリして、選択されたモデル+バージョンがターゲットSKUをサポートしていることを確認します。
az cognitiveservices model list --location <region> --subscription <sub-id> -o jsonモデルでフィルタリングし、
.model.skus[].nameを抽出してサポートされているSKUを取得します。 -
サブスクリプションに利用可能なクォータがあるか — ユーザーのサブスクリプションに、SKU+モデルの組み合わせに対して未割り当てのクォータがあることを確認します。
az cognitiveservices usage list --location <region> --subscription <sub-id> -o json使用状況名パターン
OpenAI.<SKU>.<model-name>(例:OpenAI.GlobalStandard.gpt-4o) で一致させます。available = limit - currentValueを計算します。
⚠️ 警告: 両方のチェックを通過したオプションのみを提示してください。ハードコードされたSKUリストを表示しないでください — 常に動的にクエリしてください。利用可能なクォータが0のSKUは、選択可能なオプションではなく、❌ 情報項目として表示されるべきです。
💡 クォータ管理: クォータ増加リクエスト、使用状況の監視、クォータエラーのトラブルシューティングについては、そのガイダンスをインラインで重複させるのではなく、クォータスキルに委ねてください。
前提条件
すべてのデプロイモードには以下が必要です。
- Azure CLIがインストールされ、認証されていること (
az login) - デプロイ権限を持つアクティブなAzureサブスクリプション
- Azure AI FoundryプロジェクトリソースID (またはエージェントが
PROJECT_RESOURCE_ID環境変数経由で検出を支援します)
サブスキル
- preset/SKILL.md — 最適なリージョンへの迅速なデプロイと適切なデフォルト設定
- customize/SKILL.md — 完全な構成制御を備えた対話型ガイド付きフロー
- capacity/SKILL.md — リージョンおよびプロジェクト全体で利用可能な容量を検出します
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Deploy Model
Unified entry point for all Azure OpenAI model deployment workflows. Analyzes user intent and routes to the appropriate deployment mode.
Quick Reference
| Mode | When to Use | Sub-Skill |
|---|---|---|
| Preset | Quick deployment, no customization needed | preset/SKILL.md |
| Customize | Full control: version, SKU, capacity, RAI policy | customize/SKILL.md |
| Capacity Discovery | Find where you can deploy with specific capacity | capacity/SKILL.md |
Intent Detection
Analyze the user's prompt and route to the correct mode:
User Prompt
│
├─ Simple deployment (no modifiers)
│ "deploy gpt-4o", "set up a model"
│ └─> PRESET mode
│
├─ Customization keywords present
│ "custom settings", "choose version", "select SKU",
│ "set capacity to X", "configure content filter",
│ "PTU deployment", "with specific quota"
│ └─> CUSTOMIZE mode
│
├─ Capacity/availability query
│ "find where I can deploy", "check capacity",
│ "which region has X capacity", "best region for 10K TPM",
│ "where is this model available"
│ └─> CAPACITY DISCOVERY mode
│
└─ Ambiguous (has capacity target + deploy intent)
"deploy gpt-4o with 10K capacity to best region"
└─> CAPACITY DISCOVERY first → then PRESET or CUSTOMIZE
Routing Rules
| Signal in Prompt | Route To | Reason |
|---|---|---|
| Just model name, no options | Preset | User wants quick deployment |
| "custom", "configure", "choose", "select" | Customize | User wants control |
| "find", "check", "where", "which region", "available" | Capacity | User wants discovery |
| Specific capacity number + "best region" | Capacity → Preset | Discover then deploy quickly |
| Specific capacity number + "custom" keywords | Capacity → Customize | Discover then deploy with options |
| "PTU", "provisioned throughput" | Customize | PTU requires SKU selection |
| "optimal region", "best region" (no capacity target) | Preset | Region optimization is preset's specialty |
Multi-Mode Chaining
Some prompts require two modes in sequence:
Pattern: Capacity → Deploy When a user specifies a capacity requirement AND wants deployment:
- Run Capacity Discovery to find regions/projects with sufficient quota
- Present findings to user
- Ask: "Would you like to deploy with quick defaults or customize settings?"
- Route to Preset or Customize based on answer
💡 Tip: If unsure which mode the user wants, default to Preset (quick deployment). Users who want customization will typically use explicit keywords like "custom", "configure", or "with specific settings".
Project Selection (All Modes)
Before any deployment, resolve which project to deploy to. This applies to all modes (preset, customize, and after capacity discovery).
Resolution Order
- Check
PROJECT_RESOURCE_IDenv var — if set, use it as the default - Check user prompt — if user named a specific project or region, use that
- If neither — query the user's projects and suggest the current one
Confirmation Step (Required)
Always confirm the target before deploying. Show the user what will be used and give them a chance to change it:
Deploying to:
Project: <project-name>
Region: <region>
Resource: <resource-group>
Is this correct? Or choose a different project:
1. ✅ Yes, deploy here (default)
2. 📋 Show me other projects in this region
3. 🌍 Choose a different region
If user picks option 2, show top 5 projects in that region:
Projects in <region>:
1. project-alpha (rg-alpha)
2. project-beta (rg-beta)
3. project-gamma (rg-gamma)
...
⚠️ Never deploy without showing the user which project will be used. This prevents accidental deployments to the wrong resource.
Pre-Deployment Validation (All Modes)
Before presenting any deployment options (SKU, capacity), always validate both of these:
-
Model supports the SKU — query the model catalog to confirm the selected model+version supports the target SKU:
az cognitiveservices model list --location <region> --subscription <sub-id> -o jsonFilter for the model, extract
.model.skus[].nameto get supported SKUs. -
Subscription has available quota — check that the user's subscription has unallocated quota for the SKU+model combination:
az cognitiveservices usage list --location <region> --subscription <sub-id> -o jsonMatch by usage name pattern
OpenAI.<SKU>.<model-name>(e.g.,OpenAI.GlobalStandard.gpt-4o). Computeavailable = limit - currentValue.
⚠️ Warning: Only present options that pass both checks. Do NOT show hardcoded SKU lists — always query dynamically. SKUs with 0 available quota should be shown as ❌ informational items, not selectable options.
💡 Quota management: For quota increase requests, usage monitoring, and troubleshooting quota errors, defer to the quota skill instead of duplicating that guidance inline.
Prerequisites
All deployment modes require:
- Azure CLI installed and authenticated (
az login) - Active Azure subscription with deployment permissions
- Azure AI Foundry project resource ID (or agent will help discover it via
PROJECT_RESOURCE_IDenv var)
Sub-Skills
- preset/SKILL.md — Quick deployment to optimal region with sensible defaults
- customize/SKILL.md — Interactive guided flow with full configuration control
- capacity/SKILL.md — Discover available capacity across regions and projects
同梱ファイル
※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。
- 📄 SKILL.md (6,611 bytes)
- 📎 scripts/generate_deployment_url.ps1 (2,368 bytes)
- 📎 scripts/generate_deployment_url.sh (2,684 bytes)