capacity-planner
性能テストの結果から、目標とするアクセス数に対応するために必要なサーバーやデータベースなどのインフラ規模を見積もり、コストも考慮した最適な拡張計画を提案するSkill。
📜 元の英語説明(参考)
Translates performance test results into infrastructure scaling recommendations with cost estimates. Use when someone has load test data and needs to know what infrastructure changes are required to handle target traffic. Trigger words: capacity planning, scaling plan, infrastructure sizing, how many pods, RDS sizing, handle more traffic, scale for launch.
🇯🇵 日本人クリエイター向け解説
性能テストの結果から、目標とするアクセス数に対応するために必要なサーバーやデータベースなどのインフラ規模を見積もり、コストも考慮した最適な拡張計画を提案するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o capacity-planner.zip https://jpskill.com/download/14720.zip && unzip -o capacity-planner.zip && rm capacity-planner.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/14720.zip -OutFile "$d\capacity-planner.zip"; Expand-Archive "$d\capacity-planner.zip" -DestinationPath $d -Force; ri "$d\capacity-planner.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
capacity-planner.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
capacity-plannerフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
キャパシティプランナー
概要
このスキルは、パフォーマンステストの結果(ブレークポイント、レイテンシデータ、エラーパターン)を受け取り、実行可能なインフラストラクチャのスケーリング推奨事項を生成します。ボトルネックを特定し、特定のリソース変更を推奨し、コストを見積もり、検証基準を生成します。
手順
ステップ 1: 現在の状態の収集
以下を尋ねるか、判断します。
- 現在のインフラストラクチャの仕様(pod 数、インスタンスタイプ、DB サイズ、キャッシュ構成)
- 現在の持続可能な RPS とそのレベルでのレイテンシ
- 負荷テストからのブレークポイント(SLO が破られる RPS または VU 数)
- 目標トラフィック(RPS、同時ユーザー数、または「3 倍」のような乗数として表現)
ステップ 2: ボトルネックレイヤーの特定
負荷テストのエラーパターンから、主要なボトルネックを特定します。
| エラーパターン | 考えられるボトルネック |
|---|---|
| タイムアウトが徐々に増加 | アプリケーション pod の CPU 飽和 |
| 5xx エラーの突然のスパイク | データベース接続プールの枯渇 |
| 接続拒否エラー | pod/インスタンス制限に達した |
| 最初のバイトが遅く、転送が速い | データベースクエリのレイテンシ |
| メモリ関連のクラッシュ | アプリケーションのメモリリークまたはインスタンスのサイズ不足 |
| 断続的な 503 エラー | ロードバランサーのターゲット制限 |
ステップ 3: 必要なリソースの計算
線形スケーリングをベースラインとして使用し、次に補正係数を適用します。
必要な pods = current_pods × (target_RPS / current_max_RPS) × 1.3 安全係数
必要な DB connections = current_pool × (target_RPS / current_max_RPS) × 1.2
以下を調整します。
- データベースのスケーリングは線形ではありません(読み取りが多い場合はリードレプリカを追加し、書き込みが多い場合は垂直方向にスケールします)
- キャッシュヒット率はトラフィックが増えるほど向上します(ウォームキャッシュ)
- pod ごとの接続オーバーヘッド
ステップ 4: コストの見積もり
これらの AWS 参照価格を使用します(us-east-1、オンデマンド)。
| リソース | 仕様 | 月額費用 |
|---|---|---|
| EKS pod (500m/1Gi) | ~0.25 vCPU 相当 | ~$35/月 |
| RDS db.r5.large | 2 vCPU, 16 GiB | $274/月 |
| RDS db.r5.xlarge | 4 vCPU, 32 GiB | $548/月 |
| ElastiCache r6g.large | 2 vCPU, 13 GiB | $172/月 |
| RDS Read Replica | プライマリインスタンスと同じ | 同じコスト |
| ALB | ベース + LCU | ~$25-50/月 |
注: 実際のコストは、リージョン、リザーブドインスタンス、および Savings Plans によって異なります。
ステップ 5: スケーリング計画の作成
以下を含む実行可能な項目としてフォーマットします。
- 変更する内容(特定のリソース、構成パラメータ)
- 現在の値 → 目標値
- 理由(どのボトルネックに対処するか)
- コストへの影響
- 実装順序(変更間の依存関係)
- 検証基準(変更後に再テストするもの)
例
例 1: プレローンチスケーリング計画
ユーザープロンプト:
3 つの pods と RDS db.r5.large で 400 RPS でブレークします。ローンチのために 1200 RPS を処理する必要があります。
エージェント出力:
キャパシティプラン: 400 → 1,200 RPS
───────────────────────────────
ステップ 変更 コストデルタ 対処
1 DB pool_size: 20 → 80 $0 接続枯渇 (主要なボトルネック)
2 RDS: db.r5.large → db.r5.2xlarge +$822/月 書き込みスループット + 接続
3 RDS リードレプリカの追加 +$1,096/月 読み取りクエリのオフロード
4 API pods: 3 → 10 (HPA min=7) +$245/月 リクエスト処理能力
5 Redis: r6g.medium → r6g.xlarge +$258/月 セッション/キャッシュスループット
合計追加コスト: $2,421/月
実装順序: 1 → 2 → 3 → 4 → 5 (各ステップが次のステップをアンブロックします)
検証: 各ステップの後に負荷テストを再実行します。予想されるマイルストーン:
ステップ 1-2 後: ブレークポイントが ~700 RPS に移動
ステップ 3 後: ブレークポイントが ~1,000 RPS に移動
ステップ 4-5 後: 目標 1,200 RPS で p95 < 500ms
例 2: コスト最適化されたスケーリング
ユーザープロンプト:
2 倍のトラフィックを処理する必要がありますが、リーダーシップはコストの増加を最小限に抑えたいと考えています。
エージェント出力:
コスト最適化されたスケーリング計画 (2 倍のトラフィック)
────────────────────────────────────────
無料の勝利 (構成のみ)
1. DB 接続プールの増加: 20 → 40 +0$/月 影響: +30% スループット
2. API レスポンスで gzip 圧縮を有効にする +0$/月 影響: -40% 帯域幅
3. GET /api/products の Redis キャッシュの追加 (TTL 60s) +0$/月 影響: -50% DB 読み取り
低コスト
4. 2 つの API pods の追加 (3 → 5) +$70/月
5. RDS クエリキャッシュの有効化 +$0/月
予想される結果: +$70/月 で 1.8-2.2 倍のキャパシティ
トレードオフ: 完全なスケーリングよりもヘッドルームが少なくなります。トラフィックが 2.2 倍を超えると、レイテンシが低下します。
ガイドライン
- ボトルネックを最初に — 水平方向のキャパシティを追加する前に、常にボトルネックを特定して修正します。データベースが制限である場合、より多くの pods は役に立ちません
- 実装順序が重要 — スケーリングの変更には依存関係があることがよくあります。それらを正しい順序で提示します
- 検証基準を含める — すべての変更には、「それが機能したことを確認する方法」テストが必要です
- コストの透明性 — 常に項目ごとのコスト変更と合計月額影響を示します
- 安全マージン — 予期しないスパイクのために、目標よりも 30% のヘッドルームを推奨します
- 読み取りと書き込みのスケーリングを区別する — 読み取りはレプリカ/キャッシュでスケールします。書き込みには、垂直方向のスケーリングまたはシャーディングが必要です
- 最初に無料の勝利を検討する — 構成の変更(プールサイズ、キャッシュ、圧縮)は、多くの場合、コストをかけずに大きなメリットをもたらします
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Capacity Planner
Overview
This skill takes performance test results (breaking points, latency data, error patterns) and produces actionable infrastructure scaling recommendations. It identifies bottlenecks, recommends specific resource changes, estimates costs, and generates verification criteria.
Instructions
Step 1: Gather Current State
Ask or determine:
- Current infrastructure specs (pod count, instance types, DB size, cache config)
- Current sustainable RPS and latency at that level
- Breaking point from load tests (RPS or VU count where SLOs break)
- Target traffic (expressed as RPS, concurrent users, or multiplier like "3x")
Step 2: Identify Bottleneck Layer
From load test error patterns, determine the primary bottleneck:
| Error Pattern | Likely Bottleneck |
|---|---|
| Timeouts increasing gradually | CPU saturation on application pods |
| Sudden spike in 5xx errors | Database connection pool exhaustion |
| Connection refused errors | Pod/instance limit reached |
| Slow first byte, fast transfer | Database query latency |
| Memory-related crashes | Application memory leak or undersized instances |
| Intermittent 503s | Load balancer target limits |
Step 3: Calculate Required Resources
Use linear scaling as baseline, then apply correction factors:
Required pods = current_pods × (target_RPS / current_max_RPS) × 1.3 safety factor
Required DB connections = current_pool × (target_RPS / current_max_RPS) × 1.2
Adjust for:
- Database scaling is NOT linear (add read replicas for read-heavy, scale vertically for write-heavy)
- Cache hit rates improve with more traffic (warm cache)
- Connection overhead per pod
Step 4: Estimate Costs
Use these AWS reference prices (us-east-1, on-demand):
| Resource | Spec | Monthly Cost |
|---|---|---|
| EKS pod (500m/1Gi) | ~0.25 vCPU equiv | ~$35/mo |
| RDS db.r5.large | 2 vCPU, 16 GiB | $274/mo |
| RDS db.r5.xlarge | 4 vCPU, 32 GiB | $548/mo |
| ElastiCache r6g.large | 2 vCPU, 13 GiB | $172/mo |
| RDS Read Replica | Same as primary instance | Same cost |
| ALB | Base + LCU | ~$25-50/mo |
Note: actual costs vary by region, reserved instances, and savings plans.
Step 5: Produce Scaling Plan
Format as actionable items with:
- What to change (specific resource, config parameter)
- Current value → target value
- Why (which bottleneck it addresses)
- Cost impact
- Implementation order (dependencies between changes)
- Verification criteria (what to re-test after)
Examples
Example 1: Pre-Launch Scaling Plan
User prompt:
We break at 400 RPS with 3 pods and RDS db.r5.large. Need to handle 1200 RPS for launch.
Agent output:
Capacity Plan: 400 → 1,200 RPS
───────────────────────────────
Step Change Cost Delta Addresses
1 DB pool_size: 20 → 80 $0 Connection exhaustion (primary bottleneck)
2 RDS: db.r5.large → db.r5.2xlarge +$822/mo Write throughput + connections
3 Add RDS read replica +$1,096/mo Read query offloading
4 API pods: 3 → 10 (HPA min=7) +$245/mo Request processing capacity
5 Redis: r6g.medium → r6g.xlarge +$258/mo Session/cache throughput
Total additional cost: $2,421/month
Implementation order: 1 → 2 → 3 → 4 → 5 (each step unblocks the next)
Verification: Re-run load test after each step. Expected milestones:
After step 1-2: Breaking point moves to ~700 RPS
After step 3: Breaking point moves to ~1,000 RPS
After step 4-5: Target 1,200 RPS with p95 < 500ms
Example 2: Cost-Optimized Scaling
User prompt:
We need to handle 2x traffic but leadership wants minimal cost increase.
Agent output:
Cost-Optimized Scaling Plan (2x traffic)
────────────────────────────────────────
FREE WINS (configuration only)
1. Increase DB connection pool: 20 → 40 +0$/mo Impact: +30% throughput
2. Enable gzip compression on API responses +0$/mo Impact: -40% bandwidth
3. Add Redis caching for GET /api/products (TTL 60s) +0$/mo Impact: -50% DB reads
LOW COST
4. Add 2 API pods (3 → 5) +$70/mo
5. Enable RDS query cache +$0/mo
Expected result: 1.8-2.2x capacity at +$70/month
Tradeoff: Less headroom than full scaling. If traffic exceeds 2.2x, latency degrades.
Guidelines
- Bottleneck first — always identify and fix the bottleneck before adding horizontal capacity; more pods don't help if the database is the limit
- Implementation order matters — scaling changes often have dependencies; present them in the right sequence
- Include verification criteria — every change should have a "how to confirm it worked" test
- Cost transparency — always show per-item cost changes and total monthly impact
- Safety margins — recommend 30% headroom over target for unexpected spikes
- Distinguish read vs write scaling — reads scale with replicas/cache; writes require vertical scaling or sharding
- Consider the free wins first — configuration changes (pool sizes, caching, compression) often provide significant gains at zero cost