caio-review
/cs:caio-review <plan> — Eval-demanding Chief AI Officer interrogation of any plan that involves AI: model selection, risk classification, cost economics, or AI hiring.
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o caio-review.zip https://jpskill.com/download/21687.zip && unzip -o caio-review.zip && rm caio-review.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/21687.zip -OutFile "$d\caio-review.zip"; Expand-Archive "$d\caio-review.zip" -DestinationPath $d -Force; ri "$d\caio-review.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
caio-review.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
caio-reviewフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
/cs:caio-review — CAIO 強制質問
コマンド: /cs:caio-review <plan>
評価を要求するCAIOは、AIが関わるあらゆる計画を厳しく検証します。AI機能の出荷、複数年にわたるベンダー契約、AIチームの拡大の前に、6つの質問を投げかけます。
実行時期
- 新しいAI搭載機能をリリースする前
- 複数年にわたるAIベンダー契約(APIまたは自己ホスト型インフラ)に署名する前
- AI機能のEUでのローンチ前
- 主要なAIチームの採用(特にMLエンジニアまたはリサーチサイエンティスト)の前
- ファインチューニングプロジェクトのコミットメント前
- 規制対象ドメイン(雇用、信用、ヘルスケア、教育など)でAIを導入する前
- 創業者が「AI」という言葉を「競争優位性」や「堀」の近くで使うとき
6つのCAIO質問
1. このAIは何が得意である必要があり、どのように測定しますか?
評価セットなし = 出荷なし。 AI機能をデプロイする前に、評価基準を定義してください。
- 最低50〜100の代表的な入力
- 期待される出力、または採点のためのルーブリック
- エッジケース:曖昧なもの、敵対的なもの、フォーマットのエッジケース
- 「良い」ものがどのようなものか書き出せない場合、それは機能ではなく、単なる雰囲気です。
2. ハルシネーション/エラー率に関するSLOは何ですか、そしてフォールバックは何ですか?
すべてのAI機能には失敗モードがあります。それに備えて計画を立ててください。
- 定量化されたSLO:「事実に関するクエリでのハルシネーションが5%未満」
- 検出メカニズム:モニタリング、サンプリング、顧客フィードバックループ
- フォールバック:ヒューマン・イン・ザ・ループによるレビュー、リスクの低いデフォルト応答、回答拒否
- SLO違反時の影響範囲:何人のユーザーが影響を受け、コストはいくらですか?
3. EU AI Actに基づくリスクティアは何ですか、そして適合性評価は必要ですか?
EU居住者が影響を受ける場合、またはドメインが規制されている場合は、ai_risk_classifier.pyを実行してください。
- PROHIBITED → EUでローンチできません。再スコープしてください。
- HIGH → 適合性評価 + EU DB登録 + 10条の義務(3〜12ヶ月、$50〜200K)
- LIMITED → 透明性義務(チャットボットの開示、AI生成コンテンツのマーキング)
- MINIMAL → 特定の義務なし。NIST AI RMFは任意。
4. API、ファインチューニング、それとも構築?
特定のユースケースについてmodel_buildvsbuy_calculator.pyを実行してください。
- B2B SaaSユースケースの80%:API
- 15%:ファインチューニング(ドメイン固有の動作 + ラベル付きデータ + MLチーム + 大量の場合)
- 1%未満:ゼロから構築
- 決定は、経済的な損益分岐点と実用的な実現可能性(データ、チーム、コンプライアンス)を考慮する必要があります。
5. 予想される規模での12ヶ月間のコスト推移はどうなりますか?
ワークロードについてai_cost_economics.pyを実行してください。
- API:変動費、線形にスケール
- 自己ホスト型:ほとんどが固定費、70Bクラスの場合、通常1〜10Bトークン/月で損益分岐点
- 自己ホスト型の隠れたコスト:運用、モニタリング、モデル更新、キャパシティ、フェイルオーバー、セキュリティ
- APIの隠れたコスト:ベンダーロックイン、機能のずれ、レート制限、データレジデンシー
- プロンプトキャッシュは最も過小評価されているレバーです。プロバイダーのサポートを確認してください。
6. どの役割がこれをアンブロックしますか — そして前提となる人材はすでに採用されていますか?
AIの能力を特定の役割にマッピングしてください。創業者はAIエンジニア/MLエンジニア/リサーチサイエンティストを混同しがちです。
- AIエンジニア:応用 + フルスタック + プロンプト + 評価 + デプロイメント(ほとんどのスタートアップが必要とする)
- MLエンジニア:ファインチューニング + 再トレーニングインフラ(プラットフォームエンジニア + ラベル付きデータの後のみ)
- リサーチサイエンティスト:モデルの発明(モデルが製品である場合のみ)
- 最初のAI採用としてリサーチサイエンティストを雇わないでください — 彼らは生産的であるためにインフラを必要とします。
ワークフロー
# 1. モデル選択チェック
python ../../../skills/chief-ai-officer-advisor/scripts/model_buildvsbuy_calculator.py use_case.json
# 2. 規制分類
python ../../../skills/chief-ai-officer-advisor/scripts/ai_risk_classifier.py use_case.json
# 3. コスト予測
python ../../../skills/chief-ai-officer-advisor/scripts/ai_cost_economics.py workload.json
出力フォーマット
# CAIO レビュー: <plan>
**日付:** YYYY-MM-DD
## 行われている決定
[1文 — どのCAIO決定か: モデル選択 | リスク分類 | 経済性 | 次の採用]
## 評価規律
- 評価セットコミット済み: yes/no
- SLO定義済み: <metric> < <threshold>
- フォールバック動作: <1行>
## モデル選択 (該当する場合)
- 推奨: API / FINE_TUNE / BUILD
- 3年間のTCO: $X (選択されたパス) vs $Y (代替案)
- 損益分岐点: <volume>
## リスク分類 (該当する場合)
- EU AI Actティア: PROHIBITED / HIGH / LIMITED / MINIMAL
- 適合性評価が必要: yes/no
- 米国州のトリガー: [リスト]
- 必要なコントロールの未完了数: N
## コスト経済性 (該当する場合)
- 現在のボリュームでの月間コスト: $X
- 自己ホスト型への移行の損益分岐点: <volume>
- 移行コスト (該当する場合): $X (3-6ヶ月)
## 組織 (該当する場合)
- 次の採用: <role>
- なぜこれであり、代替案ではないのか: <1行>
- 前提となる採用は完了しているか: yes/no
## 評決
🟢 SHIP | 🟡 SHARPEN | 🔴 BLOCK
## 次のステップ
[3つの具体的なアクション]
ルーティング
/cs:cdo-review— トレーニングデータに関するあらゆる影響について/cs:gc-review— AIベンダー契約、出力責任、トレーニングデータライセンスについて/cs:ciso-review— プロンプトインジェクション/ジェイルブレイク/トレーニングデータポイズニングの脅威モデルについて/cs:cfo-review— 複数年にわたるベンダーまたはGPUコミットメントのTCOについて/cs:chro-review— AIチームの採用(報酬、ラダー、レベリング)について/cs:decide— 評決を記録する/cs:freeze 60— 複数年にわたるAIコミットメントについて
関連
- エージェント:
cs-caio-advisor - スキル:
chief-ai-officer-advisor - 隣接:
../../../skills/chief-data-officer-advisor/(トレーニングデータ権限、データ戦略)
バージョン: 1.0.0
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
/cs:caio-review — CAIO Forcing Questions
Command: /cs:caio-review <plan>
The eval-demanding CAIO pressure-tests any plan that involves AI. Six questions before any AI feature ships, any multi-year vendor commitment, or any AI team expansion.
When to Run
- Before shipping any new AI-powered feature
- Before signing a multi-year AI vendor contract (API or self-hosted infra)
- Before EU launch of any AI feature
- Before a major AI team hire (especially ML engineer or research scientist)
- Before a fine-tuning project commitment
- Before adopting AI in a regulated domain (employment, credit, healthcare, education, etc.)
- When the founder uses the word "AI" near "competitive advantage" or "moat"
The Six CAIO Questions
1. What does this AI need to be good at, and how would you measure it?
No eval set = no ship. Before any AI feature deploys, define the eval criteria.
- 50-100 representative inputs minimum
- Expected outputs OR rubric for grading
- Edge cases: ambiguous, adversarial, format-edge
- If you can't write down what "good" looks like, you don't have a feature; you have a vibe.
2. What's the SLO on hallucination / error rate, and what's the fallback?
Every AI feature has a failure mode. Plan for it.
- Quantified SLO: "<5% hallucination on factual queries"
- Detection mechanism: monitoring, sampling, customer feedback loop
- Fallback: human-in-loop review, lower-risk default response, refuse-to-answer
- Blast radius if SLO breached: how many users affected, what is the cost?
3. What's the risk tier under EU AI Act, and is conformity assessment required?
Run ai_risk_classifier.py if any EU residents are affected OR domain is regulated.
- PROHIBITED → cannot launch in EU; re-scope
- HIGH → conformity assessment + EU DB registration + 10 Articles of obligations (3-12 months, $50-200K)
- LIMITED → transparency obligations (chatbot disclosure, AI-generated content marking)
- MINIMAL → no specific obligations; NIST AI RMF voluntary
4. API, fine-tune, or build?
Run model_buildvsbuy_calculator.py for the specific use case.
- 80% of B2B SaaS use cases: API
- 15%: fine-tune (when domain-specific behavior + labeled data + ML team + high volume)
- <1%: build from scratch
- Decision must consider economic breakeven AND practical feasibility (data, team, compliance)
5. What's the 12-month cost trajectory at expected scale?
Run ai_cost_economics.py for the workload.
- API: variable, scales linearly
- Self-hosted: mostly fixed, breakeven typically 1-10B tokens/month for 70B-class
- Hidden costs of self-hosted: ops, monitoring, model updates, capacity, failover, security
- Hidden costs of API: vendor lock-in, capability drift, rate limits, data residency
- Prompt caching is the most underrated lever; check provider support
6. What role unblocks this — and have we hired prerequisites first?
Map AI capability to specific role. Founders confuse AI engineer / ML engineer / research scientist.
- AI engineer: applied + full-stack + prompts + evals + deployment (most startups need this)
- ML engineer: fine-tuning + retraining infra (only after platform engineer + labeled data)
- Research scientist: model invention (only if model IS the product)
- Don't hire research scientist as first AI hire — they need infrastructure to be productive
Workflow
# 1. Model selection check
python ../../../skills/chief-ai-officer-advisor/scripts/model_buildvsbuy_calculator.py use_case.json
# 2. Regulatory classification
python ../../../skills/chief-ai-officer-advisor/scripts/ai_risk_classifier.py use_case.json
# 3. Cost projection
python ../../../skills/chief-ai-officer-advisor/scripts/ai_cost_economics.py workload.json
Output Format
# CAIO Review: <plan>
**Date:** YYYY-MM-DD
## The Decision Being Made
[one sentence — which CAIO decision: model selection | risk classification | economics | next hire]
## Eval Discipline
- Eval set committed: yes/no
- SLO defined: <metric> < <threshold>
- Fallback behavior: <one line>
## Model Selection (if applicable)
- Recommended: API / FINE_TUNE / BUILD
- 3-year TCO: $X (chosen path) vs $Y (alternatives)
- Breakeven: <volume>
## Risk Classification (if applicable)
- EU AI Act tier: PROHIBITED / HIGH / LIMITED / MINIMAL
- Conformity assessment required: yes/no
- US state triggers: [list]
- Required controls open: N
## Cost Economics (if applicable)
- Monthly cost at current volume: $X
- Breakeven for self-hosted migration: <volume>
- Migration cost if applicable: $X (3-6 months)
## Org (if applicable)
- Next hire: <role>
- Why this, not the alternative: <one line>
- Prerequisite hires in place: yes/no
## Verdict
🟢 SHIP | 🟡 SHARPEN | 🔴 BLOCK
## Next Steps
[3 concrete actions]
Routing
/cs:cdo-review— for any training-data implications/cs:gc-review— for AI vendor contracts, output liability, training-data licensing/cs:ciso-review— for prompt injection / jailbreak / training-data poisoning threat model/cs:cfo-review— for multi-year vendor or GPU commitment TCO/cs:chro-review— for AI team hires (comp, ladder, leveling)/cs:decide— log the verdict/cs:freeze 60— on multi-year AI commitments
Related
- Agent:
cs-caio-advisor - Skill:
chief-ai-officer-advisor - Adjacent:
../../../skills/chief-data-officer-advisor/(training data rights, data strategy)
Version: 1.0.0