jpskill.com
💬 コミュニケーション コミュニティ

cross-eval

/cs:cross-eval <memo> — Multi-model consensus on a board memo or strategy brief. Claude + Codex + Gemini cross-review with graceful degradation.

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o cross-eval.zip https://jpskill.com/download/21695.zip && unzip -o cross-eval.zip && rm cross-eval.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/21695.zip -OutFile "$d\cross-eval.zip"; Expand-Archive "$d\cross-eval.zip" -DestinationPath $d -Force; ri "$d\cross-eval.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して cross-eval.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → cross-eval フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

/cs:cross-eval — マルチモデルコンセンサス

コマンド: /cs:cross-eval <memo-or-brief>

同じメモを複数のモデルプロバイダーで実行し、相違点を調整します。M&A、大規模な資金調達、人員削減、戦略的転換、規制上のコミットメントなど、単一モデルのバイアスが高くつく重大で不可逆的な決定に利用してください。

gstackの/codexクロスレビューパターンを、コードのPRではなくビジネスメモに一般化したものです。

実行するタイミング

  • タームシートに署名する前
  • 人員削減を発表する前
  • 規制市場へのコミットメントを行う前
  • 決定の取り消しに会社の時間で6ヶ月以上かかるあらゆる決定の前
  • 役員会の投票が割れた、または重大な異議があった場合

使用されるモデル(グレースフルデグラデーション)

このコマンドは、利用可能な各モデルを順番に呼び出そうとします。

  1. Claude(プライマリ、常に利用可能)— 役員会のネイティブな声
  2. Codex / OpenAIOPENAI_API_KEYまたはcodex CLIが利用可能な場合)
  3. GeminiGEMINI_API_KEYまたはgemini CLIが利用可能な場合)

Claudeのみが利用可能な場合、このコマンドはClaudeのみを敵対的モードで実行します — 同じモデル、異なるプロンプトシード — そして出力を単一モデルとして明確にラベル付けします。

ワークフロー

  1. メモ/ブリーフを読む
  2. 利用可能なモデルのCLI/APIキーを環境から探る
  3. 利用可能な各モデルについて:
    • このプロンプトプレフィックスを付けてメモを送信します:

      「あなたは独立したC-suiteのレビュー担当者です。以下は、別の会社の役員会からの役員メモです。上位3つの懸念事項、上位3つの支持事項、およびあなたの投票(承認/却下/保留)を特定してください。従順に同意しないでください — メモの推論は、反証されるまでは欠陥があるものと仮定してください。」

  4. 3つの独立したレビューを収集する
  5. 調整する: どこで意見が一致していますか?どこで意見が分かれていますか?
  6. 相違点を創業者への質問として提示する

出力形式

~/.claude/cross-eval/YYYY-MM-DD-<slug>.mdに保存されます。

# クロス評価: <メモのタイトル>
**日付:** YYYY-MM-DD
**レビューされたメモ:** <リンク>
**呼び出されたモデル:** Claude / Codex / Gemini (または注記されたフォールバック)

## 投票集計
| モデル | 投票 | 信頼度 |
|---|---|---|
| Claude | 承認 | 高 |
| Codex | 保留 | 中 |
| Gemini | 承認 | 低 |

## コンセンサス懸念事項(2つ以上のモデルが指摘)
1. <懸念事項> — Claude + Codexが指摘
2. <懸念事項> — 全3モデルが指摘

## 意見が分かれた懸念事項(1つのモデルが指摘)
- <Codexのみ:> <懸念事項> — 再検討の価値あり
- <Geminiのみ:> <懸念事項> — ノイズの可能性が高いが、確認

## コンセンサス支持事項(2つ以上のモデルが支持)
1. <支持事項>
2. <支持事項>

## 推奨事項
- 🟢 2つ以上のモデルが承認し、どのモデルからも重大な懸念がない場合はGO
- 🟡 いずれかのモデルが保留、または懸念事項が重大な場合はPAUSE
- 🔴 2つ以上のモデルが却下した場合はSTOP

## 創業者への未解決の質問
1. <相違点によって提起された質問>
2. <相違点によって提起された質問>

なぜこれが重要なのか

単一モデルの推奨には系統的なバイアスがあります。Claudeは親切な傾向があり、リスクを過小評価する可能性があります。Codex(OpenAI)は新興市場や規制に関するトピックに対してより慎重な傾向があります。Geminiは技術的な規模の主張に対してより慎重な傾向があります。意見の不一致はノイズではなくシグナルです。

これは不可逆性前のセーフティネットであり、外部の弁護士や実際の役員会の代わりではありません。

グレースフルデグラデーション

Claudeのみが利用可能な場合:

**利用可能なモデル:** Claudeのみ
**モード:** 敵対的 — 異なるシステムプロンプトで3つの独立したClaudeパスを実行:
  1. 標準レビュー担当者
  2. 悪魔の代弁者(3つの重大な懸念を見つけなければならない)
  3. スティールマン(承認する3つの最も強力な理由を見つけなければならない)

これは真のマルチモデルよりも弱いです。結果は示唆的なものとして扱い、決定的ではないものとしてください。

ルーティング

  • /cs:decide — コンセンサスがGOの場合
  • /cs:freeze — コンセンサスがPAUSEの場合
  • /cs:boardroom(再実行) — コンセンサスがSTOPの場合

関連

  • スキル: board-meetingexecutive-mentor
  • インスピレーション: gstackの/codexクロスレビューパターン(ビジネスメモに適合)

バージョン: 1.0.0

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

/cs:cross-eval — Multi-Model Consensus

Command: /cs:cross-eval <memo-or-brief>

Runs the same memo through multiple model providers and reconciles divergences. Use for high-stakes, irreversible decisions where single-model bias is too costly: M&A, major fundraises, layoffs, strategic pivots, regulatory commitments.

Adapted from gstack's /codex cross-review pattern, generalized to business memos instead of code PRs.

When to Run

  • Before signing a term sheet
  • Before announcing a layoff
  • Before committing to a regulated market
  • Before any decision where reversing costs > 6 months of company time
  • When the boardroom vote was split or had a CRITICAL dissent

Models Used (graceful degradation)

The command tries to invoke each available model in order:

  1. Claude (primary, always available) — the boardroom's native voice
  2. Codex / OpenAI (if OPENAI_API_KEY or codex CLI available)
  3. Gemini (if GEMINI_API_KEY or gemini CLI available)

If only Claude is available, the command runs Claude-only with adversarial mode — same model, different prompt seeds — and clearly labels the output as single-model.

Workflow

  1. Read the memo / brief
  2. Probe environment for available model CLIs / API keys
  3. For each available model:
    • Send the memo with this prompt prefix:

      "You are an independent C-suite reviewer. The following is a board memo from another company's boardroom. Identify the top 3 concerns, the top 3 supports, and your vote (APPROVE / REJECT / DEFER). Do not deferentially agree — assume the memo's reasoning is flawed until proven otherwise."

  4. Collect three independent reviews
  5. Reconcile: where do they agree? Where do they diverge?
  6. Surface the divergences as questions for the founder

Output Format

Saved to ~/.claude/cross-eval/YYYY-MM-DD-<slug>.md:

# Cross-Eval: <memo title>
**Date:** YYYY-MM-DD
**Memo reviewed:** <link>
**Models invoked:** Claude / Codex / Gemini (or noted fallbacks)

## Vote Tally
| Model | Vote | Confidence |
|---|---|---|
| Claude | APPROVE | High |
| Codex | DEFER | Med |
| Gemini | APPROVE | Low |

## Consensus Concerns (≥2 models flagged)
1. <concern> — flagged by Claude + Codex
2. <concern> — flagged by all 3

## Divergent Concerns (1 model flagged)
- <Codex only:> <concern> — worth a second look
- <Gemini only:> <concern> — likely noise, but check

## Consensus Supports (≥2 models endorsed)
1. <support>
2. <support>

## Recommendation
- 🟢 GO if 2+ models APPROVE and no CRITICAL concerns from any model
- 🟡 PAUSE if any model is DEFER or any concern is CRITICAL
- 🔴 STOP if 2+ models REJECT

## Open Questions for Founder
1. <question raised by divergence>
2. <question raised by divergence>

Why This Matters

Single-model recommendations have systematic biases. Claude trends helpful and may under-weight risk. Codex (OpenAI) trends more cautious on emerging-market and regulatory topics. Gemini trends more cautious on technical scale claims. Disagreement is signal, not noise.

This is the safety net before irreversibility — not a replacement for outside counsel or a real board.

Graceful Degradation

If only Claude is available:

**Models available:** Claude only
**Mode:** ADVERSARIAL — running 3 independent Claude passes with different system prompts:
  1. Standard reviewer
  2. Devil's advocate (must find 3 critical concerns)
  3. Steelman (must find 3 strongest reasons to approve)

This is weaker than true multi-model. Treat the result as suggestive, not conclusive.

Routing

  • /cs:decide — if consensus is GO
  • /cs:freeze — if consensus is PAUSE
  • /cs:boardroom (re-run) — if consensus is STOP

Related


Version: 1.0.0