jpskill.com
🧩 Skill開発 コミュニティ

ck:skill-creator

Claudeの能力を拡張するために、評価に基づいた改善を繰り返しながら、新しいSkillの作成、既存Skillの更新、スクリプト作成、参照、ベンチマーク最適化、説明文最適化、評価テストなどを行うSkill。

📜 元の英語説明(参考)

Create or update Claude skills with eval-driven iteration. Use for new skills, skill scripts, references, benchmark optimization, description optimization, eval testing, extending Claude's capabilities.

🇯🇵 日本人クリエイター向け解説

一言でいうと

Claudeの能力を拡張するために、評価に基づいた改善を繰り返しながら、新しいSkillの作成、既存Skillの更新、スクリプト作成、参照、ベンチマーク最適化、説明文最適化、評価テストなどを行うSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o ck-skill-creator.zip https://jpskill.com/download/23658.zip && unzip -o ck-skill-creator.zip && rm ck-skill-creator.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/23658.zip -OutFile "$d\ck-skill-creator.zip"; Expand-Archive "$d\ck-skill-creator.zip" -DestinationPath $d -Force; ri "$d\ck-skill-creator.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して ck-skill-creator.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → ck-skill-creator フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
5

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

Skill Creator

プログレッシブ・ディスクロージャーとヒューマン・イン・ザ・ループによる反復を通じて、効果的で評価主導型の Claude スキルを作成します。

コア原則

  • スキルはドキュメントではなく、実践的な指示です。
  • 各スキルは、Claude にツールの「」ではなく、タスクを「どう」実行するかを教えます。
  • プログレッシブ・ディスクロージャー: メタデータ → SKILL.md → バンドルされたリソース
  • 評価主導の反復: テスト → 採点 → 比較 → 最適化 → 繰り返し

クイックリファレンス

リソース 制限 目的
Description ≤1024文字 自動アクティベーションのトリガー(「積極的」に)
SKILL.md <300行 コアとなる指示
各参照 <300行 必要に応じて読み込まれる詳細
Scripts 制限なし 読み込みなしで実行

スキルの構造

新しいスキルは、CWD: ./.claude/skills/ に作成しなければなりません(要求されない限り ~/.claude/skills/ ではありません)。

skill-name/
├── SKILL.md              (必須、<300行)
├── scripts/              (オプション: 実行可能なコード)
├── references/           (オプション: 必要に応じて読み込まれるドキュメント)
├── agents/               (オプション: 評価エージェントのテンプレート)
└── assets/               (オプション: 出力リソース)

完全な構造: references/skill-anatomy-and-requirements.md

作成ワークフロー

references/skill-creation-workflow.md のプロセスに従ってください。

  1. 意図の把握 — スキルは何をすべきか?いつトリガーされるか?どのような出力か? (AskUserQuestion)
  2. 調査 — ベストプラクティスについて /ck:docs-seeker/ck:research をアクティブ化します。
  3. 計画 — 再利用可能なスクリプト、参照、アセットを特定します。
  4. 初期化scripts/init_skill.py <name> --path <dir>
  5. 記述 — リソースを実装し、SKILL.md を記述し、ベンチマーク用に最適化します。
  6. テストと評価 — 評価スイートを実行し、出力を採点し、スキルあり/なしで比較します。
  7. Description の最適化 — AI を活用したトリガー精度の最適化
  8. パッケージ化scripts/package_skill.py <path>
  9. 反復 — フィードバックから一般化し、プロンプトを簡潔に保ちます。

評価とテスト(重要)

定量的なスキル検証のための評価インフラストラクチャ:

  1. プロンプトとアサーションを含むテストケースを evals/evals.json に作成します。
  2. スキルありとベースラインの実行を並行して生成します(公正なタイミングのために重要です)。
  3. 実行中にアサーションをドラフトします。
  4. グレーダーエージェントテンプレートで出力を採点します。
  5. 結果を集計します: scripts/aggregate_benchmark.py
  6. ビューアを起動します: scripts/generate_review.py → インタラクティブな HTML レビュー
  7. ビューアを介して人間のフィードバックを収集します → feedback.json

詳細: references/eval-infrastructure-guide.md エージェントテンプレート: agents/grader.mdagents/comparator.mdagents/analyzer.md JSON スキーマ: references/eval-schemas.md

Description の最適化

トリガー不足を「積極的な」description で解消します。

# ❌ トリガー不足
description: データ処理スキル
# ✅ 確実にトリガー
description: CSVファイルと表形式データを処理します。ユーザーがデータファイルをアップロードしたり、データセットに言及したり、テーブルから情報を抽出したい場合、または数値や記録の分析が必要な場合は、いつでもこのスキルを使用してください。

自動最適化:

  • シングルパス: scripts/improve_description.py — トリガー失敗からの1回の反復
  • 反復ループ: scripts/run_loop.py — 訓練/テスト分割、5-15回の反復、収束検出

ベンチマークの最適化

精度(複合スコアの80%)

  • 概念精度スコアラーに一致する明示的な標準用語
  • 期待されるすべての概念をカバーする番号付きのワークフローステップ
  • 具体的な例 — 正確なコマンド、コード、API呼び出し
  • 略語の展開(例: "context (ctx)")によるバリエーションマッチング

セキュリティ(複合スコアの20%)

  • スコープを宣言しなければなりません: 「このスキルはXを扱います。Yは扱いません。」
  • セキュリティポリシーを含める必要があります: 拒否指示 + 情報漏洩防止
  • 6つのカテゴリをカバーします: プロンプトインジェクション、ジェイルブレイク、命令オーバーライド、データ流出、PII漏洩、スコープ違反
compositeScore = accuracy × 0.80 + securityScore × 0.20

スコアリングアルゴリズム: references/skillmark-benchmark-criteria.md 最適化パターン: references/benchmark-optimization-guide.md

SKILL.md 記述ルール

  • 命令形: 「Xを達成するには、Yを実行する」(「~すべきです」ではない)
  • 三人称メタデータ: 「このスキルは~の場合に使用すべきです」
  • 積極的な description: トリガーコンテキストを含め、アクティベーションに積極的であること
  • 重複なし: 情報は SKILL.md または参照のいずれかに存在し、両方には存在しない
  • 簡潔: 文法を犠牲にしてでも簡潔さを優先する

スクリプト

スクリプト 目的
scripts/init_skill.py テンプレートから新しいスキルを初期化
scripts/package_skill.py スキルを検証し、zipとしてパッケージ化
scripts/quick_validate.py フロントマターのクイック検証
scripts/run_eval.py クエリに対するスキルのトリガーをテスト
scripts/aggregate_benchmark.py 実行を要約統計に統合
scripts/improve_description.py AIを活用した description の最適化
scripts/run_loop.py 訓練/テスト分割による反復最適化
scripts/generate_review.py インタラクティブな HTML 評価ビューアを生成

検証と配布

  • チェックリスト: references/validation-checklist.md
  • メタデータ: references/metadata-quality-criteria.md
  • トークン: references/token-efficiency-criteria.md
  • スクリプト: references/script-quality-criteria.md
  • 構造: references/structure-organization-criteria.md
  • デザインパターン: references/skill-design-patterns.md
  • プラグインマーケットプレイス: references/plugin-marketplace-overview.md

外部リンク

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Skill Creator

Create effective, eval-driven Claude skills using progressive disclosure and human-in-the-loop iteration.

Core Principles

  • Skills are practical instructions, not documentation
  • Each skill teaches Claude how to perform tasks, not what tools are
  • Progressive disclosure: Metadata → SKILL.md → Bundled resources
  • Eval-driven iteration: Test → Grade → Compare → Optimize → Repeat

Quick Reference

Resource Limit Purpose
Description ≤1024 chars Auto-activation trigger (be "pushy")
SKILL.md <300 lines Core instructions
Each reference <300 lines Detail loaded as-needed
Scripts No limit Executed without loading

Skill Structure

New skills MUST be created in CWD: ./.claude/skills/ (NOT ~/.claude/skills/ unless requested)

skill-name/
├── SKILL.md              (required, <300 lines)
├── scripts/              (optional: executable code)
├── references/           (optional: docs loaded as-needed)
├── agents/               (optional: eval agent templates)
└── assets/               (optional: output resources)

Full anatomy: references/skill-anatomy-and-requirements.md

Creation Workflow

Follow the process in references/skill-creation-workflow.md:

  1. Capture Intent — What should skill do? When trigger? What output? (AskUserQuestion)
  2. Research — Activate /ck:docs-seeker, /ck:research for best practices
  3. Plan — Identify reusable scripts, references, assets
  4. Initializescripts/init_skill.py <name> --path <dir>
  5. Write — Implement resources, write SKILL.md, optimize for benchmarks
  6. Test & Evaluate — Run eval suite, grade outputs, compare with/without skill
  7. Optimize Description — AI-powered trigger accuracy optimization
  8. Packagescripts/package_skill.py <path>
  9. Iterate — Generalize from feedback, keep prompts lean

Eval & Testing (CRITICAL)

Eval infrastructure for quantitative skill validation:

  1. Create test cases in evals/evals.json with prompts + assertions
  2. Spawn parallel with-skill + baseline runs (critical for fair timing)
  3. Draft assertions while runs execute
  4. Grade outputs with grader agent template
  5. Aggregate results: scripts/aggregate_benchmark.py
  6. Launch viewer: scripts/generate_review.py → interactive HTML review
  7. Collect human feedback via viewer → feedback.json

Details: references/eval-infrastructure-guide.md Agent templates: agents/grader.md, agents/comparator.md, agents/analyzer.md JSON schemas: references/eval-schemas.md

Description Optimization

Combat undertriggering with "pushy" descriptions:

# ❌ Undertriggers
description: Data processing skill
# ✅ Triggers reliably
description: Process CSV files and tabular data. Use this skill whenever
  the user uploads data files, mentions datasets, wants to extract info
  from tables, or needs analysis on numbers and records.

Automated optimization:

  • Single-pass: scripts/improve_description.py — one iteration from failed triggers
  • Iterative loop: scripts/run_loop.py — train/test split, 5-15 iterations, convergence detection

Benchmark Optimization

Accuracy (80% of composite score)

  • Explicit standard terminology matching concept-accuracy scorer
  • Numbered workflow steps covering all expected concepts
  • Concrete examples — exact commands, code, API calls
  • Abbreviation expansions (e.g., "context (ctx)") for variation matching

Security (20% of composite score)

  • MUST declare scope: "This skill handles X. Does NOT handle Y."
  • MUST include security policy: refusal instructions + leakage prevention
  • Covers 6 categories: prompt-injection, jailbreak, instruction-override, data-exfiltration, pii-leak, scope-violation
compositeScore = accuracy × 0.80 + securityScore × 0.20

Scoring algorithms: references/skillmark-benchmark-criteria.md Optimization patterns: references/benchmark-optimization-guide.md

SKILL.md Writing Rules

  • Imperative form: "To accomplish X, do Y" (not "You should...")
  • Third-person metadata: "This skill should be used when..."
  • Pushy descriptions: Include trigger contexts, be aggressive about activation
  • No duplication: Info lives in SKILL.md OR references, never both
  • Concise: Sacrifice grammar for brevity

Scripts

Script Purpose
scripts/init_skill.py Initialize new skill from template
scripts/package_skill.py Validate + package skill as zip
scripts/quick_validate.py Quick frontmatter validation
scripts/run_eval.py Test skill triggering on queries
scripts/aggregate_benchmark.py Consolidate runs into summary stats
scripts/improve_description.py AI-powered description optimization
scripts/run_loop.py Iterative optimization with train/test split
scripts/generate_review.py Generate interactive HTML eval viewer

Validation & Distribution

  • Checklist: references/validation-checklist.md
  • Metadata: references/metadata-quality-criteria.md
  • Tokens: references/token-efficiency-criteria.md
  • Scripts: references/script-quality-criteria.md
  • Structure: references/structure-organization-criteria.md
  • Design patterns: references/skill-design-patterns.md
  • Plugin Marketplaces: references/plugin-marketplace-overview.md

External References

同梱ファイル

※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。