ck:skill-creator
Claudeの能力を拡張するために、評価に基づいた改善を繰り返しながら、新しいSkillの作成、既存Skillの更新、スクリプト作成、参照、ベンチマーク最適化、説明文最適化、評価テストなどを行うSkill。
📜 元の英語説明(参考)
Create or update Claude skills with eval-driven iteration. Use for new skills, skill scripts, references, benchmark optimization, description optimization, eval testing, extending Claude's capabilities.
🇯🇵 日本人クリエイター向け解説
Claudeの能力を拡張するために、評価に基づいた改善を繰り返しながら、新しいSkillの作成、既存Skillの更新、スクリプト作成、参照、ベンチマーク最適化、説明文最適化、評価テストなどを行うSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o ck-skill-creator.zip https://jpskill.com/download/23658.zip && unzip -o ck-skill-creator.zip && rm ck-skill-creator.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/23658.zip -OutFile "$d\ck-skill-creator.zip"; Expand-Archive "$d\ck-skill-creator.zip" -DestinationPath $d -Force; ri "$d\ck-skill-creator.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
ck-skill-creator.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
ck-skill-creatorフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 5
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
Skill Creator
プログレッシブ・ディスクロージャーとヒューマン・イン・ザ・ループによる反復を通じて、効果的で評価主導型の Claude スキルを作成します。
コア原則
- スキルはドキュメントではなく、実践的な指示です。
- 各スキルは、Claude にツールの「何」ではなく、タスクを「どう」実行するかを教えます。
- プログレッシブ・ディスクロージャー: メタデータ → SKILL.md → バンドルされたリソース
- 評価主導の反復: テスト → 採点 → 比較 → 最適化 → 繰り返し
クイックリファレンス
| リソース | 制限 | 目的 |
|---|---|---|
| Description | ≤1024文字 | 自動アクティベーションのトリガー(「積極的」に) |
| SKILL.md | <300行 | コアとなる指示 |
| 各参照 | <300行 | 必要に応じて読み込まれる詳細 |
| Scripts | 制限なし | 読み込みなしで実行 |
スキルの構造
新しいスキルは、CWD: ./.claude/skills/ に作成しなければなりません(要求されない限り ~/.claude/skills/ ではありません)。
skill-name/
├── SKILL.md (必須、<300行)
├── scripts/ (オプション: 実行可能なコード)
├── references/ (オプション: 必要に応じて読み込まれるドキュメント)
├── agents/ (オプション: 評価エージェントのテンプレート)
└── assets/ (オプション: 出力リソース)
完全な構造: references/skill-anatomy-and-requirements.md
作成ワークフロー
references/skill-creation-workflow.md のプロセスに従ってください。
- 意図の把握 — スキルは何をすべきか?いつトリガーされるか?どのような出力か? (AskUserQuestion)
- 調査 — ベストプラクティスについて
/ck:docs-seeker、/ck:researchをアクティブ化します。 - 計画 — 再利用可能なスクリプト、参照、アセットを特定します。
- 初期化 —
scripts/init_skill.py <name> --path <dir> - 記述 — リソースを実装し、SKILL.md を記述し、ベンチマーク用に最適化します。
- テストと評価 — 評価スイートを実行し、出力を採点し、スキルあり/なしで比較します。
- Description の最適化 — AI を活用したトリガー精度の最適化
- パッケージ化 —
scripts/package_skill.py <path> - 反復 — フィードバックから一般化し、プロンプトを簡潔に保ちます。
評価とテスト(重要)
定量的なスキル検証のための評価インフラストラクチャ:
- プロンプトとアサーションを含むテストケースを
evals/evals.jsonに作成します。 - スキルありとベースラインの実行を並行して生成します(公正なタイミングのために重要です)。
- 実行中にアサーションをドラフトします。
- グレーダーエージェントテンプレートで出力を採点します。
- 結果を集計します:
scripts/aggregate_benchmark.py - ビューアを起動します:
scripts/generate_review.py→ インタラクティブな HTML レビュー - ビューアを介して人間のフィードバックを収集します →
feedback.json
詳細: references/eval-infrastructure-guide.md
エージェントテンプレート: agents/grader.md、agents/comparator.md、agents/analyzer.md
JSON スキーマ: references/eval-schemas.md
Description の最適化
トリガー不足を「積極的な」description で解消します。
# ❌ トリガー不足
description: データ処理スキル
# ✅ 確実にトリガー
description: CSVファイルと表形式データを処理します。ユーザーがデータファイルをアップロードしたり、データセットに言及したり、テーブルから情報を抽出したい場合、または数値や記録の分析が必要な場合は、いつでもこのスキルを使用してください。
自動最適化:
- シングルパス:
scripts/improve_description.py— トリガー失敗からの1回の反復 - 反復ループ:
scripts/run_loop.py— 訓練/テスト分割、5-15回の反復、収束検出
ベンチマークの最適化
精度(複合スコアの80%)
- 概念精度スコアラーに一致する明示的な標準用語
- 期待されるすべての概念をカバーする番号付きのワークフローステップ
- 具体的な例 — 正確なコマンド、コード、API呼び出し
- 略語の展開(例: "context (ctx)")によるバリエーションマッチング
セキュリティ(複合スコアの20%)
- スコープを宣言しなければなりません: 「このスキルはXを扱います。Yは扱いません。」
- セキュリティポリシーを含める必要があります: 拒否指示 + 情報漏洩防止
- 6つのカテゴリをカバーします: プロンプトインジェクション、ジェイルブレイク、命令オーバーライド、データ流出、PII漏洩、スコープ違反
compositeScore = accuracy × 0.80 + securityScore × 0.20
スコアリングアルゴリズム: references/skillmark-benchmark-criteria.md
最適化パターン: references/benchmark-optimization-guide.md
SKILL.md 記述ルール
- 命令形: 「Xを達成するには、Yを実行する」(「~すべきです」ではない)
- 三人称メタデータ: 「このスキルは~の場合に使用すべきです」
- 積極的な description: トリガーコンテキストを含め、アクティベーションに積極的であること
- 重複なし: 情報は SKILL.md または参照のいずれかに存在し、両方には存在しない
- 簡潔: 文法を犠牲にしてでも簡潔さを優先する
スクリプト
| スクリプト | 目的 |
|---|---|
scripts/init_skill.py |
テンプレートから新しいスキルを初期化 |
scripts/package_skill.py |
スキルを検証し、zipとしてパッケージ化 |
scripts/quick_validate.py |
フロントマターのクイック検証 |
scripts/run_eval.py |
クエリに対するスキルのトリガーをテスト |
scripts/aggregate_benchmark.py |
実行を要約統計に統合 |
scripts/improve_description.py |
AIを活用した description の最適化 |
scripts/run_loop.py |
訓練/テスト分割による反復最適化 |
scripts/generate_review.py |
インタラクティブな HTML 評価ビューアを生成 |
検証と配布
- チェックリスト:
references/validation-checklist.md - メタデータ:
references/metadata-quality-criteria.md - トークン:
references/token-efficiency-criteria.md - スクリプト:
references/script-quality-criteria.md - 構造:
references/structure-organization-criteria.md - デザインパターン:
references/skill-design-patterns.md - プラグインマーケットプレイス:
references/plugin-marketplace-overview.md
外部リンク
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Skill Creator
Create effective, eval-driven Claude skills using progressive disclosure and human-in-the-loop iteration.
Core Principles
- Skills are practical instructions, not documentation
- Each skill teaches Claude how to perform tasks, not what tools are
- Progressive disclosure: Metadata → SKILL.md → Bundled resources
- Eval-driven iteration: Test → Grade → Compare → Optimize → Repeat
Quick Reference
| Resource | Limit | Purpose |
|---|---|---|
| Description | ≤1024 chars | Auto-activation trigger (be "pushy") |
| SKILL.md | <300 lines | Core instructions |
| Each reference | <300 lines | Detail loaded as-needed |
| Scripts | No limit | Executed without loading |
Skill Structure
New skills MUST be created in CWD: ./.claude/skills/ (NOT ~/.claude/skills/ unless requested)
skill-name/
├── SKILL.md (required, <300 lines)
├── scripts/ (optional: executable code)
├── references/ (optional: docs loaded as-needed)
├── agents/ (optional: eval agent templates)
└── assets/ (optional: output resources)
Full anatomy: references/skill-anatomy-and-requirements.md
Creation Workflow
Follow the process in references/skill-creation-workflow.md:
- Capture Intent — What should skill do? When trigger? What output? (AskUserQuestion)
- Research — Activate
/ck:docs-seeker,/ck:researchfor best practices - Plan — Identify reusable scripts, references, assets
- Initialize —
scripts/init_skill.py <name> --path <dir> - Write — Implement resources, write SKILL.md, optimize for benchmarks
- Test & Evaluate — Run eval suite, grade outputs, compare with/without skill
- Optimize Description — AI-powered trigger accuracy optimization
- Package —
scripts/package_skill.py <path> - Iterate — Generalize from feedback, keep prompts lean
Eval & Testing (CRITICAL)
Eval infrastructure for quantitative skill validation:
- Create test cases in
evals/evals.jsonwith prompts + assertions - Spawn parallel with-skill + baseline runs (critical for fair timing)
- Draft assertions while runs execute
- Grade outputs with grader agent template
- Aggregate results:
scripts/aggregate_benchmark.py - Launch viewer:
scripts/generate_review.py→ interactive HTML review - Collect human feedback via viewer →
feedback.json
Details: references/eval-infrastructure-guide.md
Agent templates: agents/grader.md, agents/comparator.md, agents/analyzer.md
JSON schemas: references/eval-schemas.md
Description Optimization
Combat undertriggering with "pushy" descriptions:
# ❌ Undertriggers
description: Data processing skill
# ✅ Triggers reliably
description: Process CSV files and tabular data. Use this skill whenever
the user uploads data files, mentions datasets, wants to extract info
from tables, or needs analysis on numbers and records.
Automated optimization:
- Single-pass:
scripts/improve_description.py— one iteration from failed triggers - Iterative loop:
scripts/run_loop.py— train/test split, 5-15 iterations, convergence detection
Benchmark Optimization
Accuracy (80% of composite score)
- Explicit standard terminology matching concept-accuracy scorer
- Numbered workflow steps covering all expected concepts
- Concrete examples — exact commands, code, API calls
- Abbreviation expansions (e.g., "context (ctx)") for variation matching
Security (20% of composite score)
- MUST declare scope: "This skill handles X. Does NOT handle Y."
- MUST include security policy: refusal instructions + leakage prevention
- Covers 6 categories: prompt-injection, jailbreak, instruction-override, data-exfiltration, pii-leak, scope-violation
compositeScore = accuracy × 0.80 + securityScore × 0.20
Scoring algorithms: references/skillmark-benchmark-criteria.md
Optimization patterns: references/benchmark-optimization-guide.md
SKILL.md Writing Rules
- Imperative form: "To accomplish X, do Y" (not "You should...")
- Third-person metadata: "This skill should be used when..."
- Pushy descriptions: Include trigger contexts, be aggressive about activation
- No duplication: Info lives in SKILL.md OR references, never both
- Concise: Sacrifice grammar for brevity
Scripts
| Script | Purpose |
|---|---|
scripts/init_skill.py |
Initialize new skill from template |
scripts/package_skill.py |
Validate + package skill as zip |
scripts/quick_validate.py |
Quick frontmatter validation |
scripts/run_eval.py |
Test skill triggering on queries |
scripts/aggregate_benchmark.py |
Consolidate runs into summary stats |
scripts/improve_description.py |
AI-powered description optimization |
scripts/run_loop.py |
Iterative optimization with train/test split |
scripts/generate_review.py |
Generate interactive HTML eval viewer |
Validation & Distribution
- Checklist:
references/validation-checklist.md - Metadata:
references/metadata-quality-criteria.md - Tokens:
references/token-efficiency-criteria.md - Scripts:
references/script-quality-criteria.md - Structure:
references/structure-organization-criteria.md - Design patterns:
references/skill-design-patterns.md - Plugin Marketplaces:
references/plugin-marketplace-overview.md
External References
同梱ファイル
※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。
- 📄 SKILL.md (6,192 bytes)
- 📎 LICENSE.txt (11,357 bytes)
- 📎 scripts/init_skill.py (12,860 bytes)
- 📎 scripts/package_skill.py (4,538 bytes)
- 📎 scripts/quick_validate.py (3,838 bytes)