harness-engineering
AIエージェントがコードベースでより良く機能するよう、エージェントの出力品質に関する問題解決や改善を行うためのSkill。
📜 元の英語説明(参考)
Set up and improve harness engineering (AGENTS.md, docs/, lint rules, eval systems, project-level prompt engineering) for AI-agent-friendly codebases. Triggers on: new/empty project setup for AI agents, AGENTS.md or CLAUDE.md creation, harness engineering questions, making agents work better on a codebase. ALSO triggers when users are frustrated or complaining about agent quality — e.g. 'the agent keeps ignoring conventions', 'it never follows instructions', 'why does it keep doing X', 'the agent is broken' — because poor agent output almost always signals harness gaps, not model problems. Covers: context engineering, architectural constraints, multi-agent coordination, evaluation, long-running agent harness, and diagnosis of agent quality issues.
🇯🇵 日本人クリエイター向け解説
AIエージェントがコードベースでより良く機能するよう、エージェントの出力品質に関する問題解決や改善を行うためのSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o harness-engineering.zip https://jpskill.com/download/6038.zip && unzip -o harness-engineering.zip && rm harness-engineering.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/6038.zip -OutFile "$d\harness-engineering.zip"; Expand-Archive "$d\harness-engineering.zip" -DestinationPath $d -Force; ri "$d\harness-engineering.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
harness-engineering.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
harness-engineeringフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-17
- 取得日時
- 2026-05-17
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[Skill 名] harness-engineering
ハーネスエンジニアリング
ハーネスとは、プロジェクトで作業するAIエージェントのためのオペレーティングシステムです。モデルはCPU、コンテキストウィンドウはRAM、ハーネスはOSです。
基本原則
シンプルに始め、必要なときにのみ複雑さを追加してください。 すべてのハーネスコンポーネントは、モデルが単独ではできないことについての仮定をエンコードしています。これらの仮定は、モデルが改善するにつれて期限切れになるため、プレッシャーテストを行ってください。削除を前提に構築しましょう。
このスキルがアクティブになる時
| シグナル | アクション |
|---|---|
| 空の/新規プロジェクト | → プロジェクトの完全なセットアップ(セクション1) |
| ユーザーがエージェントに不満を持っている | → ハーネスのギャップを診断し修正する(セクション7) |
| 既存のプロジェクトに改善が必要 | → 評価し、段階的に改善する |
| 明示的なハーネスに関する質問 | → 関連するセクションを参照する |
ワークフロー
新規プロジェクトの場合
- 評価 — プロジェクトとは何か?技術スタックは?チームの規模は?エージェントはどのように使用されるのか?
- セットアップ — 基本的なハーネスファイルを作成する →
references/01-project-setup.mdを読む - コンテキスト — 情報アーキテクチャを設計する →
references/02-context-engineering.mdを読む - 制約 — ガードレールとリンターを追加する →
references/03-constraints.mdを読む - 評価 — フィードバックループを設定する →
references/05-eval-feedback.mdを読む - プロジェクトがマルチエージェントまたは長時間のタスクを含む場合 →
references/04-multi-agent.md、references/06-long-running.mdを読む
診断の場合(エージェントのパフォーマンスが悪い場合)
references/07-diagnosis.mdをすぐに読む- どのハーネスレイヤーが失敗しているかを特定する
- 関連するリファレンスから的を絞った修正を適用する
段階的な改善の場合
現在のハーネスの成熟度を評価し、最も弱いレイヤーを特定し、一度に1つのレイヤーを改善します。
ハーネスレイヤー(クイックリファレンス)
| レイヤー | 内容 | リファレンス |
|---|---|---|
| プロジェクトセットアップ | AGENTS.md、docs/、ディレクトリ規約 | 01-project-setup.md |
| コンテキストエンジニアリング | エージェントが見る情報、段階的開示、作業状態 | 02-context-engineering.md |
| 制約とガードレール | リンター、型システム、アーキテクチャの強制、安全な自律性 | 03-constraints.md |
| マルチエージェントアーキテクチャ | エージェントの分離、調整プロトコル、委譲パターン | 04-multi-agent.md |
| 評価とフィードバック | テスト、採点、GCエージェント、可観測性 | 05-eval-feedback.md |
| 長時間実行タスク | 進捗追跡、コンテキストリセット、ハンドオフ成果物 | 06-long-running.md |
| 診断 | エージェントが失敗した場合 — モデルではなくハーネスの根本原因を特定する | 07-diagnosis.md |
自己更新プロトコル
プロジェクト中に新しい再利用可能なハーネスパターンを発見した場合:
- それがどのリファレンスファイルに属するか(または新しいファイルが必要か)を特定する
- そのパターンを、何を解決するか、いつ使用するか、どのように実装するか、を添えて追加する
- 簡潔に保つ — 余分なものはなく、パターンのみを記述する
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Harness Engineering
Harness = the operating system for AI agents working on your project. Model is CPU, context window is RAM, harness is OS.
Core Principle
Start simple, add complexity only when needed. Every harness component encodes an assumption about what the model can't do alone. Pressure-test these assumptions — they expire as models improve. Build for deletion.
When This Skill Activates
| Signal | Action |
|---|---|
| Empty/new project | → Full project setup (Section 1) |
| User frustrated with agent | → Diagnose & fix harness gaps (Section 7) |
| Existing project needs improvement | → Assess & incrementally improve |
| Explicit harness question | → Reference relevant sections |
Workflow
For New Projects
- Assess — What's the project? Tech stack? Team size? How will agents be used?
- Setup — Create foundational harness files → read
references/01-project-setup.md - Context — Design information architecture → read
references/02-context-engineering.md - Constraints — Add guardrails and linters → read
references/03-constraints.md - Evaluate — Set up feedback loops → read
references/05-eval-feedback.md - If project involves multi-agent or long tasks → read
references/04-multi-agent.md,references/06-long-running.md
For Diagnosis (Agent Not Performing Well)
- Read
references/07-diagnosis.mdimmediately - Identify which harness layer is failing
- Apply targeted fix from the relevant reference
For Incremental Improvement
Assess current harness maturity, identify weakest layer, improve one layer at a time.
Harness Layers (Quick Reference)
| Layer | What | Reference |
|---|---|---|
| Project Setup | AGENTS.md, docs/, directory conventions | 01-project-setup.md |
| Context Engineering | What info agents see, progressive disclosure, working state | 02-context-engineering.md |
| Constraints & Guardrails | Linters, type systems, architecture enforcement, safe autonomy | 03-constraints.md |
| Multi-Agent Architecture | Agent separation, coordination protocols, delegation patterns | 04-multi-agent.md |
| Eval & Feedback | Testing, grading, GC agents, observability | 05-eval-feedback.md |
| Long-Running Tasks | Progress tracking, context resets, handoff artifacts | 06-long-running.md |
| Diagnosis | When agents fail — identify root cause in harness, not model | 07-diagnosis.md |
Self-Update Protocol
When you discover a new reusable harness pattern during a project:
- Identify which reference file it belongs to (or if it needs a new one)
- Add the pattern with: what it solves, when to use it, how to implement it
- Keep it concise — no fluff, just the pattern