abtesting
Root A/B testing: experiment design, statistical significance, sample size power analysis, launch criteria
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o abtesting.zip https://jpskill.com/download/22002.zip && unzip -o abtesting.zip && rm abtesting.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/22002.zip -OutFile "$d\abtesting.zip"; Expand-Archive "$d\abtesting.zip" -DestinationPath $d -Force; ri "$d\abtesting.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
abtesting.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
abtestingフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
abtesting
目的
このスキルは、実験デザイン、統計的有意性検定、サンプルサイズの検出力分析、ローンチ基準の定義を含むA/Bテストのワークフローを可能にします。データ駆動型の実験に基づいて意思決定を最適化するために使用します。
使用する場面
機能のロールアウト、ウェブサイトの変更、または製品のバリエーションに関する実験を設計する際に、このスキルを適用します。コンバージョン率やユーザーエンゲージメント指標の比較など、統計的検証が必要なシナリオで使用し、本格的な展開の前に信頼できる結果を確保します。
主な機能
- バリアント、指標、期間などのパラメータを使用してA/B実験を設計します。
- Cohen's dのような式を使用して、必要なサンプルサイズを計算するための検出力分析を実行します。
- 実験データに対してt検定またはカイ二乗検定で統計的有意性をテストします。
- p値、信頼区間、効果量に基づいてローンチ基準を定義します。
- リアルタイム分析のためにデータソースと統合します。
使用パターン
まず、必要なパラメータで実験オブジェクトを初期化します。迅速な計算にはCLIを、プログラムによるアクセスにはAPIを使用します。操作の前に、常に環境変数 $ABTEST_API_KEY を介してAPIキーを設定してください。例えば、コマンドを連結して設計、分析の実行、ローンチの決定を行います。非同期API呼び出しは、結果をポーリングすることで処理します。
一般的なコマンド/API
A/BテストコマンドにはOpenClaw CLIを使用します。export ABTEST_API_KEY=your_key でセットアップします。APIエンドポイントの例: POST https://api.openclaw.ai/abtesting/experiments。
-
サンプルサイズ計算のためのCLIコマンド:
abtest calculate-sample-size --effect-size 0.2 --power 0.8 --alpha 0.05これはグループあたりの最小サンプルを出力します。 -
有意性検定のためのAPI呼び出し:
curl -H "Authorization: Bearer $ABTEST_API_KEY" -d '{"control': [50, 55], 'treatment': [60, 65], 'metric': 'mean'}" https://api.openclaw.ai/abtesting/significancep値と信頼区間を含むJSONを返します。 -
実験デザインのための設定形式 (JSON):
{ "name": "email-variant-test", "variants": ["A", "B"], "metric": "click-rate", "duration_days": 7 }experiment.jsonとして保存し、abtest design --config experiment.jsonを実行します。 -
コードスニペットによる検出力分析 (Python):
import openclaw.abtestingresult = openclaw.abtesting.power_analysis(effect_size=0.1, alpha=0.05, power=0.8)必要なサンプルサイズの結果を出力します。
統合に関する注意点
OpenClaw SDKをインポートし、$ABTEST_API_KEY を設定することで、このスキルをコードベースに統合します。ウェブアプリの場合、マージ前に実験を検証するためにCI/CDパイプラインで使用します。openclaw.abtesting.connect(db_url="postgres://user:pass@host/db") のように、SDKの connect メソッドを介してデータソース (例: データベース) にアクセスできることを確認してください。マイクロサービスで使用する場合は、指数関数的バックオフでAPI呼び出しのリトライを処理します。
エラー処理
すべてのコマンドでエラーをチェックしてください。CLIは終了コード (例: 無効な入力の場合は1) を返します。APIの場合、HTTPレスポンスを解析します。不正なリクエストは400、認証失敗は401です。例:
try: response = requests.post(url, headers={"Authorization": f"Bearer {os.environ['ABTEST_API_KEY']}"})) response.raise_for_status() except requests.exceptions.HTTPError as e: log_error(e)
不十分なサンプルサイズなどの一般的な問題は、abtest validate --config experiment.json を使用して入力を事前に検証することで、早期にエラーを捕捉できます。
具体的な使用例
-
ウェブサイトバリアントテストの設計とサンプルサイズの計算: まず、設定を作成します:
{ "name": "homepage-test", "variants": ["original", "new"], "metric": "bounce-rate" }。 実行します:abtest calculate-sample-size --effect-size 0.05 --power 0.8 --alpha 0.05。 出力 (例: グループあたり500) を使用して設定します:abtest design --config config.json。 これにより、実験に十分な検出力があることを保証します。 -
メールキャンペーンの有意性を分析し、ローンチを決定: データを収集します: コントロールクリック数 = [100, 120]、トリートメント = [140, 150]。 実行します:
curl -H "Authorization: Bearer $ABTEST_API_KEY" -d '{"control": [100,120], "treatment": [140,150], "metric": "mean"}' https://api.openclaw.ai/abtesting/significance。 p値が0.05未満の場合、ローンチ基準に進みます:abtest launch-check --p-value 0.03 --min-effect 0.1。 これにより、結果に基づいて意思決定が自動化されます。
グラフの関係
- クラスター
abtestingに関連しています (直接の親)。 - タグ
ab-testing,experiments,statisticsに接続されています。 - 他のスキルにリンクしています:
analytics(データ処理用)、data-science(高度な統計用)。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
abtesting
Purpose
This skill enables A/B testing workflows, including experiment design, statistical significance testing, sample size power analysis, and defining launch criteria. Use it to optimize decisions based on data-driven experiments.
When to Use
Apply this skill when designing experiments for feature rollouts, website changes, or product variations. Use it for scenarios requiring statistical validation, such as comparing conversion rates or user engagement metrics, to ensure reliable results before full deployment.
Key Capabilities
- Design A/B experiments with parameters like variants, metrics, and duration.
- Perform power analysis to calculate required sample sizes using formulas like Cohen's d.
- Test statistical significance with t-tests or chi-squared tests on experiment data.
- Define launch criteria based on p-values, confidence intervals, and effect sizes.
- Integrate with data sources for real-time analysis.
Usage Patterns
Start by initializing an experiment object with required parameters. Use CLI for quick calculations or API for programmatic access. Always set the API key via environment variable $ABTEST_API_KEY before operations. For example, chain commands to design, run analysis, and decide on launch. Handle asynchronous API calls by polling for results.
Common Commands/API
Use the OpenClaw CLI for A/B testing commands. Set up with export ABTEST_API_KEY=your_key. Example API endpoint: POST https://api.openclaw.ai/abtesting/experiments.
-
CLI command for sample size calculation:
abtest calculate-sample-size --effect-size 0.2 --power 0.8 --alpha 0.05
This outputs the minimum sample per group. -
API call for significance test:
curl -H "Authorization: Bearer $ABTEST_API_KEY" -d '{"control': [50, 55], 'treatment': [60, 65], 'metric': 'mean'}" https://api.openclaw.ai/abtesting/significance
Returns JSON with p-value and confidence interval. -
Config format for experiment design (JSON):
{ "name": "email-variant-test", "variants": ["A", "B"], "metric": "click-rate", "duration_days": 7 }
Save asexperiment.jsonand run:abtest design --config experiment.json. -
Power analysis via code snippet (Python):
import openclaw.abtesting
result = openclaw.abtesting.power_analysis(effect_size=0.1, alpha=0.05, power=0.8)
Print result for required sample size.
Integration Notes
Integrate this skill into your codebase by importing the OpenClaw SDK and setting $ABTEST_API_KEY. For web apps, use it in CI/CD pipelines to validate experiments before merges. Ensure data sources (e.g., databases) are accessible via the SDK's connect method, like openclaw.abtesting.connect(db_url="postgres://user:pass@host/db"). If using in a microservice, handle retries for API calls with exponential backoff.
Error Handling
Check for errors in every command; CLI returns exit codes (e.g., 1 for invalid input). For API, parse HTTP responses: 400 for bad requests, 401 for auth failures. Example:
try: response = requests.post(url, headers={"Authorization": f"Bearer {os.environ['ABTEST_API_KEY']}"})) response.raise_for_status() except requests.exceptions.HTTPError as e: log_error(e)
Handle common issues like insufficient sample size by validating inputs upfront, e.g., use abtest validate --config experiment.json to catch errors early.
Concrete Usage Examples
-
Design and calculate sample size for a website variant test:
First, create a config:{ "name": "homepage-test", "variants": ["original", "new"], "metric": "bounce-rate" }.
Run:abtest calculate-sample-size --effect-size 0.05 --power 0.8 --alpha 0.05.
Use the output (e.g., 500 per group) to set up:abtest design --config config.json.
This ensures your experiment has enough power. -
Analyze significance and decide launch for an email campaign:
Collect data: control clicks = [100, 120], treatment = [140, 150].
Run:curl -H "Authorization: Bearer $ABTEST_API_KEY" -d '{"control": [100,120], "treatment": [140,150], "metric": "mean"}' https://api.openclaw.ai/abtesting/significance.
If p-value < 0.05, proceed with launch criteria:abtest launch-check --p-value 0.03 --min-effect 0.1.
This automates decision-making based on results.
Graph Relationships
- Related to cluster: abtesting (direct parent).
- Connected to tags: ab-testing, experiments, statistics.
- Links to other skills: analytics (for data processing), data-science (for advanced stats).