jpskill.com
💬 コミュニケーション コミュニティ

data-exploration-tool

DBX Studioのデータベースやテーブル構造を体系的に分析し、データの内容や構造を把握したり、データセットの特徴を理解したりする際に役立つデータ探索を支援するSkill。

📜 元の英語説明(参考)

Systematic database and table profiling for DBX Studio. Use when a user wants to understand their data, explore schema structure, or profile a dataset.

🇯🇵 日本人クリエイター向け解説

一言でいうと

DBX Studioのデータベースやテーブル構造を体系的に分析し、データの内容や構造を把握したり、データセットの特徴を理解したりする際に役立つデータ探索を支援するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o data-exploration-tool.zip https://jpskill.com/download/18590.zip && unzip -o data-exploration-tool.zip && rm data-exploration-tool.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/18590.zip -OutFile "$d\data-exploration-tool.zip"; Expand-Archive "$d\data-exploration-tool.zip" -DestinationPath $d -Force; ri "$d\data-exploration-tool.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して data-exploration-tool.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → data-exploration-tool フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

データ探索 — DBX Studio

探索ワークフロー

フェーズ 1: スキーマの発見

read_schema で開始してすべてのテーブルをリストアップし、次に興味のある各テーブルに対して describe_table を実行します。

1. read_schema(schema_name: "public")
2. describe_table(table_name: "<各テーブル>")
3. get_table_stats(table_name: "<table>")

フェーズ 2: テーブルのプロファイリング

各テーブルについて、以下を収集します。

  • 行数
  • 列名と型
  • get_table_data によるサンプルデータ
  • Null の数と分布

フェーズ 3: 関係の発見

外部キーのパターンを探します。

  • 他のテーブルにリンクする *_id という名前の列
  • 一般的な結合パターン: users.id → orders.user_id

品質スコアリング

スコア 完了度
Green 95% 超が入力済み
Yellow 80–95% が入力済み
Orange 50–80% が入力済み
Red 50% 未満が入力済み

一般的な探索クエリ

行数

SELECT COUNT(*) AS row_count FROM "public"."table_name";

列の Null 率

SELECT
  COUNT(*) AS total,
  COUNT(column_name) AS non_null,
  ROUND(100.0 * COUNT(column_name) / COUNT(*), 2) AS pct_filled
FROM "public"."table_name";

個別の値

SELECT column_name, COUNT(*) AS frequency
FROM "public"."table_name"
GROUP BY 1
ORDER BY 2 DESC
LIMIT 20;

日付範囲

SELECT MIN(created_at), MAX(created_at) FROM "public"."table_name";

出力形式

探索後、構造化された概要を提示します。

  • テーブル: 行数付きのリスト
  • キーとなる関係: テーブル間の接続方法
  • データ品質フラグ: Null 率の高い列
  • 推奨される次のクエリ: ユーザーが次に知りたいこと
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Data Exploration — DBX Studio

Exploration Workflow

Phase 1: Schema Discovery

Start with read_schema to list all tables, then describe_table for each table of interest.

1. read_schema(schema_name: "public")
2. describe_table(table_name: "<each table>")
3. get_table_stats(table_name: "<table>")

Phase 2: Table Profiling

For each table, gather:

  • Row count
  • Column names and types
  • Sample data via get_table_data
  • Null counts and distributions

Phase 3: Relationship Discovery

Look for foreign key patterns:

  • Columns named *_id linking to other tables
  • Common join patterns: users.id → orders.user_id

Quality Scoring

Score Completeness
Green > 95% populated
Yellow 80–95% populated
Orange 50–80% populated
Red < 50% populated

Common Exploration Queries

Row count

SELECT COUNT(*) AS row_count FROM "public"."table_name";

Column null rates

SELECT
  COUNT(*) AS total,
  COUNT(column_name) AS non_null,
  ROUND(100.0 * COUNT(column_name) / COUNT(*), 2) AS pct_filled
FROM "public"."table_name";

Distinct values

SELECT column_name, COUNT(*) AS frequency
FROM "public"."table_name"
GROUP BY 1
ORDER BY 2 DESC
LIMIT 20;

Date range

SELECT MIN(created_at), MAX(created_at) FROM "public"."table_name";

Output Format

After exploration, present a structured summary:

  • Tables: list with row counts
  • Key relationships: how tables connect
  • Data quality flags: any columns with high null rates
  • Suggested next queries: what the user might want to know next