🛠️ 開発・MCP コミュニティ

core-agent-browser

rust-learner、docs-researcher、crate-researcherが利用するagent-browser CLIワークフローをサポートし、ブラウザの自動操作が明確に必要な場合にのみ使用できる内部向けの支援をするSkill。

📜 元の英語説明(参考)

Internal support skill for agent-browser CLI workflows used by rust-learner, docs-researcher, and crate-researcher. Use only when browser automation is explicitly required.

🇯🇵 日本人クリエイター向け解説

一言でいうと

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux

mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o core-agent-browser.zip https://jpskill.com/download/9250.zip && unzip -o core-agent-browser.zip && rm core-agent-browser.zip

🪟 Windows (PowerShell)

$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/9250.zip -OutFile "$d\core-agent-browser.zip"; Expand-Archive "$d\core-agent-browser.zip" -DestinationPath $d -Force; ri "$d\core-agent-browser.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)

1. 下の青いボタンを押して core-agent-browser.zip をダウンロード
2. ZIPファイルをダブルクリックで解凍 → core-agent-browser フォルダができる
3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
4. Claude Code を再起動

⬇ .zip でダウンロード(推奨) ⬇ .skill 形式(上級者用) 元のソース ↗

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
- · macOS / Linux: ~/.claude/skills/
- · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →

最終更新: 2026-05-18
取得日時: 2026-05-18
同梱ファイル: 1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

agent-browser を用いたブラウザ自動化

優先度に関する注意

Rust/crate 情報を取得する場合、以下の優先順位で使用してください。

rust-learner skill - actionbook + browser-fetcher を連携
actionbook MCP - 既知のサイトに対する事前計算されたセレクタ
agent-browser CLI - 直接的なブラウザ自動化 (最終手段)

agent-browser を直接使用するのは以下の場合のみです。

actionbook に、対象サイトに対する事前計算されたセレクタがない場合
インタラクティブなブラウザテスト/自動化が必要な場合
スクリーンショットやフォームへの入力が必要な場合

クイックスタート

agent-browser open <url>        # ページに移動
agent-browser snapshot -i       # ref 付きのインタラクティブな要素を取得
agent-browser click @e1         # ref で要素をクリック
agent-browser fill @e2 "text"   # ref で入力を埋める
agent-browser close             # ブラウザを閉じる

コアワークフロー

移動: agent-browser open <url>
スナップショット: agent-browser snapshot -i ( @e1、@e2 のような ref を持つ要素を返します)
スナップショットからの ref を使用してインタラクト
移動後または DOM の大幅な変更後に再度スナップショット

コマンド

スナップショット (ページ分析)

agent-browser snapshot        # 完全なアクセシビリティツリー
agent-browser snapshot -i     # インタラクティブな要素のみ (推奨)
agent-browser snapshot -c     # コンパクトな出力
agent-browser snapshot -d 3   # 深さを 3 に制限

インタラクション (スナップショットからの @ref を使用)

agent-browser click @e1           # クリック
agent-browser dblclick @e1        # ダブルクリック
agent-browser fill @e2 "text"     # クリアして入力
agent-browser type @e2 "text"     # クリアせずに入力
agent-browser press Enter         # キーを押す
agent-browser press Control+a     # キーの組み合わせ
agent-browser hover @e1           # ホバー
agent-browser check @e1           # チェックボックスをチェック
agent-browser uncheck @e1         # チェックボックスのチェックを外す
agent-browser select @e1 "value"  # ドロップダウンを選択
agent-browser scroll down 500     # ページをスクロール
agent-browser scrollintoview @e1  # 要素がビューに入るまでスクロール

情報の取得

agent-browser get text @e1        # 要素のテキストを取得
agent-browser get value @e1       # 入力値を取得
agent-browser get title           # ページタイトルを取得
agent-browser get url             # 現在の URL を取得

スクリーンショット

agent-browser screenshot          # スクリーンショットを stdout に出力
agent-browser screenshot path.png # ファイルに保存
agent-browser screenshot --full   # ページ全体

待機

agent-browser wait @e1                     # 要素を待機
agent-browser wait 2000                    # ミリ秒単位で待機
agent-browser wait --text "Success"        # テキストを待機
agent-browser wait --load networkidle      # ネットワークアイドルを待機

セマンティックロケータ (ref の代替)

agent-browser find role button click --name "Submit"
agent-browser find text "Sign In" click
agent-browser find label "Email" fill "user@test.com"

例: フォームの送信

agent-browser open https://example.com/form
agent-browser snapshot -i
# 出力: textbox "Email" [ref=e1], textbox "Password" [ref=e2], button "Submit" [ref=e3]

agent-browser fill @e1 "user@example.com"
agent-browser fill @e2 "password123"
agent-browser click @e3
agent-browser wait --load networkidle
agent-browser snapshot -i  # 結果を確認

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Browser Automation with agent-browser

Priority Note

For fetching Rust/crate information, use this priority order:

rust-learner skill - Orchestrates actionbook + browser-fetcher
actionbook MCP - Pre-computed selectors for known sites
agent-browser CLI - Direct browser automation (last resort)

Use agent-browser directly only when:

actionbook has no pre-computed selectors for the target site
You need interactive browser testing/automation
You need screenshots or form filling

Quick start

agent-browser open <url>        # Navigate to page
agent-browser snapshot -i       # Get interactive elements with refs
agent-browser click @e1         # Click element by ref
agent-browser fill @e2 "text"   # Fill input by ref
agent-browser close             # Close browser

Core workflow

Navigate: agent-browser open <url>
Snapshot: agent-browser snapshot -i (returns elements with refs like @e1, @e2)
Interact using refs from the snapshot
Re-snapshot after navigation or significant DOM changes

Commands

Navigation

agent-browser open <url>      # Navigate to URL
agent-browser back            # Go back
agent-browser forward         # Go forward
agent-browser reload          # Reload page
agent-browser close           # Close browser

Snapshot (page analysis)

agent-browser snapshot        # Full accessibility tree
agent-browser snapshot -i     # Interactive elements only (recommended)
agent-browser snapshot -c     # Compact output
agent-browser snapshot -d 3   # Limit depth to 3

Interactions (use @refs from snapshot)

agent-browser click @e1           # Click
agent-browser dblclick @e1        # Double-click
agent-browser fill @e2 "text"     # Clear and type
agent-browser type @e2 "text"     # Type without clearing
agent-browser press Enter         # Press key
agent-browser press Control+a     # Key combination
agent-browser hover @e1           # Hover
agent-browser check @e1           # Check checkbox
agent-browser uncheck @e1         # Uncheck checkbox
agent-browser select @e1 "value"  # Select dropdown
agent-browser scroll down 500     # Scroll page
agent-browser scrollintoview @e1  # Scroll element into view

Get information

agent-browser get text @e1        # Get element text
agent-browser get value @e1       # Get input value
agent-browser get title           # Get page title
agent-browser get url             # Get current URL

Screenshots

agent-browser screenshot          # Screenshot to stdout
agent-browser screenshot path.png # Save to file
agent-browser screenshot --full   # Full page

Wait

agent-browser wait @e1                     # Wait for element
agent-browser wait 2000                    # Wait milliseconds
agent-browser wait --text "Success"        # Wait for text
agent-browser wait --load networkidle      # Wait for network idle

Semantic locators (alternative to refs)

agent-browser find role button click --name "Submit"
agent-browser find text "Sign In" click
agent-browser find label "Email" fill "user@test.com"

Example: Form submission

agent-browser open https://example.com/form
agent-browser snapshot -i
# Output shows: textbox "Email" [ref=e1], textbox "Password" [ref=e2], button "Submit" [ref=e3]

agent-browser fill @e1 "user@example.com"
agent-browser fill @e2 "password123"
agent-browser click @e3
agent-browser wait --load networkidle
agent-browser snapshot -i  # Check result