agentic-browser
Browser automation for AI agents via inference.sh. Navigate web pages, interact with elements using @e refs, take screenshots. Capabilities: web scraping, form filling, clicking, typing, JavaScript execution. Use for: web automation, data extraction, testing, agent browsing, research. Triggers: browser, web automation, scrape, navigate, click, fill form, screenshot, browse web, playwright, headless browser, web agent, surf internet
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o agentic-browser.zip https://jpskill.com/download/19318.zip && unzip -o agentic-browser.zip && rm agentic-browser.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/19318.zip -OutFile "$d\agentic-browser.zip"; Expand-Archive "$d\agentic-browser.zip" -DestinationPath $d -Force; ri "$d\agentic-browser.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
agentic-browser.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
agentic-browserフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[Skill 名] agentic-browser
Agentic Browser
inference.sh を介した AI エージェントのためのブラウザ自動化です。
クイックスタート
curl -fsSL https://cli.inference.sh | sh && infsh login
# ページを開き、インタラクティブな要素を取得します
infsh app run agentic-browser --function open --input '{"url": "https://example.com"}' --session new
コアワークフロー
すべてのブラウザ自動化は、このパターンに従います。
- Open: URL に移動し、要素の参照を取得します。
- Snapshot: DOM の変更後に要素を再フェッチします。
- Interact:
@e参照を使用してクリック、入力などを行います。 - Re-snapshot: ナビゲーション後に新しい参照を取得します。
# セッションを開始します
RESULT=$(infsh app run agentic-browser --function open --session new --input '{
"url": "https://example.com/login"
}')
SESSION_ID=$(echo $RESULT | jq -r '.session_id')
# 要素は次のように返されます: @e1 [input] "Email", @e2 [input] "Password", @e3 [button] "Sign In"
# フォームに入力します
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "fill", "ref": "@e1", "text": "user@example.com"
}'
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "fill", "ref": "@e2", "text": "password123"
}'
# 送信をクリックします
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "click", "ref": "@e3"
}'
# 完了したら閉じます
infsh app run agentic-browser --function close --session $SESSION_ID --input '{}'
関数
open
URL に移動し、ブラウザを設定します。@e 参照を含むページスナップショットを返します。
infsh app run agentic-browser --function open --session new --input '{
"url": "https://example.com",
"width": 1280,
"height": 720,
"user_agent": "Mozilla/5.0..."
}'
戻り値:
url: 現在のページの URLtitle: ページのタイトルelements:@e参照を持つインタラクティブな要素のリストscreenshot: ページのスクリーンショット (ビジョンエージェント用)
snapshot
DOM の変更後にページの状態を再フェッチします。ナビゲーションを伴うクリックの後には常に呼び出してください。
infsh app run agentic-browser --function snapshot --session $SESSION_ID --input '{}'
interact
スナップショットからの @e 参照を使用して要素と対話します。
| Action | Description | Required Fields |
|---|---|---|
click |
要素をクリックします | ref |
fill |
テキストをクリアして入力します | ref, text |
type |
テキストを入力します (クリアなし) | text |
press |
キーを押します | text (例: "Enter") |
select |
ドロップダウンを選択します | ref, text |
hover |
要素にカーソルを合わせます | ref |
scroll |
ページをスクロールします | direction (up/down) |
back |
履歴を戻ります | - |
wait |
ミリ秒待機します | wait_ms |
# クリック
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "click", "ref": "@e5"
}'
# 入力フィールドに入力
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "fill", "ref": "@e1", "text": "hello@example.com"
}'
# Enter キーを押す
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "press", "text": "Enter"
}'
# 下にスクロール
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "scroll", "direction": "down"
}'
screenshot
ページのスクリーンショットを撮ります。
infsh app run agentic-browser --function screenshot --session $SESSION_ID --input '{
"full_page": true
}'
execute
ページで JavaScript を実行します。
infsh app run agentic-browser --function execute --session $SESSION_ID --input '{
"code": "document.title"
}'
close
ブラウザセッションを閉じます。
infsh app run agentic-browser --function close --session $SESSION_ID --input '{}'
要素の参照
要素は次のような @e 参照で返されます。
@e1 [a] "Home" href="/"
@e2 [input type="text"] placeholder="Search"
@e3 [button] "Submit"
@e4 [select] "Choose option"
重要: 参照はナビゲーション後に無効になります。以下の後には常に再スナップショットを行ってください。
- ナビゲーションを伴うリンク/ボタンのクリック
- フォームの送信
- 動的なコンテンツの読み込み
例
フォーム送信
SESSION=$(infsh app run agentic-browser --function open --session new --input '{
"url": "https://example.com/contact"
}' | jq -r '.session_id')
# 要素を取得: @e1 [input] "Name", @e2 [input] "Email", @e3 [textarea] "Message", @e4 [button] "Send"
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "fill", "ref": "@e1", "text": "John Doe"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "fill", "ref": "@e2", "text": "john@example.com"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "fill", "ref": "@e3", "text": "Hello!"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "click", "ref": "@e4"}'
# 結果を確認
infsh app run agentic-browser --function snapshot --session $SESSION --input '{}'
infsh app run agentic-browser --function close --session $SESSION --input '{}'
検索と抽出
SESSION=$(infsh app run agentic-browser --function open --session new --input '{
"url": "https://google.com"
}' | jq -r '.session_id')
# 検索ボックスに入力して送信
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "fill", "ref": "@e1", "text": "weather today"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "press", "text": "Enter"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "wait", "wait_ms": 2000}'
# 結果ページを取得
infsh app run agentic-browser --function snapshot --session $SESSION --input '{}'
infsh app run agentic-browser --function close --session $SESSION --input '{}'
JavaScript でデータを抽出
infsh app run agentic-browser --function execute --session $SESSION --input '{
"code": "Array.from(document.querySelectorAll(\"h2\")).map(h => h.textContent)"
}'
セッション
B
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Agentic Browser
Browser automation for AI agents via inference.sh.
Quick Start
curl -fsSL https://cli.inference.sh | sh && infsh login
# Open a page and get interactive elements
infsh app run agentic-browser --function open --input '{"url": "https://example.com"}' --session new
Core Workflow
Every browser automation follows this pattern:
- Open: Navigate to URL, get element refs
- Snapshot: Re-fetch elements after DOM changes
- Interact: Use
@erefs to click, fill, etc. - Re-snapshot: After navigation, get fresh refs
# Start session
RESULT=$(infsh app run agentic-browser --function open --session new --input '{
"url": "https://example.com/login"
}')
SESSION_ID=$(echo $RESULT | jq -r '.session_id')
# Elements returned like: @e1 [input] "Email", @e2 [input] "Password", @e3 [button] "Sign In"
# Fill form
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "fill", "ref": "@e1", "text": "user@example.com"
}'
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "fill", "ref": "@e2", "text": "password123"
}'
# Click submit
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "click", "ref": "@e3"
}'
# Close when done
infsh app run agentic-browser --function close --session $SESSION_ID --input '{}'
Functions
open
Navigate to URL and configure browser. Returns page snapshot with @e refs.
infsh app run agentic-browser --function open --session new --input '{
"url": "https://example.com",
"width": 1280,
"height": 720,
"user_agent": "Mozilla/5.0..."
}'
Returns:
url: Current page URLtitle: Page titleelements: List of interactive elements with@erefsscreenshot: Page screenshot (for vision agents)
snapshot
Re-fetch page state after DOM changes. Always call after clicks that navigate.
infsh app run agentic-browser --function snapshot --session $SESSION_ID --input '{}'
interact
Interact with elements using @e refs from snapshot.
| Action | Description | Required Fields |
|---|---|---|
click |
Click element | ref |
fill |
Clear and type text | ref, text |
type |
Type text (no clear) | text |
press |
Press key | text (e.g., "Enter") |
select |
Select dropdown | ref, text |
hover |
Hover over element | ref |
scroll |
Scroll page | direction (up/down) |
back |
Go back in history | - |
wait |
Wait milliseconds | wait_ms |
# Click
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "click", "ref": "@e5"
}'
# Fill input
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "fill", "ref": "@e1", "text": "hello@example.com"
}'
# Press Enter
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "press", "text": "Enter"
}'
# Scroll down
infsh app run agentic-browser --function interact --session $SESSION_ID --input '{
"action": "scroll", "direction": "down"
}'
screenshot
Take page screenshot.
infsh app run agentic-browser --function screenshot --session $SESSION_ID --input '{
"full_page": true
}'
execute
Run JavaScript on the page.
infsh app run agentic-browser --function execute --session $SESSION_ID --input '{
"code": "document.title"
}'
close
Close browser session.
infsh app run agentic-browser --function close --session $SESSION_ID --input '{}'
Element Refs
Elements are returned with @e refs like:
@e1 [a] "Home" href="/"
@e2 [input type="text"] placeholder="Search"
@e3 [button] "Submit"
@e4 [select] "Choose option"
Important: Refs are invalidated after navigation. Always re-snapshot after:
- Clicking links/buttons that navigate
- Form submissions
- Dynamic content loading
Examples
Form Submission
SESSION=$(infsh app run agentic-browser --function open --session new --input '{
"url": "https://example.com/contact"
}' | jq -r '.session_id')
# Get elements: @e1 [input] "Name", @e2 [input] "Email", @e3 [textarea] "Message", @e4 [button] "Send"
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "fill", "ref": "@e1", "text": "John Doe"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "fill", "ref": "@e2", "text": "john@example.com"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "fill", "ref": "@e3", "text": "Hello!"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "click", "ref": "@e4"}'
# Check result
infsh app run agentic-browser --function snapshot --session $SESSION --input '{}'
infsh app run agentic-browser --function close --session $SESSION --input '{}'
Search and Extract
SESSION=$(infsh app run agentic-browser --function open --session new --input '{
"url": "https://google.com"
}' | jq -r '.session_id')
# Fill search box and submit
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "fill", "ref": "@e1", "text": "weather today"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "press", "text": "Enter"}'
infsh app run agentic-browser --function interact --session $SESSION --input '{"action": "wait", "wait_ms": 2000}'
# Get results page
infsh app run agentic-browser --function snapshot --session $SESSION --input '{}'
infsh app run agentic-browser --function close --session $SESSION --input '{}'
Extract Data with JavaScript
infsh app run agentic-browser --function execute --session $SESSION --input '{
"code": "Array.from(document.querySelectorAll(\"h2\")).map(h => h.textContent)"
}'
Sessions
Browser state persists within a session. Always:
- Start with
--session newon first call - Use returned
session_idfor subsequent calls - Close session when done
Related Skills
# Web search (for research + browse)
npx skills add inference-sh/skills@web-search
# LLM models (analyze extracted content)
npx skills add inference-sh/skills@llm-models
Documentation
- inference.sh Sessions - Session management
- Multi-function Apps - How functions work