jpskill.com
✍️ ライティング コミュニティ

web-search-scraper-api-skill

指定されたウェブサイトから、記事やブログ、ドキュメントなどのコンテンツを自動で抽出し、Markdown形式に変換して、必要な情報を手軽に入手できるようにするSkill。

📜 元の英語説明(参考)

This skill helps users automatically extract complete Markdown content from any website via the BrowserAct Web Search Scraper API. The Agent should proactively apply this skill when users express needs like extract complete markdown from a specific website, scrape the content of an article link, get the text from a target url, convert a webpage to markdown format, fetch the main content of a blog post, extract data from a given web page, parse the html of a website into markdown, download the readable text from a news article, obtain the content of a tutorial page, extract all the markdown text from any http or https url, scrape documentation from a web link, or grab the text of a single webpage.

🇯🇵 日本人クリエイター向け解説

一言でいうと

指定されたウェブサイトから、記事やブログ、ドキュメントなどのコンテンツを自動で抽出し、Markdown形式に変換して、必要な情報を手軽に入手できるようにするSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o web-search-scraper-api-skill.zip https://jpskill.com/download/17635.zip && unzip -o web-search-scraper-api-skill.zip && rm web-search-scraper-api-skill.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/17635.zip -OutFile "$d\web-search-scraper-api-skill.zip"; Expand-Archive "$d\web-search-scraper-api-skill.zip" -DestinationPath $d -Force; ri "$d\web-search-scraper-api-skill.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して web-search-scraper-api-skill.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → web-search-scraper-api-skill フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
2

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

Web Search Scraper API Skill

📖 はじめに

この Skill は、BrowserAct Web Search Scraper API テンプレートを通じて、ユーザーにワンストップのウェブページ抽出サービスを提供します。与えられた URL から構造化された Markdown コンテンツを直接抽出できます。ターゲット URL を入力するだけで、クリーンで利用可能な Markdown データを得ることができます。

✨ 特徴

  1. ハルシネーションがなく、安定した正確なデータ抽出を保証: 事前設定されたワークフローにより、AI 生成によるハルシネーションを回避します。
  2. 人間による機械認証の問題がない: reCAPTCHA やその他の認証課題に対処する必要はありません。
  3. IP アクセス制限やジオフェンシングがない: 地域ごとの IP 制限に対処する必要はありません。
  4. よりアジャイルな実行速度: 純粋な AI 主導のブラウザ自動化ソリューションと比較して、タスクの実行が高速です。
  5. 非常に高い費用対効果: 大量の Token を消費する AI ソリューションと比較して、データ取得のコストを大幅に削減できます。

🔑 API Key のガイダンスプロセス

実行する前に、BROWSERACT_API_KEY 環境変数が設定されているか確認する必要があります。設定されていない場合は、まず他のアクションを実行せず、ユーザーに協力を求めて提供されるのを待つ必要があります。 Agent はこの時点でユーザーに通知する必要があります:

"BrowserAct API Key が設定されていないため、まず BrowserAct Console にアクセスして Key を取得してください。"

🛠️ 入力パラメータの詳細

Agent は、スクリプトを呼び出す際に、ユーザーのニーズに基づいて以下のパラメータを柔軟に設定する必要があります。

  1. target_url
    • : string
    • 説明: コンテンツを抽出するウェブサイトの URL。任意の HTTP/HTTPS URL をサポートします。
    • : https://www.browseract.com

🚀 呼び出し方法 (推奨)

Agent は、以下の独立したスクリプトを実行して、「ワンコマンドで結果を得る」ことを実現する必要があります。

# 呼び出し例
python -u ./scripts/web_search_scraper_api.py "target_url"

⏳ 実行状況の監視

タスクには自動化されたブラウザ操作が含まれるため、時間がかかる場合があります (数分)。スクリプトは実行中に タイムスタンプ付きのステータスログを継続的に出力します (例: [14:30:05] Task Status: running)。 Agent への注意:

  • スクリプトが結果を返すのを待つ間、ターミナル出力に注意を払い続けてください。
  • ターミナルが新しいステータスログを出力し続けている限り、タスクは正常に実行されています。デッドロックまたは無応答と誤って判断しないでください。
  • ステータスが長時間変わらない場合、またはスクリプトの出力が停止し、結果が返されない場合は、リトライメカニズムをトリガーできます。

📊 データ出力の説明

正常に実行されると、スクリプトは API レスポンスから直接結果を解析して出力します。結果には以下が含まれます。

  • content: ウェブページの完全な Markdown コンテンツ。

⚠️ エラー処理とリトライメカニズム

スクリプトの実行中に、エラーが発生した場合 (ネットワークの変動やタスクの失敗など)、Agent は次のロジックに従う必要があります。

  1. 出力内容の確認:

    • 出力に "Invalid authorization"含まれている 場合、API Key が無効であるか、期限切れであることを意味します。この時点で リトライしないでください。ユーザーに再確認して正しい API Key を提供するように指示する必要があります。
    • 出力に "Invalid authorization"含まれていない が、タスクの実行に失敗した場合 (たとえば、出力が Error: で始まるか、返された結果が空の場合)、Agent は 自動的にスクリプトをもう一度再実行する必要があります
  2. リトライ制限:

    • 自動リトライは 1 回 に制限されています。2 回目の試行でも失敗した場合は、リトライを停止し、特定のエラーメッセージをユーザーに報告してください。

🌟 典型的なユースケース

  1. 記事の抽出: ニュース記事のリンクの主要なコンテンツを Markdown にスクレイピングします。
  2. ブログ投稿の解析: ターゲットのブログ投稿 URL から読みやすいテキストをダウンロードします。
  3. ウェブページから Markdown へ: 与えられた任意のウェブサイト URL をクリーンな Markdown 形式に変換します。
  4. ドキュメントのスクレイピング: チュートリアルまたはドキュメントページの内容をフェッチして、オフラインで読めるようにします。
  5. コンテンツの監視: 特定のウェブページからテキストを自動的に抽出して更新します。
  6. データ処理: 任意の HTTP/HTTPS URL の HTML を解析して、そのコンテンツを構造化します。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Web Search Scraper API Skill

📖 Introduction

This skill provides users with a one-stop web page extraction service through the BrowserAct Web Search Scraper API template. It can directly extract structured markdown content from any given URL. By simply inputting the target URL, you can get clean and usable markdown data.

✨ Features

  1. No hallucinations, ensuring stable and precise data extraction: Pre-set workflows avoid AI generative hallucinations.
  2. No human-machine verification issues: No need to deal with reCAPTCHA or other verification challenges.
  3. No IP access restrictions or geofencing: No need to handle regional IP limitations.
  4. More agile execution speed: Compared to purely AI-driven browser automation solutions, task execution is faster.
  5. Extremely high cost-effectiveness: Compared to AI solutions that consume a lot of Tokens, it can significantly reduce the cost of data acquisition.

🔑 API Key Guidance Process

Before running, you must check the BROWSERACT_API_KEY environment variable. If it is not set, do not take other actions first; you should ask and wait for the user to provide it cooperatively. The Agent must inform the user at this time:

"Since you have not configured the BrowserAct API Key, please go to the BrowserAct Console first to get your Key."

🛠️ Input Parameters Details

Agent should flexibly configure the following parameters based on user needs when calling the script:

  1. target_url
    • Type: string
    • Description: The website URL to extract content from. Supports any HTTP/HTTPS URL.
    • Example: https://www.browseract.com

🚀 Invocation Method (Recommended)

Agent should execute the following independent script to achieve "one command gets the result":

# Example invocation
python -u ./scripts/web_search_scraper_api.py "target_url"

⏳ Execution Status Monitoring

Since the task involves automated browser operations, it may take a long time (several minutes). The script will continuously output status logs with timestamps (e.g., [14:30:05] Task Status: running) while running. Notice for Agent:

  • While waiting for the script to return results, please keep paying attention to the terminal output.
  • As long as the terminal is still outputting new status logs, it means the task is running normally. Do not misjudge it as a deadlock or unresponsiveness.
  • If the status remains unchanged for a long time or the script stops outputting and no result is returned, the retry mechanism can be triggered.

📊 Data Output Description

Upon successful execution, the script will directly parse and print the result from the API response. The result contains:

  • content: The complete markdown content of the webpage.

⚠️ Error Handling & Retry Mechanism

During the execution of the script, if an error occurs (such as network fluctuation or task failure), the Agent should follow this logic:

  1. Check the output content:

    • If the output contains "Invalid authorization", it means the API Key is invalid or expired. At this time, do not retry, and you should guide the user to recheck and provide the correct API Key.
    • If the output does not contain "Invalid authorization" but the task execution fails (for example, the output starts with Error: or the returned result is empty), the Agent should automatically try to re-execute the script once.
  2. Retry limit:

    • Automatic retry is limited to once. If the second attempt still fails, stop retrying and report the specific error message to the user.

🌟 Typical Use Cases

  1. Article Extraction: Scrape the main content of a news article link into markdown.
  2. Blog Post Parsing: Download the readable text from a target blog post URL.
  3. Webpage to Markdown: Convert any given website URL into clean markdown format.
  4. Documentation Scraping: Fetch the contents of a tutorial or documentation page for offline reading.
  5. Content Monitoring: Automatically extract the text from a specific webpage for updates.
  6. Data Processing: Parse the HTML of an arbitrary HTTP/HTTPS URL to structure its content.

同梱ファイル

※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。