scribe
Reference skill for Zoom AI Services Scribe. Use after routing to a transcription workflow when handling uploaded or stored media, Build-platform JWT auth, fast mode transcription, batch jobs, or transcript pipeline design.
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o scribe.zip https://jpskill.com/download/22703.zip && unzip -o scribe.zip && rm scribe.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/22703.zip -OutFile "$d\scribe.zip"; Expand-Archive "$d\scribe.zip" -DestinationPath $d -Force; ri "$d\scribe.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
scribe.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
scribeフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 5
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[Skill 名] scribe
Zoom AI Services Scribe
Zoom AI Services Scribeに関する背景情報です。
- 同期的な単一ファイル転写 (
POST /aiservices/scribe/transcribe) - 非同期バッチジョブ (
/aiservices/scribe/jobs*) - 短いファイルの繰り返しアップロードによるブラウザマイクの疑似ストリーミング
- Webhook駆動のバッチステータス更新
- Build-platform JWT生成と認証情報処理
公式ドキュメント:
- https://developers.zoom.us/docs/ai-services/
- https://developers.zoom.us/docs/ai-services/scribe/
- https://developers.zoom.us/docs/api/ai-services/
- https://developers.zoom.us/api-hub/ai-services/methods/endpoints.json
- クイックスタートサンプル: https://github.com/zoom/scribe-quickstart/
ルーティングのガードレール
- ユーザーがアップロードまたは保存されたメディアをテキストに転写する必要がある場合は、まずここにルーティングしてください。
- ユーザーがファイルベースのアップロード/バッチジョブなしでライブミーティングメディアを必要とする場合は、../rtms/SKILL.mdにルーティングしてください。
- ユーザーがAI ServicesパスのZoom REST APIインベントリを必要とする場合は、../rest-api/SKILL.mdをチェーンしてください。
- ユーザーがWebhook署名パターンまたは一般的なHMACレシーバーの強化を必要とする場合は、オプションで../webhooks/SKILL.mdをチェーンしてください。
クイックリンク
- concepts/auth-and-processing-modes.md
- scenarios/high-level-scenarios.md
- examples/fast-mode-node.md
- examples/batch-webhook-pipeline.md
- references/api-reference.md
- references/environment-variables.md
- references/samples-validation.md
- references/versioning-and-drift.md
- troubleshooting/common-drift-and-breaks.md
- RUNBOOK.md
コアワークフロー
- Build-platformの認証情報を取得し、HS256 JWTを生成します。
- 短いファイル1つにはfast modeを、保存されたアーカイブ/大規模なセットにはbatch modeを選択します。
- 転写リクエストを送信します。
- バッチジョブの場合、ジョブ/ファイルのステータスをポーリングするか、Webhook通知を受信します。
- 転写JSONを永続化し、後処理します。
ホスト型Fast-Modeのガードレール
- 正式なfast-mode APIの制限は
100 MBと2時間ですが、ホストされたブラウザフローでは、アップストリームの応答が返る前にタイムアウトする可能性があります。 - 現在デプロイされているサンプルの観測結果:
- 約17.2 MBのMP4が約
26秒で完了しました。 - 約38.6 MBのMP4が約
26-37秒で完了しました。 - 約59.2 MBのMP4がバックエンドで約
32-34秒で完了しました。 - 一部の約59.2 MBのブラウザリクエストは、バックエンドログで後で
200と表示されたにもかかわらず、フロントエンドで504として表示されました。
- 約17.2 MBのMP4が約
- フロントエンドの
504とバックエンドの200は、自動的な転写失敗ではなく、ブラウザ/エッジのタイムアウト競合として扱ってください。 - ホストされたUIの場合、完全なアップストリーム応答のためにブラウザを開いたままにするのではなく、fast modeの非同期リクエスト/ポーリングラッパーを推奨します。
- より大きい、または予測不能なメディアの場合、ファイルが正式なfast-modeのサイズ制限内であっても、batch modeを推奨します。
ブラウザマイクパターン
scribeは、文書化されたリアルタイムストリーミングAPIサーフェスを公開していません。- ブラウザマイク体験が必要な場合は、疑似ストリーミングを使用してください。
- マイクオーディオを短いチャンクでキャプチャします。
- 各チャンクを非同期fast-modeラッパーを介してアップロードします。
- 完了をポーリングします。
- チャンクの転写を順番に付加します。
- 推奨される開始ケイデンス:
- チャンクサイズ:
5秒 - 許容範囲:
5-10秒 - 処理中のチャンクリクエスト:
2-3
- チャンクサイズ:
- これは、増分転写更新のための実用的なUIパターンであり、
rtmsの代替ではありません。 - これはフォールバックのデモパターンとして扱い、推奨される本番アーキテクチャではありません。
- 繰り返しアップロードのオーバーヘッド、チャンク境界のずれ、ブラウザのコーデック/コンテナの変動、および転写の結合の複雑さが増します。
- ユーザーが実際のライブストリーム取り込み、低遅延の連続メディア、またはサーバープッシュメディア転送を要求する場合は、代わりに../rtms/SKILL.mdにルーティングしてください。
エンドポイントサーフェス
| モード | メソッド | パス | 用途 |
|---|---|---|---|
| Fast | POST |
/aiservices/scribe/transcribe |
1つのファイルの同期転写 |
| Batch | POST |
/aiservices/scribe/jobs |
非同期バッチジョブの送信 |
| Batch | GET |
/aiservices/scribe/jobs |
ジョブのリスト表示 |
| Batch | GET |
/aiservices/scribe/jobs/{jobId} |
ジョブの概要/状態の確認 |
| Batch | DELETE |
/aiservices/scribe/jobs/{jobId} |
キューに入っている/処理中のジョブのキャンセル |
| Batch | GET |
/aiservices/scribe/jobs/{jobId}/files |
ファイルごとの結果の確認 |
高レベルのシナリオ
- ユーザーが1つの録音をアップロードした後のオンデマンドクリップ転写。
- 保存されたS3通話アーカイブのバッチ転写。
- 転写をデータベース/検索インデックスに書き込むWebhook駆動のETLパイプライン。
- Zoom管理の録音を独自のストレージにエクスポートした後の再転写。
- タイムスタンプ、チャンネル分離、話者ヒントが必要なオフラインのコンプライアンスまたはQAワークフロー。
チェーン
- 保存されたZoom録音 -> ../rest-api/SKILL.md +
scribe - Webhook検証の強化 -> ../webhooks/SKILL.md
- リアルタイムライブ転写/メディア -> ../rtms/SKILL.md
- クロスプロダクトルーティング -> ../general/SKILL.md
オペレーション
- RUNBOOK.md - 5分間の事前確認とデバッグチェックリストです。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Zoom AI Services Scribe
Background reference for Zoom AI Services Scribe across:
- synchronous single-file transcription (
POST /aiservices/scribe/transcribe) - asynchronous batch jobs (
/aiservices/scribe/jobs*) - browser microphone pseudo-streaming via repeated short file uploads
- webhook-driven batch status updates
- Build-platform JWT generation and credential handling
Official docs:
- https://developers.zoom.us/docs/ai-services/
- https://developers.zoom.us/docs/ai-services/scribe/
- https://developers.zoom.us/docs/api/ai-services/
- https://developers.zoom.us/api-hub/ai-services/methods/endpoints.json
- Quickstart sample: https://github.com/zoom/scribe-quickstart/
Routing Guardrail
- If the user needs uploaded or stored media transcribed into text, route here first.
- If the user needs live meeting media without file-based upload/batch jobs, route to ../rtms/SKILL.md.
- If the user needs Zoom REST API inventory for AI Services paths, chain ../rest-api/SKILL.md.
- If the user needs webhook signature patterns or generic HMAC receiver hardening, optionally chain ../webhooks/SKILL.md.
Quick Links
- concepts/auth-and-processing-modes.md
- scenarios/high-level-scenarios.md
- examples/fast-mode-node.md
- examples/batch-webhook-pipeline.md
- references/api-reference.md
- references/environment-variables.md
- references/samples-validation.md
- references/versioning-and-drift.md
- troubleshooting/common-drift-and-breaks.md
- RUNBOOK.md
Core Workflow
- Get Build-platform credentials and generate an HS256 JWT.
- Choose fast mode for one short file or batch mode for stored archives / large sets.
- Submit the transcription request.
- For batch jobs, poll job/file status or receive webhook notifications.
- Persist and post-process transcript JSON.
Hosted Fast-Mode Guardrail
- The formal fast-mode API limits are
100 MBand2 hours, but hosted browser flows can still time out before the upstream response returns. - Current deployed-sample observations:
- ~17.2 MB MP4 completed in about
26s - ~38.6 MB MP4 completed in about
26-37s - ~59.2 MB MP4 completed in about
32-34son the backend - some ~59.2 MB browser requests still surfaced as frontend
504while backend logs later showed200
- ~17.2 MB MP4 completed in about
- Treat frontend
504plus backend200as a browser/edge timeout race, not an automatic transcription failure. - For hosted UIs, prefer an async request/polling wrapper for fast mode instead of holding the browser open for the full upstream response.
- For larger or less predictable media, prefer batch mode even when the file is still within the formal fast-mode size limit.
Browser Microphone Pattern
scribedoes not expose a documented real-time streaming API surface.- If you want a browser microphone experience, use pseudo-streaming:
- capture microphone audio in short chunks
- upload each chunk through the async fast-mode wrapper
- poll for completion
- append chunk transcripts in sequence
- Recommended starting cadence:
- chunk size:
5 seconds - acceptable range:
5-10 seconds - in-flight chunk requests:
2-3
- chunk size:
- This is a practical UI pattern for incremental transcript updates, not a substitute for
rtms. - Treat this as a fallback demo pattern, not the preferred production architecture.
- It adds repeated upload overhead, chunk-boundary drift, browser codec/container variability, and transcript stitching complexity.
- If the user asks for actual live stream ingestion, low-latency continuous media, or server-push media transport, route to ../rtms/SKILL.md instead.
Endpoint Surface
| Mode | Method | Path | Use |
|---|---|---|---|
| Fast | POST |
/aiservices/scribe/transcribe |
Synchronous transcription for one file |
| Batch | POST |
/aiservices/scribe/jobs |
Submit asynchronous batch job |
| Batch | GET |
/aiservices/scribe/jobs |
List jobs |
| Batch | GET |
/aiservices/scribe/jobs/{jobId} |
Inspect job summary/state |
| Batch | DELETE |
/aiservices/scribe/jobs/{jobId} |
Cancel queued/processing job |
| Batch | GET |
/aiservices/scribe/jobs/{jobId}/files |
Inspect per-file results |
High-Level Scenarios
- On-demand clip transcription after a user uploads one recording.
- Batch transcription of stored S3 call archives.
- Webhook-driven ETL pipeline that writes transcripts to your database/search index.
- Re-transcription of Zoom-managed recordings after exporting them to your own storage.
- Offline compliance or QA workflows that need timestamps, channel separation, and speaker hints.
Chaining
- Stored Zoom recordings -> ../rest-api/SKILL.md +
scribe - Webhook verification hardening -> ../webhooks/SKILL.md
- Real-time live transcript/media -> ../rtms/SKILL.md
- Cross-product routing -> ../general/SKILL.md
Operations
- RUNBOOK.md - 5-minute preflight and debugging checklist.
同梱ファイル
※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。
- 📄 SKILL.md (5,940 bytes)
- 📎 references/api-reference.md (2,688 bytes)
- 📎 references/environment-variables.md (1,577 bytes)
- 📎 references/samples-validation.md (2,073 bytes)
- 📎 references/versioning-and-drift.md (2,084 bytes)