azure-speech
Azure AI Speech開発全般に関する専門知識を提供し、音声認識・合成、カスタム音声、オンプレミス環境での利用など、幅広い開発課題に対応するSkillです。
📜 元の英語説明(参考)
Expert knowledge for Azure AI Speech development including troubleshooting, best practices, decision making, limits & quotas, security, configuration, integrations & coding patterns, and deployment. Use when building STT/TTS, custom voices/avatars, batch TTS, Voice Live, or containerized/on-prem Speech, and other Azure AI Speech related development tasks. Not for Azure Communication Services (use azure-communication-services), Azure AI Bot Service (use azure-bot-service), Azure AI Video Indexer (use azure-video-indexer), Azure AI Vision (use azure-ai-vision).
🇯🇵 日本人クリエイター向け解説
Azure AI Speech開発全般に関する専門知識を提供し、音声認識・合成、カスタム音声、オンプレミス環境での利用など、幅広い開発課題に対応するSkillです。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-17
- 取得日時
- 2026-05-17
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
Azure AI Speech スキル
このスキルは、Azure AI Speech に関する専門的なガイダンスを提供します。トラブルシューティング、ベストプラクティス、意思決定、制限とクォータ、セキュリティ、構成、統合とコーディングパターン、デプロイについて説明します。ローカルのクイックリファレンスコンテンツとリモートドキュメント取得機能を組み合わせています。
このスキルの使い方
エージェントにとって重要: 以下のカテゴリインデックスを使用して、関連するセクションを見つけてください。行範囲が指定されているカテゴリ(例:
L35-L120)の場合は、指定された行でread_fileを使用してください。ファイルリンクが指定されているカテゴリ(例:[security.md](security.md))の場合は、リンクされた参照ファイルでread_fileを使用してください。
エージェントにとって重要:
metadata.generated_atが3か月以上前の場合、ユーザーにリポジトリから最新バージョンをプルするように提案してください。mcp_microsoftdocsツールが利用できない場合、ユーザーにインストールを提案してください: インストールガイド
このスキルは、ドキュメントコンテンツを取得するためにネットワークアクセスを必要とします。
- 推奨: クエリ文字列
from=learn-agent-skillを指定してmcp_microsoftdocs:microsoft_docs_fetchを使用してください。Markdown を返します。 - フォールバック: クエリ文字列
from=learn-agent-skill&accept=text/markdownを指定してfetch_webpageを使用してください。Markdown を返します。
カテゴリインデックス
| カテゴリ | 行 | 説明 |
|---|---|---|
| トラブルシューティング | L36-L45 | 一般的な Azure Speech の問題(SDK、テキスト読み上げ、Foundry、コンテナ、CRL)の診断と修正、およびサポートのためにセッション/トランスクリプション ID を取得する方法。 |
| ベストプラクティス | L46-L62 | オーディオ/ビデオの準備、カスタム音声/アバター、レイテンシとメモリのチューニング、フレーズ/キーワードの最適化、リアルタイムの Voice Live インタラクションと中断の処理に関するベストプラクティス。 |
| 意思決定 | L63-L81 | 音声機能の選択、大規模/バッチ使用の計画、モデル/デバイスの評価、可用性の確認、Speech API バージョンとサービス間の移行に関するガイド。 |
| 制限とクォータ | L82-L90 | Azure Speech のクォータ、制限、使用パターン: バッチ TTS、カスタム/プロ音声トレーニングとデプロイ、短時間オーディオ STT、およびスロットリングと容量計画のガイダンス。 |
| セキュリティ | L91-L102 | Azure AI Speech のセキュリティ構成: 認証(Entra、RBAC)、ネットワーク分離(VNet、Private Link、ソブリンクラウド)、BYOS ストレージ、暗号化/キー、音声タレントの同意管理。 |
| 構成 | L103-L132 | Azure AI Speech の動作構成: SDK/CLI 設定、オーディオ I/O、ログ記録、ストレージ、SSML、発音、バッチジョブ、カスタム音声/ボイス、アバター、Voice Live API オプション。 |
| 統合とコーディングパターン | L133-L157 | Azure Speech をアプリやエージェントと統合するためのパターンとコード: SDK/REST の使用、TTS/翻訳/アバター、コールセンターと Voice Live、OpenAI/Foundry、同意、自動化。 |
| デプロイ | L158-L169 | Azure AI Speech のデプロイとスケーリング: Docker/Kubernetes コンテナ、オンプレミス STT/TTS、カスタム音声モデル/エンドポイント、言語 ID、バッチ/長文合成ワークフロー。 |
トラブルシューティング
| トピック | URL |
|---|---|
| 一般的な Azure テキスト読み上げサービスの問題を解決する | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/faq-tts |
| サポートのために音声テキスト変換セッションおよびトランスクリプション ID を取得する | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/how-to-get-speech-session-id |
| Foundry での一般的な Azure Speech の問題を解決する | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/known-issues |
| Azure AI Speech SDK CRL 互換性の問題を解決する | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/migrate-to-sdk-1-48-2 |
| Speech サービスコンテナのデプロイをトラブルシューティングする | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/speech-container-faq |
| 一般的な Azure Speech SDK の問題をトラブルシューティングする | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/troubleshooting |
ベストプラクティス
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Azure AI Speech Skill
This skill provides expert guidance for Azure AI Speech. Covers troubleshooting, best practices, decision making, limits & quotas, security, configuration, integrations & coding patterns, and deployment. It combines local quick-reference content with remote documentation fetching capabilities.
How to Use This Skill
IMPORTANT for Agent: Use the Category Index below to locate relevant sections. For categories with line ranges (e.g.,
L35-L120), useread_filewith the specified lines. For categories with file links (e.g.,[security.md](security.md)), useread_fileon the linked reference file
IMPORTANT for Agent: If
metadata.generated_atis more than 3 months old, suggest the user pull the latest version from the repository. Ifmcp_microsoftdocstools are not available, suggest the user install it: Installation Guide
This skill requires network access to fetch documentation content:
- Preferred: Use
mcp_microsoftdocs:microsoft_docs_fetchwith query stringfrom=learn-agent-skill. Returns Markdown. - Fallback: Use
fetch_webpagewith query stringfrom=learn-agent-skill&accept=text/markdown. Returns Markdown.
Category Index
| Category | Lines | Description |
|---|---|---|
| Troubleshooting | L36-L45 | Diagnosing and fixing common Azure Speech issues (SDK, text-to-speech, Foundry, containers, CRL), plus how to capture session/transcription IDs for support. |
| Best Practices | L46-L62 | Best practices for audio/video prep, custom voice/avatars, latency and memory tuning, phrase/keyword optimization, and handling real-time Voice Live interactions and interruptions |
| Decision Making | L63-L81 | Guides for choosing speech features, planning large-scale/batch use, evaluating models/devices, checking availability, and migrating between Speech API versions and services. |
| Limits & Quotas | L82-L90 | Quotas, limits, and usage patterns for Azure Speech: batch TTS, custom/pro voice training & deployment, and short audio STT, plus throttling and capacity planning guidance. |
| Security | L91-L102 | Configuring security for Azure AI Speech: auth (Entra, RBAC), network isolation (VNet, Private Link, sovereign clouds), BYOS storage, encryption/keys, and voice talent consent management. |
| Configuration | L103-L132 | Configuring Azure AI Speech behavior: SDK/CLI settings, audio I/O, logging, storage, SSML, pronunciation, batch jobs, custom speech/voice, avatars, and Voice Live API options. |
| Integrations & Coding Patterns | L133-L157 | Patterns and code for integrating Azure Speech with apps and agents: SDK/REST usage, TTS/translation/avatars, call center and Voice Live, OpenAI/Foundry, consent, and automation. |
| Deployment | L158-L169 | Deploying and scaling Azure AI Speech: Docker/Kubernetes containers, on-prem STT/TTS, custom speech models/endpoints, language ID, and batch/long-form synthesis workflows. |
Troubleshooting
| Topic | URL |
|---|---|
| Resolve common Azure text-to-speech service issues | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/faq-tts |
| Retrieve Speech to text session and transcription IDs for support | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/how-to-get-speech-session-id |
| Resolve common Azure Speech in Foundry issues | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/known-issues |
| Resolve Azure AI Speech SDK CRL compatibility issues | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/migrate-to-sdk-1-48-2 |
| Troubleshoot Speech service container deployments | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/speech-container-faq |
| Troubleshoot common Azure Speech SDK issues | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/troubleshooting |
Best Practices
Decision Making
Limits & Quotas
| Topic | URL |
|---|---|
| Manage custom speech model and endpoint lifecycle | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/how-to-custom-speech-model-and-endpoint-lifecycle |
| Deploy professional voice models to custom endpoints | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/professional-voice-deploy-endpoint |
| Train professional voice models and understand duration | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/professional-voice-train-voice |
| Use Speech-to-text REST API for short audio | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/rest-speech-to-text-short |
| Apply Azure Speech quotas, limits, and throttling guidance | https://learn.microsoft.com/en-us/azure/ai-services/speech-service/speech-services-quotas-and-limits |