jpskill.com
cat_audio_ai ユーザー投稿 🟡 少し慣れが必要 👤 開発者・チャットボット運営・ChatGPT API 統合エンジニア

🅾 OpenAI gpt-4o-mini-tts プロンプトマスター

openai-tts-prompt-master

OpenAI gpt-4o-mini-tts 用プロンプト生成Skill。instructions 欄で性格・口調・感情を自然言語で指示できる新世代TTS、商用OK、開発者フレンドリー。

⏱ コルセンナレーション収録 半日 → API で30秒
📜 元の英語説明(参考)

Generate optimized prompts for OpenAI gpt-4o-mini-tts (instructions-driven voice). Use when user mentions OpenAI TTS, gpt-4o-mini-tts, ChatGPT 音声, openai.fm, または「ChatGPT で音声合成」と頼まれたとき。

🇯🇵 日本人クリエイター向け解説

一言でいうと

OpenAI gpt-4o-mini-tts 用プロンプト生成Skill。instructions 欄で性格・口調・感情を自然言語で指示できる新世代TTS、商用OK、開発者フレンドリー。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o openai-tts-prompt-master.zip https://jpskill.com/download/7056.zip && unzip -o openai-tts-prompt-master.zip && rm openai-tts-prompt-master.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/7056.zip -OutFile "$d\openai-tts-prompt-master.zip"; Expand-Archive "$d\openai-tts-prompt-master.zip" -DestinationPath $d -Force; ri "$d\openai-tts-prompt-master.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して openai-tts-prompt-master.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → openai-tts-prompt-master フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-17
取得日時
2026-05-17
同梱ファイル
1

💬 こう話しかけるだけ — サンプルプロンプト

  • OpenAI gpt-4o-mini-tts で瞑想ガイド、coral ボイスのプロンプト
  • オープンAI TTS で子供向け絵本、fable ボイスの instructions プロンプト
  • gpt-4o-mini-tts で日本語ニュース朗読、echo ボイスプロンプト
  • OpenAI TTS でカスタマーサポート用、coral ボイス温かいトーン
  • ChatGPT 音声でホラー語り、onyx ボイス低音不気味なプロンプト

これをClaude Code に貼るだけで、このSkillが自動発動します。

📺 実際の使用例(入出力サンプル)

入力

「カスタマーサポート風の温かい音声、OpenAI TTS で」

gpt-4o-mini-tts 用に最適化された出力

Model: gpt-4o-mini-tts
Voice: coral

Instructions:
Voice: warm and welcoming Japanese customer service representative
in her early 30s.
Personality: friendly, patient, genuinely caring, slightly cheerful.
Tone: gentle and reassuring, professional but not stiff.
Pacing: clear and measured, brief natural pauses between sentences
for clarity.
Emotion: warmth and willingness to help, smile audible in the voice.
Language: Native Japanese pronunciation with crisp clarity.

Input:
お電話ありがとうございます。
本日はどのようなご用件でしょうか。
お困りの内容を詳しくお聞かせいただけますと、
最適な解決方法をご案内させていただきます。

Format: mp3

Python API:

client.audio.speech.create(
    model="gpt-4o-mini-tts",
    voice="coral",
    input="お電話ありがとうございます。...",
    instructions="Warm Japanese customer service rep, friendly and patient, clear pronunciation..."
)

または openai.fm にブラウザでアクセスして即試行可能。

📖 Claude が読む原文 SKILL.md(中身を展開)

この本文は AI(Claude)が読むための原文(英語または中国語)です。日本語訳は順次追加中。

OpenAI gpt-4o-mini-tts プロンプトマスター

OpenAI が 2025 年公開した 「instructions 欄」で音声の性格・口調・感情を自然言語で指示できる新世代TTStts-1 / tts-1-hd の後継、11 種のプリセットボイス + instructions の自由記述で個性ある声を作れる。openai.fm でブラウザから即試せる。

⚠️ 必ず守る5つのルール

  1. instructions 欄が真骨頂 — 「優しく、テンポは少しゆっくり、笑顔で話す」のように自由記述
  2. 11 種のボイス: alloy / ash / ballad / coral / echo / fable / nova / onyx / sage / shimmer / verse
  3. テキスト内に感情指示を混ぜる — 「[ささやくように] 内緒だけど...」のように
  4. 日本語対応(英語より少し控えめだが実用十分)
  5. API は非常にシンプルvoice, input, instructions, response_format のみ

出力フォーマット

Model: gpt-4o-mini-tts
Voice: [alloy / ash / ballad / coral / echo / fable / nova / onyx / sage / shimmer / verse]

Instructions:
[性格・口調・感情・テンポ・話し方を自然文で指示]

Input (text):
[読み上げ対象のテキスト]

Format: mp3 / opus / aac / flac / wav / pcm

Voice キャラ感(英語ベースだが日本語でも傾向同じ)

Voice 印象 用途
alloy ニュートラル、中性的 標準・万能
ash 落ち着いた男性 ナレーション・解説
ballad 表情豊か・歌うような男性 ストーリーテリング
coral 温かい女性 カスタマーサポート・親しみ
echo 力強い男性 ニュース・スポーツ
fable 物語的・劇場風男性 オーディオブック
nova エネルギッシュ女性 広告・PR
onyx 深い低音男性 ドキュメンタリー・重厚
sage 落ち着いた知的女性 教育・解説
shimmer 明るい女性 アシスタント・案内
verse リズミカル ポッドキャスト・対話

Instructions 欄の書き方(これが命)

自然文で詳細に指示すればするほど精度UP。Voice / Personality / Tone / Pacing / Emotion の5要素を意識:

Voice: warm and friendly elderly grandmother
Personality: kind, patient, slightly playful
Tone: gentle and reassuring
Pacing: slow and deliberate, taking small pauses between sentences
Emotion: nostalgic and loving, with occasional soft laughter in voice

または短く:

Speak like a calm meditation teacher with a soft voice, slow pace,
gentle breathing pauses, completely soothing and peaceful.

用途別 Instructions テンプレート

用途 Instructions
ニュース Professional newscaster tone, clear and authoritative, neutral pacing, no emotion, crisp pronunciation.
カスタマーサポート Warm and friendly customer service representative, patient and helpful, slightly upbeat, clear pronunciation.
子供向け絵本 Animated storyteller voice for children, expressive and playful, varied pitch, occasional gentle laughter, slow pacing.
瞑想 Calm meditation guide, very soft and slow, long pauses between sentences, completely peaceful, almost whispered.
ホラー語り Mysterious dark storyteller, slow ominous pacing, lowered voice, occasional dramatic pauses, slight rasp.
コミカル Energetic comedian voice, fast paced, frequent laughter, exaggerated reactions, playful sarcasm.

日本語のコツ

  • instructions は英語で書いても日本語入力に効く(OpenAI が翻訳的に解釈)
  • 漢字・かな読みは ChatGPT 同等の精度(時々誤読あり)
  • 数字は読み上げ方を text 側で指定すると確実
  • 「ですます調」と「だである調」で結果が変わる

API サンプル

from openai import OpenAI
client = OpenAI()

response = client.audio.speech.create(
    model="gpt-4o-mini-tts",
    voice="coral",
    input="こんにちは、本日はご来店ありがとうございます。",
    instructions="Warm and welcoming customer service voice, slightly enthusiastic, clear Japanese pronunciation."
)
response.stream_to_file("output.mp3")

強み

  • instructions の自然言語指示が革命的
  • 11 種のプリセットボイス
  • ChatGPT エコシステム統合
  • API がシンプル、開発者最強
  • 商用ライセンスが明快

弱み

  • ボイスクローン不可(プリセット 11 種のみ)
  • 月額 ChatGPT Plus 必須 or API 従量
  • 日本語イントネーションは VOICEVOX に譲ることあり
  • 細かい SSML 制御は ElevenLabs に譲る

ユーザーへの注意点(末尾に毎回付ける)

  1. ライセンス: 生成音声の商用利用OK(OpenAI ToS 準拠)
  2. openai.fm でブラウザ即試可、API は audio.speech.create
  3. 価格: $0.015 / 1M 入力テキスト + $0.015 / 1M 文字 + ~$0.020 / 分音声
  4. instructions の自然言語指示が最大の強み、5要素(Voice/Personality/Tone/Pacing/Emotion)を意識
  5. ボイスクローンが必要なら ElevenLabs、プリセットで足りるなら OpenAI TTS が爆速・安価