minimax-music-gen
ユーザーが音楽、歌、オーディオトラックの生成を希望する場合に、歌詞の作成や既存の歌詞を歌にしたり、雰囲気やシーンに合わせたBGMを作成したりする際に活用できるSkill。
📜 元の英語説明(参考)
Use when user wants to generate music, songs, or audio tracks. Triggers on any request involving music creation, song writing, lyrics generation, audio production, or covers. Also triggers when user provides lyrics and wants them turned into a song, or describes a mood/scene and wants background music. Supports multilingual triggers — match equivalent phrases in any language. Do NOT use for music playback of existing files, music theory questions, or music recommendation without generation.
🇯🇵 日本人クリエイター向け解説
ユーザーが音楽、歌、オーディオトラックの生成を希望する場合に、歌詞の作成や既存の歌詞を歌にしたり、雰囲気やシーンに合わせたBGMを作成したりする際に活用できるSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o minimax-music-gen.zip https://jpskill.com/download/19700.zip && unzip -o minimax-music-gen.zip && rm minimax-music-gen.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/19700.zip -OutFile "$d\minimax-music-gen.zip"; Expand-Archive "$d\minimax-music-gen.zip" -DestinationPath $d -Force; ri "$d\minimax-music-gen.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
minimax-music-gen.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
minimax-music-genフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 2
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
[Skill 名] minimax-music-gen
MiniMax 楽曲生成スキル
MiniMax Music API を使用して楽曲(ボーカルまたはインストゥルメンタル)を生成します。2つの作成モードをサポートしています。ベーシック(一文入力、楽曲出力)と高度な制御(歌詞の編集、プロンプトの調整、生成前の計画)です。
前提条件
-
mmx CLI (必須): 楽曲生成には
mmxコマンドラインツールを使用します。インストールされているか確認:
command -v mmx && mmx --version || echo "mmx not found"インストール (Node.js が必要):
npm install -g mmx-cli認証 (初回のみ):
mmx auth login --api-key <your-minimax-api-key>API キーは MiniMax Platform から取得できます。 認証情報は
~/.mmx/credentials.jsonに保存され、セッション間で保持されます。確認:
mmx quota show -
オーディオプレイヤー (推奨): ローカル再生には
mpv、ffplay、またはafplay(macOS 内蔵) を使用します。インタラクティブな制御が可能なmpvが推奨されます。
CLI ツール
このスキルは、すべての楽曲生成に mmx CLI を使用します。
-
楽曲生成:
mmx music generate— モデル:music-2.6-free- プロンプトから歌詞を自動生成する
--lyrics-optimizerをサポートしています。 - インストゥルメンタル曲には
--instrumentalをサポートしています。 - ユーザー提供の歌詞には
--lyricsをサポートしています。 - 構造化されたパラメーター:
--genre、--mood、--vocals、--instruments、--bpm、--key、--tempo、--structure、--references
- プロンプトから歌詞を自動生成する
-
カバー:
mmx music cover— モデル:music-cover-free--audio-file <path>または--audio <url>を介して参照オーディオを受け取ります。--promptはターゲットのカバー スタイルを記述します。
エージェントフラグ: エージェントから mmx を呼び出す際は、常に --quiet --non-interactive を追加してください。
パイプライン:
- ボーカル:
ユーザー記述 -> mmx music generate --lyrics-optimizer -> MP3 - インストゥルメンタル:
ユーザー記述 -> mmx music generate --instrumental -> MP3 - カバー:
ソースオーディオ + スタイル -> mmx music cover -> MP3
ストレージ
生成されたすべての楽曲は ~/Music/minimax-gen/ に保存されます。ディレクトリが存在しない場合は作成してください。ファイル名はタイムスタンプとプロンプトから派生した短いスラッグで命名されます: YYYYMMDD_HHMMSS_<slug>.mp3
言語とインタラクション
ユーザーの最初のメッセージからユーザーの言語を検出し、セッション全体を通してその言語で応答してください。これは、すべてのインタラクションテキスト、質問、確認、フィードバックプロンプトに適用されます。
ユーザー向けテキストのローカライズルール:
- プレビューラベル、フィールド名、確認、ステータスメッセージ、再生情報、フィードバックプロンプト、およびプロンプト/説明のプレビューを含む、ユーザーに表示されるすべてのテキストは、ユーザーの言語に完全に翻訳される必要があります。
- モデルに送信されるAPI プロンプトは、最高の生成品質のために常に英語で記述されるべきです。ただし、プロンプトをユーザーにプレビューする際は、生の英語のプロンプトではなく、ユーザーの言語にローカライズされた説明を表示してください。英語のプロンプトは内部的な実装の詳細であり、ユーザーがそれを見る必要はありません。
- 以下のテンプレートは参照として英語で記述されています。実行時には、すべてのラベルとメッセージをユーザーの検出された言語に翻訳してください。
歌詞の言語ルール:
- デフォルトの歌詞の言語 = ユーザーの言語です。中国語を話すユーザーには中国語の歌詞が、英語を話すユーザーには英語の歌詞が提供されます。
- ユーザーが明示的に要求した場合にのみ、異なる言語で歌詞を生成してください。
- 異なる歌詞の言語が必要な場合は、「韓国語の歌詞で」と追加するのではなく、「韓国人女性ボーカリストをフィーチャーした」のように、プロンプトのボーカルまたはジャンルの説明に自然に組み込んでください。または、言語を暗示するジャンル(例: 「K-pop」、「J-rock」、「Mandopop」、「Latin pop」)を指定してください。
ワークフロー
ステップ 0: 意図の検出
ユーザーのメッセージを解析して、以下を判断します。
- 楽曲カテゴリ: ボーカル(歌詞あり)、インストゥルメンタル(ボーカルなし)、またはカバー
- 作成モードの好み: 詳細な要件(高度な制御)を提供したか、カジュアルな一文(ベーシック)を提供したか
曖昧な場合は、この決定木を使用して質問してください。
Q1: どのような種類の音楽ですか?
- ボーカル (歌詞あり)
- インストゥルメンタル (ボーカルなし)
- カバー
Q2: 作成モードは?
- ベーシック — 一文の説明、自動生成
- 高度な制御 — 歌詞の編集、プロンプトの調整、計画
ユーザーが「悲しいピアノ曲を作って」のような明確な一文を与えた場合は、質問をスキップし、インストゥルメンタル + ベーシックモードを推測して進んでください。
ステップ 1: ベーシックモード
目標: ユーザーが短い説明を提供し、スキルがすべてを自動生成し、API を呼び出します。
-
説明をプロンプトに展開する: ユーザーの一文を取り、それを豊かな音楽プロンプトに展開します。スタイル語彙、ジャンル/楽器の参照、プロンプト構造については、このドキュメントの最後にあるプロンプト作成ガイドの付録を参照してください。 最高の生成品質のために、ユーザーの言語に関係なく、API プロンプトは常に英語で記述されるべきです。
このパターンに従ってください。
A [mood] [BPM optional] [genre] song, featuring [vocal description], about [narrative/theme], [atmosphere], [key instruments and production]. -
生成前にユーザーにプレビューを表示する。すべてのラベルとプロンプトの説明をユーザーの言語に翻訳してください。英語のプロンプトは API を呼び出す際に内部的にのみ使用され、ユーザーは決してそれを見るべきではありません。例のテンプレート(英語の参照 — 実行時にすべてをローカライズしてください):
生成しようとしています: タイプ: ボーカル / インストゥルメンタル 説明: インディーフォーク、メランコリー、アコースティックギター、優しい女性の声 歌詞: 自動生成 (--lyrics-optimizer) 確認しますか? (確認するにはエンターキーを押すか、変更点を教えてください) -
mmx を呼び出す: 音楽を直接生成します。
ステップ 2: 高度な制御モード
目標: ユーザーが生成前にすべてのパラメーターを完全に制御します。
- 歌詞フェーズ:
- ユーザーが歌詞を提供した場合: セクションマーカーでフォーマットして表示し、編集を求めます。最終的な歌詞は
--lyricsを介して mmx に渡されます。 - ユーザーが
- ユーザーが歌詞を提供した場合: セクションマーカーでフォーマットして表示し、編集を求めます。最終的な歌詞は
(原文がここで切り詰められています)
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
MiniMax Music Generation Skill
Generate songs (vocal or instrumental) using the MiniMax Music API. Supports two creation modes: Basic (one-sentence-in, song-out) and Advanced Control (edit lyrics, refine prompt, plan before generating).
Prerequisites
-
mmx CLI (required): Music generation uses the
mmxcommand-line tool.Check if installed:
command -v mmx && mmx --version || echo "mmx not found"Install (requires Node.js):
npm install -g mmx-cliAuthenticate (first time only):
mmx auth login --api-key <your-minimax-api-key>The API key can be obtained from MiniMax Platform. Credentials are saved to
~/.mmx/credentials.jsonand persist across sessions.Verify:
mmx quota show -
Audio player (recommended):
mpv,ffplay, orafplay(macOS built-in) for local playback.mpvis preferred for its interactive controls.
CLI Tool
This skill uses the mmx CLI for all music generation:
-
Music Generation:
mmx music generate— model:music-2.6-free- Supports
--lyrics-optimizerto auto-generate lyrics from prompt - Supports
--instrumentalfor instrumental tracks - Supports
--lyricsfor user-provided lyrics - Structured params:
--genre,--mood,--vocals,--instruments,--bpm,--key,--tempo,--structure,--references
- Supports
-
Cover:
mmx music cover— model:music-cover-free- Takes reference audio via
--audio-file <path>or--audio <url> --promptdescribes the target cover style
- Takes reference audio via
Agent flags: Always add --quiet --non-interactive when calling mmx from agents.
Pipeline:
- Vocal:
User description -> mmx music generate --lyrics-optimizer -> MP3 - Instrumental:
User description -> mmx music generate --instrumental -> MP3 - Cover:
Source audio + style -> mmx music cover -> MP3
Storage
All generated music is saved to ~/Music/minimax-gen/. Create the directory if it doesn't
exist. Files are named with a timestamp and a short slug derived from the prompt:
YYYYMMDD_HHMMSS_<slug>.mp3
Language & Interaction
Detect the user's language from their first message and respond in that language for the entire session. This applies to all interaction text, questions, confirmations, and feedback prompts.
User-facing text localization rule:
- ALL text shown to the user — including preview labels, field names, confirmations, status messages, playback info, feedback prompts, and the prompt/description preview — MUST be fully translated into the user's language.
- The API prompt sent to the model should always be written in English for best generation quality. However, when previewing the prompt to the user, show a localized description in the user's language instead of the raw English prompt. The English prompt is an internal implementation detail — the user does not need to see it.
- The templates below are written in English as reference. At runtime, translate every label and message into the user's detected language.
Lyrics language rule:
- Default lyrics language = the user's language. A Chinese-speaking user gets Chinese lyrics; an English-speaking user gets English lyrics.
- Only generate lyrics in a different language if the user explicitly requests it.
- When a different lyrics language is needed, embed it naturally into the vocal or genre description in the prompt. For example, instead of appending "with Korean lyrics", use "featuring a Korean female vocalist" or specify a genre that implies the language (e.g., "K-pop", "J-rock", "Mandopop", "Latin pop").
Workflow
Step 0: Detect Intent
Parse the user's message to determine:
- Song category: vocal (with lyrics), instrumental (no vocals), or cover
- Creation mode preference: did they provide detailed requirements (Advanced) or a casual one-liner (Basic)?
If ambiguous, ask using this decision tree:
Q1: What type of music?
- Vocal (with lyrics)
- Instrumental (no vocals)
- Cover
Q2: Creation mode?
- Basic — one-line description, auto-generate
- Advanced — edit lyrics, refine prompt, plan
If the user gives a clear one-liner like "make me a sad piano piece", skip the questions — infer instrumental + basic mode and proceed.
Step 1: Basic Mode
Goal: User provides a short description, the skill auto-generates everything, then calls the API.
-
Expand the description into a prompt: Take the user's one-liner and expand it into a rich music prompt. Refer to the Prompt Writing Guide appendix at the end of this document for style vocabulary, genre/instrument references, and prompt structure. The API prompt should always be written in English for best generation quality, regardless of the user's language.
Follow this pattern:
A [mood] [BPM optional] [genre] song, featuring [vocal description], about [narrative/theme], [atmosphere], [key instruments and production]. -
Show the user a preview before generating. Translate all labels AND the prompt description into the user's language. The English prompt is only used internally when calling the API — the user should never see it. Example template (English reference — localize everything at runtime):
About to generate: Type: Vocal / Instrumental Description: indie folk, melancholy, acoustic guitar, gentle female voice Lyrics: Auto-generated (--lyrics-optimizer) Confirm? (press enter to confirm, or tell me what to change) -
Call mmx: Generate the music directly.
Step 2: Advanced Control Mode
Goal: User has full control over every parameter before generation.
-
Lyrics phase:
- If user provided lyrics: display them formatted with section markers, ask for edits.
The final lyrics will be passed via
--lyricsto mmx. - If user has a theme but no lyrics: will use
--lyrics-optimizerto auto-generate. - Support iterative editing: "change the second chorus" -> only rewrite that section.
- User can also write lyrics themselves and pass via
--lyrics.
- If user provided lyrics: display them formatted with section markers, ask for edits.
The final lyrics will be passed via
-
Prompt phase:
- Generate a recommended prompt based on the lyrics' mood and content.
- Present it as editable tags the user can add/remove/modify.
- Refer to the Prompt Writing Guide appendix for the full vocabulary.
-
Advanced planning (optional, offer but don't force):
- Song structure: verse-chorus-verse-chorus-bridge-chorus or custom
- BPM suggestion (encode in prompt as tempo descriptor)
- Reference style: "something like X style" -> map to prompt tags
- Vocal character description
-
Final confirmation: Show complete parameter summary, then generate.
Step 3: Call mmx
Generate music using the mmx CLI:
Vocal with auto-generated lyrics:
mmx music generate \
--prompt "<prompt>" \
--lyrics-optimizer \
--genre "<genre>" --mood "<mood>" --vocals "<vocal style>" \
--instruments "<instruments>" --bpm <bpm> \
--out ~/Music/minimax-gen/<filename>.mp3 \
--quiet --non-interactive
Vocal with user-provided lyrics:
mmx music generate \
--prompt "<prompt>" \
--lyrics "<lyrics with section markers>" \
--genre "<genre>" --mood "<mood>" --vocals "<vocal style>" \
--out ~/Music/minimax-gen/<filename>.mp3 \
--quiet --non-interactive
Instrumental (no vocal):
mmx music generate \
--prompt "<prompt>" \
--instrumental \
--genre "<genre>" --mood "<mood>" --instruments "<instruments>" \
--out ~/Music/minimax-gen/<filename>.mp3 \
--quiet --non-interactive
Use structured flags (--genre, --mood, --vocals, --instruments, --bpm, --key,
--tempo, --structure, --references, --avoid, --use-case) to give the API
fine-grained control instead of cramming everything into --prompt.
Display a progress indicator while waiting. Typical generation takes 30-120 seconds.
Step 4: Playback
After generation, detect an available audio player and play the file.
Detect player:
command -v mpv || command -v ffplay || command -v afplay
Play based on detected player (in priority order):
| Player | Command | Controls |
|---|---|---|
mpv (preferred) |
mpv --no-video ~/Music/minimax-gen/<filename>.mp3 |
space = pause/resume, q = quit, left/right = seek |
ffplay |
ffplay -nodisp -autoexit ~/Music/minimax-gen/<filename>.mp3 |
q = quit |
afplay (macOS) |
afplay ~/Music/minimax-gen/<filename>.mp3 |
Ctrl+C = stop |
| None found | Do not attempt playback | Show file path only |
After starting playback, tell the user (localize all text):
Now playing: <filename>.mp3
Saved to: ~/Music/minimax-gen/<filename>.mp3
Do NOT show playback controls (e.g. keyboard shortcuts) — they don't work in this environment since the player runs in the background.
If no player is found (localize all text):
No audio player detected.
File saved to: ~/Music/minimax-gen/<filename>.mp3
Tip: Install mpv for the best playback experience (brew install mpv).
Step 5: Feedback & Iteration
After playback, ask for feedback:
How was this song?
1. Love it, keep it!
2. Not quite, adjust and regenerate
3. Fine-tune lyrics/style then regenerate
4. Don't want it, start over
Based on feedback:
- Satisfied: Done. Mention the file path again.
- Adjust & regenerate: Ask what to change (prompt? lyrics? style?), apply edits,
re-run generation. Keep the old file with a
_v1suffix for comparison. - Fine-tune: Enter Advanced Control Mode with the current parameters pre-filled.
- Delete & restart: Remove the file, go back to Step 0.
Cover Mode
Generate a cover version of a song based on reference audio. Model: music-cover-free.
Reference audio requirements: mp3, wav, flac — duration 6s to 6min, max 50MB. If no lyrics are provided, the original lyrics are extracted via ASR automatically.
Workflow
When the user selects Cover mode:
- Ask for the source audio — a local file path or URL
- Ask for the target cover style (e.g., "acoustic cover, stripped-down, intimate vocal")
- Optionally ask for custom lyrics or lyrics file
Commands
Cover from local file:
mmx music cover \
--prompt "<cover style description>" \
--audio-file <source.mp3> \
--out ~/Music/minimax-gen/<filename>.mp3 \
--quiet --non-interactive
Cover from URL:
mmx music cover \
--prompt "<cover style description>" \
--audio <source_url> \
--out ~/Music/minimax-gen/<filename>.mp3 \
--quiet --non-interactive
With custom lyrics (text):
mmx music cover \
--prompt "<style>" \
--audio-file <source.mp3> \
--lyrics "<custom lyrics>" \
--out ~/Music/minimax-gen/<filename>.mp3 \
--quiet --non-interactive
With custom lyrics (file):
mmx music cover \
--prompt "<style>" \
--audio-file <source.mp3> \
--lyrics-file <lyrics.txt> \
--out ~/Music/minimax-gen/<filename>.mp3 \
--quiet --non-interactive
Optional flags
| Flag | Description |
|---|---|
--seed <number> |
Random seed 0-1000000 for reproducible results |
--channel <n> |
1 (mono) or 2 (stereo, default) |
--format <fmt> |
mp3 (default), wav, pcm |
--sample-rate <hz> |
Sample rate (default: 44100) |
--bitrate <bps> |
Bitrate (default: 256000) |
After generation
Proceed with normal playback and feedback flow (Step 4 & 5).
Error Handling
| Error | Action |
|---|---|
| mmx not found | npm install -g mmx-cli |
| mmx auth error (exit code 3) | mmx auth login |
| Quota exceeded (exit code 4) | Report quota limit, suggest waiting or upgrading |
| API timeout (exit code 5) | Retry once, then report failure |
| Content filter (exit code 10) | Adjust prompt to avoid filtered content |
| Invalid lyrics format | Auto-fix section markers, warn user |
| No audio player found | Save file and tell user the path, suggest installing mpv |
| Network error | Show error detail, suggest checking connection |
Important Notes
- Never reproduce copyrighted lyrics. When doing covers, always write original lyrics inspired by the song's theme. Explain this to the user.
- Prompt language: The API prompt works best with English tags. Chinese tags are also acceptable. Mixing is OK.
- Section markers in lyrics: The API recognizes
[verse],[chorus],[bridge],[outro],[intro]. Always include them when providing--lyrics. - File management: If
~/Music/minimax-gen/has more than 50 files, suggest cleanup when starting a new session. - Structured params: Prefer using
--genre,--mood,--vocals,--instruments,--bpmetc. over embedding everything in--prompt. This gives the API better control. - Lyrics language via style: When the user wants lyrics in a specific language, express it through the vocal description or genre (e.g., "Japanese female vocalist", "Mandopop ballad") rather than appending a language directive to the prompt.
Appendix: Prompt Writing Guide
See references/prompt_guide.md for the complete prompt writing guide, including genre/vocal/instrument references and BPM tables.
同梱ファイル
※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。
- 📄 SKILL.md (14,059 bytes)
- 📎 references/prompt_guide.md (5,712 bytes)