acestep-songwriting
ACE-Stepで楽曲を生成する前に、キャプションや歌詞の作成、BPM/キー/尺の選択、構成の構築など、プロの知識を活用して楽曲制作を支援するSkill。
📜 元の英語説明(参考)
Music songwriting guide for ACE-Step. Provides professional knowledge on writing captions, lyrics, choosing BPM/key/duration, and structuring songs. Use this skill when users want to create, write, or plan a song before generating it with ACE-Step.
🇯🇵 日本人クリエイター向け解説
ACE-Stepで楽曲を生成する前に、キャプションや歌詞の作成、BPM/キー/尺の選択、構成の構築など、プロの知識を活用して楽曲制作を支援するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o acestep-songwriting.zip https://jpskill.com/download/9150.zip && unzip -o acestep-songwriting.zip && rm acestep-songwriting.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/9150.zip -OutFile "$d\acestep-songwriting.zip"; Expand-Archive "$d\acestep-songwriting.zip" -DestinationPath $d -Force; ri "$d\acestep-songwriting.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
acestep-songwriting.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
acestep-songwritingフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
ACE-Step ソングライティングガイド
ACE-Step のキャプション、歌詞の作成、および音楽パラメータの選択のためのプロの音楽制作知識。
出力形式
このガイドを使用した後は、acestep スキルのために次の2つのものを生成してください。
- キャプション (
-c): スタイル/ジャンル/楽器/感情の説明 - 歌詞 (
-l): タグ付きの完全な構造化された歌詞 - パラメータ:
--duration、--bpm、--key、--time-signature、--language
キャプション: 最も重要な入力
キャプションは、生成される音楽に影響を与える最も重要な要素です。
単純なスタイルの単語、カンマ区切りのタグ、複雑な自然言語の説明など、複数の形式をサポートします。
一般的な次元
| 次元 | 例 |
|---|---|
| スタイル/ジャンル | pop, rock, jazz, electronic, hip-hop, R&B, folk, classical, lo-fi, synthwave |
| 感情/雰囲気 | melancholic, uplifting, energetic, dreamy, dark, nostalgic, euphoric, intimate |
| 楽器 | acoustic guitar, piano, synth pads, 808 drums, strings, brass, electric bass |
| 音色テクスチャ | warm, bright, crisp, muddy, airy, punchy, lush, raw, polished |
| 時代のリファレンス | 80s synth-pop, 90s grunge, 2010s EDM, vintage soul, modern trap |
| 制作スタイル | lo-fi, high-fidelity, live recording, studio-polished, bedroom pop |
| ボーカルの特徴 | female vocal, male vocal, breathy, powerful, falsetto, raspy, choir |
| 速度/リズム | slow tempo, mid-tempo, fast-paced, groovy, driving, laid-back |
| 構成のヒント | building intro, catchy chorus, dramatic bridge, fade-out ending |
キャプション作成の原則
- 具体的な方が曖昧なものより良い — "sad piano ballad with female breathy vocal" > "a sad song"
- 複数の次元を組み合わせる — スタイル+感情+楽器+音色は、方向性を正確に固定します
- リファレンスをうまく使う — "in the style of 80s synthwave" は、複雑な美学をすばやく伝えます
- テクスチャの単語は役立つ — warm, crisp, airy, punchy は、ミキシングと音色に影響を与えます
- 完璧を追求しない — キャプションは出発点であり、結果に基づいて反復します
- 粒度によって自由度が決まる — 詳細が少ないほど、モデルの創造性が高まります。詳細が多いほど、制御性が高まります
- 矛盾する単語を避ける — "classical strings" + "hardcore metal" は出力を低下させます
- 修正: 反復による強化 — より多く必要な要素を繰り返します
- 修正: 対立から進化へ — "Start with soft strings, middle becomes metal rock, end turns to hip-hop"
- BPM/キー/テンポをキャプションに入れない — 代わりに専用のパラメータを使用します
歌詞: 時間的なスクリプト
歌詞は、音楽が時間とともにどのように展開するかを制御します。それは以下を運びます。
- 歌詞テキスト自体
- 構造タグ ([Verse], [Chorus], [Bridge]...)
- ボーカルスタイルのヒント ([raspy vocal], [whispered]...)
- インストゥルメンタルセクション ([guitar solo], [drum break]...)
- エネルギーの変化 ([building energy], [explosive drop]...)
構造タグ
| カテゴリ | タグ | 説明 |
|---|---|---|
| 基本的な構造 | [Intro] |
オープニング、雰囲気を確立します |
[Verse] / [Verse 1] |
ヴァース、物語の進行 | |
[Pre-Chorus] |
プリコーラス、エネルギーを構築します | |
[Chorus] |
コーラス、感情的なクライマックス | |
[Bridge] |
ブリッジ、トランジションまたは高揚 | |
[Outro] |
エンディング、結論 | |
| ダイナミックなセクション | [Build] |
エネルギーが徐々に上昇します |
[Drop] |
エレクトロニックミュージックのエネルギー放出 | |
[Breakdown] |
楽器を減らし、スペースを作ります | |
| インストゥルメンタル | [Instrumental] |
純粋なインストゥルメンタル、ボーカルなし |
[Guitar Solo] |
ギターソロ | |
[Piano Interlude] |
ピアノのインタールード | |
| 特別 | [Fade Out] |
フェードアウトエンディング |
[Silence] |
沈黙 |
タグの組み合わせ
より細かく制御するには - を使用しますが、簡潔に保ちます。
✅ [Chorus - anthemic]
❌ [Chorus - anthemic - stacked harmonies - high energy - powerful - epic]
複雑なスタイルの説明は、タグではなくキャプションに入れます。
キャプションと歌詞の一貫性
モデルは競合を解決するのが得意ではありません。 チェックリスト:
- キャプションの楽器 ↔ 歌詞のインストゥルメンタルセクションタグ
- キャプションの感情 ↔ 歌詞のエネルギータグ
- キャプションのボーカルの説明 ↔ 歌詞のボーカルコントロールタグ
ボーカルコントロールタグ
| タグ | 効果 |
|---|---|
[raspy vocal] |
ざらざらした、テクスチャのあるボーカル |
[whispered] |
ささやく |
[falsetto] |
ファルセット |
[powerful belting] |
パワフルで高音の歌唱 |
[spoken word] |
ラップ/朗読 |
[harmonies] |
重ねられたハーモニー |
[call and response] |
コールアンドレスポンス |
[ad-lib] |
即興の装飾 |
エネルギーと感情のタグ
| タグ | 効果 |
|---|---|
[high energy] |
高エネルギー、情熱的 |
[low energy] |
低エネルギー、抑制 |
[building energy] |
エネルギーの増加 |
[explosive] |
爆発的なエネルギー |
[melancholic] |
メランコリック |
[euphoric] |
陶酔感 |
[dreamy] |
夢のような |
[aggressive] |
攻撃的 |
歌詞作成のヒント
- 1行あたり6〜10音節 — モデルは音節をビートに合わせます。同じ位置の行については、同様の数(±1〜2)を維持します
- 大文字 = より強い強度 —
WE ARE THE CHAMPIONS!(叫び) vswalking through the streets(通常) - 括弧 = バックグラウンドボーカル —
We rise together (together) - 母音を伸ばす —
Feeeling so aliiive(慎重に使用してください。効果が不安定です) - 明確なセクションの分離 — セクション間の空白行
「AI風味」の歌詞を避ける
| 危険信号 | 説明 |
|---|---|
| 形容詞の積み重ね | "neon skies, electric hearts, endless dreams" — 曖昧なイメージのフィラー |
| 韻の混乱 | 意味を壊す一貫性のないパターンまたは強制的な韻 |
| 境界線の曖昧さ | 歌詞の内容が構造タグを越える |
| 息継ぎの余地がない | 1回の呼吸で歌うには行が長すぎる |
| 混ざったメタファー | 水 → 火 → 飛行 — リスナーは固定できない |
メタファーの規律: 1曲あたり1つのコアメタファー、その複数の側面を探求します。
音楽メタデータ
ほとんどの場合、LMに自動推論させます。 必要な場合のみ
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
ACE-Step Songwriting Guide
Professional music creation knowledge for writing captions, lyrics, and choosing music parameters for ACE-Step.
Output Format
After using this guide, produce two things for the acestep skill:
- Caption (
-c): Style/genre/instruments/emotion description - Lyrics (
-l): Complete structured lyrics with tags - Parameters:
--duration,--bpm,--key,--time-signature,--language
Caption: The Most Important Input
Caption is the most important factor affecting generated music.
Supports multiple formats: simple style words, comma-separated tags, complex natural language descriptions.
Common Dimensions
| Dimension | Examples |
|---|---|
| Style/Genre | pop, rock, jazz, electronic, hip-hop, R&B, folk, classical, lo-fi, synthwave |
| Emotion/Atmosphere | melancholic, uplifting, energetic, dreamy, dark, nostalgic, euphoric, intimate |
| Instruments | acoustic guitar, piano, synth pads, 808 drums, strings, brass, electric bass |
| Timbre Texture | warm, bright, crisp, muddy, airy, punchy, lush, raw, polished |
| Era Reference | 80s synth-pop, 90s grunge, 2010s EDM, vintage soul, modern trap |
| Production Style | lo-fi, high-fidelity, live recording, studio-polished, bedroom pop |
| Vocal Characteristics | female vocal, male vocal, breathy, powerful, falsetto, raspy, choir |
| Speed/Rhythm | slow tempo, mid-tempo, fast-paced, groovy, driving, laid-back |
| Structure Hints | building intro, catchy chorus, dramatic bridge, fade-out ending |
Caption Writing Principles
- Specific beats vague — "sad piano ballad with female breathy vocal" > "a sad song"
- Combine multiple dimensions — style+emotion+instruments+timbre anchors direction precisely
- Use references well — "in the style of 80s synthwave" conveys complex aesthetic quickly
- Texture words are useful — warm, crisp, airy, punchy influence mixing and timbre
- Don't pursue perfection — Caption is a starting point, iterate based on results
- Granularity determines freedom — Less detail = more model creativity; more detail = more control
- Avoid conflicting words — "classical strings" + "hardcore metal" degrades output
- Fix: Repetition reinforcement — Repeat the elements you want more
- Fix: Conflict to evolution — "Start with soft strings, middle becomes metal rock, end turns to hip-hop"
- Don't put BPM/key/tempo in Caption — Use dedicated parameters instead
Lyrics: The Temporal Script
Lyrics controls how music unfolds over time. It carries:
- Lyric text itself
- Structure tags ([Verse], [Chorus], [Bridge]...)
- Vocal style hints ([raspy vocal], [whispered]...)
- Instrumental sections ([guitar solo], [drum break]...)
- Energy changes ([building energy], [explosive drop]...)
Structure Tags
| Category | Tag | Description |
|---|---|---|
| Basic Structure | [Intro] |
Opening, establish atmosphere |
[Verse] / [Verse 1] |
Verse, narrative progression | |
[Pre-Chorus] |
Pre-chorus, build energy | |
[Chorus] |
Chorus, emotional climax | |
[Bridge] |
Bridge, transition or elevation | |
[Outro] |
Ending, conclusion | |
| Dynamic Sections | [Build] |
Energy gradually rising |
[Drop] |
Electronic music energy release | |
[Breakdown] |
Reduced instrumentation, space | |
| Instrumental | [Instrumental] |
Pure instrumental, no vocals |
[Guitar Solo] |
Guitar solo | |
[Piano Interlude] |
Piano interlude | |
| Special | [Fade Out] |
Fade out ending |
[Silence] |
Silence |
Combining Tags
Use - for finer control, but keep it concise:
✅ [Chorus - anthemic]
❌ [Chorus - anthemic - stacked harmonies - high energy - powerful - epic]
Put complex style descriptions in Caption, not in tags.
Caption-Lyrics Consistency
Models are not good at resolving conflicts. Checklist:
- Instruments in Caption ↔ Instrumental section tags in Lyrics
- Emotion in Caption ↔ Energy tags in Lyrics
- Vocal description in Caption ↔ Vocal control tags in Lyrics
Vocal Control Tags
| Tag | Effect |
|---|---|
[raspy vocal] |
Raspy, textured vocals |
[whispered] |
Whispered |
[falsetto] |
Falsetto |
[powerful belting] |
Powerful, high-pitched singing |
[spoken word] |
Rap/recitation |
[harmonies] |
Layered harmonies |
[call and response] |
Call and response |
[ad-lib] |
Improvised embellishments |
Energy and Emotion Tags
| Tag | Effect |
|---|---|
[high energy] |
High energy, passionate |
[low energy] |
Low energy, restrained |
[building energy] |
Increasing energy |
[explosive] |
Explosive energy |
[melancholic] |
Melancholic |
[euphoric] |
Euphoric |
[dreamy] |
Dreamy |
[aggressive] |
Aggressive |
Lyric Writing Tips
- 6-10 syllables per line — Model aligns syllables to beats; keep similar counts for lines in same position (±1-2)
- Uppercase = stronger intensity —
WE ARE THE CHAMPIONS!(shouting) vswalking through the streets(normal) - Parentheses = background vocals —
We rise together (together) - Extend vowels —
Feeeling so aliiive(use cautiously, effects unstable) - Clear section separation — Blank lines between sections
Avoiding "AI-flavored" Lyrics
| Red Flag | Description |
|---|---|
| Adjective stacking | "neon skies, electric hearts, endless dreams" — vague imagery filler |
| Rhyme chaos | Inconsistent patterns or forced rhymes breaking meaning |
| Blurred boundaries | Lyric content crosses structure tags |
| No breathing room | Lines too long to sing in one breath |
| Mixed metaphors | Water → fire → flying — listeners can't anchor |
Metaphor discipline: One core metaphor per song, explore its multiple aspects.
Music Metadata
Most of the time, let LM auto-infer. Only set manually when you have clear requirements.
| Parameter | Range | Description |
|---|---|---|
bpm |
30–300 | Slow 60–80, mid 90–120, fast 130–180 |
keyscale |
Key | e.g. C Major, Am. Common keys (C, G, D, Am, Em) most stable |
timesignature |
Time sig | 4/4 (most common), 3/4 (waltz), 6/8 (swing) |
vocal_language |
Language | Usually auto-detected from lyrics |
duration |
Seconds | See duration calculation below |
When to Set Manually
| Scenario | Set |
|---|---|
| Daily generation | Let LM auto-infer |
| Clear tempo requirement | bpm |
| Specific style (waltz) | timesignature=3/4 |
| Match other material | bpm + duration |
| Specific key color | keyscale |
Duration Calculation
Estimation Method
- Intro/Outro: 5-10 seconds each
- Instrumental sections: 5-15 seconds each
- Typical structures:
- 2 verses + 2 choruses: 120-150s minimum
- 2 verses + 2 choruses + bridge: 180-240s minimum
- Full song with intro/outro: 210-270s (3.5-4.5 min)
BPM and Duration Relationship
- Slower BPM (60-80): Need MORE duration for same lyrics
- Medium BPM (100-130): Standard duration
- Faster BPM (150-180): Can fit more lyrics, but still need breathing room
Rule of thumb: When in doubt, estimate longer. A song too short feels rushed.
Note: Lyrics tags (piano, powerful, whispered) are consistent with Caption (piano ballad, building to powerful chorus, intimate).