jpskill.com
✍️ ライティング コミュニティ

acestep-songwriting

ACE-Stepで楽曲を生成する前に、キャプションや歌詞の作成、BPM/キー/尺の選択、構成の構築など、プロの知識を活用して楽曲制作を支援するSkill。

📜 元の英語説明(参考)

Music songwriting guide for ACE-Step. Provides professional knowledge on writing captions, lyrics, choosing BPM/key/duration, and structuring songs. Use this skill when users want to create, write, or plan a song before generating it with ACE-Step.

🇯🇵 日本人クリエイター向け解説

一言でいうと

ACE-Stepで楽曲を生成する前に、キャプションや歌詞の作成、BPM/キー/尺の選択、構成の構築など、プロの知識を活用して楽曲制作を支援するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o acestep-songwriting.zip https://jpskill.com/download/9150.zip && unzip -o acestep-songwriting.zip && rm acestep-songwriting.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/9150.zip -OutFile "$d\acestep-songwriting.zip"; Expand-Archive "$d\acestep-songwriting.zip" -DestinationPath $d -Force; ri "$d\acestep-songwriting.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して acestep-songwriting.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → acestep-songwriting フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

ACE-Step ソングライティングガイド

ACE-Step のキャプション、歌詞の作成、および音楽パラメータの選択のためのプロの音楽制作知識。

出力形式

このガイドを使用した後は、acestep スキルのために次の2つのものを生成してください。

  1. キャプション (-c): スタイル/ジャンル/楽器/感情の説明
  2. 歌詞 (-l): タグ付きの完全な構造化された歌詞
  3. パラメータ: --duration--bpm--key--time-signature--language

キャプション: 最も重要な入力

キャプションは、生成される音楽に影響を与える最も重要な要素です。

単純なスタイルの単語、カンマ区切りのタグ、複雑な自然言語の説明など、複数の形式をサポートします。

一般的な次元

次元
スタイル/ジャンル pop, rock, jazz, electronic, hip-hop, R&B, folk, classical, lo-fi, synthwave
感情/雰囲気 melancholic, uplifting, energetic, dreamy, dark, nostalgic, euphoric, intimate
楽器 acoustic guitar, piano, synth pads, 808 drums, strings, brass, electric bass
音色テクスチャ warm, bright, crisp, muddy, airy, punchy, lush, raw, polished
時代のリファレンス 80s synth-pop, 90s grunge, 2010s EDM, vintage soul, modern trap
制作スタイル lo-fi, high-fidelity, live recording, studio-polished, bedroom pop
ボーカルの特徴 female vocal, male vocal, breathy, powerful, falsetto, raspy, choir
速度/リズム slow tempo, mid-tempo, fast-paced, groovy, driving, laid-back
構成のヒント building intro, catchy chorus, dramatic bridge, fade-out ending

キャプション作成の原則

  1. 具体的な方が曖昧なものより良い — "sad piano ballad with female breathy vocal" > "a sad song"
  2. 複数の次元を組み合わせる — スタイル+感情+楽器+音色は、方向性を正確に固定します
  3. リファレンスをうまく使う — "in the style of 80s synthwave" は、複雑な美学をすばやく伝えます
  4. テクスチャの単語は役立つ — warm, crisp, airy, punchy は、ミキシングと音色に影響を与えます
  5. 完璧を追求しない — キャプションは出発点であり、結果に基づいて反復します
  6. 粒度によって自由度が決まる — 詳細が少ないほど、モデルの創造性が高まります。詳細が多いほど、制御性が高まります
  7. 矛盾する単語を避ける — "classical strings" + "hardcore metal" は出力を低下させます
    • 修正: 反復による強化 — より多く必要な要素を繰り返します
    • 修正: 対立から進化へ — "Start with soft strings, middle becomes metal rock, end turns to hip-hop"
  8. BPM/キー/テンポをキャプションに入れない — 代わりに専用のパラメータを使用します

歌詞: 時間的なスクリプト

歌詞は、音楽が時間とともにどのように展開するかを制御します。それは以下を運びます。

  • 歌詞テキスト自体
  • 構造タグ ([Verse], [Chorus], [Bridge]...)
  • ボーカルスタイルのヒント ([raspy vocal], [whispered]...)
  • インストゥルメンタルセクション ([guitar solo], [drum break]...)
  • エネルギーの変化 ([building energy], [explosive drop]...)

構造タグ

カテゴリ タグ 説明
基本的な構造 [Intro] オープニング、雰囲気を確立します
[Verse] / [Verse 1] ヴァース、物語の進行
[Pre-Chorus] プリコーラス、エネルギーを構築します
[Chorus] コーラス、感情的なクライマックス
[Bridge] ブリッジ、トランジションまたは高揚
[Outro] エンディング、結論
ダイナミックなセクション [Build] エネルギーが徐々に上昇します
[Drop] エレクトロニックミュージックのエネルギー放出
[Breakdown] 楽器を減らし、スペースを作ります
インストゥルメンタル [Instrumental] 純粋なインストゥルメンタル、ボーカルなし
[Guitar Solo] ギターソロ
[Piano Interlude] ピアノのインタールード
特別 [Fade Out] フェードアウトエンディング
[Silence] 沈黙

タグの組み合わせ

より細かく制御するには - を使用しますが、簡潔に保ちます。

✅ [Chorus - anthemic]
❌ [Chorus - anthemic - stacked harmonies - high energy - powerful - epic]

複雑なスタイルの説明は、タグではなくキャプションに入れます。

キャプションと歌詞の一貫性

モデルは競合を解決するのが得意ではありません。 チェックリスト:

  • キャプションの楽器 ↔ 歌詞のインストゥルメンタルセクションタグ
  • キャプションの感情 ↔ 歌詞のエネルギータグ
  • キャプションのボーカルの説明 ↔ 歌詞のボーカルコントロールタグ

ボーカルコントロールタグ

タグ 効果
[raspy vocal] ざらざらした、テクスチャのあるボーカル
[whispered] ささやく
[falsetto] ファルセット
[powerful belting] パワフルで高音の歌唱
[spoken word] ラップ/朗読
[harmonies] 重ねられたハーモニー
[call and response] コールアンドレスポンス
[ad-lib] 即興の装飾

エネルギーと感情のタグ

タグ 効果
[high energy] 高エネルギー、情熱的
[low energy] 低エネルギー、抑制
[building energy] エネルギーの増加
[explosive] 爆発的なエネルギー
[melancholic] メランコリック
[euphoric] 陶酔感
[dreamy] 夢のような
[aggressive] 攻撃的

歌詞作成のヒント

  1. 1行あたり6〜10音節 — モデルは音節をビートに合わせます。同じ位置の行については、同様の数(±1〜2)を維持します
  2. 大文字 = より強い強度WE ARE THE CHAMPIONS! (叫び) vs walking through the streets (通常)
  3. 括弧 = バックグラウンドボーカルWe rise together (together)
  4. 母音を伸ばすFeeeling so aliiive (慎重に使用してください。効果が不安定です)
  5. 明確なセクションの分離 — セクション間の空白行

「AI風味」の歌詞を避ける

危険信号 説明
形容詞の積み重ね "neon skies, electric hearts, endless dreams" — 曖昧なイメージのフィラー
韻の混乱 意味を壊す一貫性のないパターンまたは強制的な韻
境界線の曖昧さ 歌詞の内容が構造タグを越える
息継ぎの余地がない 1回の呼吸で歌うには行が長すぎる
混ざったメタファー 水 → 火 → 飛行 — リスナーは固定できない

メタファーの規律: 1曲あたり1つのコアメタファー、その複数の側面を探求します。


音楽メタデータ

ほとんどの場合、LMに自動推論させます。 必要な場合のみ

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

ACE-Step Songwriting Guide

Professional music creation knowledge for writing captions, lyrics, and choosing music parameters for ACE-Step.

Output Format

After using this guide, produce two things for the acestep skill:

  1. Caption (-c): Style/genre/instruments/emotion description
  2. Lyrics (-l): Complete structured lyrics with tags
  3. Parameters: --duration, --bpm, --key, --time-signature, --language

Caption: The Most Important Input

Caption is the most important factor affecting generated music.

Supports multiple formats: simple style words, comma-separated tags, complex natural language descriptions.

Common Dimensions

Dimension Examples
Style/Genre pop, rock, jazz, electronic, hip-hop, R&B, folk, classical, lo-fi, synthwave
Emotion/Atmosphere melancholic, uplifting, energetic, dreamy, dark, nostalgic, euphoric, intimate
Instruments acoustic guitar, piano, synth pads, 808 drums, strings, brass, electric bass
Timbre Texture warm, bright, crisp, muddy, airy, punchy, lush, raw, polished
Era Reference 80s synth-pop, 90s grunge, 2010s EDM, vintage soul, modern trap
Production Style lo-fi, high-fidelity, live recording, studio-polished, bedroom pop
Vocal Characteristics female vocal, male vocal, breathy, powerful, falsetto, raspy, choir
Speed/Rhythm slow tempo, mid-tempo, fast-paced, groovy, driving, laid-back
Structure Hints building intro, catchy chorus, dramatic bridge, fade-out ending

Caption Writing Principles

  1. Specific beats vague — "sad piano ballad with female breathy vocal" > "a sad song"
  2. Combine multiple dimensions — style+emotion+instruments+timbre anchors direction precisely
  3. Use references well — "in the style of 80s synthwave" conveys complex aesthetic quickly
  4. Texture words are useful — warm, crisp, airy, punchy influence mixing and timbre
  5. Don't pursue perfection — Caption is a starting point, iterate based on results
  6. Granularity determines freedom — Less detail = more model creativity; more detail = more control
  7. Avoid conflicting words — "classical strings" + "hardcore metal" degrades output
    • Fix: Repetition reinforcement — Repeat the elements you want more
    • Fix: Conflict to evolution — "Start with soft strings, middle becomes metal rock, end turns to hip-hop"
  8. Don't put BPM/key/tempo in Caption — Use dedicated parameters instead

Lyrics: The Temporal Script

Lyrics controls how music unfolds over time. It carries:

  • Lyric text itself
  • Structure tags ([Verse], [Chorus], [Bridge]...)
  • Vocal style hints ([raspy vocal], [whispered]...)
  • Instrumental sections ([guitar solo], [drum break]...)
  • Energy changes ([building energy], [explosive drop]...)

Structure Tags

Category Tag Description
Basic Structure [Intro] Opening, establish atmosphere
[Verse] / [Verse 1] Verse, narrative progression
[Pre-Chorus] Pre-chorus, build energy
[Chorus] Chorus, emotional climax
[Bridge] Bridge, transition or elevation
[Outro] Ending, conclusion
Dynamic Sections [Build] Energy gradually rising
[Drop] Electronic music energy release
[Breakdown] Reduced instrumentation, space
Instrumental [Instrumental] Pure instrumental, no vocals
[Guitar Solo] Guitar solo
[Piano Interlude] Piano interlude
Special [Fade Out] Fade out ending
[Silence] Silence

Combining Tags

Use - for finer control, but keep it concise:

✅ [Chorus - anthemic]
❌ [Chorus - anthemic - stacked harmonies - high energy - powerful - epic]

Put complex style descriptions in Caption, not in tags.

Caption-Lyrics Consistency

Models are not good at resolving conflicts. Checklist:

  • Instruments in Caption ↔ Instrumental section tags in Lyrics
  • Emotion in Caption ↔ Energy tags in Lyrics
  • Vocal description in Caption ↔ Vocal control tags in Lyrics

Vocal Control Tags

Tag Effect
[raspy vocal] Raspy, textured vocals
[whispered] Whispered
[falsetto] Falsetto
[powerful belting] Powerful, high-pitched singing
[spoken word] Rap/recitation
[harmonies] Layered harmonies
[call and response] Call and response
[ad-lib] Improvised embellishments

Energy and Emotion Tags

Tag Effect
[high energy] High energy, passionate
[low energy] Low energy, restrained
[building energy] Increasing energy
[explosive] Explosive energy
[melancholic] Melancholic
[euphoric] Euphoric
[dreamy] Dreamy
[aggressive] Aggressive

Lyric Writing Tips

  1. 6-10 syllables per line — Model aligns syllables to beats; keep similar counts for lines in same position (±1-2)
  2. Uppercase = stronger intensityWE ARE THE CHAMPIONS! (shouting) vs walking through the streets (normal)
  3. Parentheses = background vocalsWe rise together (together)
  4. Extend vowelsFeeeling so aliiive (use cautiously, effects unstable)
  5. Clear section separation — Blank lines between sections

Avoiding "AI-flavored" Lyrics

Red Flag Description
Adjective stacking "neon skies, electric hearts, endless dreams" — vague imagery filler
Rhyme chaos Inconsistent patterns or forced rhymes breaking meaning
Blurred boundaries Lyric content crosses structure tags
No breathing room Lines too long to sing in one breath
Mixed metaphors Water → fire → flying — listeners can't anchor

Metaphor discipline: One core metaphor per song, explore its multiple aspects.


Music Metadata

Most of the time, let LM auto-infer. Only set manually when you have clear requirements.

Parameter Range Description
bpm 30–300 Slow 60–80, mid 90–120, fast 130–180
keyscale Key e.g. C Major, Am. Common keys (C, G, D, Am, Em) most stable
timesignature Time sig 4/4 (most common), 3/4 (waltz), 6/8 (swing)
vocal_language Language Usually auto-detected from lyrics
duration Seconds See duration calculation below

When to Set Manually

Scenario Set
Daily generation Let LM auto-infer
Clear tempo requirement bpm
Specific style (waltz) timesignature=3/4
Match other material bpm + duration
Specific key color keyscale

Duration Calculation

Estimation Method

  • Intro/Outro: 5-10 seconds each
  • Instrumental sections: 5-15 seconds each
  • Typical structures:
    • 2 verses + 2 choruses: 120-150s minimum
    • 2 verses + 2 choruses + bridge: 180-240s minimum
    • Full song with intro/outro: 210-270s (3.5-4.5 min)

BPM and Duration Relationship

  • Slower BPM (60-80): Need MORE duration for same lyrics
  • Medium BPM (100-130): Standard duration
  • Faster BPM (150-180): Can fit more lyrics, but still need breathing room

Rule of thumb: When in doubt, estimate longer. A song too short feels rushed.


Note: Lyrics tags (piano, powerful, whispered) are consistent with Caption (piano ballad, building to powerful chorus, intimate).