jpskill.com
📄 ドキュメント コミュニティ

content-memory

PDFやWordなどの書類を、AIエージェントが記憶しやすいように、文章を細かく分割して整理するSkill。

📜 元の英語説明(参考)

Converts documents (PDF, PPTX, DOCX, etc.) to markdown and chunks them for agent memory. Use when the user wants to "add to memory", "convert and chunk", "ingest for agent", or "refresh memory".

🇯🇵 日本人クリエイター向け解説

一言でいうと

PDFやWordなどの書類を、AIエージェントが記憶しやすいように、文章を細かく分割して整理するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o content-memory.zip https://jpskill.com/download/10395.zip && unzip -o content-memory.zip && rm content-memory.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/10395.zip -OutFile "$d\content-memory.zip"; Expand-Archive "$d\content-memory.zip" -DestinationPath $d -Force; ri "$d\content-memory.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して content-memory.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → content-memory フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

コンテンツメモリパイプライン

ソースドキュメントを Markdown に変換し(その場で行います)、エージェントのメモリ用にチャンク化します。コンテンツは memory/ または workspace/ に存在します。チャンクは直接 memory/<domain>/<topic>/ に入ります。

アーキテクチャ

  • memory/ (プロジェクトルート): コンテンツとチャンク。converted/chunked/ のサブフォルダはありません。チャンクは直接トピックフォルダに入ります。Markdown は <folder>/markdown/ にあります。
  • workspace/ (オプション): sync_and_chunk のためのソースコンテンツ。メモリにコピーされます。
  • Markdown に変換/: PDF/DOCX → .md は、各フォルダの <folder>/markdown/ に書き込まれます。
  • チャンク: source/<domain>/ または memory/<domain>/ から読み込み、memory/<domain>/<topic>/ に書き込みます。

起動するタイミング

  • 「メモリにコンテンツを追加」、「メモリを更新」、「エージェント用にインジェスト」
  • 「ワークスペースをメモリに同期」、「変換とチャンク」

ステップ 1: Markdown に変換

.md ファイル以外のファイルを、フォルダごとに markdown/ サブフォルダ内の Markdown に変換します。

python scripts/convert_to_markdown.py --source <path> [--memory <domain>]
python scripts/convert_to_markdown.py --from source/CBE/domain_journeys_approach
  • <folder>/markdown/.md を書き込みます (例: CB Domain/foo.pdfCB Domain/markdown/foo.md)
  • .md ファイルはスキップされます

ステップ 2: メモリにチャンク

Markdown をチャンク化し、メモリトピックフォルダに直接書き込みます。

python scripts/chunk_markdown.py --memory <domain> [--incremental]
  • 読み込み元: source/<domain>/**/*.md または memory/<domain>/**/*.md
  • 書き込み先: memory/<domain>/<topic>/ (chunked/ サブフォルダはありません)
  • --incremental: 新規または変更されたファイルのみをチャンク化します

ステップ 3: ワークスペースの同期 (変換 + コピー + チャンク)

ワークスペースコンテンツ用の 1 つのコマンド:

python scripts/sync_and_chunk.py --workspace <topic> --memory <domain> [--incremental]
  1. .md 以外のファイルを <folder>/markdown/ に変換します (ワークスペース内)
  2. workspace/<topic>memory/<domain>/<topic> をコピーします
  3. memory/<domain>/<topic>/ にチャンク化します

チャンク化戦略

  • スライドデッキ (<!-- Slide number: N -->): スライドごとに 1 つのチャンク
  • その他のドキュメント (>200 行): # または ## の境界で分割
  • 小さなファイル (<200 行): 単一のチャンク

各チャンクには以下が含まれます: <!-- Source: path | file://url -->

主要な動作

  1. メモリ内のコンテンツ – コンテンツを memory/<domain>/<topic>/ に配置するか、ワークスペースから同期します。
  2. Markdown に変換/ – Markdown は、各フォルダの <folder>/markdown/ に書き込まれます。
  3. メモリ内のチャンクchunked/ サブフォルダはありません。チャンクは直接 memory/<domain>/<topic>/ に入ります。
  4. インクリメンタル – 変更されていないファイルをスキップするには、--incremental を使用します。

プロジェクト固有のトランスフォーマー

場所 スコープ
memory/<name>/transformers/ メモリ固有
.content-memory/transformers/ ワークスペースレベル

.pyEXTENSIONSconvert(path: Path) -> str をエクスポートします。

スクリプト

スクリプト 目的
convert_to_markdown.py markdown/ に変換
chunk_markdown.py メモリにチャンク
sync_and_chunk.py 変換 + コピー + チャンク (ワークスペース)

ワークスペースのルートから実行します。 必要に応じて CONTENT_MEMORY_ROOT を設定します。

トラブルシューティング

問題 解決策
Markdown がない 変換を実行してから、チャンクを実行します。または、最初にワークスペースをメモリに同期します。
markitdown がない pip install "markitdown[all]"
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Content Memory Pipeline

Convert source documents to markdown (in place) and chunk them for agent memory. Content lives in memory/ or workspace/. Chunks go directly into memory/<domain>/<topic>/.

Architecture

  • memory/ (project root): Content and chunks. No converted/ or chunked/ subfolders—chunks go directly in topic folders. Markdown in <folder>/markdown/.
  • workspace/ (optional): Source content for sync_and_chunk; copied to memory.
  • Convert to markdown/: PDF/DOCX → .md written in <folder>/markdown/ for each folder.
  • Chunk: Reads from source/<domain>/ or memory/<domain>/, writes to memory/<domain>/<topic>/.

When to Activate

  • "Add content to memory", "refresh memory", "ingest for agent"
  • "Sync workspace to memory", "convert and chunk"

Step 1: Convert to Markdown

Convert non-.md files to markdown in a markdown/ subfolder per folder:

python scripts/convert_to_markdown.py --source <path> [--memory <domain>]
python scripts/convert_to_markdown.py --from source/CBE/domain_journeys_approach
  • Writes .md in <folder>/markdown/ (e.g. CB Domain/foo.pdfCB Domain/markdown/foo.md)
  • .md files are skipped

Step 2: Chunk to Memory

Chunk markdown and write directly into memory topic folders:

python scripts/chunk_markdown.py --memory <domain> [--incremental]
  • Reads from: source/<domain>/**/*.md or memory/<domain>/**/*.md.
  • Writes to: memory/<domain>/<topic>/ (no chunked/ subfolder)
  • --incremental: Only chunk new or modified files

Step 3: Sync Workspace (Convert + Copy + Chunk)

One command for workspace content:

python scripts/sync_and_chunk.py --workspace <topic> --memory <domain> [--incremental]
  1. Converts non-.md to <folder>/markdown/ (in workspace)
  2. Copies workspace/<topic>memory/<domain>/<topic>
  3. Chunks to memory/<domain>/<topic>/

Chunking Strategy

  • Slide decks (<!-- Slide number: N -->): One chunk per slide
  • Other docs (>200 lines): Split at # or ## boundaries
  • Small files (<200 lines): Single chunk

Each chunk includes: <!-- Source: path | file://url -->

Key Behaviors

  1. Content in memory – Put content in memory/<domain>/<topic>/ or sync from workspace.
  2. Convert to markdown/ – Markdown written in <folder>/markdown/ for each folder.
  3. Chunks in memory – No chunked/ subfolder; chunks go directly in memory/<domain>/<topic>/.
  4. Incremental – Use --incremental to skip unchanged files.

Project-Specific Transformers

Location Scope
memory/<name>/transformers/ Memory-specific
.content-memory/transformers/ Workspace-level

Each .py exports EXTENSIONS and convert(path: Path) -> str.

Scripts

Script Purpose
convert_to_markdown.py Convert to markdown/
chunk_markdown.py Chunk to memory
sync_and_chunk.py Convert + copy + chunk (workspace)

Run from workspace root. Set CONTENT_MEMORY_ROOT if needed.

Troubleshooting

Issue Fix
No markdown Run convert; then chunk. Or sync workspace to memory first.
Missing markitdown pip install "markitdown[all]"