content-memory
PDFやWordなどの書類を、AIエージェントが記憶しやすいように、文章を細かく分割して整理するSkill。
📜 元の英語説明(参考)
Converts documents (PDF, PPTX, DOCX, etc.) to markdown and chunks them for agent memory. Use when the user wants to "add to memory", "convert and chunk", "ingest for agent", or "refresh memory".
🇯🇵 日本人クリエイター向け解説
PDFやWordなどの書類を、AIエージェントが記憶しやすいように、文章を細かく分割して整理するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o content-memory.zip https://jpskill.com/download/10395.zip && unzip -o content-memory.zip && rm content-memory.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/10395.zip -OutFile "$d\content-memory.zip"; Expand-Archive "$d\content-memory.zip" -DestinationPath $d -Force; ri "$d\content-memory.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
content-memory.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
content-memoryフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
コンテンツメモリパイプライン
ソースドキュメントを Markdown に変換し(その場で行います)、エージェントのメモリ用にチャンク化します。コンテンツは memory/ または workspace/ に存在します。チャンクは直接 memory/<domain>/<topic>/ に入ります。
アーキテクチャ
- memory/ (プロジェクトルート): コンテンツとチャンク。
converted/やchunked/のサブフォルダはありません。チャンクは直接トピックフォルダに入ります。Markdown は<folder>/markdown/にあります。 - workspace/ (オプション): sync_and_chunk のためのソースコンテンツ。メモリにコピーされます。
- Markdown に変換/: PDF/DOCX → .md は、各フォルダの
<folder>/markdown/に書き込まれます。 - チャンク:
source/<domain>/またはmemory/<domain>/から読み込み、memory/<domain>/<topic>/に書き込みます。
起動するタイミング
- 「メモリにコンテンツを追加」、「メモリを更新」、「エージェント用にインジェスト」
- 「ワークスペースをメモリに同期」、「変換とチャンク」
ステップ 1: Markdown に変換
.md ファイル以外のファイルを、フォルダごとに markdown/ サブフォルダ内の Markdown に変換します。
python scripts/convert_to_markdown.py --source <path> [--memory <domain>]
python scripts/convert_to_markdown.py --from source/CBE/domain_journeys_approach
<folder>/markdown/に.mdを書き込みます (例:CB Domain/foo.pdf→CB Domain/markdown/foo.md).mdファイルはスキップされます
ステップ 2: メモリにチャンク
Markdown をチャンク化し、メモリトピックフォルダに直接書き込みます。
python scripts/chunk_markdown.py --memory <domain> [--incremental]
- 読み込み元:
source/<domain>/**/*.mdまたはmemory/<domain>/**/*.md。 - 書き込み先:
memory/<domain>/<topic>/(chunked/サブフォルダはありません) --incremental: 新規または変更されたファイルのみをチャンク化します
ステップ 3: ワークスペースの同期 (変換 + コピー + チャンク)
ワークスペースコンテンツ用の 1 つのコマンド:
python scripts/sync_and_chunk.py --workspace <topic> --memory <domain> [--incremental]
- .md 以外のファイルを
<folder>/markdown/に変換します (ワークスペース内) workspace/<topic>→memory/<domain>/<topic>をコピーしますmemory/<domain>/<topic>/にチャンク化します
チャンク化戦略
- スライドデッキ (
<!-- Slide number: N -->): スライドごとに 1 つのチャンク - その他のドキュメント (>200 行):
#または##の境界で分割 - 小さなファイル (<200 行): 単一のチャンク
各チャンクには以下が含まれます: <!-- Source: path | file://url -->
主要な動作
- メモリ内のコンテンツ – コンテンツを
memory/<domain>/<topic>/に配置するか、ワークスペースから同期します。 - Markdown に変換/ – Markdown は、各フォルダの
<folder>/markdown/に書き込まれます。 - メモリ内のチャンク –
chunked/サブフォルダはありません。チャンクは直接memory/<domain>/<topic>/に入ります。 - インクリメンタル – 変更されていないファイルをスキップするには、
--incrementalを使用します。
プロジェクト固有のトランスフォーマー
| 場所 | スコープ |
|---|---|
memory/<name>/transformers/ |
メモリ固有 |
.content-memory/transformers/ |
ワークスペースレベル |
各 .py は EXTENSIONS と convert(path: Path) -> str をエクスポートします。
スクリプト
| スクリプト | 目的 |
|---|---|
convert_to_markdown.py |
markdown/ に変換 |
chunk_markdown.py |
メモリにチャンク |
sync_and_chunk.py |
変換 + コピー + チャンク (ワークスペース) |
ワークスペースのルートから実行します。 必要に応じて CONTENT_MEMORY_ROOT を設定します。
トラブルシューティング
| 問題 | 解決策 |
|---|---|
| Markdown がない | 変換を実行してから、チャンクを実行します。または、最初にワークスペースをメモリに同期します。 |
| markitdown がない | pip install "markitdown[all]" |
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Content Memory Pipeline
Convert source documents to markdown (in place) and chunk them for agent memory. Content lives in memory/ or workspace/. Chunks go directly into memory/<domain>/<topic>/.
Architecture
- memory/ (project root): Content and chunks. No
converted/orchunked/subfolders—chunks go directly in topic folders. Markdown in<folder>/markdown/. - workspace/ (optional): Source content for sync_and_chunk; copied to memory.
- Convert to markdown/: PDF/DOCX → .md written in
<folder>/markdown/for each folder. - Chunk: Reads from
source/<domain>/ormemory/<domain>/, writes tomemory/<domain>/<topic>/.
When to Activate
- "Add content to memory", "refresh memory", "ingest for agent"
- "Sync workspace to memory", "convert and chunk"
Step 1: Convert to Markdown
Convert non-.md files to markdown in a markdown/ subfolder per folder:
python scripts/convert_to_markdown.py --source <path> [--memory <domain>]
python scripts/convert_to_markdown.py --from source/CBE/domain_journeys_approach
- Writes
.mdin<folder>/markdown/(e.g.CB Domain/foo.pdf→CB Domain/markdown/foo.md) .mdfiles are skipped
Step 2: Chunk to Memory
Chunk markdown and write directly into memory topic folders:
python scripts/chunk_markdown.py --memory <domain> [--incremental]
- Reads from:
source/<domain>/**/*.mdormemory/<domain>/**/*.md. - Writes to:
memory/<domain>/<topic>/(nochunked/subfolder) --incremental: Only chunk new or modified files
Step 3: Sync Workspace (Convert + Copy + Chunk)
One command for workspace content:
python scripts/sync_and_chunk.py --workspace <topic> --memory <domain> [--incremental]
- Converts non-.md to
<folder>/markdown/(in workspace) - Copies
workspace/<topic>→memory/<domain>/<topic> - Chunks to
memory/<domain>/<topic>/
Chunking Strategy
- Slide decks (
<!-- Slide number: N -->): One chunk per slide - Other docs (>200 lines): Split at
#or##boundaries - Small files (<200 lines): Single chunk
Each chunk includes: <!-- Source: path | file://url -->
Key Behaviors
- Content in memory – Put content in
memory/<domain>/<topic>/or sync from workspace. - Convert to markdown/ – Markdown written in
<folder>/markdown/for each folder. - Chunks in memory – No
chunked/subfolder; chunks go directly inmemory/<domain>/<topic>/. - Incremental – Use
--incrementalto skip unchanged files.
Project-Specific Transformers
| Location | Scope |
|---|---|
memory/<name>/transformers/ |
Memory-specific |
.content-memory/transformers/ |
Workspace-level |
Each .py exports EXTENSIONS and convert(path: Path) -> str.
Scripts
| Script | Purpose |
|---|---|
convert_to_markdown.py |
Convert to markdown/ |
chunk_markdown.py |
Chunk to memory |
sync_and_chunk.py |
Convert + copy + chunk (workspace) |
Run from workspace root. Set CONTENT_MEMORY_ROOT if needed.
Troubleshooting
| Issue | Fix |
|---|---|
| No markdown | Run convert; then chunk. Or sync workspace to memory first. |
| Missing markitdown | pip install "markitdown[all]" |