jpskill.com
📦 その他 コミュニティ

deep-live-cam

単一の画像を使ってリアルタイムで顔を入れ替えたり、高度なビデオ加工を施したりできるため、フェイススワップアプリやバーチャルトライオン機能、AI動画エフェクトの開発に活用できるSkill。

📜 元の英語説明(参考)

Real-time face swap and video deepfake using a single source image. Use when: building face-swap applications, real-time video effects, virtual try-on features, AI video effects pipelines.

🇯🇵 日本人クリエイター向け解説

一言でいうと

単一の画像を使ってリアルタイムで顔を入れ替えたり、高度なビデオ加工を施したりできるため、フェイススワップアプリやバーチャルトライオン機能、AI動画エフェクトの開発に活用できるSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o deep-live-cam.zip https://jpskill.com/download/14824.zip && unzip -o deep-live-cam.zip && rm deep-live-cam.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/14824.zip -OutFile "$d\deep-live-cam.zip"; Expand-Archive "$d\deep-live-cam.zip" -DestinationPath $d -Force; ri "$d\deep-live-cam.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して deep-live-cam.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → deep-live-cam フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

Deep-Live-Cam — リアルタイム顔交換

概要

単一のソース画像を使用して、リアルタイムの顔交換とビデオのディープフェイクを行います。Webカメラ、ビデオファイル、およびGPUアクセラレーションによるストリーミングをサポートしています。パイプラインは顔を検出し、埋め込みを抽出し、inswapper モデルを使用して顔を交換し、品質向上のために GFPGAN/CodeFormer で後処理を行います。

ソース: hacksider/Deep-Live-Cam

手順

1. インストールと設定

git clone https://github.com/hacksider/Deep-Live-Cam.git
cd Deep-Live-Cam
pip install -r requirements.txt

モデルを models/ ディレクトリにダウンロードします。

mkdir -p models
wget -O models/inswapper_128_fp16.onnx "https://huggingface.co/hacksider/deep-live-cam/resolve/main/inswapper_128_fp16.onnx"

GPUアクセラレーションの場合:

pip install onnxruntime-gpu    # NVIDIA CUDA
pip install onnxruntime-rocm   # AMD ROCm
pip install onnxruntime-coreml # Apple Silicon

2. 顔交換の実行

GUIモード (Webカメラ、リアルタイム):

python run.py

CLIモード — ビデオファイルの処理:

python run.py \
  --source path/to/source_face.jpg \
  --target path/to/target_video.mp4 \
  --output path/to/output.mp4 \
  --execution-provider cuda

CLIモード — 単一画像の処理:

python run.py \
  --source path/to/source_face.jpg \
  --target path/to/target_image.jpg \
  --output path/to/output.jpg

3. 主な機能

  • Mouth Mask — 正確なリップムーブメントのために元の口を保持: --mouth-mask
  • Face Mapping — 複数の人に異なるソース顔を適用: --face-mapping
  • Quality Enhancement — GFPGAN または CodeFormer: --enhancer gfpgan

例 1: 会議録画での顔交換

python run.py \
  --source speaker_headshot.jpg \
  --target conference_talk.mp4 \
  --output anonymized_talk.mp4 \
  --execution-provider cuda \
  --enhancer gfpgan

これは、45分間の会議録画の講演者の顔をソース顔に置き換え、GPUアクセラレーションとブロードキャスト品質の出力のための GFPGAN エンハンスメントを使用します。

例 2: Python を使用したプログラムによる顔交換

import cv2
import insightface
from insightface.app import FaceAnalysis

app = FaceAnalysis(name="buffalo_l", providers=["CUDAExecutionProvider"])
app.prepare(ctx_id=0, det_size=(640, 640))

swapper = insightface.model_zoo.get_model(
    "models/inswapper_128_fp16.onnx",
    providers=["CUDAExecutionProvider"]
)

source_img = cv2.imread("actor_headshot.jpg")
target_img = cv2.imread("movie_scene_frame.jpg")

source_faces = app.get(source_img)
target_faces = app.get(target_img)

if source_faces and target_faces:
    result = swapper.get(target_img, target_faces[0], source_faces[0], paste_back=True)
    cv2.imwrite("swapped_scene.jpg", result)

例 3: マウスマスクを使用したリアルタイムWebカメラ

python run.py --mouth-mask --execution-provider cuda

Webカメラ入力を備えたGUIを起動します。ソース顔画像を選択し、自然なリップシンクのためにマウスマスクを有効にし、RTX 3060で25〜30 FPSでライブ顔交換を開始します。

ガイドライン

  • 常に、顔を使用する人物から同意を得てください
  • 公に共有する場合は、すべての出力を AI生成/ディープフェイクとしてラベル付けしてください
  • 法的遵守 — 多くの管轄区域には、同意のないディープフェイクに対する法律があります
  • 照明が重要 — 均一な正面からの照明で最適に機能します。極端な頭の回転(> 60°)では劣化します
  • GPUを推奨 — CPUモードでも動作しますが、非常に遅いです。6GB以上のVRAMを搭載したNVIDIA RTX 3060+を推奨します
  • 結果を確認 — 強いオクルージョン(マスク、大きなサングラス)はアーティファクトを引き起こす可能性があります
  • 品質のためにバッチモードを使用 — リアルタイムでは速度のために解像度が低下します。高解像度出力の場合はオフライン処理を使用してください

参考文献

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Deep-Live-Cam — Real-Time Face Swap

Overview

Real-time face swap and video deepfake using a single source image. Supports webcam, video files, and streaming with GPU acceleration. The pipeline detects faces, extracts embeddings, swaps faces using the inswapper model, and post-processes with GFPGAN/CodeFormer for quality.

Source: hacksider/Deep-Live-Cam

Instructions

1. Install and configure

git clone https://github.com/hacksider/Deep-Live-Cam.git
cd Deep-Live-Cam
pip install -r requirements.txt

Download models into the models/ directory:

mkdir -p models
wget -O models/inswapper_128_fp16.onnx "https://huggingface.co/hacksider/deep-live-cam/resolve/main/inswapper_128_fp16.onnx"

For GPU acceleration:

pip install onnxruntime-gpu    # NVIDIA CUDA
pip install onnxruntime-rocm   # AMD ROCm
pip install onnxruntime-coreml # Apple Silicon

2. Run face swap

GUI mode (webcam, real-time):

python run.py

CLI mode — process a video file:

python run.py \
  --source path/to/source_face.jpg \
  --target path/to/target_video.mp4 \
  --output path/to/output.mp4 \
  --execution-provider cuda

CLI mode — process a single image:

python run.py \
  --source path/to/source_face.jpg \
  --target path/to/target_image.jpg \
  --output path/to/output.jpg

3. Key features

  • Mouth Mask — Retains original mouth for accurate lip movement: --mouth-mask
  • Face Mapping — Different source faces on multiple people: --face-mapping
  • Quality Enhancement — GFPGAN or CodeFormer: --enhancer gfpgan

Examples

Example 1: Swap a face in a conference recording

python run.py \
  --source speaker_headshot.jpg \
  --target conference_talk.mp4 \
  --output anonymized_talk.mp4 \
  --execution-provider cuda \
  --enhancer gfpgan

This replaces the speaker's face in a 45-minute conference recording with the source face, using GPU acceleration and GFPGAN enhancement for broadcast-quality output.

Example 2: Programmatic face swap with Python

import cv2
import insightface
from insightface.app import FaceAnalysis

app = FaceAnalysis(name="buffalo_l", providers=["CUDAExecutionProvider"])
app.prepare(ctx_id=0, det_size=(640, 640))

swapper = insightface.model_zoo.get_model(
    "models/inswapper_128_fp16.onnx",
    providers=["CUDAExecutionProvider"]
)

source_img = cv2.imread("actor_headshot.jpg")
target_img = cv2.imread("movie_scene_frame.jpg")

source_faces = app.get(source_img)
target_faces = app.get(target_img)

if source_faces and target_faces:
    result = swapper.get(target_img, target_faces[0], source_faces[0], paste_back=True)
    cv2.imwrite("swapped_scene.jpg", result)

Example 3: Real-time webcam with mouth mask

python run.py --mouth-mask --execution-provider cuda

Launches the GUI with webcam input. Select a source face image, enable mouth mask for natural lip sync, and start the live face swap at 25-30 FPS on an RTX 3060.

Guidelines

  • Always obtain consent from the person whose face you're using
  • Label all outputs as AI-generated/deepfake when sharing publicly
  • Legal compliance — Many jurisdictions have laws against non-consensual deepfakes
  • Lighting matters — Works best with even, front-facing lighting; degrades at extreme head rotations (>60°)
  • GPU recommended — CPU mode works but is very slow; NVIDIA RTX 3060+ with 6GB+ VRAM recommended
  • Verify results — Heavy occlusion (masks, large sunglasses) can cause artifacts
  • Use batch mode for quality — Real-time trades resolution for speed; use offline processing for high-res output

References