jpskill.com
🛠️ 開発・MCP コミュニティ

foldseek

Foldseekは、タンパク質の立体構造を比較して、配列からは見つけにくい類似構造をデータベースから検索したり、構造に基づいた分類をしたり、遠い相同性を持つタンパク質を発見したりする際に役立つSkill。

📜 元の英語説明(参考)

Structure similarity search with Foldseek. Use this skill when: (1) Finding similar structures in PDB/AFDB databases, (2) Structural homology search, (3) Database queries by 3D structure, (4) Finding remote homologs not detected by sequence, (5) Clustering structures by similarity. For sequence similarity, use uniprot BLAST. For structure prediction, use chai or boltz.

🇯🇵 日本人クリエイター向け解説

一言でいうと

Foldseekは、タンパク質の立体構造を比較して、配列からは見つけにくい類似構造をデータベースから検索したり、構造に基づいた分類をしたり、遠い相同性を持つタンパク質を発見したりする際に役立つSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o foldseek.zip https://jpskill.com/download/9547.zip && unzip -o foldseek.zip && rm foldseek.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/9547.zip -OutFile "$d\foldseek.zip"; Expand-Archive "$d\foldseek.zip" -DestinationPath $d -Force; ri "$d\foldseek.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して foldseek.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → foldseek フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

Foldseek構造検索

前提条件

要件 最小 推奨
Python 3.8+ 3.10
RAM 8GB 16GB
ディスク 10GB 50GB (ローカルデータベース用)

実行方法

: Foldseek はローカルまたはウェブサーバー経由で実行できます。GPU は不要です。

オプション 1: ウェブサーバー (高速; レート制限あり、控えめに使用)

# ウェブサーバーに構造をアップロード
curl -X POST "https://search.foldseek.com/api/ticket" \
  -F "q=@query.pdb" \
  -F "database[]=afdb50" \
  -F "database[]=pdb100"

オプション 2: ローカルインストール

# Foldseek をインストール
conda install -c conda-forge -c bioconda foldseek

# PDB を検索
foldseek easy-search query.pdb /path/to/pdb100 results.m8 tmp/

# AlphaFold DB を検索
foldseek easy-search query.pdb /path/to/afdb50 results.m8 tmp/

オプション 3: Python API

import subprocess
import pandas as pd

def foldseek_search(query_pdb, database, output="results.m8"):
    """Foldseek 検索を実行します。"""
    subprocess.run([
        "foldseek", "easy-search",
        query_pdb, database, output, "tmp/",
        "--format-output", "query,target,pident,alnlen,evalue,bits"
    ])
    return pd.read_csv(output, sep="\t",
                       names=["query", "target", "pident", "alnlen", "evalue", "bits"])

主要なパラメータ

パラメータ デフォルト 説明
--min-seq-id 0.0 最小配列同一性
-e 0.001 E-value の閾値
--alignment-type 2 0=3Di, 1=TM, 2=3Di+AA
--max-seqs 300 プレフィルターを通過する最大ヒット数。これを減らすと感度に影響します。

データベース

データベース 説明 サイズ
pdb100 100% でクラスタリングされた PDB ~200K 構造
afdb50 50% の AlphaFold DB ~67M 構造
swissprot SwissProt 構造 ~500K 構造
cath50 CATH ドメイン ~50K ドメイン

出力形式

# results.m8 (表形式)
query   target          pident  alnlen  evalue  bits
query   1abc_A          85.2    120     1e-45   180.5
query   2def_B          72.1    115     1e-32   145.2

出力例

実行成功

$ foldseek easy-search query.pdb pdb100 results.m8 tmp/
[INFO] データベースをロード中: pdb100 (194,527 エントリー)
[INFO] 検索中...
[INFO] 127 件のヒットが見つかりました

上位5件のヒット:
1. 1abc_A - 85.2% の同一性, E=1e-45
2. 2def_B - 72.1% の同一性, E=1e-32
3. 3ghi_C - 68.5% の同一性, E=1e-28
4. 4jkl_A - 55.3% の同一性, E=1e-18
5. 5mno_B - 42.1% の同一性, E=1e-10

決定木

Foldseek を使用すべきか?
│
├─ 何を検索しますか?
│  ├─ 3D 構造による検索 → Foldseek ✓
│  ├─ 配列による検索 → BLAST (uniprot skill) を使用
│  └─ 両方 → 両方を実行し、結果を比較
│
└─ 何が必要ですか?
   ├─ 構造相同体を見つける → Foldseek ✓
   ├─ リモート相同性検出 → Foldseek ✓
   ├─ 構造クラスタリング → Foldseek ✓
   └─ 機能アノテーション → UniProt と相互参照

一般的なユースケース

類似したデザインを見つける

# デザインを PDB と比較
foldseek easy-search design.pdb pdb100 similar_natural.m8 tmp/

ノベルティチェック

# デザインが新規であること (既知のものとの類似性が低いこと) を確認
foldseek easy-search design.pdb afdb50 novelty.m8 tmp/

# 新規である場合: 上位ヒットの同一性が 30% 未満

スキャフォールド検索

# モチーフグラフト用のスキャフォールドを見つける
foldseek easy-search motif.pdb pdb100 scaffolds.m8 tmp/ \
  --min-seq-id 0.0 -e 10

検証

wc -l results.m8  # ヒット数

トラブルシューティング

ヒットなし: E-value の閾値を下げ、より大きなデータベースを試してください ヒットが多すぎる: min-seq-id の閾値を上げてください 検索が遅い: より小さなデータベースを使用してください

エラーの解釈

エラー 原因 解決策
Database not found パスが間違っている データベースの場所を確認してください
Invalid PDB 不正な構造 PDB 形式を検証してください
Out of memory 大きなデータベース より多くの RAM を使用するか、ウェブサーバーを使用してください

: pdb skill でヒットをダウンロード → スキャフォールドデザインに使用します。

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Foldseek Structure Search

Prerequisites

Requirement Minimum Recommended
Python 3.8+ 3.10
RAM 8GB 16GB
Disk 10GB 50GB (for local databases)

How to run

Note: Foldseek can run locally or via web server. No GPU required.

Option 1: Web Server (Quick; rate-limited, use sparingly)

# Upload structure to web server
curl -X POST "https://search.foldseek.com/api/ticket" \
  -F "q=@query.pdb" \
  -F "database[]=afdb50" \
  -F "database[]=pdb100"

Option 2: Local installation

# Install Foldseek
conda install -c conda-forge -c bioconda foldseek

# Search PDB
foldseek easy-search query.pdb /path/to/pdb100 results.m8 tmp/

# Search AlphaFold DB
foldseek easy-search query.pdb /path/to/afdb50 results.m8 tmp/

Option 3: Python API

import subprocess
import pandas as pd

def foldseek_search(query_pdb, database, output="results.m8"):
    """Run Foldseek search."""
    subprocess.run([
        "foldseek", "easy-search",
        query_pdb, database, output, "tmp/",
        "--format-output", "query,target,pident,alnlen,evalue,bits"
    ])
    return pd.read_csv(output, sep="\t",
                       names=["query", "target", "pident", "alnlen", "evalue", "bits"])

Key parameters

Parameter Default Description
--min-seq-id 0.0 Minimum sequence identity
-e 0.001 E-value threshold
--alignment-type 2 0=3Di, 1=TM, 2=3Di+AA
--max-seqs 300 Max hits to pass through prefilter; reducing this affects sensitivity

Databases

Database Description Size
pdb100 PDB clustered at 100% ~200K structures
afdb50 AlphaFold DB at 50% ~67M structures
swissprot SwissProt structures ~500K structures
cath50 CATH domains ~50K domains

Output format

# results.m8 (tabular)
query   target          pident  alnlen  evalue  bits
query   1abc_A          85.2    120     1e-45   180.5
query   2def_B          72.1    115     1e-32   145.2

Sample output

Successful run

$ foldseek easy-search query.pdb pdb100 results.m8 tmp/
[INFO] Loading database: pdb100 (194,527 entries)
[INFO] Searching...
[INFO] Found 127 hits

Top 5 hits:
1. 1abc_A - 85.2% identity, E=1e-45
2. 2def_B - 72.1% identity, E=1e-32
3. 3ghi_C - 68.5% identity, E=1e-28
4. 4jkl_A - 55.3% identity, E=1e-18
5. 5mno_B - 42.1% identity, E=1e-10

Decision tree

Should I use Foldseek?
│
├─ What are you searching?
│  ├─ By 3D structure → Foldseek ✓
│  ├─ By sequence → Use BLAST (uniprot skill)
│  └─ Both → Run both, compare results
│
└─ What do you need?
   ├─ Find structural homologs → Foldseek ✓
   ├─ Remote homolog detection → Foldseek ✓
   ├─ Structural clustering → Foldseek ✓
   └─ Functional annotation → Cross-reference with UniProt

Common use cases

Find similar designs

# Compare your design to PDB
foldseek easy-search design.pdb pdb100 similar_natural.m8 tmp/

Novelty check

# Ensure design is novel (low similarity to known)
foldseek easy-search design.pdb afdb50 novelty.m8 tmp/

# Novel if: top hit identity < 30%

Scaffold search

# Find scaffolds for motif grafting
foldseek easy-search motif.pdb pdb100 scaffolds.m8 tmp/ \
  --min-seq-id 0.0 -e 10

Verify

wc -l results.m8  # Number of hits

Troubleshooting

No hits: Lower e-value threshold, try larger database Too many hits: Increase min-seq-id threshold Slow search: Use smaller database

Error interpretation

Error Cause Fix
Database not found Wrong path Check database location
Invalid PDB Malformed structure Validate PDB format
Out of memory Large database Use more RAM or web server

Next: Download hits with pdb skill → use for scaffold design.