foldseek
Foldseekは、タンパク質の立体構造を比較して、配列からは見つけにくい類似構造をデータベースから検索したり、構造に基づいた分類をしたり、遠い相同性を持つタンパク質を発見したりする際に役立つSkill。
📜 元の英語説明(参考)
Structure similarity search with Foldseek. Use this skill when: (1) Finding similar structures in PDB/AFDB databases, (2) Structural homology search, (3) Database queries by 3D structure, (4) Finding remote homologs not detected by sequence, (5) Clustering structures by similarity. For sequence similarity, use uniprot BLAST. For structure prediction, use chai or boltz.
🇯🇵 日本人クリエイター向け解説
Foldseekは、タンパク質の立体構造を比較して、配列からは見つけにくい類似構造をデータベースから検索したり、構造に基づいた分類をしたり、遠い相同性を持つタンパク質を発見したりする際に役立つSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o foldseek.zip https://jpskill.com/download/9547.zip && unzip -o foldseek.zip && rm foldseek.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/9547.zip -OutFile "$d\foldseek.zip"; Expand-Archive "$d\foldseek.zip" -DestinationPath $d -Force; ri "$d\foldseek.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
foldseek.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
foldseekフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
Foldseek構造検索
前提条件
| 要件 | 最小 | 推奨 |
|---|---|---|
| Python | 3.8+ | 3.10 |
| RAM | 8GB | 16GB |
| ディスク | 10GB | 50GB (ローカルデータベース用) |
実行方法
注: Foldseek はローカルまたはウェブサーバー経由で実行できます。GPU は不要です。
オプション 1: ウェブサーバー (高速; レート制限あり、控えめに使用)
# ウェブサーバーに構造をアップロード
curl -X POST "https://search.foldseek.com/api/ticket" \
-F "q=@query.pdb" \
-F "database[]=afdb50" \
-F "database[]=pdb100"
オプション 2: ローカルインストール
# Foldseek をインストール
conda install -c conda-forge -c bioconda foldseek
# PDB を検索
foldseek easy-search query.pdb /path/to/pdb100 results.m8 tmp/
# AlphaFold DB を検索
foldseek easy-search query.pdb /path/to/afdb50 results.m8 tmp/
オプション 3: Python API
import subprocess
import pandas as pd
def foldseek_search(query_pdb, database, output="results.m8"):
"""Foldseek 検索を実行します。"""
subprocess.run([
"foldseek", "easy-search",
query_pdb, database, output, "tmp/",
"--format-output", "query,target,pident,alnlen,evalue,bits"
])
return pd.read_csv(output, sep="\t",
names=["query", "target", "pident", "alnlen", "evalue", "bits"])
主要なパラメータ
| パラメータ | デフォルト | 説明 |
|---|---|---|
--min-seq-id |
0.0 | 最小配列同一性 |
-e |
0.001 | E-value の閾値 |
--alignment-type |
2 | 0=3Di, 1=TM, 2=3Di+AA |
--max-seqs |
300 | プレフィルターを通過する最大ヒット数。これを減らすと感度に影響します。 |
データベース
| データベース | 説明 | サイズ |
|---|---|---|
pdb100 |
100% でクラスタリングされた PDB | ~200K 構造 |
afdb50 |
50% の AlphaFold DB | ~67M 構造 |
swissprot |
SwissProt 構造 | ~500K 構造 |
cath50 |
CATH ドメイン | ~50K ドメイン |
出力形式
# results.m8 (表形式)
query target pident alnlen evalue bits
query 1abc_A 85.2 120 1e-45 180.5
query 2def_B 72.1 115 1e-32 145.2
出力例
実行成功
$ foldseek easy-search query.pdb pdb100 results.m8 tmp/
[INFO] データベースをロード中: pdb100 (194,527 エントリー)
[INFO] 検索中...
[INFO] 127 件のヒットが見つかりました
上位5件のヒット:
1. 1abc_A - 85.2% の同一性, E=1e-45
2. 2def_B - 72.1% の同一性, E=1e-32
3. 3ghi_C - 68.5% の同一性, E=1e-28
4. 4jkl_A - 55.3% の同一性, E=1e-18
5. 5mno_B - 42.1% の同一性, E=1e-10
決定木
Foldseek を使用すべきか?
│
├─ 何を検索しますか?
│ ├─ 3D 構造による検索 → Foldseek ✓
│ ├─ 配列による検索 → BLAST (uniprot skill) を使用
│ └─ 両方 → 両方を実行し、結果を比較
│
└─ 何が必要ですか?
├─ 構造相同体を見つける → Foldseek ✓
├─ リモート相同性検出 → Foldseek ✓
├─ 構造クラスタリング → Foldseek ✓
└─ 機能アノテーション → UniProt と相互参照
一般的なユースケース
類似したデザインを見つける
# デザインを PDB と比較
foldseek easy-search design.pdb pdb100 similar_natural.m8 tmp/
ノベルティチェック
# デザインが新規であること (既知のものとの類似性が低いこと) を確認
foldseek easy-search design.pdb afdb50 novelty.m8 tmp/
# 新規である場合: 上位ヒットの同一性が 30% 未満
スキャフォールド検索
# モチーフグラフト用のスキャフォールドを見つける
foldseek easy-search motif.pdb pdb100 scaffolds.m8 tmp/ \
--min-seq-id 0.0 -e 10
検証
wc -l results.m8 # ヒット数
トラブルシューティング
ヒットなし: E-value の閾値を下げ、より大きなデータベースを試してください ヒットが多すぎる: min-seq-id の閾値を上げてください 検索が遅い: より小さなデータベースを使用してください
エラーの解釈
| エラー | 原因 | 解決策 |
|---|---|---|
Database not found |
パスが間違っている | データベースの場所を確認してください |
Invalid PDB |
不正な構造 | PDB 形式を検証してください |
Out of memory |
大きなデータベース | より多くの RAM を使用するか、ウェブサーバーを使用してください |
次: pdb skill でヒットをダウンロード → スキャフォールドデザインに使用します。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
Foldseek Structure Search
Prerequisites
| Requirement | Minimum | Recommended |
|---|---|---|
| Python | 3.8+ | 3.10 |
| RAM | 8GB | 16GB |
| Disk | 10GB | 50GB (for local databases) |
How to run
Note: Foldseek can run locally or via web server. No GPU required.
Option 1: Web Server (Quick; rate-limited, use sparingly)
# Upload structure to web server
curl -X POST "https://search.foldseek.com/api/ticket" \
-F "q=@query.pdb" \
-F "database[]=afdb50" \
-F "database[]=pdb100"
Option 2: Local installation
# Install Foldseek
conda install -c conda-forge -c bioconda foldseek
# Search PDB
foldseek easy-search query.pdb /path/to/pdb100 results.m8 tmp/
# Search AlphaFold DB
foldseek easy-search query.pdb /path/to/afdb50 results.m8 tmp/
Option 3: Python API
import subprocess
import pandas as pd
def foldseek_search(query_pdb, database, output="results.m8"):
"""Run Foldseek search."""
subprocess.run([
"foldseek", "easy-search",
query_pdb, database, output, "tmp/",
"--format-output", "query,target,pident,alnlen,evalue,bits"
])
return pd.read_csv(output, sep="\t",
names=["query", "target", "pident", "alnlen", "evalue", "bits"])
Key parameters
| Parameter | Default | Description |
|---|---|---|
--min-seq-id |
0.0 | Minimum sequence identity |
-e |
0.001 | E-value threshold |
--alignment-type |
2 | 0=3Di, 1=TM, 2=3Di+AA |
--max-seqs |
300 | Max hits to pass through prefilter; reducing this affects sensitivity |
Databases
| Database | Description | Size |
|---|---|---|
pdb100 |
PDB clustered at 100% | ~200K structures |
afdb50 |
AlphaFold DB at 50% | ~67M structures |
swissprot |
SwissProt structures | ~500K structures |
cath50 |
CATH domains | ~50K domains |
Output format
# results.m8 (tabular)
query target pident alnlen evalue bits
query 1abc_A 85.2 120 1e-45 180.5
query 2def_B 72.1 115 1e-32 145.2
Sample output
Successful run
$ foldseek easy-search query.pdb pdb100 results.m8 tmp/
[INFO] Loading database: pdb100 (194,527 entries)
[INFO] Searching...
[INFO] Found 127 hits
Top 5 hits:
1. 1abc_A - 85.2% identity, E=1e-45
2. 2def_B - 72.1% identity, E=1e-32
3. 3ghi_C - 68.5% identity, E=1e-28
4. 4jkl_A - 55.3% identity, E=1e-18
5. 5mno_B - 42.1% identity, E=1e-10
Decision tree
Should I use Foldseek?
│
├─ What are you searching?
│ ├─ By 3D structure → Foldseek ✓
│ ├─ By sequence → Use BLAST (uniprot skill)
│ └─ Both → Run both, compare results
│
└─ What do you need?
├─ Find structural homologs → Foldseek ✓
├─ Remote homolog detection → Foldseek ✓
├─ Structural clustering → Foldseek ✓
└─ Functional annotation → Cross-reference with UniProt
Common use cases
Find similar designs
# Compare your design to PDB
foldseek easy-search design.pdb pdb100 similar_natural.m8 tmp/
Novelty check
# Ensure design is novel (low similarity to known)
foldseek easy-search design.pdb afdb50 novelty.m8 tmp/
# Novel if: top hit identity < 30%
Scaffold search
# Find scaffolds for motif grafting
foldseek easy-search motif.pdb pdb100 scaffolds.m8 tmp/ \
--min-seq-id 0.0 -e 10
Verify
wc -l results.m8 # Number of hits
Troubleshooting
No hits: Lower e-value threshold, try larger database Too many hits: Increase min-seq-id threshold Slow search: Use smaller database
Error interpretation
| Error | Cause | Fix |
|---|---|---|
Database not found |
Wrong path | Check database location |
Invalid PDB |
Malformed structure | Validate PDB format |
Out of memory |
Large database | Use more RAM or web server |
Next: Download hits with pdb skill → use for scaffold design.