solublempnn
SolubleMPNNを用いて、大腸菌での発現を目的としたタンパク質の溶解性を高め、凝集を抑制することで、高収量での発現や封入体の形成を回避するタンパク質配列を設計するSkill。
📜 元の英語説明(参考)
Solubility-optimized protein sequence design using SolubleMPNN. Use this skill when: (1) Designing for E. coli expression, (2) Optimizing solubility of designed proteins, (3) Reducing aggregation propensity, (4) Need high-yield expression, (5) Avoiding inclusion body formation. For standard design, use proteinmpnn. For ligand-aware design, use ligandmpnn.
🇯🇵 日本人クリエイター向け解説
SolubleMPNNを用いて、大腸菌での発現を目的としたタンパク質の溶解性を高め、凝集を抑制することで、高収量での発現や封入体の形成を回避するタンパク質配列を設計するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o solublempnn.zip https://jpskill.com/download/9556.zip && unzip -o solublempnn.zip && rm solublempnn.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/9556.zip -OutFile "$d\solublempnn.zip"; Expand-Archive "$d\solublempnn.zip" -DestinationPath $d -Force; ri "$d\solublempnn.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
solublempnn.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
solublempnnフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
SolubleMPNN 可溶性最適化設計
前提条件
| 要件 | 最小 | 推奨 |
|---|---|---|
| Python | 3.8+ | 3.10 |
| CUDA | 11.0+ | 11.7+ |
| GPU VRAM | 8GB | 16GB (T4) |
| RAM | 8GB | 16GB |
実行方法
初回ですか? Modalとbiomodalsのセットアップについては、インストールガイドを参照してください。
オプション1: Modal (推奨)
SolubleMPNNは、可溶性モデルでProteinMPNN Modalラッパーを使用します。
cd biomodals
modal run modal_proteinmpnn.py \
--pdb-path backbone.pdb \
--num-seq-per-target 16 \
--sampling-temp 0.1 \
--model-name v_48_020
GPU: T4 (16GB) | タイムアウト: デフォルト600秒
オプション2: ローカルインストール
git clone https://github.com/dauparas/ProteinMPNN.git
cd ProteinMPNN
# 可溶性モデルの重みを使用
python protein_mpnn_run.py \
--pdb_path backbone.pdb \
--out_folder output/ \
--num_seq_per_target 16 \
--sampling_temp "0.1" \
--model_name "v_48_020" # 可溶性モデル
主要なパラメータ
| パラメータ | デフォルト | 範囲 | 説明 |
|---|---|---|---|
--pdb_path |
必須 | path | 入力構造 |
--num_seq_per_target |
1 | 1-1000 | 構造ごとの配列数 |
--sampling_temp |
"0.1" | "0.0001-1.0" | 温度 (文字列!) |
--model_name |
v_48_020 | string | 可溶性モデルのバリアント |
モデルのバリアント
| モデル | 説明 | ユースケース |
|---|---|---|
| v_48_002 | 標準 | 一般的な設計 |
| v_48_020 | 可溶性学習済み | 大腸菌での発現 |
| v_48_030 | 高い溶解性 | 困難なターゲット |
出力形式
output/
├── seqs/backbone.fa
└── backbone_pdb/backbone_0001.pdb
出力例
実行成功
$ python protein_mpnn_run.py --pdb_path backbone.pdb --model_name v_48_020 --num_seq_per_target 8
Loading soluble model weights (v_48_020)...
Designing sequences for backbone.pdb
Generated 8 sequences in 2.1 seconds
output/seqs/backbone.fa:
>backbone_0001, score=1.31, global_score=1.24, seq_recovery=0.78
MKTAYIAKQRQISFVKSHFSRQLE...
>backbone_0002, score=1.28, global_score=1.21, seq_recovery=0.81
MKTAYIAKQRQISFVKSQFSRQLD...
良好な出力の例:
- Score: 1.0-2.0 (低いほど確信度が高い)
- 標準的なMPNNと比較して疎水性パッチが減少
- 電荷分布の改善
決定木
SolubleMPNNを使用すべきか?
│
├─ どの発現系か?
│ ├─ 大腸菌 → SolubleMPNN ✓
│ ├─ 哺乳類 → ProteinMPNN (PTMがより重要)
│ └─ 酵母 → どちらでも
│
├─ 発現の問題の履歴は?
│ ├─ はい、凝集 → SolubleMPNN ✓
│ ├─ はい、低収量 → SolubleMPNN ✓
│ └─ いいえ → ProteinMPNNで問題ない
│
├─ 結合部位には何があるか?
│ ├─ 低分子/リガンド → LigandMPNNを使用
│ └─ 何もない/タンパク質のみ → SolubleMPNN ✓
│
└─ 最高の溶解性が必要か?
├─ はい → v_48_030モデルを使用
└─ 標準 → v_48_020モデルを使用
標準的なパフォーマンス
| キャンペーンサイズ | 時間 (T4) | コスト (Modal) | 注記 |
|---|---|---|---|
| 100 backbone × 8 配列 | 15-20 分 | 約$2 | 標準 |
| 500 backbone × 8 配列 | 1-1.5 時間 | 約$8 | 大規模キャンペーン |
期待される改善: 標準的なProteinMPNNと比較して+15-30%の溶解度スコア。
検証
grep -c "^>" output/seqs/*.fa # backbone_count × num_seq_per_targetと一致するはず
トラブルシューティング
まだ不溶性: v_48_030 (より高い溶解性バイアス) を試してください 多様性が低い: 温度を0.2に上げてください フォールディングが不十分: 標準的なProteinMPNNを使用し、後で最適化してください
エラーの解釈
| エラー | 原因 | 修正 |
|---|---|---|
RuntimeError: CUDA out of memory |
長いタンパク質または大きなバッチ | batch_sizeを減らす |
FileNotFoundError: v_48_020 |
モデルの重みがありません | 可溶性の重みをダウンロード |
次: 検証のための構造予測 → フィルタリングのための protein-qc。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
SolubleMPNN Solubility-Optimized Design
Prerequisites
| Requirement | Minimum | Recommended |
|---|---|---|
| Python | 3.8+ | 3.10 |
| CUDA | 11.0+ | 11.7+ |
| GPU VRAM | 8GB | 16GB (T4) |
| RAM | 8GB | 16GB |
How to run
First time? See Installation Guide to set up Modal and biomodals.
Option 1: Modal (recommended)
SolubleMPNN uses the ProteinMPNN Modal wrapper with soluble model:
cd biomodals
modal run modal_proteinmpnn.py \
--pdb-path backbone.pdb \
--num-seq-per-target 16 \
--sampling-temp 0.1 \
--model-name v_48_020
GPU: T4 (16GB) | Timeout: 600s default
Option 2: Local installation
git clone https://github.com/dauparas/ProteinMPNN.git
cd ProteinMPNN
# Use soluble model weights
python protein_mpnn_run.py \
--pdb_path backbone.pdb \
--out_folder output/ \
--num_seq_per_target 16 \
--sampling_temp "0.1" \
--model_name "v_48_020" # Soluble model
Key parameters
| Parameter | Default | Range | Description |
|---|---|---|---|
--pdb_path |
required | path | Input structure |
--num_seq_per_target |
1 | 1-1000 | Sequences per structure |
--sampling_temp |
"0.1" | "0.0001-1.0" | Temperature (string!) |
--model_name |
v_48_020 | string | Soluble model variant |
Model Variants
| Model | Description | Use Case |
|---|---|---|
| v_48_002 | Standard | General design |
| v_48_020 | Soluble-trained | E. coli expression |
| v_48_030 | High solubility | Difficult targets |
Output format
output/
├── seqs/backbone.fa
└── backbone_pdb/backbone_0001.pdb
Sample output
Successful run
$ python protein_mpnn_run.py --pdb_path backbone.pdb --model_name v_48_020 --num_seq_per_target 8
Loading soluble model weights (v_48_020)...
Designing sequences for backbone.pdb
Generated 8 sequences in 2.1 seconds
output/seqs/backbone.fa:
>backbone_0001, score=1.31, global_score=1.24, seq_recovery=0.78
MKTAYIAKQRQISFVKSHFSRQLE...
>backbone_0002, score=1.28, global_score=1.21, seq_recovery=0.81
MKTAYIAKQRQISFVKSQFSRQLD...
What good output looks like:
- Score: 1.0-2.0 (lower = more confident)
- Reduced hydrophobic patches compared to standard MPNN
- Improved charge distribution
Decision tree
Should I use SolubleMPNN?
│
├─ What expression system?
│ ├─ E. coli → SolubleMPNN ✓
│ ├─ Mammalian → ProteinMPNN (PTMs matter more)
│ └─ Yeast → Either
│
├─ History of expression problems?
│ ├─ Yes, aggregation → SolubleMPNN ✓
│ ├─ Yes, low yield → SolubleMPNN ✓
│ └─ No → ProteinMPNN is fine
│
├─ What's in the binding site?
│ ├─ Small molecule / ligand → Use LigandMPNN
│ └─ Nothing / protein only → SolubleMPNN ✓
│
└─ Need highest solubility?
├─ Yes → Use v_48_030 model
└─ Standard → Use v_48_020 model
Typical performance
| Campaign Size | Time (T4) | Cost (Modal) | Notes |
|---|---|---|---|
| 100 backbones × 8 seq | 15-20 min | ~$2 | Standard |
| 500 backbones × 8 seq | 1-1.5h | ~$8 | Large campaign |
Expected improvement: +15-30% solubility score vs standard ProteinMPNN.
Verify
grep -c "^>" output/seqs/*.fa # Should match backbone_count × num_seq_per_target
Troubleshooting
Still insoluble: Try v_48_030 (higher solubility bias) Low diversity: Increase temperature to 0.2 Poor folding: Use standard ProteinMPNN and optimize later
Error interpretation
| Error | Cause | Fix |
|---|---|---|
RuntimeError: CUDA out of memory |
Long protein or large batch | Reduce batch_size |
FileNotFoundError: v_48_020 |
Missing model weights | Download soluble weights |
Next: Structure prediction for validation → protein-qc for filtering.