jpskill.com
🛠️ 開発・MCP コミュニティ

solublempnn

SolubleMPNNを用いて、大腸菌での発現を目的としたタンパク質の溶解性を高め、凝集を抑制することで、高収量での発現や封入体の形成を回避するタンパク質配列を設計するSkill。

📜 元の英語説明(参考)

Solubility-optimized protein sequence design using SolubleMPNN. Use this skill when: (1) Designing for E. coli expression, (2) Optimizing solubility of designed proteins, (3) Reducing aggregation propensity, (4) Need high-yield expression, (5) Avoiding inclusion body formation. For standard design, use proteinmpnn. For ligand-aware design, use ligandmpnn.

🇯🇵 日本人クリエイター向け解説

一言でいうと

SolubleMPNNを用いて、大腸菌での発現を目的としたタンパク質の溶解性を高め、凝集を抑制することで、高収量での発現や封入体の形成を回避するタンパク質配列を設計するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o solublempnn.zip https://jpskill.com/download/9556.zip && unzip -o solublempnn.zip && rm solublempnn.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/9556.zip -OutFile "$d\solublempnn.zip"; Expand-Archive "$d\solublempnn.zip" -DestinationPath $d -Force; ri "$d\solublempnn.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して solublempnn.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → solublempnn フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

SolubleMPNN 可溶性最適化設計

前提条件

要件 最小 推奨
Python 3.8+ 3.10
CUDA 11.0+ 11.7+
GPU VRAM 8GB 16GB (T4)
RAM 8GB 16GB

実行方法

初回ですか? Modalとbiomodalsのセットアップについては、インストールガイドを参照してください。

オプション1: Modal (推奨)

SolubleMPNNは、可溶性モデルでProteinMPNN Modalラッパーを使用します。

cd biomodals
modal run modal_proteinmpnn.py \
  --pdb-path backbone.pdb \
  --num-seq-per-target 16 \
  --sampling-temp 0.1 \
  --model-name v_48_020

GPU: T4 (16GB) | タイムアウト: デフォルト600秒

オプション2: ローカルインストール

git clone https://github.com/dauparas/ProteinMPNN.git
cd ProteinMPNN

# 可溶性モデルの重みを使用
python protein_mpnn_run.py \
  --pdb_path backbone.pdb \
  --out_folder output/ \
  --num_seq_per_target 16 \
  --sampling_temp "0.1" \
  --model_name "v_48_020"  # 可溶性モデル

主要なパラメータ

パラメータ デフォルト 範囲 説明
--pdb_path 必須 path 入力構造
--num_seq_per_target 1 1-1000 構造ごとの配列数
--sampling_temp "0.1" "0.0001-1.0" 温度 (文字列!)
--model_name v_48_020 string 可溶性モデルのバリアント

モデルのバリアント

モデル 説明 ユースケース
v_48_002 標準 一般的な設計
v_48_020 可溶性学習済み 大腸菌での発現
v_48_030 高い溶解性 困難なターゲット

出力形式

output/
├── seqs/backbone.fa
└── backbone_pdb/backbone_0001.pdb

出力例

実行成功

$ python protein_mpnn_run.py --pdb_path backbone.pdb --model_name v_48_020 --num_seq_per_target 8
Loading soluble model weights (v_48_020)...
Designing sequences for backbone.pdb
Generated 8 sequences in 2.1 seconds

output/seqs/backbone.fa:
>backbone_0001, score=1.31, global_score=1.24, seq_recovery=0.78
MKTAYIAKQRQISFVKSHFSRQLE...
>backbone_0002, score=1.28, global_score=1.21, seq_recovery=0.81
MKTAYIAKQRQISFVKSQFSRQLD...

良好な出力の例:

  • Score: 1.0-2.0 (低いほど確信度が高い)
  • 標準的なMPNNと比較して疎水性パッチが減少
  • 電荷分布の改善

決定木

SolubleMPNNを使用すべきか?
│
├─ どの発現系か?
│  ├─ 大腸菌 → SolubleMPNN ✓
│  ├─ 哺乳類 → ProteinMPNN (PTMがより重要)
│  └─ 酵母 → どちらでも
│
├─ 発現の問題の履歴は?
│  ├─ はい、凝集 → SolubleMPNN ✓
│  ├─ はい、低収量 → SolubleMPNN ✓
│  └─ いいえ → ProteinMPNNで問題ない
│
├─ 結合部位には何があるか?
│  ├─ 低分子/リガンド → LigandMPNNを使用
│  └─ 何もない/タンパク質のみ → SolubleMPNN ✓
│
└─ 最高の溶解性が必要か?
   ├─ はい → v_48_030モデルを使用
   └─ 標準 → v_48_020モデルを使用

標準的なパフォーマンス

キャンペーンサイズ 時間 (T4) コスト (Modal) 注記
100 backbone × 8 配列 15-20 分 約$2 標準
500 backbone × 8 配列 1-1.5 時間 約$8 大規模キャンペーン

期待される改善: 標準的なProteinMPNNと比較して+15-30%の溶解度スコア。


検証

grep -c "^>" output/seqs/*.fa  # backbone_count × num_seq_per_targetと一致するはず

トラブルシューティング

まだ不溶性: v_48_030 (より高い溶解性バイアス) を試してください 多様性が低い: 温度を0.2に上げてください フォールディングが不十分: 標準的なProteinMPNNを使用し、後で最適化してください

エラーの解釈

エラー 原因 修正
RuntimeError: CUDA out of memory 長いタンパク質または大きなバッチ batch_sizeを減らす
FileNotFoundError: v_48_020 モデルの重みがありません 可溶性の重みをダウンロード

: 検証のための構造予測 → フィルタリングのための protein-qc

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

SolubleMPNN Solubility-Optimized Design

Prerequisites

Requirement Minimum Recommended
Python 3.8+ 3.10
CUDA 11.0+ 11.7+
GPU VRAM 8GB 16GB (T4)
RAM 8GB 16GB

How to run

First time? See Installation Guide to set up Modal and biomodals.

Option 1: Modal (recommended)

SolubleMPNN uses the ProteinMPNN Modal wrapper with soluble model:

cd biomodals
modal run modal_proteinmpnn.py \
  --pdb-path backbone.pdb \
  --num-seq-per-target 16 \
  --sampling-temp 0.1 \
  --model-name v_48_020

GPU: T4 (16GB) | Timeout: 600s default

Option 2: Local installation

git clone https://github.com/dauparas/ProteinMPNN.git
cd ProteinMPNN

# Use soluble model weights
python protein_mpnn_run.py \
  --pdb_path backbone.pdb \
  --out_folder output/ \
  --num_seq_per_target 16 \
  --sampling_temp "0.1" \
  --model_name "v_48_020"  # Soluble model

Key parameters

Parameter Default Range Description
--pdb_path required path Input structure
--num_seq_per_target 1 1-1000 Sequences per structure
--sampling_temp "0.1" "0.0001-1.0" Temperature (string!)
--model_name v_48_020 string Soluble model variant

Model Variants

Model Description Use Case
v_48_002 Standard General design
v_48_020 Soluble-trained E. coli expression
v_48_030 High solubility Difficult targets

Output format

output/
├── seqs/backbone.fa
└── backbone_pdb/backbone_0001.pdb

Sample output

Successful run

$ python protein_mpnn_run.py --pdb_path backbone.pdb --model_name v_48_020 --num_seq_per_target 8
Loading soluble model weights (v_48_020)...
Designing sequences for backbone.pdb
Generated 8 sequences in 2.1 seconds

output/seqs/backbone.fa:
>backbone_0001, score=1.31, global_score=1.24, seq_recovery=0.78
MKTAYIAKQRQISFVKSHFSRQLE...
>backbone_0002, score=1.28, global_score=1.21, seq_recovery=0.81
MKTAYIAKQRQISFVKSQFSRQLD...

What good output looks like:

  • Score: 1.0-2.0 (lower = more confident)
  • Reduced hydrophobic patches compared to standard MPNN
  • Improved charge distribution

Decision tree

Should I use SolubleMPNN?
│
├─ What expression system?
│  ├─ E. coli → SolubleMPNN ✓
│  ├─ Mammalian → ProteinMPNN (PTMs matter more)
│  └─ Yeast → Either
│
├─ History of expression problems?
│  ├─ Yes, aggregation → SolubleMPNN ✓
│  ├─ Yes, low yield → SolubleMPNN ✓
│  └─ No → ProteinMPNN is fine
│
├─ What's in the binding site?
│  ├─ Small molecule / ligand → Use LigandMPNN
│  └─ Nothing / protein only → SolubleMPNN ✓
│
└─ Need highest solubility?
   ├─ Yes → Use v_48_030 model
   └─ Standard → Use v_48_020 model

Typical performance

Campaign Size Time (T4) Cost (Modal) Notes
100 backbones × 8 seq 15-20 min ~$2 Standard
500 backbones × 8 seq 1-1.5h ~$8 Large campaign

Expected improvement: +15-30% solubility score vs standard ProteinMPNN.


Verify

grep -c "^>" output/seqs/*.fa  # Should match backbone_count × num_seq_per_target

Troubleshooting

Still insoluble: Try v_48_030 (higher solubility bias) Low diversity: Increase temperature to 0.2 Poor folding: Use standard ProteinMPNN and optimize later

Error interpretation

Error Cause Fix
RuntimeError: CUDA out of memory Long protein or large batch Reduce batch_size
FileNotFoundError: v_48_020 Missing model weights Download soluble weights

Next: Structure prediction for validation → protein-qc for filtering.