jpskill.com
🛠️ 開発・MCP コミュニティ 🔴 エンジニア向け 👤 エンジニア・AI開発者

🛠️ Proteomics De

proteomics-de

MaxQuantやDIA-NNの出力データから、タンパク質の差次的な発現を統計的に解析するSkill。

⏱ ライブラリ調査+組込 半日 → 1時間

📺 まず動画で見る(YouTube)

▶ 【衝撃】最強のAIエージェント「Claude Code」の最新機能・使い方・プログラミングをAIで効率化する超実践術を解説! ↗

※ jpskill.com 編集部が参考用に選んだ動画です。動画の内容と Skill の挙動は厳密には一致しないことがあります。

📜 元の英語説明(参考)

Differential expression analysis for label-free quantitative (LFQ) intensity data with standard MaxQuant and DIA-NN output. Workflow includes preprocessing, imputation, and statistical testing.

🇯🇵 日本人クリエイター向け解説

一言でいうと

MaxQuantやDIA-NNの出力データから、タンパク質の差次的な発現を統計的に解析するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-17
取得日時
2026-05-17
同梱ファイル
1

💬 こう話しかけるだけ — サンプルプロンプト

  • Proteomics De を使って、最小構成のサンプルコードを示して
  • Proteomics De の主な使い方と注意点を教えて
  • Proteomics De を既存プロジェクトに組み込む方法を教えて

これをClaude Code に貼るだけで、このSkillが自動発動します。

📖 Claude が読む原文 SKILL.md(中身を展開)

この本文は AI(Claude)が読むための原文(英語または中国語)です。日本語訳は順次追加中。

🥚 Proteomics Differential Expression

This skill performs differential expression analysis on label-free quantitative (LFQ) intensity data from MaxQuant and DIA-NN outputs, including preprocessing, imputation, statistical testing, and visualization.


Domain Decisions

1. Multi-format Input Support

  • Supports MaxQuant proteinGroups.txt
    • Automatic filtering of reverse hits, contaminants, and site-only identifications
  • Supports DIA-NN output
    • Automatically extracts protein IDs and .raw intensity columns

2. Preprocessing Strategy

  • MaxQuant:
    • Filters:
      • Reverse
      • Potential contaminant / Contaminant
      • Only identified by site
  • DIA-NN:
    • Extracts protein identifiers and intensity matrix directly

3. Intensity Transformation

  • LFQ intensities are transformed using log2 scaling
  • Ensures approximate normality for downstream statistical testing

4. Missing Value Imputation

  • Uses down-shifted Gaussian imputation
    • Mean shifted by: median - shift × std
    • Default:
      • shift = 1.8
      • scale = 0.3
  • Assumption:
    • Missing values represent low-abundance proteins

5. Statistical Testing

  • Two-sample t-test between treatment and control groups
  • Default degrees of freedom:
    • df = 4 (for 3 vs 3 replicates)

6. s0-based FDR Correction

  • Uses s0-based thresholding to stabilize variance
  • Combines:
    • log2 fold change
    • p-value
  • Based on:
    • Giai Gianetto et al. (2016)

7. Significance Thresholding

  • Default:
    • FDR = 0.05
    • s0 = 0.1
  • Produces:
    • Adjusted significance boundary (used in volcano plot)

8. Visualization Outputs

  • PCA plot
  • Volcano plot (with s0 curve)
  • Imputation distribution comparison

Safety Rules

  • Local-first

    • No data upload without explicit user consent
  • Statistical caution

    • Statistical results should be interpreted with caution and not overinterpreted
    • Avoid drawing conclusions beyond what the data supports
  • Missing data assumptions

    • Imputation assumes missing values correspond to low abundance
    • May not hold in all experimental designs
  • Small sample limitations

    • t-test reliability depends on sufficient replicates
  • Reproducibility

    • All parameters and commands are logged
  • No hallucinated science

    • All methods are based on established proteomics workflows

Agent Boundary

This skill DOES:

  • Perform differential expression analysis on LFQ proteomics data
  • Handle MaxQuant and DIA-NN outputs
  • Generate statistical results and visualizations
  • Produce reproducible reports

This skill DOES NOT:

  • Process raw mass spectrometry data (e.g. RAW files)
  • Perform peptide identification or database search
  • Conduct pathway or functional enrichment analysis
  • Provide biological interpretation of results

Input Contract

Supported Input Formats

  1. MaxQuant proteinGroups.txt
  2. DIA-NN output (.tsv / .txt)

Metadata Requirements

  • .csv or .tsv
  • Must include:
    • sample_id
    • group

Supports:

  • raw names
  • full paths (e.g. /path/sample.raw)

Output Structure

proteomics_de_report/
├── report.md
├── figures/
│   ├── imputation_distribution.png
│   ├── pca.png
│   └── volcano.png
├── tables/
│   ├── imputed_proteinGroups.csv
│   └── de_results.csv
├── ro-crate-metadata.json
└── reproducibility/
    ├── commands.sh
    ├── environment.yml
    └── checksums.sha256

Usage

Demo

python proteomics_de.py \
  --demo \
  --output report_dir

MaxQuant Input

python proteomics_de.py \
  --input proteinGroups.txt \
  --input-type maxquant \
  --metadata metadata.csv \
  --contrast "treated,control" \
  --output report_dir

DIA-NN Input

python proteomics_de.py \
  --input diann_output.tsv \
  --input-type diann \
  --metadata metadata.csv \
  --contrast "treated,control" \
  --output report_dir

Parameters

Parameter Description Default
--input Input file path -
--input-type maxquant or diann maxquant
--metadata Metadata file -
--contrast treatment,control treated,control
--s0 s0 parameter 0.1
--fdr FDR threshold 0.05
--ttest-df Degrees of freedom 4
--imputation-shift Imputation shift 1.8
--imputation-scale Imputation scale 0.3
--output Output directory -

References

  • test_proteinGroups.txt is from: Keilhauer EC, Hein MY, Mann M. Accurate protein complex retrieval by affinity enrichment mass spectrometry (AE-MS) rather than affinity purification mass spectrometry (AP-MS). Mol Cell Proteomics. 2015 Jan;14(1):120-35. doi: 10.1074/mcp.M114.041012. Epub 2014 Nov 2. PMID: 25363814; PMCID: PMC4288248.
  • s0 correction algorithm is from: Giai Gianetto Q, Couté Y, Bruley C, Burger T. Uses and misuses of the fudge factor in quantitative discovery proteomics. Proteomics. 2016 Jul;16(14):1955-60. doi: 10.1002/pmic.201600132. PMID: 27272648.
  • s0 correction algorithm is cited by: Michaelis AC, Brunner AD, Zwiebel M, Meier F, Strauss MT, Bludau I, Mann M. The social and structural architecture of the yeast protein interactome. Nature. 2023 Dec;624(7990):192-200. doi: 10.1038/s41586-023-06739-5. Epub 2023 Nov 15. PMID: 37968396; PMCID: PMC10700138.