jpskill.com
🛠️ 開発・MCP コミュニティ

clinvar-database

Query NCBI ClinVar for variant clinical significance. Search by gene/position, interpret pathogenicity classifications, access via E-utilities API or FTP, annotate VCFs, for genomic medicine.

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o clinvar-database.zip https://jpskill.com/download/18365.zip && unzip -o clinvar-database.zip && rm clinvar-database.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/18365.zip -OutFile "$d\clinvar-database.zip"; Expand-Archive "$d\clinvar-database.zip" -DestinationPath $d -Force; ri "$d\clinvar-database.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して clinvar-database.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → clinvar-database フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
4

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

ClinVarデータベース

概要

ClinVarは、ヒトの遺伝的変異と表現型との関係に関するレポートを、裏付けとなるエビデンスとともに、NCBIが無料でアクセスできるようにしたアーカイブです。このデータベースは、ゲノムの多様性とそれがヒトの健康に及ぼす関係に関する情報を集約し、臨床遺伝学および研究で使用される標準化された変異分類を提供します。

このSkillを使用する場面

このSkillは、以下の場合に使用する必要があります。

  • 遺伝子、状態、または臨床的意義による変異の検索
  • 臨床的意義の分類(病原性、良性、VUS)の解釈
  • E-utilities APIを介したプログラムによるClinVarデータへのアクセス
  • FTPからのバルクデータのダウンロードと処理
  • レビュー状況とスター評価の理解
  • 矛盾する変異の解釈の解決
  • 臨床的意義による変異コールセットのアノテーション

主要な機能

1. ClinVarの検索とクエリ

Webインターフェースのクエリ

https://www.ncbi.nlm.nih.gov/clinvar/ のWebインターフェースを使用してClinVarを検索します。

一般的な検索パターン:

  • 遺伝子別: BRCA1[gene]
  • 臨床的意義別: pathogenic[CLNSIG]
  • 状態別: breast cancer[disorder]
  • 変異別: NM_000059.3:c.1310_1313del[variant name]
  • 染色体別: 13[chr]
  • 組み合わせ: BRCA1[gene] AND pathogenic[CLNSIG]

E-utilitiesを介したプログラムによるアクセス

NCBIのE-utilities APIを使用して、プログラムでClinVarにアクセスします。包括的なAPIドキュメントについては、references/api_reference.mdを参照してください。以下が含まれます。

  • esearch - 条件に一致する変異の検索
  • esummary - 変異の概要の取得
  • efetch - 完全なXMLレコードのダウンロード
  • elink - 他のNCBIデータベース内の関連レコードの検索

curlを使用した簡単な例:

# 病原性のBRCA1変異の検索
curl "https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=clinvar&term=BRCA1[gene]+AND+pathogenic[CLNSIG]&retmode=json"

ベストプラクティス:

  • 自動化する前に、Webインターフェースでクエリをテストします
  • APIキーを使用して、レート制限を3リクエスト/秒から10リクエスト/秒に増やします
  • レート制限エラーに対して指数バックオフを実装します
  • Biopythonを使用する場合は、Entrez.emailを設定します

2. 臨床的意義の解釈

分類の理解

ClinVarは、変異分類に標準化された用語を使用します。詳細な解釈ガイドラインについては、references/clinical_significance.mdを参照してください。

主要な生殖細胞系列分類用語 (ACMG/AMP):

  • Pathogenic (P) - 変異が疾患を引き起こす(〜99%の確率)
  • Likely Pathogenic (LP) - 変異が疾患を引き起こす可能性が高い(〜90%の確率)
  • Uncertain Significance (VUS) - 分類するのに十分なエビデンスがない
  • Likely Benign (LB) - 変異が疾患を引き起こす可能性は低い
  • Benign (B) - 変異は疾患を引き起こさない

レビュー状況(スター評価):

  • ★★★★ Practice guideline - 最高の信頼度
  • ★★★ Expert panel review (e.g., ClinGen) - 高い信頼度
  • ★★ Multiple submitters, no conflicts - 中程度の信頼度
  • ★ Single submitter with criteria - 標準的な重み
  • ☆ No assertion criteria - 低い信頼度

重要な考慮事項:

  • 常にレビュー状況を確認してください - ★★★または★★★★の評価を優先します
  • 矛盾する解釈には手動評価が必要です
  • 新しいエビデンスが出現すると、分類が変更される可能性があります
  • VUS(意義不明)の変異は、臨床で使用するのに十分なエビデンスがありません

3. FTPからバルクデータをダウンロードする

ClinVar FTPサイトへのアクセス

ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/ から完全なデータセットをダウンロードします。

ファイル形式と処理に関する包括的なドキュメントについては、references/data_formats.mdを参照してください。

更新スケジュール:

  • 月次リリース: 各月の最初の木曜日(完全なデータセット、アーカイブ済み)
  • 毎週の更新: 毎週月曜日(増分更新)

利用可能な形式

XMLファイル (最も包括的):

  • VCV (Variation) ファイル: xml/clinvar_variation/ - 変異中心の集約
  • RCV (Record) ファイル: xml/RCV/ - 変異-状態のペア
  • 完全な提出の詳細、エビデンス、およびメタデータが含まれます

VCFファイル (ゲノムパイプライン用):

  • GRCh37: vcf_GRCh37/clinvar.vcf.gz
  • GRCh38: vcf_GRCh38/clinvar.vcf.gz
  • 制限事項: >10kbの変異および複雑な構造的変異は除外されます

タブ区切りファイル (迅速な分析用):

  • tab_delimited/variant_summary.txt.gz - すべての変異の概要
  • tab_delimited/var_citations.txt.gz - PubMedの引用
  • tab_delimited/cross_references.txt.gz - データベースの相互参照

ダウンロード例:

# 最新の月次XMLリリースのダウンロード
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/clinvar_variation/ClinVarVariationRelease_00-latest.xml.gz

# GRCh38のVCFのダウンロード
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar.vcf.gz

4. ClinVarデータの処理と分析

XMLファイルの操作

XMLファイルを処理して、変異の詳細、分類、およびエビデンスを抽出します。

xml.etreeを使用したPythonの例:

import gzip
import xml.etree.ElementTree as ET

with gzip.open('ClinVarVariationRelease.xml.gz', 'rt') as f:
    for event, elem in ET.iterparse(f, events=('end',)):
        if elem.tag == 'VariationArchive':
            variation_id = elem.attrib.get('VariationID')
            # 臨床的意義、レビュー状況などを抽出します。
            elem.clear()  # メモリを解放します

VCFファイルの操作

bcftoolsまたはPythonを使用して、変異コールにアノテーションを付けたり、臨床的意義でフィルタリングしたりします。

bcftoolsの使用:

# 病原性変異のフィルタリング
bcftools view -i 'INFO/CLNSIG~"Pathogenic"' clinvar.vcf.gz

# 特定の遺伝子の抽出
bcftools view -i 'INFO/GENEINFO~"BRCA"' clinvar.vcf.gz

# ClinVarを使用してVCFにアノテーションを付けます
bcftools annotate -a clinvar.vcf.gz -c INFO your_variants.vcf

PythonでのPyVCFの使用:

import vcf

vcf_reader = vcf.Reader(filename='clinvar.vcf.gz')
for record in vcf_reader:
    clnsig = record.INFO.get('CLNSIG', [])
    if 'Pathogenic' in clnsig:
        gene = record.INFO.get('GENEINFO', [''])[0]
        print(f"{record.CHROM}:{record.POS} {gene} - {clnsig}")

タブ区切りファイルの操作

(原文がここで切り詰められています)

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

ClinVar Database

Overview

ClinVar is NCBI's freely accessible archive of reports on relationships between human genetic variants and phenotypes, with supporting evidence. The database aggregates information about genomic variation and its relationship to human health, providing standardized variant classifications used in clinical genetics and research.

When to Use This Skill

This skill should be used when:

  • Searching for variants by gene, condition, or clinical significance
  • Interpreting clinical significance classifications (pathogenic, benign, VUS)
  • Accessing ClinVar data programmatically via E-utilities API
  • Downloading and processing bulk data from FTP
  • Understanding review status and star ratings
  • Resolving conflicting variant interpretations
  • Annotating variant call sets with clinical significance

Core Capabilities

1. Search and Query ClinVar

Web Interface Queries

Search ClinVar using the web interface at https://www.ncbi.nlm.nih.gov/clinvar/

Common search patterns:

  • By gene: BRCA1[gene]
  • By clinical significance: pathogenic[CLNSIG]
  • By condition: breast cancer[disorder]
  • By variant: NM_000059.3:c.1310_1313del[variant name]
  • By chromosome: 13[chr]
  • Combined: BRCA1[gene] AND pathogenic[CLNSIG]

Programmatic Access via E-utilities

Access ClinVar programmatically using NCBI's E-utilities API. Refer to references/api_reference.md for comprehensive API documentation including:

  • esearch - Search for variants matching criteria
  • esummary - Retrieve variant summaries
  • efetch - Download full XML records
  • elink - Find related records in other NCBI databases

Quick example using curl:

# Search for pathogenic BRCA1 variants
curl "https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=clinvar&term=BRCA1[gene]+AND+pathogenic[CLNSIG]&retmode=json"

Best practices:

  • Test queries on the web interface before automating
  • Use API keys to increase rate limits from 3 to 10 requests/second
  • Implement exponential backoff for rate limit errors
  • Set Entrez.email when using Biopython

2. Interpret Clinical Significance

Understanding Classifications

ClinVar uses standardized terminology for variant classifications. Refer to references/clinical_significance.md for detailed interpretation guidelines.

Key germline classification terms (ACMG/AMP):

  • Pathogenic (P) - Variant causes disease (~99% probability)
  • Likely Pathogenic (LP) - Variant likely causes disease (~90% probability)
  • Uncertain Significance (VUS) - Insufficient evidence to classify
  • Likely Benign (LB) - Variant likely does not cause disease
  • Benign (B) - Variant does not cause disease

Review status (star ratings):

  • ★★★★ Practice guideline - Highest confidence
  • ★★★ Expert panel review (e.g., ClinGen) - High confidence
  • ★★ Multiple submitters, no conflicts - Moderate confidence
  • ★ Single submitter with criteria - Standard weight
  • ☆ No assertion criteria - Low confidence

Critical considerations:

  • Always check review status - prefer ★★★ or ★★★★ ratings
  • Conflicting interpretations require manual evaluation
  • Classifications may change as new evidence emerges
  • VUS (uncertain significance) variants lack sufficient evidence for clinical use

3. Download Bulk Data from FTP

Access ClinVar FTP Site

Download complete datasets from ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/

Refer to references/data_formats.md for comprehensive documentation on file formats and processing.

Update schedule:

  • Monthly releases: First Thursday of each month (complete dataset, archived)
  • Weekly updates: Every Monday (incremental updates)

Available Formats

XML files (most comprehensive):

  • VCV (Variation) files: xml/clinvar_variation/ - Variant-centric aggregation
  • RCV (Record) files: xml/RCV/ - Variant-condition pairs
  • Include full submission details, evidence, and metadata

VCF files (for genomic pipelines):

  • GRCh37: vcf_GRCh37/clinvar.vcf.gz
  • GRCh38: vcf_GRCh38/clinvar.vcf.gz
  • Limitations: Excludes variants >10kb and complex structural variants

Tab-delimited files (for quick analysis):

  • tab_delimited/variant_summary.txt.gz - Summary of all variants
  • tab_delimited/var_citations.txt.gz - PubMed citations
  • tab_delimited/cross_references.txt.gz - Database cross-references

Example download:

# Download latest monthly XML release
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/clinvar_variation/ClinVarVariationRelease_00-latest.xml.gz

# Download VCF for GRCh38
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar.vcf.gz

4. Process and Analyze ClinVar Data

Working with XML Files

Process XML files to extract variant details, classifications, and evidence.

Python example with xml.etree:

import gzip
import xml.etree.ElementTree as ET

with gzip.open('ClinVarVariationRelease.xml.gz', 'rt') as f:
    for event, elem in ET.iterparse(f, events=('end',)):
        if elem.tag == 'VariationArchive':
            variation_id = elem.attrib.get('VariationID')
            # Extract clinical significance, review status, etc.
            elem.clear()  # Free memory

Working with VCF Files

Annotate variant calls or filter by clinical significance using bcftools or Python.

Using bcftools:

# Filter pathogenic variants
bcftools view -i 'INFO/CLNSIG~"Pathogenic"' clinvar.vcf.gz

# Extract specific genes
bcftools view -i 'INFO/GENEINFO~"BRCA"' clinvar.vcf.gz

# Annotate your VCF with ClinVar
bcftools annotate -a clinvar.vcf.gz -c INFO your_variants.vcf

Using PyVCF in Python:

import vcf

vcf_reader = vcf.Reader(filename='clinvar.vcf.gz')
for record in vcf_reader:
    clnsig = record.INFO.get('CLNSIG', [])
    if 'Pathogenic' in clnsig:
        gene = record.INFO.get('GENEINFO', [''])[0]
        print(f"{record.CHROM}:{record.POS} {gene} - {clnsig}")

Working with Tab-Delimited Files

Use pandas or command-line tools for rapid filtering and analysis.

Using pandas:

import pandas as pd

# Load variant summary
df = pd.read_csv('variant_summary.txt.gz', sep='\t', compression='gzip')

# Filter pathogenic variants in specific gene
pathogenic_brca = df[
    (df['GeneSymbol'] == 'BRCA1') &
    (df['ClinicalSignificance'].str.contains('Pathogenic', na=False))
]

# Count variants by clinical significance
sig_counts = df['ClinicalSignificance'].value_counts()

Using command-line tools:

# Extract pathogenic variants for specific gene
zcat variant_summary.txt.gz | \
  awk -F'\t' '$7=="TP53" && $13~"Pathogenic"' | \
  cut -f1,5,7,13,14

5. Handle Conflicting Interpretations

When multiple submitters provide different classifications for the same variant, ClinVar reports "Conflicting interpretations of pathogenicity."

Resolution strategy:

  1. Check review status (star rating) - higher ratings carry more weight
  2. Examine evidence and assertion criteria from each submitter
  3. Consider submission dates - newer submissions may reflect updated evidence
  4. Review population frequency data (e.g., gnomAD) for context
  5. Consult expert panel classifications (★★★) when available
  6. For clinical use, always defer to a genetics professional

Search query to exclude conflicts:

TP53[gene] AND pathogenic[CLNSIG] NOT conflicting[RVSTAT]

6. Track Classification Updates

Variant classifications may change over time as new evidence emerges.

Why classifications change:

  • New functional studies or clinical data
  • Updated population frequency information
  • Revised ACMG/AMP guidelines
  • Segregation data from additional families

Best practices:

  • Document ClinVar version and access date for reproducibility
  • Re-check classifications periodically for critical variants
  • Subscribe to ClinVar mailing list for major updates
  • Use monthly archived releases for stable datasets

7. Submit Data to ClinVar

Organizations can submit variant interpretations to ClinVar.

Submission methods:

Requirements:

  • Organizational account with NCBI
  • Assertion criteria (preferably ACMG/AMP guidelines)
  • Supporting evidence for classification

Contact: clinvar@ncbi.nlm.nih.gov for submission account setup.

Workflow Examples

Example 1: Identify High-Confidence Pathogenic Variants in a Gene

Objective: Find pathogenic variants in CFTR gene with expert panel review.

Steps:

  1. Search using web interface or E-utilities:
    CFTR[gene] AND pathogenic[CLNSIG] AND (reviewed by expert panel[RVSTAT] OR practice guideline[RVSTAT])
  2. Review results, noting review status (should be ★★★ or ★★★★)
  3. Export variant list or retrieve full records via efetch
  4. Cross-reference with clinical presentation if applicable

Example 2: Annotate VCF with ClinVar Classifications

Objective: Add clinical significance annotations to variant calls.

Steps:

  1. Download appropriate ClinVar VCF (match genome build: GRCh37 or GRCh38):
    wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar.vcf.gz
    wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar.vcf.gz.tbi
  2. Annotate using bcftools:
    bcftools annotate -a clinvar.vcf.gz \
      -c INFO/CLNSIG,INFO/CLNDN,INFO/CLNREVSTAT \
      -o annotated_variants.vcf \
      your_variants.vcf
  3. Filter annotated VCF for pathogenic variants:
    bcftools view -i 'INFO/CLNSIG~"Pathogenic"' annotated_variants.vcf

Example 3: Analyze Variants for a Specific Disease

Objective: Study all variants associated with hereditary breast cancer.

Steps:

  1. Search by condition:
    hereditary breast cancer[disorder] OR "Breast-ovarian cancer, familial"[disorder]
  2. Download results as CSV or retrieve via E-utilities
  3. Filter by review status to prioritize high-confidence variants
  4. Analyze distribution across genes (BRCA1, BRCA2, PALB2, etc.)
  5. Examine variants with conflicting interpretations separately

Example 4: Bulk Download and Database Construction

Objective: Build a local ClinVar database for analysis pipeline.

Steps:

  1. Download monthly release for reproducibility:
    wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/clinvar_variation/ClinVarVariationRelease_YYYY-MM.xml.gz
  2. Parse XML and load into database (PostgreSQL, MySQL, MongoDB)
  3. Index by gene, position, clinical significance, review status
  4. Implement version tracking for updates
  5. Schedule monthly updates from FTP site

Important Limitations and Considerations

Data Quality

  • Not all submissions have equal weight - Check review status (star ratings)
  • Conflicting interpretations exist - Require manual evaluation
  • Historical submissions may be outdated - Newer data may be more accurate
  • VUS classification is not a clinical diagnosis - Means insufficient evidence

Scope Limitations

  • Not for direct clinical diagnosis - Always involve genetics professional
  • Population-specific - Variant frequencies vary by ancestry
  • Incomplete coverage - Not all genes or variants are well-studied
  • Version dependencies - Coordinate genome build (GRCh37/GRCh38) across analyses

Technical Limitations

  • VCF files exclude large variants - Variants >10kb not in VCF format
  • Rate limits on API - 3 req/sec without key, 10 req/sec with API key
  • File sizes - Full XML releases are multi-GB compressed files
  • No real-time updates - Website updated weekly, FTP monthly/weekly

Resources

Reference Documentation

This skill includes comprehensive reference documentation:

  • references/api_reference.md - Complete E-utilities API documentation with examples for esearch, esummary, efetch, and elink; includes rate limits, authentication, and Python/Biopython code samples

  • references/clinical_significance.md - Detailed guide to interpreting clinical significance classifications, review status star ratings, conflict resolution, and best practices for variant interpretation

  • references/data_formats.md - Documentation for XML, VCF, and tab-delimited file formats; FTP directory structure, processing examples, and format selection guidance

External Resources

Contact

For questions about ClinVar or data submission: clinvar@ncbi.nlm.nih.gov

同梱ファイル

※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。