jpskill.com
🛠️ 開発・MCP コミュニティ

gene-database

Query NCBI Gene via E-utilities/Datasets API. Search by symbol/ID, retrieve gene info (RefSeqs, GO, locations, phenotypes), batch lookups, for gene annotation and functional analysis.

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o gene-database.zip https://jpskill.com/download/18415.zip && unzip -o gene-database.zip && rm gene-database.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/18415.zip -OutFile "$d\gene-database.zip"; Expand-Archive "$d\gene-database.zip" -DestinationPath $d -Force; ri "$d\gene-database.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して gene-database.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → gene-database フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
6

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

遺伝子データベース

概要

NCBI Gene は、多様な種からの遺伝子情報を統合した包括的なデータベースです。命名法、参照配列(RefSeqs)、染色体地図、生物学的経路、遺伝的変異、表現型、およびグローバルなゲノムリソースへの相互参照を提供します。

この Skill の使用時

この Skill は、遺伝子記号または ID による検索、遺伝子配列およびメタデータの取得、遺伝子機能および経路の分析、またはバッチ遺伝子ルックアップの実行など、遺伝子データを扱う場合に使用する必要があります。

クイックスタート

NCBI は、遺伝子データアクセス用に 2 つの主要な API を提供しています。

  1. E-utilities (従来型): 柔軟なクエリによるすべての Entrez データベース用のフル機能 API
  2. NCBI Datasets API (より新しい): 簡素化されたワークフローによる遺伝子データ取得用に最適化

複雑なクエリおよびデータベース間の検索には E-utilities を選択してください。メタデータと配列を含む簡単な遺伝子データ取得には Datasets API を選択してください。

一般的なワークフロー

記号または名前による遺伝子の検索

生物全体で記号または名前によって遺伝子を検索するには:

  1. E-utilities ESearch で scripts/query_gene.py スクリプトを使用します
  2. 遺伝子記号と生物を指定します (例: "BRCA1 in human")
  3. スクリプトは一致する Gene ID を返します

クエリパターンの例:

  • 遺伝子記号: insulin[gene name] AND human[organism]
  • 疾患を持つ遺伝子: dystrophin[gene name] AND muscular dystrophy[disease]
  • 染色体位置: human[organism] AND 17q21[chromosome]

ID による遺伝子情報の取得

既知の Gene ID の詳細な情報を取得するには:

  1. 包括的なデータのために Datasets API で scripts/fetch_gene_data.py を使用します
  2. または、特定の形式のために E-utilities EFetch で scripts/query_gene.py を使用します
  3. 目的の出力形式 (JSON、XML、またはテキスト) を指定します

Datasets API は以下を返します:

  • 遺伝子命名法とエイリアス
  • 転写産物とタンパク質の参照配列 (RefSeqs)
  • 染色体位置とマッピング
  • 遺伝子オントロジー (GO) アノテーション
  • 関連する出版物

バッチ遺伝子ルックアップ

複数の遺伝子を同時に処理するには:

  1. 効率的なバッチ処理のために scripts/batch_gene_lookup.py を使用します
  2. 遺伝子記号または ID のリストを提供します
  3. 記号ベースのクエリのために生物を指定します
  4. スクリプトはレート制限を自動的に処理します (API キーを使用すると 10 リクエスト/秒)

このワークフローは以下に役立ちます:

  • 遺伝子リストの検証
  • 遺伝子パネルのメタデータの取得
  • 遺伝子識別子の相互参照
  • 遺伝子アノテーションテーブルの構築

生物学的コンテキストによる検索

特定の生物学的機能または表現型に関連する遺伝子を見つけるには:

  1. 遺伝子オントロジー (GO) 用語または表現型キーワードで E-utilities を使用します
  2. 経路名または疾患関連によってクエリを実行します
  3. 生物、染色体、またはその他の属性でフィルタリングします

検索例:

  • GO 用語別: GO:0006915[biological process] (アポトーシス)
  • 表現型別: diabetes[phenotype] AND mouse[organism]
  • 経路別: insulin signaling pathway[pathway]

API アクセスパターン

レート制限:

  • API キーなし: E-utilities は 3 リクエスト/秒、Datasets API は 5 リクエスト/秒
  • API キーあり: 両方の API で 10 リクエスト/秒

認証: レート制限を増やすには、https://www.ncbi.nlm.nih.gov/account/ で無料の NCBI API キーを登録してください。

エラー処理: 両方の API は標準の HTTP ステータスコードを返します。一般的なエラーは次のとおりです:

  • 400: 不正な形式のクエリまたは無効なパラメータ
  • 429: レート制限を超過
  • 404: Gene ID が見つかりません

指数バックオフで失敗したリクエストを再試行してください。

スクリプトの使用法

query_gene.py

E-utilities (ESearch, ESummary, EFetch) を使用して NCBI Gene にクエリを実行します。

python scripts/query_gene.py --search "BRCA1" --organism "human"
python scripts/query_gene.py --id 672 --format json
python scripts/query_gene.py --search "insulin[gene] AND diabetes[disease]"

fetch_gene_data.py

NCBI Datasets API を使用して包括的な遺伝子データを取得します。

python scripts/fetch_gene_data.py --gene-id 672
python scripts/fetch_gene_data.py --symbol BRCA1 --taxon human
python scripts/fetch_gene_data.py --symbol TP53 --taxon "Homo sapiens" --output json

batch_gene_lookup.py

複数の遺伝子クエリを効率的に処理します。

python scripts/batch_gene_lookup.py --file gene_list.txt --organism human
python scripts/batch_gene_lookup.py --ids 672,7157,5594 --output results.json

API リファレンス

エンドポイント、パラメータ、応答形式、および例を含む詳細な API ドキュメントについては、以下を参照してください。

  • references/api_reference.md - E-utilities および Datasets API の包括的な API ドキュメント
  • references/common_workflows.md - 追加の例とユースケースパターン

特定の API エンドポイントの詳細、パラメータオプション、または応答構造の情報が必要な場合は、これらのリファレンスを検索してください。

データ形式

NCBI Gene データは、複数の形式で取得できます。

  • JSON: プログラムによる処理に最適な構造化データ
  • XML: 完全なメタデータを含む詳細な階層形式
  • GenBank: アノテーション付きの配列データ
  • FASTA: 配列データのみ
  • Text: 人間が読める要約

最新のアプリケーションには JSON を、詳細なメタデータを必要とするレガシーシステムには XML を、配列解析ワークフローには FASTA を選択してください。

ベストプラクティス

  1. あいまいさを避けるために、遺伝子記号で検索する場合は常に生物を指定してください
  2. 利用可能な場合は、正確なルックアップのためにGene ID を使用してください
  3. API 呼び出しを最小限に抑えるために、複数の遺伝子を扱う場合はバッチリクエストを使用してください
  4. 冗長なクエリを減らすために、結果をローカルにキャッシュしてください
  5. より高いレート制限のために、スクリプトにAPI キーを含めてください
  6. 一時的な障害に対する再試行ロジックでエラーを適切に処理してください
  7. タイプミスを検出するために、バッチ処理の前に遺伝子記号を検証してください

リソース

この Skill には以下が含まれます:

scripts/

  • query_gene.py - E-utilities (ESearch, ESummary, EFetch) を使用して遺伝子にクエリを実行します
  • fetch_gene_data.py - NCBI Datasets API を使用して遺伝子データを取得します
  • batch_gene_lookup.py - 複数の遺伝子クエリを効率的に処理します

references/

  • api_reference.md - 詳細な API ドキュメント

(原文がここで切り詰められています)

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Gene Database

Overview

NCBI Gene is a comprehensive database integrating gene information from diverse species. It provides nomenclature, reference sequences (RefSeqs), chromosomal maps, biological pathways, genetic variations, phenotypes, and cross-references to global genomic resources.

When to Use This Skill

This skill should be used when working with gene data including searching by gene symbol or ID, retrieving gene sequences and metadata, analyzing gene functions and pathways, or performing batch gene lookups.

Quick Start

NCBI provides two main APIs for gene data access:

  1. E-utilities (Traditional): Full-featured API for all Entrez databases with flexible querying
  2. NCBI Datasets API (Newer): Optimized for gene data retrieval with simplified workflows

Choose E-utilities for complex queries and cross-database searches. Choose Datasets API for straightforward gene data retrieval with metadata and sequences in a single request.

Common Workflows

Search Genes by Symbol or Name

To search for genes by symbol or name across organisms:

  1. Use the scripts/query_gene.py script with E-utilities ESearch
  2. Specify the gene symbol and organism (e.g., "BRCA1 in human")
  3. The script returns matching Gene IDs

Example query patterns:

  • Gene symbol: insulin[gene name] AND human[organism]
  • Gene with disease: dystrophin[gene name] AND muscular dystrophy[disease]
  • Chromosome location: human[organism] AND 17q21[chromosome]

Retrieve Gene Information by ID

To fetch detailed information for known Gene IDs:

  1. Use scripts/fetch_gene_data.py with the Datasets API for comprehensive data
  2. Alternatively, use scripts/query_gene.py with E-utilities EFetch for specific formats
  3. Specify desired output format (JSON, XML, or text)

The Datasets API returns:

  • Gene nomenclature and aliases
  • Reference sequences (RefSeqs) for transcripts and proteins
  • Chromosomal location and mapping
  • Gene Ontology (GO) annotations
  • Associated publications

Batch Gene Lookups

For multiple genes simultaneously:

  1. Use scripts/batch_gene_lookup.py for efficient batch processing
  2. Provide a list of gene symbols or IDs
  3. Specify the organism for symbol-based queries
  4. The script handles rate limiting automatically (10 requests/second with API key)

This workflow is useful for:

  • Validating gene lists
  • Retrieving metadata for gene panels
  • Cross-referencing gene identifiers
  • Building gene annotation tables

Search by Biological Context

To find genes associated with specific biological functions or phenotypes:

  1. Use E-utilities with Gene Ontology (GO) terms or phenotype keywords
  2. Query by pathway names or disease associations
  3. Filter by organism, chromosome, or other attributes

Example searches:

  • By GO term: GO:0006915[biological process] (apoptosis)
  • By phenotype: diabetes[phenotype] AND mouse[organism]
  • By pathway: insulin signaling pathway[pathway]

API Access Patterns

Rate Limits:

  • Without API key: 3 requests/second for E-utilities, 5 requests/second for Datasets API
  • With API key: 10 requests/second for both APIs

Authentication: Register for a free NCBI API key at https://www.ncbi.nlm.nih.gov/account/ to increase rate limits.

Error Handling: Both APIs return standard HTTP status codes. Common errors include:

  • 400: Malformed query or invalid parameters
  • 429: Rate limit exceeded
  • 404: Gene ID not found

Retry failed requests with exponential backoff.

Script Usage

query_gene.py

Query NCBI Gene using E-utilities (ESearch, ESummary, EFetch).

python scripts/query_gene.py --search "BRCA1" --organism "human"
python scripts/query_gene.py --id 672 --format json
python scripts/query_gene.py --search "insulin[gene] AND diabetes[disease]"

fetch_gene_data.py

Fetch comprehensive gene data using NCBI Datasets API.

python scripts/fetch_gene_data.py --gene-id 672
python scripts/fetch_gene_data.py --symbol BRCA1 --taxon human
python scripts/fetch_gene_data.py --symbol TP53 --taxon "Homo sapiens" --output json

batch_gene_lookup.py

Process multiple gene queries efficiently.

python scripts/batch_gene_lookup.py --file gene_list.txt --organism human
python scripts/batch_gene_lookup.py --ids 672,7157,5594 --output results.json

API References

For detailed API documentation including endpoints, parameters, response formats, and examples, refer to:

  • references/api_reference.md - Comprehensive API documentation for E-utilities and Datasets API
  • references/common_workflows.md - Additional examples and use case patterns

Search these references when needing specific API endpoint details, parameter options, or response structure information.

Data Formats

NCBI Gene data can be retrieved in multiple formats:

  • JSON: Structured data ideal for programmatic processing
  • XML: Detailed hierarchical format with full metadata
  • GenBank: Sequence data with annotations
  • FASTA: Sequence data only
  • Text: Human-readable summaries

Choose JSON for modern applications, XML for legacy systems requiring detailed metadata, and FASTA for sequence analysis workflows.

Best Practices

  1. Always specify organism when searching by gene symbol to avoid ambiguity
  2. Use Gene IDs for precise lookups when available
  3. Batch requests when working with multiple genes to minimize API calls
  4. Cache results locally to reduce redundant queries
  5. Include API key in scripts for higher rate limits
  6. Handle errors gracefully with retry logic for transient failures
  7. Validate gene symbols before batch processing to catch typos

Resources

This skill includes:

scripts/

  • query_gene.py - Query genes using E-utilities (ESearch, ESummary, EFetch)
  • fetch_gene_data.py - Fetch gene data using NCBI Datasets API
  • batch_gene_lookup.py - Handle multiple gene queries efficiently

references/

  • api_reference.md - Detailed API documentation for both E-utilities and Datasets API
  • common_workflows.md - Examples of common gene queries and use cases

同梱ファイル

※ ZIPに含まれるファイル一覧。`SKILL.md` 本体に加え、参考資料・サンプル・スクリプトが入っている場合があります。