jpskill.com
📦 その他 コミュニティ

glm4v-analyze-image

智谱AIが開発した画像分析モデルで、画像の内容を理解し、質問に答えたり、何が写っているかを識別したりするなど、ビジネスシーンで役立つ様々な視覚情報解析を支援するSkill。

📜 元の英語説明(参考)

智谱AI的视觉语言模型,用于图像分析、内容识别和视觉问答

🇯🇵 日本人クリエイター向け解説

一言でいうと

智谱AIが開発した画像分析モデルで、画像の内容を理解し、質問に答えたり、何が写っているかを識別したりするなど、ビジネスシーンで役立つ様々な視覚情報解析を支援するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o glm4v-analyze-image.zip https://jpskill.com/download/17871.zip && unzip -o glm4v-analyze-image.zip && rm glm4v-analyze-image.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/17871.zip -OutFile "$d\glm4v-analyze-image.zip"; Expand-Archive "$d\glm4v-analyze-image.zip" -DestinationPath $d -Force; ri "$d\glm4v-analyze-image.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して glm4v-analyze-image.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → glm4v-analyze-image フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

GLM-4V画像分析ツールガイド

核心能力

  • 画像内容の識別と記述
  • 視覚的な質問応答と推論
  • 画像の詳細分析
  • マルチモーダルな理解と生成

呼び出し仕様

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "画像URL",
    "prompt": "分析プロンプト"
  }
}

以下は、glm4v_analyze_imageツールを呼び出す際の正しい例と誤った例です。必ず正しい形式に従ってください。

✅ 正しい例

{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

❌ 誤った例 (以下のよくある間違いを避けてください)

  • 引用符またはカンマの欠落:

    {"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

    ( } が欠落)

  • パラメータ名の誤り:

    {"img_url": "https://path/to/image.jpg"}

    ( "image_url" であるべきところが "img_url" になっている)

  • モデル名の誤り:

    {"model": "glm4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

    ( "glm-4v-flash" であるべき)

重要な指示

  1. モデル選択: glm-4v-flash モデルを使用します。
  2. 画像形式: 一般的な画像形式(JPEG, PNG, WebPなど)をサポートします。
  3. プロンプト設計: 明確で具体的な分析指示を与えます。
  4. URL有効性: 画像URLが公開アクセス可能であることを確認します。

使用シーン

画像記述

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash", 
    "image_url": "https://example.com/image.jpg",
    "prompt": "詳細にこの画像の内容を記述してください"
  }
}

視覚的な質問応答

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "https://example.com/image.jpg", 
    "prompt": "画像には何人がいますか?彼らは何をしていますか?"
  }
}

詳細分析

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "https://example.com/image.jpg",
    "prompt": "画像中の文字内容と技術的な詳細を分析してください"
  }
}

ベストプラクティス

プロンプト設計

  • 具体的で明確: "画像中の人物の動作と表情を記述してください"
  • タスク指向: "画像中のすべての物体を識別して分類してください"
  • 詳細な要求: "色、形、空間関係などの詳細に注意してください"

エラー処理

  • 画像URLが有効かどうかを確認します。
  • 画像形式がサポートされていることを確認します。
  • ネットワークタイムアウトの状況を処理します。

能力範囲

  • ✅ 物体認識と分類
  • ✅ シーンの理解と記述
  • ✅ 文字認識(OCR)
  • ✅ 感情と雰囲気の分析
  • ✅ 技術的な詳細の抽出

制限事項

  • ❌ センシティブな内容や不適切な内容を処理できません。
  • ❌ 画像のサイズと解像度に制限があります。
  • ❌ リアルタイムのビデオストリームはサポートされていません。
  • ❌ 3Dモデルの分析はサポートされていません。

性能最適化

  • 適切な画像サイズを使用します。
  • 具体的な分析ニーズを提供します。
  • 複雑な分析は段階的に行います。
  • 他のツールと組み合わせて検証します。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

GLM-4V图像分析工具指南

核心能力

  • 图像内容识别和描述
  • 视觉问答和推理
  • 图像细节分析
  • 多模态理解和生成

调用规范

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "图片URL",
    "prompt": "分析提示语"
  }
}

以下是调用 glm4v_analyze_image 工具的正确错误示例。请务必遵循正确格式。

✅ 正确示例

{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

❌ 错误示例 (请避免以下常见错误)

  • 缺少引号或逗号:

    {"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

    (缺少 })

  • 参数名错误:

    {"img_url": "https://path/to/image.jpg"}

    (应为 "image_url" 而非 "img_url")

  • 模型名称错误:

    {"model": "glm4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

    (应为 "glm-4v-flash")

关键指令

  1. 模型选择: 使用 glm-4v-flash 模型
  2. 图片格式: 支持常见图片格式(JPEG, PNG, WebP等)
  3. 提示语设计: 清晰具体的分析指令
  4. URL有效性: 确保图片URL可公开访问

使用场景

图像描述

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash", 
    "image_url": "https://example.com/image.jpg",
    "prompt": "详细描述这张图片的内容"
  }
}

视觉问答

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "https://example.com/image.jpg", 
    "prompt": "图片中有多少人?他们在做什么?"
  }
}

细节分析

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "https://example.com/image.jpg",
    "prompt": "分析图片中的文字内容和技术细节"
  }
}

最佳实践

提示语设计

  • 具体明确: "描述图片中人物的动作和表情"
  • 任务导向: "识别图片中的所有物体并分类"
  • 细节要求: "注意颜色、形状、空间关系等细节"

错误处理

  • 检查图片URL是否有效
  • 确认图片格式支持
  • 处理网络超时情况

能力范围

  • ✅ 物体识别和分类
  • ✅ 场景理解和描述
  • ✅ 文字识别(OCR)
  • ✅ 情感和氛围分析
  • ✅ 技术细节提取

限制说明

  • ❌ 不能处理敏感或不当内容
  • ❌ 图片大小和分辨率有限制
  • ❌ 实时视频流不支持
  • ❌ 3D模型分析不支持

性能优化

  • 使用合适的图片尺寸
  • 提供具体的分析需求
  • 分步骤进行复杂分析
  • 结合其他工具进行验证