📦 その他コミュニティ

glm4v-analyze-image

智谱AIが開発した画像分析モデルで、画像の内容を理解し、質問に答えたり、何が写っているかを識別したりするなど、ビジネスシーンで役立つ様々な視覚情報解析を支援するSkill。

📜 元の英語説明(参考)

智谱AI的视觉语言模型，用于图像分析、内容识别和视觉问答

🇯🇵 日本人クリエイター向け解説

一言でいうと

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux

mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o glm4v-analyze-image.zip https://jpskill.com/download/17871.zip && unzip -o glm4v-analyze-image.zip && rm glm4v-analyze-image.zip

🪟 Windows (PowerShell)

$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/17871.zip -OutFile "$d\glm4v-analyze-image.zip"; Expand-Archive "$d\glm4v-analyze-image.zip" -DestinationPath $d -Force; ri "$d\glm4v-analyze-image.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)

1. 下の青いボタンを押して glm4v-analyze-image.zip をダウンロード
2. ZIPファイルをダブルクリックで解凍 → glm4v-analyze-image フォルダができる
3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
4. Claude Code を再起動

⬇ .zip でダウンロード(推奨) ⬇ .skill 形式(上級者用) 元のソース ↗

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
- · macOS / Linux: ~/.claude/skills/
- · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →

最終更新: 2026-05-18
取得日時: 2026-05-18
同梱ファイル: 1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

GLM-4V画像分析ツールガイド

核心能力

画像内容の識別と記述
視覚的な質問応答と推論
画像の詳細分析
マルチモーダルな理解と生成

呼び出し仕様

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "画像URL",
    "prompt": "分析プロンプト"
  }
}

以下は、glm4v_analyze_imageツールを呼び出す際の正しい例と誤った例です。必ず正しい形式に従ってください。

✅ 正しい例

{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

❌ 誤った例 (以下のよくある間違いを避けてください)

引用符またはカンマの欠落:

{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

( } が欠落)

パラメータ名の誤り:
```
{"img_url": "https://path/to/image.jpg"}
```
( "image_url" であるべきところが "img_url" になっている)

モデル名の誤り:

{"model": "glm4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

( "glm-4v-flash" であるべき)

重要な指示

モデル選択: glm-4v-flash モデルを使用します。
画像形式: 一般的な画像形式（JPEG, PNG, WebPなど）をサポートします。
プロンプト設計: 明確で具体的な分析指示を与えます。
URL有効性: 画像URLが公開アクセス可能であることを確認します。

使用シーン

画像記述

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash", 
    "image_url": "https://example.com/image.jpg",
    "prompt": "詳細にこの画像の内容を記述してください"
  }
}

視覚的な質問応答

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "https://example.com/image.jpg", 
    "prompt": "画像には何人がいますか？彼らは何をしていますか？"
  }
}

詳細分析

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "https://example.com/image.jpg",
    "prompt": "画像中の文字内容と技術的な詳細を分析してください"
  }
}

ベストプラクティス

プロンプト設計

具体的で明確: "画像中の人物の動作と表情を記述してください"
タスク指向: "画像中のすべての物体を識別して分類してください"
詳細な要求: "色、形、空間関係などの詳細に注意してください"

エラー処理

画像URLが有効かどうかを確認します。
画像形式がサポートされていることを確認します。
ネットワークタイムアウトの状況を処理します。

能力範囲

✅ 物体認識と分類
✅ シーンの理解と記述
✅ 文字認識（OCR）
✅ 感情と雰囲気の分析
✅ 技術的な詳細の抽出

制限事項

❌ センシティブな内容や不適切な内容を処理できません。
❌ 画像のサイズと解像度に制限があります。
❌ リアルタイムのビデオストリームはサポートされていません。
❌ 3Dモデルの分析はサポートされていません。

性能最適化

適切な画像サイズを使用します。
具体的な分析ニーズを提供します。
複雑な分析は段階的に行います。
他のツールと組み合わせて検証します。

📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

GLM-4V图像分析工具指南

核心能力

图像内容识别和描述
视觉问答和推理
图像细节分析
多模态理解和生成

调用规范

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "图片URL",
    "prompt": "分析提示语"
  }
}

以下是调用 glm4v_analyze_image 工具的正确和错误示例。请务必遵循正确格式。

✅ 正确示例

{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

❌ 错误示例 (请避免以下常见错误)

缺少引号或逗号:

{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

(缺少 })

参数名错误:
```
{"img_url": "https://path/to/image.jpg"}
```
(应为 "image_url" 而非 "img_url")

模型名称错误:

{"model": "glm4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}

(应为 "glm-4v-flash")

关键指令

模型选择: 使用 glm-4v-flash 模型
图片格式: 支持常见图片格式（JPEG, PNG, WebP等）
提示语设计: 清晰具体的分析指令
URL有效性: 确保图片URL可公开访问

使用场景

图像描述

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash", 
    "image_url": "https://example.com/image.jpg",
    "prompt": "详细描述这张图片的内容"
  }
}

视觉问答

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "https://example.com/image.jpg", 
    "prompt": "图片中有多少人？他们在做什么？"
  }
}

细节分析

{
  "tool_name": "glm4v_analyze_image",
  "parameters": {
    "model": "glm-4v-flash",
    "image_url": "https://example.com/image.jpg",
    "prompt": "分析图片中的文字内容和技术细节"
  }
}

最佳实践

提示语设计

具体明确: "描述图片中人物的动作和表情"
任务导向: "识别图片中的所有物体并分类"
细节要求: "注意颜色、形状、空间关系等细节"

错误处理

检查图片URL是否有效
确认图片格式支持
处理网络超时情况

能力范围

✅ 物体识别和分类
✅ 场景理解和描述
✅ 文字识别（OCR）
✅ 情感和氛围分析
✅ 技术细节提取

限制说明

❌ 不能处理敏感或不当内容
❌ 图片大小和分辨率有限制
❌ 实时视频流不支持
❌ 3D模型分析不支持

性能优化

使用合适的图片尺寸
提供具体的分析需求
分步骤进行复杂分析
结合其他工具进行验证