glm4v-analyze-image
智谱AIが開発した画像分析モデルで、画像の内容を理解し、質問に答えたり、何が写っているかを識別したりするなど、ビジネスシーンで役立つ様々な視覚情報解析を支援するSkill。
📜 元の英語説明(参考)
智谱AI的视觉语言模型,用于图像分析、内容识别和视觉问答
🇯🇵 日本人クリエイター向け解説
智谱AIが開発した画像分析モデルで、画像の内容を理解し、質問に答えたり、何が写っているかを識別したりするなど、ビジネスシーンで役立つ様々な視覚情報解析を支援するSkill。
※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。
下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o glm4v-analyze-image.zip https://jpskill.com/download/17871.zip && unzip -o glm4v-analyze-image.zip && rm glm4v-analyze-image.zip
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/17871.zip -OutFile "$d\glm4v-analyze-image.zip"; Expand-Archive "$d\glm4v-analyze-image.zip" -DestinationPath $d -Force; ri "$d\glm4v-analyze-image.zip"
完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。
💾 手動でダウンロードしたい(コマンドが難しい人向け)
- 1. 下の青いボタンを押して
glm4v-analyze-image.zipをダウンロード - 2. ZIPファイルをダブルクリックで解凍 →
glm4v-analyze-imageフォルダができる - 3. そのフォルダを
C:\Users\あなたの名前\.claude\skills\(Win)または~/.claude/skills/(Mac)へ移動 - 4. Claude Code を再起動
⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。
🎯 このSkillでできること
下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。
📦 インストール方法 (3ステップ)
- 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
- 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
- 3. 展開してできたフォルダを、ホームフォルダの
.claude/skills/に置く- · macOS / Linux:
~/.claude/skills/ - · Windows:
%USERPROFILE%\.claude\skills\
- · macOS / Linux:
Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。
詳しい使い方ガイドを見る →- 最終更新
- 2026-05-18
- 取得日時
- 2026-05-18
- 同梱ファイル
- 1
📖 Skill本文(日本語訳)
※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。
GLM-4V画像分析ツールガイド
核心能力
- 画像内容の識別と記述
- 視覚的な質問応答と推論
- 画像の詳細分析
- マルチモーダルな理解と生成
呼び出し仕様
{
"tool_name": "glm4v_analyze_image",
"parameters": {
"model": "glm-4v-flash",
"image_url": "画像URL",
"prompt": "分析プロンプト"
}
}
以下は、glm4v_analyze_imageツールを呼び出す際の正しい例と誤った例です。必ず正しい形式に従ってください。
✅ 正しい例
{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}
❌ 誤った例 (以下のよくある間違いを避けてください)
-
引用符またはカンマの欠落:
{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}(
}が欠落) -
パラメータ名の誤り:
{"img_url": "https://path/to/image.jpg"}( "image_url" であるべきところが "img_url" になっている)
-
モデル名の誤り:
{"model": "glm4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}( "glm-4v-flash" であるべき)
重要な指示
- モデル選択:
glm-4v-flashモデルを使用します。 - 画像形式: 一般的な画像形式(JPEG, PNG, WebPなど)をサポートします。
- プロンプト設計: 明確で具体的な分析指示を与えます。
- URL有効性: 画像URLが公開アクセス可能であることを確認します。
使用シーン
画像記述
{
"tool_name": "glm4v_analyze_image",
"parameters": {
"model": "glm-4v-flash",
"image_url": "https://example.com/image.jpg",
"prompt": "詳細にこの画像の内容を記述してください"
}
}
視覚的な質問応答
{
"tool_name": "glm4v_analyze_image",
"parameters": {
"model": "glm-4v-flash",
"image_url": "https://example.com/image.jpg",
"prompt": "画像には何人がいますか?彼らは何をしていますか?"
}
}
詳細分析
{
"tool_name": "glm4v_analyze_image",
"parameters": {
"model": "glm-4v-flash",
"image_url": "https://example.com/image.jpg",
"prompt": "画像中の文字内容と技術的な詳細を分析してください"
}
}
ベストプラクティス
プロンプト設計
- 具体的で明確: "画像中の人物の動作と表情を記述してください"
- タスク指向: "画像中のすべての物体を識別して分類してください"
- 詳細な要求: "色、形、空間関係などの詳細に注意してください"
エラー処理
- 画像URLが有効かどうかを確認します。
- 画像形式がサポートされていることを確認します。
- ネットワークタイムアウトの状況を処理します。
能力範囲
- ✅ 物体認識と分類
- ✅ シーンの理解と記述
- ✅ 文字認識(OCR)
- ✅ 感情と雰囲気の分析
- ✅ 技術的な詳細の抽出
制限事項
- ❌ センシティブな内容や不適切な内容を処理できません。
- ❌ 画像のサイズと解像度に制限があります。
- ❌ リアルタイムのビデオストリームはサポートされていません。
- ❌ 3Dモデルの分析はサポートされていません。
性能最適化
- 適切な画像サイズを使用します。
- 具体的な分析ニーズを提供します。
- 複雑な分析は段階的に行います。
- 他のツールと組み合わせて検証します。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開
GLM-4V图像分析工具指南
核心能力
- 图像内容识别和描述
- 视觉问答和推理
- 图像细节分析
- 多模态理解和生成
调用规范
{
"tool_name": "glm4v_analyze_image",
"parameters": {
"model": "glm-4v-flash",
"image_url": "图片URL",
"prompt": "分析提示语"
}
}
以下是调用 glm4v_analyze_image 工具的正确和错误示例。请务必遵循正确格式。
✅ 正确示例
{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}
❌ 错误示例 (请避免以下常见错误)
-
缺少引号或逗号:
{"model": "glm-4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}(缺少
}) -
参数名错误:
{"img_url": "https://path/to/image.jpg"}(应为 "image_url" 而非 "img_url")
-
模型名称错误:
{"model": "glm4v-flash", "image_url": "https://path/to/image.jpg", "prompt": "Describe this image."}(应为 "glm-4v-flash")
关键指令
- 模型选择: 使用
glm-4v-flash模型 - 图片格式: 支持常见图片格式(JPEG, PNG, WebP等)
- 提示语设计: 清晰具体的分析指令
- URL有效性: 确保图片URL可公开访问
使用场景
图像描述
{
"tool_name": "glm4v_analyze_image",
"parameters": {
"model": "glm-4v-flash",
"image_url": "https://example.com/image.jpg",
"prompt": "详细描述这张图片的内容"
}
}
视觉问答
{
"tool_name": "glm4v_analyze_image",
"parameters": {
"model": "glm-4v-flash",
"image_url": "https://example.com/image.jpg",
"prompt": "图片中有多少人?他们在做什么?"
}
}
细节分析
{
"tool_name": "glm4v_analyze_image",
"parameters": {
"model": "glm-4v-flash",
"image_url": "https://example.com/image.jpg",
"prompt": "分析图片中的文字内容和技术细节"
}
}
最佳实践
提示语设计
- 具体明确: "描述图片中人物的动作和表情"
- 任务导向: "识别图片中的所有物体并分类"
- 细节要求: "注意颜色、形状、空间关系等细节"
错误处理
- 检查图片URL是否有效
- 确认图片格式支持
- 处理网络超时情况
能力范围
- ✅ 物体识别和分类
- ✅ 场景理解和描述
- ✅ 文字识别(OCR)
- ✅ 情感和氛围分析
- ✅ 技术细节提取
限制说明
- ❌ 不能处理敏感或不当内容
- ❌ 图片大小和分辨率有限制
- ❌ 实时视频流不支持
- ❌ 3D模型分析不支持
性能优化
- 使用合适的图片尺寸
- 提供具体的分析需求
- 分步骤进行复杂分析
- 结合其他工具进行验证