jpskill.com
✍️ ライティング コミュニティ

blog-factcheck

ブログ記事内の統計データや主張について、引用元URLを調べて実際にデータが存在するかを確認し、一致度を評価することで、記事の信頼性を検証するSkill。

📜 元の英語説明(参考)

Verify statistics and claims in blog posts by fetching cited source URLs and checking if the claimed data actually appears on the page. Extracts all statistical claims (numbers, percentages, named sources), fetches each cited URL via WebFetch, and scores match confidence (exact match 1.0, paraphrase 0.7-0.9, not found 0.0). Flags uncited claims as UNVERIFIED. Use when user says "fact check", "verify statistics", "check sources", "validate claims", "factcheck", "source verification".

🇯🇵 日本人クリエイター向け解説

一言でいうと

ブログ記事内の統計データや主張について、引用元URLを調べて実際にデータが存在するかを確認し、一致度を評価することで、記事の信頼性を検証するSkill。

※ jpskill.com 編集部が日本のビジネス現場向けに補足した解説です。Skill本体の挙動とは独立した参考情報です。

⚡ おすすめ: コマンド1行でインストール(60秒)

下記のコマンドをコピーしてターミナル(Mac/Linux)または PowerShell(Windows)に貼り付けてください。 ダウンロード → 解凍 → 配置まで全自動。

🍎 Mac / 🐧 Linux
mkdir -p ~/.claude/skills && cd ~/.claude/skills && curl -L -o blog-factcheck.zip https://jpskill.com/download/10518.zip && unzip -o blog-factcheck.zip && rm blog-factcheck.zip
🪟 Windows (PowerShell)
$d = "$env:USERPROFILE\.claude\skills"; ni -Force -ItemType Directory $d | Out-Null; iwr https://jpskill.com/download/10518.zip -OutFile "$d\blog-factcheck.zip"; Expand-Archive "$d\blog-factcheck.zip" -DestinationPath $d -Force; ri "$d\blog-factcheck.zip"

完了後、Claude Code を再起動 → 普通に「動画プロンプト作って」のように話しかけるだけで自動発動します。

💾 手動でダウンロードしたい(コマンドが難しい人向け)
  1. 1. 下の青いボタンを押して blog-factcheck.zip をダウンロード
  2. 2. ZIPファイルをダブルクリックで解凍 → blog-factcheck フォルダができる
  3. 3. そのフォルダを C:\Users\あなたの名前\.claude\skills\(Win)または ~/.claude/skills/(Mac)へ移動
  4. 4. Claude Code を再起動

⚠️ ダウンロード・利用は自己責任でお願いします。当サイトは内容・動作・安全性について責任を負いません。

🎯 このSkillでできること

下記の説明文を読むと、このSkillがあなたに何をしてくれるかが分かります。Claudeにこの分野の依頼をすると、自動で発動します。

📦 インストール方法 (3ステップ)

  1. 1. 上の「ダウンロード」ボタンを押して .skill ファイルを取得
  2. 2. ファイル名の拡張子を .skill から .zip に変えて展開(macは自動展開可)
  3. 3. 展開してできたフォルダを、ホームフォルダの .claude/skills/ に置く
    • · macOS / Linux: ~/.claude/skills/
    • · Windows: %USERPROFILE%\.claude\skills\

Claude Code を再起動すれば完了。「このSkillを使って…」と話しかけなくても、関連する依頼で自動的に呼び出されます。

詳しい使い方ガイドを見る →
最終更新
2026-05-18
取得日時
2026-05-18
同梱ファイル
1

📖 Skill本文(日本語訳)

※ 原文(英語/中国語)を Gemini で日本語化したものです。Claude 自身は原文を読みます。誤訳がある場合は原文をご確認ください。

Blog Fact-Check

ブログ記事内の統計、主張、およびソースの帰属を検証します。外部の NLP 依存関係のない、純粋な Claude パイプラインです。

ワークフロー

ステップ 1: ブログ記事を読む

対象のファイルを読み込み、データの主張を含むすべてのセクションを特定します。

ステップ 2: 統計的主張を抽出する

テキスト全体をスキャンして、数字、パーセンテージ、金額、または名前付きのソースを含むすべての主張を抽出します。次のフィールドを持つ主張リストを作成します。

フィールド 説明
claim_text 統計を含む正確な文またはフレーズ
value 数値 (例: "42%"、"$1.2M"、"3x")
attribution 名前付きのソース (例: "HubSpot"、"Gartner 2025") が存在する場合
url 引用された URL (Markdown リンクまたは括弧内から) が存在する場合
location 主張が現れる見出しまたは行番号

ステップ 3: 引用された主張を検証する

URL を含む各主張について:

  1. WebFetch 経由でソースページを取得します
  2. 返されたコンテンツから特定の数値を検索します
  3. 正確な値が見つかった場合は、周囲のコンテキストが主張のトピックと一致するかどうかを確認します
  4. 信頼度スコアを割り当てます (以下の検証スコアリングを参照)

ソースサイトのレート制限を回避するために、主張を順番に処理します。

ステップ 4: 引用されていない主張にフラグを立てる

URL のない主張について:

  • ステータスを UNVERIFIED としてマークします
  • ユーザーがソースを見つけるために実行できる検索クエリを提案します
  • 帰属が特定の組織を指名している場合は、そのドメインを提案します

ステップ 5: 検証レポートを生成する

完全な結果テーブル、要約統計、および推奨されるアクションを出力します。

主張抽出パターン

次の構造に一致する主張を特定します。

完全に引用されている (最優先):

  • [Number]% [claim] ([Source], [Year]) - 括弧内の引用
  • [claim] [Number]% ... [markdown link to source] - インラインリンク
  • According to [Source], [Number]... - 帰属リード

引用されていない統計 (ソースの特定のためにフラグを立てる):

  • [Number]% of [noun phrase] - スタンドアロンのパーセンテージ
  • [Number]x more/less/higher/lower - 乗数による主張
  • $[Number] [claim] - 帰属のないドル金額

弱いシグナル (抽出する前にコンテキストを確認する):

  • studies showresearch indicatesdata suggests + 付近の数字
  • survey foundreport revealsanalysis shows + 付近の数字
  • 単独の概数 (例: "millions of users") - 具体的な場合を除きスキップ

検証スコアリング

スコア ステータス 基準
1.0 VERIFIED 一致するコンテキストで、引用されたページに正確な数値が見つかりました
0.7-0.9 PARAPHRASE 類似のデータが見つかりましたが、言い回し、丸め、または時間枠が異なります
0.3-0.6 WEAK ソースページが存在し、トピックをカバーしていますが、特定の統計は表示されません
0.0 NOT FOUND 引用されたページには、主張されたデータがどこにも含まれていません
N/A UNVERIFIED 主張にソース URL が提供されていません

スコアリングのガイダンス:

  • ソースが "nearly half" と述べている場合に "43%" という主張は 0.8 と評価されます
  • ソースに "2023" しかない場合に "2024" のデータという主張は 0.7 と評価されます
  • 統計がサブページにある場合にホームページを引用する主張は 0.3 と評価されます
  • 404 または到達不能な URL は 0.0 と評価されます

出力形式

検証レポート: [Post Title]

File: [path] Claims found: [total] Verified: [count] | Paraphrase: [count] | Weak: [count] | Not Found: [count] | Unverified: [count]

# Claim Source URL Score Status Notes
1 "73% of marketers..." https://example.com/report 1.0 VERIFIED セクション 3 で完全一致が見つかりました
2 "5x ROI improvement" https://example.com/study 0.8 PARAPHRASE ソースは "nearly 5x" と述べています
3 "60% prefer video" (none) N/A UNVERIFIED 試してみてください: "video preference statistics 2025"

推奨されるアクション

  • [ソース URL が必要な主張のリスト]
  • [代替ソースが必要な、スコアが低いまたは見つからない主張のリスト]
  • [ソースデータが古くなっている可能性がある主張のリスト]

統合

このスキルは、オプションの詳細検証ステップとして blog-analyze から呼び出すことができます。 アナライザーから呼び出された場合、0.7 未満のスコアの主張のみが分析レポートでフラグ付けされます。

スタンドアロンでの使用: /blog factcheck path/to/post.md

制限事項

  • ペイウォールコンテンツ: WebFetch はログインウォールの背後にあるコンテンツにアクセスできません。これらは、ペイウォール検出に関するメモとともに WEAK (0.5) としてスコアリングされます。
  • 動的ページ: JavaScript でレンダリングされたコンテンツは、WebFetch 経由では利用できない場合があります。ページが最小限のコンテンツを返す場合は、ステータスにこれを記載してください。
  • PDF ソース: WebFetch は PDF テキストを確実に抽出できない場合があります。手動検証のために PDF URL にフラグを立てます。
  • アーカイブされたページ: URL が 404 を返す場合は、web.archive.org を確認することをお勧めします。
  • レート制限: ソースサーバーに過負荷をかけないように、1 回の実行あたり 10 個以下の URL を処理します。投稿に 10 個を超える引用された URL がある場合は、最初の 10 個を検証し、残りを SKIPPED としてリストします。
📜 原文 SKILL.md(Claudeが読む英語/中国語)を展開

Blog Fact-Check

Verify statistics, claims, and source attributions in blog posts. Pure Claude pipeline with no external NLP dependencies.

Workflow

Step 1: Read the Blog Post

Read the target file and identify all sections containing data claims.

Step 2: Extract Statistical Claims

Scan the full text for every claim that includes a number, percentage, dollar amount, or named source. Build a claims list with these fields:

Field Description
claim_text The exact sentence or phrase containing the statistic
value The numeric value (e.g., "42%", "$1.2M", "3x")
attribution Named source if present (e.g., "HubSpot", "Gartner 2025")
url Cited URL if present (from markdown link or parenthetical)
location Heading or line number where the claim appears

Step 3: Verify Cited Claims

For each claim that includes a URL:

  1. Fetch the source page via WebFetch
  2. Search the returned content for the specific numeric value
  3. If exact value found, check surrounding context matches the claim topic
  4. Assign a confidence score (see Verification Scoring below)

Process claims sequentially to avoid rate-limiting source sites.

Step 4: Flag Uncited Claims

For claims without a URL:

  • Mark status as UNVERIFIED
  • Suggest a search query the user can run to find a source
  • If the attribution names a specific organization, suggest their domain

Step 5: Generate Verification Report

Output the full results table, summary statistics, and recommended actions.

Claim Extraction Patterns

Identify claims matching these structures:

Fully cited (highest priority):

  • [Number]% [claim] ([Source], [Year]) - parenthetical citation
  • [claim] [Number]% ... [markdown link to source] - inline link
  • According to [Source], [Number]... - attribution lead

Uncited statistics (flag for sourcing):

  • [Number]% of [noun phrase] - standalone percentage
  • [Number]x more/less/higher/lower - multiplier claims
  • $[Number] [claim] - dollar figures without attribution

Weak signals (check context before extracting):

  • studies show, research indicates, data suggests + nearby number
  • survey found, report reveals, analysis shows + nearby number
  • Round numbers in isolation (e.g., "millions of users") - skip unless specific

Verification Scoring

Score Status Criteria
1.0 VERIFIED Exact number found on cited page in matching context
0.7-0.9 PARAPHRASE Similar data found but with different wording, rounding, or timeframe
0.3-0.6 WEAK Source page exists and covers the topic but the specific statistic is not visible
0.0 NOT FOUND Cited page does not contain the claimed data anywhere
N/A UNVERIFIED No source URL provided for the claim

Scoring guidance:

  • A claim of "43%" when the source says "nearly half" scores 0.8
  • A claim of "2024" data when the source only has "2023" scores 0.7
  • A claim citing a homepage when the stat lives on a subpage scores 0.3
  • A 404 or unreachable URL scores 0.0

Output Format

Verification Report: [Post Title]

File: [path] Claims found: [total] Verified: [count] | Paraphrase: [count] | Weak: [count] | Not Found: [count] | Unverified: [count]

# Claim Source URL Score Status Notes
1 "73% of marketers..." https://example.com/report 1.0 VERIFIED Exact match found in section 3
2 "5x ROI improvement" https://example.com/study 0.8 PARAPHRASE Source says "nearly 5x"
3 "60% prefer video" (none) N/A UNVERIFIED Try: "video preference statistics 2025"

Recommended Actions

  • [List claims that need source URLs]
  • [List claims with weak or not-found scores that need replacement sources]
  • [List claims where the source data may be outdated]

Integration

This skill can be called from blog-analyze as an optional deep-verification step. When invoked from the analyzer, only claims scoring below 0.7 are flagged in the analysis report.

Standalone usage: /blog factcheck path/to/post.md

Limitations

  • Paywalled content: WebFetch cannot access content behind login walls. These score as WEAK (0.5) with a note about paywall detection.
  • Dynamic pages: JavaScript-rendered content may not be available via WebFetch. If the page returns minimal content, note this in the status.
  • PDF sources: WebFetch may not extract PDF text reliably. Flag PDF URLs for manual verification.
  • Archived pages: If a URL returns 404, suggest checking web.archive.org.
  • Rate limits: Process no more than 10 URLs per run to avoid overwhelming source servers. If a post has more than 10 cited URLs, verify the first 10 and list the remainder as SKIPPED.