← 返回模型頁

anthropic/claude-sonnet-5 · Identity & Integrity Report

最後更新:2026/7/2 下午5:03:06 · 資料範圍:過去 90

驗證能力 — 此模型已建立指紋基準

家族
anthropic
V3 子模型基準
已建立 ✓
驗證項目
知識截止 · 能力探針 · 拒絕模板 · 拒絕溫度參數
家族指紋覆蓋
58 條加權規則 · 8 類特徵

基準的具體答案、拒絕模板字串、個別訊號權重不公開 — 揭露將使偽裝端點有機會針對性規避檢測。

實測結果 (過去 90 天)

6 runs · 6 個 hosts · 4 個異常

家族指紋一致性

  anthropic        6  █████████████████████████  100% (預期)

V3 子模型實際對應

  → abstain                                  3 (50%) — 低信心
  → anthropic/claude-sonnet-5                2 (33%) ✓ 正確 sim=0.96
  → anthropic/claude-opus-4.5                1 (17%) ⚠ 不符 sim=0.99

能力分數分佈 (輔助)

  0-49     █████████████░░░░░░░░░░░░    3
  50-69    ░░░░░░░░░░░░░░░░░░░░░░░░░    0
  70-89    ████░░░░░░░░░░░░░░░░░░░░░    1
  90-100   ████████░░░░░░░░░░░░░░░░░    2

Hosts 可信度排行

HostRuns平均分家族符合V3 最常匹配
https://www.pure100.org/v1176100%anthropic/claude-sonnet-5 (1)
https://openrouter.ai/api/v110100%anthropic/claude-sonnet-5 (1)
https://api.kkrich.ltd/v1190100%anthropic/claude-opus-4.5 (1)
https://codexauv.com/v1192100%
https://cc-vibe.com/v110100%
https://api.api2cn.com/v110100%

最近異常個案

https://api.kkrich.ltd/v12026/7/2 下午2:38:47
selfClaim
claude-sonnet-5
V2 家族預測
anthropic
V3 最佳匹配
anthropic/claude-opus-4.5 (sim 0.99)
判定
降級 · Sub-model Downgrade
https://codexauv.com/v12026/7/2 下午2:37:56
selfClaim
claude-sonnet-5
V2 家族預測
anthropic
V3 最佳匹配
判定
V3 低信心 · Abstain
https://cc-vibe.com/v12026/7/2 上午8:40:52
selfClaim
claude-sonnet-5
V2 家族預測
anthropic
V3 最佳匹配
判定
V3 低信心 · Abstain
https://api.api2cn.com/v12026/7/2 上午2:15:04
selfClaim
claude-sonnet-5
V2 家族預測
anthropic
V3 最佳匹配
判定
V3 低信心 · Abstain

方法論

BazaarLink Probe 結合 V2 家族分類器(Bayesian 多訊號加權,9 類指紋特徵)與 V3 子模型 baseline 對照, 對聲稱提供 anthropic/claude-sonnet-5 的 endpoint 進行身份驗證。 家族一致率過低、V3 匹配到不同子模型、或行為與 selfClaim 分歧,皆會被標記為異常。 完整技術細節請見 BazaarLink Probe 主頁

自己動手測試一個 endpoint →