← 返回模型頁

gemini-2.5-pro-thinking-* · Identity & Integrity Report

最後更新:2026/6/14 下午2:05:36 · 資料範圍:過去 90

實測結果 (過去 90 天)

2 runs · 1 個 hosts · 2 個異常

家族指紋一致性

  google           2  █████████████████████████  100% (可疑)

V3 子模型實際對應

  → google/gemini-2.5-pro                    2 (100%) ⚠ 不符 sim=1.00

能力分數分佈 (輔助)

  0-49     ░░░░░░░░░░░░░░░░░░░░░░░░░    0
  50-69    █████████████████████████    2
  70-89    ░░░░░░░░░░░░░░░░░░░░░░░░░    0
  90-100   ░░░░░░░░░░░░░░░░░░░░░░░░░    0

Hosts 可信度排行

HostRuns平均分家族符合V3 最常匹配
https://media.aichiapi.com/v12590%google/gemini-2.5-pro (2)

最近異常個案

https://media.aichiapi.com/v12026/4/27 上午9:03:25
selfClaim
gemini-2.5-pro-thinking
V2 家族預測
google
V3 最佳匹配
google/gemini-2.5-pro (sim 1.00)
判定
全換 · Full Swap
https://media.aichiapi.com/v12026/4/27 上午8:46:23
selfClaim
gemini-2.5-pro-thinking-*
V2 家族預測
google
V3 最佳匹配
google/gemini-2.5-pro (sim 1.00)
判定
全換 · Full Swap

方法論

BazaarLink Probe 結合 V2 家族分類器(Bayesian 多訊號加權,9 類指紋特徵)與 V3 子模型 baseline 對照, 對聲稱提供 gemini-2.5-pro-thinking-* 的 endpoint 進行身份驗證。 家族一致率過低、V3 匹配到不同子模型、或行為與 selfClaim 分歧,皆會被標記為異常。 完整技術細節請見 BazaarLink Probe 主頁

自己動手測試一個 endpoint →