gemini-2.5-pro-thinking-* · Identity & Integrity Report
最後更新:2026/6/14 下午2:05:36 · 資料範圍:過去 90 天
實測結果 (過去 90 天)
2 runs · 1 個 hosts · 2 個異常
家族指紋一致性
google 2 █████████████████████████ 100% (可疑)
V3 子模型實際對應
→ google/gemini-2.5-pro 2 (100%) ⚠ 不符 sim=1.00
能力分數分佈 (輔助)
0-49 ░░░░░░░░░░░░░░░░░░░░░░░░░ 0 50-69 █████████████████████████ 2 70-89 ░░░░░░░░░░░░░░░░░░░░░░░░░ 0 90-100 ░░░░░░░░░░░░░░░░░░░░░░░░░ 0
Hosts 可信度排行
| Host | Runs | 平均分 | 家族符合 | V3 最常匹配 |
|---|---|---|---|---|
| https://media.aichiapi.com/v1 | 2 | 59 | 0% | google/gemini-2.5-pro (2) |
最近異常個案
https://media.aichiapi.com/v12026/4/27 上午9:03:25
- selfClaim
- gemini-2.5-pro-thinking
- V2 家族預測
- V3 最佳匹配
- google/gemini-2.5-pro (sim 1.00)
- 判定
- 全換 · Full Swap
https://media.aichiapi.com/v12026/4/27 上午8:46:23
- selfClaim
- gemini-2.5-pro-thinking-*
- V2 家族預測
- V3 最佳匹配
- google/gemini-2.5-pro (sim 1.00)
- 判定
- 全換 · Full Swap
方法論
BazaarLink Probe 結合 V2 家族分類器(Bayesian 多訊號加權,9 類指紋特徵)與 V3 子模型 baseline 對照, 對聲稱提供 gemini-2.5-pro-thinking-* 的 endpoint 進行身份驗證。 家族一致率過低、V3 匹配到不同子模型、或行為與 selfClaim 分歧,皆會被標記為異常。 完整技術細節請見 BazaarLink Probe 主頁。