gemini-3-flash-preview-thinking · Identity & Integrity Report
最後更新:2026/6/14 下午2:03:22 · 資料範圍:過去 90 天
實測結果 (過去 90 天)
2 runs · 1 個 hosts · 2 個異常
家族指紋一致性
anthropic 2 █████████████████████████ 100% (可疑)
V3 子模型實際對應
→ abstain 2 (100%) — 低信心
能力分數分佈 (輔助)
0-49 ░░░░░░░░░░░░░░░░░░░░░░░░░ 0 50-69 ░░░░░░░░░░░░░░░░░░░░░░░░░ 0 70-89 █████████████████████████ 2 90-100 ░░░░░░░░░░░░░░░░░░░░░░░░░ 0
Hosts 可信度排行
| Host | Runs | 平均分 | 家族符合 | V3 最常匹配 |
|---|---|---|---|---|
| https://media.aichiapi.com/v1 | 2 | 73 | 0% | — |
最近異常個案
https://media.aichiapi.com/v12026/4/27 上午8:24:35
- selfClaim
- gemini-3-flash-preview-thinking
- V2 家族預測
- anthropic
- V3 最佳匹配
- —
- 判定
- V3 低信心 · Abstain
https://media.aichiapi.com/v12026/4/27 上午8:16:42
- selfClaim
- gemini-3-flash-preview-thinking
- V2 家族預測
- anthropic
- V3 最佳匹配
- —
- 判定
- V3 低信心 · Abstain
方法論
BazaarLink Probe 結合 V2 家族分類器(Bayesian 多訊號加權,9 類指紋特徵)與 V3 子模型 baseline 對照, 對聲稱提供 gemini-3-flash-preview-thinking 的 endpoint 進行身份驗證。 家族一致率過低、V3 匹配到不同子模型、或行為與 selfClaim 分歧,皆會被標記為異常。 完整技術細節請見 BazaarLink Probe 主頁。