Patrick Zandl
Česká pirátská strana
Twitter
AKTIVNÍ
Obsah příspěvku
Google vydal Gemini 3.1 Pro Preview a tentokrát to nejsou jen marketingová čísla.
@ArtificialAnlys potvrzuje: vede Intelligence Index o 4 body před Claude Opus 4.6.
Ale čert je v detailech 🧵
Kde opravdu vede:
• ARC-AGI-2: 77,1 % (Opus 4.6: 68,8 %) – abstraktní uvažování
• Halucinace: –38 p.b. oproti předchůdci
• Token efektivita: 57M tokenů vs. 160M u Opus 4.6 (max)
• Cena: $892 za benchmark vs. $2000+ u Opus 4.6
Kde stále zaostává:
• GDPval-AA (reálné agentní úkoly): 1316 Elo
• Claude Sonnet 4.6: 1633 / Opus 4.6: 1606 / GPT-5.2: 1462
• Gemini 3.1 Pro je až čtvrtý – navzdory vedení v celkovém indexu
Nejlepší model závisí na tom, co měříš. Pro agentní produkční úkoly Claude drží pozici. Pro nákladově citlivé projekty je Gemini 3.1 Pro za $2/$12/M tokenů vážný argument. A pozor, v režimu 1M tokenů jsou výsledky podobně nedobré, jako u 3 Pro - 26% přesnosti.
Screenshot
Screenshot není k dispozici
Metadata
| Platforma | Twitter (social) |
| Publikováno | 19.02.2026 17:17 |
| První viděn | 12.04.2026 05:39 |
| Poslední kontrola | 30.04.2026 23:15 |
| Počet slov | 0 |
| Hlídač ID | 6e7252e91e451801f20f3bae92db9bae |
| Original ID | 2024533908985983183 |
| Zdrojová URL | https://x.com/tangero/status/2024533908985983183 |