Příspěvek — Odstraněno.cz

Patrick Zandl

Česká pirátská strana

Twitter AKTIVNÍ

Obsah příspěvku

Google vydal Gemini 3.1 Pro Preview a tentokrát to nejsou jen marketingová čísla.

@ArtificialAnlys potvrzuje: vede Intelligence Index o 4 body před Claude Opus 4.6.

Ale čert je v detailech 🧵

Kde opravdu vede:
• ARC-AGI-2: 77,1 % (Opus 4.6: 68,8 %) – abstraktní uvažování
• Halucinace: –38 p.b. oproti předchůdci
• Token efektivita: 57M tokenů vs. 160M u Opus 4.6 (max)
• Cena: $892 za benchmark vs. $2000+ u Opus 4.6

Kde stále zaostává:
• GDPval-AA (reálné agentní úkoly): 1316 Elo
• Claude Sonnet 4.6: 1633 / Opus 4.6: 1606 / GPT-5.2: 1462
• Gemini 3.1 Pro je až čtvrtý – navzdory vedení v celkovém indexu

Nejlepší model závisí na tom, co měříš. Pro agentní produkční úkoly Claude drží pozici. Pro nákladově citlivé projekty je Gemini 3.1 Pro za $2/$12/M tokenů vážný argument. A pozor, v režimu 1M tokenů jsou výsledky podobně nedobré, jako u 3 Pro - 26% přesnosti.

Screenshot

Screenshot není k dispozici

Metadata

Platforma	Twitter (social)
Publikováno	19.02.2026 17:17
První viděn	12.04.2026 05:39
Poslední kontrola	30.04.2026 23:15
Počet slov	0
Hlídač ID	6e7252e91e451801f20f3bae92db9bae
Original ID	2024533908985983183
Zdrojová URL	https://x.com/tangero/status/2024533908985983183