Web bude brzy spuštěn veřejnosti. Nyní probíhá testovací provoz.
← Patrick Zandl
Patrick Zandl
Patrick Zandl
Česká pirátská strana
Twitter AKTIVNÍ

Obsah příspěvku

Google vydal Gemini 3.1 Pro Preview a tentokrát to nejsou jen marketingová čísla. @ArtificialAnlys potvrzuje: vede Intelligence Index o 4 body před Claude Opus 4.6. Ale čert je v detailech 🧵 Kde opravdu vede: • ARC-AGI-2: 77,1 % (Opus 4.6: 68,8 %) – abstraktní uvažování • Halucinace: –38 p.b. oproti předchůdci • Token efektivita: 57M tokenů vs. 160M u Opus 4.6 (max) • Cena: $892 za benchmark vs. $2000+ u Opus 4.6 Kde stále zaostává: • GDPval-AA (reálné agentní úkoly): 1316 Elo • Claude Sonnet 4.6: 1633 / Opus 4.6: 1606 / GPT-5.2: 1462 • Gemini 3.1 Pro je až čtvrtý – navzdory vedení v celkovém indexu Nejlepší model závisí na tom, co měříš. Pro agentní produkční úkoly Claude drží pozici. Pro nákladově citlivé projekty je Gemini 3.1 Pro za $2/$12/M tokenů vážný argument. A pozor, v režimu 1M tokenů jsou výsledky podobně nedobré, jako u 3 Pro - 26% přesnosti.

Screenshot

Screenshot není k dispozici

Metadata

PlatformaTwitter (social)
Publikováno19.02.2026 17:17
První viděn12.04.2026 05:39
Poslední kontrola30.04.2026 23:15
Počet slov0
Hlídač ID6e7252e91e451801f20f3bae92db9bae
Original ID2024533908985983183
Zdrojová URLhttps://x.com/tangero/status/2024533908985983183