Web bude brzy spuštěn veřejnosti. Nyní probíhá testovací provoz.
← Patrick Zandl
Patrick Zandl
Patrick Zandl
Česká pirátská strana
Twitter AKTIVNÍ

Obsah příspěvku

Doplnění k Opus 4.6 – nezávislý ARC-AGI-2 benchmark (abstraktní reasoning, ne memorování): Opus 4.5 → 4.6 24 % → 68 % Trojnásobek. GPT-5.2 vede absolutně (72 %), ale za ~$30/task. Opus 4.6 dává 68 % za ~$1. Třicetkrát levnější za 4 p.b. rozdíl. Grok 4: 31 % za $50+. Bez komentáře. ARC-AGI se nedá řešit memorováním – tohle je zatím nejpřesvědčivější nezávislý důkaz, že skok z 4.5 na 4.6 je velmi slušný!

Screenshot

Screenshot není k dispozici

Metadata

PlatformaTwitter (social)
Publikováno05.02.2026 21:18
První viděn12.04.2026 05:40
Poslední kontrola30.04.2026 21:18
Počet slov0
Hlídač IDa53cf5cb770574357e326e33f9b1c113
Original ID2019521128696279055
Zdrojová URLhttps://x.com/tangero/status/2019521128696279055