Patrick Zandl
Česká pirátská strana
Twitter
AKTIVNÍ
Obsah příspěvku
Doplnění k Opus 4.6 – nezávislý ARC-AGI-2 benchmark (abstraktní reasoning, ne memorování):
Opus 4.5 → 4.6
24 % → 68 %
Trojnásobek.
GPT-5.2 vede absolutně (72 %), ale za ~$30/task. Opus 4.6 dává 68 % za ~$1. Třicetkrát levnější za 4 p.b. rozdíl.
Grok 4: 31 % za $50+. Bez komentáře.
ARC-AGI se nedá řešit memorováním – tohle je zatím nejpřesvědčivější nezávislý důkaz, že skok z 4.5 na 4.6 je velmi slušný!
Screenshot
Screenshot není k dispozici
Metadata
| Platforma | Twitter (social) |
| Publikováno | 05.02.2026 21:18 |
| První viděn | 12.04.2026 05:40 |
| Poslední kontrola | 30.04.2026 21:18 |
| Počet slov | 0 |
| Hlídač ID | a53cf5cb770574357e326e33f9b1c113 |
| Original ID | 2019521128696279055 |
| Zdrojová URL | https://x.com/tangero/status/2019521128696279055 |