Patrick Zandl
Česká pirátská strana
Twitter
AKTIVNÍ
Obsah příspěvku
K výsledkům Grok 4.2 na Alpha Arena (Mystery Model pár úvah:
- Standardní modely (GPT-5, Gemini) jsou trénovány na to odpovědi (tj. potěšit uživatele) či logické/mat úlohy (tj. vyřešit rovnici). Na trhu však selhávají, protože neumí pracovat s pravděpodobností a rizikem v čase. Grok 4.20 byl zřejmě trénován s jinou odměňovací funkcí zaměřenou na dlouhodobý výsledek a na práci s nejistotou. Nikoliv jen na přesnost dalšího tokenu. To je zajímavý přístup.
- Rozdíl mezi Grok 4 (ztráta 92 %) a Grok 4.20 (zisk 46 %) je tak propastný, že naznačuje změnu v architektuře nebo trénovacích datech. Pravděpodobně jde o masivní zapojení Reasoning (Chain of Thought) do rozhodovacího procesu před každým obchodem.
Takto natrénovaný model je lepší v strategickém rozhodování pod tlakem, ne nutně třeba v psaní kódu. xAI zřejmě řeší rozdílné přístupy k rozdílným typům úloh.
Screenshot
Screenshot není k dispozici
Metadata
| Platforma | Twitter (social) |
| Publikováno | 06.12.2025 19:01 |
| První viděn | 12.04.2026 05:41 |
| Poslední kontrola | 30.04.2026 19:39 |
| Počet slov | 0 |
| Hlídač ID | 62651df4f639d3b646e78ceab6aa9f4a |
| Original ID | 1997380912653259028 |
| Zdrojová URL | https://x.com/tangero/status/1997380912653259028 |