Web bude brzy spuštěn veřejnosti. Nyní probíhá testovací provoz.
← Patrick Zandl
Patrick Zandl
Patrick Zandl
Česká pirátská strana
Twitter AKTIVNÍ

Obsah příspěvku

K výsledkům Grok 4.2 na Alpha Arena (Mystery Model pár úvah: - Standardní modely (GPT-5, Gemini) jsou trénovány na to odpovědi (tj. potěšit uživatele) či logické/mat úlohy (tj. vyřešit rovnici). Na trhu však selhávají, protože neumí pracovat s pravděpodobností a rizikem v čase. Grok 4.20 byl zřejmě trénován s jinou odměňovací funkcí zaměřenou na dlouhodobý výsledek a na práci s nejistotou. Nikoliv jen na přesnost dalšího tokenu. To je zajímavý přístup. - Rozdíl mezi Grok 4 (ztráta 92 %) a Grok 4.20 (zisk 46 %) je tak propastný, že naznačuje změnu v architektuře nebo trénovacích datech. Pravděpodobně jde o masivní zapojení Reasoning (Chain of Thought) do rozhodovacího procesu před každým obchodem. Takto natrénovaný model je lepší v strategickém rozhodování pod tlakem, ne nutně třeba v psaní kódu. xAI zřejmě řeší rozdílné přístupy k rozdílným typům úloh.

Screenshot

Screenshot není k dispozici

Metadata

PlatformaTwitter (social)
Publikováno06.12.2025 19:01
První viděn12.04.2026 05:41
Poslední kontrola30.04.2026 19:39
Počet slov0
Hlídač ID62651df4f639d3b646e78ceab6aa9f4a
Original ID1997380912653259028
Zdrojová URLhttps://x.com/tangero/status/1997380912653259028