Příspěvek — Odstraněno.cz

Patrick Zandl

Česká pirátská strana

Twitter AKTIVNÍ

Obsah příspěvku

K výsledkům Grok 4.2 na Alpha Arena (Mystery Model pár úvah: 

- Standardní modely (GPT-5, Gemini) jsou trénovány na to odpovědi (tj. potěšit uživatele) či logické/mat úlohy (tj. vyřešit rovnici). Na trhu však selhávají, protože neumí pracovat s pravděpodobností a rizikem v čase. Grok 4.20 byl zřejmě trénován s jinou odměňovací funkcí zaměřenou na dlouhodobý výsledek a na práci s nejistotou. Nikoliv jen na přesnost dalšího tokenu. To je zajímavý přístup. 

- Rozdíl mezi Grok 4 (ztráta 92 %) a Grok 4.20 (zisk 46 %) je tak propastný, že naznačuje změnu v architektuře nebo trénovacích datech. Pravděpodobně jde o masivní zapojení Reasoning (Chain of Thought) do rozhodovacího procesu před každým obchodem.

Takto natrénovaný model je lepší v strategickém rozhodování pod tlakem, ne nutně třeba v psaní kódu. xAI zřejmě řeší rozdílné přístupy k rozdílným typům úloh.

Screenshot

Screenshot není k dispozici

Metadata

Platforma	Twitter (social)
Publikováno	06.12.2025 19:01
První viděn	12.04.2026 05:41
Poslední kontrola	30.04.2026 19:39
Počet slov	0
Hlídač ID	62651df4f639d3b646e78ceab6aa9f4a
Original ID	1997380912653259028
Zdrojová URL	https://x.com/tangero/status/1997380912653259028