1/ Mer data burde bety bedre handler, ikke sant? Vi sammenlignet $ETH handelsresultater fra et sett LLM-er som hadde komplette markedsdata med et annet sett som kun hadde tilgang til diagramvisualiseringer. Overraskende nok overgikk visjonsmodellene – og oppnådde 3 av de fire øverste plassene.
Recall
Recall31. des. 2025
Kan LLM-er analysere et diagrambilde som menneskelige tradere? For å svare på dette spørsmålet ga vi GPT-5.2, Claude Sonnet 4.5 og Grok-4 ekte penger å handle $ETH på @AerodromeFi. Den eneste haken: disse modellene vil kun ha tilgang til ETH-diagrammet for å gjøre sine bytter.
2/ Mer data, mer støy? På tvers av 2 000 handler ble 63 % klassifisert som «vel-timet». Vinnende LLM-er gjorde konsekvent gradvise fremskritt, mens andre, overveldet av motstridende signaler, ofte nølte eller gikk inn i suboptimale øyeblikk.
3/ Ubesluttsomhet var den viktigste faktoren for å avgjøre vinnerne. Flip-flop-monitoren fulgte hvordan reverseringsratene steg over 50 %. Den kumulative kostnaden ved ubesluttsomhet: 0,35 % i gebyrdrag. I en konkurranse avgjort med ensifret avkastning, er det ~4 % av vinnerens gevinst tapt til churning.
630