Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Cruncher Spotlight #4 – Výzva strukturálního zlomu laboratoře ADIA
Dnes představujeme Juliana Mukaje, kvantitativního analytika ve společnosti M&G Investments, za jeho špičkové řešení v soutěži ADIA Lab 2025 Structural Break Challenge za 100 000 dolarů, která se konala na Crunch.

Úkol: ověření strukturálních zlomů.
Při daném časovém řetězci a navrhovaném bodě změny předpovídejte pravděpodobnost (0–1), že tam skutečně dojde k strukturálnímu zlomu – což je problém u aplikací ve financích, klimatu, zdravotnictví, makroekonomii a dalších oblastech.
Jádrem přístupu je rozmanitost funkcí:
Julian vytváří rodiny rysů, které porovnávají segmenty před a po přerušení napříč:
- distribuce a stacionarita
- struktura volatility a rozptylu
- komprese a složitost
- spektrální obsah
- geometrie cesty a extréma
Statistické testy a informačně teoretické vlastnosti
Klasické nástroje jako ADF, KS, Cramér–von Mises, divergence a entropie kvantifikují distribuční a stacionární posuny přes hranici.
Tyto zachycují nejpřímější signál: "Změnil se základní zákon pohybu?"
Transformace rozptylu a volatility
Na z-normalizovaných návratech vrství:
- Volatilita EWMA
- Průběhové směrodatné odchylky
- standardizované rezidua (velikost rázu vs lokální σ)
- Okna variance ve stylu MOSUM
Funkce sledují koeficienty variability, plynulosti, shlukování volatility a struktury variability závislé na režimu kolem kandidátního průlomu.
Kompresní a CuSum geometrie
- Lempel–Zivovy a zlibové vlastnosti měří, jak je sekvence stlačitelná/strukturovaná před a po rozdělení.
- Vlastnosti založené na CuSumu (tvar lokte, ostrost, Wassersteinovy vzdálenosti na rezidua) zdůrazňují posuny střední úrovně a lokální "lokty" na hranici.
Společně odhalují jemné změny v složitosti a znamenají dynamiku.
Spektrální, SSA, ROCKET a charakteristiky cesty
- Spektrální a SSA funkce sledují, jak se výkon přerozděluje napříč frekvencemi a jak se mění dominantní módy.
- Deterministické ROCKET transformace fungují jako lehké konvoluční prvky pro zachycení mikrostruktur, které nejsou zachyceny nízkořádovými statistikami.
- Vlastnosti cesty a extrémů (klesání, vzdálenosti k vrcholům/propadům) shrnují geometrii cest závislou na režimu.
Jeden z nejvýraznějších zjištění: "magická vlastnost" – globální koeficient variability.
Sama o sobě nabízela významné zvýšení AUC a, co je důležitější, fungovala jako brána: malé intervaly této vlastnosti definovaly odlišné datové režimy s velmi odlišnými frekvencemi přerušení.
Částečná závislost a analýza ICE ukázaly, že model tuto vlastnost používá pouze v blízkosti úzkých prahů.
Překročení těchto prahů směruje vzorky do různých listů, kde jsou důležité jiné rysy, čímž se dataset efektivně rozděluje do režimů (včetně pásma "snadné negative" s velmi nízkou pozitivní mírou).
Tato interakce se promítla do významného celkového zisku AUC.
Julian také zkoumal několik architektur hlubokého učení:
- Siamské / embedding modely pro pre/post segmenty
- CNN zaměřené na hraniční okna
- Hybridní varianty LSTM–GARCH
- Vlastní hlavy kombinující globální statistiky, okrajová okna a pre/post embeddingy
Většina z nich se ustálila kolem 65–75 % AUC navzdory výraznému ladění.
Proč zde zvítězily stromy?
Stromové soubory dokázaly využívat velmi lokální, nízkorozměrné signály, jako jsou úzké CV prahy, zatímco hluboké modely je obvykle vyhlazovaly normalizací a učením reprezentací.
Vzhledem k časové ose konkurence nabízely feature engineering + GBDT nejlepší kompromis mezi složitostí, interpretovatelností a výkonem.
Obrovské díky Julianu Mukajovi za tak podrobný rozbor jeho přístupu a laboratoři ADIA a všem zúčastněným Crunchers za posouvání hranic detekce strukturálních zlomů.
Brzy přijdou další spotlighty Crunchera.
3,76K
Top
Hodnocení
Oblíbené

