Cruncher Spotlight #4 – Výzva strukturálního zlomu laboratoře ADIA Dnes představujeme Juliana Mukaje, kvantitativního analytika ve společnosti M&G Investments, za jeho špičkové řešení v soutěži ADIA Lab 2025 Structural Break Challenge za 100 000 dolarů, která se konala na Crunch.
Úkol: ověření strukturálních zlomů. Při daném časovém řetězci a navrhovaném bodě změny předpovídejte pravděpodobnost (0–1), že tam skutečně dojde k strukturálnímu zlomu – což je problém u aplikací ve financích, klimatu, zdravotnictví, makroekonomii a dalších oblastech.
Jádrem přístupu je rozmanitost funkcí: Julian vytváří rodiny rysů, které porovnávají segmenty před a po přerušení napříč: - distribuce a stacionarita - struktura volatility a rozptylu - komprese a složitost - spektrální obsah - geometrie cesty a extréma
Statistické testy a informačně teoretické vlastnosti Klasické nástroje jako ADF, KS, Cramér–von Mises, divergence a entropie kvantifikují distribuční a stacionární posuny přes hranici. Tyto zachycují nejpřímější signál: "Změnil se základní zákon pohybu?"
Transformace rozptylu a volatility Na z-normalizovaných návratech vrství: - Volatilita EWMA - Průběhové směrodatné odchylky - standardizované rezidua (velikost rázu vs lokální σ) - Okna variance ve stylu MOSUM Funkce sledují koeficienty variability, plynulosti, shlukování volatility a struktury variability závislé na režimu kolem kandidátního průlomu.
Kompresní a CuSum geometrie - Lempel–Zivovy a zlibové vlastnosti měří, jak je sekvence stlačitelná/strukturovaná před a po rozdělení. - Vlastnosti založené na CuSumu (tvar lokte, ostrost, Wassersteinovy vzdálenosti na rezidua) zdůrazňují posuny střední úrovně a lokální "lokty" na hranici. Společně odhalují jemné změny v složitosti a znamenají dynamiku.
Spektrální, SSA, ROCKET a charakteristiky cesty - Spektrální a SSA funkce sledují, jak se výkon přerozděluje napříč frekvencemi a jak se mění dominantní módy. - Deterministické ROCKET transformace fungují jako lehké konvoluční prvky pro zachycení mikrostruktur, které nejsou zachyceny nízkořádovými statistikami. - Vlastnosti cesty a extrémů (klesání, vzdálenosti k vrcholům/propadům) shrnují geometrii cest závislou na režimu.
Jeden z nejvýraznějších zjištění: "magická vlastnost" – globální koeficient variability. Sama o sobě nabízela významné zvýšení AUC a, co je důležitější, fungovala jako brána: malé intervaly této vlastnosti definovaly odlišné datové režimy s velmi odlišnými frekvencemi přerušení.
Částečná závislost a analýza ICE ukázaly, že model tuto vlastnost používá pouze v blízkosti úzkých prahů. Překročení těchto prahů směruje vzorky do různých listů, kde jsou důležité jiné rysy, čímž se dataset efektivně rozděluje do režimů (včetně pásma "snadné negative" s velmi nízkou pozitivní mírou). Tato interakce se promítla do významného celkového zisku AUC.
Julian také zkoumal několik architektur hlubokého učení: - Siamské / embedding modely pro pre/post segmenty - CNN zaměřené na hraniční okna - Hybridní varianty LSTM–GARCH - Vlastní hlavy kombinující globální statistiky, okrajová okna a pre/post embeddingy Většina z nich se ustálila kolem 65–75 % AUC navzdory výraznému ladění.
Proč zde zvítězily stromy? Stromové soubory dokázaly využívat velmi lokální, nízkorozměrné signály, jako jsou úzké CV prahy, zatímco hluboké modely je obvykle vyhlazovaly normalizací a učením reprezentací. Vzhledem k časové ose konkurence nabízely feature engineering + GBDT nejlepší kompromis mezi složitostí, interpretovatelností a výkonem.
Obrovské díky Julianu Mukajovi za tak podrobný rozbor jeho přístupu a laboratoři ADIA a všem zúčastněným Crunchers za posouvání hranic detekce strukturálních zlomů. Brzy přijdou další spotlighty Crunchera.
3,76K