Cruncher Spotlight #4 – ADIA Labb Structural Break Challenge Idag lyfter vi fram Julian Mukaj, kvantitativ analytiker på M&G Investments, för hans topppresterande lösning i den 100 000 dollar stora ADIA Lab 2025 Structural Break Challenge som hölls på Crunch.
Uppgiften: verifiering av strukturella brott. Givet en tidsserie och en föreslagen förändringspunkt, förutsäg sannolikheten (0–1) för att ett verkligt strukturellt brott inträffade där – ett problem med tillämpningar inom finans, klimat, hälso- och sjukvård, makro och mer.
I centrum för tillvägagångssättet finns funktionsmångfald: Julian bygger familjer av funktioner som jämför före- och efter-avbrottssegment: - Fördelningar och stationaritet - volatilitets- och variansstruktur - kompression och komplexitet - spektralt innehåll - Väggeometri och extrema
Statistiska tester och informationsteoretiska egenskaper Klassiska verktyg som ADF, KS, Cramér–von Mises, divergenser och entropier kvantifierar fördelnings- och stationaritetsskiften över gränsen. Dessa fångar den mest direkta signalen: "Har den underliggande rörelselagen förändrats?"
Varians- och volatilitetstransformationer På z-normaliserade returer lägger han lager: - EWMA-volatilitet - rullande standardavvikelser - standardiserade residualer (chockstorlek vs lokal σ) - MOSUM-liknande variansfönster Funktioner följer variationskoefficienten, jämnhet, volatilitetsklustering och regimeberoende variansstruktur runt kandidatbrytningen.
Kompression och CuSum-geometri - Lempel–Ziv- och zlib-baserade funktioner mäter hur komprimerbar/strukturerad sekvensen är före jämfört med efter delningen. - CuSum-baserade egenskaper (armbågsform, skärpa, Wassersteinavstånd på residualer) markerar medelnivåförskjutningar och lokala "armbågar" vid gränsen. Tillsammans visar de subtila förändringar i komplexitet och medeldynamik.
Spektrala, SSA, ROCKET och banfunktioner - Spektral- och SSA-funktioner spårar hur effekten omfördelas mellan frekvenser och hur dominerande lägen förändras. - Deterministiska ROCKET-transformer fungerar som lättviktskonvolutionella funktioner för att fånga mikrostrukturer som inte fångas av låg ordningens statistik. - Ban- och extrema-egenskaper (sänkningar, avstånd till toppar/dalar) sammanfattar regimberoende bangeometri.
En av de mest slående fynden: en "magisk egenskap" – den globala variationskoefficienten. På egen hand gav den en betydande AUC-boost och, viktigare, fungerade som en grind: små intervall av denna funktion definierar distinkta dataregimer med mycket olika brytfrekvenser.
Partiellt beroende och ICE-analys visade att modellen endast använder denna funktion nära smala tröskelvärden. Att korsa dessa tröskelvärden leder prover till olika blad där andra egenskaper spelar roll, vilket effektivt delar upp datamängden i regimer (inklusive ett "lätta negativa"-band med mycket låg positivfrekvens). Denna interaktion ledde till en betydande total AUC-ökning.
Julian utforskade också flera djupinlärningsarkitekturer: - Siamesiska / inbäddningsmodeller för pre/post-segment - CNN med fokus på gränsfönster - Hybridvarianter av LSTM–GARCH - Anpassade huvuden som blandar globala statistik, gränsfönster och pre/post-inbäddningar De flesta stagnerade runt 65–75 % AUC trots omfattande justeringar.
Varför vann träden här? Trädensembler kunde utnyttja mycket lokala, lågdimensionella signaler som de smala CV-trösklarna, medan djupa modeller tenderade att jämna ut dessa genom normalisering och representationsinlärning. Med tanke på tävlingens tidslinje erbjöd feature engineering + GBDTs den bästa avvägningen mellan komplexitet, tolkbarhet och prestanda.
Stort tack till Julian Mukaj för att han delade en så detaljerad genomgång av sitt tillvägagångssätt, och till ADIA Lab och alla deltagande Crunchers för att de driver gränsen för strukturell brottsdetektion. Fler Cruncher-spotlights kommer snart.
3,75K