Det er mulig å trene modeller i alle størrelser ved hjelp av Mac-er. Pipeline-parallellisme muliggjør dette – ved å legge deler av modellen på hver enhet. Å implementere dette med MLX på Apple Silicon var en ganske stor utfordring; Jeg har skrevet et blogginnlegg som forklarer hvordan det fungerer. 🧵