Jeg har brukt PyTorch-profilen mye
Det du ser her er en profilsporing av 10 fremoverpasninger (10 token-spådommer), og profiltrinn 0 forteller meg at den mest åpenbare ytelsesflaskehalsen er forhåndsfyllingsfasen
Jeg kommer tilbake til dette sporet for å sammenligne når jeg har en raskere måte å forhåndsutfylle på