Het kopiëren en aanpassen van amd_uop_matmul.py voor de 4090 zou je de $300 GEMM snelheid beloning moeten opleveren. Het is zo eenvoudig dat AI het (bijna) kan doen.