Copiar e ajustar amd_uop_matmul.py para 4090 deve lhe dar a recompensa de velocidade GEMM de $ 300. É tão fácil que a IA pode (quase) fazer isso.