Copierea și ajustarea amd_uop_matmul.py pentru 4090 ar trebui să vă aducă recompensa de viteză GEMM de 300 USD. Este atât de ușor încât AI poate (aproape) să o facă.