Hodně používám profiler PyTorch To, co zde vidíte, je profilová stopa 10 předběžných průchodů (10 tokenových predikcí) a Profiler krok 0, který mi říká, že nejviditelnějším úzkým hrdlem výkonu je fáze předvyplnění K této stopě se vrátím, abych porovnal, až budu mít rychlejší způsob předvyplnění