Eines der DeepSeek-Repositorys wurde mit einem Verweis auf ein neues „model1“-Modell aktualisiert. „FlashMLA ist die Bibliothek von DeepSeek für optimierte Attention-Kerne, die die DeepSeek-V3- und DeepSeek-V3.2-Exp-Modelle antreiben.“ Bald? 👀👀👀