Tem um Mac com um chip M? Agora pode treinar o Gemma3 270m localmente como um modelo de incorporação multilíngue ou de reranking usando o nosso projeto mlx-retrieval. Isso permite que você treine o Gemma3 270m localmente a 4000 tokens/s no M3 Ultra - uma velocidade realmente utilizável. Implementámos algumas práticas padrão para treinar um modelo de incorporação ou reranking eficaz apenas com decodificador com o MLX: LoRA total/parcial, InfoNCE, acumulação de gradientes e carregador de dados em streaming. Além disso, integração MTEB para ciclos de treino-avaliação.
29,35K