可以使用Mac训练任何规模的模型。管道并行性使这一切成为可能——将模型的一部分放在每个设备上。在Apple Silicon上使用MLX实现这一点相当具有挑战性;我写了一篇博客文章详细说明了它是如何工作的。🧵