Minhas maiores conclusões da palestra da Apple de hoje: - A Apple está focada em melhorar as GPUs para inferência de IA. O Apple Neural Engine nem foi mencionado uma vez. - Espere que a computação de inferência aumente de 3 a 4x (talvez mais) nos próximos chips M5 Apple Silicon para Mac. A largura de banda da memória ainda é um fator importante quando se trata de inferência, mas com novos modelos MoE esparsos como o Qwen 3 Next, o fator de computação se tornará mais importante. - MLX (não CoreML) é onde a IA está acontecendo. Presumo que o Metal apoiará os Aceleradores Neurais desde o primeiro dia, assim como o MLX ou logo depois. - Se o aumento de desempenho de 3-4x for real, os próximos chips M5 serão incrivelmente bons em inferência e treinamento de IA. Eles já são o melhor retorno para o investimento e serão ainda mais quando o M5 for lançado - Com a melhoria de software (MLX), modelos e hardware, a inferência de IA local no dispositivo terá um grande impulso no iPhone e no Mac