¡FLUX.1 Kontext se ha SOBRECARGADO! @NVIDIA_AI_PC La aceleración de TensorRT ofrece una inferencia 2 veces más rápida en las GPU RTX. La cuantificación reduce la memoria de 24 GB a 7 GB (FP4) manteniendo la calidad. Las variantes BF16/FP8/FP4 listas para la producción ya están en @huggingface
NVIDIA AI PC
NVIDIA AI PC2 jul 2025
📸 Generar. Refinar. Repetir. FLUX.1 Kontext de @bfl_ml simplifica la edición de imágenes con IA con indicaciones de texto + imagen, ahora aceleradas por RTX con TensorRT. Bono: el nuevo LLM multimodal Gemma 3n de Google también se acelera en RTX. 🔗 #RTXAIGarage:
36.73K