Microsoft hat gerade VibeVoice-Realtime-0.5B veröffentlicht Ein Open-Source-Realtime-TTS-AI-Modell, das in ~300 ms zu sprechen beginnt Streaming, Langform und wahnsinnig schnell.