Wat is de beste manier om end-to-end tests uit te voeren voor chat (LLM) gebaseerde UIs waarbij de reacties interactief kunnen zijn?