Presentamos RND1, el modelo de lenguaje de difusión de base (DLM) más potente hasta la fecha. RND1 (Radical Numerics Diffusion) es un DLM experimental con parámetros 30B (3B activos) con una arquitectura MoE dispersa. Lo estamos haciendo de código abierto, publicando pesos, detalles de entrenamiento y código para catalizar más investigaciones sobre la inferencia DLM y el entrenamiento posterior. Somos investigadores e ingenieros (DeepMind, Meta, Liquid, Stanford) que construyen el motor para la automejora recursiva (RSI) y lo usamos para acelerar nuestro propio trabajo. Nuestro objetivo es dejar que la IA diseñe la IA. Estamos contratando.