Proč je AI v psaní front-endu najednou tak silná? Tento odstavec článku Xiaomi o MiMo představuje, jak trénují model na psaní front-endu, klíčem je tato věta: Náš ověřovatel založený na zraku hodnotí vizuální kvalitu, funkční přesnost a vymahatelnost tím, že hodnotí provedení nahraných videozáznamů, čímž zajišťuje, že mechanismus odměny vyvažuje vzhled a chování. V zásadě model napíše kód na základě výzvy, poté jej nahraje do videa pomocí Playwrightových operací a následně jej předá vizuálnímu validátorovi (což by měl být speciálně trénovaný model pro porozumění videu), aby hodnotil a poskytl odměnové signály.