fant ut hvordan jeg kunne "angre" RL og gjøre gpt-oss tilbake til en basismodell vil slippe vektene i morgen Gn
jack morris
jack morris9. aug., 03:21
nysgjerrig på treningsdataene til OpenAIs nye gpt-oss-modeller? Det var jeg også. så jeg genererte 10 millioner eksempler fra gpt-oss-20b, kjørte noen analyser, og resultatene var ... ganske bisarrt På tide med et dypdykk 🧵
194,66K