jeśli budowanie większej liczby środowisk RL dla LLM-ów jest kluczowe dla postępu AI i poprawy możliwości w obszarach o wysokim ryzyku, musimy znacznie zwiększyć dostępność nauki, jak to robić dobrze. tutoriale nie istnieją. nie ma podręcznika. zmieńmy to.
31,75K