Saya pikir ini mungkin benar-benar bekerja lebih baik daripada stick figure karena jauh lebih detail. Pertanyaannya adalah bagaimana menghasilkan sosok humanoid yang akurat dari prompt teks karena kemudian Anda membuat ribuan animasi.