我认为这可能比火柴人更有效,因为它更详细。 问题是如何从文本提示生成准确的人形图像,因为这样你可以创建成千上万的动画。