Meta刚刚在Hugging Face上发布了Action100M 这是一个包含超过1亿个层次化动作注释的大型视频数据集。 每个视频都包括带有动作标签的标题树,以及简要和详细的摘要。