人类和人工智能代理在具体指令下表现更好,但当糟糕的指令导致糟糕的表现时,只有前者可以被指责。
5.54K