今晚的观察: gpt5 在高水平数学方面非常非常出色。 gemini 2.5 pro 在受到足够的责备和批评后,成为了一个非常好的评论者。 opus 4(不是 4.1)仍然是最好的工作蜂,但在原始智力水平上并不在同一层次。
27.56K