phần điên rồ là Opus 4.1 không suy nghĩ gần như tốt như GPT-5-cao, đôi khi còn tốt hơn ở một số khía cạnh, ngoại trừ việc nó bắt đầu trả lời ngay lập tức thay vì suy nghĩ trong một phút. Tôi không hiểu Anthropic đã làm thế nào để tạo ra phiên bản không lý luận thông minh như vậy.
lmarena.ai
lmarena.ai00:57 12 thg 8
🚨 Cập nhật Bảng xếp hạng: Claude Opus 4.1 leo lên vị trí #2 tổng thể trên Arena và giờ đây trở thành mô hình không suy nghĩ tốt nhất, ngang bằng với GPT-5 ở vị trí #1 trong các hạng mục chính: - Lập trình - Thực hiện hướng dẫn - Các yêu cầu khó - Các truy vấn dài hơn Chúc mừng @AnthropicAI về cột mốc ấn tượng này!
138,38K