Bản DeepSeek-V3.1-Base vừa được phát hành đã có bài kiểm tra thực tế! Nói thẳng vào kết luận, tốt hơn GPT-5! Cảm giác của tôi là nó có thể sớm ngang bằng với Claude-Sonnet-4. Trong ba nhóm thử nghiệm lần này, DeepSeek đã vượt qua tất cả các bài kiểm tra ngoại trừ việc không thêm tên gói THREE vào OrbitControls của kem đánh răng voi, so với GPT-5 đã gặp nhiều lỗi trong các bài kiểm tra trước. DeepSeek-V3.1-Base có thể được mô tả là mượt mà. Tuy nhiên, vấn đề lớn nhất mà DeepSeek-V3.1-Base gặp phải là thẩm mỹ vẫn còn thiếu sót, bình tam giác được tạo ra chỉ có thể được mô tả là trừu tượng, và trong 6 lần tạo ra không có lần nào có thể xem được. Phong cách và thẩm mỹ của trang web cũng hơi đơn điệu. Đó là đánh giá cho kỳ này, hãy theo dõi tôi để xem các đánh giá mô hình lớn chuyên nghiệp trên toàn mạng.
83,48K