Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nghiên cứu quy mô lớn đầu tiên về các tác nhân AI thực sự hoạt động trong sản xuất.
Cơn sốt nói rằng các tác nhân đang biến đổi mọi thứ. Dữ liệu cho thấy một câu chuyện khác.
Các nhà nghiên cứu đã khảo sát 306 thực hành viên và thực hiện 20 nghiên cứu trường hợp sâu rộng trên 26 lĩnh vực. Những gì họ phát hiện thách thức những giả định phổ biến về cách các tác nhân sản xuất được xây dựng.
Thực tế: các tác nhân sản xuất được thiết kế đơn giản và bị hạn chế chặt chẽ.
1) Mô hình & Độ tin cậy
- 68% thực hiện tối đa 10 bước trước khi cần can thiệp của con người.
- 47% hoàn thành ít hơn 5 bước.
- 70% dựa vào các mô hình có sẵn mà không cần tinh chỉnh.
- 74% phụ thuộc chủ yếu vào đánh giá của con người.
Các nhóm cố ý đánh đổi tính tự chủ để lấy độ tin cậy.
Tại sao lại có những hạn chế này? Độ tin cậy vẫn là thách thức lớn nhất chưa được giải quyết. Các thực hành viên không thể xác minh độ chính xác của tác nhân ở quy mô lớn. Các tiêu chuẩn công khai hiếm khi áp dụng cho các nhiệm vụ sản xuất cụ thể theo miền. 75% các nhóm được phỏng vấn đánh giá mà không có tiêu chuẩn chính thức, thay vào đó dựa vào thử nghiệm A/B và phản hồi trực tiếp từ người dùng.
2) Lựa chọn Mô hình
Mô hình lựa chọn gây ngạc nhiên cho các nhà nghiên cứu. 17 trong số 20 nghiên cứu trường hợp sử dụng các mô hình biên giới đóng như Claude Sonnet 4, Claude Opus 4.1 và GPT o3. Việc áp dụng mã nguồn mở là hiếm và được thúc đẩy bởi các hạn chế cụ thể: khối lượng công việc lớn nơi chi phí suy diễn trở nên cản trở, hoặc các yêu cầu quy định ngăn cản việc chia sẻ dữ liệu với các nhà cung cấp bên ngoài. Đối với hầu hết các nhóm, chi phí thời gian chạy là không đáng kể so với các chuyên gia con người mà tác nhân hỗ trợ.
3) Khung Tác nhân
Việc áp dụng khung cho thấy sự khác biệt rõ rệt. 61% người tham gia khảo sát sử dụng các khung bên thứ ba như LangChain/LangGraph. Nhưng 85% các nhóm được phỏng vấn có triển khai sản xuất xây dựng các thực hiện tùy chỉnh từ đầu. Lý do: các vòng lặp tác nhân cốt lõi rất đơn giản để triển khai với các cuộc gọi API trực tiếp. Các nhóm thích các khung xây dựng tối thiểu, được thiết kế cho mục đích hơn là sự phình to của phụ thuộc và các lớp trừu tượng.
4) Luồng Kiểm soát Tác nhân
Các kiến trúc sản xuất ưu tiên các quy trình làm việc tĩnh đã được định nghĩa trước hơn là tính tự do mở. 80% các nghiên cứu trường hợp sử dụng luồng kiểm soát có cấu trúc. Các tác nhân hoạt động trong các không gian hành động được xác định rõ ràng thay vì tự do khám phá môi trường. Chỉ một trường hợp cho phép khám phá không bị hạn chế, và hệ thống đó chỉ chạy trong các môi trường được cách ly với xác minh CI/CD nghiêm ngặt....

Hàng đầu
Thứ hạng
Yêu thích

