Một vấn đề mà chúng tôi thường thấy: các tài liệu dài với nhiều phần nội dung lặp lại. Ví dụ: một cuốn sách sơ yếu lý lịch với một trang bìa, một vài trang về chương trình học của sinh viên, sau đó là các sơ yếu lý lịch nối tiếp nhau Xây dựng một tác nhân xử lý sơ yếu lý lịch thông minh tự động trích xuất dữ liệu có cấu trúc từ nội dung lặp lại bằng cách sử dụng LlamaSplit để xác định nơi bắt đầu và kết thúc của từng nội dung và LlamaExtract để trích xuất dữ liệu có cấu trúc: 📄 Tải lên các cuốn sách sơ yếu lý lịch PDF lên LlamaCloud và tự động phân loại các trang bằng cách sử dụng LlamaSplit để tách riêng các sơ yếu lý lịch khỏi chương trình học và trang bìa 🤖 Trích xuất thông tin có cấu trúc từ mỗi sơ yếu lý lịch bằng cách sử dụng LlamaExtract với các sơ đồ tùy chỉnh để ghi lại tên, thông tin liên lạc, giáo dục, kinh nghiệm làm việc và kỹ năng v.v. (do bạn chọn) ⚡ Tổ chức toàn bộ quy trình với LlamaAgent Workflows 🔍 Xử lý dữ liệu sơ yếu lý lịch thực tế với điểm tin cậy và đầu ra có cấu trúc sẵn sàng cho việc lọc, tìm kiếm và hệ thống ghép nối ứng viên Hướng dẫn sử dụng một cuốn sách sơ yếu lý lịch NYU làm ví dụ và cho thấy cả các cuộc gọi API riêng lẻ và một triển khai quy trình tự động hoàn chỉnh. Xem hướng dẫn đầy đủ: