Bài báo giới thiệu một hệ thống theo dõi nhiều đối tượng trong thời gian thực bằng cách kết hợp mô hình phát hiện YOLOv10 với thuật toán liên kết ByteTrack. Trong hệ thống, YOLOv10 cung cấp các phát hiện đối tượng chính xác theo từng khung hình, trong khi ByteTrack thực hiện liên kết dữ liệu dựa trên chiến lược gán hai giai đoạn, tận dụng cả các phát hiện có độ tin cậy cao và thấp để giảm số lần thay đổi định danh. Kết quả thực nghiệm cho thấy hệ thống đạt độ chính xác phát hiện 0,90, tỷ lệ bao phủ 0,85, độ chính xác theo dõi tổng thể 0,82 và số lần thay đổi định danh là 10. Khi chạy trên video độ phân giải 720 điểm ảnh, hệ thống duy trì tốc độ 7-8 khung hình mỗi giây. Các kết quả thực nghiệm cho thấy phương pháp YOLOv10 kết hợp ByteTrack đạt hiệu năng phù hợp cho các ứng dụng như giám sát, giao thông thông minh và phân tích hành vi, đồng thời có thể tiếp tục được cải thiện thông qua tối ưu tham số hoặc bổ sung mô-đun tái nhận dạng gọn nhẹ.