: Bài báo đề xuất một mô hình học máy cho bài toán phân lớp trên tập dữ liệu mất cân bằng, trong đó sử dụng kết hợp kỹ thuật sinh mẫu tổng hợp SMOTE và giải thuật AdaBoost cho thuật toán Cây quyết định. Các tác giả đã tiến hành thực nghiệm đánh giá so sánh hiệu quả phân lớp của mô hình đã đề xuất với các giải thuật Cây quyết định sử dụng entropy và chỉ số Gini trên bộ dữ liệu thực tế thu thập tại Trường trung học phổ thông (THPT) Đông Hiếu, Thái Hòa, Nghệ An từ năm 2014 đến năm 2019. Kết quả nghiên cứu có thể sử dụng làm nền tảng để xây dựng ứng dụng hỗ trợ dự đoán sớm khả năng thôi học của học sinh THPT, có ý nghĩa góp phần nâng cao chất lượng giáo dục đào tạo của nhà trường và các cấp quản lý giáo dục.