Nghiên cứu này tập trung vào bài toán dự đoán điểm đánh giá sản phẩm dựa trên phản hồi văn bản của khách hàng - một nhiệm vụ kết hợp giữa thách thức của xử lý ngôn ngữ tự nhiên và hiện tượng mất cân bằng lớp thường gặp trong dữ liệu thực tế. Sử dụng tập dữ liệu Amazon Fine Food Reviews, nhóm nghiên cứu tiến hành tiền xử lý, trích xuất đặc trưng ngôn ngữ và xây dựng các mô hình học máy và học sâu nhằm đánh giá hiệu suất dự đoán. Các mô hình được so sánh bao gồm Logistic Regression, Decision Tree, Random Forest, CatBoost, LightGBM, XGBoost, FastText, CNN và LSTM. Kết quả thực nghiệm cho thấy sự đánh đổi rõ rệt giữa độ chính xác và khả năng nắm bắt thứ bậc: Logistic Regression đạt độ chính xác phân loại cao nhất, trong khi CNN thể hiện chất lượng dự đoán ordinal tốt nhất với chỉ số QWK cao nhất và sai số MAE thấp nhất. FastText nổi bật như một mô hình cơ sở mạnh, đạt hiệu suất cạnh tranh cùng thời gian huấn luyện nhanh nhất, trong khi các mô hình boosting mang lại độ chính xác số học tốt...
Nghiên cứu này tập trung vào bài toán dự đoán điểm đánh giá sản phẩm dựa trên phản hồi văn bản của khách hàng - một nhiệm vụ kết hợp giữa thách thức của xử lý ngôn ngữ tự nhiên và hiện tượng mất cân bằng lớp thường gặp trong dữ liệu thực tế. Sử dụng tập dữ liệu Amazon Fine Food Reviews, nhóm nghiên cứu tiến hành tiền xử lý, trích xuất đặc trưng ngôn ngữ và xây dựng các mô hình học máy và học sâu nhằm đánh giá hiệu suất dự đoán. Các mô hình được so sánh bao gồm Logistic Regression, Decision Tree, Random Forest, CatBoost, LightGBM, XGBoost, FastText, CNN và LSTM. Kết quả thực nghiệm cho thấy sự đánh đổi rõ rệt giữa độ chính xác và khả năng nắm bắt thứ bậc: Logistic Regression đạt độ chính xác phân loại cao nhất, trong khi CNN thể hiện chất lượng dự đoán ordinal tốt nhất với chỉ số QWK cao nhất và sai số MAE thấp nhất. FastText nổi bật như một mô hình cơ sở mạnh, đạt hiệu suất cạnh tranh cùng thời gian huấn luyện nhanh nhất, trong khi các mô hình boosting mang lại độ chính xác số học tốt nhưng phải đánh đổi về chi phí tính toán. Không có mô hình nào vượt trội toàn diện trên tất cả các chỉ số, cho thấy tầm quan trọng của việc lựa chọn mô hình phù hợp với từng mục tiêu ứng dụng cụ thể. Các phát hiện này góp phần làm rõ vai trò của đặc trưng ngôn ngữ trong phản hồi người dùng và cung cấp định hướng thực tiễn cho việc xây dựng hệ thống dự đoán điểm đánh giá trong thương mại điện tử.