Nghiên cứu này khảo sát mối quan hệ giữa các chỉ số độ phức tạp phần mềm và mật độ lỗi trên năm tập dữ liệu NASA-PROMISE (JM1, CM1, KC1, KC2 và PC1). Năm chỉ số độ phức tạp được kiểm chứng rộng rãi—độ phức tạp vòng lặp, số dòng lệnh (LOC), thể tích Halstead, độ khó Halstead và độ phức tạp thiết yếu—được phân tích bằng cả phương pháp thống kê và học máy. Phân tích tương quan Pearson và Spearman cho thấy mặc dù tương quan tuyến tính yếu và âm, các mối quan hệ đơn điệu đều dương và có ý nghĩa thống kê (𝑝 < 0, 01), trong đó LOC thể hiện mối liên hệ mạnh nhất. Bốn mô hình học máy (Hồi quy Logistic, SVM, Random Forest và Gradient Boosting) được đánh giá với hai kỹ thuật lấy mẫu (SMOTE và BorderlineSMOTE), tạo ra 40 cấu hình thực nghiệm. Random Forest đạt hiệu năng tốt nhất, với kết quả cao nhất trên tập KC1 khi kết hợp Borderline-SMOTE (AUC = 0,868; F1 = 0,500; MCC = 0,432). Phân tích tầm quan trọng đặc trưng cho thấy LOC, thể tích Halstead và độ khó Halstead đóng góp hơn 81% tổng sức mạnh...
Nghiên cứu này khảo sát mối quan hệ giữa các chỉ số độ phức tạp phần mềm và mật độ lỗi trên năm tập dữ liệu NASA-PROMISE (JM1, CM1, KC1, KC2 và PC1). Năm chỉ số độ phức tạp được kiểm chứng rộng rãi—độ phức tạp vòng lặp, số dòng lệnh (LOC), thể tích Halstead, độ khó Halstead và độ phức tạp thiết yếu—được phân tích bằng cả phương pháp thống kê và học máy. Phân tích tương quan Pearson và Spearman cho thấy mặc dù tương quan tuyến tính yếu và âm, các mối quan hệ đơn điệu đều dương và có ý nghĩa thống kê (𝑝 < 0, 01), trong đó LOC thể hiện mối liên hệ mạnh nhất. Bốn mô hình học máy (Hồi quy Logistic, SVM, Random Forest và Gradient Boosting) được đánh giá với hai kỹ thuật lấy mẫu (SMOTE và BorderlineSMOTE), tạo ra 40 cấu hình thực nghiệm. Random Forest đạt hiệu năng tốt nhất, với kết quả cao nhất trên tập KC1 khi kết hợp Borderline-SMOTE (AUC = 0,868; F1 = 0,500; MCC = 0,432). Phân tích tầm quan trọng đặc trưng cho thấy LOC, thể tích Halstead và độ khó Halstead đóng góp hơn 81% tổng sức mạnh dự đoán, trong khi độ phức tạp thiết yếu có ảnh hưởng rất thấp. So với các nghiên cứu trước, nghiên cứu này cải thiện hiệu năng trên nhiều tập dữ liệu nhờ kỹ thuật cân bằng lớp, đồng thời cung cấp đánh giá toàn diện hơn thông qua các thước đo AUC và MCC. Kết quả khẳng định rằng một tập nhỏ các chỉ số độ phức tạp đã được kiểm chứng có thể hỗ trợ hiệu quả cho bài toán dự đoán lỗi phần mềm khi kết hợp với các kỹ thuật tiền xử lý và học máy phù hợp.