no-2

Một thuật toán hữu ích để khai thác tập hữu ích cao

Tác giả:
Nguyễn Thi Thanh Thủy
Trang:
100
Lượt xem:
132
Số trong tạp chí:
6/6
Lượt tải:
72
Khai thác tập hữu ích cao (High Utility Itemsets - HUIs) là việc tìm ra các tập mục thỏa mãn một ngưỡng độ hữu ích tối thiểu do người dùng xác định. Đã có nhiều thuật toán khai thác tập hữu ích cao hiệu quả, tuy nhiên các thuật toán này đều dựa trên cơ chế Tidset (lưu trữ tập giao của các giao dịch trong cấu trúc dữ liệu). Ở bài báo này, thuật toán DCHUIM được đề xuất nhằm khai thác tập hữu ích cao bằng cơ chế Diffset, tức là thay vì lưu trữ tập giao thì cơ chế này sẽ lưu trữ tập trừ của các giao dịch. Để thực hiện việc này, một cấu trúc dữ liệu DUL được xây dựng để lưu trữ thông tin về độ hữu ích của một tập mục và các giao dịch thuộc tập Diffset. Ngoài ra, thuật toán còn áp dụng các chiến lược cắt tỉa như U-Prune, EUCS-Prune và sử dụng tập hữu ích đóng để nén dữ liệu một cách hiệu quả, từ đó giảm không gian tìm kiếm trong quá trình khai thác. Thực nghiệm được thực hiện trên các bộ dữ liệu lớn gồm Accidents, Mushroom, Retail, Chainstore và tiến hành so sánh hiệu suất thực thi giữa...
Khai thác tập hữu ích cao (High Utility Itemsets - HUIs) là việc tìm ra các tập mục thỏa mãn một ngưỡng độ hữu ích tối thiểu do người dùng xác định. Đã có nhiều thuật toán khai thác tập hữu ích cao hiệu quả, tuy nhiên các thuật toán này đều dựa trên cơ chế Tidset (lưu trữ tập giao của các giao dịch trong cấu trúc dữ liệu). Ở bài báo này, thuật toán DCHUIM được đề xuất nhằm khai thác tập hữu ích cao bằng cơ chế Diffset, tức là thay vì lưu trữ tập giao thì cơ chế này sẽ lưu trữ tập trừ của các giao dịch. Để thực hiện việc này, một cấu trúc dữ liệu DUL được xây dựng để lưu trữ thông tin về độ hữu ích của một tập mục và các giao dịch thuộc tập Diffset. Ngoài ra, thuật toán còn áp dụng các chiến lược cắt tỉa như U-Prune, EUCS-Prune và sử dụng tập hữu ích đóng để nén dữ liệu một cách hiệu quả, từ đó giảm không gian tìm kiếm trong quá trình khai thác. Thực nghiệm được thực hiện trên các bộ dữ liệu lớn gồm Accidents, Mushroom, Retail, Chainstore và tiến hành so sánh hiệu suất thực thi giữa thuật toán DCHUIM với thuật toán HMINER. Kết quả cho thấy thuật toán DCHUIM có hiệu suất tốt hơn thuật toán HMINER về thời gian thực thi trên cơ sở dữ liệu thưa và vượt trội về bộ nhớ sử dụng trên tất cả các cơ sở dữ liệu.
Tin liên quan
Kháng kháng sinh của Streptococcus agalactiae gây bệnh trên cá rô phi (Oreochromis sp.) ở miền bắc Việt Nam
Trương Thị Mỹ Hạnh, Nguyễn Thị Hạnh, Lê Thị Mây, Trương Thị Thành Vinh, Đặng Thị Lụa
Tập 53, Số 2A, 04/2024
Nghiên cứu xây dựng thiết bị y tế hỗ trợ theo dõi từ xa cho bệnh nhân tim mạch
Trần Thị Hiền, Đào Thị Hằng, Phạm Văn Phi
Tập 53, Số 2A, 04/2024
Phân bố của loài Epinephelus epistictus (Temminck and Schlegel, 1843) (Perciformes: Epinephelidae) ở vùng ven biển Bắc Trung Bộ, Việt N
Hoàng Ngọc Thảo, Lê Trần Ngọc Trúc, Hoàng Ngọc Thảo Anh, Trần Thị Khánh Linh, Lê Thị Quý, Trịnh Thị Thu
Tập 53, Số 2A, 04/2024
Tìm kiếm cộng đồng mạng dựa trên cải tiến toạ độ của đỉnh
Lại Văn Trung, Nguyễn Thị Thanh Giang
Tập 53, Số 2A, 04/2024
Ảnh hưởng của oxit kim loại hiếm đến cấu trúc và tính chất điện của varistor dựa trên ZnO-Bi2O3: phân tích, so sánh giữa Y2O3 và CeO2
Nguyễn Trung Huy, Tráng Nguyen, Cao Thị Hồng, Nguyễn Thị Xuyên, Võ Thị Kiều Anh, Nguyễn Quang Dương, Nguyễn Tuấn Anh, Lê Đăng Quang, Đỗ Quang Thẩm
Tập 53, Số 2A, 04/2024

Tạp chí khoa học Trường Đại học Vinh

Vinh University journal of science (VUJS)

ISSN: 1859 - 2228

Cơ quan chủ quản: Trường Đại học Vinh

  • Địa chỉ: 182 Lê Duẩn - Thành Phố Vinh - tỉnh Nghệ An
  • Điện thoại: (0238)3855.452 - Fax: (0238)3855.269
  • Email: vinhuni@vinhuni.edu.vn
  • Website: https://vinhuni.edu.vn

 

Giấy phép xuất bản tạp chí: 163/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 10/5/2023

Giấy phép truy cập mở: Creative Commons CC BY NC 4.0

 

LIÊN HỆ

Tổng biên tập: PGS.TS. Trần Bá Tiến 
Email: tientb@vinhuni.edu.vn

Phó Tổng biên tập: TS. Phan Văn Tiến
Email: vantientkxd@vinhuni.edu.vn

Thư ký tòa soạn: TS. Đỗ Mai Trang
Email: domaitrang@vinhuni.edu.vn

Ban thư ký và trị sự: ThS. Lê Tuấn Dũng, TS. Lê Thanh Nga

  • Địa chỉ Toà soạn: Tầng 4, Tòa nhà Điều hành, Số 182 Lê Duẩn, TP. Vinh, Nghệ An, Việt Nam
  • Điện thoại: (0238)3.856.700 | Hotline: 0973.856.700
  • Email: editors@vujs.vn
  • Website: https://vujs.vn

img