no-2

Hệ thống phát hiện email lừa đảo phishing sử dụng temporal analysis và mô hình transformer

Tác giả:
Đặng Thị Hiền, Trần Thị Duyên
Trang:
0
Lượt xem:
52
Số trong tạp chí:
7/7
Lượt tải:
17
Nghiên cứu này giải quyết thách thức phát hiện hiệu quả các chiến dịch email lừa đảo có mức độ tinh vi ngày càng cao và mang tính tuần tự. Mục tiêu chính là xây dựng một phương pháp phát hiện không chỉ phân tích từng email riêng lẻ mà còn nắm bắt được các mẫu hành vi xuyên suốt chuỗi email liên quan. Để đạt được mục tiêu này, một khung học sâu lai được đề xuất nhằm kết hợp các kiến trúc mạng nơ-ron tiên tiến cho phân tích chuỗi nhiều email. Cụ thể, mô hình sử dụng DistilBERT để trích xuất các biểu diễn ngữ nghĩa từ nội dung email, trong khi mạng Bidirectional Long Short-Term Memory (BiLSTM) được áp dụng để mô hình hóa các phụ thuộc theo thời gian trong các luồng email liên tiếp. Tập dữ liệu huấn luyện được xây dựng bằng cách tổng hợp bốn bộ dữ liệu công khai về email lừa đảo và spam, bao gồm CEAS_08, Nazario, Nigerian Fraud và SpamAssassin, tạo thành tập dữ liệu đã được làm sạch gồm 46.616 email, bao phủ giai đoạn từ năm 2000 đến năm 2022. Ngoài ra, hai thước đo heuristic mới —...
Nghiên cứu này giải quyết thách thức phát hiện hiệu quả các chiến dịch email lừa đảo có mức độ tinh vi ngày càng cao và mang tính tuần tự. Mục tiêu chính là xây dựng một phương pháp phát hiện không chỉ phân tích từng email riêng lẻ mà còn nắm bắt được các mẫu hành vi xuyên suốt chuỗi email liên quan. Để đạt được mục tiêu này, một khung học sâu lai được đề xuất nhằm kết hợp các kiến trúc mạng nơ-ron tiên tiến cho phân tích chuỗi nhiều email. Cụ thể, mô hình sử dụng DistilBERT để trích xuất các biểu diễn ngữ nghĩa từ nội dung email, trong khi mạng Bidirectional Long Short-Term Memory (BiLSTM) được áp dụng để mô hình hóa các phụ thuộc theo thời gian trong các luồng email liên tiếp. Tập dữ liệu huấn luyện được xây dựng bằng cách tổng hợp bốn bộ dữ liệu công khai về email lừa đảo và spam, bao gồm CEAS_08, Nazario, Nigerian Fraud và SpamAssassin, tạo thành tập dữ liệu đã được làm sạch gồm 46.616 email, bao phủ giai đoạn từ năm 2000 đến năm 2022. Ngoài ra, hai thước đo heuristic mới — Urgency_score và Suspicious_score — được đề xuất nhằm định lượng các dấu hiệu tiềm ẩn thường xuất hiện trong email lừa đảo. Kết quả thực nghiệm cho thấy khung phương pháp đề xuất đạt độ chính xác 99,36% và giá trị AUC-ROC 0,9991 trên tập xác thực, vượt trội so với một số phương pháp cơ sở. Bên cạnh đó, các thí nghiệm loại bỏ thành phần (ablation study) xác nhận đóng góp của từng thành phần trong mô hình, trong khi phân tích độ nhạy cung cấp cơ sở thực nghiệm cho việc lựa chọn kích thước cửa sổ chuỗi phù hợp.
Tin liên quan

Tạp chí khoa học Trường Đại học Vinh

Vinh University journal of science (VUJS)

ISSN: 1859 - 2228

Cơ quan chủ quản: Trường Đại học Vinh

  • Địa chỉ: 182 Lê Duẩn - Thành Phố Vinh - tỉnh Nghệ An
  • Điện thoại: (0238)3855.452 - Fax: (0238)3855.269
  • Email: vinhuni@vinhuni.edu.vn
  • Website: https://vinhuni.edu.vn

 

Giấy phép xuất bản tạp chí: 163/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 10/5/2023

Giấy phép truy cập mở: Creative Commons CC BY NC 4.0

 

LIÊN HỆ

Tổng biên tập: PGS.TS. Trần Bá Tiến 
Email: tientb@vinhuni.edu.vn

Phó Tổng biên tập: PGS.TS. Phan Văn Tiến
Email: vantienkxd@vinhuni.edu.vn

Thư ký tòa soạn: TS. Đỗ Mai Trang
Email: domaitrang@vinhuni.edu.vn

Ban thư ký và trị sự: ThS. Lê Tuấn Dũng, ThS. Phan Thế Hoa, ThS. Phạm Thị Quỳnh Nga, ThS. Trần Thị Thái

  • Địa chỉ Toà soạn: Tầng 4, Tòa nhà Điều hành, Số 182 Lê Duẩn, TP. Vinh, Nghệ An, Việt Nam
  • Điện thoại: (0238)3.856.700 | Hotline: 0973.856.700
  • Email: editors@vujs.vn
  • Website: https://vujs.vn

img