Việc sử dụng ngôn ngữ tự nhiên để tạo ra biểu diễn trực quan của dữ liệu (NL2VIS) đang trở thành một hướng nghiên cứu tiềm năng và được thúc đẩy bởi sự phát triển của AI tạo sinh (GenAI). Trước sự gia tăng nhanh chóng của các nghiên cứu trong lĩnh vực này, bài báo thực hiện đánh giá tổng quan có hệ thống bằng phương pháp PRISMA. Trên cơ sở phân tích 46 bài báo (2018-2024), kết quả cho thấy rằng: 1) Số lượng công bố về chủ đề này ngày càng tăng, với tạp chí “IEEE Transactions on Visual-ization and Computer Graphics” là nơi đăng tải chủ yếu, mô hình Generative Adversar-ial Network (GAN) là nền tảng cho sự phát triển; 2) Các nghiên cứu chủ yếu tập trung vào việc tích hợp mô hình ngôn ngữ lớn (LLM) như ChatGPT, và cải thiện độ chính xác cũng như khả năng diễn giải của các hệ thống AI; 3) Thách thức hiện nay bao gồm thiếu dữ liệu huấn luyện chất lượng cao, hạn chế về tính minh bạch và khả năng diễn giải, vấn đề đạo đức khi áp dụng GenAI. Trong tương lai, nghiên cứu cần tập trung vào việc...
Việc sử dụng ngôn ngữ tự nhiên để tạo ra biểu diễn trực quan của dữ liệu (NL2VIS) đang trở thành một hướng nghiên cứu tiềm năng và được thúc đẩy bởi sự phát triển của AI tạo sinh (GenAI). Trước sự gia tăng nhanh chóng của các nghiên cứu trong lĩnh vực này, bài báo thực hiện đánh giá tổng quan có hệ thống bằng phương pháp PRISMA. Trên cơ sở phân tích 46 bài báo (2018-2024), kết quả cho thấy rằng: 1) Số lượng công bố về chủ đề này ngày càng tăng, với tạp chí “IEEE Transactions on Visual-ization and Computer Graphics” là nơi đăng tải chủ yếu, mô hình Generative Adversar-ial Network (GAN) là nền tảng cho sự phát triển; 2) Các nghiên cứu chủ yếu tập trung vào việc tích hợp mô hình ngôn ngữ lớn (LLM) như ChatGPT, và cải thiện độ chính xác cũng như khả năng diễn giải của các hệ thống AI; 3) Thách thức hiện nay bao gồm thiếu dữ liệu huấn luyện chất lượng cao, hạn chế về tính minh bạch và khả năng diễn giải, vấn đề đạo đức khi áp dụng GenAI. Trong tương lai, nghiên cứu cần tập trung vào việc cải thiện mô hình AI tạo sinh, thiết kế giao diện lấy người dùng làm trung tâm, và giải quyết các vấn đề về thiên lệch, độ tin cậy và bảo mật trong trực quan hóa dữ liệu do AI tạo ra.