Cùng với sự phát triển của khoa học kỹ thuật, đặc biệt là internet vạn vật kết nối (IoT), các sản phẩm liên quan đến IoT thường được điều khiển bằng tiếng nói con người. Nhận dạng tiếng nói con người là kỹ thuật bị ảnh hưởng bởi các nguyên nhân như môi trường, độ dài của thời gian. Các kỹ thuật nhận dạng tiếng nói hiện nay vẫn chưa khắc phục được hết các nguyên nhân kể trên, do đó các kỹ thuật nhận dạng, xử lý tiếng nói có nhu cầu bắt buộc phải cải tiến. Để tăng cường khả năng nhận dạng xử lý tiếng nói đảm các yêu cầu trên. Nhóm nghiên cứu chúng tôi đã đề xuất một phương pháp mới kết hợp các kỹ thuật nhận dạng tiếng nói: Đầu tiên là thông qua CNN, VGG-CNN và RNN để lấy các âm đặc trưng của tín hiệu đầu vào sau đó lợi dụng vào máy hỗ trợ Vector (SVM) để tiến hành phân loại các âm đặc trưng, cuối cùng chúng tôi dùng hàm số Softmax để phán đoán kết quả nhận dạng. Kết quả thử nghiệm được sử dụng trong cơ sở dữ liệu tiêu chuẩn Voxcelb thể hiện sự vượt trội trong nhận dạng tiếng nói con...
Cùng với sự phát triển của khoa học kỹ thuật, đặc biệt là internet vạn vật kết nối (IoT), các sản phẩm liên quan đến IoT thường được điều khiển bằng tiếng nói con người. Nhận dạng tiếng nói con người là kỹ thuật bị ảnh hưởng bởi các nguyên nhân như môi trường, độ dài của thời gian. Các kỹ thuật nhận dạng tiếng nói hiện nay vẫn chưa khắc phục được hết các nguyên nhân kể trên, do đó các kỹ thuật nhận dạng, xử lý tiếng nói có nhu cầu bắt buộc phải cải tiến. Để tăng cường khả năng nhận dạng xử lý tiếng nói đảm các yêu cầu trên. Nhóm nghiên cứu chúng tôi đã đề xuất một phương pháp mới kết hợp các kỹ thuật nhận dạng tiếng nói: Đầu tiên là thông qua CNN, VGG-CNN và RNN để lấy các âm đặc trưng của tín hiệu đầu vào sau đó lợi dụng vào máy hỗ trợ Vector (SVM) để tiến hành phân loại các âm đặc trưng, cuối cùng chúng tôi dùng hàm số Softmax để phán đoán kết quả nhận dạng. Kết quả thử nghiệm được sử dụng trong cơ sở dữ liệu tiêu chuẩn Voxcelb thể hiện sự vượt trội trong nhận dạng tiếng nói con người so với phương pháp i-vector truyền thống hay các phương pháp CNN khác.