Công nghệ chuyển giọng nói... thành chữ viết

Viện Nghiên cứu điện tử viễn thông Hàn Quốc (ETRI) tuyên bố đã phát triển được công nghệ dịch thuật từ việc nhận diện âm thanh để "dịch" nội dung đó từ ngôn ngữ này sang ngôn ngữ khác.

Nhân viên của ETRI kiểm tra công nghệ nhận dạng tiếng nói của mình bằng ứng dụng dịch thuật di động Genie Talk ngày 18/4. Ảnh: ETRI
Nhân viên của ETRI kiểm tra công nghệ nhận dạng tiếng nói của mình bằng ứng dụng dịch thuật di động Genie Talk ngày 18/4. Ảnh: ETRI

Các nhà nghiên cứu của ETRI đã ứng dụng công nghệ nhận diện chuyên sâu (deep learning) của trí tuệ nhân tạo để phát triển một chương trình nhận diện-dịch thuật âm thanh đa ngôn ngữ.

Theo đó, với các cụm từ có sẵn, công nghệ sẽ nhận diện âm thanh giọng nói để dịch trực tiếp từ ngôn ngữ này sang ngôn ngữ khác rồi hiển thị nội dung đó bằng chữ viết.

So với chương trình của Google, khả năng nhận diện tiếng Hàn của ETRI vượt trội hơn khi có thể "dịch" tới 96% nội dung cuộc nói chuyện trong đời sống hằng ngày. Tỉ lệ này ở các ngôn ngữ khác đạt từ 90% tới 95%, tương đương với Google.

Hiện công nghệ trên đã được áp dụng với 9 ngôn ngữ, gồm tiếng Anh, Trung Quốc, Nhật, Tây Ban Nha, Pháp, Đức, Nga và tiếng A Rập.

ETRI dự kiến sẽ mở rộng áp dụng với một số ngôn ngữ ở Đông Nam Á.

Theo Chính Phủ

Tin tiêu điểm

Đừng bỏ lỡ