Cụ thể, công nghệ mới này sẽ nhận dạng và chuyển thể giọng nói tốt bằng cả con người. "Chúng tôi đã đạt đến sự ngang bằng giữa máy móc và con người. Đây là một thành tựu của lịch sử", trưởng ban nghiên cứu, ông Xuedong Huang, cho biết.
Được biết, tỉ lệ mắc lỗi của hệ thống là 5,9%, và Microsoft đã cho rằng tỉ lệ này ngang bằng với phiên dịch viên chuyên nghiệp khi họ tiến hành các bài đánh giá thực giữa người và máy.
Hệ thống dùng sẽ dùng Machine Learning cho việc phân tích và xử lý ngữ nghĩa của ngôn ngữ. Microsoft dự kiến sẽ tích hợp khả năng nhận dạng này lên trợ lý ảo Cortana trên các thiết bị Windows và máy chơi game Xbox One, cũng như các phần mềm phiên dịch khác trong tương lai.
Tuy kết quả trên thực sự ấn tượng, nhưng cuộc chơi nhận dạng giọng nói vẫn chưa kết thúc. Microsoft vẫn cần thực hiện một số chỉnh sửa để có thể nhận dạng giọng nói trong nhiều ngữ cảnh khác nhau, cũng như nhiều dạng giọng nói/ngôn ngữ.
Việc lớn nhất mà Microsoft cần làm với Cortana hiện giờ là "dạy" cho nó hiểu nghĩa của từ ngữ và hành động theo văn cảnh, chứ không chỉ khiến nó nghe chính xác giọng nói con người.