Không ngừng phát triển
Hệ thống này do nhóm tác giả thuộc Phòng Thí nghiệm Trí tuệ Nhân tạo (AILab), Trường Đại học Khoa học tự nhiên Thành phố Hồ Chí Minh nghiên cứu và phát triển.
Đại diện nhóm tác giả - anh Đậu Hà Ngọc Dương cho biết, VIS là hệ thống tổng đài chuyển mạch tự động tích hợp công nghệ xử lý tiếng nói tiếng Việt đầu tiên tại Việt Nam, trong khi các hệ thống trên thế giới hiện chỉ hỗ trợ một số ngôn ngữ phổ biến như tiếng Anh, tiếng Pháp, tiếng Nhật …
Như vậy có thể nói, đây chính là hệ thống đầu tiên tại Việt Nam hỗ trợ tiếng Việt và phục vụ cho người Việt. Mô hình kiến trúc hệ thống với hạt nhân xử lý tiếng nói (nhận dạng và tổng hợp) dễ dàng thay đổi tùy theo từng ứng dụng, từng lĩnh vực, giúp nhanh chóng xây dựng một hệ thống mới, tùy theo yêu cầu của khách hàng.
Có thể nói, chất lượng tiếng nói tổng hợp của VIS hiện đã rất tự nhiên, trôi chảy và gần với tiếng người.
Do đó, đánh giá cao những giá trị và triển vọng ứng dụng rộng rãi của hệ thống VIS, Hội đồng giám khảo Giải thưởng NTĐV 2012 đã quyết định trao tặng giải Nhì cho Hệ thống trả lời tự động bằng giọng nói.
Giải thưởng này đã trở thành động lực rất lớn để nhóm tác giả tiếp tục hoàn thiện hơn nữa sản phẩm của mình nhằm mang lại cho người Việt hệ thống trả lởi tự động thuần Việt nhất.
Cụ thể, sản phẩm đã được phát triển thêm tập trung vào công nghệ nhận dạng và tổng hợp tiếng nói. Chẳng hạn như, bộ nhận dạng tiếng nói được bổ sung thêm về phương ngữ, giúp nhận dạng tốt hơn tiếng nói của các vùng miền khác nhau của nước ta. Bộ tổng hợp tiếng nói được bổ sung thêm các giọng mới (3 giọng: Hà Nội, Huế, Sài Gòn).
Tốc độ tổng hợp cũng được cải thiện, giảm thời gian xử lý, giúp hệ thống phản hồi đến người dùng nhanh hơn. Chúng tôi đã có thể đưa bộ tổng hợp này chạy độc lập trên những thiết bị di động với cấu hình thấp.