Theo thống kê, Việt Nam hiện có hơn 3 triệu người mắc chứng bệnh suy giảm thị lực (mù và khiếm thị). Và trong một khảo sát được thực hiện bởi các tổ chức xã hội, 82% số người người này cho rằng, “đọc”là một phần rất quan trọng trong cuộc sống của họ.
Thế nhưng, cũng chỉ có 1% người mù và khiếm thị có khả năng đọc được bằng chữ nổi. Điều này xuất phát từ việc học cách đọc, tài liệu chữ nổi còn ít, chi phí làm chữ nổi cao, chiếm diện tích lớn và khó chia sẻ...
Hiện nay, trên thế giới chỉ có khoảng 2% các tài liệu, sách báo được chuyển sang định dạng cho người mù và khiếm thị. Tại Việt Nam, tỷ lệ trên còn thấp hơn rất nhiều.
Theo khảo sát của nhóm nghiên cứu iHearTech, trường ĐH Bách khoa TP.HCM, người mắc chứng suy giảm thị lực có yêu cầu nhiều nhất về nội dung cần đọc là các loại sách giáo khoa phổ thông, sách học ngoại ngữ, sách Văn học, sách về Xã hội – Chính trị, Âm nhạc, Y học cổ truyền... Thế nhưng, các nội dung này có rất ít ở dạng chữ nổi để họ có thể đọc được.
Để hỗ trợ cho người mù và người khiếm thị tiếp cận thông tin, nhiều hãng công nghệ lớn trên thế giới đã cho ra đời các ứng dụng nhận dạng và tổng hợp tiếng nói như Dragon của LH, Siri của Apple, Google voice search... Tuy nhiên, các ứng dụng này chỉ có khả năng hỗ trợ tiếng Anh, các ứng dụng dành cho tiếng Việt gần như là không có.
Theo PGS-TS Hoàng Trang, Phó Trưởng khoa Điện – Điện tử, Trường ĐH Bách Khoa TP.HCM, âm sắc, ngữ điệu và cấu trúc ngữ pháp của tiếng Việt tương đối phức tạp. Do đó, không thể áp dụng các công nghệ nhận dạng tiếng nói có sẵn trên thế giới.
Đứng trước bài toán nói trên, anh và nhóm cộng sự của mình đã nghiên cứu và chế tạo ra một thiết bị cầm tay trợ giúp người khuyết tật bằng giọng nói.
Theo PGS – TS Hoàng Trang, thiết bị trên tương đối nhỏ gọn, chỉ như một chiếc điện thoại khoảng 5 inch được cấu tạo từ một hệ thống bảng mạch điện tử. Máy hoạt động trên cơ chế tiếp nhận lệnh bằng giọng nói và điều khiển theo câu lệnh dựa trên nền tảng của con chip “iHearTech”. Đây là con chip do nhóm tự nghiên cứu và sản xuất ra.
Con chip này có hai chế độ, đầu tiên là chế độ hỗ trợ bộ từ phụ thuộc người nói tối đa đến 768 từ. Thứ hai là chế độ hỗ trợ bộ từ độc lập người nói tối đa 256 từ, chế độ này giúp máy có thể nhận dạng giọng nói của bất kỳ ai.
Bên cạnh đó, máy cũng được trang bị bộ xử lý văn phạm, trong đó gom gọn các câu lệnh bằng các “keyword”, giúp thời gian nhận dạng và xử lý câu lệnh nhanh hơn.
Khi muốn truy cập vào một tờ báo hay cuốn sách điện tử nào đó, người dùng chỉ cần ra lệnh, thiết bị sẽ lọc bỏ những dữ liệu không cần thiết, chỉ giữ lại phần chữ và sau đó chuyển phần chữ sang định dạng âm thanh để phát cho người nghe. Máy cũng có bộ nhớ để lưu các tài liệu sách nói, giúp người sử dụng có thể nghe ở bất cứ nơi đâu mà không cần internet.
PGS -TS Hoàng Trang và thiết bị hỗ trợ đọc sách cho người khiếm thị
Được biết, nhóm phải mất hơn hai năm trời nghiên cứu để hoàn thành thiết bị này. “Nhiều lần, cả nhóm mất ăn mất ngủ vì thiết bị không thể nhận dạng được chính xác giọng nói, phải thử đi thử lại nhiều lần với đủ cách khác nhau. Thiết bị càng nhỏ, đòi hỏi độ chính xác, gia công, thiết kế phải càng cao, chỉ cần 1 sai sót nhỏ là có thể dẫn đến sự cố ngoài ý muốn. May mắn là sau một thời gian, mọi thứ cũng bắt đầu suôn sẻ”, PGS – TS Hoàng Trang kể lại.
Đến nay, thiết bị nhận dạng giọng nói này đã được thử nghiệm tại 2 công ty, cùng với đó là 2 lời đề nghị chuyển giao công nghệ. Tuy nhiên, nhóm đang dự định sẽ phát triển thêm tính năng ứng dụng để tiến tới thành lập doanh nghiệp phi lợi nhuận, kêu gọi sự đóng góp của xã hội để sản xuất sản phẩm với số lượng lớn và đưa đến tay những người có nhu cầu.
“Ý nghĩa sâu xa của chúng tôi khi thực hiện đề tài là phục vụ cho người khuyết tật, không phải kinh doanh. Mọi người trong nhóm, ai cũng có trong đầu quan niệm, người mù và người khiếm thị cần được phục vụ, hỗ trợ chứ không phải để xếp thành “thị trường hơn 1 triệu người”".