Đề tài nghiên cứu khoa học (Kính hỗ trợ đọc văn bản dành cho người khiếm thị) vừa đạt giải Nhất Cuộc thi Khoa học kỹ thuật cấp quốc gia học sinh trung học khu vực phía Nam của Nguyễn Hoàng Minh Khôi và Vũ Phương Thảo (lớp 12) đã gây ấn tượng mạnh mẽ cho Ban giám khảo.
Ý tưởng nhân văn
Trong những lần tham gia các hoạt động xã hội, thiện nguyện hay đến giao lưu với các bạn đồng trang lứa tại Trường Phổ thông đặc biệt Nguyễn Đình Chiểu nhận thấy sự khó khăn của các bạn nơi đây trong việc tiếp cận văn bản, sách báo hai em đã nảy sinh ý nghĩ: Sao không biến những chiếc kính các bạn đang đeo (để che khiếm khuyết) thành công cụ hỗ trợ đọc.
Nghĩ là làm, cả hai bắt tay vào việc tìm hiểu và phác thảo ý tưởng của mình. Ban đầu là xây dựng phần mềm, các cảm biến ánh sáng và mô hình nhận dạng hình ảnh trên các ký tự tiếng Việt. Kế tiếp là kết hợp các trị số môi trường, camera thu nhận hình ảnh…
“Chiếc kính là sự kết hợp hoàn hảo giữa công nghệ cảm biến, nhận diện hình ảnh và phân tích cơ sở dữ liệu thành âm thanh. Quy trình hoạt động của kính bắt đầu bằng các cảm biến ánh sáng và khoảng cách thu nhận các trị số môi trường để hỗ trợ hình ảnh tốt nhất.
Sau đó, camera thu nhận hình ảnh văn bản chuyển về điện thoại để phân tích, nhận diện chữ viết với Google Vision kết hợp với Tasseract (kỹ thuật giúp nhận dạng các ký tự trên một bức ảnh), từ đó phát ra âm đọc cho người khiếm thị” - Phương Thảo cho biết.
Thảo chia sẻ thêm, điểm nổi bật của dự án là hai bạn đã nghiên cứu và xây dựng được mô hình nhận dạng hình ảnh trên các ký tự tiếng Việt, xử lý và khử nhiễu trên nền tảng ngôn ngữ và lập trình. Nhờ đó, các ký tự được nhận diện chính xác hơn, trên nhiều loại văn bản hơn.
Nhóm cũng đã ứng dụng các công nghệ 4.0 như máy học và mạng nơron nhân tạo để huấn luyện cơ sở dữ liệu ký tự tiếng Việt nhằm cải thiện độ chính xác. Các dữ liệu này cũng được cập nhật liên tục.
Sau khi chiếc kính hoàn thiện các dải số kỹ thuật và ứng dụng vi xử lý và phần mềm, Phương Thảo và Minh Khôi đã mang kính đến thử nghiệm thực tế tại Hội Người mù TPHCM và Trường Phổ thông đặc biệt Nguyễn Đình Chiểu.
Ý nghĩa thực tiễn
Qua các buổi thử nghiệm, Phương Thảo và Minh Khôi tiếp tục cải thiện dần khâu tiền xử lý nhận diện văn bản, và trau chuốt hơn ở phần hậu xử lý để đưa ra đoạn ký tự hoàn chỉnh, biến thành âm đọc. Với hàng chục buổi thử nghiệm, cuối cùng hai bạn trẻ đã nhận được phản hồi khá tốt từ những người khiếm thị khi độ chính xác được đo lường khoảng 89%.
Thực tế, tính hữu ích của dự án “Kính hỗ trợ đọc văn bản cho người khiếm thị” không cần các con số cũng cho thấy khả năng ứng dụng và chuyển giao của dự án là rất cao.
Trước khi thực hiện nghiên cứu khoa học của mình, Phương Thảo và Minh Khôi cũng đã tỉ mẩn tìm tòi, dẫn ra khảo sát của Quỹ Dân số Liên Hiệp Quốc tại Việt Nam như một luận cứ khoa học.
Khảo sát cho biết, 19% người khiếm thị xem đọc là một sở thích mới, trong khi 81% còn lại cho rằng đây là sở thích thường xuyên. Còn theo Bộ Y tế, tính đến năm 2014, Việt Nam có hơn 3 triệu người mù và khiếm thị. Trong đó, tỉ lệ người có nhu cầu đọc sách và tiếp cận ngôn ngữ viết là rất lớn.
“Từ những con số được thống kê và khảo sát một cách kỹ lưỡng, cộng thêm việc ở Việt Nam hiện chỉ có vài phương tiện hỗ trợ đọc như sách chữ nổi, máy đọc sách... Các phương tiện này lại còn có nhiều hạn chế, giá cao nên ít người khiếm thị có thể tiếp cận.
Vì vậy, tính thực tiễn và khả năng triển khai áp dụng nghiên cứu “Kính hỗ trợ đọc văn bản cho người khiếm thị” là rất cao” - ông N.T.H một thành viên Ban giám khảo đánh giá về dự án sau khi dự án đoạt giải.