Nhóm sinh viên Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia TPHCM vừa sáng tạo thành công ứng dụng (app) đọc đơn thuốc từ đề tài “Mecognize: Ứng dụng nhận diện tên thuốc từ đơn thuốc điện tử thông qua các phương pháp OCR”.
Dùng công nghệ biến tài liệu thành dạng ảnh
Đội Mecognize gồm các sinh viên Nguyễn Thái Bình, Bùi Ngọc Chính, Nguyễn Nhật Cường, Nguyễn Thị Ngọc Diệu, Bùi Văn Hưng, Chương trình Chất lượng cao, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia TPHCM.
Giảng viên hướng dẫn là ThS Lê Ngọc Thành đã cùng nhóm thực hiện đề tài nêu trên. Nghiên cứu vừa đoạt giải Nhì tại chung kết Cuộc thi Code Your Future đầu tháng 10 vừa qua.
Đây là cuộc thi nhằm thúc đẩy các hoạt động sáng tạo, đam mê nghiên cứu về lĩnh vực công nghệ thông tin và lập trình của mỗi cá nhân, qua đó chung tay xây dựng cộng đồng công nghệ chất lượng cao tại khu vực TPHCM; xây dựng một cầu nối giữa trường đại học - doanh nghiệp, các đối tác trong ngành công nghệ thông tin; tôn vinh và bồi dưỡng các tài năng trẻ để tham gia các cuộc thi lập trình sáng tạo cấp quốc gia, quốc tế.
Nguyễn Thái Bình, thành viên nhóm nghiên cứu cho biết, OCR là viết tắt của cụm từ Optical Character Recognition hay còn được biết tới với tên gọi tiếng Việt là công nghệ nhận dạng ký tự quang học.
OCR được ứng dụng để nhận dạng ký tự trên file ảnh chụp, file PDF. OCR vận hành như một người trợ lý đắc lực giúp trích xuất các trường thông tin trên hình ảnh và tiến hành lưu trữ chúng dưới dạng text. Nhờ vậy, các tài liệu dạng ảnh sẽ được chuyển đổi thành các tài liệu có thể biên tập, trích xuất thông tin.
OCR sẽ hỗ trợ quét nhiều hình ảnh, tài liệu, số hóa nhanh chóng, truy xuất nhiều trường thông tin cùng lúc, nhanh hơn gấp 50 - 60 lần so với phương pháp thủ công.
Nhóm sinh viên nhận thấy đây là công nghệ phù hợp nhất để xây dựng ứng dụng đọc đơn thuốc. Với sản phẩm của nhóm, người dùng chỉ cần chụp ảnh đơn thuốc mà mình được nhận từ bác sĩ.
Hệ thống sẽ xử lý và nhập liệu vào app đúng các thông tin có trên đơn gồm các chẩn đoán, ngày kê đơn, tên thuốc, liều lượng và cách dùng của từng loại theo chỉ định. Không chỉ giúp người dùng thuận tiện theo dõi hơn so với trên toa giấy truyền thống, ứng dụng còn tổng hợp nhiều thông tin liên quan về các loại thuốc được bác sĩ kê trong toa giúp cho người dùng có thêm các kênh tham khảo.
Chỉ cần nhập tên thuốc vào mục tra cứu, app sẽ truy vấn trong cơ sở dữ liệu và trả kết quả về cho người dùng ngay tức thì. Từ thông tin trích xuất, app sẽ lên một lịch uống thuốc hằng ngày riêng cho từng người dùng. Khi đến giờ, ứng dụng sẽ thông báo trên điện thoại để nhắc nhở uống thuốc.
Muốn tích hợp chatbot hỗ trợ trên ứng dụng
Sinh viên Nguyễn Nhật Cường cho biết, một trong những thách thức nhất khi nhóm xây dựng mô hình xử lý là giải quyết bài toán trích xuất thông tin từ hình ảnh. Nhiều hình ảnh đơn thuốc người dùng chụp bị mờ, mất nét, không ngay ngắn hoặc ảnh có chữ bị đứt khúc.
Tất cả đều gây khó khăn cho hệ thống nhận diện nhưng app lại không thể bắt buộc người dùng phải chụp ảnh đúng theo cách duy nhất. Nhóm buộc phải thử nghiệm nhiều phương pháp xử lý ảnh để làm nét, khử nhiễu cho mọi bức ảnh đơn thuốc mà người dùng gửi đến.
Nhóm đã huấn luyện cho hệ thống tự học từ hơn 2.000 đơn thuốc từ các bệnh viện, phòng khám khác nhau. Nhóm lựa chọn các mẫu đơn thuốc đa dạng để phần mềm có thể được huấn luyện tốt nhất. Đây cũng là điểm khác biệt của dự án.
“Một số nhà thuốc đã phát triển các phần mềm xử lý đơn thuốc cho nhân viên của họ, nhưng chỉ dùng được với mẫu đơn thuốc nội bộ, không thể dùng với những mẫu từ các đơn vị khác” - Cường nói.
ThS Lê Ngọc Thành nhận định, trong thời gian tới, dự án này còn nhiều tiềm năng phát triển với các nhóm sinh viên tiếp theo. Chẳng hạn, app có thể cung cấp thêm cho người dùng các tác dụng phụ của thuốc hoặc kiểm tra chéo với tiền sử bệnh của bệnh nhân.
Dựa trên phần chẩn đoán, app còn có thể đưa gợi ý lời khuyên sức khỏe, các thói quen nên và không nên cho người dùng. Xa hơn nữa, dự án có thể tiến tới hình thành chatbot tư vấn sức khỏe cho các trung tâm y tế, bệnh viện...
Sau thành công ở giải thưởng này, nhóm sinh viên dự kiến sẽ dành thời gian tập trung nâng cấp, cải thiện độ chính xác của ứng dụng và tích hợp thêm nhiều tính năng như một kênh hỗ trợ y tế cho người bệnh như chatbot. Để làm được điều này chỉ cần thu thập đủ dữ liệu để AI có thể phân tích và đưa ra lời khuyên cho người bệnh.