Tự động tóm tắt văn bản bằng AI
Gần đây, Nguyễn Thanh Thông và Nguyễn Lữ Thiên Trúc (sinh viên năm cuối thuộc Khoa Khoa học và Kỹ thuật máy tính, Trường ĐH Bách khoa - ĐHQG TPHCM) gây chú ý với bài báo “Enriching and Controlling Global Semantics for Text Summarization” (tạm dịch: Làm giàu và điều khiển ngữ nghĩa toàn cục để tóm tắt văn bản) được chấp nhận đăng tại hội nghị đầu ngành Empirical Methods in Natural Language Processing (EMNLP) năm 2021.
Nội dung bài báo là một phần của Luận văn tốt nghiệp đại học của hai sinh viên, dưới sự hướng dẫn của PGS.TS Quản Thành Thơ (Phó Trưởng Khoa Khoa học và Kỹ thuật máy tính - Trường ĐH Bách khoa TPHCM) và PGS.TS Lưu Anh Tuấn (cựu sinh viên Trường ĐH Bách khoa, hiện đang công tác tại Trường Nanyang Technological University - Singapore).
Theo PGS Quản Thành Thơ, bài báo của Thông và Trúc hướng đến vấn đề tự động tóm tắt văn bản bằng trí tuệ nhân tạo (AI). Đây là một công việc rất cần thiết cho những người làm việc trong môi trường học thuật cần phải đọc và nắm được các thông tin chính yếu của một lượng lớn tài liệu. Hệ thống AI được đề xuất từ phương pháp của bài báo có thể tóm tắt một đoạn văn bản dài thành một nội dung cô đọng nhưng vẫn đầy đủ các thông tin chính yếu nhất.
Các thành tựu mới nhất trong lĩnh vực này thường dựa trên Transformer, một trong những mô hình Học sâu tiên tiến nhất trong lĩnh vực Xử lý ngôn ngữ tự nhiên. Tuy nhiên, các phương pháp hiện nay thường bị thiếu những từ khóa và thông tin quan trọng nhất khi tóm tắt các văn bản dài. Hệ thống được đề cập trong bài báo của hai sinh viên Thông và Trúc sẽ tìm cách hệ thống hóa thông tin toàn cục của bài báo gốc trước khi tích hợp vào kết quả tóm tắt. Nhờ vậy, bản tóm tắt của nhóm được đánh giá là có đầy đủ thông tin nhất trong số các phương pháp tóm tắt văn bản tự động hiện nay.
“Hiện nay việc tóm tắt các bài báo dài để tạo thành các chuyên mục như điểm tin, bài tóm tắt khoa học hoặc chỉ đơn giản giúp một cá nhân tự thu thập/ hệ thống thông tin từ nhiều nguồn tin đã trở thành một nhu cầu cấp thiết. Công cụ đang được dùng nhiều nhất là Pegasus nhưng vẫn còn nhiều hạn chế. Kết quả từ đề tài của Thông và Trúc có thể tạo ra các bản tóm tắt có nhiều thông tin hơn và vì vậy có khả năng áp dụng thực tế rất cao” - PGS.TS Quản Thành Thơ cho biết.
Bài báo của Thông và Trúc là bài báo xuất bản ở hội nghị quốc tế xếp hạng A+, là một trong 2 hội nghị lớn nhất thế giới về Xử lý Ngôn ngữ Tự nhiên, vì vậy sẽ rất có lợi cho 2 bạn nếu xin học học bổng tại các trường đại học hàng đầu thế giới.
Tỏa sáng cùng Kỹ thuật Y sinh
Là sinh viên khóa 2016 của Khoa Kỹ thuật Y sinh, Trường ĐH Quốc tế (IU) - ĐHQG TPHCM, Võ Thị Cẩm Duyên vừa hoàn thành khóa luận loại xuất sắc và dự kiến sẽ tốt nghiệp trong năm 2021.
Tháng 6 vừa qua, bài báo khoa học “Rapid Detection of Tebuconazole Based on Aptasensor and Aggregation of Silver Nanoparticles” (Tạm dịch: Thiết kế Aptasensor phát hiện nhanh Tebuconazole dựa trên sự kết tụ của các hạt nano bạc) của Duyên (với sự hỗ trợ của TS Trương Phước Long) đã được đăng trên tạp chí “Journal of Nanomaterials” - một trong các tạp chí quốc tế uy tín của ngành Kỹ thuật Y sinh.
Duyên cho biết, Tebuconazole là một hoạt chất diệt nấm được sử dụng trong nông nghiệp, tuy nhiên nó được xem là một chất gây ung thư và có nguy cơ tiềm ẩn gây nguy hiểm cho môi trường. Vì vậy, việc giám sát hoạt chất này trong thực phẩm và trong môi trường đóng một vai trò quan trọng.
Nội dung chính của nghiên cứu này là thiết kế một cảm biến sinh học sử dụng DNA aptamer như một phần tử nhận biết sinh học và các hạt nano bạc như phần tử chuyển đổi để phát hiện nhanh Tebuconazole dựa trên sự kết tụ của các hạt nano bạc. Các hạt nano bạc này một khi kết tụ sẽ thay đổi phổ hấp thụ, từ đó gây ra sự thay đổi màu của dung dịch phản ứng. Phương pháp này cho phép nhận biết kết quả bằng mắt thường trong vòng 20 phút với độ nhạy và độ đặc hiệu cao.
Bước đầu tiếp cận với nghiên cứu khoa học, Duyên đã được học nhiều kiến thức cơ bản về sinh học phân tử, kỹ thuật PCR, kỹ thuât LAMP, các xét nghiệm lâm sàng cũng như kỹ năng làm thí nghiệm và đọc báo khoa học từ thầy Khôn. Các thí nghiệm đầu tiên của Duyên là thực hiện phản ứng PCR để phát hiện kí sinh trùng sốt rét và tối ưu hóa phản ứng LAMP để tránh hiện tượng dương tính giả trong xét nghiệm lâm sàng.
Trước tình hình dịch bệnh Covid-19, TS Trương Phước Long đã đề xuất cho Duyên làm đề tài “Phương pháp phát hiện nhanh virus” với mong muốn mang lại ý nghĩa thiết thực cho cộng đồng. Bước đầu Duyên đã tiến hành thiết kế một cảm biến sinh học so màu có thể phát hiện nhanh chủng virus sốt xuất huyết bằng mắt thường dựa trên sự kết tụ của hạt nano vàng. Với kết quả khả quan, đề tài này đã được đánh giá rất cao bởi hội đồng bảo vệ luận văn tốt nghiệp Khoa Kỹ thuật Y sinh năm 2021 với số điểm 98/100. Nghiên cứu này Duyên đang dần hoàn thiện và dự kiến sẽ công bố khoa học trong thời gian sắp tới.
TS Trương Phước Long (GV Khoa Kỹ thuật Y sinh) chia sẻ: “Duyên rất chuyên cần, chăm chỉ trong học tập, đồng thời luôn có tinh thần học hỏi, kiên nhẫn, chủ động và sáng tạo trong nghiên cứu. Bên cạnh đó, em còn nắm bắt kiến thức, kỹ thuật mới rất nhanh”.