Đánh giá đúng trình độ người học
CAT (Computerized Adaptive Testing – CAT) là đề tài nghiên cứu của PGS.TS Lê Thái Hưng - Phó Hiệu trưởng Trường Đại học Giáo dục (ĐH Quốc gia Hà Nội) thực hiện cùng với nhiều chuyên gia trong lĩnh vực đo lường đánh giá, toán ứng dụng, công nghệ giáo dục, chuyên gia của các môn học. Sản phẩm nghiên cứu khoa học này đã được Cục Sở hữu trí tuệ – Bộ Khoa học và Công nghệ cấp bằng độc quyền sáng chế.
Theo PGS.TS Lê Thái Hưng, các hình thức kiểm tra truyền thống với các câu hỏi cố định trên giấy có hạn chế rõ rệt: Tất cả thí sinh thường làm một bài kiểm tra với các câu hỏi giống nhau, có thể chỉ thay đổi thứ tự câu hỏi để tránh thí sinh gian lận. Điều này khiến đề kiểm tra phải dài và nhiều câu hỏi mới có thể đánh giá đúng và phân loại được năng lực của tất cả thí sinh, từ thấp đến cao.
Trắc nghiệm thích ứng trên máy tính được biết đến với nhiều ưu thế nổi bật: Đánh giá chính xác, đầy đủ và toàn diện về năng lực người học; cho phép phân tích các chỉ số về năng lực của thí sinh ngay sau khi họ trả lời câu hỏi và liên tục cập nhật thông tin về năng lực của học sinh trong quá trình làm bài.
Các bài CAT thường ngắn hơn một nửa so với bài kiểm tra truyền thống. Chỉ cần máy tính kết nối Internet, CAT có thể đánh giá trên diện rộng với số lượng lớn học sinh tham gia.
PGS.TS Lê Thái Hưng và nhóm nghiên cứu gồm các giảng viên Khoa Quản trị Chất lượng, đã dành nhiều năm để phát triển và hoàn thiện phương pháp kiểm tra đánh giá năng lực người học bằng bài thi trắc nghiệm thích ứng trên máy tính.
Sáng chế này đề cập đến phương pháp đánh giá thích ứng năng lực người học trên máy tính. Để đo lường chính xác năng lực người học, nhóm sử dụng các thuật toán ước lượng trong toán học thống kê và các thuật toán học máy tăng cường.
PGS.TS Lê Thái Hưng cho biết, nhóm bắt tay vào triển khai nghiên cứu từ năm 2019 đến năm 2021 thì phiên bản UEd-CAT 1.0 ra đời. Sau phiên bản UEd-CAT 1.0, đến nay, nhóm nghiên cứu đã hoàn thiện phiên bản UEd-CAT 2.0, với đầy đủ 3 tham số: Độ khó, độ phân biệt, độ may rủi và tính năng lưu vết bài làm của thí sinh. Sản phẩm của UEd-CAT 2.0 hiện có là bộ ngân hàng câu hỏi chuẩn hóa theo Chương trình giáo dục phổ thông 2018.
Nhóm nghiên cứu đang tiến hành nghiên cứu thuật toán cho mô hình MCAT (Multil CAT) – là dạng mở rộng của hệ thống CAT, bài kiểm tra được tổ chức theo nhiều cấp độ để đánh giá toàn diện chính xác hơn năng lực của người học.
Trắc nghiệm dựa trên năng lực người học
Theo PGS.TS Lê Thái Hưng, dựa trên nguyên tắc hoạt động của CAT, hệ thống UEd-CAT đã kế thừa, phát triển và tối ưu hóa các phương pháp đánh giá năng lực thích ứng của người học.
Hệ thống UEd-CAT không giống với một số hệ thống trắc nghiệm thích ứng khác, vốn sử dụng các gói câu hỏi tổng hợp sẵn theo nội dung và trình độ mà người học lựa chọn.
Thay vào đó, UEd-CAT phản hồi trực tiếp theo thời gian thực dựa trên thông tin mà thí sinh tương tác qua mỗi câu trả lời, từ đó tạo ra vô vàn bộ câu hỏi khác nhau phù hợp nhất để đánh giá năng lực.
Thuật toán ước lượng năng lực của UEd-CAT có thể điều chỉnh để phù hợp với mục đích kiểm tra đánh giá. Các tham số về “tốc độ học” (learning rate) có thể được điều chỉnh nhằm kéo dài hoặc rút ngắn tương đối bài kiểm tra, phù hợp với các mục đích kiểm tra khác nhau như đánh giá thường xuyên hay tổng kết.
Đây là điểm khác biệt của UEd-CAT so với các hệ thống đánh giá thích ứng khác trên thế giới, khi các hệ thống này thường giữ cấu trúc bài kiểm tra cố định về nội dung và số lượng câu hỏi giữa các thí sinh. Hệ thống kỳ vọng mang lại một bước đột phá trong việc đánh giá năng lực người học, đảm bảo tính chính xác và công bằng cao hơn trong quá trình kiểm tra.
Trong bối cảnh giáo dục đại chúng và phổ cập, việc các hệ thống giáo dục đủ năng lực về công nghệ và chuyên môn để tổ chức các kỳ thi diện rộng, kiểm tra được nhiều người cùng lúc là nhu cầu cấp thiết.
Hướng nghiên cứu ứng dụng này sẽ góp phần hiện thực hóa xu thế đổi mới dạy học và kiểm tra đánh giá người học theo hướng phát triển năng lực, cá nhân hóa trong môi trường học tập kết hợp.