Một số nhà GD phát hiện ra rằng sẽ có những vấn đề nếu học theo những hệ thống GD có điểm số cao nhất trong PISA. Theo kết quả kỳ thi PISA mới nhất, các nước đạt kết quả cao nhất lại là nơi có mức độ hạnh phúc thấp hơn vốn được đo bằng mức độ hài lòng của HS về cuộc sống và trường học. 6 trong số 10 nước đạt kết quả cao nhất về môn đọc có mức độ hạnh phúc thấp hơn mức trung bình các nước thuộc tổ chức Hợp tác và Phát triển Kinh tế (OECD).
Điều này cho thấy chúng ta cần có cái nhìn kỹ hơn vào những kết quả đánh giá tầm quy mô lớn như của PISA và tại sao các nước ghi điểm số cao trong PISA lại có mức độ hạnh phúc thấp hơn.
Một câu hỏi khác là liệu các bài thi này có nắm nhiều quyền lực như vậy khi được áp dụng vào việc định hình chính sách GD, được đưa vào thực tế hay đánh giá “chất lượng” của hệ thống GD của nước này so với nước khác không.
Đây là một loạt vấn đề được chứng minh đã xảy ra khi người ta quá quan trọng tới kết quả của các bài thi GD lớn như PISA.
Định nghĩa GD bị bóp méo
Những bài thi lớn có thể bóp méo định nghĩa GD. Ví dụ, với các hệ thống GD ghi điểm cao trong PISA như Singapore, Phần Lan, Hàn Quốc và Thượng Hải, họ được xem là các hệ thống GD có chất lượng. Tuy nhiên, chúng ta thấy rằng chất lượng GD còn có nhiều yếu tố hơn so với bất kỳ cuộc thi nào có thể đánh giá.
Các bài thi quy mô lớn có thể bóp méo những gì thực sự được dạy trong trường học bằng cách giới hạn vào một số ít các môn được đánh giá: đọc cơ bản, toán và một số trường hợp là khoa học. Trong khi đó các môn khác như nhạc, nghệ thuật, xã hội và ngôn ngữ bị bỏ qua.
Ngoài ra, những bài thi trên có thể làm chệch hướng bằng cách khiến GV dạy để HS đi thi. Ví dụ, Đạo luật Không để trẻ em nào lại phía sau năm 2001 của Mỹ đã coi các bài thi là biện pháp đo lường trong trường học và điều này đã khiến GV tăng thời gian dạy các môn được thi. Tuy nhiên, các kỹ năng quan trọng khác như sáng tạo, giải quyết vấn đề, tổ chức kiến thức lại không được quan tâm.
Dẫn đến tham nhũng và gian lận
Những đánh giá quy mô lớn tạo ra áp lực và có thể dẫn tới tham nhũng và gian lận. Ví dụ, năm 2019, 50 người Mỹ dính líu tới một bê bối tuyển sinh ĐH liên quan tới gian lận đối với các bài thi vào ĐH cũng như hối lộ để con mình được vào trường tốt.
Gian lận không chỉ giới hạn ở Mỹ. Tại Trung Quốc, gian lận trong kỳ thi tuyển sinh ĐH và những đánh giá quy mô lớn vẫn thường xảy ra.
Làm trầm trọng thêm sự bất bình đẳng
Những đánh giá quy mô lớn có thể có định kiến đối với HS có hoàn cảnh khó khăn hoặc thiểu số và ủng hộ HS khá giả hơn. Ví dụ như kỳ thi SAT. Điểm số trong kỳ thi này có mối tương quan mạnh mẽ với thu nhập gia đình, điều đó có nghĩa là HS từ các gia đình giàu có thường ghi điểm cao hơn các em từ các gia đình có thu nhập thấp hơn.
Kết quả là, HS từ gia đình có thu nhập thấp không có cùng cơ hội học ĐH với HS giàu có hoặc phải theo một trường kém danh tiếng hơn. Điều này có tác động kinh tế xã hội lâu dài khi việc tốt nghiệp ĐH và theo đuổi bằng cấp cao có sự khác biệt lớn về cơ hội kiếm tiền lâu dài. Khả năng theo học các trường danh tiếng làm tăng đáng kể khả năng tốt nghiệp và được chấp nhận học lên cao. Khi những cơ hội này bị giới hạn bởi những đánh giá có quy mô lớn có định kiến và không đồng đều, nó chỉ khiến làm trầm trọng thêm sự bất bình đẳng và bất công.
Tại nhiều nước, những đánh giá quy mô lớn được sử dụng như người giữ cổng đối với GD bậc cao. Điều này dẫn tới các bậc phụ huynh, GV, trường học, truyền thông, các nhà lập chính sách và HS tập trung vào điểm số. Điểm số sau đó được liên kết với giá trị của HS và có thể dẫn tới làm mất tinh thần, gây thiệt hại tâm lý cho HS, GV và các bên liên quan.
Những vụ tự tử vì thi cử đã được báo cáo ở những nơi như Hàn Quốc, Singapore, Hong Kong và Trung Quốc. Những nơi này thường đạt thành tích cao trong những đánh giá quy mô lớn như PISA.
Khả năng bỏ qua những yếu tố quan trọng
Những đánh giá quy mô lớn có thể cung cấp thông tin hữu tích phục vụ chính sách GD, tuy nhiên, việc phụ thuộc quá nhiều vào kết quả các bài thi có thể gây ra vấn đề. Khi sự tập trung được đặt vào điểm số và xếp hạng các nước, những điều quan trọng khác như sự sáng tạo, cảm xúc xã hội, tư duy phản biện… có thể bị bỏ qua. Những kết quả GD quý giá này là những thứ mà những cuộc đánh giá quy mô lớn thường không nắm bắt được.