 Xu hướng của các bài trắc nghiệm thích ứng trên máy tính (CAT)! Các hình thức kiểm tra truyền thống với các câu hỏi cố định trên giấy có hạn chế rõ rệt: tất cả thí sinh thường làm một bài kiểm tra với các câu hỏi giống nhau, có thể chỉ thay đổi thứ tự câu hỏi để tránh thí sinh gian lận. Điều này khiến đề kiểm tra phải dài và nhiều câu hỏi mới có thể đánh giá đúng và phân loại được năng lực của tất cả thí sinh, từ thấp đến cao. Trắc nghiệm thích ứng trên máy tính (Computerized Adaptive Testing – CAT) được biết đến với nhiều ưu thế nổi bật: đánh giá chính xác, đầy đủ và toàn diện về năng lực người học; cho phép phân tích các chỉ số về năng lực của thí sinh ngay sau khi họ trả lời câu hỏi và liên tục cập nhật thông tin về năng lực của học sinh trong quá trình làm bài. Các bài CAT thường ngắn hơn một nửa so với bài kiểm tra truyền thống. Chỉ cần máy tính kết nối internet, CAT có thể đánh giá trên diện rộng với số lượng lớn học sinh tham gia. .jpg)
Qua thời gian, CAT khẳng định với nhiều ưu điểm vượt trội Ra đời từ những năm 1960 sau một thời gian dài nghiên cứu, CAT đã phát triển mạnh mẽ trên thế giới. Tuy nhiên, tại Việt Nam, các nghiên cứu về trắc nghiệm thích ứng trên máy tính vẫn còn rất mới mẻ, chủ yếu tập trung vào cơ sở lý luận và khung lý thuyết, chưa xây dựng được cơ sở dữ liệu để sử dụng CAT trong việc đánh giá năng lực người học. Với sự phát triển của trí tuệ nhân tạo và học máy (AI & machine learning), CAT ngày càng cải thiện độ chính xác, tăng tính bảo mật và được sử dụng rộng rãi trong giáo dục. Hệ thống UEd-CAT: từ ý tưởng đến Bằng sáng chế đầu tiên được cấp cho một sản phẩm thuộc lĩnh vực phương pháp giảng dạy và đánh giá trong giáo dục PGS.TS Lê Thái Hưng và nhóm nghiên cứu gồm các giảng viên Khoa Quản trị Chất lượng, đã dành nhiều năm để phát triển và hoàn thiện phương pháp kiểm tra đánh giá năng lực người học bằng bài thi trắc nghiệm thích ứng trên máy tính. Quá trình nghiên cứu bao gồm: nghiên cứu, thử nghiệm trên nhiều đối tượng học sinh ở các cấp độ khác nhau, phân tích dữ liệu và điều chỉnh thuật toán để đảm bảo độ chính xác cao nhất. Sáng chế này đề cập đến phương pháp đánh giá thích ứng năng lực người học trên máy tính. Để đo lường chính xác năng lực người học, nhóm sử dụng các thuật toán ước lượng trong toán học thống kê và các thuật toán học máy tăng cường. Sáng chế còn bao gồm quy trình xây dựng ngân hàng câu hỏi và triển khai đánh giá năng lực người học. Được biết, đây có lẽ là bằng sáng chế đầu tiên được cấp cho một sản phẩm thuộc lĩnh vực phương pháp giảng dạy và đánh giá trong giáo dục. Việc được cấp bằng sáng chế này là minh chứng cho thấy lĩnh vực đo lường và đánh giá trong giáo dục nói riêng, khoa học giáo dục nói chung cũng có thể có những sản phẩm được bảo hộ với bằng sáng chế.  PGS.TS Lê Thái Hưng Chia sẻ về quá trình phát triển ứng dụng, PGS.TS Lê Thái Hưng cho biết: “Ý tưởng về việc xây dựng hệ thống đánh giá năng lực thích ứng trên máy tính được GS.TS Nguyễn Quý Thanh – Hiệu trưởng Trường Đại học Giáo dục, thành viên nhóm nghiên cứu – ấp ủ từ những năm 2013, khi Giáo sư được giao phụ trách Đề án Xây dựng hệ thống đánh giá năng lực phục vụ mục đích tuyển sinh (thường gọi là Đề án đổi mới tuyển sinh của ĐHQGHN) và một số mục đích khác.” Quá trình hoàn thiện, nâng cấp các phiên bản UEd-CAT và các công bố khoa học nổi bật Nhóm bắt tay vào triển khai nghiên cứu từ năm 2019 đến năm 2021 thì phiên bản UEd-CAT 1.0 ra đời. Sau phiên bản UEd-CAT 1.0, đến nay, nhóm nghiên cứu đã hoàn thiện phiên bản UEd-CAT 2.0, với đầy đủ 3 tham số: độ khó, độ phân biệt, độ may rủi và tính năng lưu vết bài làm của thí sinh. Sản phẩm của UEd-CAT 2.0 hiện có là bộ ngân hàng câu hỏi chuẩn hóa theo chương trình GDPT 2018.  Quy trình phát triển hệ thống CAT Nhóm nghiên cứu khẳng định, UEd-CAT 2.0 cho thấy phù hợp và tối ưu của thuật toán so với việc sử dụng mô hình 1 tham số; Hoàn thiện được quy trình phát triển các bài đánh giá thích ứng, nhân rộng cho các môn học khác, cấp học khác theo CT GDPT 2018; Nâng cấp chức năng quản trị hệ thống, tính bảo mật, giám sát hành vi, quản lý và trích xuất dữ liệu. UEd-CAT 2.0 có thể triển khai trong thực tiễn và tiến hành đánh giá tác động việc sử dụng hệ thống CAT với quá trình dạy học Hiện nay, nhóm nghiên cứu đang tiến hành nghiên cứu thuật toán cho mô hình MCAT (Multil CAT) – là dạng mở rộng của hệ thống CAT, bài kiểm tra được tổ chức theo nhiều cấp độ để đánh giá toàn diện chính xác hơn năng lực của người học. Nhớ lại lúc tiếp nhận ý tưởng khởi nguồn từ GS.TS Nguyễn Quý Thanh, PGS.TS Lê Thái Hưng chia sẻ: “Nhìn lại chặng đường xây dựng hệ thống đánh giá thích ứng UEd-CAT, nhóm nghiên cứu càng thêm thấm thía câu trích dẫn mà GS.TS Nguyễn Quý Thanh động viên nhóm: trên đời này làm gì có đường, người ta đi mãi thì thành đường thôi”. Câu nói ấy cũng chính là khẩu hiệu và động lực truyền lửa để chúng tôi hoàn thành nhiệm vụ trong suốt chặng đường tìm kiếm và đạt được kết quả như hiện tại. Từ đó cho đến nay, nhóm đã xây dựng được ngân hàng câu hỏi trắc nghiệm thích ứng đánh giá năng lực Toán học, Khoa học, Đọc hiểu, Năng lực từ vựng Tiếng Anh, hệ thống UEd-CAT 2.0; 3000 câu hỏi được chuẩn hóa, 05 đề tài cấp cơ sở và 01 nhiệm vụ khoa học được nghiệm thu, 03 học viên thạc sĩ đã tốt nghiệp; 01 nghiên cứu sinh và 03 học viên đã bảo vệ, 10 công bố khoa học trong nước và quốc tế đã được đăng tải. Ưu điểm nổi trội của hệ thống UEd-CAT Dựa trên nguyên tắc hoạt động của CAT, hệ thống UEd-CAT đã kế thừa, phát triển và tối ưu hóa các phương pháp đánh giá năng lực thích ứng của người học. Điểm khác biệt và ưu điểm nổi bật của UEd-CAT bao gồm: Là hệ thống trắc nghiệm thích ứng dựa trên năng lực của người học: Hệ thống UEd-CAT không giống với một số hệ thống trắc nghiệm thích ứng khác, vốn sử dụng các gói câu hỏi tổng hợp sẵn theo nội dung và trình độ mà người học lựa chọn. Thay vào đó, UEd-CAT phản hồi trực tiếp theo thời gian thực dựa trên thông tin mà thí sinh tương tác qua mỗi câu trả lời, từ đó tạo ra vô vàn bộ câu hỏi khác nhau phù hợp nhất để đánh giá năng lực. Là hệ thống trắc nghiệm thích ứng có tính tuỳ biến cao: Thuật toán ước lượng năng lực của UEd-CAT có thể điều chỉnh để phù hợp với mục đích kiểm tra đánh giá. Các tham số về "tốc độ học" (learning rate) có thể được điều chỉnh nhằm kéo dài hoặc rút ngắn tương đối bài kiểm tra, phù hợp với các mục đích kiểm tra khác nhau như đánh giá thường xuyên hay tổng kết. Đây là điểm khác biệt của UEd-CAT so với các hệ thống đánh giá thích ứng khác trên thế giới, khi các hệ thống này thường giữ cấu trúc bài kiểm tra cố định về nội dung và số lượng câu hỏi giữa các thí sinh (ví dụ: bài thi GMAT). Hệ thống trắc nghiệm thích ứng UEd-CAT thực sự mang lại một bước đột phá trong việc đánh giá năng lực người học, đảm bảo tính chính xác và công bằng cao hơn trong quá trình kiểm tra. Ứng dụng của UEd-CAT trong đào tạo/tuyển sinh và nhiều công bố khoa học Kết quả mà UEd-CAT 1.0 và Ued-CAT 2.0 đã mang lại cùng với sự phát triển của UEd-MCAT mở ra triển vọng thực hiện các nghiên cứu và xây dựng hệ thống trắc nghiệm thích ứng kết hợp tư vấn hỗ trợ trong suốt quá trình học tập của học sinh.  Học sinh Trường THPT Khoa học Giáo dục thuộc Trường Đại học Giáo dục làm bài test trên hệ thống UEd-CAT 2.0 Trong bối cảnh giáo dục đại chúng và phổ cập, việc các hệ thống giáo dục đủ năng lực về công nghệ và chuyên môn để tổ chức các kỳ thi diện rộng, kiểm tra được nhiều người cùng lúc là nhu cầu cấp thiết. Điều này thay thế cho các kỳ thi truyền thống vốn tốn kém, gây áp lực, và có mức độ tin cậy, chính xác thấp. Hướng nghiên cứu ứng dụng này sẽ góp phần hiện thực hóa xu thế đổi mới dạy học và kiểm tra đánh giá người học theo hướng phát triển năng lực, cá nhân hóa trong môi trường học tập kết hợp (blended learning environment) và đổi mới thi trung học phổ thông ở Việt Nam. Sử dụng công cụ đánh giá của hệ thống UEd-CAT, công trình nghiên cứu khoa học: “Xây dựng bài kiểm tra thích ứng bằng máy tính để đánh giá kiến thức từ vựng tiếp nhận tiếng Anh” đã được các chuyên gia trong lĩnh vực đo lường và đánh giá trong giáo dục nhận định: “hệ thống bài kiểm tra thích ứng đã đưa ra được bằng chứng thực nghiệm về việc áp dụng lý thuyết hồi đáp và phương pháp cân bằng trong xây dựng và chuẩn hoá ngân hàng câu hỏi trong lĩnh vực đo lường và đánh gía trong giáo dục, công trình này cũng được đánh giá là có thể chuyển giao cho các cơ sở đào tạo tiếng Anh hoặc được nhân rộng, tham khảo cho các nội dung đào tạo khác ngoài tiếng Anh”. Tương lai của Ued-CAT đối với nền giáo dục Với những thành tựu đã đạt được, hệ thống UEd-CAT có thể tiếp tục triển khai theo hai hướng: Đối với Nhà trường: UEd-CAT có thể sử dụng hệ thống hiện có để phát triển ngân hàng câu hỏi thích nghi cho nhiều lĩnh vực khác nhau, phục vụ các nhiệm vụ kiểm tra đánh giá như thi tuyển sinh, đánh giá quá trình và đánh giá tổng kết. Hệ thống có thể phát triển hướng tới kết hợp với quá trình học tập thích nghi: xây dựng các bài kiểm tra theo mô đun (gói câu hỏi theo nhóm kỹ năng hoặc năng lực, theo tiến độ học tập...), và phát triển hệ thống học tập đi kèm. Điều này giúp theo dõi kết quả học tập của học sinh và cá nhân hóa lộ trình đào tạo cho từng học sinh. Đối với học sinh: UEd-CAT cung cấp cho học sinh khả năng theo dõi quá trình học tập của mình và đóng góp vào việc xây dựng chiến lược học tập tiến bộ. Hệ thống phần mềm trắc nghiệm thích ứng trên máy tính cũng là một môi trường học tập chủ động cho học sinh. Quy trình giáo dục và đào tạo, cũng như vai trò đổi mới trong kiểm tra đánh giá, đóng vai trò quan trọng. Chuyển đổi số trong hoạt động kiểm tra đánh giá là một trong những hoạt động chuyển đổi số được ưu tiên. UEd-CAT là sản phẩm nghiên cứu khoa học tiêu biểu; là minh chứng khẳng định tính đúng đắn trong chiến lược điều hướng sản phẩm nghiên cứu mang tính ứng dụng cao, mang tính chất liên ngành và xuyên ngành; phù hợp với sứ mệnh và tầm nhìn của một đại học định hướng nghiên cứu; đáp ứng nhu cầu của giáo dục hiện đại và tiếp cận tiêu chuẩn quốc tế. >>> Tin bài liên quan: - VNU-UED: Lần đầu tiên tuyển sinh bậc đại học ngành Tâm lý học, chuyên ngành Tâm lý học lâm sàng trẻ em và vị thành niên - Năm học 2024, Trường Đại học Giáo dục tuyển sinh 1150 chỉ tiêu cho 16 ngành đào tạo - Đào tạo phải gắn với thực tiễn của giáo dục Việt Nam và thị trường lao động
|