13 May, 2021
Big data trong xét tuyển vào đại học
Tôi mới đọc một bài báo thú vị rằng một số đại học đang dùng công nghệ Big Data trong việc xét tuyển vào trường của họ. Khái niệm này là đơn giản, mọi bài tập về nhà của học sinh và các điểm bài thi ở trường trung học hay đại học được lưu trong cơ sở dữ liệu máy tính nhà trường và những dữ liệu này có thể được thu thập và phân tích. Nhiều học sinh cũng đặt thông tin cá nhân của họ lên Facebook, LinkedIn, phòng chat, và các mạng xã hội, những dữ liệu này cũng có thể được thu thập bởi công cụ phân tích Big data nữa. Những dữ liệu này được phân tích bởi các thuật toán phức tạp để xác định ai sẽ học tốt ở đại học, ai sẽ thất bại, ai có thể bỏ trường, và ai sẽ cần giúp đỡ thêm. Các yếu tố này cũng có thể dự báo liệu học sinh có thành công trong cuộc đời hay không.
Bài báo này chỉ ra rằng Đại học bang Wichita đã dùng các công cụ phân tích dự báo Big data trong việc xét tuyển vào đại học của họ trong vài năm. Các quan chức xét tuyển thu thập dữ liệu như điểm bài tập về nhà của học sinh, số giờ trên lớp họ ghi danh ở trường trung học, và các yếu tố xã hội khác để dự báo các ứng cử viên nào sẽ thành công và người nào có thể lâm vào vấn đề và kết luận rằng mô hình dự báo Big data của họ có độ chính xác 96% trong nhận diện các ứng cử viên “hàng đầu”. Ở Mĩ việc xếp hạng trường là rất quan trọng và bằng việc có nhiều sinh viên tốt nghiệp và thành công, xếp hạng của trường sẽ lên cao v.v.
Việc dùng công nghệ này trong xét tuyển của trường có thể đem tới thay đổi trong việc xếp hạng trường nhưng nó cũng đem tới những kết quả không chủ định nữa. Khi phần mềm dự báo rằng một sinh viên sẽ học tốt ở đại học, điều đó là tốt nhưng điều gì sẽ xảy ra nếu nó chỉ ra một sinh viên có thể thất bại? Liệu trường có tuyển sinh viên đó không? Nếu mọi trường đều dùng công cụ này, điều gì sẽ xảy ra cho nhiều sinh viên bị coi là “không khớp”? Điều hoàn toàn sai là giả định rằng sinh viên không học tốt ở trường trung học sẽ không học tốt ở đại học. Điều hoàn toàn sai là phủ nhận cơ hội giáo dục cho những sinh viên dựa trên chương trình phần mềm. Điều hoàn toàn sai là không nhận các sinh viên bởi vì phần mềm dự báo rằng sinh viên có điểm thấp ở trường trung học và có thể thất bại trong đại học. Trong 25 năm dạy học của tôi, tôi đã thấy nhiều sinh viên đã không học tốt ở trường trung học nhưng lại xuất sắc ở đại học. Tôi đã thấy nhiều sinh viên vật lộn trong năm thứ nhất ở đại học nhưng vượt qua chướng ngại và biến thành sinh viên tốt hơn nhiều về sau. Tôi cũng thấy nhiều học sinh hàng đầu ở trường trung học nhưng thất bại ở đại học nữa. Tôi không nghĩ bất kì thuật toán toán học này có thể dự báo được tương lai của con người vì họ sẽ thay đổi khi họ trưởng thành. Con người không chỉ là dữ liệu tĩnh mà có thể được khớp vào trong hình mẫu nào đó.
Việc xét tuyển vào trường báo cáo rằng với phân tích dữ liệu, họ đã giảm được số sinh viên “rủi ro” người thường thất bại và bỏ trường. Tôi tự hỏi phân tích dữ liệu sẽ dự báo cái gì về Bill Gates. Ông ấy đã học tốt ở trung học nhưng đằng nào cũng bỏ trường. Mark Zuckerberg cũng đã học tốt ở trường trung học nhưng bỏ trường nữa. Nó sẽ dự báo cái gì về Steve Jobs, ông ấy đã thất bại nhiều môn học đại học và bỏ trường nữa. Những sinh viên kém không có tương lai sao? Có nhiều người thành công bỏ đại học; có nhiều người vĩ đại đã không học tốt ở trung học nhưng đã đóng góp lớn cho khoa học, công nghệ và nhân loại. Albert Einstein đã không học tốt ở trường phổ thông nhưng trở thành nhà khoa học nổi tiếng; có danh sách dài những người nổi tiếng đã không học tốt ở phổ thông, họ có nên bị phủ nhận việc tuyển vào giáo dục không vì dự báo của phần mềm?
Công nghệ Big data là tốt để dự báo khiếm khuyết, bất thường, và hình mẫu trong chế tạo, bán hàng và tiếp thị v.v. nhưng dùng nó cho việc xét tuyển đại học là sai. Chất lượng của giáo dục không nên được làm bằng con số thống kê; giáo dục phải mở cho mọi người, không cho vài sinh viên được chọn. Toàn thế giới cần nhiều người có giáo dục để làm cho nó thành chỗ tốt hơn; mọi nước đều cần người có giáo dục để cải tiến cuộc sống của các công dân của nó. Trong thời đại thông tin này, chúng ta cần nhiều người có tri thức và đó là sứ mệnh của mọi thể chế giáo dục là giáo dục con người, không dùng công nghệ để phân biệt và phủ nhận bất kì ai có cơ hội học dựa trên chương trình máy tính.
—English version—
Blog1474- Big data in college admission
I just read an interesting article that some universities are using Big Data technology in their school admission. The concept is simple, all of students’ homeworks and exams grades in high schools or universities are stored in the school computers database and these data can be collected and analyzed. Many students also place their personal information on Facebook, LinkedIn, chat rooms, and social networks, these data can also be collected by Big data analytic tools too. These data are analyzed by sophisticated algorithms to determine who will do well in college, who will fail, who may quit school, and who will need extra help. These factors can also predict whether the student will be successful in life or not.
The article showed that WichitaStateUniversity has been using Big data predictive analysis tools in their college admission for several years. Admission officers collect data such as students’ homework grades, the amount of classes they enrolled in high school, and other social factors to predict which applicants will succeed and which ones may get into problems and concluded that their Big data predicting model had 96% accuracy identifying “top” applicants. In the U.S. the rating of the school is very important and by having more students graduated and succeed, the school’s rating will go up etc.
The use of this technology in school’s admissions may bring changes in the school rating but it also brings some unintended results too. When the software predicts that a student will do well in college, it is good but what will happen if it shows a student who may fail? Would the school do not admit that student? If all schools are using this tool, what will happen to many students who are considered “Not fit”? It is completely wrong to assume that students who did not do well in high schools will not do well in college. It is completely wrong to deny an education opportunity for students based on a software program. It is completely wrong not to accept students because the software predicts that students who have low grades in high school and may fail in college. In my 25 years of teaching, I have seen many students who did not do well in high schools but excel in college. I have seen many students who struggled in their first year in college but overcome obstacles and turn out to be much better students later. I also saw many top students in high school but failed in college too. I do not think any mathematical algorithms can predict the future of people as they will change as they are maturing. People are not just static data that can be fitted into a certain pattern.
The school admission reported that with data analytics, they have reduced the number of “risky” students who often failed and quit school. I wonder what the data analytic would predict about Bill Gates. He did well in high school but quit school anyway. Mark Zuckerberg also did well in high school but quit school too. What would it predicts about Steve Jobs, he failed many college courses and quit school too. Are they bad students who have no future? There are many successful people who quit college; there are many great people who did not do well in high school but contributed significant to science, technology and humanity. Albert Einstein did not do well in school but became a famous scientist; there is a long list famous people who did not do well in school, should they be denied admission to an education because of a software prediction?
Big data technology is good to predict defects, anomaly, and pattern in manufacturing, sales and marketing etc. but using it for college admission is wrong. The quality of education should not be made by statistic numbers; education must be open for all, not for a few selective students. The whole world needs more educated people to make it a better place; every country needs educated people to improve the lives of its citizens; In this information age, we need more knowledgeable people and that is the mission of every educational institution to educate people, not to use technology to discriminate and deny anyone a chance to learn based on a computer program.