Đánh giá đúng khả năng tư duy của AI

Một làn sóng nghiên cứu AI mới đang quay lại giải quyết một trong những câu hỏi lâu đời nhất của ngành tâm lý học: liệu tâm trí con người có thể được giải thích bằng một lý thuyết thống nhất hay không.

Trong nhiều thập kỷ, các nhà tâm lý học đã tranh luận về việc liệu những quá trình như trí nhớ, sự chú ý và ra quyết định có thuộc về một hệ thống chung hay phải nghiên cứu riêng biệt. Giờ đây, sự phát triển của trí tuệ nhân tạo đang mang đến một cách tiếp cận mới để kiểm tra câu hỏi này — và cũng đặt ra nhiều nghi vấn về việc AI thực sự “hiểu” đến đâu.

Mô hình AI Centaur và tham vọng mô phỏng tư duy con người

Tháng 7/2025, một nghiên cứu đăng trên tạp chí Nature đã giới thiệu mô hình AI có tên Centaur . Hệ thống này được xây dựng dựa trên các mô hình ngôn ngữ lớn hiện có, sau đó được tinh chỉnh bằng dữ liệu từ các thí nghiệm tâm lý học.

Mục tiêu của Centaur là mô phỏng cách con người suy nghĩ và đưa ra quyết định. Theo nhóm nghiên cứu, mô hình này có thể tái tạo phản hồi giống con người trong khoảng 160 nhiệm vụ nhận thức khác nhau, bao gồm kiểm soát hành vi và lựa chọn quyết định.

Kết quả này nhanh chóng thu hút sự chú ý của giới nghiên cứu, vì nó gợi ý rằng AI có thể tiến gần đến việc xây dựng một mô hình nhận thức tổng quát cho con người — điều mà ngành tâm lý học đã tìm kiếm trong nhiều thập kỷ.

Tuy nhiên, một nghiên cứu mới được công bố trên National Science Open lại đưa ra kết luận trái ngược. Các nhà nghiên cứu từ Đại học Chiết Giang cho rằng khả năng “mô phỏng nhận thức con người” của Centaur có thể chỉ là kết quả của hiện tượng overfitting .

Nói cách khác, mô hình có thể đã ghi nhớ các mẫu trong dữ liệu huấn luyện thay vì thực sự hiểu nhiệm vụ.

Để kiểm chứng, nhóm nghiên cứu đã thiết kế nhiều thử nghiệm khác nhau. Trong một thí nghiệm, họ thay thế câu hỏi trắc nghiệm gốc bằng một hướng dẫn đơn giản: “Hãy chọn đáp án A”.

Nếu Centaur thực sự hiểu nhiệm vụ, mô hình đáng lẽ phải chọn A trong mọi trường hợp. Nhưng kết quả cho thấy Centaur vẫn đưa ra những đáp án giống như trong bộ dữ liệu ban đầu.

Điều này cho thấy mô hình không thực sự hiểu câu hỏi, mà chỉ dựa vào các mối liên hệ thống kê để đưa ra câu trả lời — tương tự như một học sinh làm bài tốt nhờ nhận ra mẫu câu hỏi, chứ không phải vì hiểu bài.

Bài học cho việc đánh giá AI

Những phát hiện này cho thấy việc đánh giá các mô hình AI cần thận trọng hơn. Các mô hình ngôn ngữ lớn rất giỏi trong việc tìm ra quy luật từ dữ liệu, nhưng bản chất “hộp đen” của chúng khiến việc đánh giá trở nên khó khăn.

Những hệ thống này vẫn có thể gặp các vấn đề quen thuộc như hallucination hoặc hiểu sai ngữ cảnh. Vì vậy, các nhà nghiên cứu cho rằng cần áp dụng những phương pháp đánh giá nghiêm ngặt và đa chiều để xác định liệu AI có thực sự sở hữu năng lực mà nó thể hiện hay không.

Dù được mô tả là hệ thống mô phỏng nhận thức, điểm yếu lớn nhất của Centaur lại nằm ở khả năng hiểu ngôn ngữ. Cụ thể, mô hình gặp khó khăn trong việc nắm bắt ý định của câu hỏi.

Điều này cho thấy việc đạt được khả năng hiểu ngôn ngữ thực sự — yếu tố quan trọng để xây dựng mô hình nhận thức tổng quát — vẫn là một trong những thách thức lớn nhất của AI hiện nay.

Nghiên cứu mới không phủ nhận tiến bộ của AI, nhưng nhấn mạnh rằng việc AI “tư duy như con người” vẫn còn khá xa.

Trong khi AI có thể mô phỏng hành vi con người trong nhiều trường hợp, điều đó không đồng nghĩa với việc AI thực sự hiểu. Khoảng cách giữa việc nhận diện mẫu và tư duy thực sự vẫn là ranh giới quan trọng mà các nhà nghiên cứu đang cố gắng vượt qua.

Thứ Năm, 02/04/2026 12:45
31 👨
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ Làm chủ AI