LLMs và sự ảnh hưởng tới việc tiếp thu kiến thức

Nghiên cứu "How AI Impacts Skill Formation" (Tạm dịch: AI ảnh hưởng thế nào đến việc hình thành kỹ năng).

Đây là một nghiên cứu rất đáng đọc, được thực hiện bởi các nhà nghiên cứu từ Anthropic, nhằm trả lời câu hỏi mà mọi lập trình viên đều trăn trở: Liệu dùng ChatGPT/Copilot code hộ có khiến chúng ta "lụt nghề" hay không?

Cạm Bẫy Của Sự Tiện Lợi: Khi AI Code Nhanh Hơn Nhưng Chúng Ta Lại Hiểu Ít Hơn?

Là lập trình viên, chúng ta đang sống trong kỷ nguyên vàng của AI. Chỉ cần một câu prompt, GitHub Copilot hay GPT-4 có thể viết xong cả một function phức tạp. Nhưng cái giá phải trả cho sự tiện lợi đó là gì?

Một nghiên cứu mới nhất (arXiv:2601.20245v2) đã thực hiện một thử nghiệm thực tế trên 52 lập trình viên để đo lường chính xác sự đánh đổi này. Kết quả thực sự là một hồi chuông cảnh tỉnh.

Tham khảo

1. Thiết lập thí nghiệm: Sân chơi công bằng

Các nhà nghiên cứu đã tuyển chọn 52 lập trình viên (phần lớn có kinh nghiệm chuyên nghiệp). Để đảm bảo công bằng, họ chọn một thư viện Python tên là Trio (thư viện lập trình bất đồng bộ).

Tại sao là Trio? Vì nó ít phổ biến hơn asyncio, đảm bảo người tham gia chưa từng dùng nó trước đây.
Nhiệm vụ: Hoàn thành 2 bài tập code sử dụng Trio.
Chia nhóm:
Nhóm Control (Không AI): Chỉ được dùng Google Search và tài liệu hướng dẫn.
Nhóm Treatment (Có AI): Được dùng một chatbot AI (GPT-4o) để hỏi, gen code, debug.

Sau khi code xong, cả hai nhóm phải làm một bài kiểm tra (Quiz) để đo lường mức độ hiểu biết mà không được dùng AI.

2. Nghịch lý về Năng suất và Kỹ năng

Kết quả đưa ra hai con số trái ngược nhau một cách thú vị:

A. Về Kỹ năng (Skill Formation): AI làm giảm tư duy sâu

Nhóm sử dụng AI có điểm số bài kiểm tra thấp hơn 17% so với nhóm tự làm. Sự sụt giảm này không phải là ngẫu nhiên (p=0.010).

Debugging & Code Reading: Đây là hai kỹ năng bị ảnh hưởng nặng nề nhất. Nhóm dùng AI thường gặp khó khăn khi phải tự đọc hiểu một đoạn code hoặc tìm lỗi mà không có trợ lý ảo.
Nguyên nhân: "Cognitive Offloading" (Giảm tải nhận thức). Khi AI làm thay phần khó, não bộ chúng ta bỏ qua quá trình vật lộn để hiểu vấn đề.

B. Về Năng suất (Productivity): Không nhanh hơn là bao!

Đây là điều bất ngờ nhất. Mặc dù AI có thể viết code trong tích tắc, tổng thời gian hoàn thành task của nhóm dùng AI không nhanh hơn đáng kể so với nhóm tự làm (p=0.391).

Tại sao? Thời gian tiết kiệm được khi gõ code lại bị tiêu tốn vào việc viết prompt, chờ AI trả lời, và đọc (hoặc sửa) code do AI sinh ra.
Một số người tham gia đã dành tới 30% tổng thời gian chỉ để "trò chuyện" và chỉnh sửa prompt cho AI.

3. Phân loại người dùng AI: Bạn thuộc kiểu nào?

Nghiên cứu đã mổ xẻ screen recording của từng người và phát hiện ra 6 kiểu hành vi (personas) khi dùng AI. Cách bạn dùng AI quyết định việc bạn học được nhiều hay ít.

Nhóm "Nguy hiểm" (Điểm thấp - Hiểu biết nông)

AI Delegation (Phó mặc hoàn toàn):

Hành vi: Bảo AI "làm hết bài 1 cho tao", copy-paste và nộp.
Kết quả: Nhanh nhất, nhưng điểm quiz cực thấp (~39%).

Progressive Reliance (Lệ thuộc dần):

Hành vi: Bắt đầu thì tự làm, nhưng khi gặp khó ở bài 2 thì buông xuôi cho AI làm hết.
Kết quả: Điểm thấp (~35%) vì mất gốc kiến thức phần sau.

Iterative Debugging (Debug kiểu đoán mò):

Hành vi: Gặp lỗi -> Copy lỗi ném cho AI -> AI đưa code sửa -> Copy vào chạy -> Lại lỗi -> Lại ném cho AI.
Kết quả: Tệ nhất. Tốn nhiều thời gian nhất (~31 phút) và điểm thấp nhất (~24%). Đây là vòng lặp chết chóc của việc không chịu đọc hiểu lỗi.

Nhóm "Thông minh" (Điểm cao - Hiểu sâu)

Generation-Then-Comprehension (Sinh code rồi học):

Hành vi: Cho AI viết code, nhưng sau đó dành thời gian đọc kỹ code đó, hỏi lại AI "tại sao dòng này lại viết thế?" trước khi dùng.
Kết quả: Điểm rất cao (86%).

Hybrid Code-Explanation (Vừa code vừa giải thích):

Hành vi: Luôn yêu cầu AI "viết code và giải thích logic cho tôi".
Kết quả: Điểm khá (68%).

Conceptual Inquiry (Hỏi khái niệm):

Hành vi: Không bảo AI viết code. Chỉ hỏi về lý thuyết (VD: "Nursery trong Trio hoạt động thế nào?"). Sau đó tự viết code.
Kết quả: Cân bằng tốt nhất giữa tốc độ và kiến thức.

4. Vai trò của việc "Gặp Lỗi" (Encountering Errors)

Một phát hiện thú vị khác là nhóm Không dùng AI gặp nhiều lỗi hơn hẳn (trung bình 3 lỗi so với 1 lỗi của nhóm AI).

Nhóm Không AI: Gặp các lỗi logic sâu của thư viện (TypeError, RuntimeWarning của Trio). Việc tự sửa các lỗi này buộc họ phải đọc docs và hiểu cơ chế hoạt động.
Nhóm Có AI: AI thường viết code chạy được ngay (hoặc chỉ gặp lỗi syntax vặt). Người dùng "sướng" vì code chạy một phát ăn ngay, nhưng chính vì thế họ mất đi cơ hội quý giá để học từ lỗi sai.

5. Kết luận & Lời khuyên cho Developer

Nghiên cứu này không bảo bạn hãy ngừng dùng AI. Nó cảnh báo về cách dùng.

"AI-enhanced productivity is not a shortcut to competence." (Năng suất do AI mang lại không phải là con đường tắt dẫn đến năng lực thực sự).

Để không bị "thui chột" khi dùng Copilot/ChatGPT:

Đừng phó mặc (Delegate): Đừng bao giờ copy-paste code mà bạn không thể giải thích từng dòng.
Hỏi "Tại sao", đừng chỉ hỏi "Làm thế nào": Dùng AI như một Mentor (người hướng dẫn) để giải thích concept, thay vì dùng như một Typist (người gõ thuê).
Chấp nhận khó khăn: Khi gặp lỗi khó, hãy thử tự đọc log và docs trước khi paste vào AI. Cảm giác khó chịu khi debug chính là lúc não bạn đang nạp kiến thức ("pain of learning").

Hy vọng bài tóm tắt này giúp bạn có cái nhìn chiến lược hơn trong việc sử dụng trợ lý ảo hằng ngày!

LLMS VÀ SỰ ẢNH HƯỞNG TỚI VIỆC TIẾP THU KIẾN THỨC