교실에서 가장 흔한 질문은 “이거 시험에 나와요?”입니다. 배움이 호기심이 아니라 채점에 매달릴 때, 질문은 줄고 정답만 남습니다. 그런데 아이러니하게도, 요즘 가장 빠르게 성장하는 존재는 정반대로 갑니다. 질문을 스스로 만들어 배우는 AI가 등장했기 때문입니다.

최근 와이어드가 소개한 연구는 그 장면을 선명하게 보여줍니다. 칭화대학교, 베이징 범용인공지능연구소, 펜실베이니아 주립대학교연구진이 만든 앱솔루트 제로 리즈너(Absolute Zero Reasoner, AZR)는 인간이 만든 문제집을 잔뜩 먹고 자라는 방식 대신, 자기 실력에 맞는 파이썬 문제를 스스로 출제하고, 스스로 풀고, 실행 결과로 채점받으며 실력을 끌어올립니다.

여기서 말하는 “계속 배운다”는 건, 마법처럼 스스로 지혜를 얻는다는 뜻이 아닙니다. 핵심은 훨씬 기술적입니다. 모델이 “조금 어렵지만 풀 수 있는” 코딩 과제를 스스로 만들고, 같은 모델이 그 문제를 풉니다. 답을 사람에게 묻지 않고 코드를 실행해 맞았는지 틀렸는지 확인합니다. 연구진은 이를 “검증 가능한 보상(verifiable rewards)”이라 부릅니다. 성공과 실패 신호로 다음 학습을 업데이트하는 것이죠. 결국 AI가 자라는 비밀은 자기성찰이 아니라 자동 채점이 가능한 환경입니다. 그래서 이 접근은 지금 단계에서 특히 수학과 코딩처럼 정답 판정이 명확한 영역에 강합니다.

이 대목에서 교육은 불편해집니다. 학교는 오랫동안 채점 가능한 것을 중심으로 교육을 설계해 왔습니다. 객관식, 단답형, 정해진 풀이. 그런데 AZR이 보여주는 역설은 이겁니다. 채점이 가능하면, 문제를 만드는 능력이 성장을 폭발시킨다는 것.

우리는 아이들에게 문제를 풀게 하면서도, 정작 “좋은 문제를 만드는 능력”은 주변으로 밀어냈습니다. 질문은 수업 진행을 방해하는 변수가 되고, 출제 의도는 교사가 가진 권력이 되었습니다. 반면 AZR은 출제를 성장의 엔진으로 삼습니다. 이 차이는 단지 AI 이야기로 끝나지 않습니다. 인간 학습에서도, 질문을 잃는 순간 배움은 복습으로 퇴화합니다.

앤드류 자오Andrew Zhao 같은 연구자는 이 방식이 “모방을 넘어, 인간처럼 질문하며 성장하는 단계”를 가리킨다고 말합니다. 셀프-플레이(self-play)라는 아이디어는 위르겐 슈미트후버Jürgen Schmidhuber 등 오래전 연구자들에게서도 맥이 이어집니다. 하지만 교육 현장에서 이 기사를 읽는 우리는, 한 가지를 더 분명히 해야 합니다.

AZR의 힘은 정답이 있는 세계에서 빛납니다. 코드를 실행하면 맞는지 틀리는지 바로 알 수 있고, 수학 문제는 답이 하나입니다. 반면 학교와 삶의 대부분은 정답이 아니라 판단의 영역입니다. “좋은 발표”, “설득력”, “협업”, “윤리”, “돌봄”, “책임” 같은 것들은 코드처럼 실행해서 채점할 수 없습니다.

그래서 이 흐름이 더 확장되려면, 결국 “무엇이 좋은 행동이고 좋은 답인가”를 판정하는 새로운 검증 장치가 필요합니다. 그 방향의 시도로 에이전트가 도구를 쓰며 자기 커리큘럼을 키우는 에이전트0(Agent0) 같은 연구도 등장합니다. 그러나 이 지점부터는 기술이 아니라 사회가 합의해야 할 채점 기준이 문제의 중심으로 들어옵니다.

AZR이 던지는 교육적 충격은 성능 수치가 아닙니다. “AI도 결국 질문으로 성장한다”는 사실입니다. 우리는 아이들에게 너무 오래 정답을 맞히는 법만 가르쳐 왔습니다. 그 결과, 질문은 점수에 도움이 될 때만 남는 기술이 되었습니다. 그런데 지금, 기계가 오히려 질문을 통해 성장하는 길을 다시 보여주고 있습니다.

이제 교육이 스스로에게 물어야 할 질문은 하나입니다. 우리는 아이들을 정답을 생산하는 존재로 키울 것인가, 질문을 발명하는 존재로 키울 것인가.

인쇄하기

이전
0

소요 사이트를 방문해주셔서 고맙습니다. 액수에 관계없이 여러분의 관심과 후원이 소요 사이트를 유지하는 데 큰 힘이 됩니다. 후원금은 협동조합 소요 국민은행 037601-04-047794 계좌(아래 페이팔을 통한 신용카드결제로도 가능)로 후원하실 수 있습니다.