생성 AI가 급속도로 발전하면서, 그 “창의성”을 둘러싼 과도한 의견과 단정적인 주장들이 점점 더 큰 소리로 유통되고 있습니다. 이제는 ‘도구가 도움을 준다’는 수준을 넘어, “AI가 인간의 창의성을 이겼다”는 선언까지 등장합니다. 실제로 ScienceDaily는 2026년 1월 25일 한 연구를 소개하며 기사 제목을 아예 그렇게 붙였습니다. “AI has surpassed human creativity.” 그러나 그 제목이 약속하는 ‘승부의 결론’과 달리, 연구가 보여주는 것은 승패가 아니라 측정 가능한 창의성이 어디로 이동하고, 무엇이 남는가에 관한 더 불편한 보고서입니다.

기사에 따르면 연구팀은 10만 명이 넘는 인간 참가자와 여러 대형언어모델을 같은 방식으로 비교했습니다. 핵심 도구는 DAT(Divergent Association Task)라는 과제로, 참가자는 서로 최대한 무관한 단어 10개를 제시하고, 단어들 사이의 의미적 거리(semantic distance)를 기반으로 점수가 산출됩니다. 결과는 자극적입니다. 일부 모델(특히 GPT-4)이 ‘평균 점수’ 기준으로 인간 평균을 넘어설 수 있다는 것입니다. 

그런데 같은 기사 안에 이미 중요한 반전이 있습니다. 창의적인 인간 집단(예: 상위권/특히 상위 10%)은 AI를 일관되게 앞섰다는 대목입니다. 즉, “AI가 인간의 창의성을 이겼다”는 문장은 정확히 말하면 “AI가 특정 창의성 과제에서 인간의 평균을 앞서기 시작했다”로 좁혀져야 합니다. 이 차이는 단순한 말장난이 아닙니다. 평균과 상위권의 분리가 의미하는 것은, 창의성이 사라졌다는 이야기가 아니라 창의성이 ‘평균’에서 빠져나가고, ‘최상위’에서 더 중요해질 수 있다는 신호이기 때문입니다.

문제는 우리가 DAT가 측정하는 것을 ‘창의성 전체’로 오해할 때 시작됩니다. DAT는 장점이 분명합니다. 짧은 시간에 대규모로 수행할 수 있고, 발산적 사고를 정량화할 수 있습니다. 하지만 그 장점은 동시에 함정입니다. 창의성을 ‘의미적으로 멀리 떨어진 단어를 골라내는 능력’으로 압축하는 순간, 창의성의 중요한 구성요소인 맥락 감각, 목적의식, 미적 판단, 정서적 진정성, 사회적 위험 감수, 윤리적 책임은 측정 밖으로 밀려납니다. 단어가 멀다고 해서, 그 선택이 곧바로 좋은 시가 되거나 좋은 기획이 되지는 않습니다. ‘멀리’ 튀는 산출물을 만들 줄 아는 능력과, ‘왜’ 튀어야 하는지 아는 능력은 다릅니다.

더 불편한 지점은, 기사에서 “AI의 창의성”이 사실상 사용자가 조절 가능한 설정값으로 취급된다는 부분입니다. 연구는 모델의 템퍼러처(출력 다양성 파라미터)를 높이면 더 탐색적인 결과가 나오고, ‘어원(etymology)을 떠올리라’ 같은 프롬프트 지시가 성과에 영향을 준다고 설명합니다. 

이는 “AI가 창의적이다”라는 선언을 강화하기보다, 오히려 이렇게 묻게 합니다. 창의성이라는 이름으로 우리가 실제로 보고 있는 것은, 모델의 내재적 성질이라기보다 프롬프트 설계와 랜덤성 튜닝이 만들어낸 ‘출력의 변주’ 아닌가. 창의성이 ‘조작 가능한 파라미터’가 되는 순간, 창의성의 언어는 기술의 광고 문구로 쉽게 전락합니다.

이 연구가 현실에 던지는 산업적 메시지는 더 노골적입니다. 평균 수준의 창의성 과제에서 AI가 앞서기 시작했다는 사실은, “AI가 인간을 이겼다”라기보다 “평균적 산출물이 더 싸고 더 빠르게 대량생산될 수 있다”는 의미에 가깝습니다. 그리고 평균이 무너질 때 가장 먼저 흔들리는 것은 ‘천재의 창작’이 아니라, 그동안 창의성이라는 단어로 포장되어 왔던 중간층의 창작 노동과 중간품질의 콘텐츠 시장입니다. 반대로 상위 10%가 여전히 앞선다는 결과는, 인간 창의성의 자리가 안전하다는 뜻이 아닙니다. 오히려 경쟁의 기준이 독창적 산출물의 생산 능력에서 산출물의 선택·편집·정교화·맥락화 능력으로 이동하고 있음을 암시합니다. ‘좋은 아이디어를 많이 내는 사람’이 아니라, ‘아이디어의 홍수에서 무엇을 남길지 결정하는 사람’이 더 강해질 수 있다는 뜻입니다.

따라서 이번 연구를 읽고 우리가 던져야 할 질문은 “AI가 창의적인가 아닌가”가 아닙니다. 교육과 조직에서 현실적인 질문은 세 가지입니다. 첫째, 우리는 아이들에게 ‘특이한 답’을 더 빨리 뽑는 기술을 훈련시키고 있는가, 아니면 특이한 답을 낼 때 지불해야 하는 책임과 이유를 훈련시키고 있는가. 둘째, AI가 내어놓는 발산적 결과물을 창의성으로 착각하지 않도록, 비판적 선택과 편집의 근육을 어떻게 키울 것인가. 셋째, 평균이 자동화되는 시대에 상위권 인간의 창의성이 의미하는 바—맥락, 윤리, 미학, 판단—를 사회가 어떻게 인정하고, 어떻게 확장할 것인가입니다.

사이언스데일리의 제목처럼 “AI가 인간의 창의성을 이겼다”는 문장은 그 자체로는 강한 문장입니다. 그러나 연구가 실제로 말하는 것은 더 냉정합니다. 측정 가능한 영역에서 평균은 흔들렸고, 최고점의 영역은 여전히 인간에게 남아 있다는 것. 이제 선택은 우리에게 있습니다. 우리는 창의성을 ‘점수화 가능한 발산’으로 더 좁히며 AI가 잘하는 게임판을 키울 것인가, 아니면 점수로 환원되지 않는 인간의 판단과 맥락을 더 단단하게 만들 것인가.

인쇄하기

이전
0

소요 사이트를 방문해주셔서 고맙습니다. 액수에 관계없이 여러분의 관심과 후원이 소요 사이트를 유지하는 데 큰 힘이 됩니다. 후원금은 협동조합 소요 국민은행 037601-04-047794 계좌(아래 페이팔을 통한 신용카드결제로도 가능)로 후원하실 수 있습니다.