Google이 I/O 2025에서 공개한 Veo 3는 “텍스트에서 고품질 비디오를 생성하는 AI”로 대중의 이목을 집중시켰다. 화려한 데모 영상들이 소셜미디어를 뜨겁게 달궜지만, 실제 사용자들의 경험은 냉혹하다. “영상 프롬프트를 디테일하게 잘 넣어줘야되고, 원하는 영상 뽑으려면 뽑기도 여러번 해야 됩니다”라는 후기가 대표적이다. 한 사용자는 솔직하게 고백했다: “아 구글도 체리피킹 잘하는 데였지”

감동적인 영화 장면을 요구하는 프롬프트에 대해 Veo 3는 저화질의 짧은 영상과 의미 없는 감탄사(“오!”, “라!”)만을 내놓는 경우가 허다하다. “오디오와 자막 생성이 너무 무작위로 느껴졌다”며 “프롬프트에서 표시 여부를 지정하더라도 제어할 수 없었다”는 체험담이 이어진다. 감정도, 카메라 무빙도, 요청한 대사도 제대로 구현되지 않는다.

이러한 현실은 OpenAI의 Sora가 보여준 과장된 기대와 실망의 패턴을 반복한다. 당시에도 놀라운 데모 영상들이 주목을 받았지만, 나중에 공개된 원시 출력물에서는 AI 특유의 왜곡된 손, 시간 불일치, 물리적 오류 등이 여전히 발견되었다.

공통점은 무엇일까? 바로 ‘숨겨진 인간 노동‘이다.

포장된 자동화 뒤에 숨은 노동들

AI 비디오 생성 시스템은 완전 자동화처럼 홍보되지만, 실제로는 다음과 같은 광범위한 인간의 개입 없이는 완성도 있는 결과물이 불가능하다:

  • 프롬프트 엔지니어링: 원하는 스타일, 조명, 감정을 구현하기 위해 수십~수백 번의 실험이 필요하다. 전문가들도 인정한다: “기업이 추구하는 톤을 이해해 장면별로 메시지를 담아 영상을 제작하기에는 아직 한계가 있다. 따라서 전문가를 대체하기보다는 작업 과정을 효율화하는 목적으로 활용할 수 있다.”
  • 클립 선택 및 시퀀스 편집: 수많은 실패작 중 의미 있는 몇 초를 골라내어 자연스럽게 연결하는 편집이 이루어진다.
  • 비주얼 후반작업: 조명 불일치, 색감 왜곡, 이상한 물체 형태를 보정하고, 모션의 부자연스러움을 수정한다.
  • 오디오 재작업: 의미 없는 감탄사 대신 성우의 재녹음 또는 음성 합성 조정이 필요하다.
  • 합성 편집: 여러 AI 세대 결과를 이어붙여 하나의 내러티브로 만들고, 시각적 흐름을 인위적으로 조율한다.
  • 실패한 시도 관리: 결과물이 나오기까지 수많은 실패가 반복되며, 이 과정은 정리와 분석을 동반한다.

이러한 작업들은 결코 자동화되지 않는다. 그럼에도 기업들은 이러한 작업을 감추고, 마치 AI가 모든 것을 완전 자동으로 처리한 것처럼 마케팅한다.

숨은 댓가들

문제는 여기에 그치지 않는다. 이렇게 가려진 노동은 기술이 노동을 대체할 수 있다는 환상을 강화하고, 실제로는 미완성인 기술을 근거로 일자리를 줄이는 의사결정을 유도한다. 이미 프리랜서 영상 편집자와 VFX 아티스트들이 생계를 위협받고 있다. AI가 사람을 대체한 것이 아니라, AI가 대체할 수 있다는 ‘믿음’이 사람을 내몰고 있는 것이다.

게다가 비효율적인 반복 생성은 막대한 에너지 소비로 이어진다. 구글의 경우 AI 서비스 확산으로 인해 온실가스 배출량이 4년 전 대비 50% 증가했다. 연구에 따르면 구글이 모든 검색에 AI를 사용한다면 아일랜드의 연간 전력 소비량에 해당하는 29.2TWh가 필요할 것으로 추정된다.

ChatGPT의 경우 1만 대의 NVIDIA V100 GPU가 장착된 슈퍼컴퓨터로 1,248MWh의 전력을 소비한다. 수백 번의 시도 중 대부분은 폐기되며, GPU 자원을 낭비하고 탄소 발자국을 키운다. “완벽한 한 컷”을 얻기 위한 이 과정은 기존 영상 제작보다 예측 불가능하고 비효율적이며, 환경적으로도 더 해롭다.

전문가들은 경고한다: “AI는 에너지 집약적이기 때문에 실제로 필요하지도 않은 모든 종류의 작업에 AI를 투입하는 것은 쓸데없는 낭비”

결국 우리가 마주한 것은 ‘기술적 기적’이 아니라 잘 포장된 연극이다. 스포트라이트를 받은 무대 위에는 AI가 있지만, 커튼 뒤에는 여전히 사람의 손이 바쁘게 움직이고 있다. 마이크로소프트 역시 2020년 이후 탄소배출량이 29.1% 늘어났다고 발표하면서, 데이터센터 건설에 사용된 반도체, 연료, 건축자재 등을 그 원인으로 지목했다.

우리는 이제 묻지 않을 수 없다. 정말 필요한 것이 ‘AI가 만든 완벽한 영상’인가, 아니면 사람과 함께 작업하는 정직한 기술인가?

진짜 혁신을 위한 제안

진짜 혁신은 인간을 지우는 것이 아니라, 인간과 협업하는 기술을 만드는 것이다. Veo 3가 진정한 창작 도구가 되기 위해서는 다음이 필요하다:

  • 투명한 성능 공개: 실패율, 평균 시도 횟수, 후편집 범위 등을 솔직히 공개해야 한다.
  • 지속가능한 개발: 에너지 효율성을 핵심 성능 지표로 포함하고, 환경적 비용을 고려한 개발이 이루어져야 한다.
  • 인간 중심 설계: AI가 인간을 대체하는 것이 아닌, 인간의 창의성을 증폭시키는 방향으로 개발되어야 한다.
  • 정직한 마케팅: 인간 노동을 숨기지 않고, 그 가치를 존중하는 개발 철학이 필요하다.

다음 번 AI 데모를 볼 때는 이 질문을 던져보자.

“이 영상 뒤에는 몇 번의 시도가 있었을까? 누가, 무엇을, 어떻게 고쳤을까? 그리고 이를 위해 얼마나 많은 전력이 소모되었을까?”

기술의 진보란 더 나은 미래를 만드는 수단이지, 진실을 감추는 도구가 되어서는 안 된다. AI 시대의 진정한 혁신은 투명성과 지속가능성, 그리고 인간과의 협력에서 나올 것이다.

인쇄하기

이전
0

소요 사이트를 방문해주셔서 고맙습니다. 액수에 관계없이 여러분의 관심과 후원이 소요 사이트를 유지하는 데 큰 힘이 됩니다. 후원금은 협동조합 소요 국민은행 037601-04-047794 계좌(아래 페이팔을 통한 신용카드결제로도 가능)로 후원하실 수 있습니다.