AI가 만든 영상인지 구분할 수 있는 가장 확실한 방법은?
요즘 많은 사람들의 소셜 미디어 피드에는 AI가 만든 영상이 자주 올라온다. 실제로 촬영된 영상인지, AI로 만든 영상인지 구별할 수 있는 한 가지 방법이 있다. 해당 영상의 화질이 낮지는 않은가?
때가 됐다. 우리는 속아 넘어갈 것이다. 어쩌면 이미 속고 있을지도 모른다. 지난 6개월 동안 AI(인공지능)의 영상 생성 기술은 급격히 발전해, 실제 카메라로 촬영한 영상과 구분하기 어려워졌다. 미래에 대한 가장 낙관적인 전망조차 결국 사람들이 속고 또 속으며, 보는 것마다 의심하게 되는 상황이다. 이런 미래는 머지않아 현실이 될지도 모른다.
그러나 AI로 실제처럼 만들어낸 영상을 판별하는 데 당분간은 활용할 수 있는 단서들이 있다. 화질은 그중 특히 유용한 단서다. 입자가 거칠고 흐릿한, 즉 화질이 나쁜 영상이라면 AI의 제작 가능성을 의심해볼 만하다.
캘리포니아대 버클리 캠퍼스 컴퓨터과학과 교수인 해니 파리드는 "우리가 가장 먼저 살펴보는 요소가 화질"이라고 말했다. 그는 디지털 포렌식 분야의 선구자이자 딥페이크 탐지 기업 '겟리얼 시큐리티'의 설립자다.
다만 영상 생성 AI는 계속 발전할 것이며, 이런 조언도 곧 무용지물이 될 가능성이 크다. 그것이 몇 달 안에 일어날지, 몇 년 뒤에 일어날지는 알 수 없다. 하지만 AI 영상의 미묘한 차이를 이해해 둔다면, 우리가 진실을 판단하는 방식을 바꾸기 전까지는 이 기사에 담긴 팁들이 AI 영상 홍수를 잠시나마 피하는 데 도움이 될 수 있다.
분명한 것은 AI 영상의 품질이 앞으로 더 나빠지지는 않을 것이라는 점이다. 최고 수준의 AI 도구는 이미 아름답고 정교한 영상을 만들어낸다. 또한 화질이 낮은 영상이라고 해서 반드시 AI가 만든 것은 아니다. 미국 드렉셀대 멀티미디어 및 정보 보안 연구소 소장인 매튜 스탐은 "화질이 낮은 영상이라고 해서 그것이 가짜라는 의미는 아니며, 비윤리적인 무언가가 있다는 뜻도 아니다"라고 말했다.
그러나 선명하지 않고 픽셀로 쪼개진 흔적이 남은 영상일수록, 시청자를 속일 가능성은 더 높다. 그렇기 때문에 우리가 보는 영상을 조금 더 주의 깊게 살펴볼 필요가 있다.
파리드 교수는 "구글의 '비오(Veo)'나 오픈AI의 '소라(Sora)'처럼 텍스트를 영상으로 변환하는 대표적인 도구를 사용하면 결과물에 미세한 불일치가 생긴다"며 "다만 그 수준은 손가락이 여섯 개가 된다거나 글자가 흐릿해 읽을 수 없는 정도가 아니라, 매우 미묘한 수준"이라고 설명했다.
오늘날 가장 진보된 AI 모델조차도 가끔 이상한 피부 질감, 머리카락이나 옷의 비정상적 패턴, 현실적으로 불가능한 방식으로 움직이는 배경 요소 등을 만들어내곤 한다. 하지만 시청자들은 이런 오류를 놓치기 쉽다. 영상의 화질이 선명할수록 AI가 남긴 흔적을 포착할 가능성은 높아진다.
이 때문에 화질이 낮은 영상은 AI에게 유리한 조건이 된다. 예를 들어 AI가 구형 휴대전화나 저가형 보안 카메라로 촬영한 듯한 영상을 만들어 내면, 사람들이 알아챌 수 있는 인위적 오류가 감춰질 수 있다.
최근 몇 달 사이 수많은 사람들을 속이며 화제를 모았던 AI 영상들이 있었다. 이들은 공통점이 있다. 유쾌한 야생 토끼들이 트램펄린 위에서 뛰노는 모습을 AI가 만든 영상은 틱톡에서 2억4000만 회 넘는 조회수를 기록했다. 수백만 명의 온라인 로맨티스트들은 뉴욕 지하철에서 사랑에 빠지는 커플의 영상에 '좋아요'를 눌렀지만, 그것 역시 가짜로 드러나 같은 실망을 맛봤다. 나 또한 보수적 교회 소속의 미국 신부가 놀라울 만큼 좌파적인 설교를 한다는 바이럴 영상에 속았다. 그는 남부 억양으로 "억만장자들은 우리가 두려워해야 할 유일한 소수자다. 그들은 이 나라를 파괴할 힘을 가지고 있다!"라고 외쳤다. 나는 깜짝 놀랐다. 정말 정치적 경계가 그렇게 흐려진 것일까? 아니었다. AI의 장난이었다.
이 영상들은 하나같이 화질이 매우 떨어졌다. AI가 만든 토끼 영상은 밤에 저가 보안 카메라로 찍은 것처럼 보였다. 지하철 커플 영상은 화소가 깨져 있었다. 그 상상의 설교자 영상은 인물을 과도하게 클로즈업했다. 그리고 이 영상들에는 다른 단서들도 있었다.
파리드는 "해상도, 화질, 길이 세 가지를 확인해야 한다"고 말했다. 이 중 길이는 가장 쉽게 판단할 수 있다. "대부분의 AI 영상은 매우 짧습니다. 틱톡이나 인스타그램에서 흔히 보는 30~60초짜리 일반 영상보다도 짧죠. 제가 검증 요청을 받는 영상 대부분은 길이가 6초, 8초, 10초에 불과합니다." AI 영상 생성은 비용이 많이 들기 때문에 대부분의 도구가 짧은 분량만 생성하도록 제한하기 때문이다. 게다가 영상이 길어질수록 AI가 실수할 가능성도 커진다. "여러 AI 영상을 이어 붙일 수는 있지만, 약 8초마다 발생하는 전환의 어색함을 발견할 수 있을 것입니다."
나머지 두 요소인 해상도와 화질은 서로 다르지만 밀접하게 관련되어 있다. 해상도는 이미지의 픽셀 수, 즉 크기를 말한다. 화질은 그 픽셀이 얼마나 조밀하게 배열되어 있는지를 뜻한다. 그런데 압축을 통해 세부 정보를 줄이면, 영상에 이상한 패턴이나 흐릿한 경계선이 남기도 한다.
파리드는 악의적인 사람들이 의도적으로 영상의 품질을 떨어뜨리기도 한다고 말했다. "사람들을 속이고 싶다면 어떻게 할까요? AI로 만든 가짜 영상의 해상도를 낮춰 세부 사항이 보이지 않게 만든 다음, 압축을 거쳐 오류를 더욱 모호하게 만드는 겁니다." 파리드는 이것이 "흔히 쓰이는 기법"이라고 설명한다.
문제는 지금 이 순간에도 테크 기업들이 AI 영상이 실제 촬영한 영상처럼 보이도록 만들기 위한 막대한 투자를 지속하고 있다는 점이다. 스탐은 "안타깝게도 지금은 AI 영상에서 시각적 단서를 발견할 수 있지만, 머지않아 사라질 것입니다"라고 말했다. "영상에서 눈에 띄는 시각적 단서들은 최소 2년 안에 사라질 가능성이 큽니다. 이미 AI 생성 사진에서는 이러한 단서들이 거의 사라졌기 때문이죠. 그렇게 되면 우리는 눈으로 보는 것을 신뢰할 수 없게 될지도 모릅니다."
그렇다고 진실이 완전히 사라지는 것은 아니다. 파리드와 스탐 같은 연구자들은 더 발전된 기술을 활용해 콘텐츠를 검증할 수 있다. 스탐은 "AI가 동영상을 생성하거나 조작할 때, 범죄 현장의 지문과 같은 미세한 통계적 흔적이 남는다"며 "이런 지문을 찾아 드러내는 데 도움을 주는 기술이 등장하고 있다"고 설명했다. 가짜 영상은 픽셀 분포에서 실제 영상과 차이를 보이기도 한다. 다만 이러한 요소만으로는 완전한 검증이 어렵다.
이 때문에 일부 테크 기업들은 디지털 정보 검증을 위한 새로운 표준을 만들고 있다. 카메라가 이미지를 촬영할 때 실제 촬영에 대한 진위를 확인할 수 있는 정보를 파일에 첨부하는 방식이다. 마찬가지로 인공지능 도구가 영상과 이미지에 유사한 정보를 자동으로 삽입해 '이 영상은 AI가 만든 것'이라고 표기할 수도 있다. 스탐을 비롯한 전문가들은 이러한 업계의 노력이 AI 영상 구별에 도움이 될 것이라고 보고 있다.
하지만 디지털 리터러시 전문가 마이크 콜필드는 진정한 해결책은 우리가 온라인 콘텐츠를 바라보는 방식을 근본적으로 바꾸는 것이라고 말했다. 그는 AI가 남긴 흔적을 찾는 방식은 "지속 가능하지 않다"고 지적했다. 그 흔적들은 계속 진화하고 변화하기 때문이다. 이에 콜필드는 뜬금없는 영상이나 이미지에서 지나치게 많은 의미를 읽어내려는 태도를 줄여야 한다고 조언한다.
"제가 보기에는 장기적으로 영상은 텍스트와 비슷한 형태로 진화할 것이고, 내용 자체보다 출처가 핵심 요소가 될 것입니다. 그에 대비하는 것이 현명합니다."
우리는 누군가가 쓴 글을 바로 사실이라고 단정하지 않는다. 의문이 생기면 출처를 확인한다. 그러나 과거의 영상과 이미지는 위조나 조작이 어렵다는 이유로 그렇게 다루지 않았다. 하지만 지금은 상황이 달라졌다. 이제 중요한 것은 콘텐츠의 출처, 게시자, 맥락, 그리고 신뢰할 수 있는 출처에 의해 검증되었는지 여부다. 그리고 우리 모두가 이 사실을 언제(혹은 과연) 받아들일 수 있을지가 관건이다.
스탐은 "약간 과장하자면, 이는 21세기 최대의 정보 보안 과제라고 할 수 있다"고 말했다. "하지만 불과 몇 년 사이에 등장한 문제이고, 해결을 위해 일하는 인력은 아직 많지 않습니다. 다만 빠르게 늘고 있어요. 다양한 해결책, 교육, 지능형 정책, 기술적 접근법이 함께 작동하는 종합적 대응이 필요합니다. 저는 희망적인 해법이 나올 것이라 기대하고 있습니다."