“눈 뒤집어 쓴 강아지들”…AI 명령어 만으로 1분 영상 뚝딱

입력 2024-02-16 17:40
오픈AI가 16일 공개한 '텍스트-비디오 AI 모델 소라'의 결과물 일부 편집. 오픈AI 제공 명령어: 눈 속에서 놀고 있는 작은 골든 리트리버 강아지들. 눈 속을 파헤친 강아지들의 머리가 눈에 뒤덮인 모습.

생성형 인공지능(AI) 챗GPT를 개발한 오픈AI가 16일 명령어 입력만으로 영상을 만들 수 있는 AI 도구를 16일(현지시간) 발표했다. 사용자가 원하는 장면, 카메라 움직임, 캐릭터 묘사 등을 입력하면 AI가 세부적인 부분까지 반영해 영상을 만들어 내는 게 특징이다.

오픈AI는 이날 소셜미디어를 통해 명령어(프롬프트) 만으로 최대 1분 길이의 동영상을 만들 수 있는 텍스트-동영상 AI 모델 ‘소라(Sora)’를 공개했다.

오픈AI가 16일 공개한 '텍스트-비디오 AI 모델' 소라의 결과물을 일부 편집한 영상. 오픈AI 제공 명령어: 한 세련된 여성이 따뜻하게 빛나는 네온사인과 움직이는 도시 간판으로 가득한 도쿄 거리를 걷고 있다. 검은색 가죽 자켓, 긴 빨간색 드레스, 검은색 부츠를 신고 검은색 지갑을 들고 있다. 선글라스와 빨간 립스틱을 착용하고 있다. 그녀는 자신감 있고 자연스럽게 걷는다. 길은 축축하고 반사되어 화려한 조명이 거울 효과를 만들어낸다. 많은 보행자가 걸어가고 있다.

오픈 AI는 “소라는 매우 세부적인 장면, 복잡한 카메라 움직임, 생생한 감정을 가진 다양한 캐릭터를 담아낸 최대 1분 짜리 영상을 만들어낼 수 있다”고 설명했다.

이어 “우리는 인공지능에 물리적 세계의 움직임을 이해하고 모방하는 것을 가르치고 있다”며 “사람들이 현실 세계의 상호작용을 요구하는 문제들을 해결하는 데 도움을 주는 모델을 훈련시키는 목적”이라고 덧붙였다.

오픈AI는 이와 함께 X(옛 트위터)에 소라가 명령어에 따라 제작한 동영상 샘플도 첨부했다. ‘빨간색 모직 니트 오토바이 헬멧을 쓴 30세 우주인의 모험을 담은 영화 예고편’이라고 명령어를 입력한 영상은 입력 내용을 반영한 17초 트레일러로 제작됐다. 오픈AI가 이번에 공개한 영상들은 최소 8초에서 최대 59초에 이른다.

오픈AI가 공개한 '텍스트-비디오 모델 소라'의 결과물. 오픈AI제공 명령어: 빨간 모직 니트 오토바이 헬멧을 쓴 30세 우주인의 모험, 푸른 하늘, 소금 사막, 영화 같은 스타일, 35mm 필름으로 촬영한 영화 예고편, 선명한 색감.

앞서 다른 AI 회사들도 동영상 생성 도구를 발표한 바 있지만, 동영상의 길이가 몇초 내외로 짧은 데다 명령어와 일치하지 않는다는 한계를 보였다.

오픈AI 역시 소라 모델의 기술적 한계를 인정했다. 소라가 ‘복잡한 물리법칙’ ‘인과 관계’ 등을 이해하지 못할 수 있다는 것이다. 예를 들어 한 인물이 한 입 베어문 쿠키에 깨문 자국이 남지 않을 수 있다고 오픈AI 측은 설명했다.

오픈AI는 딥페이크 악용 우려 등에 대해 “소라는 대중에게 공개되기 전 중요한 테스트를 거치며 안전 조치를 취할 것”이라며 “잘못된 정보(misinformation), 혐오·증오(hateful) 콘텐츠, 편향·편견(bias) 등에 관한 전문가들로 이뤄진 레드팀이 협력해 모델을 적대적으로 테스트할 것”이라고 말했다.

샘 올트먼 오픈AI 최고경영자(CEO)도 자신의 SNS에 “초기 ‘소라’는 소수의 연구자와 일부 창작자에게만 먼저 사용할 수 있도록 허용한다”고 했다.

이정헌 기자 hlee@kmib.co.kr