3초 만에… 카카오브레인, 이미지 생성 AI ‘칼로 2.0’ 공개

Է:2023-07-10 15:28
ϱ
ũ
칼로 2.0에 고양이를 명령어로 입력했을 때 나오는 이미지. 카카오브레인 제공

카카오의 인공지능(AI) 자회사 카카오브레인이 초거대 AI 이미지 생성 모델 ‘칼로 2.0’을 10일 공개했다.

3억장에 달하는 ‘텍스트-이미지 데이터셋’을 학습한 칼로 2.0은 사실감 높은 이미지를 3초 안에 그려낼 수 있다. 예를 들어 ‘밝은 파란 눈동자를 가진 고양이’처럼 복잡한 프롬프트(명령어)도 명확하게 이해하고 이미지를 만든다고 카카오브레인은 설명했다.

칼로 2.0의 해상도는 최대 2048x2048을 지원한다. 이미지의 공간감, 입체감과 동물 털 같은 텍스처(질감)를 표현하는 세밀함이 보강돼 실사에 가까운 이미지를 생성한다. 이미지 생성 속도도 기존 모델(칼로 1.4) 대비 단축됐다.

칼로 1.4, 칼로 2.0에 배(ship)를 각각 입력했을 때 나오는 이미지. 칼로 2.0가 그려낸 이미지의 질감과 디테일이 더 살아있다. 카카오브레인 제공

칼로 2.0 오픈 API(응용프로그램 인터페이스)는 개발자 전용 웹사이트인 카카오디벨로퍼스에 공개됐다. 기존 칼로 1.4에선 무료 생성 이미지가 월 최대 500장였으나, 칼로 2.0에선 60만장으로 크게 늘었다. 카카오브레인은 “일반 스타트업 기업이나 개발자가 사용할 수 있는 무료 이미지 생성 횟수를 글로벌 최대 규모로 확대한 것”이라고 말했다.

김일두 카카오브레인 각자 대표는 “다양한 이미지 데이터 학습 및 기술 고도화를 거쳐 칼로 2.0을 선보였다”며 “많은 데이터와 사용자 피드백을 학습시켜 실사 수준 이미지를 생성하고, 사용자 니즈를 반영하는 모델로 발전시키겠다”고 말했다.

조민아 기자 minajo@kmib.co.kr

GoodNews paper Ϻ(www.kmib.co.kr), , , AIн ̿
Ŭ! ̳?
Ϻ IJ о
õ
Ϻ Ź