카카오브레인이 자사의 인공지능(AI) 기술을 확대하며 경쟁력 강화에 힘을 싣고 있다. 지난해 초거대 AI 로드맵을 발표한 만큼 카카오 공동체와의 협업 추진, 수익원 확대 등을 목표에 속도를 낼 전망이다. /카카오브레인
카카오브레인이 자사의 인공지능(AI) 기술을 확대하며 경쟁력 강화에 힘을 싣고 있다. 지난해 초거대 AI 로드맵을 발표한 만큼 카카오 공동체와의 협업 추진, 수익원 확대 등에 속도를 낼 전망이다. /카카오브레인

시사위크=송가영 기자  카카오브레인이 자사의 인공지능(AI) 기술을 확대하며 경쟁력 강화에 힘을 싣고 있다. 지난해 초거대 AI 로드맵을 발표한 만큼 카카오 공동체와의 협업 추진, 수익원 확대 등에 속도를 낼 전망이다. 

카카오브레인은 19일 지난해 12월에 공개한 초거대 AI 멀티모달인 민달리의 업그레이드 버전인 이미지 생성 모델 ‘RQ 트랜스포머’를 최대 오픈소스 커뮤니티 깃허브에 공개했다. 

RQ 트랜스포머는 카카오브레인의 민달리의 업그레이드 버전으로 39억개의 매개변수(파라미터)로 구성돼 3,000만쌍의 텍스트와 이미지를 학습한 텍스트 투 이미지 AI 모델로 계산 비용을 줄이고 이미지 생성 속도를 높인 동시에 이미지의 품질을 크게 향상시킨 모델이다.

민달리 대비 모델 크기는 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘린 것이 특징이다. 특히 민달리의 경우 미국의 인공지능 개발 기업 ‘오픈AI’가 공개한 ‘달리’를 재현하는 것에 가깝지만 RQ 트랜스포머의 경우 카카오브레인 만의 독자적인 기술로 개발됐다. 

또한 고해상도의 이미지를 2차원의 코드맵으로 표현하는 기존 기술과 달리 RQ 트랜스포머는 3차원의 코드맵으로 표현된 이미지를 순차적으로 예측해 생성하도록 학습된 이미지 생성 모델이다. 

기존 기술과 비교했을 때 이미지 압축으로 인한 손실이 적어 높은 품질의 이미지를 저해상도의 코드맵으로 표현해 RQ 트랜스포머는 기존 이미지 생성 모델보다 적은 계산 비용과 높은 이미지 생성 속도를 달성할 수 있다.

카카오브레인은 오는 6월 세계적인 학술대회 CVPR 2022에서 RQ 트랜스포머 기술의 우수성을 담은 논문을 발표할 예정이다. 이와 함께 이미지 생성 모델 연구 개발을 담당하고 있는 카카오브레인 GM팀은 이를 발판 삼아 훨씬 더 정교한 이미지를 생성하고 생성 속도를 향상시키기 위한 연구를 진행한다는 계획이다. 

이 외에도 독자적으로 개발한 기술을 기반으로 생성된 컴퓨터 이미지의 품질을 개선하고 적은 비용으로 훨씬 많은 데이터를 학습할 수 있도록 연구‧개발을 추진, 인간의 아이디어를 컴퓨터 프로그램을 통해 디지털 이미지로 실현시킬 수 있도록 기술 역량을 확보한다는 계획이다. 

카카오브레인은 지난해 12월 멀티모달 모델 개발 계획을 발표하며 자사가 확보하고 있는 AI 기술 성능을 더욱 끌어올리겠다고 밝혔다. 이와 함께 카카오 공동체와 함께 디지털 헬스케어, 교육 등 다양한 분야에서의 사업 확장 의지도 드러냈다. 

지난해 계획 발표에 따라 올해 멀티모달 모델 RQ 트랜스포머를 발표한 만큼 카카오 공동체와의 협력 추진, 사업 확장에 따른 수익원 확보 등에도 속도를 낼 것으로 전망된다. 

관련기사

저작권자 © 시사위크 무단전재 및 재배포 금지
이 기사를 공유합니다