카카오브레인이 20일 온라인 기자간담회를 개최하고 초거대 인공지능(AI) 로드맵과 내년에 진행할 핵심 기술 연구 및 사업 계획 등을 공개했다. /온라인 간담회 갈무리
카카오브레인이 20일 온라인 기자간담회를 개최하고 초거대 인공지능(AI) 로드맵과 내년에 진행할 핵심 기술 연구 및 사업 계획 등을 공개했다. /온라인 간담회 갈무리

시사위크=송가영 기자  올해 자체적으로 인공지능(AI) 기술 확보에 집중해온 카카오브레인이 내년도 사업 청사진을 발표했다. 최대 규모 딥러닝 인프라를 기반으로 AI 기술력을 강화함과 동시에 수익원 발굴에도 적극 나설 계획이다.

◇ 내년엔 ‘멀티모달’ 공개… 헬스케어‧교육 분야와 접목

카카오브레인은 20일 온라인 기자간담회를 개최하고 김일두 카카오브레인 대표가 직접 참석해 초거대 AI 로드맵과 내년에 진행할 핵심 기술 연구 계획 및 방향성 등을 공개했다. 카카오브레인은 최근 오픈소스를 통해 공개한 초거대 AI 모델인 ‘KoGPT(코지피티)’와 ‘minDALL-E(민달리)’에 이어, 내년에는 멀티모달 모델을 공개한다는 계획이다.

‘코지피티’는 한국어를 사전적·문맥적으로 이해하고 이용자가 원하는 결과값을 보여주는 한국어 특화 언어모델이다. 60억개의 매개변수와 2,000억개 토큰의 한국어 데이터를 바탕으로 구축했으며 최근에는 매개변수를 300억개까지 확장했다. ‘민달리’는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. 

카카오브레인이 내년에 공개할 예정인 멀티모달 모델은 언어로 표현된 글과 이미지를 동시에 이해할 수 있는 AI 모델이다. 이를 통해 검색엔진의 이미지 섹터에 혁신을 주고 커머스, 이미지 검색 등 다양한 분야의 니즈를 해소해줄 수 있을 것으로 분석하고 있다. 

김 대표는 “이를 개발하는데 기반이 되는 것은 최고 규모의 딥러닝 인프라 때문”이라며 “카카오브레인은 구글과의 협력, 자체 인프라 구축 등으로 최고 규모의 딥러닝 인프라를 보유하고 있다”고 말했다. 

이와 함께 내년 ‘넥스트 이미지넷 프로젝트’를 공개할 계획이다. 최근 대부분의 기업들이 데이터셋이 사업적으로 중요하다고 판단하고 있어 카카오브레인이 확보하고 있는 20억건의 데이터셋을 내년 1월께 일부 공개해 연구 커뮤니티에 기여하고 AI 연구 가속화를 이끄는 파트너 모색에도 나선다는 방침이다. 

카카오브레인은 내년 초 공개될 기술들을 발판삼아 교육, 헬스케어 등 고부가가치 산업 분야 접목에도 나선다. 이를 위해 지난 16일에는 AI 기반 신약 설계 플랫폼 기업 ‘갤럭스’에 50억원 투자를 단행, 공동연구를 진행하겠다고 밝힌 바 있다. 

이와 관련해 김 대표는 “카카오브레인의 AI 역량으로 신약을 개발하는 프로세스를 간소화시킴으로서 향후 인류의 질병 대응 수준이 높아지고 삶의 질을 바꿀 수 있는 좋은 프로젝트로 보고 있다”고 말했다. 

◇ AI 모델 성능 더 끌어올린다… “혁신 일으켜 나갈 것”

이날 간담회에 참석한 김일두 카카오브레인 대표(사진)는 초거대 AI 개발 현황과 향후 사업 전략에 등에 대해 직접 설명했다. /카카오
이날 간담회에 참석한 김일두 카카오브레인 대표(사진)는 초거대 AI 개발 현황과 향후 사업 전략에 등에 대해 직접 설명했다. /카카오

카카오브레인은 네이버, LG 등 경쟁사의 최고 규모의 모델 수준까지 끌어올리기 위해 성능 확장에 집중한다는 계획이다. 김 대표는 “언어모델을 실제로 쓸 수 있는 규모가 있는데 6~80억 파라미터(학습 데이터 저장소)”라며 “내년 상반기 중으로 성능을 더욱 끌어올리는 것을 목표로 한다”고 말했다. 

이들 경쟁사 대비 파라미터수가 적다는 지적에 대해서는 “무작정 파라미터를 키우면 속도도 느려지고 비용도 늘어난다”며 “실용구간에 집중하다보니 현재는 그렇지만 당연히 큰 모델을 준비 중이고 내년에 공개할 수 있을 것 같다”고 답했다.

파라미터 이외에 초거대 AI 개발을 위한 요소들과 관련해 김 대표는 “기존의 초거대 AI 모델에서 드러난 극단적인 단점을 극복하기 위해 모델의 구조 자체를 바꾸는 방향으로 연구가 될 것으로 본다”며 “카카오브레인은 기억을 왜곡시키지 않고 팩트를 잘 기억하는 지, 모델 사이즈가 커짐에 따라 발생하는 딜레이를 줄이고 리얼 타임으로 사용할 수 있는지에 집중하려고 한다”고 설명했다.

넥스트 이미지셋 프로젝트 진행 상황과 관련해서는 “현재 글로벌 파트너사들과 이야기하고 있고 글로벌에서 구글 등 연구를 리딩하는 곳과 협업을 논의 중”이라며 “국내에서도 다른 대기업들과 논의가 진행되고 있다”고 했다. 

컨퍼런스를 통해 언어 모델과 이미지 모델을 섞은 사례들을 만들어내고 싶다는 목표를 밝힌 것과 관련해서는 “우리의 전략 포인트이자 내년 카카오브레인의 주요 목표”라며 “없던 기술이 생기면 생각조차 하지 못한 방향으로 비즈니스로 풀어낼 수 있어야 한다고 본다”고 강조했다.

카카오브레인의 AI 기술을 기반으로 내년에 가장 주력할 사업 분야는 단연 헬스케어를 꼽는 분위기다. 이를 위해 현재 카카오의 헬스케어 CIC(사내독립기업) 등 공동체와의 협력 의지를 거듭 드러냈다. 김 대표는 “헬스케어 CIC와 겹치는 부분이 있고 그쪽에서 도움을 받을 것들도 있어서 협력지점을 논의 중”이라며 “협력안이 나온 것은 아니지만 내년에는 헬스케어 사업을 진행하면서 협력적으로 진행할 것 같다”고 말했다.

갤럭스와의 협력에 대해서는 “신약 개발 프로세스에서 질병 자체를 짚어나간다기보다 일반화된 프로세스를 AI를 통해 만드는 것으로 이해해달라”며 “구체적인 범위는 갤럭스와 정하고 있고 나오는 대로 공유하겠다”고 밝혔다.

헬스케어 사업 분야에서 카카오 공동체간 협력 계획에 대해서는 “투자나 공동연구는 내년에 적극적으로 할 가능성 높다”며 “휴먼스케이프 등 헬스케어 CIC와 연결되는 부분일텐데 아직은 구체적인 계획은 없지만 헬스케어 CIC의 사업 가능성이 구체화되면 나올 수 있는 부분이라고 본다”고 했다. 

다만 교육 분야 사업에 대해 김 대표는 “교육 분야는 고민을 하고 있고 내부 아이디어나 방향성을 공개할 단계는 아니다”라며 “오랫동안 변화가 없었던 분야이기 때문에 혁신적으로 다가갈 수 있지 않을까 생각한다”고 답했다.

이어 “교육과 관련한 사업 구상은 조금 더 준비가 되면 말씀드리겠다”며 “헬스케어 사업 관련해서도 단백질 구조 예측 연구 외에도 다른 프로젝트들이 있어 준비되는 대로 공유하겠다”고 덧붙였다. 

카카오브레인의 AI 기술을 접목할 분야로 헬스케어, 교육 등을 지목한 것과 관련해 김 대표는 “여러 이유 중 하나는 디지털휴먼을 완성해나가는 측면”이라며 “사람이 해야하는 역할을 대체하는데 고부가가치를 둘 수 있는 영역이 무엇인가 한다면 헬스케어와 교육이기 때문”이라고 강조했다. 

이와 함께 AI 컨택트 센터 등 카카오브레인의 성과를 카카오 공동체 내 적용 사례도 이른 시일 내 공개한다는 방침이다. 김 대표는 “공동체에는 속도감 있게 적용할 수 있을 것 같다. AI 컨택트 센터가 주요한 부분”이라며 “주요 고객들의 사안을 빠르고 정확하게 처리한다는 점에서 카카오뱅크와 MOU를 맺어 공동 연구하며 중요하게 보고 있다”고 말했다.

김 대표는 “카카오브레인은 디지털휴먼에 계속해서 다가가는 것 같다. 접근성이 떨어지고 베네핏이 높은 분야가 헬스케어와 교육이라고 본다”며 “카카오브레인이 디지털휴먼에 다가감과 동시에 헬스케어, 교육뿐만 아니라 여러 분야 수십개, 수백개에서 혁신을 일으키는 회사로 봐달라”고 말했다. 

관련기사

저작권자 © 시사위크 무단전재 및 재배포 금지
이 기사를 공유합니다