KT는 18일 AI원팀 참여기관인 한국전자통신연구원, KAIST, 한양대와 함께 ‘초거대 AI 모델’을 개발하기 위한 공동 연구 협약을 체결했다고 밝혔다. 사진은 협약식에 참여한 AI 원팀의 KT, ETRI, KAIST, 한양대학교 관계자들의 모습./ 사진=KT

시사위크=박설민 기자  인공지능 1등 대한민국을 목표로 지난해 출범한 KT ‘AI 원팀’이 이번엔 다자간 공동연구를 통해 초거대 AI 모델 개발에 나선다. 

KT는 18일 AI 원팀 참여기관인 한국전자통신연구원(ETRI), 한국과KAIST, 한양대와 함께 ‘초거대 AI 모델’을 개발하기 위한 공동 연구 협약을 체결했다고 밝혔다. 이번 프로젝트를 통해 자연어 처리 분야를 대표하는 국내 최고 수준의 연구진들이 포함된 AI 원팀은 KT의 오랜 사업 경험과 풍부한 데이터를 활용해 초거대 AI 모델을 개발한다는 계획이다.

초거대 AI란, 대용량의 연산이 가능한 인프라를 바탕으로 대규모 데이터를 학습해 사람처럼 스스로 사고할 수 있도록 설계된 인공지능을 의미한다. 과거 구글에서 개발한 알파고가 바둑이라는 특정 분야’에 특화된 AI라면, 초거대 AI는 마치 인간의 뇌와 유사하게 종합적인 부문을 학습해 판단할 수 있는 AI라 볼 수 있다. 때문에 인간이 여러 직종에 종사할 수 있는 것처럼 초거대 AI를 활용하면 다양한 서비스, 산업 분야 등에서 AI가 활약할 가능성이 매우 높아질 것으로 기대 받는다. 

하지만 AI 언어모델은 매우 빠르게 발전하고 있으며, 데이터 정제, 학습 알고리즘, 분산/병렬학습, 경량화, 응용모델 발굴 등 다양한 분야의 연구가 필요하기 때문에 단일 기업이 단독으로 추진하기는 어렵다. 또한 학교와 연구기관에서는 AI 연구를 위한 대규모의 GPU 인프라에 접근하는 것이 쉽지 않다.

이에 대한민국을 대표하는 AI 얼라이언스인 AI 원팀은 KT와 같은 기업의 대규모 투자를 통해 GPU 인프라를 구축하고, 학교와 연구기관은 최신의 연구 동향을 반영한 기술을 제공하는 이상적인 산·학·연 협력 모델을 적용한다는 목표다.
 
이번 프로젝트에서 KT는 다른 참여기관들과 힘을 모아 대규모 GPU 인프라 구축, 데이터 수집/분석, 모델 학습, 응용태스크 적용 등 R&D 및 상용화 관련 업무를 총괄적으로 수행하게 된다. 카이스트(KAIST)의 경우엔 머신러닝 알고리즘 최적화 및 어플리케이션 파트를 맡게 되며, 한양대학교는 데이터 정제/필터링 알고리즘 개발, 분산/병렬 알고리즘 및 모델 최적화 분야를 맡는다. 한국전자통신연구원(ETRI)은 대형 모델학습 및 모델개발 분야에 참여하게 된다.

AI 원팀은 올해 말까지 1차로 초거대 AI의 학습을 완료하고 내년 상반기 내 초거대 AI모델을 상용화할 계획이다. 대규모 AI 연산 인프라 구축 및 향후 2,000억 파라미터(매개변수) 이상의 모델까지 가능하도록 인프라 규모 확대도 점진적으로 추진할 예정이다.

또한  학습데이터 필터링 강화, 데이터 간 균형 조정 등을 통해 AI의 편향성을 우선 제거하는 한편, 유해 콘텐츠(Toxic Content) 필터링 기술 등 다양한 딥러닝 기반 탐지 기술을 적극 활용해 AI 윤리 이슈도 사전에 차단한다는 계획이다.

특히 이번에 개발하는 초거대 언어모델은 즉시 상용화가 가능한 ‘과제 지향적(Task-Oriented)’ 형태로 설계된다. 이에 초거대 언어모델을 통해 향상된 STT(음성인식), TTS(음성합성), TA(텍스트 분석), 대화 등 요소기술은 먼저 KT 기가지니와 AICC 서비스 고도화를 위해 활용되며, 나아가 △제조 △금융 △물류 △유통 등 AI 원팀 참여기업들의 다양한 사업 분야에 적용될 것으로 보인다.

아울러 AI 원팀은 영상·로봇 등의 복합인지, 이미지 기반 해석, 휴머니스틱 AI(인간중심 AI) 등에서 초거대 AI 모델로 영역을 확장해 나갈 예정이다. 이번 연구로 개발되는 초거대 AI 모델은 ‘AI 1등 대한민국’이라는 AI 원팀의 취지에 따라 국내외 많은 기업들과 학교, 연구기관들이 AI 원팀의 초거대 모델을 활용해 한국어 언어지능에 대한 손쉽게 접근하고, 이를 다양한 산업분야에 활용하도록 지원한다는 목표다.

KT 홍경표 융합기술원장은 “AI 원팀 소속기관이 보유한 세계적 수준의 기술과 경험을 모두 결집한 초거대 AI모델 개발은 차세대 AI 핵심 원천기술 확보라는 측면에서 각별한 의미를 가진다”며 “이번 프로젝트를 통해 대한민국의 국가 AI 산업 경쟁력 강화에 크게 기여하고, 산업전반의 디지털 트랜스포메이션(Digital Transformation, 디지털 전환)과 고객 라이프스타일 변화를 선도하겠다”고 밝혔다.

저작권자 © 시사위크 무단전재 및 재배포 금지
이 기사를 공유합니다