베일 벗은 ‘하이퍼클로바X’, “챗GPT보다 똑똑하다”

가상 시뮬레이션 결과, 챗GPT와의 대결 승률 75%
쇼핑·비즈니스·기업 등 다분야 활용 기대… 검색 서비스는 9월 공개

24일 팀네이버 컨퍼런스 ‘DAN 23’에서 기조 연설을 진행하는 최수연 네이버 대표./ 네이버

시사위크=박설민 기자 ‘챗GPT’와 ‘미드저니’로 시작된 ‘생성형 인공지능(Generative AI)’ 열풍이 세계IT업계로 빠르게 뻗어나가고 있다. 글로벌 시장조사기관 ‘스태티스타(Statista)’에 따르면 생성형 AI산업은 연간 24.4%의 성장률을 보이며 오는 2030년 2,070억달러(약 273조3,435억원) 규모에 이를 전망이다.

이 같은 세계적 흐름에 맞춰, 국내 AI기술을 대표하는 기업 ‘네이버’가 생성형 AI의 기반이 되는 초거대 AI모델을 새롭게 공개했다. 네이버는 24일 생성형 AI를 중심으로 한 팀네이버의 기술 방향성과 사업 전략을 공유하는 컨퍼런스 ‘DAN 23’을 개최했다. 이날 컨퍼런스에서 네이버는 최신 초거대 AI모델 ‘하이퍼클로바X’를 소개했다.

◇ GPT-3.5를 뛰어넘는 매개변수… “챗GPT와의 대결 승률 75%”

네이버는 지난 2013년부터 AI모델 연구를 진행해왔다. 2015년부터는 국내 대표 AI연구자 중 하나인 하정우 네이버 클라우드 AI이노베이션센터장이 합류해 연구에 가속도가 붙었다. 이후 2021년 5월, 초거대 AI모델 ‘하이퍼클로바(HyperCLOVA)’가 세상에 모습을 드러냈다. 그리고 약 2년이 지난 현재, 한층 더 업그레이드된 ‘하이퍼클로바X’가 탄생했다.

그렇다면 하이퍼클로바X는 얼마나 우수한 성능을 가진 초거대AI모델일까. 일단 단순 수치만으로 하이퍼클로바X의 성능을 파악하긴 쉽지 않다. 네이버가 하이퍼클로바X의 파라미터(parameter, 매개변수)를 공개하지 않아서다. 매개변수는 입력된 데이터에서 원하는 출력값을 얻기 위해 AI가 찾아내야 하는 변수다. 이 수치가 높을수록 우수한 AI모델이라고 평가받는다.

대신 이전 모델인 하이퍼클로바의 성능지표를 살펴보면 대략적인 하이퍼클로바X의 성능을 가늠해볼 수 있다. 지난 2021년 네이버가 공개한 바에 따르면 하이퍼클로바의 매개변수는 2,040억개다. 반면 오픈AI가 개발한 ‘챗GPT’의 기반이 된 초거대 AI ‘GPT-3.5’의 매개변수는 1,750억개다. 따라서 네이버의 하이퍼클로바X는 챗GPT에 적용된 초거대AI보다 확실히 성능면에서 우위에 있다고 볼 수 있는 셈이다.

성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄도 “초거대 규모의 언어모델(LLM)의 성능을 어떤 하나의 수치로 비교하는 것은 어려운 일”이라면서도 “내부적으로 저희 모델과 GPT-3.5의 시뮬레이션을 진행해본 결과 75%의 높은 승률을 기록했다”고 말했다.

하이퍼클로바X는 한국어 데이터를 대량으로 학습했다는 장점도 있다. 이는 영어 중심의 챗GPT나 구글의 ‘바드’와 달리, 한국 시장에서 유리한 고지에 설 수 있음을 의미한다. 네이버에 따르면 하이퍼클로바의 경우 GPT-3보다 한국어 데이터를 약 6,500배 이상 학습한 것으로 알려졌다. 이는 전 세계에서 가장 거대한 한국어 기반 초거대 AI 언어모델이다.

성낙호 총괄은 “글로벌 기업같은 경우, 전 세계를 타겟으로 사업을 진행해야 하기 때문에 오히려 각 국가별 시장에선 경쟁력이 약화될 가능성도 있다”며 “저희는 생성형 AI에서도 로컬라이즈된 사업 전략이 필요하다고 생각했고, 한국 시장에 특화된 모델을 만들고 경량화를 진행하고 있다”고 설명했다.

아울러 네이버는 단일 기업으로는 아시아 최대 규모인 60만 유닛 이상의 서버를 수용할 수 있는 하이퍼스케일 데이터센터 '각 세종'을 오는 11월 오픈한다. 각 세종은 초대규모AI의 브레인센터 역할을 수행할 예정이다.

실제 클로바X를 사용한 결과. 여행지 및 전문용어에 대한 답변은 우수하게 했으나, 복잡한 학술 연구 분야에 대해선 아직 미흡한 점이 있다./ 박설민 기자

◇ 여행지·전문용어 답변도 척척… 고도의 학술 분야는 아직 미흡

하이퍼클로바X의 성능은 ‘클로바X’로 직접 체감할 수 있었다. 클로바X는 이날 행사 이후, 오후 4시부터 네이버가 공개한 대화형 AI서비스다. 하이퍼클로바X를 기반으로 제작돼 창작, 요약, 추론, 번역, 코딩 등 다양한 분야 답변 제공이 가능하다.

실제로 기자가 클로바X에 ‘요즘 뜨는 미국 여행지는 어디가 있니?’라고 질문하자, 클로바X는 샌프란스시코 소살리토섬, 그랜드캐니언 등 미국 내 주요 관광 명소들을 자연스럽게 읊었다. 뿐만 아니라 세부적인 설명도 자세히 해줘, 여행지를 고를 때 유용할 것으로 기대됐다.

단순 여행지뿐만 아니라 어려운 전문용어들에 대한 설명도 막힘없이 해냈다. 영화 촬영 기법 중 하나인 ‘핸드헬드기법’에 대해 묻자, “카메라를 어깨에 들쳐메거나 휴대용 카메라로 촬영하는 기법으로, 화면이 수시로 흔들리기 때문에 산만한 느낌과 현장감을 높여줍니다. 이에 호러영화에 주로 사용됩니다”라고 정확한 개념을 답했다.

다만 아직까지 고도의 학술 연구 분야에 대해선 한계가 있는 듯했다. ‘운석 충돌을 막을 수 있는 인공지능 관련 연구 성과를 알려줘’라는 질문에 “이에 대해 정확한 정보를 제공하긴 어려운 상황입니다. 더 많은 조사를 진행해 정확한 정보를 찾아드릴 수 있도록 최선을 다하겠습니다”라고 답했다.

물론 경쟁자인 챗GPT도 학술 연구 분야에 대해선 제대로 답하지 못한다. 클로바X에 했던 것과 같은 질문을 하자, 실제로는 존재하지 않는 여러 편의 가짜 운석 관련 논문을 답했다. 이는 AI가 정보를 처리하는 과정에서 발생하는 오류인 ‘환각 현상(Hallucination)’ 때문이다. 즉, 클로바X는 답을 못하는 대신 환각 현상 발생 확률을 낮춘 것으로 보인다.

‘뉴로클라우드 포 하이퍼클로바X(Neurocloud for HyperCLOVA X)’를 소개하는 곽용재 네이버 클라우드 CTO./ 박설민 기자

◇ 쇼핑·비즈니스·기업 등 다분야 활용 기대… 검색서비스 적용은 9월부터

그렇다면 이처럼 우수한 성능을 보유한 하이퍼클로바X는 실제 어떤 분야에 적용될까. 먼저 네이버는 클로바X를 네이버쇼핑, 여행과의 연계한다는 방침이다. 이를 통해 고도화된 상품 및 여행 장소 추천 능력으로 이용자들에게 다양한 정보를 제공한다. 또한 네이버는 향후 자연스러운 대화를 통해 다른 외부 서비스들과의 호출이 가능하도록 스킬 시스템을 확장해나갈 계획이다.

네이버는 ‘프로젝트 커넥트X (Project CONNECT X)’도 공개했다. 프로젝트 커넥트X는 하이퍼클로바X를 기반으로 제작된 기업용 비즈니스 플랫폼이다. 디자인, 코딩 등 기업 내 전문 업무 분야 수행을 돕는 보조 프로그램이라고 볼 수 있다. 이용자들은 자료 탐색 및 문서 작성, 일정 조율 등 다양한 업무 분야의 효율을 극대화시킬 수 있다. 심지어 투자제안서 등 고난이도 문서작업도 문제없이 척척해낼 수 있다.

하이퍼클로바X는 기업 전용 생성형 AI 솔루션에도 적용 가능하다. 네이버의 자회사 네이버클라우드는 ‘뉴로클라우드 포 하이퍼클로바X(Neurocloud for HyperCLOVA X)’를 개발했다. 이 기술은 강력한 보안과 기업 자체적 생성형 AI 구축을 원하는 기업 고객을 위한 완전 관리형 하이브리드 클라우드 솔루션이다. 고객사가 데이터센터 내부에 직접 설치하는 것이 가능하다. 여기에 그래픽처리장치(GPU)클러스터를 결합하면 하이퍼클로바X모델과 학습, 운영도구들을 패키지 형태로 제공한다. 금융, 의료, 법률 등 다양한 산업 분야에 적용 가능한 ‘클로바 스튜디오’의 베타서비스도 공개됐다.

아울러 네이버는 하이퍼클로바X 기반의 새로운 검색 서비스 ‘큐(CUE):’도 선보일 계획이다. 큐:는 질문의 의도를 이해할 수 있는 AI기반 검색엔진이다. 여러 의미가 포함된 복잡하고 긴 질문을 하이퍼클로바X가 분석한 후, 답변 생성에 필요한 신뢰도 높은 최신 정보를 활용, 입체적인 검색 결과를 제공해줄 수 있다. 큐:는 오는 9월 대중들에게 공개될 예정이며, 11월 네이버에 순차 적용된다.

큐: 개발 총괄을 맡은 김용범 네이버서치 US AI 기술 총괄은 “큐:에는 질문 이해, 출처 수집, 사실성 일치 확인의 3단계 기술이 적용돼, 생성형 AI서비스가 갖는 한계점인 환각 현상을 최소화했다”며 “내부 테스트 결과, 큐:의 환각 현상은 72% 정도 감소했다”고 설명했다.

최수현 네이버 대표는 “그동안 네이버는 AI기반의 추천기술들을 다양한 영역에 적용하며 기술을 고도화하고, 사용성을 강화해나가고 있다”며 “수십 년간 경험한 사용자에 대한 이해, 서비스 운영 노하우, 기술 역량 등은 모두 현재 생성형 AI의 백본모델인 하이퍼클로바X의 경쟁력을 강력하게 뒷받침하는 밑거름이 되고 있다”고 말했다.

이어 “생성형AI와 이를 기반한 다양한 기술 프로덕트들의 중심에는 사용자, 판매자, 창작자의 경쟁력 향상에 있다”며 “네이버의 경쟁력은 다양한 서비스와 파트너들이 서로 연결돼 성장을 이끌고, 이는 다시 플랫폼의 성장으로 이어지는 ‘위닝루프’ 구조에 있으며 하이퍼클로바X는 이러한 위닝루프를 더욱 가속화할 것”이라고 기대했다.

상단영역

본문영역