다수의 로봇 연구자들이 인간을 닮은 휴머노이드 로봇 육체에 AI라는 ‘영혼’을 주입하려는 시도가 늘고 있다. 인간의 작업 현장에 최적화된 휴머노이드 로봇의 성능을 AI로 극대화시키기 위한 시도다./ 그래픽=박설민 기자
다수의 로봇 연구자들이 인간을 닮은 휴머노이드 로봇 육체에 AI라는 ‘영혼’을 주입하려는 시도가 늘고 있다. 인간의 작업 현장에 최적화된 휴머노이드 로봇의 성능을 AI로 극대화시키기 위한 시도다./ 그래픽=박설민 기자

시사위크|일산=박설민 기자 11일 오전 일산 킨텍스에서 열린 ‘로보월드 2023’ 현장. 수많은 인파로 북적이는 전시장 한편, 한 전시 부스에서 경쾌한 드럼 소리와 노랫소리가 울려퍼졌다. 연주를 시작한 것은 휴머노이드 로봇 연주자. 두손의 스틱을 꼭 쥔 채 한 치의 오차도 없는 드럼 연주를 진행했다. 드럼을 치는 강약조절까지 완벽해 마치 인간 드러머가 연주를 하는 것이 아닌가 하는 착각을 불러일으켰다.

◇ 드럼로봇 ‘모펫’, 음악 듣고 AI로 악보 재구성

전시장 관람객들을 매혹시킨 이 로봇의 이름은 ‘모펫’. 임세혁 한국과학기술연구원(KIST) 책임연구원팀이 개발한 고속 드럼연주 휴머노이드 로봇이다. 일반적으로 정해진 악보를 그대로 따라가는 드럼 로봇들과는 다르게, 악보를 분석하고 거기에 맞는 악기 연주를 할 수 있는 것이 특징이다. 사실상 사람 연주자와 동일한 연주 방식인 셈이다.

이처럼 모펫의 ‘똑똑한 연주’가 가능했던 비결은 ‘청음지능’ 기술 덕분이다. 청음지능은 합성곱 신경망(CNN)과 순환신경망(RNN) 기반 AI로, 음악 데이터를 학습하고 그에 맞는 박자로 드럼 연주를 할 수 있도록 해주는 기술이다. 예를 들어 어떤 음악을 모펫이 들으면, 그것이 어떤 악기인지, 무슨 음정인지를 분석한다. 그 정보를 기반으로 악보를 재구성하고, 실제 사람 연주자들의 기교도 학습하는 것이다.

모펫 제작 연구 책임자인 임세혁 KIST 책임연구원은 “음악용 AI기술에는 여러 가지가 있는데, 그중 청음지능은 1단계 표현 지능에 해당하는 기술”이라며 “이 기술이 적용된 로봇은 단순히 악보를 따라가는 것이 아닌, 음악을 듣고 어떤 악기가 어떻게 사용되는지, 연주자가 어떤 기교를 사용해 연주했는지를 학습할 수 있다”고 설명했다.

이어 “앞으로 디지털 문화 콘텐츠, 특히 음악과 관련된 것들은 다양한 방식으로 재생산될 것으로 기대한다”며 “지금처럼 단순히 소리만 낼 수 있는 로봇이나 IT서비스가 아닌, 직접 눈으로 볼 수 있는 공연이 가능한 휴머노이드 로봇을 만들고자 했고, 동작이 크고 멋진 드럼 연주를 선택하게 됐다”고 말했다.

임세혁 한국과학기술연구원(KIST) 책임연구원팀이 개발한 고속 드럼연주 휴머노이드 로봇 '모펫'의 실제 연주 모습./ 박설민 기자
임세혁 한국과학기술연구원(KIST) 책임연구원팀이 개발한 고속 드럼연주 휴머노이드 로봇 '모펫'의 실제 연주 모습./ 박설민 기자

◇ 휴머노이드 로봇으로 변신한 ‘챗GPT’

KIST 전시 부스를 떠나 로보월드 2023 현장을 둘러보자, 또 다른 AI기반 휴머노이드 로봇이 눈길을 끌었다. ‘에이로봇(A.robot)’에서 개발한 ‘제미니(GEMINI)’다. 전시장에 배치된 제미니는 인간과 같은 표정을 지으며 관람객들을 맞이했다. 엄윤설 대표가 2018년 설립한 휴머노이드 로봇 전문 스타트업이다. 현재 기술 분야 CTO는 국내 최고의 로봇 공학자 중 한명인 한재권 한양대 로봇공학과 교수가 맡고 있다.

흥미로운 것은 관람객의 질문에 반응하는 제미니의 능력이었다. 기자가 다가가 인사를 건내자 ‘안녕하세요. 즐거운 로보월드 2023 관람되세요’라고 답한 뒤, 로보월드 2023 행사에 대한 설명도 이어갔다. 뿐만 아니라 ‘라면 끓이는 법을 알려줘’와 같은 일상적 질문에도 ‘적정량의 물이 끓으면 스프와 면을 넣고 익히면 됩니다’라고 정확히 답변했다.

제미니가 이처럼 뛰어난 의사소통능력을 보유할 수 있었던 것도 AI의 힘 덕분이다. 엄윤설 대표의 설명에 따르면 이 기술은 ‘기능 모듈화’다. 휴머노이드 로봇 몸체에 고객이 원하는 다양한 AI기술을 추가하거나 업그레이드 할 수 있는 기술이다. 이번 전시회에 나온 제미니에는 생성형 AI서비스로 잘 알려진 ‘챗GPT’가 연동됐다. 때문에 제미니는 우수한 정확도의 답변을 할 수 있었던 것. 한재권 교수에 따르면 챗GPT를 연동한 휴머노이드 로봇은 국내선 제미니가 최초다.

국내 최초 챗GPT 연동 휴머노이드 로봇 '제미니'의 개발자인 한재권 한양대 교수(좌측)와 엄윤설 에이로봇 대표./ 박설민 기자
국내 최초 챗GPT 연동 휴머노이드 로봇 '제미니'의 개발자인 한재권 한양대 교수(좌측)와 엄윤설 에이로봇 대표./ 박설민 기자

제미니를 더욱 ‘똑똑하게’ 만들어주는 기능으론 ‘휴먼 로봇 인터렉션(HRI)’의 역할도 컸다. HRI는 마주한 사용자와의 상호작용을 하도록 해주는 기능이다. 눈맞춤을 하거나, 제스쳐 자동생성기능을 통해 사용자와 대화하는 동안 자연스러운 경청 동작을 구현한다. 실제로 기자와 문답을 주고받을 때 제미니는 끊임없이 눈을 깜빡이고 웃거나 놀란 표정을 보여줬다. 뿐만 아니라 로봇 손도 수시로 움직여 실제 사람이 대화할 때의 손동작을 모사하기도 했다.

또 다른 AI 휴머노이드 로봇 ‘앨리스’는 지나가는 관람객들에게 사탕 선물을 나눠주고 있었다. 앨리스에는 임베디드 AI시스템이 적용됐다. 이는 로봇 자체에 AI알고리즘이 내장됨을 뜻한다. 이렇게 하면 실시간 AI의 데이터 처리가 가능해, 통신에 의존해야하는 기존 AI로봇보다 안정적인 운용이 가능하다. 앨리스는 지난해와 올해 글로벌 로봇 축구대회 ‘로보컵(RoboCup)’에서 2회 연속 결승에 진출하는 성과를 이뤘다. 내년 대회에서는 반드시 우승하겠다는 것이 엄윤설 대표의 목표라고.

한재권 교수는 “그간 연구자로 휴머노이드 로봇을 오랜 시간 개발해 왔는데, 우리 주변의 삶에서 실제로 쓸 수 있는 것을 만드는 것이 꿈이었다”며 “그 꿈을 이루기 위해 학교 안에서의 연구를 넘어, 실생활에 밀접하게 쓰일 수 있는 로봇을 개발하는 에이로봇에서 일하게 됐다”고 말했다.

AI 휴머노이드 로봇  ‘앨리스’가 관람객들에게 사탕을 나눠주는 모습./ 박설민 기자
AI 휴머노이드 로봇  ‘앨리스’가 관람객들에게 사탕을 나눠주는 모습./ 박설민 기자

◇ 해외선 테슬라 ‘옵티머스’ 선두… “AI, 인간형 로봇 능률 극대화 시킬 것”

국내 연구진뿐만 아니라 해외서도 휴머노이드 로봇에 AI를 접목하는 시도는 끊임없이 이뤄지고 있다. 가장 대표적인 로봇은 2족 보행 로봇 ‘옵티머스’다. 옵티머스는 자율주행 및 전기차 개발 기업으로 잘 알려진 ‘테슬라(Tesla)’에서 개발한 휴머노이드 로봇이다. 지난해 9월 30일 미국 캘리포니아 테슬라 본사에서 개최된 ‘AI데이 2022’행사서 처음 대중들에게 공개됐다.

당시 행사에서 옵티머스의 로봇 자체적 성능은 크게 우수하진 않았다는 평가가 지배적이었다. 하지만 주목된 것은 적용된 AI였다. 테슬라는 전기차에 적용된 ‘심층신경망(DNN)’ 기반 AI자율주행기술이 옵티머스에 그대로 탑재했다. 

여기서 바뀐 것은 AI의 학습데이터. 일반 자율주행용 AI가 주변 보행자 및 다른 자동차 등 도로 상황 등을 학습한다면, 옵티머스의 AI는 계단, 문, 책상 등 주변 사물 상황을 학습한다. 즉, 사람의 생활 속에 들어와서 주위 환경을 학습하는 휴머노이드 로봇이 옵티머스다. 여기에 슈퍼컴퓨터 ‘도조(Dojo)’의 연산 능력을 적용, 매일 50만개의 이동 관련 영상 데이터 학습이 가능하다.

지난달 24일 공개된 테슬라 '옵티머스'의 모습. 물건을 정확히 인식하고 자율적으로 정렬할 수 있는 능력까지 갖췄다고 한다./ 테슬라
지난달 24일 공개된 테슬라 '옵티머스'의 모습. 물건을 정확히 인식하고 자율적으로 정렬할 수 있는 능력까지 갖췄다고 한다./ 테슬라

1년이 지난 현재, 옵티머스의 AI능력은 훨씬 더 향상된 것으로 파악된다. 지난달 24일, 일론 머스크 테슬라 최고경영자는 자신의 ‘엑스(X)’ 계정에 옵티머스의 최신 개발 현황을 공개했다. 테슬라에 따르면 옵티머스는 이제 물건을 정확히 인식하고 자율적으로 정렬할 수 있는 능력까지 갖췄다고 한다. 실제로 공개된 영상에서 옵티머스는 5개의 손가락으로 플라스틱 블록을 색깔별로 상자에 분류했다.

이처럼 최근 다수의 로봇 연구자들이 인간을 닮은 휴머노이드 로봇 육체에 AI라는 ‘영혼’을 주입하려는 시도가 느는 이유는 무엇일까. 전문가들은 대부분의 작업 환경은 ‘인간의 신체구조’에 가장 적합하게 만들어져, 최적의 능률을 보일 수 있는 것은 휴머노이드 로봇이라고 설명한다. 여기에 AI를 기반으로 한 자체 판단력까지 적용된다면 작업 능력을 더할 나위 없이 상승하게 된다.

관련 산업도 빠르게 성장 중이다. 글로벌시장조사기관 ‘마켓앤마켓(Markets and markets)’에 따르면 올해 AI기반 휴머노이드 로봇 시장 규모는 18억달러(약 2조4,154억원). 2028년에는 138억달러(약 18조5,210억원)에 달할 전망이다.

한재권 교수는 “휴머노이드 로봇에 거대 언어모델(LLM)과 같은 초거대AI기술을 연동하는 것은 앞으로 비약적인 휴머노이드 로봇 성능 향상의 발판이 될 수 있다고 생각한다”며 “지금은 AI를 기반으로 대화와 재스처를 따라하는 수준이지만, 향후 기술이 향상되면 서비스나 실제 업무현장에서 높은 작업 효율을 낼 수 있을 것으로 기대한다”고 말했다.

저작권자 © 시사위크 무단전재 및 재배포 금지
이 기사를 공유합니다