AI의 음성기술들 중 사람의 목소리를 흉내 내는 ‘음성 복제 기술’은 AI산업의 뜨거운 감자로 부상하고 있다. 특히 22일 아마존에서 공개한 AI음성 비서 ‘알렉사’의 새로운 음성 복제 기술은 고인의 목소리도 흉내낼 수 있다./ 그래픽=박설민 기자

시사위크=박설민 기자  인공지능(AI) 기술이 날로 발전하고 있는 가운데 가장 대중적으로 많이 사용되는 기술은 ‘음성 AI’ 기술이다. AI음성기술은 현재 AI스피커부터 디지털 휴먼까지 다양한 기술 산업 분야에서 이용되고 있다.

이때 AI의 음성기술들 중 사람의 목소리를 흉내 내는 ‘음성 복제 기술’은 AI산업의 뜨거운 감자로 부상하고 있다. 교육, 심리 치료 등 긍정적인 방향으로 사용될 수 있다는 기대감과 범죄에 악용되거나 인권을 침해할 수 있다는 우려가 충돌하면서다.

◇ 삶과 죽음의 경계를 넘어… AI, 고인의 목소리를 재현하다

이 같은 논란은 지난 22일 미국 네바다주 라스베이거스에 열린 아마존 리마스(Re:Mars) 컨퍼런스에서 AI음성 비서 ‘알렉사’의 새로운 음성 복제 기능이 공개되면서 더욱 커지고 있다. 알렉사는 미국의 글로벌 IT플랫폼 기업 아마존에서 개발한 AI비서다. 

이날 행사에서 공개된 아마존의 AI비서 알렉사에는 ‘Teachable AI(가르칠 수 있는 AI)’ 시스템이 적용됐다. 1분 정도의 음성 샘플만 있으면 특정 인물의 목소리를 AI가 분석한 후 그대로 재현할 수 있다고 한다. 살아있는 사람뿐만 아니라 이미 세상을 떠난 고인의 목소리도 샘플만 있으면 알렉사가 흉내낼 수 있게된 것이다.

실제로 이날 행사에서 아마존은 알렉사가 특정 인물의 목소리를 모방해 구현할 수 있는 기술을 공개했다. 기술 시연 영상을 살펴보면 한 아이가 알렉사에게 동화책을 읽어달라고 부탁하자 알렉사는 할머니의 목소리로 책을 읽어준다. 이때 알렉사가 모방한 목소리는 옛날에 세상을 떠난 고인의 목소리였다.

22일 미국 네바다주 라스베이거스에 열린 아마존 리마스(Re:Mars) 컨퍼런스에서 로히트 프라사드 사장이  AI음성 비서 ‘알렉사’의 새로운 음성 모방 기능을 설명하는 모습./ 아마존 컨퍼런스 영상 캡처

알렉사의 음성 모방 능력을 본 국내외 누리꾼들은 대다수가 호평을 쏟아내고 있다. 특히 실제로 사랑하는 가족들을 떠나보낸 이들의 경우, 알렉사를 통해 그리운 이를 다시 만나는 기분을 느낄 수 있을 것 같아 기대된다는 반응이다.

기술 시연을 진행한 아마존의 로히트 프라사드 사장도 “우리는 코로나19 팬데믹으로 많은 사랑하는 사람을 잃었다”며 “AI가 이런 상실의 고통을 없애진 못하곘지만 추억을 오래 남기도록 도와줄 수 있다”고 설명했다.

또한 AI의 목소리 모방 기술은 미디어·콘텐츠 분야에서도 활용도가 매우 높을 것으로 기대받고 있다. 세상을 떠난 유명 영화배우나 가수들의 목소리를 다시 복원하거나, 디지털 휴먼 등 가상 인간에 인조 목소리를 덧입혀 실제 인간과 유사한 가상의 배우를 만들 수 있을 것으로 예상되기 때문이다.

실제로 지난 22일 개봉해 세계적인 인기를 끌고 있는 영화 ‘탑건-매버릭’에서는 등장인물인 아이스맨의 목소리를 AI가 대신한 것으로 알려졌다. 과거 탑건 1편에서 아이스맨 역을 맡은 영화배우 발 킬머가 후두암 수술 후유증으로 목소리를 낼 수 없는 상황이었기 때문이다. 제작진 측에 따르면 과거 발 킬머가 출연했던 영화들의 영상들을 통해 약 40여개의 목소리 버전을 AI가 만들어낸 것으로 알려졌다.

AI의 음성 복제 기술 시장 전망은 특히 미디어 콘텐츠 시장에서 밝다. 세상을 떠난 유명 영화배우나 가수들의 목소리를 다시 복원하거나, 디지털 휴먼 등 가상 인간에 인조 목소리를 덧입혀 실제 인간과 유사한 가상의 배우를 만들 수 있을 것으로 예상되기 때문이다./ 그래픽=박설민 기자

◇ AI 음성 복제, 시장 전망 우수하지만… 전문가들, “악용 가능성 우려”

AI의 음성 복제 기술 시장의 전망 역시 밝은 추세다. 글로벌 시장조사기관 리서치앤마켓(Research and markets)에서 22일 발표한 보고서에 따르면 전 세계 AI기반 음성 복제 시장은 2021년 기준 10억3,820만 달러 규모에서 연평균 성장률(CAGR) 30.7%를 보이며 오는 2030년 114억6,220만달러에 이를 것으로 전망된다.

리서치앤마켓은 “음성 복제 AI기술은 챗봇 및 어시스턴트, 접근성, 디지털 게임 및 대화형 학습에 사용되는 필수 컴퓨터 기술”이라며 “통신, 은행, BFSI, 미디어 및 엔터테인먼트, 교육, 국방, 에너지 및 유틸리티 부문에서 새로운 음성 기술에 대한 수요 증가는 시장 성장을 향상시킬 것”이라고 전망했다.

다만, AI분야 전문가들은 AI의 음성 복제 기술의 시장 가능성에 대해 인정하면서도 동시에 부작용 역시 클 것으로 예상하고 있다. 고인의 목소리를 함부로 복제할 경우, 이는 윤리적·도덕적 관점에서 논란이 될 수 있다는 것이다. 

글로벌 시장조사기관 ABI Research의 Micheal Inouye 연구원도 CNN과의 인터뷰에서 “AI가 목소리를 모방할 경우 사랑하는 사람의 기억과 잘 일치하지 않는 경우와 같은 몇 가지 위험이 분명히 있다”며 “어떤 사람들에게는 이것을 소름 끼치거나 끔찍하다고 생각할 것”이라고 우려를 표했다.

AI분야 전문가들은 AI의 음성 복제 기술의 시장 가능성에 대해 인정하면서도 동시에 부작용 역시 클 것으로 예상하고 있다. 고인의 목소리를 함부로 복제할 경우, 이는 윤리적·도덕적 관점뿐만 아니라 범죄 등에 악용될 가능성이 있다는 것이다./ Gettyimagesbank

뿐만 아니라 저작권, 인권 침해, 범죄 악용 등 법적 문제로 이어질 가능성이 있다는 우려도 나온다. 목소리 ‘주인’의 동의 없이도 인터넷의 동영상 등을 기반으로 누구나 AI를 활용해 목소리를 복제하고, 이를 악용할 가능성이 높다는 것이다. 지난 2019년 3월 영국의 한 에너지 기업 CEO는 AI로 복제한 모기업 대표 목소리에 속아 해커 집단에게 22만유로(한화 약 2억9,000만원)을 송부하기도 했다.

한국저작권보호원 김한솔 선임 연구원은 ‘신규 저작권 침해유형 및 이슈-딥페이크와 저작권 침해(2021)’ 보고서에서 “AI기반 딥페이크가  범죄에 악용될 경우, 진실과 거짓을 구분하는 데에 큰 어려움이 생기게 되고, 이는 곧 커다란 사회적 혼란으로 이어질 것”이라며 “이런 악용 사례가 지속해서 증가한다면 진보된 기술은 오히려 우리에게 큰 혼란을 일으키는 양날의 검이 될 것”이라고 우려하기도 했다.

국제인공지능&윤리협회(IAAE) 전창배 이사장은 <시사위크>와의 통화에서 “AI 음성 복제를 위해서는 목소리의 주인에게 동의를 받는 것이 맞다”며 “동의를 받지 않을 경우 윤리적인 문제를 넘어 법적 문제까지 이어지게 된다”고 지적했다.

이어 “특히 고인의 경우에는 살아생전에 동의를 명확히 받지 않은 경우 이를 AI로 모방하는 것은 옳지 않다고 생각한다”며 “유족의 동의를 받는 경우도 있지만, 이는 본인의 의견을 물은 것이라 보긴 어렵다. 본인의 의사와 전혀 다를 수도 있다는 문제가 있다”고 전했다.

저작권자 © 시사위크 무단전재 및 재배포 금지
이 기사를 공유합니다