인공지능(AI) 기반의 번역 기술은 단순한 자동 번역기술을 넘어 스스로 학습하고 오답을 수정하는 기술로 진화하고 있어 다양한 분야에서 응용이 가능할 것으로 기대가 커지고 있다./ 그래픽=박설민 기자

시사위크=박설민 기자  하늘에 닿을 만큼 높은 ‘바벨탑’을 짓던 인간들의 오만함에 분노한 신이 벌을 내렸다는 이야기는 기독교 신자가 아니라도 들어본 사람들이 많을 것이다. 인간의 언어를 여러 개로 흩어놔 의사소통이 어렵게 만들었다는 성경의 이야기 말이다.

그런데 최근 언어번역기술의 성능 역시 급속도로 발전하면서 이런 신의 벌이 ‘기한’이 다한 것 아니냐는 우스갯소리가 나오고 있다. 특히 인공지능(AI) 기반의 번역 기술은 단순한 자동 번역기술을 넘어 스스로 학습하고 오답을 수정하는 기술로 진화하고 있어 다양한 분야에서 응용이 가능할 것으로 기대가 커지고 있다.

◇ AI, ‘인공 신경망 번역 기술’로 인간의 뇌처럼 번역한다

사실 인간의 능력이 아닌 ‘기계’를 활용한 자동 번역 기술의 역사는 제법 오래됐다. 지난 1940년대 시작된 냉전 시대에 미국과 소련이 상대국의 기밀 문서를 빠르게 해독하고자 기계 번역 기술 개발을 시작한 것이 시초라고 볼 수 있다.

이후 1951년 미국립과학재단(NSF)의 이사에 기계 번역 기술을 연구하던 워런 웨이버 (Warren Weaver)가 이사장이 된 후 워싱턴 대학, 미시건 대학, UC 버클리 등 주요 대학이 기계를 이용한 번역 기술 개발을 진행했다. 하지만 당시 기계 번역 기술은 일일이 사람이 모든 규칙을 만들어 입력해야 했기 때문에 수많은 언어를 번역하는 것을 구현하는 것은 매우 힘든 일이었다.

이때 기계를 활용한 언어 번역 기술에 새로운 장을 연 것이 바로 ‘인공지능(AI)’였다. 기존의 일반 컴퓨터나 번역기로는 불가능했던 수많은 언어 빅데이터를 AI는 매우 빠르게 학습하는 것이 가능했다. 이를 기반으로 만들어진 번역 기술이 바로 AI기반의 ‘인공 신경망 기계 번역’이다.

AI기반의 ‘인공 신경망 기계 번역’ 기술은 ‘사람의 뇌’처럼 AI가 번역을 하는 기술이다. 러닝을 통해 빅데이터를 AI가 스스로 학습해 번역을 수행해 데이터가 점점 늘어나 정확도는 시간이 지날수록 더욱 높아진다./ 그래픽=박설민 기자

‘인공 신경망 기계 번역(NMT·Neural Machine Translation)’의 원리는 간단히 말해 ‘사람의 뇌’처럼 AI가 번역을 하는 기술이라고 말할 수 있다. 사람은 눈이나 촉각 등 감각 기관을 통해 글자에 대한 정보를 받아들인다. 이 정보를 뇌에서 문맥, 단어의 뜻 등을 처리해 문장의 뜻을 이해하고 번역한다.

이때 NMT가 적용된 AI는 마치 사람의 뇌처럼 사용자가 번역기에 어떤 문장을 입력하면 맥락을 파악한 후, 이를 단어, 구문, 어순 등의 정보가 담겨 있는 벡터(좌표 값)로 전환하여 번역을 한다. 때문에 기존의 통계 기반 번역기와 달리 문맥을 파악할 수 있어 보다 자연스럽고 정확한 번역이 가능하다. 또한 딥러닝을 통해 빅데이터를 AI가 스스로 학습해 번역을 수행해 데이터가 점점 늘어나 정확도는 시간이 지날수록 더욱 높아진다.

이 같은 AI기반 인공 신경망 번역기술의 대표적 예는 바로 우리가 일상생활에서 아주 쉽게 이용하고 있는 ‘구글 번역기’다. 지난 2016년 11월 처음으로 글로벌 IT플랫폼 구글은 인공 신경망 번역 기술이 도입된 구글 번역기를 도입했다. 기존의 단순 통계 기반 구글 번역기보다 훨씬 높은 품질 향상을 보여줬다고 평가된다.

또한 구글 번역기나 아마존 등 글로벌 IT플랫폼 들뿐만 아니라 우리나라 대표 IT플랫폼인 네이버 역시 ‘파파고(Papago)’ 역시 구글 번역기와 마찬가지로 AI기반의 인공 신경망 번역기를 서비스 중이다. 현재 파파고는 매우 우수한 수준의 번역 기술을 보유했다고 평가받는데, 한국어, 영어, 일본어, 중국어 등 13개의 언어를 번역할 수 있다. 또한 텍스트나 음성, 사진 속 문자도 번역할 수 있다.

AI기반 구글 번역기가 적용된 삼성전자 빅스비 비전을 사용해 해외 제품을 번역해본 모습. 아주 정확하진 않지만 영어가 아닌 오스트리아어도 어느 정도 해석할 수 있는 능력을 보여주고 있다./ 박설민 기자

◇ 고유명사·전문용어 오역은 해결 과제

IT분야 전문가들은 높은 정확도와 AI 기반 인공 신경망 번역 기술이 매우 높은 활용 가치가 있다고 평가한다. 글로벌 시대로 불리는 현재, 전 세계인의 왕래가 많아진 만큼, 일상생활에서 사용할 수 있는 AI 기반 번역 기술 시장 성장에 대한 기대감이 매우 크며, 관광산업 등에서도 이용될 가능성이 매우 높다는 것이다.

글로벌 시장조사업체 글로벌마켓인사이츠(Global Market Insights)가 지난해 7월 발표한 보고서에 따르면 AI 번역 기술 시장은 2020년 기준 6억5,000만달러에서 연평균 25%의 성장률을 보이며 오는 2027년 30억달러 규모에 이를 것으로 전망됐다.

김상훈 한국전자통신연구원 책임연구원도 ‘Conversational AI 기반 다국어 자동통역 기술 동향(2021)’ 보고서에서 “국가 간 인적, 물적 교류가 활발해지면서 언어 간 장벽을 허무는 자동통역 기술의 확보는 국가 글로벌 경쟁력과 직결된다”며 “글로벌화의 가속으로 언어장벽 해소가 각 산업 분야에서 혁신적인 변화를 가져올 정도로 파급효과가 기대돼 대화형 AI 기반 다국어 자동통역 기술 확보가 무엇보다도 시급하다”고 전망했다.

IT분야 전문가들은 AI 번역 기술의 발전은 곧, AI음성비서 기술의 발전으로 이어질 것이라고 내다본다. 실제로 글로벌 IT플랫폼 아마존(Amazon)의 경우, AI비서인 아마존 알렉사에 영어를 비롯한 총 48개 언어를 통역해주는 기능을 제공하고 있다./ 아마존 홈페이지 캡쳐

또한 IT분야 전문가들은 AI 번역 기술의 발전은 곧, AI음성비서 기술의 발전으로 이어질 것이라고 예상하고 있다. 스마트폰의 보급과 AI스피커의 대중화로 AI음성비서 시장이 빠르게 성장함에 따라 전 세계에 분포한 이용자들이 사용하는 각각의 언어에 맞춘 대화형 AI서비스가 필요하기 때문이다.

글로벌마켓인사이츠는 “AI의 출현은 여러 산업 부문에 혁명을 일으키며 디지털 혁신과 자연 환경에 보다 통합된 새로운 비즈니스 모델을 가져왔다”며 “아마존의 알렉사, 구글 홈, 코타나, 애플 시리(Siri) 등 AI비서들은 기계 번역 소프트웨어를 사용하여 언어를 이해하고 사용자에게 의미 있는 피드백을 제공한다”고 전했다.

실제로 전 세계 AI음성 스피커 시장을 선도하고 있는 글로벌 IT플랫폼 아마존(Amazon)의 경우, AI비서인 아마존 알렉사에 영어를 비롯한 총 48개 언어를 통역해주는 기능을 제공하고 있다. 

특히 아마존의 AI번역기인 ‘Amazon Translate’의 경우엔 55개 언어 및 변형 언어 간의 통번역 기능도 제공되는데, 글로벌 번역전문업체 인텐토(Intento)는 14개 언어 쌍, 16개 산업 부문 및 8개 콘텐츠 유형에서 Amazon Translate를 2020년 최고의 기계번역 공급자로 선정한 바 있다,

다만 아직까지 AI번역기술이 완벽한 수준은 아니며, 이에 대한 개선사항도 많다는 것이 전문가들의 의견이다. 특히 해외 고유명사나 논문 등에서 사용하는 전문 용어들에 대한 오역은 아직까지 자주 발생하는 상황이다.

김상훈 한국전자통신연구원 책임연구원은 “끊김 없는 대화형 AI 통역이 되기 위해서는 스마트폰 화면을 터치 후 말해야 하는 인터페이스를 개선해 사용성을 대폭 높여야 한다”며 “해외지명, 이름 등 외래어로 된 고유명사 인식이 잘 안되는 문제 등 실용적인 측면에서도 개선해야 할 부분이 많다”고 지적했다.

이어 “자동통역 기술을 둘러싸고 구글, MS, IBM 등 세계 IT 대표기업들의 기술개발 경쟁이 치열하게 전개되고 있는 가운데, 이를 통한 원천기술 확보와 기술선점을 토대로 세계 시장을 주도할 수 있기를 기대해 본다”고 전했다.
 

저작권자 © 시사위크 무단전재 및 재배포 금지
이 기사를 공유합니다