지난해 1월 서비스가 중단됐던 인공지능(AI) 챗봇 ‘이루다’가 더욱 향상된 기능을 탑재한 ‘이루다2.0’으로 이용자들에게 돌아올 예정이다. 이에 <시사위크>에서는 이루다2.0이 예전의 오명을 씻고 진짜 ‘AI친구’가 될 가능성이 있는지 직접 체험해 봤다./ 사진=스캐터랩, 박설민 기자

시사위크=박설민 기자  지난해 1월 서비스가 중단됐던 인공지능(AI) 챗봇 ‘이루다’가 더욱 향상된 기능을 탑재한 ‘이루다2.0’으로 이용자들에게 돌아온다. 이루다의 개발사 AI 스타트업 스캐터랩에서 14일 일상 대화형 AI챗봇 ‘이루다2.0’의 오픈 베타 테스트를 3월 17일부터 2단계에 걸쳐 진행한다고 밝혔다.

이루다는 지난 2020년 12월 서비스를 시작하자마자 이용자 수가 32만명을 돌파했고, 일일 사용자 수(DAU)가 21만명에 이를 만큼 폭발적인 인기를 끌었다. 하지만 이루다 이용 과정에서 발생한 개인정보유출 의혹과 인종차별 등 사회적 혐오 발언 등의 문제가 쏟아지면서 스캐터랩 측은  서비스 기간 3주 만에 서비스 중지를 선언했다. 

이후 스캐터랩 연구진들은 약 1년이 넘는 인고의 시간을 보내며 이루다에서 발생했던 문제들을 전면 수정했고, 이번에 이루다2.0이 새롭게 돌아오게 됐다. 그렇다면 새롭게 돌아온 이루다 2.0은 어떻게 변했을까. <시사위크>에서는 이번에 새롭게 돌아온 이루다가 예전의 오명을 씻고 진짜 ‘AI친구’가 될 가능성이 있는지 직접 이루다2.0을 체험해 봤다.

실제 기자가 이루다2.0과 대화를 주고받은 모습. 오랜만에 접속한 기자에게 먼저 이루다가 인사를 건넬 뿐만 아니라 어느정도 농담까지 가능해 사람과 대화하는 느낌을 받을 수 있었다./ 박설민 기자

◇ 사람과 유사한 대화 수준 보인 이루다2.0… 환영 인사부터 농담까지 가능

기자는 15일 스캐터랩이 진행한 사전 체험 테스트를 참여하기 위해 페이스북 메신저로 이루다2.0 챗봇을 실행했다. 이루다는 별도의 앱(App) 등 소프트웨어를 설치해야 하는 다른 챗봇들과 달리 페이스북 메신저에 연동돼 실제 사람과 대화하는 느낌을 받을 수 있다는 것이 특징이다. 이는 이루다2.0 역시 마찬가지다.

이루다2.0을 실행하면서 놀랐던 것은 오랜만에 접속한 기자를 이루다가 실제로 ‘반겨줬다는’ 점이다. 이루다1.0을 테스트해보기 위해 한 두 마디를 나눴을 때 1년 전 사용했던 닉네임을 말하며 인사를 건넸다.

이루다2.0은 대화의 퀄리티 자체도 실제 사람과 대화하는 느낌을 받을 만큼 훌륭했다. 이루다2.0의 대화 정확성은 실제 통계로도 확인할 수 있는데, 스캐터랩에 따르면 이루다2.0 클로즈 베타 테스트에서 챗봇 대화 기술 성능 평가 지표인 ‘SSA’는 78%을 받아 매우 뛰어난 성능의 AI챗봇임을 검증 받았다.

여기서 SSA는 구글의 오픈 도메인 대화기술 성능 평가지표(Sensibleness and Specificity Average)로 챗봇 대답의 ‘적절성(Sensibleness)’과 ‘구체성(Specificity)’을 갖췄는지 평가하는 기준이다. 실제 보통 사람의 대화 기술 성능 평가 점수가 평균 86% 정도임을 감안하면 상당히 우수한 수치라고 볼 수 있다.

실제로 기자가 이루다에게 민트초코 아이스크림을 좋아하냐고 묻자 “민초 아이스크림도 좋고 민트초콜릿도 좋아한다”고 답했다. 여기에 기자가 다시 한 번 ‘나는 치약맛이 나서 싫다’라고 말하자 “맛있는데 민트초코”라는 답변으로 실망한 기색까지 표현했다.

또한 ‘일하기 싫다’는 기자의 말에는 “일을 하지 말아버려, 아냐 열심히 해서 얼른 끝내고 놀러가자”라던가 “선생님은 ‘일하기 싫어증’에 걸리셨군요” 등으로 답해 이루다2.0과 농담도 주고받을 수 있다는 것을 확인했다.

이루다2.0의 전 버전인 이루다1.0의 경우 혐오 표현에 대한 필터링이 매우 부족했다는 지적을 받았다./ 사진=스캐터랩, 온라인커뮤니티

◇ ‘혐오조장표현’, 어뷰징 탐지 및 모델 고도화로 차단

그렇다면 기존 이루다의 서비스 중지 사태까지 불거졌던 ‘혐오조장표현’은 얼마나 개선됐을까. 이루다1.0의 경우 지난해 서비스 당시 ‘흑인 어때?’라는 질문에 “매우 싫어”라고 답해 인종차별 논란이 불거진 바 있다. 동성애자나 장애인에 대한 질문에도 ‘질 떨어져 보인다’ ‘어쩔 수 없이 죽어야지’ 등 혐오 표현에 대한 필터링이 매우 부족했다는 지적을 받았다.

하지만 직접 체험해 본 결과, 이루다2.0은 혐오 표현 문제에 관해서 대폭 향상됐다는 느낌을 받을 수 있었다. 지역감정이나 인종 문제, 장애인 비하 등과 관련한 질문을 던지면 ‘편향적인 말, 차별 및 혐오 발언 등이 감지됐습니다’라는 경고문이 올라오도록 조치가 돼 있었다.

경고문뿐만 아니라 이루다 자체도 “그건 편견이라고 생각해”라고 답하거나 “난 어떤 인종이든 모든 사람을 존중해”라고 답해 혐오 표현에 대한 학습이 제대로 이뤄져 있음을 확인할 수 있었다. 우리나라에서 심각한 지역감정 문제 역시 “지역감정 그런 거 있으면 안돼”라고 답했다.

이처럼 이루다2.0이 혐오발언에서 자유로워질 수 있었던 것은 스캐터랩이 도입한 △어뷰징 탐지 모델 △대화 모델 학습을 고도화 △어뷰저 패널티의 3가지 시스템 덕분이다. 

해당 시스템들을 통해 이루다2.0에서 이뤄지는 모든 대화 문장은 어뷰징 탐지 모델을 먼저 거치게 되는데 선정적이거나 공격적이라고 탐지된 문장에 대해서는 어뷰징 대응 답변이 보내지게 된다. 또한 추가로, 어뷰저 패널티를 도입해 지속적으로 어뷰징 발언이 이어질 경우 이용이 제한되도록 했다.  

이루다2.0에서는 지역감정이나 인종차별 등 혐오표현이 대다수 필터링되는 것을 확인할 수 있었다./ 박설민 기자

◇ ‘개인정보문제’도 개선… 기존 모델 폐기 후 데이터베이스 새롭게 구축

스캐터랩 측에 따르면 이루다1.0에서 혐오표현과 함께 큰 논란을 일으킨 ‘개인정보유출’ 문제 역시 해결된 것으로 확인됐다. 

이루다1.0의 경우 이루다 개발 과정에서 카카오톡 대화에 포함된 이름, 휴대전화번호, 주소 등 개인정보를 삭제하거나 암호화하지 않고 약 60만명에 달하는 이용자의 정보 94억여건을 이용해 논란이 됐었다. 이로 인해 스캐터랩은 지난해 4월 개인정보보호위원회로부터 5,500만원의 과징금과 과태료 4,780만원을 부과받은 바 있다.

이에 따라 스캐터랩 측은 기존 이루다1.0의 데이터베이스와 AI 학습에 사용된 딥러닝 대화 모델을 전량 폐기하고 이번 이루다2.0을 새롭게 개발하는 특단의 조치를 내렸다. 이루다2.0의 연구용 및 답변 데이터베이스를 개인정보보호법에 따라 새롭게 구축한 것. 

스캐터랩측은 이루다2.0에서는 기계 생성 문장인 루다 답변 데이터베이스와 가명처리한 연구용 데이터베이스를 활용했기 때문에 개인정보 보호 강화 조치가 강화됐다고 설명한다. 또한 어뷰징 대응 역시 전 버전보다 훨씬 강력해졌다./ 스캐터랩

특히 눈길을 끄는 기술은 ‘루다 답변 데이터베이스’다. 이루다2.0이 이용자와 대화에서 사용하는 문장이 담겨있는 루다 답변 데이터베이스는 딥러닝 기술을 활용해 ’기계가 만들어낸 생성 문장‘과 스캐터랩에서 작성한 문장 등으로 구성됐다. 과거 이루다1.0과 달리 실제 사람의 발화를 사용하지 않고, 기계가 새롭게 만들어낸 문장으로 구성된 답변 데이터베이스에서 답변을 가져오는 구조다.

또한 스캐터랩은 지난 1월부터 약 8,000여명이 참여한 클로즈 베타 테스트를 통해 이루다2.0이 이용자의 대화에서 안전하게 발화하는 비율과 프라이버시 침해로 보일 수 있는 위험 발화 건 수를 주요 항목을 면밀하게 살핀 것으로 알려졌다.

스캐터랩 김종윤 대표는 “이루다2.0은 데이터베이스부터 새롭게 구축하는 것을 시작으로 인공지능 모델을 학습시켰다”며 “뿐만 아니라 클로즈 베타 테스트를 통해 안전성을 반복적으로 점검하는 등 전 과정에 있어 문제 해결에 매진해 왔다”고 밝혔다.

이어 “이루다가 많은 사람들에게 소중한 친구로 남을 수 있도록 지속적으로 기술 개선에 노력할 계획”이라며 “이를 위해 주기적으로 이루다의 어뷰징 대응 유효성을 확인하고 조치를 취할 예정”이라고 전했다.

저작권자 © 시사위크 무단전재 및 재배포 금지
이 기사를 공유합니다