맹성현 네이버 뉴스 알고리즘 검토위원회 위원장이 29일 서울 프레스센터에서 그간의 활동 결과를 발표했다. /뉴시스
맹성현 네이버 뉴스 알고리즘 검토위원회 위원장이 29일 서울 프레스센터에서 그간의 활동 결과를 발표했다. /뉴시스

[시사위크=현우진 기자] ‘네이버 뉴스 알고리즘 검토위원회’가 29일 약 6개월간의 활동을 마치고 검토 결과를 발표했다. 관리자가 네이버 뉴스 알고리즘에 개입하는 것은 ‘원칙적으로 불가능’하며, 공정성 측면에서 특별한 문제점이 발견되지 않았다는 것이 결론이었다.

지난 5월 29일 발족한 네이버 뉴스 알고리즘 검토위원회는 컴퓨터공학·정보학·커뮤니케이션학을 전공한 11명의 검토위원들로 구성됐으며, ▲뉴스 검색 서비스 ▲AiRS(인공지능 기반 추천 시스템) 서비스 ▲스포츠/연예기사 추천 서비스 등 네이버 뉴스의 3가지 카테고리에 대한 검증 작업을 진행했다.

이날 발표를 맡은 맹성현 위원장(카이스트 전산학부 교수)은 네이버가 뉴스 편파 배치 의혹·스포츠뉴스 배열 청탁사건·댓글조작 사건 수사 등으로 공정성 의혹들을 받아왔던 사실들을 거론하며 “네이버 측에서 더 좋은 뉴스 서비스 제공을 위해 자문을 원했다”고 검토위원회의 발족 배경을 설명했다. 또한 뉴스 생태계 측면에서도 “생산자와 유통자 사이에 공생관계가 형성되고, 포탈에 대한 사회적 수요도 증가했다. 효율성을 위해 포탈이 필요하지만 어뷰징·여론조작 등 부작용도 생겼다. 유통을 맡는 포탈이 사회적 책무를 수행해야 한다는 기대감이 있다”며 뉴스의 공공성을 보장하는 작업이 필요하다는 의견을 밝혔다.

◇ 뉴스기사 검색·배열·추천 서비스, ‘공정성 이상 없음’ 결론

위원회는 우선 네이버 뉴스 검색 서비스에 사용되는 알고리즘의 공정성에 대해 “관리자의 개입이 원칙적으로 불가능하다”는 결론을 내렸다. 뉴스 검색 결과는 알고리즘을 통해 자동으로 배치되며, 종합만족도 측정 방식은 절차적 합리성과 투명성을 가지고 있다는 것이 검증 결과였다. 위원회는 “현재 사용 중인 알고리즘 모델을 교체할 필요가 없다”면서 대신 뉴스검색 품질평가 가이드라인의 개정 주기를 단축시킬 것을 권고했다.

한편 단독 기사보다 카피 기사가 먼저 노출되는 문제를 해결할 수 있는지, 같은 내용을 다룬 기사 중에선 어떤 것이 상단에 노출되는지 등의 의문점에 대해서는 “검증위원회의 목적은 알고리즘의 공정성 검토다. 자동화 과정에서 나타나는 부정적인 결과들이 공정성을 해칠 수 있는지를 중점적으로 검증했다. 정책적 문제는 검토 범위가 아니다”는 입장을 밝혔다.

사용자의 정보를 바탕으로 뉴스를 추천하는 AiRS 서비스 분야에서는 ‘확증 편향’ 문제가 가장 중요하게 다뤄졌다. 사용자가 최근에 본 뉴스를 바탕으로 개인선호도와 추천 점수를 산정하다보니 기존 성향에 한정된 뉴스만 제공받는 ‘필터버블’ 현상이 나타날 수 있다는 우려가 있었기 때문이다. 위원회는 AiRS 서비스에 사용되는 알고리즘이 이미 다양성 문제를 고려하고 있으며, 기존 편집 뉴스와 AiRS 서비스를 비교분석한 결과 AiRS 쪽의 다양성이 훨씬 더 컸다고 밝혔다.

기사의 선호도를 책정하는 과정에서 품질·화제성뿐 아니라 매체별 특성에 따라서도 가중치를 둬야 하는 것 아니냐는 지적에 대해선 부분적인 동의를 표했다. 위원회는 “구글로 뉴스를 검색하면 가장 먼저 나오는 것은 CNN·뉴욕타임스 등 누구나 알 법한 매체들이다. 구글 알고리즘에서는 뉴스를 만든 언론사의 평판이 굉장히 중요한 비중을 차지하고 있다는 사실을 짐작할 수 있다. 검증위원회도 이 부분에 대해 검토를 진행했고, 위원들 사이에서도 다양한 의견이 제시됐다”고 밝혔다. 다만 위원회의 중점사항인 공정성 문제와는 관련이 크지 않기 때문에 구체적인 권고안을 내지는 않았다고 설명했다.

스포츠/연예 기사에 대해서는 어뷰징과 기사 배열의 투명성 문제가 중점적으로 다뤄졌다. 위원회는 네이버가 실시간으로 업데이트된 기사와 전문매체의 기사에 대해서 가점을 부여하는 등 다른 분야의 기사들과 별개의 알고리즘을 적용하고, 댓글 어뷰징을 막기 위해 댓글 가중치 최댓값 제한·시간 간격에 따른 작성횟수 제한·동일 내용 제한 등의 장치를 마련하고 있다고 설명했다. 스포츠/연예 기사에 적용되는 알고리즘과 데이터 확보 과정도 문제가 없다는 평가를 받았다.

◇ “정보 공개·교류 통해 발전 가능해”

맹성현 위원장은 “네이버의 학습 데이터와 알고리즘은 문제가 없다. 공공성·투명성에서 합격점을 줬다”고 검토 결과를 정리했다. ▲네이버가 사용자 만족도의 최적화와 정보량 증대라는 목표 하에서 데이터 구축 알고리즘을 설정하고 있으며 ▲관리자의 알고리즘 개입이 원천적으로 차단돼있고 ▲스포츠/연예 기사의 경우 최신성과 전문성이 함께 고려되고 있는 점 등이 긍정적인 평가의 근거로 제시됐다.

다만 위원회는 네이버가 외부적으로 투명성을 인정받기 위해 알고리즘 관련 정보를 공개하는 방안을 고려해 볼 것을 권고했다. 맹성현 위원장은 “알고리즘은 네이버의 고유 자산이기 때문에 전체 공개는 불가능하지만, 어뷰징에 악용되지 않는 선에서 대략적인 프로세스와 자료 일부를 공개한다면 공정성·객관성을 확보하는데 도움이 될 것이다”는 의견을 밝혔다.

내·외부적으로 정보 교류를 늘릴 필요가 있다는 지적도 있었다. 위원회는 서비스 부문별로 개별 진행되고 있는 품질평가를 공통 진행해 노하우를 나눌 것을 권고했으며, CIO(최고정보관리책임자)를 임명하는 것이 각 서비스 개발 분야의 정보를 공유하는 문화를 만드는데 도움이 될 수 있다고 밝혔다. AiRS 서비스의 경우 독립된 외부 평가위원회와 상호 네트워크를 형성하는 방안이 권고사항으로 제시됐다.

저작권자 © 시사위크 무단전재 및 재배포 금지
이 기사를 공유합니다