뒤로가기
유튜브 알고리즘의 비밀
[유튜브 알고리즘의 비밀①] 나를 유혹하는 ‘유튜브 AI’의 원리
2021. 08. 13 by 이민지 기자 dbsgk4774@sisaweek.com
이용자들을 유혹하는 유튜브의 추천 알고리즘 / 픽사베이
이용자들을 유혹하는 유튜브의 추천 알고리즘 / 픽사베이

시사위크=이민지 기자  ‘이 영상 하나만 보고 자야지.’ 유튜브를 틀며 굳게 마음먹지만, 이를 지키기란 쉽지가 않다. 계속해서 흥미로운 영상을 보여주는 알고리즘의 유혹에 매일 밤 속수무책으로 당하게 되기 때문이다. 잠깐 보려고 켠 유튜브 때문에 밤을 새웠다는 이용자들의 이야기가 적지 않게 들려오는 요즘이다.

실제 유튜브의 최고 상품 담당자(Chief Product Officer, CPO)인 닐 모한은 뉴욕타임스와의 인터뷰에서 “이용자들의 시청 시간 70%가 추천 알고리즘에 의한 결과”라고 했을 정도로 알고리즘은 이용자들의 유튜브 이용 시간을 늘리고 있다. 그렇다면 우리를 매번 시험에 들게 만드는 ‘유튜브 추천 알고리즘’은 어떠한 원리로 운영되고 있는 걸까.

알고리즘(Algorithm)은 사전적 정의로 어떠한 문제를 해결하기 위해 정한 절차 또는 규칙 모음을 말한다. 현실 속에서 알고리즘은 주로 사용자의 이용 기록과 각종 개인 정보를 토대로 이용자에게 맞춤형 콘텐츠나 광고를 보여주는 시스템으로 사용되고 있다. 특히 유튜브가 이용하고 있는 ‘추천 알고리즘’은 사용자가 좋아할 만한 콘텐츠의 취향을 신기할 정도로 족집게처럼 골라주며, 이용자들의 체류시간을 늘리는 효과를 보여주고 있다.

방대한 양의 콘텐츠들 속에서 사용자의 취향에 맞는 영상을 보여주는 유튜브 추천 알고리즘 / 게티이미지뱅크
방대한 양의 콘텐츠들 속에서 사용자의 취향에 맞는 영상을 보여주는 유튜브 추천 알고리즘 / 게티이미지뱅크

매분 500시간 이상 분량의 새로운 영상들이 유튜브에 업로드되고 있다는 점을 고려했을 때, 유튜브 추천 알고리즘의 능력은 가히 놀랍다. 유튜브는 기업 내 핵심 기술이자 영업 비밀인 만큼 추천 알고리즘 원리의 내막을 자세히 공개하지 않고 있다.

하지만 세계적으로 많은 곳에서 유튜브 추천 알고리즘의 원리를 파악하려는 시도를 보이고 있으며, 이는 국내에서도 이뤄졌다. 지난 2019년 한국언론진흥재단은 서울대와 카이스트 공학 전문가들의 도움을 받아 ‘유튜브 추천 알고리즘과 저널리즘’ 보고서를 발간, 유튜브 추천 알고리즘 원리를 담아냈다.

‘유튜브 추천 알고리즘과 저널리즘’ 보고서는 구글의 연구자들이 발표한 논문에 근거해 유튜브 추천 알고리즘이 ‘추천 영상의 목록을 만드는 알고리즘’과 ‘그 목록에서 순위를 결정하는 알고리즘’으로 구성돼 운영되고 있다고 설명했다.

두 알고리즘에 대해 간략히 살펴보자면, 먼저 ‘추천 영상의 목록을 만드는 알고리즘’은 이름 그대로 여러 데이트들을 토대로 이용자가 흥미를 가질만한 콘텐츠의 목록을 만드는 역할을 하는 알고리즘을 뜻한다. 여기에는 △현재 재생되고 있는 영상과 비슷한 주제의 콘텐츠 △사용자가 이전에 길게 시청한 영상 △이용자가 검색했던 키워드 △거주지와 같은 이용자의 인구 통계학적 정보 등이 활용된다. 개개인의 데이터뿐 아니라 유튜브를 방문하는 매일 3,000만명 이상의 사용자들 이용 내역을 활용해 맞춤 콘텐츠를 제공하고 있는 셈이다.

‘추천 영상의 목록을 만드는 알고리즘’과 ‘그 목록에서 순위를 결정하는 알고리즘’으로 운영되는 유튜브 추천 알고리즘 / 한국언론진흥재단 ‘유튜브 추천 알고리즘과 저널리즘’ 캡처
‘추천 영상의 목록을 만드는 알고리즘’과 ‘그 목록에서 순위를 결정하는 알고리즘’으로 운영되는 유튜브 추천 알고리즘 / 한국언론진흥재단 ‘유튜브 추천 알고리즘과 저널리즘’ 캡처

‘그 목록에서 순위를 결정하는 알고리즘’은 사용자의 반응을 예측해 추천 영상 목록의 순위를 정하는 작업을 말한다. △콘텐츠의 조회 수 △영상을 본 이용자들의 시청 시간 △‘좋아요’ 수 등을 토대로 추천 영상별 점수를 매기게 되며, 이때 ‘조회 수’에 비해 ‘시청 시간’이 많은 비중을 차지하게 된다. 이는 클릭만을 노리고 제목과 섬네일을 자극적으로 포장한 영상을 걸러내기 위함인 것으로 알려진다.

‘암시적 편향(Implict bias)’ 또한 고려된다. ‘암시적 편향’이란 사용자들이 맨 위 추천 영상을 선택하는 것이 자신의 선호를 반영한 행동이 아닌, 단순 상단에 있기 때문에 클릭하게 되는 것을 뜻한다. 암시적 편향 현상이 커질수록 알고리즘이 사용자의 선호를 학습할 수 있는 기회를 잃게 되고, 결국 개인화되지 못하기 때문에 이용자가 상단 콘텐츠를 클릭한 것보다 하단으로 내려가 누른 영상에 점수를 더 주는 방식으로 이를 보완하고 있다.

결론적으로 한국언론진흥재단은 “유튜브의 추천 알고리즘은 이용자를 오래 체류시키는 것이 주요 목표”라며 “이 과정에서 추천 알고리즘은 이용자 개인의 선호에 알맞은 영상과 다른 이용자들이 관심을 보이는 영상을 추천한다”고 말했다.

이어 “이는 유튜브의 수익을 극대화하기 위함”이라며 “그 과정에서 추천 알고리즘이 영상의 내용, 영상이 조회 수를 얻은 배경, 영상이 개개인과 사회에 미칠 파급력을 충분히 고려할 수 있는지는 의문으로 남는다”고 의구심을 내비쳤다.