드림어스컴퍼니 김명주 팀장님에 이어 SK브로드밴드의 최요한님께서 콘텐츠 추천 원리와 활용에 대한 강연을 해주셨습니다. 김명주 팀장님이 플랫폼이 서비스를 어떻게 만드느냐에 중점을 두어 설명해줬다고 하면 최요한님은 플랫폼에 업로드하는 크리에이터로서 어떻게 콘텐츠 추천 알고리즘을 활용할 수 있는지에 중점을 두어 설명해주셨습니다.
# 유튜브 알고리즘
유튜브 알고리즘을 생각할 때 중요한 숫자는 총 4가지가 있습니다. 4가지는 다음과 같습니다. 1) 노출수 - 노출 수는 검색을 했을 때 화면 페이지 안에 영상의 썸네일이 50% 이상 노출 된 것을 말합니다. 2) 노출에서 발생한 조회수 - 노출 되고 얼마나 클릭해서 조회를 했는지를 말합니다. 3) 클릭률 - "조회수 / 노출수"로 계산할 수 있습니다. 그리고 4) 노출에서 발생한 시청 시간, 시청 지속시간이 있습니다.
위 순서는 중요한 순서대로 서술한 것입니다. 우선 가장 중요한 것은 노출 횟수입니다. 노출수가 많다는 것은 영상이 추천 알고리즘에 잘 맞게 설정되었다는 것이며, 추천 알고리즘이 내 영상을 추천해주고 있다는 것을 의미하기 때문입니다. 조회수와 클릭률은 사실상 같은 의미를 가집니다. 조회수가 나오면 클릭률은 자동으로 계산되기 때문입니다. 알고리즘은 클릭률 높은 영상을 좋아합니다. 알고리즘의 효율성을 평가할 때, 노출 대비 클릭률이 얼마나 높은지로 평가하기 때문입니다. 노출 시켜줬을 때 클릭률이 높다면 알고리즘은 향후 해당 영상을 더 추천해줄 가능성이 높습니다.
최요한님이 말씀해주신 것 중에 가장 특이했던 것은 유튜브 알고리즘이 "시청자가 보지 않는 것"을 측정한다는 점이었습니다. 노출 되었는데 클릭하지 않은 것을 알고리즘이 기록하고 파악한 후 다음 추천에 반영하기 때문입니다. 영상을 보는 것, 관심 없음 의사를 직접 표현하는 것 외에 그냥 지나친 것도 알고리즘에서 고려한다는 점이 신선했습니다.
알고리즘 내에서 가장 피해야할 점은 ClickBate 입니다. 일명 낚시 영상인데요, 알고리즘은 이러한 영상들을 경고 없이 삭제할 수 있고 향후 해당 크리에이터 추천 빈도 수를 낮춘다고 합니다. 또한 ClickBate 영상들은 시청 지속시간이 짧기 때문에 알고리즘이 기피하게 된다고 합니다.
# 알고리즘 원리에 입각하여 유튜브 구독자 높이는 법
강연을 듣는 사람 중 대부분이 궁금해했을 주제였을 것 같습니다. 구독자를 높이는 방법에는 여러 가지가 있지만 자체적으로 할 수 있는 것은 크게 3가지 정도가 있었습니다. 1) 썸네일 - 좋은 썸네일을 만드는 것이 중요합니다. 사람의 시선은 좌측 상단에서 우측 하단으로 내려가기 때문에 좌측 상단에 제목을 넣어야 합니다. 그리고 우측하단에 그림을 넣을 경우, 타임코드에 가리지 않도록 주의해야 합니다. 2) 15초 - 영상의 처음 15초 안에 흥미를 끌만한 요소들을 넣어야 합니다. 영상을 볼지 말지 여부를 15초 내에 결정하기 때문입니다. 요즘에는 이러한 요소들이 많이 알려져서 그런지 15초 동안 영상 하이라이트를 편집하는 경우가 많은 것을 보실 수 있습니다. 3) 조금씩이라도 자주 올리기 - 1000개의 좋아요가 달린 영상 1개보다 100개의 좋아요가 달린 영상 10개가 더 의미 있습니다. 알고리즘은 비교적 최근에 올린 영상을 추천 영상으로 올리게 됩니다. 때문에 자주, 그리고 많이 올리는 것이 중요합니다.
이 외 방법으로는 4) 초대하기가 있는데요, 유튜버들끼리 서로의 채널에 초대하는 방식으로 노출 수를 올릴 수 있습니다. 유튜브 알고리즘이 양측 구독자 모두를 해당 영상을 모아주기 때문입니다. 이래서 합방을 하면 영상 조회수가 폭발을 하는 것 같네요.
# 넷플릭스 알고리즘
유튜브 알고리즘 뿐 아니라 넷플릭스의 추천 알고리즘에 대해서도 설명을 해주셨습니다. 넷플릭스에서는 정말 다양한 알고리즘을 사용하고 있는데요, 이 중 4개를 설명해주셨습니다.
Personal Video Ranker - 가장 기초적인 알고리즘. 사람들마다 콘텐츠 다르게 추천.
- 내가 좋아요한 영상에 좋아요를 누르거나 싫어요한 영상에 싫어요를 누른 비슷한 성향의 다른 이용자를 찾습니다.
- 이 사람들이 보고, 내가 안 본 타이틀을 추천해줍니다.
Top-N Ranker - 평균적으로 인기있는 콘텐츠 추천 알고리즘
- 조회수, 좋아요 건수, 시청 중단 위치 등 데이터를 가중평균해서 선정합니다.
- 피드백 루프 - 피드백 루프는 한 번 인기 콘텐츠가 되면 잘 보이는 곳에 위치해서 차트에 계속 머무르게 되는 현상을 말합니다. 이 경우, 잘 보이는 곳에 노출되어 발생한 조회수는 가중치를 하향하는 방식으로 피드백 루프 현상을 완화할 수 있습니다.
Page Generation - 블록의 순서를 바꿔주는 것
Artwork Personalization - 똑같은 콘텐츠여도 이용자가 선호하는 배우, 감독 등에 따라 포스터가 바뀌는 알고리즘
- 시청 이력을 바탕으로 포스터도 섬세하게 고려하게 됩니다.
이렇듯 다양한 알고리즘을 통해서 롱테일을 두텁게 하려고 노력하는데요, 1~2개의 콘텐츠에 시청이 집중될 경우 플랫폼의 협상력이 약화되고 콘텐츠 제공사의 입지가 강화되기 때문입니다. 추천 시스템의 정확도는 Precision & Recall로 평가하는데 Precision은 추천한 콘텐츠 중 시청한 콘텐츠 비율을 말하고, Recall은 시청한 콘텐츠 중 추천을 통해 시청한 비율을 말합니다. 이 두가지를 적절히 조합해서 평가한다고 하네요.
# 큐레이션에 중요한 요소 & 사람이 하는 일은 무엇인가?
큐레이션에서는 어떤 데이터를 쓰는지가 매우 중요합니다. 때문에 양질의 데이터를 활용하는 것이 중요합니다. 이 안에서 사람이 하는 일은 데이터를 잘 관리하는 것입니다. 이 뿐 아니라 콘텐츠를 많이 감상하면서 알고리즘을 통해서는 알 수 없는 정성적인 평가를 사람이 해주어야 합니다.
저 개인적으로는 플랫폼 활용 방안 등 구체적인 적용법을 알려주신 최요한님의 강연이 매우 좋았습니다. 이 포스팅을 통해 많은 분들이 최요한님의 인사이트를 알아가셨으면 좋겠습니다 :)
'2022년 이전 > 작은 창업' 카테고리의 다른 글
AI와 콘텐츠 큐레이션_드림어스 김문주 팀장 (0) | 2020.08.01 |
---|---|
[창업캠프] 비즈니스 모델링 (0) | 2015.12.17 |