본문 바로가기

2022년 이전/작은 창업

AI와 콘텐츠 큐레이션_드림어스 김문주 팀장

문화체육관광부와 한국콘텐츠진흥원에서 AI와 콘텐츠 큐레이션에 관한 강의를 진행했습니다. 총 2분의 연사 분이 오셔서 발표를 해주셨는데요, 그 중 한 분은 음악 스트리밍 서비스인 "FLO"를 운영하는 드림어스컴퍼니의 김문주 팀장님이었습니다. 김문주 팀장님은 # 개인화 서비스와 음악 콘텐츠 소비 #라는 주제로 발표를 해주셨는데, 그 내용을 공유해볼까 합니다. 

 

# 기존 음악콘텐츠 소비 시장

기존 음악 콘텐츠 소비 시장은 파레토 법칙이 적용되는 시장입니다. 상위 20% 음악들에만 80%의 트래픽이 가고 있다는 뜻입니다. 이는 음원 스트리밍 플랫폼들의 화면 구성만 보아도 확실하게 알 수 있는데요, 사람들이 인기있는 노래만 듣기 때문에 인기차트를 화면 구성 상단에 놓는 것을 볼 수 있습니다. 음원 시장이 지속해서 이러한 모습을 보일 경우, 모든 사람이 비슷한 음악을 듣게 되어 음악적 다양성이 훼손되고, 음원 사재기 등 순위를 조작하는 부작용이 발생할 수 있습니다.  

사람들은 큐레이션의 영향을 받습니다. 음원을 어떻게 추천하고, 배치하느냐에 따라 콘텐츠 소비 양상이 달라질 수 있습니다. 그렇기 때문에 큐레이션을 활용하면 이러한 상위 20%가 시장 대부분을 독점하는 현상을 해결할 수 있습니다. 큐레이션을 통해 기존에는 소비자들이 접하기 힘들었던 "Long Tail"에 대한 접점을 늘리면 없던 수요가 창출되어 전체 음원 시장 규모 또한 커질 수 있습니다. 이러한 목적을 위해 개인맞춤 음원 큐레이팅 서비스가 출시되었으며 점점 그 규모가 증가하고 있습니다.

Long Tail 개념 - 출처: Google

 

# 개인맞춤 서비스

개인맞춤 큐레이션 서비스를 통해서 Long Tail의 수요를 늘리면 소수의 동질적인 음악이 아닌 더 다양한 형태의 음악/음원들이 빛을 볼 수 있습니다. 이러한 큐레이션을 잘 하기 위해서는 AI를 활용한 추천 알고리즘을 활용하는 것이 필요합니다. AI 큐레이팅 서비스를 운영하는 많은 회사들은 장기적으로 AI를 활용하여 꼬리(Long Tail)을 더 두껍게 만드는 것을 목표로 한다고 합니다. 

그렇다면 실제로 개인맞춤을 통해 큐레이팅 해준 콘텐츠의 소비가 늘어날까요? 넷플릭스를 예로 들어보면 전체 스트리밍 영상의 2/3 가량이 추천영상에서 발생한다고 합니다. 아마존 또한 판매의 35% 이상이 추천 상품 리스트에서 발생한다고 합니다. 이렇듯 AI가 충분히 고도화 된다면 큐레이션을 통해 새로운 수요를 창출할 수 있습니다. 

 

# 콘텐츠 플랫폼의 역할

그렇다면 콘텐츠 큐레이션 활성화를 위하여 플랫폼은 어떤 역할을 해야할까요? 플랫폼은 AI가 일을 잘 할 수 있는 환경을 구축해야 합니다. AI가 일을 잘 하기 위해서는 양질의 데이터를 많이 확보해야 합니다. 추천 알고리즘 중에 가장 많이 사용되는 알고리즘은 "Collaborative Filtering"이라는 알고리즘입니다. 추천을 잘하기 위해서는 특정 사람이 어떤 곡을 좋아하는지 잘 알아야 합니다. 지금처럼 파레토 법칙에 의거하여 소비되는 시장에서는 모든 사람이 같은 음악을 듣기 때문에 곡 추천이 어려워집니다. 사람들이 다양한 곡을 들어야 AI가 추천을 더 잘 할 수 있으며, 플랫폼은 그러한 데이터를 모으기 위한 노력을 해야합니다. 플랫폼은 적절한 UI와 UX를 사용하면 양질의 사용자 데이터들을 확보할 수 있습니다.

여기에서 AI의 3단계를 구분해야합니다. 흔히 인공지능(AI, Artificial Intelligence), 머신 러닝(ML, Machine Learning), 딥러닝(DL, Deep Learning)이 3가지를 혼용하는데 조금씩 구분할 필요가 있습니다. 사실 이 3개의 단어는 포함관계에 있는데 AI는 "기계가 사람과 같이 행동할 수 있는 모든 기술"을 총칭하는 말로 범위가 가장 넓습니다. 머신러닝은 그 중 스스로 학습이 가능한 것을 보여주는데, 사람이 정답을 알려준 것들을 기반으로 학습하여 추후에는 알려주지 않은 것을 통해 통계적으로 가장 유의미한 답을 내리는 것을 말합니다. 머신 러닝을 구축하기 위해서는 라벨링을 전문적으로 하는 데이터 사이언티스트들이 필요하다고 합니다. 딥러닝은 머신 러닝 중에서도 Neural Network를 활용하여 학습하는 것을 말하는데, 이 경우 정답을 알려주지 않아도 컴퓨터가 스스로 학습합니다. 요즘에는 추천 시스템에 딥러닝을 사용하는 것이 추세인데, 장르 점수를 바탕으로 필터링을 하여 여러 사용자들의 선호도를 기반으로 잠재 선호도를 예측한다고 합니다.

 

# 추천 시스템 종류

추천 시스템에는 크게 2가지 종류의 알고리즘이 사용된다고 합니다. 1) Collaborative Filtering (CF)이고, 2) Content-based Filtering (CBF) 이 2가지가 있습니다. CF는 특정 아이템에 대해 선호도가 유사한 고객은 다른 아이템에서도 비슷한 선호도를 보일 것이라고 가정하는 모델입니다. 최근 가장 성능이 좋은 방식은 행렬 인수분해(Matrix Factorization)을 활용하는 것이라고 합니다. CF 모델의 단점은 사용하기 전에 데이터가 있어야 판단을 할 수 있다는 점입니다. 그래서 최신곡은 추천할 수가 없습니다. 최신곡은 그래서 곡에 대한 수요가 아닌 아티스트에 대한 선호도로 추천을 한다고 합니다. CBF는 사람을 보지 않고 콘텐츠만 보고 추천하는 것이라고 합니다. 제가 만약 특정 곡을 들었으면 특정 곡과 비슷한 다른 곡을 추천해주는 방식입니다. 콘텐츠 큐레이팅을 할 때에는 이 2가지를 적절하게 조합하여 활용한다고 합니다. 

 

콘텐츠 큐레이팅 시장은 점점 커지고 있습니다. 지금은 빅데이터를 활용하여 AI가 콘텐츠를 큐레이팅 하도록 하고 있는데, 아직은 많이 부족한 것이 사실입니다. 넷플릭스 같은 대기업이 운영하는 큐레이팅 알고리즘만 보아도 보고 싶은 영상이 없는 것을 보면 아직 갈 길이 먼 것 같습니다. 현재는 빅데이터만 활용하지만 향후에 휴먼 감성을 넣은 큐레이팅을 추가하면 어떨까 생각을 해봅니다. AI와 사람이 결합되면 그 가능성이 무궁무진하지 않을까 기대되네요.