г. Ростов-на-Дону ул. Пушкинская, 43, оф. 10
e-mail: info@hjournal.ru 
тел. +7(863) 269-88-14

scienceRU

Популярность видеоконтента: прогнозирование с использованием инструментов машинного обучения

Популярность видеоконтента: прогнозирование с использованием инструментов машинного обучения

Journal of Economic Regulation (Вопросы регулирования экономики), , Том 11 (номер 2),

Видеоконтент формирует 70% интернет-трафика, кроме того, в условиях пандемии коронавируса изменяется экономическое поведение населения, увеличивается доля интернет- рекламы. Вышеизложенное актуализирует исследовательскую проблему прогнозирования популярности вновь создаваемого видеоконтента. Задачу прогнозирования популярности видеоконтента в данном исследовании предложено сформулировать как задачу бинарной классификации видео на «популярные» и «непопулярные». С учётом принципа Парето, к «популярным» предлагается относить видео, которые входят в топ – 20% видео по числу просмотров. В статье представлен обзор исследований по тематике прогнозирования популярности видеоконтента с применением методов машинного (в том числе – глубокого) обучения. Автор исследует возможность применения модификации данных методов для решения поставленной задачи, а также разрабатывает новый метод, основанный на комбинации методов ансамбля деревьев и нейронных сетей. Каждый из методов тестируется на выборке данных 11000 видео YouTube, которая собрана при помощи разработанного программного обеспечения. По результатам тестирования для прогнозирования популярности вновь созданного видеоконтента автором предложен к применению показавший лучшие результаты метод комбинации ансамблей деревьев и нейронных сетей. Качество прогнозирования популярности видеоконтента с использованием данного метода характеризуется следующими значениями метрик: 87% видеороликов корректно классифицируется как популярные/непопулярные (Accuracy); среди роликов, отнесённых к классу популярных, 63% являются популярными (Precision); 49% действительно популярных видеороликов определены корректно (Recall). Выявлены признаки, имеющие наибольшее значение для популярности вновь созданного видео: количество просмотров и дислайков видео, последнего из опубликованных на канале; количество подписчиков канала; время опубликования вновь созданного видео; заголовок вновь созданного видео; дата основания канала. В статье изложены ограничения и направления совершенствования предложенного автором метода, доказана необходимость междисциплинарных исследований в данной области на пересечении сфер интересов маркетологов, аналитиков данных, лингвистов и психологов.


Ключевые слова: цифровая экономика; маркетинг; менеджмент; большие данные; видеоконтент; инструменты машинного обучения

Список литературы:
Издатель: ООО "Гуманитарные Перспективы"
Учредитель: ООО "Гуманитарные Перспективы"
Online ISSN: 2412-6047
ISSN: 2078-5429