Классификации видеороликов по текстовым описаниям для Союзмультфильма (NLP)
Задача проекта — создание автоматизированного решения для классификации видеороликов по принадлежности к проектам на основе анализа текстовых описаний и другой доступной информации с платформы YouTube
В папке model обученная модель и просмотр выборок.
В папке class код и описание.
Метрика модели DistilBERT для задачи классификации:
- F1 Score (Macro) на валидационной выборке: 0.84464
- F1 Score (Macro) на тестовой выборке: 0.82345