Сервис VK Видео внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте.
Автоматические субтитры генерируются с помощью Ml-моделей, которые создают текст и расставляют знаки препинания, синхронизируют их с видео. Machine Learning (ML) – изучение алгоритмов для работы с данными для дальнейшей автоматизации процесса обработки новых данных.
По словам VK, точность анализа и расшифровки выросла на 25%, кроме того, нейросети теперь знают тысячи новых слов, включая мемы.
Сервис утверждает, что в ближайшее время нейросети VK Видео научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28%, и сейчас субтитрами пользуются 11% всей аудитории VK Видео.
О том, как VK Видео стал самым популярным российским видеосервисом в августе, написали здесь.