Нейросети в VK Видео улучшили распознавание речи на 25%

Сервис VK Видео внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте.

Автоматические субтитры генерируются с помощью Ml-моделей, которые создают текст и расставляют знаки препинания, синхронизируют их с видео. Machine Learning (ML) – изучение алгоритмов для работы с данными для дальнейшей автоматизации процесса обработки новых данных.

По словам VK, точность анализа и расшифровки выросла на 25%, кроме того, нейросети теперь знают тысячи новых слов, включая мемы.

Сервис утверждает, что в ближайшее время нейросети VK Видео научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.

Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28%, и сейчас субтитрами пользуются 11% всей аудитории VK Видео.

О том, как VK Видео стал самым популярным российским видеосервисом в августе, написали здесь.

Комментарии
Нет комментариев. Будьте первым!