a
b
c
d
FindNews.ru - новости, последние события, хроники.
Ученые: Две кружки кофе в день продлевают жизнь
Сегодня, 05:06
Астрологи назвали знаки зодиака, которые охотно дают «бывшим» второй шанс
Сегодня, 04:32
Диетолог Белоусова рассказала, как правильно хранить кабачки
Сегодня, 04:12
В Минобороны Британии считают, что «Северные потоки» повредили дистанционным взрывным устройством
Сегодня, 04:08
Израиль может выделить $25 млн на поддержку репатриантов из России
Сегодня, 04:08
Диетолог Белоусова рассказала, как правильно хранить кабачки
Сегодня, 03:33
Глава Дагестана обвинил ВСУ в организации протестов против мобилизации в республике
Сегодня, 03:14
«Коммерсант»: ЦБ собирает списки сотрудников банков, которые могут претендовать на бронь
Сегодня, 03:14
Обзор рынка недвижимости Москвы по итогам сентября 2022 года
Сегодня, 03:00
Во Флориде ураган оставил без света больше миллиона человек
Сегодня, 02:35

«Вконтакте» открывает доступ к собственным технологиям распознавания речи сторонним разработчикам

Теперь разработчики смогут бесплатно использовать в своих инди-проектах технологию «Вконтакте», которая считывает голос и переводит его в текст. Об этом рассказал технический директор «Вконтакте» Александр Тоболь. Технология распознавания речи, или ASR, Automatic Speech Recognition, внедряется в несколько кликов. Нейросети хорошо справляются с аудио с посторонними шумами, большим количеством сленга и сокращений. Об этом CNews сообщили представители VK.

Для распознавания можно выбрать одну из двух моделей. Нейтральная подойдет для разборчивой речи, как в телешоу или интервью, а спонтанная поможет, когда нужно обработать более обыденную речь со сленгом и ненормативной лексикой. Нейросети «Вконтакте» обрабатывают файлы за несколько секунд, умеют удалять из расшифровки шумы и паузы, понимают неразборчивую речь и даже отдельный звук «ъ».

Технологию можно попробовать через веб-интерфейс на специальной странице или интегрировать через публичный API «Вконтакте». На портале доступен широкий набор методов, с помощью которых можно создавать мини-приложения «Вконтакте» или использовать в сторонних проектах. Решение подойдет для стартапов, инди-проектов, личных pet-проектов для обучения и саморазвития. Версию с обработкой аудио до 100 минут в сутки можно применять для любых целей. А для безлимитного использования технологии можно отправить заявку на электронную почту.

Александр Тоболь, СТО «Вконтакте»: «Мы считаем важным помогать рынку и уже делимся широким набором собственных уникальных технологий. Наше ASR-решение — одно из лучших в отрасли по распознаванию обыденной, повседневной речи, в которой нередко встречается сленг, заимствования, сокращения. Каждый месяц пользователи «Вконтакте» отправляют более 2 млрд голосовых — это миллионы часов аудио, которые обрабатывают наши нейросети. Применение технологии ограничено только вашей фантазией: можете сделать игру с голосовым управлением или с помощью чат-бота наконец добавить распознавание голосовых в какой-нибудь сторонний мессенджер. Надеемся, что наш ASR поможет появиться новым необычным стартапам и инди-проектам от молодых перспективных разработчиков».

Как «Тинькофф» проводит встречи и обучает 20 000 сотрудников ежемесячно Импортозамещение ВКС

ASR используется «Вконтакте» для расшифровки голосовых сообщений, генерации субтитров в видео, персональных рекомендаций и многого другого. Под капотом у решения сразу три нейросети: одна отвечает за распознавание речи, вторая находит подходящие слова, а третья расставляет знаки препинания. Технология построена таким образом, чтобы справляться с ежедневной обработкой сотен миллионов сообщений разной длительности, качества и наполнения. Каждое сообщение расшифровывается очень быстро — примерно за 1,5 секунды после отправки.

Поделиться Подписаться на новости Короткая ссылка

Наука и высокие технологии - другие новости