Подписаться на ленту новостей через RSS канал
25 October 2020
О чем же статья:
1. Рассказываем, как использовали распознавание и синтез речи других компаний при работе с чат-ботами и голосовыми помощниками и почему решили создавать свой ASR и выкладывать его в Open Source.
2. Раскрываем главные ингредиенты рецепта современной системы распознавания речи.
3. Приводим примеры интересных разработок, которые мы сами изучали, «щупали» и сравнивали на старте нашего проекта.
4. Отвечаем на вопросы: «Какие существуют метрики для оценки качества распознавания? И что нужно учитывать при разработке и подготовке датасетов?»
5. Описываем процесс сбора и разметки данных и узнаем ответ на главный вопрос: «Сколько нужно данных?». Спойлер: очень много, чем больше, тем лучше)
6. Знакомим с алгоритмами работы технологии распознавания речи NLab Speech и нашего бесплатного распознавания речи SOVA ASR.
7. И посвящаем вас в свои планы на будущее.
В качестве бонуса в статье найдете примеры аудио тестовых датасетов и алгоритмы решения всех сложностей, с которыми нам пришлось столкнуться в процессе разработки. Обещаем, будет интересно, полезно и познавательно!
Прочитать статью https://bit.ly/3oo0DUs
Недавние публикации:
Виртуальный помощник Зожик окажет поддержку во время пандемии,
News, 04 May 2020
Виртуальные ассистенты для банков,
Articles, 01 May 2020
Кейс: Чат-бот Хэдди для HeadHunter,
Articles, 01 May 2020