© 2016 Икском.Хобби
16.03.2017 в 08:27

Baidu представила SwiftScribe — сервис для транскрибации аудио

Baidu представила SwiftScribe — сервис для транскрибации аудио

Ведущая китайская поисковая система Baidu объявила о запуске веб-приложения SwiftScribe. Программа создана на базе искусственного интеллекта и предназначена для быстрого перевода аудио в текст. Несколько последних лет разработчик активно продвигал приложения для распознавания речи DeepSpeech, в прошлом году появилась специальная клавиатура для Android под названием TalkType, а в этом уже собственный онлайн-сервис транскрибации. Кроме этого, не так давно была представлена система быстрого синтеза речи — Deep Voice, что еще раз подтверждает заинтересованность Baidu в создании ПО для работы с голосом.

SwiftScribe позволяет загрузить файл в формате WAV или MP3 и сразу же начать его обрабатывать. Для расшифровки 30-секундного ролика необходимо около 10 секунд, 60-секундного — полминуты. Максимальная длина аудиофайла может составляет 1 час, а для его обработки потребуется около 20 минут.

После первичной конвертации необходимо провести корректировку. Предстоит добавить заглавные буквы, знаки препинания, а также изменить некоторые слова или словосочетания. 

Представители Baidu отмечают, что пока приложение находится на этапе закрытого бета-теста. В будущем из него сделают коммерческий продукт и добавят ряд возможности, например, обработку видео, вставку субтитров, поддержку различных форматов аудио и т. д.

Комментарии (0)