Мобильное приложение для распознавания казахской речи разработали в РК

Проект будет бесплатным для пользователей.

26 Мая 2021, 12:08
АВТОР
Подпишитесь на наш
Telegram-канал
и узнавайте новости первыми!
gadgetshelp.com 26 Мая 2021, 12:08
26 Мая 2021, 12:08
13055
Фото: gadgetshelp.com

Казахстанские разработчики создали мобильное приложение TezText, которое распознает устную казахскую речь и преобразовывает ее в текст, передает корреспондент BaigeNews.kz. Приложение придумано, в основном, в помощь журналистам, которые берут интервью, а потом вынуждены длительное время расписывать диалог. Разработка значительно облегчает им эту задачу.

"TezText позволяет записывать аудио в приложении, распознать казахскую речь в режиме реального времени, а также в загруженных аудиофайлах. Записывая речь через приложение, вы сможете получить мгновенный результат сразу после окончания записи. У вас будет уже распознанный текст после нажатия на кнопку "Stop". Приложение также позволит удобно взаимодействовать с уже записанными аудио. Для быстрой записи, для быстрой навигации среди записей в TezText есть возможность предпросмотра загруженных аудио. Вы можете послушать записанные аудио и нажатием на кнопку "Весь текст" увидеть полную версию распознанного предложения. Каждый, кто активно работает с медиа, создает очень много контента, будь это фото, видео или аудио, чтобы не потеряться в аудиозаписях, мы сделали функцию "Добавить в избранное". Вы можете добавлять туда наиболее важные для вас аудиозаписи. Журналисты в работе используют профессиональные диктофоны. Мы разработали функцию загрузки аудиофайлов. Вы можете загрузить аудиофайл для распознания прямо из приложения", - рассказал один из разработчиков приложения Абай Сергазиев.

Команда "Галамат Тех", создавшая этот проект, работала над ним более полугода. Финансировало их Посольство США в Казахстане. Мобильное приложение бесплатно для пользователей, его можно скачать в Play Market или AppStore.

"При сборе голосовых данных для акустической модели мы привлекли волонтеров со всего Казахстана. С их помощью мы собрали более 10 тысяч слов живой казахской речи. Средний возраст волонтеров составляет 23 года, 60 процентов из них - представители женского пола. Для корректного распознавания речи мы использовали специальные материалы: казахоязычные статьи из Википедии, из различных новостных агентств, а также из художественных произведений. В итоге нам удалось собрать более 40 миллиона предложений. Таким образом мы на самом деле добились хорошего уровня распознавания, в частности для журналистов. Задача по распознаванию речи относится к высокоинтеллектуальному и трудоемкому роду задач, поэтому за такой короткий период добиться такого распознавания на самом деле является очень хорошим результатом. В данный момент мы не остановились, также работаем над качеством распознавания и постоянно улучшаем языковую модель", - рассказал представитель "Галамат Тех" Нургаин Сакиев.

Разработчики подсчитали, что на раскадровку устного интервью журналист тратит в среднем два часа. Мобильное приложение TezText справляется с этой задачей в несколько раз быстрее. К тому же, разработка экономит не только время репортера, но и его деньги, говорят авторы проекта. Услуги транскрибатора (специалиста по декодированию аудиозаписи), к которым журналисты нередко обращаются за помощью, стоят от четырех тысяч тенге и выше.

По словам Сакиева, существуют много мобильных приложений по распознаванию русской и английской речей, но IT-продукта по декодированию казахской речи до сих пор не было.

Наверх