Это первая ИИ-модель такого масштаба, созданная в Центральной Азии
Казахстанский стартап Cybernet AI представил крупнейшую модель автоматического распознавания речи (ASR), специально разработанную для тюркских языков, передает Azattyq Rýhy со ссылкой на пресс-службу Министерства искусственного интеллекта и цифрового развития РК.
Это первая ИИ-модель такого масштаба, созданная в Центральной Азии и изначально спроектированная под особенности тюркской языковой группы, а не адаптированная из англоязычных решений.
Разработка была реализована при стратегической поддержке Astana Hub и Министерства искусственного интеллекта и цифрового развития РК. Для обучения модели использовалась GPU-инфраструктура компании Microsoft.
По словам управляющего директора Astana Hub Таната Ускембаева, проект открывает для стран тюркского мира новые возможности цифровизации сервисов на родных языках.
«Для Казахстана это означает переход от роли потребителя глобальных ИИ-решений к роли разработчика собственных технологий, конкурентоспособных на международном уровне», - отметил он.
ИИ-модель обучена на казахском, турецком, узбекском, кыргызском, азербайджанском и татарском языках. Кроме того, она корректно распознаtт смешанную тюркско-русскую речь, которая широко используется в повседневном общении, бизнесе и при получении государственных услуг.
До этого Казахстан и другие страны Центральной Азии были вынуждены использовать международные ASR-модели, ориентированные в первую очередь на английский язык. Такие решения плохо учитывали тюркскую фонетику, акценты и языковое переключение, что снижало точность голосовых AI-сервисов.
В Cybernet AI сознательно отказались от адаптации англоязычных решений и разработали модель внутри региона и для региона.
«Мы создали ASR-модель, которая изначально понимает живую, смешанную разговорную речь. Это вклад в формирование локальной ИИ-экосистемы и технологического суверенитета Казахстана», - отметил CTO компании Рашид Исмаилов.
Модель ориентирована на бизнес и государственные структуры, работающие с большими объёмами голосовых коммуникаций. Среди них:
Разработчики отмечают, что использование новой ASR-модели позволит сократить расходы на поддержку клиентов и обеспечить круглосуточный сервис в голосовом формате. Модель устойчива к шумам, акцентам и переключению языков в одном предложении и демонстрирует высокую точность — от финтеха до сферы госуслуг.