Голос степи: как бурятский язык завоёвывает киберпространство
Национальный язык стал доступен в сервисе «Яндекса». Так появилась возможность переводить тексты с бурятского языка на более чем 100 других языков.

Литературный бурятский
«Яндекс» стремится к тому, чтобы соблюдались все правила правописания, лексическая сочетаемость. Когда мы сделаем миллион предложений, то тогда бурятскому языку можно будет научить искусственный интеллект. И тогда он обретёт вечность», – заявлял директор Республиканского центра «Бэлиг» Баир Балданов. На пути к этой значимой цели специалисты Центра завершили важную работу: перевели на бурятский язык и отредактировали три датасета. Это стало значимым шагом к созданию полноценной цифровой инфраструктуры для бурятского языка, что открывает двери для множества новых возможностей. Проект ориентирован не только на переводы текстов, но и на создание рабочих инструментов для задач ИИ, таких как машинный перевод, распознавание речи и образовательные приложения.
Объёмные технические работы производились в кооперации с компанией «Яндекс». И вот в День бурятского языка, 24 октября 2025 года, произошло историческое событие – бурятский язык появился в сервисе «Яндекс Переводчик». Это сделало язык доступным для перевода на более чем 100 других языков. Конечно, речь идёт о «литературном» варианте бурятского, принятом в Бурятии, который может быть непривычен носителям диалектов. Однако это, безусловно, шаг вперёд. Даже с учётом того, что пока «Яндекс Переводчик» находится в стадии бета-версии, и для полноценной работы необходимо добавить ещё сотни тысяч фраз, что потребует дальнейших усилий.
Спасти языки из «Красной книги»
Переведённые датасеты – это лишь начало. В дальнейшем эти данные могут стать основой для создания полноценной экосистемы цифровых решений: переводчиков, интерфейсов для обучения, а также приложений, поддерживающих бурятский язык. В планах – создание обучающих курсов и пособий для школ, что откроет новые возможности для образовательной среды на бурятском языке.

Но для того, чтобы проект стал полноценным, предстоит решить ряд технических и культурных проблем. В частности, необходимо разработать транслитерацию для тех, кто не владеет кириллицей, а также улучшить качество перевода, который пока ещё не может полностью передать нюансы всех бурятских диалектов. В дополнение к этому продолжаются работы по голосовым технологиям, что даст возможность интегрировать бурятский в мобильные приложения и системы виртуальных ассистентов.
Интересно, что создание NLP-модулей для бурятского языка привлекает внимание не только на локальном, но и на международном уровне. В последние годы увеличивается количество проектов, ориентированных на языки, находящиеся на грани исчезновения. Эти примеры показывают, как цифровизация языков может быть важным инструментом для их сохранения и развития.
Миллионы предложений, миллиарды слов
Для понимания значимости текущих инициатив стоит вспомнить несколько крупных шагов последних лет. В 2024 году началась работа по созданию корпуса бурятского языка для интеграции в сервисы «Яндекса», что стало основой для развития машинного перевода и цифровых платформ (объём информации составил 2112,97 мегабайта – более 2 млн предложений на бурятском языке). Важным направлением также стало развитие цифровых образовательных ресурсов на родных языках, включая школьные программы и онлайн-курсы.
Особое внимание уделяется переводу учебников на бурятский язык с учётом культурных особенностей. В 2026 году планируется начать перевод учебников по математике, окружающему миру, физкультуре и другим предметам, что позволит интегрировать бурятский язык в основной образовательный процесс.
«Народ без языка - не народ»
«Президент России Владимир Владимирович Путин, находясь с визитом в Чукотском автономном округе, сказал о важности сохранения и развития родных языков всех народов России. Наша работа в Бурятии полностью соответствует этой цели. Народ без языка - не народ, а язык без народа - не язык», - подчёркивает глава центра «Бэлиг» Баир Балданов.

Развитие бурятского языка в цифровой среде – это процесс многоэтапный. Огромную роль здесь играет продолжение работы над транслитерацией для иностранных пользователей и улучшение качества перевода, чтобы учесть все диалектные различия бурятского языка. Вот почему одним из главных вызовов остаётся необходимость в фундаментальных лингвистических исследованиях. Только глубокий научный подход к изучению всех диалектов, особенностей грамматики и произношения, позволит языку стать не поверхностно цифровым, а ярким и многогранным.









































