Сбер существенно обновил лингвистические возможности своей нейросети GigaChat: теперь ИИ понимает более 30 национальных языков. Обновление, подготовленное при участии ученых и носителей речи, позволит пользователям искать информацию и работать с документами на родном языке.
В список поддерживаемых наречий вошли татарский, башкирский, чувашский, чеченский, якутский, бурятский и другие языки. Для обучения системы Сбер привлек экспертов из Дома народов России, команды интернет-энциклопедии «Рувики», а также специалистов региональных академий наук и профильных фондов.Обучение на живой речи
Базой для обучения послужили миллионы документов: от архивных текстов и научных работ до современных новостных материалов. Особенностью проекта стало участие носителей языка, которые вручную проверяли корректность грамматики и соответствие ответов естественной речи. Разработчикам удалось адаптировать алгоритмы так, чтобы нейросеть выдавала качественный результат даже при ограниченном объеме данных. Теперь GigaChat одинаково хорошо распознает как строгий литературный слог, так и разговорный стиль.
Цифровой помощник для регионов
Обновление ориентировано на упрощение доступа к технологиям для людей разных поколений и сохранение культурного наследия. По словам представителей Сбера, использование нейросети на национальных языках открывает новые возможности:
- быстрый поиск информации и обучение;
- подготовка официальных и личных документов;
- взаимодействие с государственными и цифровыми сервисами.
Комментарии (0)
Пока нет комментариев. Будьте первым!