Студенты Московского физико-технического института представили программное решение, которое сокращает время обработки данных в нейронных сетях в полтора раза. Технология позволяет запускать тяжелые модели искусственного интеллекта на устройствах с ограниченными вычислительными мощностями, сохраняя при этом исходную точность предсказаний, что открывает новые возможности для мобильной электроники и интернета вещей.
Разработка опирается на метод квантования весов, который уменьшает размер моделей без потери качества вычислений. Авторы проекта использовали специфические математические оптимизации, позволяющие нейросети выполнять операции с меньшей нагрузкой на процессор. В ходе тестирования алгоритм показал стабильные результаты на популярных архитектурах глубокого обучения, включая системы распознавания речи и визуальных образов.Текущие методы сжатия часто приводят к заметным ошибкам в работе ИИ. Команда МФТИ нашла способ сбалансировать скорость и точность, перераспределяя нагрузку между слоями сети в динамическом режиме. Исследователи уже получили предварительные патенты и ведут переговоры с производителями микрочипов о внедрении своего кода в прошивки будущих устройств. Это решение способно значительно увеличить время автономной работы гаджетов при использовании нейросетевых функций.
Комментарии (0)
Пока нет комментариев. Будьте первым!