Admin
Администратор
Исследователи из Alibaba представили языковую модель ROME, которая способна самостоятельно выполнять сложные задачи.
ROME обходит более крупные модели, используя всего три миллиарда параметров.
Модель ROME, построенная на архитектуре Qwen3-MoE, прошла многоэтапное обучение и демонстрирует выдающиеся результаты на бенчмарках. Она способна писать и отлаживать код, работать с терминалом и исправлять собственные ошибки. Экосистема ALE, включающая компоненты ROLL, ROCK и iFlow CLI, обеспечивает полный цикл от обучения до развертывания. Особенность ROME — новый алгоритм обучения IPA, который стабилизирует градиентное обновление на длинных горизонтах. Модель уже используется в реальных условиях.