Интересно 16 ИИ-агентов Claude, две недели и $20 000. Как искусственный интеллект написал компилятор C и собрал ядро Linux.

Admin

Администратор

16 ИИ-агентов Claude, две недели и $20 000. Как искусственный интеллект написал компилятор C и собрал ядро Linux.


1770660533943

Компилятор от ИИ-агентов успешно прошел 99% стресс-тестов GCC.


Шестнадцать автономных ИИ-агентов Claude совместно написали новый компилятор языка C и даже смогли собрать рабочее ядро Linux. Эксперимент обошелся примерно в 20 000 долларов, занял две недели и выглядел впечатляюще, но без плотного контроля со стороны человека дело все же не обошлось.

Исследователь компании Anthropic Николас Карлини рассказал о проекте, в котором запустил 16 экземпляров модели Claude Opus 4.6 в общей среде разработки. Каждому агенту выдали доступ к одному хранилищу кода и набор задач. Они сами выбирали, что исправлять и что добавлять дальше, синхронизировали изменения и разрешали конфликты версий без центрального управляющего узла. Всего прошло почти 2000 сеансов работы, а итоговый объем кода превысил 100 000 строк. Компилятор написан на языке Rust и способен собирать загружаемое ядро Linux версии 6.9 для архитектур x86, ARM и RISC-V.

Разработчики выложили результат в открытый доступ. Компилятор смог собрать ряд крупных открытых проектов, среди них PostgreSQL, SQLite, Redis, FFmpeg и QEMU. Он прошел около 99% проверок из стрессового набора тестов для компиляторов GCC и даже справился со сборкой и запуском игры Doom, что сам автор эксперимента назвал показательной проверкой для разработчика.

При этом задача была во многом удобной именно для ИИ. Спецификация языка C давно устоялась, существуют подробные тестовые наборы и эталонные компиляторы для сверки результата. В реальной разработке чаще всего сложнее не написать код, а правильно сформулировать требования и проверки, чего здесь не требовалось.

Ограничений у проекта тоже немало. Компилятор не умеет генерировать 16-битный код для x86, который нужен на ранней стадии загрузки Linux, поэтому на этом шаге используется GCC. Собственные ассемблер и компоновщик пока работают с ошибками. Даже при включенных оптимизациях результат получается менее эффективным, чем код GCC без оптимизаций. Качество исходников на Rust остается рабочим, но заметно уступает уровню опытного разработчика. По словам Карлини, по мере роста проекта исправление одних ошибок часто ломало уже работающие части.

Автор называет реализацию «чистой», потому что агенты не имели доступа к интернету во время работы. Однако сами модели обучались на огромных массивах открытого исходного кода, где почти наверняка были и GCC, и Clang, и другие компиляторы. В классическом понимании «чистая» разработка означает, что создатели не видели оригинальную реализацию, поэтому такое определение вызвало споры среди программистов.

Сумма в 20 000 долларов покрывает только расходы на обращения к интерфейсу модели. В нее не входят затраты на обучение самой модели, а также ручная работа по подготовке среды. Карлини пришлось создать специальные стенды тестирования, систему непрерывных проверок и механизмы обратной связи. Например, подробные журналы тестов перегружали рабочий контекст модели и мешали ей, поэтому вывод пришлось сокращать до коротких сводок.

Также выяснилось, что модель не ощущает время и может часами гонять проверки без прогресса, поэтому добавили ускоренный режим с выборочной проверкой 1-10% тестов. Когда все агенты застряли на одной и той же ошибке в ядре Linux, в схему включили GCC как эталон для сравнения, чтобы распределить задачи по разным файлам.

Исследователь отмечает, что год назад языковые модели не могли приблизиться к созданию рабочего компилятора даже при неограниченном бюджете и постоянном присмотре. Подход с группой параллельных агентов и координацией через систему контроля версий он считает перспективным. В то же время его беспокоит тенденция к внедрению программ, которые разработчики не проверяли лично. По его мнению, это может стать новой зоной риска в безопасности программного обеспечения.
 
Последнее редактирование:
Похожие темы
Admin Интересно Mozilla создает базу знаний для ИИ-агентов, аналогичную Stack Overflow. Новости в сети 0
Admin Интересно NVIDIA представила инструмент NemoClaw для безопасного запуска ИИ-агентов. Новости в сети 0
Support81 Этичный хакинг? Забудьте. США готовят рои ИИ-агентов для атаки на Китай Новости в сети 0
Admin Интересно Милла Йовович создала инструмент для памяти ИИ MemPalace, но разработчики сомневаются. Новости в сети 0
Admin Интересно Американские чиновники предупредили банки о киберрисках от новой модели ИИ. Новости в сети 0
Admin Интересно Математик предложил новый метод предсказания хаоса в жидкостях с помощью ИИ. Новости в сети 0
Admin Интересно MemPalace: Милла Йовович запустила открытый инструмент для долгосрочной памяти ИИ. Новости в сети 0
Admin Интересно ИИ-алгоритмы демонстрируют неожиданную солидарность друг с другом. Новости в сети 0
Admin Интересно Google представила мощную ИИ-модель Gemma 4, которая работает даже на слабом железе. Новости в сети 0
Admin Интересно Гонка вооружений в сфере ИИ: почему управление уязвимостями становится приоритетом для компаний. Новости в сети 0
Admin Интересно Европейский союз запрещает использование ИИ для создания поддельных откровенных изображений. Новости в сети 0
Admin Интересно Microsoft позволяет Copilot использовать несколько моделей ИИ одновременно для взаимной проверки. Новости в сети 0
Admin Интересно 43% сотрудников опасаются, что ИИ лишит их работы. Как страх увольнения убивает эффективность бизнеса. Новости в сети 0
Admin Интересно ИИ ускоряет проектирование и строительство ядерных реакторов. Новости в сети 0
Admin Интересно Расширения для браузеров с функцией ИИ стали инструментом слежки. Новости в сети 0
Admin Интересно Дэвид Сакс покинул пост советника Белого дома по ИИ и присоединился к технологическому совету Трампа. Новости в сети 0
Admin Интересно Наталья Касперская предложила регулировать использование ИИ в образовании. Новости в сети 0
Admin Интересно ИИ стал инструментом для создания запрещённого контента. Новости в сети 0
Admin Интересно Новый гибридный ИИ предсказывает срок службы батарей с высокой точностью. Новости в сети 0
Admin Интересно ИИ RAVEN обнаружил 31 скрытую экзопланету среди 2 миллионов звезд. Новости в сети 0
Admin Интересно Критическая уязвимость в Python-библиотеке LiteLLM: миллионы разработчиков ИИ оказались под угрозой. Новости в сети 0
Admin Интересно OpenAI Foundation инвестирует $1 млрд в использование ИИ для лечения болезней. Новости в сети 0
Admin Интересно 20 часов до первого удара. Как ИИ-инструменты лишили системных администраторов сна. Новости в сети 0
Admin Интересно Нейросеть написала код, а пароль спрятать забыла. ИИ превратил GitHub в решето. Новости в сети 0
Admin Интересно Белый дом предлагает единый закон об ИИ для защиты детей и упрощения регулирования. Новости в сети 0
Admin Интересно Иностранные ИИ-инструменты должны соответствовать российским ценностям или покинуть страну. Новости в сети 0
Admin Интересно ИИ-терапия провалилась. Чат-боты проигрывают людям в борьбе с одиночеством. Новости в сети 0
Admin Интересно Systemd 260 удаляет поддержку старых скриптов и внедряет ИИ в разработку. Новости в сети 0
Admin Интересно Google представила обновлённый инструмент Stitch для проектирования интерфейсов с использованием ИИ. Новости в сети 0
Admin Интересно Минцифры выставило на обсуждение закон о суверенном ИИ. Новости в сети 0
Admin Интересно Компании в Индии обязаны раскрывать использование ИИ для получения киберстрахования. Новости в сети 0
Admin Интересно ИИ находит слишком много багов. Но разработчики нашли способ спасти Open Source от наплыва отчётов. Новости в сети 0
Admin Интересно ИИ в цифровой среде TerraLingua начал проявлять социальное поведение и обман. Новости в сети 0
Admin Интересно Пентагон внес ИИ-компанию в чёрный список за отказ сделать ИИ опаснее. Новости в сети 0
Admin Интересно ИИ теперь создаёт не только красивые, но и прочные объекты. Новости в сети 0
Admin Интересно Gartner рекомендует отключать корпоративный ИИ по пятницам после обеда. Новости в сети 0
Admin Интересно Популярные системы управления ИИ оказались уязвимыми для атак. Новости в сети 0
Admin Интересно Киберпреступники используют ClickFix для распространения macOS-трояна через поддельные установщики ИИ-инструментов. Новости в сети 0
Admin Интересно Microsoft запустила медицинский ИИ Copilot Health. Новости в сети 0
Admin Интересно Хакеры используют ИИ для создания вредоносного ПО Slopoly. Новости в сети 0
Admin Интересно Китайский регулятор предупредил об опасностях ИИ-инструмента OpenClaw. Новости в сети 0
Admin Интересно Hacker News запрещает комментарии, созданные или отредактированные с помощью ИИ. Новости в сети 0
Admin Интересно Китайские микродрамы с ИИ-животными стали хитом среди поколения Z. Новости в сети 0
Admin Интересно ИИ-чатботы признаны опасными после рекомендаций совершить насилие. Новости в сети 0
Admin Интересно Правительство может разрешить использование защищенных материалов для обучения ИИ. Новости в сети 0
Admin Интересно ИИ-хакеры захватывают сети всего за 29 минут. Новости в сети 0
Admin Интересно Как предотвратить утечку данных через ИИ: вебинар по аудиту современных агентских процессов. Новости в сети 0
Admin Интересно Пакистанские хакеры перешли на массовое производство вредоносного кода с помощью ИИ. Новости в сети 0
Admin Интересно Конец плавящимся дата-центрам: ИИ заставили считать на фотонах и навсегда отменили проблему перегрева серверов. Новости в сети 0
Admin Интересно ИИ помогает продвигать псевдонаучные теории, обходя академические барьеры. Новости в сети 0

Название темы