Microsoft дала ИИ настоящий инструмент программиста — и он впервые узнал, как сложно быть человеком

Support81

Модератор
Инструмент debug-gym удваивает успех моделей, но до человека ещё далеко.
Mai



Искусственный интеллект активно внедряется в сферу разработки программного обеспечения, и вряд ли найдётся другая область, где его используют столь широко. От генерации кода по описанию в духе «настроения» до GitHub Copilot и стартапов, которые собирают простенькие приложения за считанные часы при поддержке больших языковых моделей — ИИ уже стал неотъемлемой частью инструментов программиста.

Тем не менее, те, кто рассчитывает, что через пару месяцев ИИ вытеснит большинство разработчиков, сильно переоценивают возможности современных моделей. Главная причина — они по-прежнему плохо справляются с отладкой, а именно на неё уходит большая часть времени любого разработчика. Об этом говорится в исследовании Microsoft Research, где представили новый инструмент debug-gym — платформу для тестирования и улучшения навыков ИИ в поиске и устранении ошибок в коде.

Debug-gym — это среда, в которой ИИ-модели могут работать с реальными репозиториями, используя привычные для программистов инструменты: ставить точки останова, просматривать значения переменных, писать тесты, переходить по коду и так далее. Всё это позволяет моделям не просто «угадывать» исправления на основе изученных ранее шаблонов, а опираться на реальное выполнение программы и логику конкретного проекта. Microsoft отмечает, что без таких средств ИИ-модели в отладке проявляют себя довольно слабо. С ними — ощутимо лучше, но всё равно далеко от уровня опытного разработчика.

В тестах debug-gym модели, получившие доступ к инструментам, показали почти вдвое более высокие показатели успешной отладки по сравнению с теми, кто работал «вслепую». Но даже в лучшем случае модели смогли успешно завершить задание лишь в 48,4% случаев. Это значительный прогресс, но пока явно недостаточный, чтобы заменить человека.

Microsoft объясняет ограничения тем, что текущие языковые модели обучались на данных, в которых мало представлено поведение, характерное для отладки — например, последовательные действия по поиску ошибки. Это делает область особенно перспективной для дальнейших исследований. В следующем этапе планируется обучение специальной модели, заточенной именно под поиск информации, необходимой для устранения багов. Такая «поисковая» модель может помогать более крупной системе, снижая расходы на вычисления.



Скепсис в отношении полной замены программистов ИИ не нов. Уже есть немало исследований, показывающих, что даже если модель способна собрать простое приложение, её код часто содержит баги и уязвимости, которые она не в состоянии исправить. Так что текущий путь скорее ведёт не к полной автономии ИИ, а к созданию эффективного помощника, способного экономить разработчику время, но не заменять его полностью.
Подробнее: https://www.securitylab.ru/news/558291.php
 
Похожие темы
Admin Интересно Microsoft раскрыла детали использования cookie для управления PHP-веб-шеллами на Linux-серверах. Новости в сети 0
Admin Интересно Астронавты Artemis II столкнулись с проблемами в Microsoft Outlook. Новости в сети 0
Admin Интересно Microsoft предупреждает о вредоносных VBS-файлах, распространяемых через WhatsApp. Новости в сети 0
Admin Интересно Microsoft отозвала проблемный патч KB5079391 для Windows 11. Новости в сети 0
Admin Интересно Microsoft позволяет Copilot использовать несколько моделей ИИ одновременно для взаимной проверки. Новости в сети 0
Admin Интересно Microsoft представила новый тест для улучшения взаимодействия роботов с предметами. Новости в сети 0
Admin Интересно Microsoft не успел, а хакеры успели. 0Day в Office помог проникнуть в инфраструктуру Европы. Новости в сети 0
Admin Интересно Китай, США и полмиллиона дыр в безопасности. Старые серверы Microsoft превратились в легкую добычу. Новости в сети 0
Admin Интересно Фишинговая атака через Device Code затронула более 340 организаций Microsoft 365. Новости в сети 0
Admin Интересно Microsoft запретила разгон SSD-дисков в Windows 11. Новости в сети 0
Admin Интересно Microsoft обещает исправить Windows 11, но пользователи недовольны. Новости в сети 0
Admin Интересно Microsoft улучшает Windows 11 на основе обратной связи пользователей. Новости в сети 0
Admin Интересно Microsoft предупреждает о фишинговых атаках с использованием вредоносного ПО. Новости в сети 0
Admin Интересно CISA предупреждает о рисках использования Microsoft Intune после атаки на Stryker. Новости в сети 0
Admin Интересно Илон Маск анонсировал проект Macrohard — цифровую копию Microsoft. Новости в сети 0
Admin Интересно Microsoft запустила медицинский ИИ Copilot Health. Новости в сети 0
Admin Интересно Microsoft исправила 84 уязвимости в мартовском обновлении безопасности. Новости в сети 0
Admin Интересно Microsoft внедрит обновления Windows в фоновом режиме. Новости в сети 0
Admin Интересно Microsoft представила компактную нейросеть Phi-4-reasoning-vision-15B. Новости в сети 0
Admin Интересно Microsoft меняет правила открытия ссылок в Copilot. Новости в сети 0
Admin Интересно Слишком сложно для Microsoft. Как три разработчика сделали сайт npm лучше, чем целая корпорация. Новости в сети 0
Admin Интересно Microsoft раскрыла кампанию ClickFix, использующую Windows Terminal для распространения Lumma Stealer. Новости в сети 0
Admin Интересно Microsoft предупреждает: злоумышленники используют Google для распространения вредоносного ПО. Новости в сети 0
Admin Интересно Microsoft предупреждает: не доверяйте ссылкам от Microsoft. Новости в сети 0
Admin Интересно Microsoft предупреждает о троянизированных игровых утилитах, распространяющих RAT. Новости в сети 0
Admin Интересно «Хотите Windows? Используйте наш инструмент». Microsoft закрывает все неофициальные пути к ISO-образам. Новости в сети 0
Admin Интересно Microsoft - соучастник фишинга: официальная надстройка Outlook годами крала пароли тысяч пользователей. Новости в сети 0
Admin Интересно Один файл + один клик = ODay в MS Office. Microsoft принимает меры против эксплуатируемой уязвимости. Новости в сети 0
Admin Интересно Сначала помогут, потом ограбят. Как хакеры превратили Microsoft Quick Assist в «троянского коня». Новости в сети 0
Admin Интересно Российский хакер нашел «дыру» в Windows. Microsoft пришлось обновить 35 версий системы. Новости в сети 0
Admin Интересно Аста ла виста, бейби. Microsoft официально закрыла историю самой спорной Windows. Новости в сети 0
Admin Интересно «Ваш пароль истекает» (на самом деле нет). Microsoft объясняет, почему нельзя верить даже письмам от собственного HR. Новости в сети 0
D 150k Microsoft D4RKNETHUB CLOUD Раздачи и сливы 0
D 489.6k Microsoft D4RKNETHUB CLOUD Раздачи и сливы 0
D 49.5k Microsoft D4RKNETHUB CLOUD Раздачи и сливы 0
Support81 Новая тактика «Призрачных звонков» использует Zoom и Microsoft Teams для операций C2 Новости в сети 0
Support81 Вирус-вымогатель Akira использует инструмент настройки процессора, чтобы отключить Microsoft Defender Новости в сети 0
ValidMail ♋ 14kk MICROSOFT DOMAIN WITH VALID 05/08/25 ♋ Раздачи и сливы 0
ValidMail ♋ 1.2 MILLION MICROSOFT DOMAIN (HAVE VALID) 30/07/25 ♋ Раздачи и сливы 0
Support81 Microsoft снова сыграла на руку хакерам — корпоративные сети ломают через официальный софт Новости в сети 0
ValidMail ♋ 32k MICROSOFT DOMAINS WITH VALID 21.05.25 ♋ Раздачи и сливы 0
Support81 Плати или рискуй: Microsoft будет брать плату за обновления Windows Новости в сети 0
BinaryCloud (62.263 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (101.200 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
BinaryCloud (78.231 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
BinaryCloud (73.764 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (58.262 lines) UHQ Leak Combos Microsoft Domain Раздачи и сливы 0
BinaryCloud (93.164 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (89.879 lines) UHQ Leak Combos Microsoft Domain Раздачи и сливы 0
BinaryCloud (117.025 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0

Название темы