Исследование показало: программный код, созданный ИИ, содержит больше ошибок, чем код, написанный человеком.

Анализ, проведенный компанией CodeRabbit, показал, что pull request-ы, сгенерированные с помощью инструментов искусственного интеллекта, в среднем содержат 10,83 ошибки, в то время как в pull request-ах, созданных разработчиками, этот показатель равен 6,45. Это влечет за собой увеличение времени, необходимого для проверки кода, и повышает вероятность появления большего количества дефектов в конечном продукте.

Согласно проведенному исследованию, в коде, созданном искусственным интеллектом, количество общих ошибок превышает аналогичный показатель в 1,7 раза, а количество критических и уязвимостей – в 1,4 и 1,7 раза соответственно. Наиболее распространенные дефекты связаны с ошибками в логике и неточностями (наблюдаются в 1,75 раза чаще), недостаточным качеством кода и сложностями его сопровождения (в 1,64 раза чаще), уязвимостями в области безопасности (в 1,57 раза чаще) и проблемами с производительностью (на 1,42 раза чаще).

В числе наиболее распространенных проблем, возникающих в коде, созданном искусственным интеллектом, выделяют некорректную обработку паролей, небезопасные ссылки на объекты, уязвимости типа XSS и небезопасную десериализацию – процесс восстановления данных из преобразованного формата).

Не пропустите:  В России появится новая платформа для игр OnlyGames

По словам Дэвида Локера, директора CodeRabbit AI, инструменты искусственного интеллекта существенно повышают скорость разработки кода, однако они также создают предсказуемые и поддающиеся оценке дефекты, которые компаниям следует активно устранять.

Искусственный интеллект оказался полезным инструментом на начальных этапах разработки программного кода, что позволило увеличить производительность и ускорить создание прототипов. Кроме того, в коде, сгенерированном ИИ, зафиксировано на 1,76 раза меньше орфографических ошибок и на 1,32 раза меньше проблем, связанных с тестированием.

Выпуск Microsoft в 2025 году 1139 патчей CVE (Common Vulnerabilities and Exposures – общедоступные идентификаторы уязвимостей), что является вторым по величине показателем за всю историю, не обязательно указывает на ухудшение ситуации. Разработчики генерируют больше кода с использованием ИИ, поэтому доля проблемных участков кода может оказаться не столь значительной, чем можно предположить изначально. К тому же, модели искусственного интеллекта, такие как семейство GPT от OpenAI, непрерывно улучшаются для обеспечения более точных и безошибочных результатов.

Похожие статьи