Anthropic анонсировала выпуск новой, высокоэффективной модели Claude Sonnet 4.5, демонстрирующей выдающиеся результаты в задачах программирования. По утверждению разработчиков, Claude Sonnet 4.5 позволяет создавать не только прототипы, но и полностью функциональные приложения.
Новая версия Claude Sonnet 4.5 будет предоставляться через API Claude и в чат-боте Claude. Для разработчиков стоимость использования останется на уровне Claude Sonnet 4: 3 доллара за миллион входящих токенов (что эквивалентно примерно 750 000 словам) и 15 долларов за миллион исходящих токенов.
Claude Sonnet 4.5 признана ведущей моделью программирования. Она является наиболее эффективным инструментом для разработки сложных агентов и позволяет максимально использовать возможности компьютеров. Модель демонстрирует заметные улучшения в области логических выводов и математических вычислений.
Anthropic
По мнению Anthropic, Claude Sonnet 4.5 показывает лучшие результаты среди конкурентов в ряде тестов, включая SWE-Bench Verified. Однако специалист по искусственному интеллекту из Anthropic, Дэвид Херши, рассказал TechCrunch, что для оценки эффективности Claude Sonnet 4.5 полагаться исключительно на результаты бенчмарков затруднительно.
По словам представителей компании Херши, в ходе первоначальных тестов у некоторых корпоративных заказчиков наблюдалось, что Claude Sonnet 4.5 самостоятельно занимался программированием до 30 часов. За указанный период времени искусственный интеллект не только разрабатывал приложение, но и настраивал службы баз данных, регистрировал доменные имена и проводил аудит SOC 2 для подтверждения безопасности продукта.
Майкл Труэлл, генеральный директор Cursor, отметил, что Claude Sonnet 4.5 демонстрирует выдающиеся результаты в программировании, особенно при решении задач, требующих продолжительного анализа. Джефф Ван, глава Windsurf, назвал Claude Sonnet 4.5 «моделью программирования нового поколения».
Anthropic заявляет, что Claude Sonnet 4.5 является наиболее продвинутой ИИ-моделью на текущий момент, демонстрируя сниженные проявления лести и дезинформации по сравнению с предыдущими версиями. Кроме того, компания отмечает, что Claude Sonnet стал устойчивее к манипуляциям посредством запросов.
