Anthropic представила обновленную версию Claude 3.5 Sonnet, которая демонстрирует значительный прирост производительности в задачах программирования и визуального анализа. Модель показывает улучшенные результаты в бенчмарках на написание кода и работу с интерфейсами, сохраняя при этом высокую скорость отклика и эффективность обработки сложных многоступенчатых инструкций, что делает её одним из наиболее сбалансированных решений для разработчиков.

Ключевым нововведением стала оптимизация работы с «компьютерным использованием» (Computer Use), позволяющая модели более точно взаимодействовать с элементами графического интерфейса. Это расширяет возможности автоматизации рутинных задач, где требуется не просто генерация текста, а выполнение последовательных действий в браузере или десктопных приложениях. Модель лучше справляется с интерпретацией визуальных данных, что критично для анализа скриншотов и сложных макетов.

Разработчики также отметили улучшение способности модели следовать сложным системным промптам и поддерживать контекст в длинных диалогах. Это снижает вероятность галлюцинаций при работе с большими кодовыми базами и технической документацией. Обновление направлено на повышение надежности агентов, которые требуют высокой точности исполнения команд в реальном времени.

Ключевые факты

  • Claude 3.5 Sonnet демонстрирует лидерство в тестах на написание кода, опережая предыдущие итерации в задачах рефакторинга.
  • Улучшенная поддержка Computer Use позволяет модели эффективнее управлять курсором и кликать по элементам интерфейса.
  • Снижен уровень ошибок при выполнении многошаговых инструкций, требующих высокой степени логической последовательности.
  • Модель сохранила прежнюю ценовую политику, несмотря на значительное повышение качества генерации и визуального восприятия.
  • Улучшена работа с визуальным контекстом, что позволяет точнее распознавать элементы дизайна и структуру веб-страниц.