ИИ-стартап Anthropic обновил свою флагманскую модель Claude Opus до версии 4.6. Нейросеть стала лучше планировать действия, справляться с длительными задачами ИИ-стартап Anthropic обновил свою флагманскую модель Claude Opus до версии 4.6. Нейросеть стала лучше планировать действия, справляться с длительными задачами

Claude Opus 4.6 обошла GPT-5.2 в тестах на логику и получила «команду агентов»

2026/02/06 19:49
3м. чтение

Claude Opus 4.6 обошла GPT-5.2 в тестах на логику и получила «команду агентов»

ИИ-стартап Anthropic обновил свою флагманскую модель Claude Opus до версии 4.6. Нейросеть стала лучше планировать действия, справляться с длительными задачами и эффективнее работать с объемными базами кода.

Контекстное окно расширили до 1 млн токенов. Такой объем позволяет анализировать массивные документы и вести долгие диалоги без потери логической нити.

Обновленные алгоритмы адаптированы для решения рабочих задач: проведению финансового анализа, исследования, использованию и созданию документов, таблиц и презентаций.

Opus 4.6 получила наивысшую оценку в тесте по программированию Terminal-Bench 2.0 и опередила конкурентов в сложном междисциплинарном бенчмарке на логическое мышление Humanity’s Last Exam.

Сравнение Opus 4.6 с конкурентами в ряде тестов. Источник: Anthropic.

В GDPval-AA, который оценивает качество рассуждений и принятия решений, модель превзошла GPT-5.2 от OpenAI. LLM также показала лучшие результаты в BrowseComp, который измеряет способность находить в интернете труднодоступную информацию.

Источник: Anthropic.

Opus 4.6 эффективно извлекает данные из объемных документов. Благодаря расширенному контекстному окну модель отслеживает и улавливает неочевидные скрытые детали.

Команды агентов

Ключевое нововведение — возможность создавать группы агентов для совместной работы. В таком режиме несколько ИИ-ассистентов работают параллельно и координируют свою работу автономно.

Инструмент подходит для поручений, которые разделяются на независимые и требуют анализа большого количества текста.

Замкнутый цикл

В Anthropic заявили, что «создают Claude вместе с Claude». Разработчики пишут код с помощью собственной ИИ-модели, а каждый новый продукт перед релизом проходит проверку на внутренних задачах компании.

Команда обнаружила, что Opus 4.6 уделяет больше внимания самым сложным частям задачи без дополнительных указаний, быстро выполняет простые поручения, лучше справляется с неоднозначными проблемами и сохраняет эффективность на длинных дистанциях.

Безопасность

Автоматизированный аудит выявил у Opus 4.6 низкую склонность к нежелательному поведению: обману, лести, укреплению заблуждений пользователя и содействию в неправомерных действиях.

Модель демонстрирует безопасность на уровне Opus 4.5. Источник: Anthropic.

Для проверки модели компания провела наиболее полную серию оценок, впервые применив новые методики тестирования и усовершенствовав существующие.

Доступность и новые функции

Claude Opus 4.6 уже доступна в веб-интерфейсе, через API и на основных облачных платформах.

В инструментарий для разработчиков новые функции:

  • адаптивное мышление — нейросеть самостоятельно определяет, когда необходимо задействовать режим глубокого рассуждения;
  • регулировка усилий — предусмотрено четыре уровня интенсивности работы: от низкого до максимального;
  • уплотнение контекста — инструмент автоматически резюмирует и заменяет старый контекст, когда разговор приближается к порогу токенов.

Opus 4.6 лучше работает с офисными инструментами вроде Excel и PowerPoint.

Напомним, в январе CEO Anthropic Дарио Амодеи предсказал скорое появление AGI и сокращения рабочих мест.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Возможности рынка
Логотип 4
4 Курс (4)
$0.010772
$0.010772$0.010772
+9.96%
USD
График цены 4 (4) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Крупная подсказка Kraken: Pi Coin готовится к листингу на бирже в 2026 году

Крупная подсказка Kraken: Pi Coin готовится к листингу на бирже в 2026 году

Pi Coin (PI) глубоко погружён в продолжающуюся криптозиму, которая обрушила капитализацию мирового крипторынка ниже $2,4 трлн. Мобильный майнинг
Поделиться
Coinstats2026/02/07 09:25
Отчаявшийся Трамп «разжигает ненависть», чтобы скрыть еще больший скандал: звезда демократов

Отчаявшийся Трамп «разжигает ненависть», чтобы скрыть еще больший скандал: звезда демократов

Конгрессмен Жасмин Крокетт (демократ от Техаса) раскритиковала президента Дональда Трампа на MS NOW в пятницу вечером в ответ на его расистский пост в социальных сетях с видео теории заговора
Поделиться
Rawstory2026/02/07 09:34
Трамп может превратить Олимпиаду 2028 года в шоу MAGA, предупреждает аналитик

Трамп может превратить Олимпиаду 2028 года в шоу MAGA, предупреждает аналитик

Дональд Трамп может устроить грандиозное шоу в стиле MAGA в последний год своего президентства, предполагает обозреватель Slate Джастин Питерс, используя Олимпийские игры 2028 года в Лос-Анджелесе
Поделиться
Rawstory2026/02/07 09:25