Anthropic готовит массовый запуск Claude Mythos, несмотря на тревоги кибербезопасности, и обновляет Opus 4.8

1 час назад 1 источник neutral

Главное по теме:

  • Предоставленная новость не связана с криптовалютным рынком, поэтому анализ и рекомендации по данной теме невозможны.

Компания Anthropic объявила, что её самая мощная и одновременно самая спорная ИИ-модель — Claude Mythos — станет доступна широкому кругу клиентов «в ближайшие недели». Это заявление прозвучало одновременно с релизом Claude Opus 4.8 — новой версии флагманской линейки, которая получила значительный прирост производительности, но сохранила прежнюю цену в $5 за миллион входных токенов и $25 за миллион выходных.

Claude Mythos впервые засветилась в марте после утечки черновиков блога Anthropic. Уже тогда компания называла её «самой мощной моделью из когда-либо созданных», подчёркивая способности в области кибербезопасности, которые далеко опережают существующие аналоги. Однако именно эти способности вызвали волну критики. Исследователи из Британского института безопасности ИИ выяснили, что Mythos может автономно выполнить сложную 32-шаговую симуляцию атаки на корпоративную сеть — задание, на которое у живой команды специалистов уходит до 20 часов. В апреле Mozilla сообщила, что модель обнаружила 271 уязвимость в браузере Firefox, а стартап Calif использовал превью-версию Mythos для создания эксплойта под чипы Apple M5 Mac.

На данный момент доступ к Mythos строго ограничен программой Project Glasswing, в рамках которой модель тестируют избранные технологические компании, правительственные структуры и эксперты по безопасности. Anthropic утверждает, что модель поможет защитникам быстрее находить и закрывать уязвимости, но регуляторы и исследователи опасаются обратного эффекта — автоматизации кибератак. Генеральный директор OpenAI Сэм Альтман даже обвинил конкурента в «маркетинге на страхе», заявив, что предупреждения о рисках Mythos могут стать предлогом для ограничения доступа к продвинутому ИИ.

Параллельно представленный Claude Opus 4.8 демонстрирует серьёзный прогресс в бенчмарках. Тест SWE-bench Pro, оценивающий способность решать реальные задачи по программной инженерии, модель прошла с результатом 69,2% (рост с 64,3% у Opus 4.7). Для сравнения: GPT-5.5 от OpenAI набрала 58,6%, а Gemini 3.1 Pro от Google — 54,2%. В дисциплинарном экзамене Humanity’s Last Exam модель достигла 49,8% без инструментов и 57,9% с ними, а в OSWorld-Verified (работа с пользовательскими интерфейсами) — 83,4%. Кроме того, показатели «обманчивого» поведения и склонности к сотрудничеству с вредоносными запросами у Opus 4.8 снизились до уровня, сопоставимого с Mythos Preview, что делает её в четыре раза надёжнее предшественницы в плане пропуска багов.

Для Opus 4.8 введена гибкая система выбора «усилий» модели: режимы Low, Medium, High, Extra и Max позволяют балансировать между скоростью и глубиной анализа. В быстром режиме цена вырастает до $10 за вход и $50 за выход, но Anthropic подчёркивает, что это в три раза дешевле аналогичного ускорения у предыдущих версий. Тем не менее разрыв с китайскими конкурентами остаётся огромным: DeepSeek V4 Pro и Xiaomi MiMo V2.5 Pro предлагают сопоставимую производительность по цене менее доллара за миллион токенов, что делает Opus 4.8 в десятки раз дороже. В Anthropic парируют ставкой на качество и безопасность, что критически важно для регулируемых отраслей, но для массового пользователя такая разница в цене трудно игнорируема.

На платформе предсказаний Myriad вероятность выхода Mythos до конца июня оценивается в 44%, что значительно выше утренних 17,5%. Таким образом, Anthropic балансирует на грани между технологическим лидерством и необходимостью убедить рынок в контролируемости своих самых мощных творений.

Главное сегодня
Отказ от ответственности

Данный материал носит информационный характер и не является инвестиционной рекомендацией. Криптоактивы высокорискованны и волатильны — возможна полная потеря средств. Материалы могут содержать ссылки и пересказы сторонних источников; администрация не отвечает за их содержание и точность. Coinalertnews рекомендует самостоятельно проверять информацию и консультироваться со специалистами, прежде чем принимать любые финансовые решения на основе этого контента.