Исследование Института безопасности искусственного интеллекта Великобритании (AI Safety Institute) выявило, что предварительная версия модели Claude Mythos от компании Anthropic способна автономно планировать и выполнять сложные многоэтапные кибератаки на корпоративные сети. В ходе контролируемых оценок модель успешно завершила симуляцию взлома корпоративной сети «The Last Ones» (TLO), состоящую из 32 шагов, что ранее требовало около 20 часов работы человека-специалиста.
Mythos Preview стал первой ИИ-моделью, полностью завершившей эту симуляцию, добившись успеха в трёх из десяти попыток. В среднем по всем запускам модель выполняла 22 из 32 шагов. Для сравнения, следующая по результативности модель, Claude Opus 4.6, в среднем завершала лишь 16 шагов. На экспертных задачах типа «захват флага» (capture-the-flag) успешность Mythos Preview составила 73% — уровень, недостижимый для любой ИИ-модели до апреля 2025 года.
Развитие этих способностей происходит на фоне активного расширения Anthropic своей вычислительной инфраструктуры. Компания заключила долгосрочное партнёрство с облачным провайдером CoreWeave для доступа к массиву графических процессоров Nvidia, размещённых в дата-центрах по США. Ранее Anthropic также анонсировала сотрудничество с Broadcom и Google для обеспечения примерно 3,5 гигаватт мощности тензорных процессоров (TPU) к следующему году. Эти шаги направлены на масштабирование инфраструктуры для обучения и развёртывания моделей, включая Claude.
Утечка информации о существовании Claude Mythos произошла в конце марта, после чего Anthropic подтвердила, что эта модель следующего поколения обладает беспрецедентными способностями к поиску и эксплуатации уязвимостей в кибербезопасности. Вместо публичного релиза компания предоставила ограниченный доступ десяткам фирм, занимающихся исследованиями безопасности, для тестирования и подготовки.
Потенциальные последствия для криптоиндустрии оцениваются как значительные. Децентрализованные финансы (DeFi), смарт-контракты и криптобиржи, ежегодно теряющие миллиарды долларов из-за уязвимостей и взломов, могут столкнуться с новым классом угроз. Автономные ИИ-системы, способные анализировать и атаковать несколько векторов одновременно, могут усилить существующие риски. В то же время та же технология потенциально может быть использована для поиска и устранения уязвимостей, а не только для их эксплуатации.
На прошлой неделе министр финансов США Скотт Бессент и председатель ФРС Джером Пауэлл, как сообщается, предупредили руководителей банков о надвигающейся угрозе безопасности, которую представляет Claude Mythos. Институт безопасности ИИ Великобритании, отслеживающий эти возможности с 2023 года, документирует стремительный прогресс ИИ-моделей — от базовых упражнений по кибербезопасности до экспертных автономных атак.