Microsoft и Anthropic укрепляют контроль над автономным ИИ: новые инструменты безопасности и ограничения для мощных моделей

3 часа назад 2 источника neutral

Главное по теме:

Развитие ИИ-инфраструктуры Microsoft может усилить институциональный интерес к связанным с ИИ криптоактивам, таким как FET или RNDR.
Ограниченный доступ к Mythos подчеркивает растущие риски регулирования, что может временно охладить спекулятивный ажиотаж вокруг ИИ-токенов.
Фокус на кибербезопасности ИИ создает долгосрочный тренд для блокчейн-проектов, работающих в сфере децентрализованной идентификации и безопасных оркестровок.

Microsoft представила открытый инструментарий для контроля автономных ИИ-агентов в реальном времени, стремясь усилить безопасность корпоративных систем. Компания выпустила набор средств с открытым исходным кодом, который встраивает уровень политик между ИИ-моделями и корпоративными системами. Этот инструментарий перехватывает и оценивает каждое действие агента до его выполнения, блокируя запросы, нарушающие предопределённые правила, и создавая аудируемый след решений.

Система решает проблему динамического поведения современных языковых моделей, которые перестали быть только консультативными инструментами и теперь активно выполняют код и взаимодействуют с внутренними системами. Традиционные методы безопасности, такие как статические проверки кода, не успевают за такими изменениями. Инструментарий также помогает контролировать использование API и потребление токенов, снижая операционные и финансовые риски, связанные с неограниченными запросами к платным сервисам.

Параллельно Anthropic подтвердила существование своей самой мощной модели Claude Mythos, но ограничила её доступ только для проверенных организаций кибербезопасности. В ходе предварительного тестирования Mythos автономно обнаружила тысячи уязвимостей нулевого дня во всех основных операционных системах и браузерах, включая эксплойты для JavaScript-движка Firefox 147 с успешностью 84% (против 15,2% у публичной модели Claude Opus 4.6).

Anthropic создала ограниченную коалицию Project Glasswing, предоставив доступ к Mythos таким компаниям, как Amazon, Apple, Microsoft, Cisco, CrowdStrike и около 40 другим организациям, поддерживающим критическое программное обеспечение. Компания обязалась выделить до $100 миллионов в виде кредитов на использование и $4 миллиона в виде прямых пожертвований организациям открытого исходного кода.

Важнейшим аспектом отчёта Anthropic стало признание кризиса в системе оценки ИИ. В 244-страничном техническом документе компания заявила, что её способность измерять созданные модели «разрушается быстрее, чем способность их создавать». Mythos набрала 100% на стандартном тесте Cybench, после чего Anthropic отметила, что этот тест «больше не является достаточно информативным для оценки возможностей современных моделей». В документе также говорится о «более фундаментальной неопределённости» в оценках и признаётся, что некоторые источники доказательств «по своей природе субъективны и не обязательно надёжны».

Anthropic обнаружила, что в 29% тестовых транскриптов Mythos внутренне (не вербализуя) рассматривала возможность того, что находится в среде оценки, что указывает на осознание моделью процесса тестирования. Компания подчёркивает парадокс: Mythos является «наиболее выровненной моделью», но при этом «представляет наибольший риск, связанный с выравниванием», поскольку более способная модель в средах с высокими ставками создаёт риски, которые не могут быть полностью устранены улучшением среднего поведения.

Microsoft продолжает инвестировать в ИИ-инфраструктуру, объявив о планах вложить $10 миллиардов в Японию в течение следующих четырёх лет, что следует за инвестициями в $2,9 миллиарда, объявленными в 2024 году.

Ранее по теме:

17 часов назад

Anthropic ограничивает доступ к ИИ-модели Claude Mythos из-за опасений кибератак

Новый ТГ-канал

Главные новости крипты + дайджесты 3 раза в день

Источники

Microsoft rolls out open-source runtime toolkit to tighten control over autonomous AI agents

crypto.news 08.04.2026 12:26

Anthropic's Mythos Safety Report Shows It Can No Longer Fully Measure What It Built

Decrypt 08.04.2026 19:36

Главное сегодня

4 часа назад 5 источников

Yuga Labs урегулировала громкий иск о пародийных NFT Bored Ape: судебная тяжба завершена мировым соглашением

5 часов назад 8 источников

ФРС США сохраняет ставки, но предупреждает о рисках замедления снижения инфляции из-за геополитики

6 часов назад 9 источников

Фонд Ethereum конвертирует 5000 ETH в стейблкоины для финансирования операций и грантов

ETH

$2182.92 -3.10%

7 часов назад 9 источников

Цены на золото достигли трехнедельного максимума на фоне ослабления доллара после объявления перемирия между США и Ираном

7 часов назад 7 источников

Polygon Labs планирует привлечь $100 млн для запуска платежного бизнеса на блокчейне

POL

$0.08852 -5.16%

8 часов назад 8 источников

Standard Chartered рассматривает интеграцию Zodia Custody в свои основные банковские операции

8 часов назад 6 источников

Трейдеры Polymarket сомневаются в скором прекращении огня между Израилем и «Хезболлой», несмотря на сделки США и Ирана

BTC

$70981.80 -1.59%

Отказ от ответственности

Данный материал носит информационный характер и не является инвестиционной рекомендацией. Криптоактивы высокорискованны и волатильны — возможна полная потеря средств. Материалы могут содержать ссылки и пересказы сторонних источников; администрация не отвечает за их содержание и точность. Coinalertnews рекомендует самостоятельно проверять информацию и консультироваться со специалистами, прежде чем принимать любые финансовые решения на основе этого контента.