OpenAI и Paradigm запустили EVMbench: бенчмарк для оценки ИИ-агентов в аудите смарт-контрактов Ethereum

18 февраля 2026, 22:00 16 источников neutral

Главное по теме:

Запуск EVMbench ускорит внедрение ИИ-аудиторов, повысив безопасность контрактов в Ethereum и других EVM-сетях.
Рост эффективности ИИ в поиске уязвимостей создаст новые риски для DeFi-протоколов с устаревшим кодом.
Инвестиции в кибербезопасность от OpenAI могут усилить доверие институтов к блокчейн-экосистемам.

Компании OpenAI и криптоинвестиционная фирма Paradigm представили EVMbench — новый бенчмарк для оценки способностей искусственного интеллекта в области безопасности смарт-контрактов Ethereum. Инструмент призван измерить, насколько эффективно ИИ-агенты могут обнаруживать, исправлять и безопасно эксплуатировать уязвимости в контрактах, работающих на виртуальной машине Ethereum (EVM).

EVMbench организует задачи по трём основным направлениям: обнаружение (detect), исправление (patch) и эксплуатация (exploit) уязвимостей. По данным The Block, OpenAI описывает эту работу как тестирование моделей в «экономически значимых средах» для развития защитных применений.

Бенчмарк основан на реальных уязвимостях, выявленных примерно в 40 аудитах, а также включает специальные задачи с неопубликованными контрактами. Агенты запускаются в изолированных песочницах (контейнерах), а каждая задача имеет ключ ответа для обеспечения объективной оценки и воспроизводимости результатов.

Ключевые результаты тестирования показывают быстрое развитие способностей ИИ к эксплуатации уязвимостей. Как сообщает Investing.com, модель GPT-5.3-Codex достигла показателя успеха в 72,2% в режиме «эксплуатация» по сравнению с 31,9% у GPT-5. При этом эффективность в режимах «обнаружение» и «исправление» остаётся значительно ниже, что указывает на сохраняющийся разрыв.

«Учитывая, что более $100 млрд активов находятся в открытых криптоконтрактах, существует реальный риск со стороны ИИ-агентов, способных находить уязвимости. EVMbench призван измерить, что именно агенты могут делать», — заявил Алпин Юкселоглу, партнёр Paradigm.

Запуск EVMbench совпал с объявлением OpenAI о выделении $10 млн на исследования в области кибербезопасности. Как отмечает Crypto Briefing, эта инициатива интегрирует ИИ-агентов в рабочие процессы криптоаудита, делая акцент на оборонительных применениях.

Влияние на индустрию аудита может быть значительным. «Теперь нам ясно, что растущая часть аудитов в будущем будет выполняться агентами», — отметил Юкселоглу. Однако эксперты, включая команду OpenZeppelin, предупреждают, что ИИ пока не может полностью заменить опытных аудиторов, особенно в работе с новыми или сложными случаями.

Независимые исследования, такие как SCONE-bench от Anthropic, подтверждают двойственную природу технологии: агенты могут автономно генерировать эксплойты, имитирующие потери в миллионы долларов, даже для контрактов, развёрнутых после окончания обучения модели. Это сокращает временное окно между раскрытием уязвимости и её использованием, подчёркивая необходимость таких измеримых оценок, как EVMbench.

С точки зрения управления, подобные бенчмарки могут повлиять на процессы предразвёртывающего сканирования, непрерывного мониторинга поведения в блокчейне и нормы ответственного раскрытия уязвимостей. Это означает, что советы директоров, DAO протоколов и руководители по безопасности будут более внимательно оценивать критерии доступа агентов и подписания аудиторских отчётов.

Ранее по теме:

20 февраля 2026, 12:22

Виталик Бутерин раскритиковал концепцию «суверенного ИИ» Web 4.0 за зависимость от Big Tech

Новый ТГ-канал

Главные новости крипты + дайджесты 3 раза в день

Источники

Ethereum gains EVMbench as OpenAI, Paradigm launch benchmark

bitcoininfonews.com 18.02.2026 20:29

Ethereum sees EVMbench launch as AI tested on EVM bugs

theccpress.com 18.02.2026 21:30

Can AI Agents Boost Ethereum Security? OpenAI and Paradigm Created a Testing Ground

Decrypt 18.02.2026 22:03

Главное сегодня

2 часа назад 7 источников

Tether перевела $70,5 млн в биткоинах, приблизившись к отметке в 100 000 BTC в резервах

BTC

$74784.00 +0.76%

USDT

4 часа назад 5 источников

Сенатор Уоррен предупреждает Элона Маска: запуск X Money угрожает финансовой стабильности США

DOGE

$0.09534 +2.32%

5 часов назад 10 источников

Разработчик Bitcoin предложил заморозить $420 млрд в потерянных BTC для защиты от квантовых хакеров

BTC

$74784.00 +0.76%

5 часов назад 5 источников

Британский регулятор FCA запускает консультации по криптовалютным правилам перед вводом режима в 2027 году

6 часов назад 6 источников

Bitwise запускает на NYSE ETF BAVA с доступом к Avalanche и доходностью от стейкинга

AVAX

$9.50 +1.61%

6 часов назад 6 источников

Генеральный директор Bybit представил на Paris Blockchain Week видение «невидимых» финансов на основе ИИ и стабильных монет

6 часов назад 5 источников

Компания Allbirds кардинально меняет бизнес-модель, переходя от обуви к инфраструктуре для ИИ, акции взлетели на 400%

Отказ от ответственности

Данный материал носит информационный характер и не является инвестиционной рекомендацией. Криптоактивы высокорискованны и волатильны — возможна полная потеря средств. Материалы могут содержать ссылки и пересказы сторонних источников; администрация не отвечает за их содержание и точность. Coinalertnews рекомендует самостоятельно проверять информацию и консультироваться со специалистами, прежде чем принимать любые финансовые решения на основе этого контента.