Крошечная ИИ-модель умещается в смартфоне, но агенты всё ещё не справляются с реальной жизнью

1 час назад 1 источник neutral

Главное по теме:

Локальный доступ AI-агентов к цене биткоина снижает барьеры для розничных инвесторов, поддерживая долгосрочный спрос на BTC.
Провал AI-ассистентов в сложных сценариях предостерегает от бесконтрольной автоматизации криптотрейдинга, сохраняя преимущество за экспертами.
Открытый исход MiniCPM5-1B ускорит интеграцию криптоданных в мобильные приложения, формируя структурный тренд роста вовлеченности.

Компания OpenBMB представила MiniCPM5-1B — языковую модель с 1 млрд параметров, которая способна работать локально на смартфоне и поддерживает инструментальные вызовы и протокол Model Context Protocol (MCP). Модель набрала в среднем 42,57 балла в тестах на агентные и логические задачи, обойдя ближайших конкурентов с 35,61 балла. Однако практические испытания выявили склонность к галлюцинациям и неспособность решать логические ловушки.

Параллельно исследователи из Huawei, Пекинского технологического института, Пекинского университета и Китайской академии наук опубликовали эталонный тест Claw-Anything, который оценивает ИИ-агентов в условиях, приближенных к реальной жизни: более трёх месяцев симулированной активности, в среднем 10,1 взаимозависимых сервисов на задачу и взаимодействие с несколькими устройствами. Даже флагманская модель GPT-5.5 показала лишь 34,5% успешных выполнений с первой попытки (pass@1), а в проактивных сценариях результат падал до 6,7%.

MiniCPM5-1B позиционируется как основа для локальных агентов, способных искать информацию в календаре, вызывать веб-серверы MCP и поддерживать контекст до 128 тысяч токенов. На практике модель может успешно получать цену биткоина и давать осмысленные биржевые рекомендации, но её знания и способность к кодированию значительно уступают более крупным моделям. В то же время тонкая настройка открытой модели Qwen3.5-27B на синтетических данных повысила результат на Claw-Anything на 23,7%, превзойдя некоторые закрытые аналоги.

Таким образом, хотя миниатюрные ИИ-модели делают автономных агентов доступными на потребительских устройствах без облака, нынешние бенчмарки показывают, что до надёжного персонального ассистента ещё далеко — требуется преодолеть проблемы координации между сервисами и долговременной согласованности.

Новый ТГ-канал

Главные новости крипты + дайджесты 3 раза в день

Источники

This Half-Gigabyte AI Model Runs Local Agents on Your Phone

Decrypt 26.05.2026 20:59

Главное сегодня

3 часа назад 6 источников

DTCC выводит токенизированные акции, ETF и гособлигации США на блокчейн Stellar

XLM

$0.16 +9.01%

3 часа назад 5 источников

S&P 500 обновил исторический максимум на ИИ-ралли, биткоин снизился на фоне прогресса переговоров с Ираном

BTC

$74940.40 -1.38%

3 часа назад 6 источников

Robinhood открыл торговлю акциями для ИИ-агентов: криптовалюты и опционы — на очереди

3 часа назад 7 источников

Mastercard получил BitLicense в Нью-Йорке для запуска стабильных монет и токенизированных депозитов

4 часа назад 6 источников

Kraken запускает Bitcoin Vault для пассивного дохода держателей BTC

BTC

$74940.40 -1.38%

4 часа назад 6 источников

Пресейл-инвесторы Ozak AI (OZK) рассчитывают на 71-кратный рост при листинге

OZK

4 часа назад 8 источников

SoFi запускает банковский стейблкоин SoFiUSD для 14,7 млн пользователей, открывая новую эру регулируемых цифровых денег

Отказ от ответственности

Данный материал носит информационный характер и не является инвестиционной рекомендацией. Криптоактивы высокорискованны и волатильны — возможна полная потеря средств. Материалы могут содержать ссылки и пересказы сторонних источников; администрация не отвечает за их содержание и точность. Coinalertnews рекомендует самостоятельно проверять информацию и консультироваться со специалистами, прежде чем принимать любые финансовые решения на основе этого контента.