Пекинская лаборатория Z.AI, с января 2025 года находящаяся в санкционном списке США, 16 июня 2026 года представила GLM-5.2 — большую языковую модель с открытыми весами, распространяемую под лицензией MIT без региональных ограничений. Модель сразу заняла лидирующие позиции среди открытых аналогов и в ряде тестов вплотную приблизилась к флагманским закрытым системам Anthropic и OpenAI.
По данным бенчмарка FrontierSWE, оценивающего выполнение многочасовых автономных инженерных проектов, GLM-5.2 набрала 74,4 балла против 75,1 у Claude Opus 4.8 и 72,6 у GPT-5.5. В тесте SWE-bench Pro результат составил 62,1 (против 58,6 у GPT-5.5 и 58,4 у предшественника GLM-5.1). Агрегированный Intelligence Index от Artificial Analysis поставил GLM-5.2 на первое место среди открытых моделей с результатом 51, тогда как GLM-5.1 имела лишь 40.
Принципиальное отличие новинки — полный отказ от чипов Nvidia. GLM-5.2 обучена исключительно на ускорителях Huawei Ascend. По оценке основателя Stability AI Эмада Мостака, общие затраты на обучение составили около $25 млн, из которых 80% пришлись на посттренировку. Это значительно дешевле сопоставимых решений конкурентов. Модель построена по архитектуре Mixture-of-Experts с 744 млрд общих параметров (40 млрд активных) и имеет контекстное окно на 1 млн токенов — в пять раз больше, чем у предыдущей версии.
Для разработчиков ключевой интерес представляют открытые веса и гибкость запуска. API предлагается по цене $1,40 за миллион входных токенов и $4,40 за выходные, тогда как у Claude Opus 4.8 тарифы составляют $5 и $25 соответственно. Сжатые 2-битные квантизации от Unsloth AI уменьшают размер модели с 1,51 ТБ до 238 ГБ, позволяя запускать её на машинах с 256 ГБ ОЗУ или VRAM, например на максимально оснащённых Mac Studio или рабочих станциях с offloading.
На фоне запрета модели Anthropic Fable и ажиотажа вокруг выхода GLM-5.2 акции Z.AI взлетели на 90%, достигнув исторического максимума. Однако реакция сообщества оказалась неоднозначной. Специализированные тесты Vals AI показали, что GLM-5.2 стала первой открытой моделью, преодолевшей планку 30% в ProofBench, и уступила Claude Opus 4.5 всего 1 процентный пункт. Вместе с тем, независимые инженеры столкнулись с нестыковками в тарификации — при заявленных лимитах реальный расход токенов оказался в десятки раз выше. В практических задачах отладки модель не показала уровня GPT-5.5, что указывает на сохраняющийся разрыв между бенчмарками и реальной эксплуатацией.
GLM-5.2 безусловно сокращает дистанцию между открытыми и проприетарными ИИ-продуктами, но её полноценное внедрение потребует доработки инфраструктуры и большей прозрачности от разработчика.