Китайский стартап в сфере искусственного интеллекта DeepSeek в пятницу представил предварительную версию своей долгожданной модели четвертого поколения DeepSeek V4, что стало самым значительным обновлением продукта с момента запусканой V3 в конце 2024 года. Объявление, сделанное в аккаунте компании в WeChat, включает выпуск версий Pro и Flash, которые должны прийти на смену V3.
Этот шаг возвращает DeepSeek в центр быстро меняющейся гонки ИИ в то время, когда инвесторы и разработчики внимательно следят за китайскими производителями моделей в поисках признаков технического прогресса и коммерческих амбиций. Компания не раскрыла цены, конкретные показатели производительности или точные сроки финального релиза, описав текущий запуск как ранний этап, направленный на сбор реальных отзывов перед более широким внедрением.
Влияние на рынок акций
Новость о V4 вызвала полярную реакцию на фондовых рынках Гонконга и материкового Китая. Акции таких компаний, занимающихся ИИ, как Zhipu AI (падение на 8-9%), MiniMax (снижение на 7-8%) и Manycore Tech (обвал на 9%), пошли вниз, тогда как стоимость акций производителей чипов резко возросла. Semiconductor Manufacturing International Corp (SMIC) подскочила на 11% в Гонконге, Hua Hong Semiconductor показала рост более 18%. На материковом рынке Cambricon Technologies и Moore Threads Technology выросли на 4-6%, а Hygon Information Technology — более чем на 10%.
Аппаратное обеспечение и геополитика
Ключевой интригой остается вопрос, на каких чипах была обучена V4. Компания Huawei подтвердила, что ее суперноды на базе Ascend 950 поддерживают модель V4, однако DeepSeek не уточнила, какое именно оборудование использовалось для обучения. В условиях действующих с 2022 года экспортных ограничений США, которые блокируют продажу Китаю самых передовых чипов Nvidia, Пекин активно продвигает переход национальных технологических компаний на отечественные решения, в частности от Huawei.
Примечательно, что запуск V4 состоялся сразу после того, как Белый дом обвинил Китай в масштабном промышленном воровстве интеллектуальной собственности американских лабораторий ИИ. DeepSeek находится в центре этого спора: Вашингтон утверждает, что стартап получил доступ к запрещенным чипам Nvidia, а такие компании, как Anthropic и OpenAI, обвиняют его в неправомерном копировании моделей. Посольство Китая в Вашингтоне отвергло эти обвинения как "безосновательные".
Стратегия открытого исходного кода и доступность
Как и предшественница V3, модель V4 является открытой (open source), что позволяет разработчикам скачивать, запускать и модифицировать код на своих системах. В DeepSeek заявляют, что V4 демонстрирует хорошую производительность особенно в задачах, связанных с ИИ-агентами, обработкой знаний и выводами (inference), и создана для совместимости с популярными инструментами агентов, включая Claude Code от Anthropic.
Финансирование и удержание талантов
Параллельно с запуском V4 компания ищет пути привлечения внешнего финансирования впервые в своей истории. Как ранее сообщалось, DeepSeek ведет переговоры с Tencent и Alibaba о привлечении средств при оценке свыше $20 млрд. Ожидаемая сумма составляет несколько сотен миллионов долларов, что значительно ниже сумм, которые обычно привлекают конкуренты. По данным источников, потребность в средствах вызвана не критической нехваткой денег, а необходимостью удерживать исследователей. Некоторые ключевые сотрудники, включая Го Дая, ведущего автора статьи по модели R1, уже ушли в ByteDance, а Ван Бинсюань из команды обучения моделей DeepSeek перешел в Tencent.