Google Cloud представила два новых специализированных чипа восьмого поколения — TPU 8t для обучения AI-моделей и TPU 8i для их инференса (выполнения). Это первый случай, когда компания разделила эти функции на отдельные процессоры. Чипы были разработаны совместно с Broadcom и при участии Google DeepMind, и станут доступны клиентам облачной платформы позднее в этом году.
Чип для инференса TPU 8i, по заявлениям Google, предлагает на 80% лучшее соотношение производительности к стоимости по сравнению с предыдущим поколением Ironwood. Он оснащен 384 МБ SRAM на чип (в три раза больше, чем у предшественника), что призвано снизить задержки при высокой нагрузке. Также чип обеспечивает двукратное улучшение производительности на ватт благодаря интегрированной системе управления питанием.
Тренировочный чип TPU 8t масштабируется до суперкластера из 9 600 чипов с 2 петабайтами высокоскоростной памяти. Его межчиповая пропускная способность удвоена, что, как утверждает Google, может сократить время разработки передовых моделей с месяцев до недель. Производительность нового чипа в 2,8 раза выше, чем у Ironwood, при той же цене.
Оба чипа впервые работают на процессорной платформе Google Axion, что позволяет повысить эффективность на системном уровне. Среди текущих пользователей TPU — Citadel Securities, все 17 национальных лабораторий Министерства энергетики США и компания Anthropic, которая зарезервировала мощности на несколько гигаватт.
Параллельно Google Cloud объявила о создании фонда на $750 млн для поддержки партнеров в развертывании агентного искусственного интеллекта. Инициатива, представленная на конференции Cloud Next 2026, направлена на консалтинговые компании, системных интеграторов и вендоров ПО. Фонд будет финансировать оценку AI-кейсов, создание прототипов, развертывание агентов и обучение команд.
Часть средств пойдет на размещение инженеров Google непосредственно в организациях-партнерах, включая Accenture, Capgemini, Deloitte и других. Ключевые консультанты, такие как Accenture, Bain, BCG, Deloitte и McKinsey, также получат ранний доступ к новым моделям Gemini для их тестирования и доработки.
Генеральный директор Google Cloud Томас Куриан отметил, что эти шаги основаны на более чем годичной внутренней работе по созданию «готовой к агентам» технологической инфраструктуры. Он подчеркнул сдвиг от использования моделей для ответов на вопросы к их применению для выполнения конкретных задач.
Отдельно сообщается, что Google обсуждает с Marvell Technology разработку двух новых чипов: процессора, ориентированного на память, и чипа следующего поколения TPU, что является частью стратегии по созданию альтернативы GPU от Nvidia.