Компания Google представила инновационную систему прогнозирования внезапных паводков, которая использует искусственный интеллект для анализа миллионов исторических новостных статей. Разработка, основанная на крупной языковой модели Gemini, направлена на заполнение критических пробелов в данных и предоставление заблаговременных предупреждений в более чем 150 странах.
Технология использует массив из 5 миллионов новостных статей из глобальных источников, из которых ИИ идентифицировал и каталогизировал сообщения о 2,6 миллионах отдельных случаев наводнений. Эти качественные описания были преобразованы в структурированную, геопривязанную базу данных временных рядов под названием Groundsource, которая теперь находится в открытом доступе для научного сообщества.
На основе этого набора данных исследователи обучили специализированную модель, построенную на архитектуре нейронной сети с долгой краткосрочной памятью (LSTM). Модель анализирует глобальные прогнозы погоды и выдает вероятность возникновения внезапного паводка в конкретной зоне с заблаговременностью до 24 часов. Система уже функционирует на публичной платформе Google Flood Hub, охватывая городские районы по всему миру.
Как отметила Джульетта Ротенберг, руководитель программы в команде Google по устойчивости, ключевой задачей проекта было создание инструмента для регионов с дефицитом данных. «Набор данных Groundsource помогает перебалансировать глобальную карту, позволяя экстраполировать риски в регионах, где правительства не могут позволить себе дорогие сенсорные сети или не имеют обширных метеорологических архивов», — пояснила она.
Система имеет определённые ограничения: её пространственное разрешение составляет 20 квадратных километров, и она не обладает точностью локальных сетей, подобных службе Национальной погоды США, которые используют плотную радарную инфраструктуру. Однако в пилотных регионах, например в Южной Африке, службы экстренного реагирования уже подтвердили практическую ценность прогнозов для организации оперативных мер.
Эксперты отмечают методологическую новизну подхода. «Дефицит данных — одно из самых сложных препятствий в геофизике. Подход Google к извлечению информации из новостных отчётов стал по-настоящему творческим решением для получения этих критически важных проверочных данных», — заявил Маршалл Моутено, CEO компании Upstream Tech.
В перспективе аналогичная методология — использование языковых моделей для создания количественных наборов данных из качественных письменных источников — может быть применена для прогнозирования других опасных явлений, таких как волны жары и оползни. Работа Google знаменует собой сдвиг в использовании неструктурированных данных для повышения глобальной безопасности и устойчивости к стихийным бедствиям.