Российский рынок ИИ-вычислений расписывает себе «энергетическую карту» до 2035 года. По оценке BitRiver, к 2035-му отечественной экосистеме ИИ понадобится около 4 ГВт мощности. На ближней дистанции компания обещает уже в 2025 году выделить 100 МВт под GPU-кластеры с суммарной производительностью свыше 1 экзафлопса FP32. Архитектура — «как у взрослых»: внутри узлов — NVLink для сверхплотной связности, между узлами — InfiniBand для низких задержек и высокой полоси, чтобы обучать действительно большие модели без «узких горлышек».
Что стоит за этими цифрами? Во-первых, география и энергия. Кластеры выносятся туда, где дешёвая и «длинная» генерация — гидро и другие ВИЭ. Это снижает стоимость часа обучения и позволяет увеличивать мощность без перегрева энергосетей мегаполисов. Во-вторых, сетевой дизайн. NVLink даёт локальную «шину» между GPU в одном сервере/шасси, InfiniBand с умной топологией (fat-tree/dragonfly) «сшивает» стойки в единую фабрику. Во-третьих, производственная дисциплина: чтобы экзафлопсы не проседали до терафлопсов в реальной жизни, нужен грамотный MLOps-контур, расписание задач, оркестрация и мониторинг I/O
Где тонко? В компонентной базе и сетевых ускорителях: каждая задержка в поставках — риск для линейного масштабирования. Но если «первую сотню мегаватт» BitRiver введёт в срок и подтвердит устойчивую пропускную способность на InfiniBand-уровне, рынок получит важный сигнал: экза-кластеры можно собирать и эксплуатировать локально, без постоянной оглядки на внешние площадки. В макро-смысле это часть сюжетной линии о цифровом суверенитете: электричество + оптика + охлаждение + сетевой стек = способность обучать и обслуживать модели внутри страны.
Итог. Переход от мегаваттов к экзафлопсам — не про «красивые пресс-релизы», а про инженерную рутину. Если она сыграет, у российских команд появится площадка, где стоимость эксперимента и масштаб запуска будут сравнимы с зарубежными предложениями — а это уже прямой стимул развивать свои модели и сервисы.