Олли Блог

Пользовательская вычислительная архитектура Marvell HBM для пользовательских гипермасштабируемых XPU

Сегодня компания Marvell совместно с тремя крупными производителями HBM — Micron, Samsung и SK hynix — делает следующий шаг в кастомизации XPU для гипермасштабируемых клиентов. Новая архитектура вычислений с использованием HBM от Marvell направлена на увеличение плотности HBM для XPU следующего поколения за счёт кастомизации интерфейса между HBM и XPU.

Кастомная архитектура вычислений Marvell HBM для гипермасштабируемых XPU

Память HBM жертвует ёмкостью и расширяемостью ради значительно более высокой пропускной способности. Обычно HBM размещается рядом с процессорами (CPU) и ускорителями (или XPU) и взаимодействует через стандартные проводники, проходящие через кремниевый интерпозер, который соединяет два кристалла. XPU обычно имеет два или более HBM-стека, состоящих из DRAM и базового кристалла.

Marvell Custom HBM Compute Architecture Diagram 1
Особенности архитектуры:
  1. Кастомный интерфейс:
  2. Marvell вместе с гипермасштабными клиентами и основными производителями HBM определяет новый интерфейс, который занимает меньше места на вычислительном кристалле. Это позволяет разместить больше HBM рядом с XPU, увеличивая пропускную способность и ёмкость памяти на один чип.
  3. Энергопотребление:
  4. Новый подход снижает требования к энергопотреблению для чипов, использующих кастомную память.


Marvell CHBM Benefits

Преимущества кастомной архитектуры HBM

  1. Экономия пространства:
  2. Стандартный интерфейс HBM требует значительных площадей на кристалле, что ограничивает возможности его использования. Снижение физического пространства, необходимого для соединения HBM и XPU, освобождает место для дополнительных интерфейсов ввода-вывода или большего количества HBM.
  3. Увеличение производительности:
  4. Использование кастомного интерфейса увеличивает производительность ввода-вывода и снижает энергопотребление интерфейса на 70%.
  5. Кастомные функции:
  6. Новый интерфейс позволяет добавлять специализированную логику, такую как сжатие данных и функции безопасности.
  7. Увеличение пропускной способности:
  8. Marvell прогнозирует 4-кратное увеличение пропускной способности на квадратный миллиметр площади, с потенциалом увеличения до 10 раз в будущем.


Marvell CHBM 2024

Заключение

Для индустрии гипермасштабных вычислений это огромный шаг вперёд. Гипермасштабируемые компании в 2024 году вложили около $100 млрд в капитальные затраты. Следующее поколение кластеров для ИИ будет в 10 раз больше текущих, таких как кластер xAI Colossus на 100 000 GPU, потребляющий несколько гигаватт энергии. Экономия каждого ватта в масштабах таких систем выливается в мегаватты экономии. Отказ от стандартов JEDEC и переход к кастомным решениям для гипермасштабных клиентов показывает, что Marvell добилась значительных успехов в этой области, так как подобные разработки возможны только при крупных заказах.