Олли Блог

Meta тестирует свой первый RISC-V чип для ИИ

Meta была одной из первых компаний, которая несколько лет назад создала свои чипы на базе RISC-V для вывода ИИ, чтобы сократить расходы и уменьшить зависимость от Nvidia. Reuters сообщает, что компания пошла еще дальше и разработала (предположительно, с помощью Broadcom) свой собственный ускоритель для обучения ИИ. Если чип будет соответствовать целям Meta, она может уменьшить свою зависимость от высокопроизводительных графических процессоров Nvidia AI — таких как H100 / H200 и B100 / B200 — для обучения расширенных моделей большого языка.
Meta и Broadcom запустили первый ускоритель обучения искусственного интеллекта Meta совместно с TSMC; последняя выпустила первые рабочие образцы этих чипов, и партнеры успешно запустили устройство, согласно отчету. К настоящему времени Meta начала с ограниченного развертывания ускорителя, оценивая его производительность перед масштабированием производства и развертывания. Неясно, проводят ли инженеры Meta тесты на новом чипе; он уже был развернут для выполнения некоторой полезной работы.
Технические характеристики чипа неизвестны, хотя обычно чипы для обучения ИИ используют конструкцию, известную как систолический массив. Эта архитектура состоит из структурированной сети идентичных процессорных элементов (PE), расположенных в строках и столбцах. Каждый блок обрабатывает вычисления, включающие матрицы или векторы, и данные последовательно передаются по сети.

Пользовательский ускоритель RISC-V для ИИ

Поскольку процессор предназначен для обучения ИИ — что означает обработку огромных объемов данных — ожидайте, что процессор будет иметь память HBM3 или HBM3E. Учитывая, что мы имеем дело с процессором, сделанным на заказ, Meta определила поддерживаемые форматы данных и инструкции для оптимизации размера кристалла, энергопотребления и производительности. Что касается производительности, ускоритель должен предлагать конкурентоспособные характеристики производительности на ватт с современными графическими процессорами ИИ от Nvidia, такими как H200, B200 и, возможно, следующего поколения B300 .
Чип является последним дополнением к программе Meta Training and Inference Accelerator (MTIA) компании Meta. Программа столкнулась с различными неудачами, в том числе когда разработка была остановлена ​​на схожих этапах.
Например, прекратил выпуск внутреннего процессора вывода после того, как он не смог достичь своих целевых показателей производительности и мощности во время ограниченных испытаний развертывания. Эта неудача заставила Meta изменить свою стратегию в 2022 году, разместив крупные заказы на графические процессоры Nvidia для удовлетворения своих непосредственных потребностей в обработке ИИ.

Meta стремится к независимости ИИ от оборудования

С тех пор Meta стала одним из крупнейших клиентов Nvidia, приобретя десятки тысяч графических процессоров. Эти устройства сыграли решающую роль в обучении моделей ИИ для рекомендаций, рекламы и серии моделей Llama Foundation. Кроме того, графические процессоры этой зеленой компании использовались для процессов вывода, поддерживая взаимодействие более трех миллиардов ежедневных пользователей на платформах Meta, согласно данным Reuters.
Несмотря на эти проблемы, Meta продолжила развивать свою кастомную кремниевую программу. В прошлом году Meta начала использовать чип MTIA для задач вывода, и, заглядывая вперед, руководство Meta наметило планы начать использовать свои кастомные чипы для обучения ИИ к 2026 году. План состоит в том, чтобы постепенно увеличивать использование, если чип будет соответствовать целевым показателям производительности и мощности, что является критически важным компонентом долгосрочной цели Meta по разработке более кастомных аппаратных решений для операций своего центра обработки данных.
Интересно отметить, что ускорители MTIA для вывода используют ядра RISC-V с открытым исходным кодом. Это позволяет Meta настраивать архитектуру набора инструкций по своему усмотрению, чтобы соответствовать своим требованиям в своем ритме, но с другой стороны, ей не нужно платить роялти какой-либо третьей стороне. Неясно, основан ли ускоритель обучения MTIA также на RISC-V ISA, но это возможно. Если это правда, Meta, возможно, разработала один из самых производительных чипов на базе RISC-V в отрасли.