...
К 2026 году общее число узлов в кластерах AI превысит 100 000
...
Время простоя процессоров в ожидании обмена данными доходит до 50%
...
Инновации в AI-сетях требуют новых инструментов измерения и эталонного тестирования
...
К 2026 году общее число узлов в кластерах AI превысит 100 000
...
Время простоя процессоров в ожидании обмена данными доходит до 50%
...
Инновации в AI-сетях требуют новых инструментов измерения и эталонного тестирования
IxNetwork / AresONE-S поддерживает транспортный протокол RoCEv2 с контролем перегрузок DCQCN (Data Center Quantized Congestion Notification) и приоритетным управлением потоками PFC (Priority Flow Control). Это масштабируемое и экономичное решение для проверки эффективности управления трафиком в AI-кластерах, для оптимизации производительности сетевой фабрики.
AresONE-S содержит до 16 портов 400GE на устройство и может объединяться в конфигурацию из нескольких устройств с более чем 256 портами в одном коллективе. Каждый порт эмулирует конечную точку RoCEv2 и поддерживает тысячи пар очередей с трафиком на скорости линии. Такой масштаб необходим для воспроизведения топологий реальных AI-кластеров.
Для соответствия реалистичности формы трафика AI-нагрузок и воспроизведения проблем реальной сети на меньших конфигурациях, возможности AresONE RoCEv2 охватывают широкий спектр форм трафика – от in-cast до частичной сетки (partial mesh) и до полносвязных соединений (all-to-all) коллективного трафика. На транспортном уровне поддерживаются последовательности команд RDMA с настраиваемыми размерами данных, скоростями всплесков трафика, интервалами в коллективной работе узлов – все это в сочетании с механизмами контроля скорости DCQCN и PFC.
Контроль DCQCN на каждую пару очередей обеспечивает точный контроль сетевых перегрузок с такими функциями, как явное уведомление о перегрузке ECN (Explicit Congestion Notification), а также оптимизацию скорости потока данных и отзывчивости сетевой инфраструктуры на изменения потока и модели трафика.