Вычислительный кластер АФИФ получил очередное значительное обновление в рамках грантового (АР14871603, АР19676713, AP14869395, AP14870501) и программно-целевого финансирования (BR21881880, BR20381077). Были приобретены дополнительные серверные стойки SHIP 601S.6842.54.100, модули расширения Synology RX1217/RX1217RP, батарейные модули Eaton EBM 9SXEBM180RT, вычислительный сервер Supermicro GPU A+ Server AS-4125GS-TNRT2 Server на базе двух 96-ядерных процессоров AMD Epyc 9654 с 768GB оперативной памяти DDR5, видеокарты GIGABYTE GeForce RTX 4090 WINDFORCE V2 24G, автоматический переключатель резерва Eaton ATS16N, а также дополнительные сетевые карты для служебных серверов. Также были приобретены дополнительные сетевые кабели и кабели питания. Оборудование кластера было перераспределенно на 5 стоек в более эффективную конфигурацию.
В результат чего вычислительная мощность кластера (FP32) по CPU возросла на 21 терафлопс (на 21%) и на 164 терафлопса (на 6%) по GPU, и в общем составила 94.4 терафлопса по CPU и 1461 терафлопс по GPU.
Фактическая накопительная емкость кластера была расширена на 48 терабайт и в общем составила 280 терабайт. При этом был сформирован потенциал расширения еще на 338 терабайт (при использовании дисков с номинальной емкостью 18 терабайт). Следует отметить, что эти показатели были достигнуты двукратно, так как речь идет о расширении емкости SHA-кластера состоящего из двух одинковых NAS серверов (Synology RS4021xs+).
Приобретение дополнительных батарейных модулей позволило увеличить время автономной работы всех систем кластера с 2-3 минут до 8-10 минут, а кртических систем до 10-11 часов.
Также был значительно улучшен кабель менеджмент кластера, организована цветовая дифференциация. Сетевые кабели категории 5е были замененны на кабели 6 категории с экранированием и LZHS оболочкой, что позволило обеспечить стабильный 10 гигабитный линк со всеми серверами. Также все сервера были соединены дополнительным (вторым) сетевым кабелем для большей отказоустойчивости и организации агрегации каналов (LAG с LACP), что позволило увеличить скорость совместного доступа к серверам до 20 гигабит (важно при использовании MPI-параллелизации на двух и более хостах).
Основное назначение кластера – проведение вычислительных исследований астрофизических и космологических объектов, таких как звездные кластеры, галактики, скопления галактик и крупномасштабная структура Вселенной, а также обработка и безотказное долговременное хранение полученных вычислительных и наблюдательных данных.
Вычислительный кластер является собственной инициативой АФИФ и создается аддитивным образом за счет средств базового, грантового и программно-целевого финансирования.