Рис. 3. Сравнение эффективности использования GPU
Причины обращения к построению таких систем хорошо извест-
ны — традиционные архитектуры многопроцессорных компьютеров
с увеличением числа процессоров получают все больше узких мест.
Основным здесь является то обстоятельство, что возможное число
транзисторов на один чип значительно превышает сегодня возможно-
сти традиционной архитектуры суперкомпьютера.
Одним из таких гибридных устройств, является разработанный в
ИПМ им. М.В. Келдыша РАН кластер [6], состоящий из нескольких
узлов. Каждый узел представляет собой совокупность восьми процес-
сорных (CPU) ядер и двух видеоадаптеров GeForce GTX 295 с общим
числом процессорных (GPU) ядер, равным 960. Узлы объединены се-
тью на базе интерфейса PCI-E (рис. 4).
Во время подготовки данной статьи в ИПМ им. М.В. Келдыша РАН
был запущен в опытную эксплуатацию гибридный суперкомпьютер
К-100 с производительностью до 100 Тфлоп/с [8].
Основная идея разработки алгоритмов и программ для таких кла-
стеров заключается в том, чтобы возложить на CPU управление и
логическую часть алгоритма, в то время как арифметические вычи-
сления выполнять на GPU и при этом распараллелить как работу CPU,
так и расчеты с использованием графических ускорителей. Тем самым
можно достичь эффекта “двойного” распараллеливания.
Пример расчета с использованием гибридных кластеров.
В ка-
честве примера применения технологии CUDA рассмотрим вычисли-
тельный эксперимент, в котором многокомпонентные объекты, имею-
щие кусочно-гомогенную структуру, облучаются рентгеновским или
гамма-излучением.
ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. “Естественные науки”. 2011. № 3
77