О некоторых особенностях применения технологии CUDA для моделирования переноса излучения - page 3

Все потоки имеют идентичный исполняемый код, поэтому, чтобы
отличать потоки ядра друг от друга, каждому присваивается иденти-
фикационный номер.
Аппаратная структура видеоадаптера.
Основными элементами
видеоадаптера являются видеопамять (VRAM) и графический процес-
сор (GPU), который состоит из набора мультипроцессоров.
В отличие от обычных процессоров, имеющих одно устрой-
ство контроля исполнения, кэш, и несколько арифметико-логических
устройств (ALU), графический процессор состоит из набора муль-
типроцессоров, каждый из которых имеет свое устройство контроля
исполнения (Control), область разделяемой (Cache) памяти, области
регистров и значительно расширенный по сравнению с обычным
процессором набор ALU (рис. 1, [2]).
Такая структура позволяет добиться не только параллельного вы-
полнения алгоритма на разных мультипроцессорах, но и параллельной
обработки данных в рамках одного мультипроцессора.
При запуске ядра блоки распределяются между мультипроцессора-
ми (при нехватке мультипроцессоров ставятся в очередь) и выполня-
ются независимо. С каждым мультипроцессором может быть ассоции-
рован один и более блоков (в зависимости от ресурсов, используемых
блоком). Один блок не может выполняться более чем на одном муль-
типроцессоре.
Соответствие программных средств и аппаратных устройств при
проведении расчетов с использованием графических ускорителей сле-
дующее:
— поток выполняется одним из вычислителей мультипроцессора
(такой элемент еще называют потоковым процессором);
— блок выполняется мультипроцессором;
— решетка — устройством видеокарта.
Рис. 1. Иллюстрация отличий структуры обычного процессора (CPU) и графи-
ческого процессора (GPU)
ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. “Естественные науки”. 2011. № 3
73
1,2 4,5,6,7,8,9,10,11,12,...13
Powered by FlippingBook