массива данных, пересылаемого между вычислительными модулями
на каждом шаге.
После разложения последовательно решаются две системы урав-
нений:
Ly
=
b
,
Ux
=
y
. По окончании расчета матрица
A
и правая
часть
b
системы воссоздаются и вычисляется невязка полученного ре-
шения
f
=
Ax
−
b
. Тест считается выполненным, если
r
N
< α
,
r
1
< α
и
r
∞
< α
, где
α
— константа порядка единицы,
ε
— точность предста-
вления чисел с плавающей точкой,
r
N
=
k
f
k
∞
/
(
k
A
k
1
∙
N
∙
ε
);
r
1
=
k
f
k
∞
/
(
k
A
k
1
∙ k
x
k
1
∙
ε
);
r
∞
=
k
f
k
∞
/
(
k
A
k
∞
∙ k
x
k
∞
∙
ε
)
.
Коэффициенты
P
и
Q
выбираются в зависимости от структуры
кластера. Например, если кластер состоит из восьми вычислитель-
ных модулей, возможными являются комбинации
1
×
8
,
2
×
4
,
4
×
2
,
8
×
1
,
2
×
3
и т.п. Если размерность решаемой системы
N
достаточно
велика, то максимальная производительность достигается в одном из
тех случаев, когда
P
∙
Q
= 8
, т.е. задействованы все вычислительные
модули кластера.
Производительность кластера
R
определяется по времени, затра-
чиваемому на выполнение
2
3
N
3
+ 2
N
2
операций с плавающей точкой,
требуемых для решения системы. Производительность принято ука-
зывать в гигафлопсах (Гфлопс) — миллиардах операций с плавающей
точкой в секунду.
Результаты анализа производительности кластера.
В силу нели-
нейного влияния на эффективность распараллеливания различных ха-
рактеристик решаемой задачи (размера матрицы, размеров пересыла-
емых блоков данных, способа разбиения матрицы на блоки и т.д.) для
получения максимальной производительности на каждой конкретной
кластерной системе приходится подбирать собственные оптимальные
значения этих параметров.
Зависимость оценки производительности от размера решаемой си-
стемы достаточно хорошо исследована [3], и чем б ´ольшую долю зани-
мает вычислительная составляющая расчета по сравнению с обменом
данными, тем б´ольшую производительность показывает кластер. Для
демонстрации этой закономерности были проведены расчеты для си-
стем линейных уравнений различной размерности (табл. 1).
Таблица 1
Производительность кластера в зависимости от размерности системы (
P
= 4
,
Q
= 2
)
Размерность системы
N
30 000 50 000 70 000 90 000 110 000
Производительность
R
8
, Гфлопс 152,1 198,1 223,7 239,5 250,8
36
ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. “Естественные науки”. 2011. № 4