Численное решение биматричных игр - page 4

неравенств в условиях (2). Введем функцию Лагранжа, которая по
определению имеет вид [5]
L
=
F
(
p, q, u, v
) + (
ue
T
p
T
B
)
λ
+
μ
(
ve
0
Aq
)
.
Множители Лагранжа
λ
,
μ
являются также двойственными пере-
менными в задачах ЛП (3), (4). Исходя из двойственных к ним задач
ЛП [3], несложно убедиться, что двойственные переменные удовле-
творяют ограничениям
μ
2
Σ
p
,
λ
2
Σ
q
.
Для упрощения записи далее будем опускать переменные
u, v
и
упоминать лишь о паре переменных
(
p, q
)
, говоря об оптимизации
функции (1) на множестве (2). Пусть
(
p , q
)
— стационарная точка
функции (1), а
λ
,
μ
— соответствующие двойственные переменные в
задачах ЛП (3) (
p
=
p
) и (4) (
q
=
q
).
Согласно теореме 2 и замечанию 2, итерационный процесс из тео-
ремы 3, сходясь к стационарной точке функции
F
, вообще говоря, не
дает решения исходной игры. Для того чтобы выходить из областей
притяжения стационарных точек функции (1) с целью попадания в
искомый глобальный максимум, будем использовать следующее свой-
ство экстремальной задачи (1), (2).
Теорема 4.
Ситуация
(
p , q
)
является равновесием по Нэшу в
исходной игровой задаче тогда и только тогда, когда в стационарной
точке целевой функции
(1)
p
=
μ
,
q
=
λ
.
Доказательство.
Ситуация равновесия
(
p , q
)
является точкой
глобального экстремума
F
(см. теорему 1). В ней значения функций
Лагранжа
L
и
F
совпадают [5], поэтому с учетом включений
μ
2
Σ
p
,
λ
2
Σ
q
получим
0 =
F
=
L
= (
p
μ
)
T
Aq
+
p
T
B
(
q
λ
)
.
Отсюда следует, что нулевой уровень целевой функции достигается
при выборе множителей Лагранжа
μ
=
p
,
λ
=
q
.
Обратное утверждение доказывается аналогичными рассуждения-
ми, применяемыми к точкам экстремума целевых функций в задачах
ЛП (3), (4). В случае задачи (3),
q
=
λ
, имеем
p
T
(
A
+
B
)
q
u
=
p
T
(
A
+
B
)
q
u
+ (
u e
T
p
T
B
)
λ
=
p
T
Aq .
Для задачи (4) получим
p
T
Bq
. Сложив найденные значения и вычтя
величину, которая дважды вошла в эту сумму, вычислим значение
целевой функции (1) в рассматриваемой точке:
F
=
p
T
Aq
+
p
T
Bq
p
T
(
A
+
B
)
q
= 0
.
Применение теоремы 1 завершает доказательство.
ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. “Естественные науки”. 2008. № 3
57
1,2,3 5,6
Powered by FlippingBook