При любой фиксированной стратегии партнера каждая из функ-
ций выигрыша (3), (4) является линейной по переменной
(
p, u
)
или
(
q, v
)
, представляющей выбираемую этим игроком стратегию. Таким
образом, (3), (4) — это взаимосвязанные задачи линейного программи-
рования (ЛП).
Замечание 1.
В случае
A
+
B
= 0
задачи ЛП (3), (4) взаимно двой-
ственны [3]. Как известно [1, 2], их решение дает ситуацию равновесия
исходной, в указанном случае,
антагонистической
игры.
Замечание 2.
Всякая ситуация равновесия
(
p
0
, u
0
, q
0
, v
0
) в игре (3), (4)
есть точка максимума функции (1) по каждой из переменных
x
= (
p, u
)
или
y
= (
q, v
)
в отдельности при фиксированном значении
(
y
0
или
x
0
)
другой переменной.
Теорема 2.
Если в ситуации равновесия
(
p
0
, u
0
, q
0
, v
0
) обе задачи
ЛП (3) (
q
=
q
0
) и (4) (
p
=
p
0
) имеют единственное решение, то
точка
(
p
0
, u
0
, q
0
, v
0
) является локальным максимумом функции (1) на
множестве (2) по совокупности переменных
.
Доказательство.
Рассмотрим приращение целевой функции (1) в
точке (
p
0
, u
0
, q
0
, v
0
). По условию теоремы имеющееся билинейное сла-
гаемое имеет более высокий порядок малости по сравнению с ли-
нейными, являющимися приращениями целевых функций (3), (4) в
их точках максимума. Поэтому приращение отрицательно при малых
вариациях переменных
(
p, u, q, v
)
. Следовательно, по любому допу-
стимому направлению функция (1) локально убывает.
Равновесия по Нэшу в игре (3), (4) будем называть
стационарными
точками целевой функции
F
(ввиду теоремы 2 и замечания 2).
Игровая задача (3), (4) намного проще исходной, так как в ней
игроки приходят к равновесию, поочередно делая свои “ходы”, начи-
ная игру из произвольной начальной ситуации.
Теорема 3.
Пусть вектор
p
t
+1
— решение задачи
(3)
,
q
=
q
t
,
q
t
+1
— решение задачи
(4)
,
p
=
p
t
,
t
= 0
,
1
, . . .
, причем элемент
q
0
2
Σ
q
выбран произвольно. Тогда
p
t
→
p
0
,
q
t
→
q
0
,
t
→ ∞
, где векторы
(
p
0
, q
0
) определяют некоторую ситуацию равновесия в игре
(3)
,
(4)
.
Доказательство.
Значения целевой функции (1)
F
(
p
t
+1
, u
t
+1
, q
t
, v
t
)
,
t
= 0
,
1
, . . .
, по построению образуют монотонно возрастающую, а
следовательно, сходящуюся последовательность. Ввиду компактности
множеств смешанных стратегий игроков можно считать, что последо-
вательность
{
p
t
, q
t
}
также сходится [4]. Предельный переход в усло-
виях задач ЛП (3), (4) показывает, что пара
(
p
0
, q
0
)
служит решением
задач ЛП (3), (4), т.е. является равновесием.
Через
λ
,
μ
обозначим двойственные переменные в экстремальной
задаче (1), (2), с помощью которых снимаются ограничения [5] в форме
56
ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. “Естественные науки”. 2008. № 3