Idea Transcript
Mathematik Kompakt
Christian Kanzow Alexandra Schwartz
Spieltheorie Theorie und Verfahren zur Lösung von Nash- und verallgemeinerten Nash-Gleichgewichtsproblemen
Mathematik Kompakt Herausgegeben von: Martin Brokate Aiso Heinze Karl-Heinz Hoffmann Mihyun Kang Götz Kersting Moritz Kerz Otmar Scherzer
Die Lehrbuchreihe Mathematik Kompakt ist eine Reaktion auf die Umstellung der Diplomstudiengänge in Mathematik zu Bachelor- und Masterabschlüssen. Inhaltlich werden unter Berücksichtigung der neuen Studienstrukturen die aktuellen Entwicklungen des Faches aufgegriffen und kompakt dargestellt. Die modular aufgebaute Reihe richtet sich an Dozenten und ihre Studierenden in Bachelor- und Masterstudiengängen und alle, die einen kompakten Einstieg in aktuelle Themenfelder der Mathematik suchen. Zahlreiche Beispiele und Übungsaufgaben stehen zur Verfügung, um die Anwendung der Inhalte zu veranschaulichen. Kompakt: relevantes Wissen auf 150 Seiten Lernen leicht gemacht: Beispiele und Übungsaufgaben veranschaulichen die Anwendung der Inhalte Praktisch für Dozenten: jeder Band dient als Vorlage für eine 2-stündige Lehrveranstaltung
Christian Kanzow Alexandra Schwartz
Spieltheorie Theorie und Verfahren zur Lösung von Nash- und verallgemeinerten Nash-Gleichgewichtsproblemen
Christian Kanzow Institut für Mathematik Universität Würzburg Würzburg, Deutschland
ISSN 2504-3846 Mathematik Kompakt ISBN 978-3-319-96678-6 https://doi.org/10.1007/978-3-319-96679-3
Alexandra Schwartz Fachbereich Mathematik Technische Universität Darmstadt Darmstadt, Deutschland
ISSN 2504-3854 (electronic) ISBN 978-3-319-96679-3 (eBook)
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Birkhäuser © Springer Nature Switzerland AG 2018 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichenund Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Birkhäuser ist ein Imprint der eingetragenen Gesellschaft Springer Nature Switzerland AG und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Gewerbestrasse 11, 6330 Cham, Switzerland
Vorwort
Die Spieltheorie beschäftigt sich mit der Beschreibung und Analyse von Spielen in einem weiten Sinne. Hierbei handelt es sich ganz allgemein um Konfliktsituationen zwischen mehreren Beteiligten (Spielern), die verschiedene Handlungsmöglichkeiten haben und damit den Ausgang des Konflikts beeinflussen können. Es kann sich bei einer solchen Konfliktsituation um einen Markt mit konkurrierenden oder interagierenden Unternehmen, um politische Gruppen mit unterschiedlichen Zielen, aber auch um die Spieler einer Schachpartie handeln. Hingegen beschäftigt sich die Spieltheorie nicht mit reinen Glücksspielen. Die Spieltheorie ist ein interdisziplinäres Forschungsgebiet. Sie tritt insbesondere in den Wirtschaftswissenschaften, in der Informatik und in der Mathematik auf. Die jeweiligen Schwerpunkte in den einzelnen Disziplinen unterscheiden sich jedoch. Im Zentrum dieses Buches stehen kontinuierliche Spiele, Nash-Gleichgewichtsprobleme und deren numerische Behandlung. Dabei werden teilweise sehr neue Ergebnisse aus Originalarbeiten vorgestellt. Zum besseren Verständnis haben wir in diversen Fällen die in den Artikeln behandelten Problemklassen vereinfacht, ohne dabei jedoch die zentrale Idee aus den Augen zu verlieren. Für die allgemeine Behandlung wird auf die jeweils zu Grunde liegende Arbeit verwiesen. In vielen Fällen basiert die Idee zur Lösung von (verallgemeinerten) Nash-Gleichgewichtsproblemen darauf, diese geeignet umzuformulieren, häufig in der Gestalt eines Optimierungsproblems. Ein gewisses Hintergrundwissen aus der Optimierung ist für das Verständnis dieses Buches daher hilfreich, für die theoretischen Ausführungen allerdings nicht zwingend notwendig, da die entsprechenden Resultate zur Verfügung gestellt werden. Das vorliegende Buch basiert auf Vorlesungen, welche die beiden Autoren an der Universität Würzburg und der TU Darmstadt für Bachelor- und Masterstudierende gehalten haben. Es kann verwendet werden, um in einer zwei- oder vierstündigen Vorlesung einen Einstieg in den Bereich der Spieltheorie zu geben. Dank ausführlicher Beweise und Übungsaufgaben ist es jedoch auch zum Selbststudium geeignet. Wir möchten uns bei Christian Schwartz, Theresa Lechner, Anna Walter, Daniel Nowak, Jan Becker, Eike Börgens und Daniel Steck für das aufmerksame Korrekturlesen unseres Manuskripts bedanken. Unser Dank gilt außerdem Herrn Brokate für die Einladung, dieses Buch zu schreiben. V
Inhaltsverzeichnis
1
Einführung . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Definition und Beispiele strategischer Spiele . 1.2 Klassifikation strategischer Spiele . . . . . . . 1.3 Nash-Gleichgewichte . . . . . . . . . . . . . . . 1.4 Andere Lösungskonzepte . . . . . . . . . . . . 1.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1 1 5 8 13 16
2
Mathematische Grundlagen . . . . . . . . . . . . . . 2.1 Konvexe Funktionen . . . . . . . . . . . . . . . . 2.2 Monotone Funktionen . . . . . . . . . . . . . . . 2.3 Grundlagen aus der nichtlinearen Optimierung 2.4 Projektionen . . . . . . . . . . . . . . . . . . . . . 2.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
19 19 28 35 38 41
3
Existenz von Nash-Gleichgewichten . . . . . . . . . . . . . . . . . . . . . 3.1 Nash-Gleichgewichte und Variationsungleichungen . . . . . . . . . 3.2 Existenz von Nash-Gleichgewichten via Variationsungleichungen 3.3 Der Existenzsatz von Nikaido-Isoda . . . . . . . . . . . . . . . . . . . 3.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
43 43 46 53 56
4
Zwei-Personen-Spiele . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Matrixspiele . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Matrixspiele in gemischten Strategien . . . . . . . . . . . . 4.3 Bi-Matrixspiele und quadratische Programme . . . . . . . 4.4 Bi-Matrixspiele und lineare Komplementaritätsprobleme 4.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
59 59 64 68 74 77
5
Verallgemeinerte Nash-Gleichgewichtsprobleme . . . . . . 5.1 Problemstellung und Beispiele . . . . . . . . . . . . . . . 5.2 Normalisierte Nash-Gleichgewichte . . . . . . . . . . . . 5.3 Charakterisierung normalisierter Nash-Gleichgewichte
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
79 79 83 86
. . . .
VII
VIII
Inhaltsverzeichnis
5.4 5.5
Existenz normalisierter Nash-Gleichgewichte . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
90 93
6
Numerische Verfahren für NEPs . . . . . . . . . . . . . . . . . . . . . . . 6.1 Diagonalisierung nach Jacobi und Gauß-Seidel . . . . . . . . . . . . 6.2 Potentialspiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Konvergenz des Diagonalisierungsverfahrens für zwei Spieler . . . 6.4 Ein regularisiertes Diagonalisierungsverfahren für Potentialspiele 6.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. 95 . 95 . 98 . 99 . 102 . 105
7
Numerische Verfahren für GNEPs . . . . . . . . . . . . . . . . . . . . 7.1 Die Nikaido-Isoda-Funktion und ein Relaxationsverfahren . . . 7.2 Die regularisierte Nikaido-Isoda-Funktion . . . . . . . . . . . . . 7.3 Die Differenz zweier regularisierter Nikaido-Isoda-Funktionen 7.4 Berechnung nicht-normalisierter Lösungen von GNEPs . . . . . 7.5 Ein Multiplier-Penalty-Zugang . . . . . . . . . . . . . . . . . . . . 7.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
107 108 111 118 123 126 132
8
Numerische Verfahren für VIPs . . . . . . 8.1 Projektionsverfahren . . . . . . . . . . 8.2 Josephy-Newton-Verfahren . . . . . . 8.3 Die (regularisierte) Gap-Funktion . . 8.4 Die D-Gap-Funktion . . . . . . . . . . 8.5 Verallgemeinerte KKT-Bedingungen 8.6 Aufgaben . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
135 135 138 143 151 155 158
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
1
Einführung
Dieses Kapitel ist der Einführung in die grundlegenden Begriffe und Konzepte der Spieltheorie gewidmet. Insbesondere wollen wir bekannte Beispiele für Spiele vorstellen, Spiele bezüglich relevanter Eigenschaften klassifizieren und Lösungsbegriffe für Spiele definieren.
1.1 Definition und Beispiele strategischer Spiele Wir beginnen diesen Abschnitt mit der zentralen Definition eines strategischen Spiels. Definition 1.1
Ein (strategisches) Spiel (in Normalform) wird beschrieben durch (a) eine Menge f1; : : : ; N g von (endlich vielen) Spielern, (b) Strategiemengen X für jeden Spieler D 1; : : : ; N , (c) Auszahlungsfunktionen oder Nutzenfunktionen W X ! R für jeden Spieler D 1; : : : ; N , wobei X WD X1 : : : XN das kartesische Produkt aller Strategiemengen bezeichnet. Zur Abkürzung für ein solches Spiel schreiben wir D fX ; gN D1 und bezeichnen auch als ein N -Personen-Spiel. In der Literatur findet man häufig eine allgemeinere Definition eines (strategischen) Spiels, bei der als Bildbereich der Auszahlungsfunktionen nicht notwendig die Menge der reellen Zahlen steht, vergleiche etwa [40]. Für unsere (und viele andere) Zwecke genügt jedoch die obige Definition. Wir illustrieren den Begriff eines Spiels zunächst an einigen (sehr populären) Beispielen. © Springer Nature Switzerland AG 2018 C. Kanzow, A. Schwartz, Spieltheorie, Mathematik Kompakt, https://doi.org/10.1007/978-3-319-96679-3_1
1
2
1
Einführung
Beispiel (Gefangenendilemma) Nach einem Raubüberfall werden zwei Personen 1 und 2 festgenommen, da sie unter dringendem Tatverdacht stehen. Die Polizei trennt beide Personen, damit zwischen diesen keine Absprachen möglich sind, und macht beiden unabhängig voneinander den folgenden Vorschlag:
Wenn einer sich schuldig bekennt und der andere nicht, so erhält der Geständige als Strafe 1 Jahr Gefängnis aufgrund einer Kronzeugenregelung, während der andere (Nichtgeständige) dann für 10 Jahre ins Gefängnis kommt. Wenn beide gestehen, bekommt jeder 5 Jahre Gefängnis. Wenn keiner gesteht, bekommt jeder 2 Jahre Gefängnis wegen illegalen Waffenbesitzes. Hierbei handelt es sich um ein Spiel im Sinne der Definition 1.1 mit der Menge f1; 2g von zwei Spielern, den Strategiemengen X1 WD X2 WD fS; Gg mit
S WD schweigen;
G WD gestehen
und den Auszahlungsfunktionen 1 W X1 X2 ! R;
2 W X1 X2 ! R;
die elementweise definiert sind durch 1 .S; S / WD 2;
1 .S; G/ WD 10;
2 .S; S / WD 2;
2 .S; G/ WD 1;
1 .G; S / WD 1;
1 .G; G/ WD 5
2 .G; S / WD 10;
2 .G; G/ WD 5:
und
Dies ist die formale Beschreibung des Gefangenendilemmas als ein 2-Personen-Spiel in Normalform.
In diesem Beispiel traten lediglich 2 Spieler auf und die zugehörigen Strategiemengen waren beide endlich. In einem solchen Fall lassen sich die Auszahlungsfunktionen einfacher in der Gestalt einer Auszahlungsmatrix angeben, wobei man, je nach Zusammenhang, auch von einer Gewinn- oder Verlustmatrix spricht. Im vorigen Beispiel sind die Auszahlungsmatrizen der beiden Spieler gegeben durch: Auszahlungsmatrix für Spieler 1 Auszahlungsmatrix für Spieler 2
Spieler 1
Spieler 2
Spieler 2
S
G
S
G
S
2
10
S
2
1
G
1
5
G
10
5
Spieler 1
Zur Analyse des Spiels: Intuitiv ist .S; S/ die beste Lösung, denn dann bekämen beide Spieler „nur“ eine Strafe von 2 Jahren. Allerdings dürfen sich die Spieler ja nicht absprechen. Daher besteht für jeden Spieler, der die Strategie S wählt, die große Gefahr, dass der
1.1
Definition und Beispiele strategischer Spiele
3
jeweils andere Spieler die Strategie G wählt, um dann nur 1 Jahr Gefängnis zu erhalten, während der erste für 10 Jahre ins Gefängnis muss. Um dieser Gefahr vorzubeugen, wird ein strategisch denkender Spieler deshalb die Strategie G wählen. Dann bekommt er 5 Jahre (statt 10 Jahre) Gefängnis, wenn der andere Spieler gesteht, bzw. 1 Jahr (statt 2 Jahre) Gefängnis, wenn der andere schweigt. Aus analogen Überlegungen heraus wird der andere Spieler ebenfalls die Strategie G wählen. Beide erhalten somit eine Gefängnisstrafe von 5 Jahren. Dies ist insofern ein Dilemma, als dass sie beide mit nur 2 Jahren davonkommen könnten, sofern sie sich beide auf die Strategie S einigen würden. Eine Einigung ist aber nicht möglich, da beide Spieler sich nicht absprechen konnten und man davon ausgehen muss, dass jeder Spieler selbstsüchtig ist und im Falle der gegnerischen Strategie S selbst die Strategie G wählt, um möglichst doch nur 1 Jahr Gefängnis zu erhalten. Beispiel (Kampf der Geschlechter) Ein Ehepaar möchte gemeinsam ein Konzert besuchen, allerdings bevorzugt sie ein Konzert mit Musik von Bach, während er lieber ein Konzert mit Musik von Stravinsky hören möchte. Bezeichnen wir die Ehefrau als Spieler 1 und den Ehemann als Spieler 2, so haben beide Spieler die Strategiemengen
X1 WD X2 WD fBach; Stravinskyg: Die Auszahlungsfunktionen 1 und 2 ergeben sich aus der nachfolgenden Auszahlungsmatrix:
Spieler 1 (Ehefrau)
Bach Stravinsky
Spieler 2 (Ehemann) Bach Stravinsky 2; 1 0; 0 0; 0 1; 2
Die jeweils erste Zahl soll dabei die Bewertung der Ehefrau sein, die zweitgenannte Ziffer die Bewertung des Mannes. Wir haben die eigentlich zwei Auszahlungsmatrizen somit etwas kompakter in einer Matrix zusammengefasst.
Die Situation in diesem Beispiel ist anders als im Gefangenendilemma, denn jetzt können (und wollen) beide Spieler sich miteinander absprechen (in der Spieltheorie nennt man dies kooperieren). Da man gemeinsam ausgehen will, sind die beiden Strategientupel .Bach, Stravinsky/ und .Stravinsky, Bach/ wertlos. Die Bewertungen der beiden Kombinationen .Bach, Bach/ und .Stravinsky, Stravinsky/ sind bei Mann und Frau zwar verschieden, in ihrer Summe allerdings gleich. Daher wird keine dieser beiden Kombinationen bevorzugt. Beispiel (Schere, Stein, Papier) Gegeben seien zwei Spieler 1 und 2, die unabhängig voneinander Schere, Stein oder Papier wählen. Die Strategiemengen beider Spieler sind also gegeben durch
X1 WD X2 WD fSchere, Stein, Papierg:
4
1
Einführung
Es gelten die bekannten Regeln: Schere schneidet Papier, Papier hüllt Stein ein und Stein macht Schere stumpf. Das können wir auch auf die folgende Weise ausdrücken: Schere schlägt Papier;
Papier schlägt Stein;
Stein schlägt Schere:
Gewinnt Spieler 1, so erhält er 1 Euro von Spieler 2, verliert Spieler 1, so zahlt er hingegen 1 Euro an den Gegenspieler. In Patt-Situationen müssen keine Zahlungen erfolgen. Die Auszahlungsmatrix dieses Spiels lautet daher wie folgt:
Spieler 1
Schere Stein Papier
Schere 0; 0 1; 1 1; 1
Spieler 2 Stein Papier 1; 1 1; 1 0; 0 1; 1 1; 1 0; 0
Die Einträge in dieser Matrix haben ansonsten dieselbe Bedeutung wie im vorigen Beispiel.
Im obigen Spiel gibt es offensichtlich keine Strategie, die garantiert zum Sieg führt. Würde man hingegen die Wahl des Gegenspielers kennen, so gäbe es stets eine Strategie, die einem den Sieg einbringt. Ansonsten ist der Gewinn des einen Spielers immer gleich dem Verlust des anderen, sodass die Summe der Auszahlungsfunktionen 1 und 2 stets gleich Null ist. Wir werden solche Spiele später Nullsummenspiele nennen. Beispiel (Oligopol-Modell nach Cournot1 ) Ein gewisses Produkt möge von N Unternehmen produziert werden. (Üblicherweise geht man bei einem Oligopol davon aus, dass es sich hierbei nur um wenige Unternehmen handelt, aus mathematischer Sicht darf die Zahl N auch groß sein.) Sei x die vom -ten Unternehmen hergestellte Menge dieses Produkts. Es seien ferner c .x / die gesamten Kosten, P die für das Unternehmen zur Erzeugung von x Einheiten des Produktes anfallen. Seien WD N D1 x die insgesamt vom Produkt hergestellte Menge und p./ der Preis pro Einheit des Produktes, bei dem die Konsumenten gewillt sind, insgesamt Einheiten zu kaufen. (Die Funktion p heißt auch inverse Nachfragefunktion2 .) Jedes Unternehmen versucht seinen Gewinn zu maximieren. Für das Unternehmen ergibt sich daher das Optimierungsproblem3 X max p x C x x c .x / u. d. N. x 0; x
¤
wobei x für ¤ die Produktionsmengen der Konkurrenzunternehmen bezeichnet. Das Unternehmen besitzt somit die Strategiemenge X WD Œ0; C1/ (da nur nichtnegative Stückzahlen produziert werden können) und die Auszahlungsfunktion X .x/ WD p x C x x c .x /; ¤
welche gerade die Differenz zwischen den Einnahmen und den Ausgaben (Kosten) angibt. 1
Antoine-Augustin Cournot (1801–1877), Mathematiker und Wirtschaftstheoretiker Die Nachfragefunktion f .p/ gibt zu jedem Preis p die gesamte Nachfrage D f .p/ des Produktes an. Nehmen wir f als streng monoton fallend an, so besitzt f eine Inverse p./ WD f 1 ./. Dies liefert gerade die inverse Nachfragefunktion, die dann natürlich ebenfalls streng monoton fällt. 3 u. d. N. D unter der Nebenbedingung 2
1.2
Klassifikation strategischer Spiele
5
Das vorige Beispiel unterscheidet sich von seinen Vorgängern darin, dass die Strategiemengen jetzt nicht mehr endlich sind. Wir werden dies später ein kontinuierliches Spiel nennen. Die möglichen Auszahlungen lassen sich offenbar nicht mehr in Form einer einfachen Tabelle oder Matrix angeben.
1.2 Klassifikation strategischer Spiele Wie wir an den vorherigen Beispielen gesehen haben, lässt die Definition eines Spieles große Freiheiten. Wir führen daher in diesem Abschnitt einige Begriffe ein, die zur Klassifikation von strategischen Spielen nützlich sind und später bei der Wahl eines geeigneten Lösungsverfahrens eine gewisse Rolle spielen. Zunächst können wir Spiele anhand der Größe der Strategiemengen unterscheiden. Definition 1.2
Ein Spiel D fX ; gN D1 heißt (a) endlich, wenn alle Strategiemengen X nur endlich viele Elemente enthalten; (b) abzählbar, wenn mindestens eine Strategiemenge X abzählbar viele Elemente enthält und alle anderen Strategiemengen höchstens abzählbar sind; (c) überabzählbar oder kontinuierlich, wenn mindestens eine Strategiemenge X überabzählbar viele Elemente enthält. Endliche Spiele sind beispielsweise das Gefangenendilemma, der Kampf der Geschlechter und das Stein-Schere-Papier-Spiel. Hingegen ist das Oligopol-Modell nach Cournot ein kontinuierliches Spiel. Wir werden uns im Folgenden ausschließlich mit endlichen und kontinuierlichen Spielen auseinandersetzen, wobei letztere den Schwerpunkt unserer Ausführungen bilden. Eine andere Klassifikation von strategischen Spielen basiert auf gewissen Eigenschaften der Auszahlungsfunktionen. Definition 1.3
Ein Spiel D fX ; gN D1 heißt P : : : XN gilt; (a) Nullsummenspiel, falls N D1 .x/ D 0 für alle x 2 X WD X1P (b) Konstantsummenspiel, falls es eine Konstante c 2 R gibt mit N D1 .x/ D c für alle x 2 X WD X1 : : : XN ; (c) Nicht-Nullsummenspiel, wenn es kein Nullsummenspiel ist. Das Stein-Schere-Papier-Spiel ist nach obiger Definition etwa ein Nullsummenspiel. Alle anderen im Abschn. 1.1 vorgestellten Beispiele von strategischen Spielen sind NichtNullsummenspiele. Wir werden später sehen, dass Konstantsummenspiele stets auf Nullsummenspiele zurückgeführt werden können. Daher betrachten wir nur Nullsummenspiele und meinen mit
6
1
Einführung
dem Begriff Nicht-Nullsummenspiel üblicherweise auch, dass es sich bei dem Spiel nicht um ein Konstantsummenspiel handelt. Schließlich können wir Spiele auch nach der Anzahl der Spieler unterschieden. Endliche Spiele mit nur zwei Spielern sind oft von besonderer Bedeutung und erhalten daher einen eigenen Namen. Sie werden später im Kap. 4 kurz behandelt. Definition 1.4
(a) Ein endliches 2-Personen-Nullsummenspiel heißt Matrixspiel. (b) Ein endliches 2-Personen-Spiel heißt Bi-Matrixspiel. Wir wollen noch kurz erläutern, warum man von einem Matrix- bzw. Bi-Matrixspiel spricht. Betrachte dazu zunächst ein endliches 2-Personen-Spiel D fX ; g2D1 . Nach Voraussetzung sind die beiden Strategiemengen X WD X1 und Y WD X2 endlich, etwa X D fx1 ; : : : ; xm g und Y WD fy1 ; : : : ; yn g. Definieren wir dann zwei Matrizen A; B 2 Rmn elementweise durch die Auszahlungen aij WD 1 .xi ; yj /;
bij WD 2 .xi ; yj /
8i D 1; : : : ; m; 8j D 1; : : : ; n;
so kann man die Auszahlungsfunktionen 1 und 2 durch die beiden Matrizen A und B vollständig darstellen. Man benötigt hierzu allerdings im Allgemeinen tatsächlich zwei Matrizen, weshalb man von einem Bi-Matrixspiel spricht. Im Falle eines 2-PersonenNullsummenspiels hingegen ist B D A, sodass man mit nur einer Matrix auskommt und daher von einem Matrixspiel spricht. Beispiele von Bi-Matrixspielen sind das Gefangenendilemma und der Kampf der Geschlechter, während es sich bei Stein-Schere-Papier um ein Matrixspiel handelt (die Summe der Auszahlungen ist stets Null). Neben den gerade eingeführten Klassifikationsmerkmalen, die für unsere Ausführungen eine gewisse Rolle spielen, existieren verschiedene weitere Unterscheidungsmöglichkeiten, die insbesondere dann wichtig werden, wenn man weitere spieltheoretische Themen behandeln möchte, die im Rahmen dieses Buches nicht weiter vorkommen. Die folgende Liste entstammt im Wesentlichen dem Vorlesungsskript [23] und mag bei der Einordnung der in der Literatur zur Spieltheorie behandelten Probleme hilfreich sein: kooperative vs. nicht-kooperative Spiele Bei den nicht-kooperativen Spielen wird davon ausgegangen, dass die einzelnen Spieler strikt gegeneinander agieren und es keine bindenden Absprachen (Kooperationen) zwischen den Teilnehmern gibt, wie sie bei den kooperativen Spielen erlaubt sind. Zur Sicherung des Wettbewerbs ist das Bundeskartellamt beispielsweise dafür verantwortlich, dass es in gewissen Bereichen (etwa bei den Mineralölkonzernen) keine Kooperationen (Preisabsprachen) gibt. Ein bekanntes Beispiel einer Kooperation verschiedener beteiligter Personen (Länder) ist das Ölkartell der OPEC, bei der sich alle Teilnehmerländer auf eine Förderquote einlassen und auf diese verpflichten müssen. Wir werden in unseren Ausführungen ausschließlich nicht-kooperative Spiele betrachten.
1.2
Klassifikation strategischer Spiele
7
simultane vs. sequentielle Spiele Bei simultanen Spielen wählen alle Spieler ihre Strategien gleichzeitig aus. Keinem Spieler sind die Entscheidungen der Gegenspieler bekannt. Bei den sequentiellen Spielen hingegen tritt eine zeitliche Reihenfolge der Spielzüge auf. Eine wichtige Klasse von sequentiellen Spielen sind die so genannten StackelbergSpiele4 . Im Prinzip handelt es sich bei diesen Stackelberg-Spielen um eine DuopolSituation, bei der, anders als im Cournot-Beispiel, ein Unternehmen (der StackelbergFührer) zuerst entscheidet und das andere Unternehmen (der Stackelberg-Folger) erst danach seine Strategie optimal anpasst. Wir werden hier nur simultane Spiele untersuchen. einmalige vs. wiederholte Spiele Einmalige Spiele werden genau einmal gespielt, bei den wiederholten Spielen hingegen kann ein und dasselbe Spiel mehrfach hintereinander ausgeführt werden. Die Lösung einer Instanz des wiederholten Spiels muss dabei nicht immer der Lösung des einmaligen Spiels entsprechen, was eine Unterscheidung auch völlig überflüssig machen würde. Stattdessen können Lerneffekte auftreten, die einen Einfluss auf die Wahl der möglichen Strategien haben können. Als Beispiel für einen solchen Lerneffekt betrachten wir zwei Agenten, die verschlossene Koffer austauschen und sich sofort wieder trennen. Diese Koffer können entweder leer sein oder Informationen enthalten. Wir gehen davon aus, dass für jeden Agenten die eigenen Informationen gewisse Kosten verursachen, die gegnerischen Informationen jedoch wertvoller sind. Tauschen beide Agenten nur einmal Koffer aus, so ist es, ähnlich zum Gefangenendilemma, sinnvoll, einen leeren Koffer zu tauschen. Planen beide Agenten hingegen einen wiederholten Informationsaustausch, so ist ein solcher Vertrauensbruch eher hinderlich. Wir betrachten hier lediglich einmalige Spiele. Spiele mit vollständiger vs. unvollständiger Information Das hier angesprochene Unterscheidungsmerkmal bezieht sich auf die Informationslage der Spieler. Bei Spielen mit vollständiger Informationen stehen sämtliche relevanten Informationen allen Spielern zur Verfügung. Jeder Spieler kennt die möglichen Strategien sowie die Auszahlungsfunktionen von allen Mitspielern. Man spricht in diesem Zusammenhang auch von Spielen mit vollkommener Information. Anderenfalls handelt es sich um eine Spiel mit unvollständiger (unvollkommener) Information. Schach ist etwa ein Paradebeispiel für ein Spiel mit vollkommener Information: Beide Spieler kennen den kompletten bisherigen Spielverlauf und wissen, welche Zugmöglichkeiten im Augenblick bestehen. Skat hingegen ist ein Spiel mit unvollständiger Information. Zwar ist bekannt, welche Karten die beteiligten Spieler in jeder Runde abgelegt haben, jedoch ist die anfängliche Kartenverteilung zufallsbedingt, sodass man nicht weiß, welche Karten die Mitspieler noch auf der Hand halten. Bei uns treten ausschließlich Spiele mit vollständiger Information auf. 4
Heinrich Freiherr von Stackelberg (1905–1946), Ökonom
8
1
Einführung
1.3 Nash-Gleichgewichte Wir haben im Abschn. 1.1 mehrere Beispiele von strategischen Spielen betrachtet und uns dabei intuitiv klar gemacht, welches wohl die Lösung des gegebenen strategischen Spiels ist, ohne hierfür einen formalen Lösungsbegriff zur Hand zu haben. Dies soll in diesem Abschnitt nachgeholt werden. Dabei sei bereits an dieser Stelle erwähnt, dass es eine Reihe von verschiedenen Lösungsbegriffen gibt. Der bedeutendste seiner Art ist aber sicherlich der eines Nash-Gleichgewichts5 , den wir deshalb auch an den Anfang dieses Abschnitts stellen. Definition 1.5 ; N Gegeben sei ein strategisches Spiel D fX ; gN /D1 heißt D1 . Ein Vektor x D .x ; Nash-Gleichgewicht dieses Spiels, wenn x 2 X und
.x / .x ;1 ; : : : ; x ;1 ; x ; x ;C1 ; : : : ; x ;N /
8x 2 X
(1.1)
und alle D 1; : : : ; N gilt. Zur bequemeren Formulierung der Bedingung (1.1) führen wir noch eine neue und in der Spieltheorie übliche Schreibweise ein: Ist x D .x 1 ; : : : ; x N /T ein gegebener Vektor mit den Block-Komponenten x 2 X ; D 1; : : : ; N , und wollen wir die -te BlockKomponente x besonders hervorheben, so schreiben wir hierfür x D .x ; x /T ; wobei x alle Block-Komponenten x mit ¤ enthält. Dann ist .x ; x ; / eine abkürzende Bezeichnung für den Vektor .x ;1 ; : : : ; x ;1 ; x ; x ;C1 ; : : : ; x ;N /T , bei dem die Block-Komponente x ; durch x ersetzt wird. In dieser Notation ist x D .x ; /N D1 genau dann ein Nash-Gleichgewichtspunkt des gegebenen Spiels, wenn x ; 2 X und .x / .x ; x ; /
8x 2 X
und alle D 1; : : : ; N gelten. Das bedeutet gerade, dass x ; eine Lösung des Optimierungsproblems .x ; x ; / min x
u. d. N. x 2 X
(1.2)
für alle D 1; : : : ; N ist. Man beachte hierbei, dass die Zielfunktion von der optimalen Strategie aller Mitspieler abhängt und daher im Allgemeinen nicht explizit bekannt ist. 5
John Forbes Nash (1928–2015), Mathematiker (Spieltheorie und Differentialgeometrie); 1994 Nobelpreis für Wirtschaftswissenschaften. Selbst Hollywood hat ihm mit dem Spielfilm „A Beautiful Mind“ ein Denkmal gesetzt.
1.3
Nash-Gleichgewichte
9
Das Lösungskonzept von Nash lässt sich auch noch etwas anders formulieren. Sei dazu x D .x 1 ; : : : ; x N /T ein gegebener Vektor und S .x / die Lösungsmenge des Optimierungsproblems .x ; x / min x
u. d. N. x 2 X
für D 1; : : : ; N . Dann ist x D .x ; /N D1 offenbar genau dann ein Nash-Gleichgewicht des gegebenen Spiels, wenn x ; 2 S .x ; /
8 D 1; : : : ; N
gilt. Wir halten diese Beobachtung formal in dem folgenden Resultat fest. Satz 1.6 Gegeben sei ein strategisches Spiel D fX ; gN D1 . Dann ist x genau ; ; 2 S .x / für alle D 1; : : : ; N dann ein Nash-Gleichgewicht von , wenn x gilt.
Im Zusammenhang mit dem obigen Resultat ist der nachfolgende Begriff manchmal recht nützlich. Definition 1.7
Die Abbildung x 7! S .x / heißt die Beste-Antwort-Funktion des Spielers . Die hieraus zusammengesetzte Abbildung x 7! S.x/ mit S.x/ WD S1 .x 1 / : : : SN .x N /
wird auch als Beste-Antwort-Funktion des gegebenen Spiels bezeichnet. Mit diesen Bezeichnungen lässt sich der Satz 1.6 auch so formulieren, dass x genau dann ein Nash-Gleichgewicht ist, wenn x 2 S.x / gilt. I Bemerkung 1.8 Wir haben bislang den Fall betrachtet, dass die Block-Komponenten
x ; eines Nash-Gleichgewichtes die Lösung eines Minimierungsproblems sind, siehe (1.2). Häufig haben wir es jedoch auch mit Maximierungsproblemen zu tun, vergleiche etwa das Oligopol-Modell. In diesem Fall heißt x natürlich ein Nash-Gleichgewicht des gegebenen Spieles D fX ; gN D1 , wenn .x / .x ; x ; /
8x 2 X
und alle D 1; : : : ; N gilt. Offenbar ist x genau dann eine Lösung der Minimierungsprobleme .x ; x ; / u. d. N. x 2 X min x
10
1
Einführung
für D 1; : : : ; N , wenn x die Maximierungsprobleme .x ; x ; / u. d. N. x 2 X max x
für D 1; : : : ; N löst. Durch Ersetzen von durch lassen sich alle Ausführungen und Ergebnisse für Nash-Gleichgewichte in Minimierungsform auf Nash-Gleichgewichte in Maximierungsform übertragen (und umgekehrt). Die obige Bemerkung ist für unsere weiteren Ausführungen sehr wichtig, da wir häufig zwischen Nash-Gleichgewichten in Minimierungsform und Nash-Gleichgewichten in Maximierungsform springen werden. Aus dem jeweiligen Zusammenhang ist stets klar, ob wir nun minimieren oder maximieren wollen. Im Gefangenendilemma zum Beispiel soll die Strafe in Gefängnisjahren natürlich minimiert werden, während im Oligopol-Beispiel der Gewinn der Unternehmen zu maximieren ist. Wir überprüfen das Lösungskonzept von Nash kurz an den Beispielen des vorigen Abschnitts. Beispiel
(a) Das Gefangenendilemma besitzt offenbar genau einen Nash-Gleichgewichtspunkt, nämlich die Strategiekombination .G; G/, bei dem beide Spieler gestehen. Dies entspricht gerade der im vorigen Abschnitt intuitiv herausgearbeiteten Lösung. (b) Im Kampf der Geschlechter gibt es zwei Nash-Gleichgewichte, nämlich die Strategiekombinationen (Bach, Bach) und (Stravinsky, Stravinsky). Durch das Lösungskonzept von Nash wird keine dieser beiden Strategien bevorzugt. (c) Das Stein-Schere-Papier-Spiel schließlich hat gar kein Nash-Gleichgewicht. Dies entspricht unserer früheren Beobachtung, dass es hier keine Lösung gibt.
Wir betrachten als Nächstes auch noch ein konkretes Beispiel zum Oligopol-Modell von Cournot. Da hier nur N D 2 Unternehmen (Spieler) beteiligt sind, spricht man statt von einem Oligopol meist von einem Duopol. Beispiel (Duopol-Modell nach Cournot) Betrachte das Oligopol-Modell von Cournot mit N D 2 Unternehmen, linearen Kostenfunktionen c .x / WD cx für D 1; 2 (mit einer Konstanten c > 0) und der inversen Nachfragefunktion ( P ; falls P; p./ WD 0; falls P; P
p(ξ) 0
c
P
ξ
1.3
Nash-Gleichgewichte
11
a) θ1 0
b) θ1 P − x2
x1
0 P − x2
c) θ1 x1
0
x1
Abb. 1.1 Illustration der Auszahlungsfunktionen 1 in Cournot-Duopol. a) 1 .x1 ; x2 / für 0 x2 < P c, b) 1 .x1 ; x2 / für P c x2 < P , c) 1 .x1 ; x2 / für x2 P
für eine weitere Konstante P > c. Damit lautet die zu maximierende Zielfunktion des Unternehmens 1 ( .P x1 x2 c/x1 ; falls x1 C x2 P; 1 .x1 ; x2 / WD p.x1 C x2 /x1 c1 .x1 / D falls x1 C x2 P: cx1 ; Entsprechend lautet die zu maximierende Zielfunktion des Unternehmens 2 ( .P x1 x2 c/x2 ; falls x1 C x2 P; 2 .x1 ; x2 / WD p.x1 C x2 /x2 c2 .x2 / D falls x1 C x2 P: cx2 ; Maximieren der beiden Nutzenfunktionen 1 bzw. 2 bezüglich x1 bzw. x2 für gegebene gegnerische Strategien x2 bzw. x1 , siehe auch Abb. 1.1 für eine Illustration von x1 7! 1 .x1 ; x2 / für verschiedene Werte von x2 , zeigt nun, dass die zugehörigen Beste-Antwort-Funktionen der beiden Unternehmen (in dem letztlich nur interessierenden Fall x1 C x2 < P ) wie folgt lauten: ( 1 .P c x2 /; falls x2 P c; S1 .x2 / D 2 0; falls x2 P c; ( 1 .P c x1 /; falls x1 P c; S2 .x1 / D 2 0; falls x1 P c (beachte hierbei, dass die Produktionszahlen x1 ; x2 nichtnegativ sein sollen). Nun ist x D .x1 ; x2 / genau dann ein Nash-Gleichgewicht, wenn x1 2 S1 .x2 / und x2 2 S2 .x1 / gelten. Da die beiden Beste-Antwort-Funktionen jeweils einelementig sind, ist dies äquivalent zu ( 1 .P c x2 /; falls x2 P c; x1 D 2 0; falls x2 P c; ( 1 .P c x1 /; falls x1 P c; x2 D 2 0; falls x1 P c: Eine elementare geometrische Überlegung zeigt nun (vergleiche die Abb. 1.2), dass 1 1 x WD .P c/; .P c/ 3 3 der einzige Nash-Gleichgewichtspunkt im gegebenen Duopol-Modell ist. Die Nash-Gleichgewichte im Zusammenhang mit dem Oligopol-Modell von Cournot werden in der Literatur oft auch als Cournot-Nash-Gleichgewichte bezeichnet.
12
1
Einführung
− c)
S2 (x1 ) x1 P −c
x2
Abb. 1.2 Illustration der Beste-Antwort-Funktionen im Cournot-Duopol
P − c S1 (x2 )
1 2 (P
x∗
− c)
0
1 2 (P
Das folgende Resultat beschäftigt sich damit, wie die Auszahlungsfunktionen von Spielen manipuliert werden können, ohne die Menge der Nash-Gleichgewichte zu verändern. e N e Satz 1.9 Seien D fX ; gN D1 und D fX ; gD1 zwei Spiele mit gleicher Zahl an Spielern und gleichen Strategiemengen derart, dass für die zugehörigen Auszahlungsfunktionen eine Beziehung der Gestalt e .x/ D r .x/ C .x / 8 D 1; : : : ; N
(1.3)
mit Konstanten r > 0 und Funktionen W X ! R gilt, wobei X WD X1 : : : e strategisch äquivalent, X1 XC1 : : :XN sei. Dann sind die beiden Spiele und d. h. sie besitzen die gleichen Nash-Gleichgewichte. Beweis Sei x ein Nash-Gleichgewicht von . Dann ist x 2 X1 : : : XN und .x / .x ; x ; /
8x 2 X
und für alle D 1; : : : ; N . Dies impliziert für alle D 1; : : : ; N und alle x 2 X e .x / D r .x / C .x ; / r .x ; x ; / C .x ; / D e .x ; x ; /: e. Also ist x auch ein Nash-Gleichgewicht von e , also Sei umgekehrt x ein Nash-Gleichgewicht von e .x / e .x ; x ; / 8x 2 X
8 D 1; : : : ; N:
Wegen (1.3) ist dies äquivalent zu r .x / C .x ; / r .x ; x ; / C .x ; / 8x 2 X
8 D 1; : : : ; N:
Durch geeignetes Kürzen erhalten wir hieraus .x / .x ; x ; /
8x 2 X
Also ist x auch ein Nash-Gleichgewicht von .
8 D 1; : : : ; N:
1.4
Andere Lösungskonzepte
13
Wegen Satz 1.9 bleibt die Menge der Nash-Gleichgewichte unverändert, wenn wir bei einem gegebenen Spiel die Auszahlungsfunktionen mit einer positiven Konstanten multiplizieren oder eine von x unabhängige Funktion addieren. Eine direkte Anwendung dieses Resultats zeigt, dass man in der Theorie nicht zwischen Konstantsummenspielen und Nullsummenspielen unterscheiden muss. Lemma 1.10 Jedes Konstantsummenspiel ist strategisch äquivalent zu einem Nullsummenspiel. Beweis Sei D fX ; gN D1 ein Konstantsummenspiel. Dann existiert ein c 2 R mit PN .x/ D c für alle x 2 X WD X1 : : : XN . Definiere nun ein zweites Spiel D1 Q .x/ WD .x/ c für D 1; : : : ; N . Nach Satz 1.9 ist das durch Q D fX ; Q gN D1 N Spiel Q strategisch äquivalent zu dem Konstantsummenspiel . Wegen N X D1
Q .x/ D
N X
.x/
D1
c Dcc D0 N
für alle x 2 X handelt es sich bei Q außerdem um ein Nullsummenspiel.
1.4 Andere Lösungskonzepte Mit dem Nash-Gleichgewicht haben wir das zentrale Lösungskonzept der Spieltheorie kennengelernt. Es gibt allerdings eine Reihe weiterer Lösungsansätze, von denen wir hier zumindest zwei vorstellen wollen. Bei einem Nash-Gleichgewicht wird die optimale Strategie des Spielers so gewählt, dass er seine eigene Auszahlungsfunktion bei gegebener optimaler Strategie aller Mitspieler minimiert (bzw. maximiert). Kann jeder Spieler seine Strategie hingegen unabhängig davon wählen, wie sich die übrigen Spieler verhalten, so gelangt man zu dem Begriff eines Gleichgewichtes in dominanten Strategien. Definition 1.11
Gegeben sei ein Spiel D fX ; gN D1 . (a) Für einen festen Spieler dominiert eine Strategie xN 2 X eine andere Strategie x 2 X , wenn .xN ; x / .x ; x / für alle x 2 X WD X1 : : : X1 XC1 : : : XN gilt.
14
1
Einführung
(b) Für einen festen Spieler heißt eine Strategie xN 2 X dominant, wenn sie jede andere Strategie x 2 X dominiert. (c) Ein Vektor x 2 X WD X1 : : : XN heißt Gleichgewicht in dominanten Strategien, wenn für alle Spieler D 1; : : : ; N .x ; ; x / .x ; x / 8.x ; x / 2 X gilt, also x ; für alle Spieler D 1; : : : ; N dominant ist. Die obigen Definitionen entsprechen nicht immer jenen aus der Literatur, wo insbesondere im Teil (a) oft noch zusätzlich verlangt wird, dass die dortige Ungleichung für mindestens ein x strikt erfüllt ist. Gelegentlich unterscheidet man diesbezüglich auch zwischen strikt und schwach dominanten Strategien. Dies wäre dann allerdings nicht mehr konsistent mit dem Teil (c) der Definition, sodass wir unsere Version hier bevorzugen. Ist x ein Gleichgewicht in dominanten Strategien und wählt man speziell x D ; , so gelangt man unmittelbar zu dem folgenden Resultat. x Satz 1.12 Jedes Gleichgewicht in dominanten Strategien ist auch ein Nash-Gleichgewicht. Die Umkehrung des Satzes 1.12 gilt im Allgemeinen nicht. Tatsächlich ist ein Gleichgewicht in dominanten Strategien zwar ein sehr schöner Lösungsbegriff, der aber in der Praxis viel zu stark ist, da ein solches Gleichgewicht nur relativ selten existiert. Beispielsweise besitzt das Gefangenendilemma ein Gleichgewicht in dominanten Strategien, hingegen sind die beiden Nash-Gleichgewichte im Kampf der Geschlechter keine Gleichgewichte in dominanten Strategien. Umgekehrt ist jedoch der Begriff einer dominierten Strategie in einigen Fällen sinnvoll. So wird ein Spieler eine dominierte Strategie beispielsweise als wenig sinnvoll ansehen und diese Möglichkeit daher völlig außer Acht lassen. Dies führt auf die so genannte Elimination dominierter Strategien, mit deren Hilfe man ein strategisches Spiel manchmal sogar lösen kann. Wir illustrieren die Vorgehensweise an dem folgenden Beispiel. Beispiel (Elimination dominierter Strategien) Wir betrachten ein abstraktes Spiel mit zwei Spielern in Maximierungsform. Spieler 1 habe die Strategiemenge X1 WD fO; U g, Spieler 2 die Strategiemenge X2 WD fL; M; Rg. Die Auszahlungsmatrix lautet wie folgt:
Spieler 1
O U
L 1; 0 0; 3
Spieler 2 M R 1; 2 0; 1 0; 1 2; 0
1.4
Andere Lösungskonzepte
15
Beide Spieler mögen rational denken. Dann wird Spieler 2 keinesfalls die Strategie R wählen, denn diese wird von seiner Strategie M dominiert (wegen 2 > 1 und 1 > 0). Spieler 1 bemerkt dies natürlich ebenfalls. Daher reduziert sich das Spiel auf die folgende Auszahlungsmatrix:
Spieler 1
O U
Spieler 2 L M 1; 0 1; 2 0; 3 0; 1
Nun wird die Strategie U von Spieler 1 aber dominiert von der Strategie O (wegen 1 > 0 und 1 > 0). Elimination dieser dominierten Strategie liefert:
Spieler 1
O
Spieler 2 L M 1; 0 1; 2
Jetzt wird die Strategie L von Spieler 2 aber dominiert durch die Strategie M (wegen 2 > 0). Durch sukzessive Elimination dominierter Strategien erhalten wir damit die Lösung .O; M / als einziges Gleichgewicht.
Zu diesem Verfahren sei angemerkt, dass hier der Unterschied zwischen strikt und schwach dominierten Strategien eine Rolle spielt. Während die Elimination einer strikt dominierten Strategie die Menge der Nash-Gleichgewichte nicht verändert, kann man durch die Elimination einer schwach dominierten Strategie Nash-Gleichgewichte verlieren. Wir erwähnen als Nächstes zumindest noch ein weiteres Lösungskonzept, das in der spieltheoretischen Literatur manchmal auftritt und aus der mehrkriteriellen Optimierung (Optimierung mit mehreren Zielfunktionen) stammt, vergleiche [6]. Definition 1.13 Gegeben sei ein Spiel D fX ; gN D1 . Dann heißt x 2 X WD X1 : : : XN ein 6 Pareto-Gleichgewicht , wenn es kein x 2 X gibt mit
.x ; x / .x ; ; x ; / 8 D 1; : : : ; N; sodass für zumindest ein 2 f1; : : : ; N g diese Ungleichung strikt ist. Es liegt also genau dann ein Pareto-Gleichgewicht x vor, wenn dieses durch keine andere Strategie x 2 X dominiert werden kann in dem Sinne, dass sie für alle Spieler zumindest keinen schlechteren Wert der Auszahlungsfunktion als x liefert, und für mindestens einen Spieler sogar eine echte Verbesserung bringt. Einen direkten Zusammenhang zwischen Nash- und Pareto-Gleichgewichten gibt es nicht. Die Schnittmenge dieser beiden Gleichgewichtskonzepte mag leer sein. Im Gefangenendilemma etwa sind die Strategien .S; S/; .S; G/ und .G; S/ allesamt ParetoGleichgewichte, nicht jedoch das einzige Nash-Gleichgewicht .G; G/. 6
Vilfredo Pareto (1848–1923), Ingenieur, Ökonom und Soziologe
16
1
Einführung
Dieses Beispiel deutet allerdings auch an, dass die Anzahl der Pareto-Gleichgewichte im Allgemeinen sehr viel größer als die Anzahl der Nash-Gleichgewichte ist. Tatsächlich ist der Begriff eines Pareto-Gleichgewichtes in der Spieltheorie meist nicht differenziert genug, um als ein brauchbares Lösungskonzept zu gelten. So überlegt man sich zum Beispiel schnell, dass in einem Nullsummenspiel jede Strategiekombination ein ParetoGleichgewicht liefert.
1.5 Aufgaben 1. Aus der Serie „The Big Bang Theory“ kennen Sie vielleicht das Spiel rock-paper-scissors-lizardSpock. Zur Erinnerung, die Regeln lauten wie folgt: scissors cut paper
scissors decapitate lizard
paper covers rock
lizard eats paper
rock crushes lizard
paper disproves Spock
lizard poisons Spock
Spock vaporizes rock
Spock smashes scissors
rock crushes scissors
(a) Bestimmen Sie die Strategiemengen der beiden Spieler und stellen Sie ihre Auszahlungsfunktionen mit Hilfe einer Tabelle dar. Gehen Sie davon aus, dass im Falle eines Sieges der Verlierer dem Gewinner 1 Euro zahlt. (b) Gibt es eine besonders gute Strategie? (c) Wenden Sie die in diesem Kapitel eingeführten Definitionen auf das Spiel an und überlegen Sie sich, welche Eigenschaften es hat. 2. Ein weiteres beliebtes Kinderspiel ist Strich-Punkt oder Tic-Tac-Toe. Überlegen Sie sich, wie Sie dieses Spiel als 2-Personen-Spiel in Normalform darstellen können? Wie könnten die Strategiemengen und die Auszahlungsfunktionen aussehen, wenn der Verlierer 1 Euro an den Gewinner zahlen muss? 3. Betrachten Sie eine Auktion mit N Teilnehmern, bei der ein Objekt versteigert wird, welches für Teilnehmer den Wert v > 0 besitzt. Jedem Teilnehmer steht ein Budget von maximal B > v Geldeinheiten zur Verfügung. Alle Teilnehmer geben zeitgleich und verdeckt ein Gebot ab. Danach wird nach einer der folgenden Regeln bestimmt, wer den Zuschlag erhält. Bestimmen Sie die Strategiemengen und Nutzenfunktionen der Teilnehmer für die folgenden Auktionsmodelle: (a) First Price Sealed Bid: Der Teilnehmer mit dem höchsten Gebot erhält das Objekt zu dem Preis, den er geboten hat. (b) Second Price Sealed Bid: Der Teilnehmer mit dem höchsten Gebot erhält das Objekt zu dem zweithöchsten Preis, der geboten wurde. (c) All Pay Auction: Der Teilnehmer mit dem höchsten Gebot erhält das Objekt, aber alle Teilnehmer zahlen den Preis, den sie geboten haben. (d) Lottery: Das Objekt wird verlost, wobei die Gewinnwahrscheinlichkeit eines Teilnehmers gegeben ist durch sein relatives Gebot. Alle Teilnehmer zahlen den Preis, den sie geboten haben. Bonusfrage: Können Sie absehen, wie die Teilnehmer sich verhalten werden?
1.5
Aufgaben
17
4. In vielen Anwendungen sollten die Auszahlungsfunktionen maximiert statt minimiert werden. In diesen Fällen können wir Nash-Gleichgewichte wie folgt definieren: D .x ; /N Sei D fX ; gN D1 ein strategisches Spiel. Ein Vektor x D1 heißt Nash; Gleichgewicht des Spiels, falls x 2 X und .x ; ; x ; / .x ; x ; / 8x 2 X für alle D 1; : : : ; N gilt. Zeigen Sie, dass, unter Verwendung dieser Definition, D fX ; gN D1 die gleichen NashGleichgewichte besitzt wie das Spiel N D fX ; gN D1 unter Verwendung von Definition 1.5. 5. Betrachten Sie das folgende Bi-Matrix-Spiel, bei dem die Auszahlungen maximiert werden sollen.
Spieler 1
(a) (b) (c) (d)
a1 a2 a3
Spieler 2 b1 b2 b3 4; 4 3; 3 1; 1 3; 3 1; 1 2; 2 1; 1 2; 2 0; 0
Bestimmen Sie alle Nash-Gleichgewichte. Bestimmen Sie alle Gleichgewichte in dominanten Strategien. Wenden Sie die „Elimination dominierter Strategien“ auf dieses Beispiel an. Bestimmen Sie alle Pareto-Gleichgewichte.
6. Betrachten Sie wieder die „Second Price Sealed Bid“-Auktion, bei welcher der Spieler mit dem höchsten Gebot gewinnt, aber nur das zweithöchste Gebot zahlen muss. Nehmen Sie zusätzlich an, dass alle Spieler ein unbeschränktes Budget haben (d. h. B D 1), dass v1 > v2 > : : : > vN gilt und dass im Falle eines Unentschiedens niemand die Auktion gewinnt. (a) Bestimmen Sie alle Nash-Gleichgewichte. (b) Bestimmen Sie alle Gleichgewichte in dominanten Strategien. (c) Bestimmen Sie alle Pareto-Gleichgewichte.
2
Mathematische Grundlagen
In diesem Kapitel wollen wir einige hilfreiche Grundlagen sammeln, insbesondere Charakterisierungen konvexer und monotoner Funktionen, Eigenschaften des Projektionsoperators und Optimalitätsbedingungen aus der restringierten Optimierung.
2.1
Konvexe Funktionen
Wir erinnern zunächst daran, dass eine Menge X Rn als konvex bezeichnet wird, wenn mit je zwei Punkten aus X auch die gesamte Verbindungsstrecke zwischen diesen Punkten in X verläuft. Formal bedeutet dies, dass X genau dann konvex ist, wenn für alle x; y 2 X und alle 2 .0; 1/ auch x C .1 /y 2 X gilt. Abb. 2.1 gibt ein paar Beispiele für konvexe und nicht-konvexe Mengen. Wie man durch Induktion zeigen kann, enthält eine konvexe Menge X Rn nicht nur alle Konvexkombinationen von zwei Elementen x; y 2 X, sondern auch alle endlichen Konvexkombinationen von Elementen x1 ; : : : ; xm 2 X, d. h. m X
i xi 2 X
81 ; : : : ; m 0 mit
i D1
m X
i D 1:
i D1
Konvexe Mengen treten insbesondere als Definitionsbereiche von (strikt, gleichmäßig) konvexen Funktionen auf, die wir im Folgenden einführen. Dabei bezeichnet k k stets die euklidische Norm.
© Springer Nature Switzerland AG 2018 C. Kanzow, A. Schwartz, Spieltheorie, Mathematik Kompakt, https://doi.org/10.1007/978-3-319-96679-3_2
19
20
2
konvex
konvex
Mathematische Grundlagen
nicht-konvex
nicht-konvex
Abb. 2.1 Beispiele für konvexe und nicht-konvexe Mengen
Definition 2.1
Sei X Rn eine konvexe Menge. Eine Funktion f W X ! R heißt (a) konvex (auf X), wenn für alle x; y 2 X und alle 2 .0; 1/ gilt f x C .1 /y f .x/ C .1 /f .y/I (b) strikt konvex (auf X), wenn für alle x; y 2 X mit x ¤ y und alle 2 .0; 1/ gilt f x C .1 /y < f .x/ C .1 /f .y/I (c) gleichmäßig konvex (auf X), wenn es ein > 0 gibt mit f x C .1 /y f .x/ C .1 /f .y/ .1 /kx yk2 für alle x; y 2 X und alle 2 .0; 1/. Aus Definition 2.1 ergibt sich unmittelbar, dass jede gleichmäßig konvexe Funktion strikt konvex ist. Ebenso ist jede strikt konvexe Funktion auch konvex. Hingegen sind die Umkehrungen im Allgemeinen nicht richtig. Auch wenn in der Definition von Konvexität nur jeweils zwei Punkte x; y betrachtet werden, so besagt die Jensensche Ungleichung, dass eine Funktion f W X ! R genau dann konvex ist, wenn für jede endliche Konvexkombination von Punkten x1 ; : : : ; xm 2 X P mit Skalaren 1 ; : : : ; m 0, m i D1 i D 1 gilt f
m X i D1
m X i xi i f .xi /: i D1
Anschaulich ist eine Funktion f genau dann (strikt) konvex, wenn ihr Graph (strikt) unterhalb der geraden Verbindungsstrecke von je zwei Punkten auf dem Graphen verläuft. Abb. 2.2 illustriert die verschiedenen Konvexitätskonzepte.
2.1 Konvexe Funktionen
21 f
Abb. 2.2 Illustration der verschiedenen Konvexitätsbegriffe
λf (x) + (1 − λ)f (y)
x 0
f λf (x) + (1 − λ)f (y) −λ(1 − λ)μx − y22
y
konvex und strikt konvex
x 0
y
gleichmäßig konvex
Beispiel Sei f W R ! R: Dann gelten:
(a) Die Gerade f .x/ WD x ist konvex, aber nicht strikt konvex. (b) Die Abbildung f .x/ WD exp.x/ ist strikt, aber nicht gleichmäßig konvex. (c) Die Parabel f .x/ WD x 2 ist gleichmäßig konvex. Die hiermit eng verwandte Funktion f .x/ WD x 4 hingegen ist strikt, aber nicht gleichmäßig konvex.
Für quadratische Funktionen gilt die folgende Bemerkung. I Bemerkung 2.2 Sei f W Rn ! R eine quadratische Funktion, d. h.
f .x/ WD
1 T x Qx C c T x C 2
mit einer symmetrischen Matrix Q 2 Rnn ; c 2 Rn und 2 R. Dann lassen sich die folgenden Aussagen leicht verifizieren: (a) f ist konvex ” Q ist positiv semidefinit. (b) f ist strikt konvex ” f ist gleichmäßig konvex ” Q ist positiv definit. Im Gegensatz zu quadratischen Funktionen gilt die Äquivalenz f ist strikt konvex
”
f ist gleichmäßig konvex
bei beliebigen nichtlinearen Funktionen im Allgemeinen nicht mehr, vergleiche hierzu die Abbildung f .x/ WD x 4 aus dem vorigen Beispiel. Der folgende Satz enthält eine Charakterisierung der Klasse der stetig differenzierbaren (strikt, gleichmäßig) konvexen Funktionen.
22
2
Mathematische Grundlagen
Satz 2.3 Seien X Rn eine offene und konvexe Menge sowie f W X ! R stetig differenzierbar. Dann gelten: (a) f ist genau dann konvex (auf X), wenn für alle x; y 2 X gilt f .x/ f .y/ rf .y/T .x y/:
(2.1)
(b) f ist genau dann strikt konvex (auf X), wenn für alle x; y 2 X gilt f .x/ f .y/ > rf .y/T .x y/
falls
x ¤ y:
(2.2)
(c) f ist genau dann gleichmäßig konvex (auf X), wenn es ein > 0 gibt mit f .x/ f .y/ rf .y/T .x y/ C kx yk2
(2.3)
für alle x; y 2 X. Beweis Es gelte zunächst (2.3). Seien x; y 2 X und 2 .0; 1/ beliebig. Setze z WD x C .1 /y 2 X. Wegen (2.3) gelten dann f .x/ f .z/ rf .z/T .x z/ C kx zk2 ; f .y/ f .z/ rf .z/T .y z/ C ky zk2 : Multipliziert man diese Ungleichungen mit 0 bzw. 1 0 und addiert sie, so erhält man unter Verwendung der Definition von z die Ungleichung f .x/ C .1 /f .y/ f x C .1 /y .1 /kx yk2 ; d. h. f ist gleichmäßig konvex. Analog zeigt man, dass aus (2.1) bzw. (2.2) die Konvexität bzw. strikte Konvexität von f folgt. Sei f nun als gleichmäßig konvex vorausgesetzt. Für alle x; y 2 X und alle 2 .0; 1/ gilt dann mit einem > 0 f y C .x y/ D f x C .1 /y f .x/ C .1 /f .y/ .1 /kx yk2 und daher f y C .x y/ f .y/ f .x/ f .y/ .1 /kx yk2 :
2.1 Konvexe Funktionen
23
Aus der (stetigen) Differenzierbarkeit von f folgt somit für ! 0C f y C .x y/ f .y/ rf .y/ .x y/ D lim f .x/ f .y/ kx yk2 ; !0C (2.4) T
d. h. es gilt (2.3). Ist f nur konvex, so ergibt sich mittels des soeben geführten Beweises mit D 0 ebenso die Gültigkeit von (2.1). Sei nun f strikt konvex und x; y 2 X mit x ¤ y gegeben. Der Beweis, dass dann auch (2.2) gilt, muss etwas anders geführt werden als die entsprechenden Beweise im (gleichmäßig) konvexen Fall, da beim Grenzübergang in (2.4) sonst das „ 0 pseudokonvex
quasikonvex
Abb. 2.4 Illustration von verallgemeinerter Konvexität
Definition 2.6
Sei X Rn eine konvexe Menge. Eine Funktion f W X ! R heißt quasikonvex (auf X), wenn für alle x; y 2 X und alle 2 .0; 1/ gilt f x C .1 /y maxff .x/; f .y/g: Aus den entsprechenden Definitionen ergibt sich unmittelbar, dass jede konvexe Funktion insbesondere quasikonvex ist. Abb. 2.4b dient der Verdeutlichung der Definition von Quasikonvexität. Das nächste Resultat enthält eine einfache Charakterisierung von quasikonvexen Funktionen, die oft leichter zu merken ist. Satz 2.7 Sei X Rn konvex und f W X ! R gegeben. Dann ist f genau dann quasikonvex (auf X), wenn die Levelmengen L˛ WD fx 2 X j f .x/ ˛g für alle ˛ 2 R konvex sind. Beweis Sei zunächst L˛ konvex für alle ˛ 2 R. Seien ferner x; y 2 X mit o. B. d. A. f .y/ f .x/ gegeben sowie 2 .0; 1/ beliebig. Setze ˛ WD f .x/. Nach Voraussetzung ist L˛ konvex, also ist x C .1 /y 2 L˛ , mithin f x C .1 / ˛ D f .x/, folglich f quasikonvex. Seien umgekehrt f quasikonvex auf X und ˛ 2 R beliebig gegeben. Ist L˛ D ;, so ist nichts zu zeigen. Sei daher L˛ ¤ ; und wähle x; y 2 L˛ sowie 2 .0; 1/ beliebig. Ohne Einschränkung gelte f .y/ f .x/. Wegen x; y 2 L˛ ist f .y/ f .x/ ˛. Da f quasikonvex und X konvex sind, gilt f x C .1 /y f .x/ ˛: Folglich ist x C .1 /y 2 L˛ und L˛ daher konvex.
26
2
Mathematische Grundlagen
Satz 2.7 hat eine wichtige Anwendung im Zusammenhang mit Optimierungsproblemen der Gestalt (2.7) min f .x/ u. d. N. x 2 X: x
Sei ˛ WD infx2X f .x/. Dann ist die Lösungsmenge von (2.7) gerade gegeben durch die (eventuell leere) Levelmenge L˛ WD fx 2 X j f .x/ ˛ g. Aus Satz 2.7 erhalten wir daher unmittelbar das folgende Resultat. Korollar 2.8 Seien X Rn konvex und f W X ! R quasikonvex. Dann ist die Lösungsmenge des Optimierungsproblems (2.7) konvex (eventuell leer). Eine weitere Konsequenz aus der Definition einer quasikonvexen Funktion ist das nachstehende Hilfsresultat, welches im Beweis des Satzes 2.19 benötigt wird. Korollar 2.9 Sei X Rn eine offene und konvexe Menge sowie f W X ! R stetig differenzierbar und quasikonvex. Dann gilt für alle x; y 2 X f .y/ f .x/
H)
rf .x/T .y x/ 0:
Beweis Seien x; y 2 X mit o. B. d. A. f .y/ f .x/ gegeben. Da f quasikonvex ist, gilt somit auch f x C .1 /y f .x/ für alle 2 .0; 1/. Aus der (stetigen) Differenzierbarkeit von f ergibt sich daher f x C t.y x/ f .x/ T rf .x/ .y x/ D lim t !0C t f x C .1 /.y x/ f .x/ D lim !1 1 f x C .1 /y f .x/ 0; D lim !1 1 also die Behauptung.
Wir zeigen nun, dass jede auf einer konvexen Menge stetig differenzierbare pseudokonvexe Funktion auch quasikonvex ist. Satz 2.10 Sei X Rn eine offene und konvexe Menge sowie f W X ! R eine stetig differenzierbare pseudokonvexe Funktion. Dann ist f quasikonvex.
2.1 Konvexe Funktionen
27 f gleichmäßig konvex
Abb. 2.5 Zusammenhang zwischen Konvexitätsbegriffen für f W X ! R mit X Rn offen und konvex
f strikt konvex
f ∈ C 1 (X) f pseudokonvex
f konvex f ∈ C 1 (X)
f quasikonvex
Beweis Sei f pseudokonvex. Angenommen, es existieren x; y 2 X mit f .y/ f .x/
und
N C .1 /y N f x > f .x/
(2.8)
für ein N 2 .0; 1/. Definiere W Œ0; 1 ! R gemäß ./ WD f x C .1 /y D f y C .x y/ und betrachte das eindimensionale Maximierungsproblem max ./
u. d. N. 2 Œ0; 1 :
(2.9)
Da die Funktion auf dem kompakten Intervall Œ0; 1 stetig ist, existiert ein Punkt 2 Œ0; 1 , in dem in (2.9) das Maximum angenommen wird. Wegen (2.8) ist sogar aus dem offenen Intervall .0; 1/. Aus der notwendigen Optimalitätsbedingung erster Ordnung folgt daher 0 D 0 . / D rf .z /T .x y/; wobei zur Abkürzung z WD x C .1 /y 2 X gesetzt wurde. Also gilt rf .z /T .x z / D .1 /rf .z /T .x y/ D 0 0: Da f nach Voraussetzung pseudokonvex ist, ergibt sich hieraus f .x/ f .z /. Anderer N C .1 /y N > f .x/ wegen (2.8) und per Definition von z , ein seits ist f .z / f x Widerspruch. Zusammenfassend liefern die obigen Resultate das Schema in Abb. 2.5. Wir geben abschließend noch die Definition einer (strikt, gleichmäßig) konkaven Funktion an. Für diese Klassen von Funktionen lassen sich sehr einfach ähnliche Resultate wie für die Klassen der (strikt, gleichmäßig) konvexen Funktionen beweisen. Wir verzichten hier auf die genauere Ausführung.
28
2
Mathematische Grundlagen
Definition 2.11
Sei X Rn eine konvexe Menge. Dann heißt eine Funktion f W X ! R (strikt, gleichmäßig) konkav (auf X), falls die Funktion f (strikt, gleichmäßig) konvex (auf X) ist. Entsprechend heißt f quasikonkav (pseudokonkav), wenn f quasikonvex (pseudokonvex) ist.
2.2 Monotone Funktionen In dem vorherigen Abschnitt haben wir Tangenten-basierte Charakterisierungen von konvexen Funktionen kennengelernt. Tatsächlich lassen sich hinreichend glatte konvexe Funktionen rein über Eigenschaften der ersten oder zweiten Ableitung charakterisieren. Um dies zu zeigen, führen wir zunächst den Begriff einer monotonen Funktion ein. Definition 2.12
Sei X Rn gegeben. Eine Funktion F W X ! Rn heißt (a) monoton (auf X), wenn für alle x; y 2 X gilt .x y/T F .x/ F .y/ 0I (b) strikt monoton (auf X), wenn für alle x; y 2 X mit x ¤ y gilt .x y/T F .x/ F .y/ > 0I (c) gleichmäßig monoton (auf X), wenn es ein > 0 gibt mit .x y/T F .x/ F .y/ kx yk2 für alle x; y 2 X. Man beachte, dass Monotonie nur für Abbildungen F W X Rn ! Rn definiert ist. Im Fall n D 1 entspricht dies einer monoton wachsenden Funktion, siehe auch Abb. 2.6. Wir werden dieses Konzept später auf den Gradienten rf W X Rn ! Rn einer konvexen Funktion anwenden. Die Konstante > 0 im Teil (c) der Definition 2.12 wird häufig auch als Modulus der gleichmäßigen Monotonie bezeichnet. Offenbar ist jede gleichmäßig monotone Funktion auch strikt monoton, und jede strikt monotone Funktion ist bereits monoton. Die Umkehrungen gelten im Allgemeinen jedoch nicht.
2.2 Monotone Funktionen
29 F
F F (y) +μ(x − y)
F (y)
0
y
x
y
0
monoton und strikt monoton
x
gleichmäßig monoton
Abb. 2.6 Illustration von monotonen Funktionen F W R ! R
Beispiel Sei F W R ! R. Dann gelten:
(a) Die Funktion F .x/ WD c für c 2 R ist monoton, aber nicht strikt monoton. (b) Die Funktion F .x/ WD e x ist strikt monoton, aber nicht gleichmäßig monoton. (c) Die Abbildung F .x/ WD x ist gleichmäßig monoton.
In Analogie zu der Bemerkung 2.2 gilt hier das folgende Resultat für affin-lineare Funktionen. I Bemerkung 2.13 Sei F W Rn ! Rn eine affin-lineare Funktion, d. h.
F .x/ WD M x C q mit M 2 Rnn und q 2 Rn . Dann gelten die folgenden Aussagen: (a) F ist monoton ” M ist positiv semidefinit. (b) F ist strikt monoton ” F ist gleichmäßig monoton ” M ist positiv definit. Hierbei nennen wir eine Matrix M 2 Rnn positiv semidefinit, wenn gilt d T Md 0
8d 2 Rn :
Wir setzen nicht voraus, dass M symmetrisch ist. Man beachte, dass die Äquivalenz zwischen den strikt und gleichmäßig monotonen Funktionen bei nichtlinearen Funktionen im Allgemeinen nicht mehr gilt. Beispielsweise ist die Abbildung F .x/ WD x 3 strikt monoton, aber nicht gleichmäßig monoton, vergleiche hierzu den Satz 2.15. Mittels des Satzes 2.3 sind wir nun in der Lage, den folgenden Zusammenhang zwischen konvexen und monotonen Funktionen zu beweisen.
30
2
Mathematische Grundlagen
Satz 2.14 Sei X Rn eine offene und konvexe Menge sowie f W X ! R stetig differenzierbar. Dann gelten: (a) f ist genau dann konvex, wenn rf monoton ist. (b) f ist genau dann strikt konvex, wenn rf strikt monoton ist. (c) f ist genau dann gleichmäßig konvex, wenn rf gleichmäßig monoton ist. Beweis Wir beginnen mit dem Beweis von Teil (c), sei also f zunächst als gleichmäßig konvex vorausgesetzt. Wegen des Satzes 2.3 existiert dann ein > 0, sodass für alle x; y 2 X gilt f .x/ f .y/ rf .y/T .x y/ C kx yk2 ; f .y/ f .x/ rf .x/T .y x/ C kx yk2 : Addiert man diese beiden Ungleichungen, so erhält man .x y/T rf .x/ rf .y/ 2kx yk2 ;
(2.10)
d. h. rf ist gleichmäßig monoton mit Modulus 2. Sei nun umgekehrt rf gleichmäßig monoton. Wir beschreiben zunächst die Beweisidee: Nach dem Mittelwertsatz gibt es ein # 2 .0; 1/ mit f .x/ f .y/ D rf .y C #.x y//T .x y/: Die gleichmäßige Monotonie von rf impliziert #.x y/T .rf .y C #.x y// rf .y// D .y C #.x y/ y/T .rf .y C #.x y// rf .y// # 2 kx yk2 mit einem Modulus > 0. Kombinieren wir beide Gleichungen, so folgt f .x/ f .y/ D rf .y C #.x y//T .x y/ rf .y/T .x y/ C #kx yk2 : Das ist schon fast das, was wir zeigen wollen, vergleiche Satz 2.3. Allerdings kann hierbei # 2 .0; 1/ beliebig klein werden. Um dieses Problem zu lösen, verwenden wir folgenden Trick: Da rf gleichmäßig monoton ist, gilt (2.10) für alle x; y 2 X. Sei ferner m 0 eine k für k D 0; 1; : : : ; m; mC1. zunächst feste, aber beliebige natürliche Zahl. Setze tk WD mC1 Aufgrund des Mittelwertsatzes existieren dann Zahlen #k 2 .tk ; tkC1 / mit f y C tkC1 .x y/ f y C tk .x y/ D .tkC1 tk /rf .z k /T .x y/;
2.2 Monotone Funktionen
31
wobei z k WD y C #k .x y/ gesetzt wurde. Hieraus folgt f .x/ f .y/ D
m X f y C tkC1 .x y/ f y C tk .x y/ kD0
D
m X
.tkC1 tk /rf .z k /T .x y/
kD0
D rf .y/T .x y/ C D rf .y/T .x y/ C
m X kD0 m X kD0
rf .y/ .x y/ C 2 T
T .tkC1 tk / rf .z k / rf .y/ .x y/ T .tkC1 tk / rf .z k / rf .y/ .z k y/ #k
m X .tkC1 tk / kD0
#k
D rf .y/T .x y/ C 2kx yk2
m X
kz k yk2
#k .tkC1 tk /:
kD0
Wegen m X
#k .tkC1 tk /
kD0
m X kD0
tk .tkC1 tk / D
m X 1 1 m kD 2 .m C 1/ 2mC1 kD0
folgt somit f .x/ f .y/ rf .y/T .x y/ C
m kx yk2 : mC1
Für m ! 1 ergibt sich f .x/ f .y/ rf .y/T .x y/ C kx yk2 : Also ist f gleichmäßig konvex mit Modulus aufgrund des Satzes 2.3. Teil (a) zeigt man analog zu Teil (c) mit D 0. Um Teil (b) zu zeigen, geht man ebenfalls analog zu Teil (c) mit D 0 vor und fügt an geeigneten Stellen strikte Ungleichungen ein. Als Nächstes gehen wir auf die Eigenschaften der Jacobi-Matrizen von monotonen Funktionen ein, die in gewissem Sinne Bemerkung 2.13 auf nichtlineare Abbildungen verallgemeinern.
32
2
Mathematische Grundlagen
Satz 2.15 Sei X Rn eine offene und konvexe Menge sowie F W X ! Rn stetig differenzierbar. Dann gelten: (a) F ist genau dann monoton (auf X), wenn F 0 .x/ für alle x 2 X positiv semidefinit ist. (b) Ist F 0 .x/ für alle x 2 X positiv definit, so ist F strikt monoton (auf X). (c) F ist genau dann gleichmäßig monoton (auf X), wenn F 0 .x/ gleichmäßig positiv definit auf X ist, d. h., wenn es ein > 0 gibt mit d T F 0 .x/d kd k2
(2.11)
für alle x 2 X und für alle d 2 Rn . Beweis Wir beweisen zunächst Teil (c). Sei F gleichmäßig monoton. Aus der stetigen Differenzierbarkeit von F folgt td T F .x C td / F .x/ F .x C td / F .x/ D lim d F .x/d D d lim t !0 t !0 t t2 1 lim 2 ktd k2 D kd k2 t !0 t 0
T
T
für alle x 2 X und alle d 2 Rn , d. h. F 0 .x/ ist gleichmäßig positiv definit. Sei umgekehrt (2.11) vorausgesetzt. Aus dem Mittelwertsatz in Integralform ergibt sich dann .x y/ F .x/ F .y/ D
Z1
T
.x y/T F 0 y C t.x y/ .x y/dt kx yk2 ;
0
(2.12) d. h. F ist gleichmäßig monoton auf X: Der Beweis von Teil (a) kann analog erfolgen, indem man einfach D 0 setzt. Zum Nachweis von Teil(b): Sei F 0 .z/ positiv definit für alle z 2 X. Dann ist .t/ WD .x y/T F 0 y C t.x y/ .x y/ > 0 für alle t 2 Œ0; 1 und alle x; y 2 X mit x ¤ y. Folglich ist .x y/ F .x/ F .y/ D
Z1
T
.t/dt > 0 0
für alle x; y 2 X mit x ¤ y; vergleiche (2.12). Also ist F strikt monoton.
2.2 Monotone Funktionen
33
f glm. konvex
∇f glm. monoton
∇2 f glm. positiv definit
f strikt konvex
∇f strikt monoton
∇2 f positiv definit
f konvex
∇f monoton
∇2 f positiv semidefinit
Abb. 2.7 Beziehungen für eine zweimal stetig differenzierbare Funktion f W X ! R mit X Rn offen und konvex
Man beachte, dass die Umkehrung der Aussage (b) des Satzes 2.15 im Allgemeinen nicht gilt. So ist die Funktion F .x/ WD x 3 strikt monoton, aber F 0 .x/ D 3x 2 ist nur positiv semidefinit in x D 0. Als unmittelbare Folgerung aus den Sätzen 2.14 und 2.15 erhält man das nachstehende Resultat. Korollar 2.16 Sei X Rn eine offene und konvexe Menge sowie f W X ! R zweimal stetig differenzierbar. Dann gelten: (a) f ist genau dann konvex (auf X), wenn r 2 f .x/ für alle x 2 X positiv semidefinit ist. (b) Ist r 2 f .x/ für alle x 2 X positiv definit, so ist f strikt konvex (auf X). (c) f ist genau dann gleichmäßig konvex (auf X), wenn r 2 f .x/ gleichmäßig positiv definit auf X ist. Auch hier ist nur für konvexe und gleichmäßig konvexe Funktionen eine Charakterisierung möglich ist. Für strikt konvexe Funktionen gilt nur eine Implikation, siehe auch Abb. 2.7. Wir führen nun noch eine Verallgemeinerung der Klasse der monotonen Funktionen ein. Definition 2.17
Sei X Rn eine gegebene Teilmenge. Eine Funktion F W X ! Rn heißt pseudomonoton (auf X), falls für alle x; y 2 X die Implikation .x y/T F .y/ 0 H) .x y/T F .x/ 0 gilt. Es folgt unmittelbar aus den entsprechenden Definitionen, dass jede monotone Funktion auch pseudomonoton ist. Hingegen ist die Funktion F .x/ WD e x zwar pseudomonoton
34
2
Mathematische Grundlagen
auf X D R, nicht jedoch monoton. Ebenso ist die von Billups [4] als Testbeispiel für Komplementaritätsprobleme vorgeschlagene Funktion F .x/ WD .x 1/2 1;01 zwar pseudomonoton auf X D RC , aber weder pseudomonoton auf X D R noch monoton auf X D RC . Wir beweisen zunächst ein sehr einfaches Resultat über pseudomonotone Funktionen. Lemma 2.18 Sei X Rn und F W X ! Rn pseudomonoton. Dann gilt für alle x; y 2 X die Implikation .x y/T F .y/ > 0 H) .x y/T F .x/ > 0: Beweis Sei F pseudomonoton. Angenommen, es gibt x; y 2 X mit .x y/T F .y/ > 0
und
.x y/T F .x/ D 0:
(2.13)
Dann gilt auch .y x/T F .x/ D 0. Aus der Definition einer pseudomonotonen Funktion folgt daher .y x/T F .y/ 0; also .x y/T F .y/ 0 im Widerspruch zu (2.13). Wir sind nun in der Lage, das folgende Analogon zu Satz 2.14 zu beweisen. Satz 2.19 Sei X Rn offen und konvex sowie f W X ! R stetig differenzierbar. Dann ist f genau dann pseudokonvex, wenn rf pseudomonoton ist. Beweis Sei f zunächst pseudokonvex. Seien x; y 2 X gegeben mit rf .y/T .x y/ 0:
(2.14)
Aus (2.14) und der Pseudokonvexität von f folgt f .x/ f .y/:
(2.15)
Wegen Satz 2.10 ist die pseudokonvexe Funktion f insbesondere quasikonvex. Aus (2.15) und Korollar 2.9 folgt daher rf .x/T .y x/ 0: Also ist rf .x/T .x y/ 0 und rf somit pseudomonoton. Sei jetzt rf als pseudomonoton vorausgesetzt. Seien x; y 2 X gegeben mit rf .y/T .x y/ 0:
(2.16)
2.3 Grundlagen aus der nichtlinearen Optimierung
35
Angenommen, es ist f .x/ < f .y/:
(2.17)
Aufgrund des Mittelwertsatzes existiert ein # 2 .0; 1/ mit f .x/ f .y/ D rf .z/T .x y/
(2.18)
z WD y C #.x y/:
(2.19)
und
Aus (2.17)–(2.19) ergibt sich rf .z/T .y z/ D #rf .z/T .y x/ D # f .y/ f .x/ > 0: Da rf nach Voraussetzung pseudomonoton ist, folgt aus dem Lemma 2.18 daher rf .y/T .y z/ > 0: Unter Verwendung von (2.19) folgt somit rf .y/T .x y/ < 0I
dies widerspricht jedoch (2.16). Folglich ist f pseudokonvex.
2.3
Grundlagen aus der nichtlinearen Optimierung
Im Gegensatz zum Großteil dieses Buchs betrachten wir in diesem Abschnitt ein einzelnes Optimierungsproblem min f .x/ x
u. d. N. x 2 X
(2.20)
mit einer konvexen zulässigen Menge X Rn und einer Zielfunktion f W X ! R, die auf einer offenen Obermenge von X stetig differenzierbar sei. Dann lassen sich Lösungen von (2.20) wie folgt charakterisieren. Lemma 2.20 (Minimumprinzip) Sei f W Rn ! R stetig differenzierbar und X Rn nichtleer, abgeschlossen und konvex. Dann gelten: (a) Ist x 2 X ein lokales Minimum von (2.20), so gilt rf .x /T .x x / 0 8x 2 X:
(2.21)
(b) Ist f pseudokonvex und gilt (2.21), so ist x ein globales Minimum von (2.20).
36
2
Mathematische Grundlagen
Beweis (a) Sei x 2 X ein lokales Minimum von (2.20). Angenommen, es existiert ein x 2 X mit rf .x /T .x x / < 0. Da rf .x /T .x x / gerade die Richtungsableitung von f im Punkte x in Richtung x x ist, fällt f also in Richtung x x . Also gilt f x C .x x / < f .x / für alle > 0 hinreichend klein. Da X konvex ist, gilt auch x C.x x / D x C .1 /x 2 X. Dies steht aber im Widerspruch zur vorausgesetzten lokalen Minimalität von x . Also ist rf .x /T .x x / 0 für alle x 2 X; d. h., x genügt (2.21). (b) Sei f pseudokonvex und x 2 X genüge (2.21). Dann gilt rf .x /T .x x / 0 für alle x 2 X. Aus der Definition einer pseudokonvexen Funktion folgt dann f .x/ f .x / für alle x 2 X; d. h., x ist ein globales Minimum von (2.20). In einem lokalen Minimum x von (2.20) muss also die Richtungsableitung f 0 .x I d / D rf .x /T d für alle „zulässigen“ Richtungen d nichtnegativ sein. Falls die zulässige Menge X nicht konvex ist, kann man ähnliche Resultate erzielen, indem man die Menge der „zulässigen“ Richtungen X x WD fd 2 Rn j 9x 2 X W d D x x g durch den (Bouligand1 ) Tangentialkegel TX .x / D fd 2 Rn j 9.x k /k X; .tk /k RC W x k ! x ; tk .x k x / ! d g ersetzt, vergleiche zum Beispiel [25, 42] für Details. Üblicherweise ist die Menge X gegeben durch Restriktionen, zum Beispiel X D fx 2 Rn j g.x/ 0; h.x/ D 0g mit stetig differenzierbaren Funktionen gW Rn ! Rm und hW Rn ! Rp . Dann ist die notwendige Optimalitätsbedingung aus dem Minimumprinzip schlecht zu überprüfen. Arbeitet man hingegen mit dem Linearisierungskegel LX .x / WD fd 2 Rn j rgi .x /T d 0 .i 2 Ig .x //; rh.x /T d D 0g; wobei Ig .x / WD fi j gi .x / D 0g die Menge aller aktiven Ungleichungen bezeichnet, so kann man zeigen, dass die Bedingung rf .x /T d 0
8d 2 LX .x /
äquivalent ist zu den nachfolgend definierten KKT-Bedingungen2. 1
Georges Bouligand (1889–1979), Mathematiker William Karush (1927–1997), Mathematiker (Optimierung); Harold Kuhn (1925–2014), Mathematiker (Optimierung, Spieltheorie, Operations Research); Albert Tucker (1905–1995), Mathematiker (Optimierung, Spieltheorie)
2
2.3 Grundlagen aus der nichtlinearen Optimierung
37
Definition 2.21
Ein Tripel .x ; ; / 2 Rn Rm Rp genügt den KKT-Bedingungen für (2.20), wenn es das folgende System löst: rf .x/ C rg.x/ C rh.x/ D 0; g.x/ 0;
0;
g.x/T D 0; h.x/ D 0:
Die Vektoren und heißen Lagrange-Multiplikatoren3 , der Punkt x wird auch als KKT-Punkt bezeichnet. Gilt also TX .x / D LX .x / in einem lokalen Minimum x von (2.20), so gibt es Multiplikatoren ; , sodass .x ; ; / den KKT-Bedingungen genügt. Unter diesen Voraussetzungen stellen die KKT-Bedingungen also notwendige Optimalitätsbedingungen dar. Unglücklicherweise gilt ohne weitere Annahmen nur die Inklusion TX .x / LX .x /; d. h. die KKT-Bedingungen sind a priori keine notwendigen Optimalitätsbedingungen. Jedoch gibt es eine Reihe von Regularitätsbedingungen, sogenannte Constraint Qualifications (kurz CQ), die garantieren, dass beide Kegel übereinstimmen und damit ein lokales Minimum auch ein KKT-Punkt ist. Nachfolgend listen wir einige dieser Bedingungen auf, die später auftreten werden. Definition 2.22
Sei x 2 X beliebig. Dann gilt in x die (a) Linear Independence CQ (LICQ), wenn die Gradienten rgi .x / .i 2 Ig .x //;
rhi .x / .i D 1; : : : ; p/
linear unabhängig sind; (b) Mangasarian-Fromovitz CQ (MFCQ)4 , wenn die Vektoren rhi .x / .i D 1; : : : ; p/ linear unabhängig sind und es einen Vektor d 2 Rn n f0g gibt mit rgi .x /T d < 0 .i 2 Ig .x //;
rhi .x /T d D 0 .i D 1; : : : ; p/I
(c) Linearitäts-CQ, wenn die Restriktionen g und h affin-linear sind; (d) Slater-CQ5 , wenn g komponentenweise konvex und h affin-linear ist und es einen Punkt xO 2 X gibt mit g.x/ O < 0; h.x/ O D 0: 3
Joseph-Louis Lagrange (1736–1813), Mathematiker und Astronom Olvi Mangasarian (geb. 1934), Mathematiker und Informatiker (Optimierung, Data Mining); Stanley Fromovitz (1936–2017), Mathematiker 5 Morton Slater (1921–2002), Mathematiker 4
38
2
Mathematische Grundlagen
Unter jeder dieser CQs gilt TX .x / D LX .x / und die KKT-Bedingungen stellen somit notwendige Optimalitätsbedingungen dar. Für konvexe Optimierungsprobleme, also im Fall, dass f; gi konvex und h affin-linear sind, gilt auch die Umkehrung, d. h. jeder KKTPunkt x ist automatisch ein globales Minimum. Alle zuvor eingeführten CQs sind nur für zulässige Punkte x 2 X definiert. Zum Abschluss dieses Abschnitts wollen wir zumindest für ungleichungsrestringierte Probleme, also den Fall X D fx 2 Rn j g.x/ 0g; noch eine Erweiterung von MFCQ auf möglicherweise unzulässige Punkte x 2 Rn angeben. Definition 2.23
Sei x 2 Rn beliebig. Dann gilt in x die extended Mangasarian-Fromovitz CQ (EMFCQ), wenn es einen Vektor d 2 Rn n f0g gibt mit rgi .x /T d < 0 für alle i mit gi .x / 0: Da wir in der Definition von EMFCQ auch Punkte x … X zulassen, müssen wir neben den inaktiven Ungleichungen gi .x / < 0 und den aktiven Ungleichungen gi .x / D 0 möglicherweise auch verletzte Nebenbedingungen gi .x / > 0 berücksichtigen. Im Fall x 2 X stimmt EMFCQ hingegen offensichtlich mit der klassischen MFCQ-Bedingung überein.
2.4 Projektionen In diesem Abschnitt wollen wir die Projektion eines Punktes y 2 Rn auf eine konvexe Menge X Rn untersuchen. Für die hierbei auftretende Vektornorm verwenden wir die durch eine symmetrische und positiv definite Matrix G 2 Rnn induzierte Norm p kxkG WD x T Gx: Im Fall G D I stimmt diese Norm mit der euklidischen Norm überein, die weiterhin mit k k bezeichnet wird. Lemma 2.24 Sei X Rn nichtleer, abgeschlossen und konvex sowie G 2 Rnn symmetrisch und positiv definit. Dann existiert zu jedem y 2 Rn ein eindeutig bestimmter Vektor z 2 X mit ky zkG ky xkG
für alle x 2 X:
Dieser Vektor z heißt Projektion von y auf X bzgl. der Norm k kG und wird mit PX;G .y/ bezeichnet. Im Fall G D I schreiben wir auch PX .y/.
2.4 Projektionen
39
Abb. 2.8 Illustration des Beweises von Lemma 2.24
w y
z
X
Beweis Sei y 2 Rn . Es ist zu zeigen, dass die Funktion f .x/ WD ky xkG (oder ihr Quadrat) ein eindeutig bestimmtes Minimum auf der Menge X besitzt. Ist nun w 2 X ein beliebiger Vektor, so ist z 2 X offenbar genau dann eine Lösung von min f .x/ x
u. d. N.
x 2 X;
wenn z 2 X das Problem min f .x/ x
u. d. N.
˚
x 2 X \ x 2 Rn j ky xkG ky wkG
löst, vergleiche Abb. 2.8. Der zulässige Bereich dieses Problems ist nichtleer und kompakt. Da f stetig ist und eine stetige Funktion auf einer nichtleeren und kompakten Menge ihr Minimum annimmt, existiert ein z 2 X mit ky zkG ky xkG
für alle x 2 X:
Die Eindeutigkeit folgt unmittelbar aus der strikten Konvexität der Abbildung x ! ky xk2G D .x y/T G.x y/. Die gerade eingeführte Projektion eines Vektors lässt sich mittels des folgenden Resultates geometrisch charakterisieren. Man betrachte hierzu insbesondere den Fall der euklidischen Norm zur Veranschaulichung. Satz 2.25 (Projektionssatz) Sei X Rn nichtleer, abgeschlossen und konvex, G 2 Rnn symmetrisch und positiv definit sowie y 2 Rn . Genau dann ist der Vektor z 2 X gleich der Projektion von y auf X bzgl. der Norm k kG , wenn gilt .z y/T G.x z/ 0 für alle x 2 X: Beweis Die Funktion f .x/ WD 12 ky xk2G ist konvex, insbesondere also pseudokonvex. Aus dem Minimumprinzip (Lemma 2.20) ergibt sich daher: z D PX;G .y/
”
z ist das globale Minimum von f auf X
”
rf .z/T .x z/ 0 für alle x 2 X
”
.z y/T G.x z/ 0 für alle x 2 X
wegen rf .z/ D G.y z/.
40
2
Mathematische Grundlagen
Abb. 2.9 Illustration von Satz 2.25 für G D I
X
≥ 90◦
y
x PX (y)
Anders formuliert besagt der Projektionssatz 2.25, dass die Ungleichung T PX;G .y/ y G x PX;G .y/ 0 8y 2 Rn ; x 2 X gilt. Speziell für G D I ergibt sich damit die Ungleichung T y PX .y/ x PX .y/ 0 8y 2 Rn ; x 2 X; d. h. der Winkel zwischen y PX .y/ und x PX .y/ muss für alle x 2 X mindestens 90ı betragen, vergleiche Abb. 2.9. Diese Ungleichung wird in späteren Abschnitten noch sehr häufig benutzt. Als einfache Anwendung des Projektionssatzes 2.25 beweisen wir die Lipschitz-Stetigkeit6 des Projektionsoperators. Lemma 2.26 Sei X Rn nichtleer, abgeschlossen und konvex sowie G 2 Rnn symmetrisch und positiv definit. Dann gilt PX;G .x/ PX;G .y/ kx ykG G für alle x; y 2 Rn . Insbesondere ist der Projektionsoperator x 7! PX;G .x/ stetig. Beweis Seien x; y 2 Rn . Dann gilt
x y D PX;G .x/ PX;G .y/ C x PX;G .x/ C PX;G .y/ y D PX;G .x/ PX;G .y/ C u
mit
u WD x PX;G .x/ C PX;G .y/ y :
Daher ist
2 kx yk2G D PX;G .x/ PX;G .y/G C kuk2G C 2uT G PX;G .x/ PX;G .y/ 2 D PX;G .x/ PX;G .y/G C kuk2G T C 2 x PX;G .x/ G PX;G .x/ PX;G .y/ T C 2 PX;G .y/ y G PX;G .x/ PX;G .y/ :
6
Rudolf Lipschitz (1832–1903), Mathematiker
2.5 Aufgaben
41
Aufgrund des Projektionssatzes 2.25 gelten T x PX;G .x/ G PX;G .x/ PX;G .y/ 0; T PX;G .y/ y G PX;G .x/ PX;G .y/ 0: Zusammenfassend ergibt sich daher 2 kx yk2G PX;G .x/ PX;G .y/G ;
also die Behauptung.
2.5 Aufgaben 1. Beweisen oder widerlegen Sie die folgenden Aussagen: (a) Sind X; Y Rn konvex, so ist auch X \ Y konvex. (b) Sind X; Y Rn konvex, so ist auch X [ Y konvex. (c) Sind X Rn und Y Rm konvex, so ist auch X Y konvex. (d) Sind X Rn konvex und f W X ! R konvex, so ist auch a f konvex für alle a 2 R. (e) Sind X Rn konvex und f; g W X ! R konvex, so ist auch f C g konvex. Ist g sogar strikt/gleichmäßig konvex, so ist auch f C g strikt/gleichmäßig konvex. (f) Sind X Rn konvex und f; g W X ! R konvex, so ist auch maxff; gg konvex. (g) Sind X Rn konvex und f W X ! R, g W R ! R konvex, so ist auch g ı f konvex. 2. Beweisen Sie Bemerkung 2.2 : Sei f W Rn ! R eine quadratische Funktion, d. h. f .x/ WD x T Qx C q T x C mit einer Matrix Q 2 Rnn , einem Vektor q 2 Rn und einer Konstanten 2 R. Dann gilt: (a) f ist konvex ” Q ist positiv semidefinit. (b) f ist strikt konvex ” f ist gleichmäßig konvex ” Q ist positiv definit. 3. Sei X Rn offen und f W X ! R konvex. Weiter sei x 2 X beliebig und " > 0 so gewählt, dass Q WD fx 2 Rn j kx x k1 2"g X . (a) Zeigen Sie, dass f beschränkt auf B2" .x / WD fx 2 Rn j kx x k2 2"g ist, d. h. jf .x/j C für alle x 2 B2" .x / mit einem C > 0. (b) Zeigen Sie, dass f Lipschitz-stetig auf B" .x / ist, d. h. dass es ein L > 0 gibt mit jf .x1 / f .x2 /j Lkx1 x2 k2
8x1 ; x2 2 B" .x /:
Insbesondere folgt hieraus, dass f stetig auf X ist. 4. Sei f W Rn ! R konvex. (a) Zeigen Sie, dass die folgende Ungleichung für alle x; y 2 Rn und alle c 2 R n Œ0; 1 gilt: f .cx C .1 c/y/ cf .x/ C .1 c/f .y/: (b) Sei f zusätzlich nach oben beschränkt. Zeigen Sie, dass f dann konstant ist.
42
2
Mathematische Grundlagen
Q x B2ε (x∗ )
x∗
x1
x2
x ˆ
∗
x
Bε (x∗ )
x ¯
B2ε (x∗ )
Abb. 2.10 Hinweise zu Aufgabe 3 5. Sei X Rn nichtleer. Dann heißt F W X ! Rn quasimonoton, falls minf.y x/T F .x/; .x y/T F .y/g 0 für alle x; y 2 X gilt. Beweisen Sie die folgenden Aussagen: (a) Sei X Rn nichtleer und F W X ! Rn pseudomonoton. Dann ist F auch quasimonoton. (b) Sei X Rn offen und konvex und f W X ! R stetig differenzierbar. Dann ist f quasikonvex genau dann, wenn rf quasimonoton ist.
3
Existenz von Nash-Gleichgewichten
In diesem Kapitel wollen wir untersuchen, welche Voraussetzungen garantieren, dass ein Spiel mindestens ein oder genau ein Nash-Gleichgewicht besitzt. Hierfür verwenden wir zwei unterschiedliche Herangehensweisen: Zum einen nutzen wir den engen Zusammenhang zwischen Nash-Gleichgewichten und Variationsungleichungen und leiten verschiedene Existenzresultate für Variationsungleichungen her. Zum anderen wenden wir einen geeigneten Fixpunktsatz direkt auf die Beste-Antwort-Abbildung von Spielen an.
3.1 Nash-Gleichgewichte und Variationsungleichungen Wir definieren zunächst den Begriff einer Variationsungleichung. Anschließend werden wir zeigen, dass sich eine ganze Reihe von bekannten Problemen in der Gestalt einer Variationsungleichung formulieren lassen. Insbesondere wird sich herausstellen, dass ein Nash-Gleichgewicht unter gewissen Voraussetzungen gerade die Lösung einer zugehörigen Variationsungleichung ist. Definition 3.1
Sei X Rn nichtleer und abgeschlossen sowie F W X ! Rn gegeben. Als (finite) Variationsungleichung (engl.: variational inequality problem; kurz: VIP.X; F /) bezeichnet man das Problem, einen Vektor x 2 X zu finden mit F .x /T .x x / 0
8x 2 X:
(Häufig wird zusätzlich vorausgesetzt, dass die Menge X konvex ist.) In dem folgenden Resultat geben wir einen einfachen Spezialfall einer Variationsungleichung an.
© Springer Nature Switzerland AG 2018 C. Kanzow, A. Schwartz, Spieltheorie, Mathematik Kompakt, https://doi.org/10.1007/978-3-319-96679-3_3
43
44
3
Existenz von Nash-Gleichgewichten
Lemma 3.2 Betrachte die Variationsungleichung VIP.X; F / mit X D Rn . Dann ist ein Vektor x 2 X genau dann eine Lösung von VIP.X; F /, wenn er das nichtlineare Gleichungssystem F .x/ D 0 löst. Beweis Sei x zunächst eine Lösung von VIP.X; F / mit X D Rn . Dann gilt F .x /T .x x / 0 für alle x 2 Rn . Speziell für x D x F .x / folgt dann F .x /T F .x / D F .x /T .x x / 0: Also ist F .x / D 0. Gilt umgekehrt F .x / D 0; so ist offensichtlich F .x /T .x x / D 0 0 für alle x 2 Rn erfüllt. Bevor wir auf einen weiteren wichtigen Spezialfall einer Variationsungleichung eingehen, definieren wir zunächst das Komplementaritätsproblem. Definition 3.3
Sei F W X ! Rn mit X WD RnC gegeben. Das Komplementaritätsproblem besteht darin, einen Vektor x 2 Rn zu finden, der dem folgenden System genügt: 0 x ? F .x/ 0
”
xi 0; Fi .x/ 0; xi Fi .x/ D 0 8i D 1; : : : ; n:
Ist F dabei eine affin-lineare Funktion, d. h., F .x/ WD M x C q für ein M 2 Rnn und ein q 2 Rn , so spricht man von einem linearen Komplementaritätsproblem (engl.: linear complementarity problem; kurz: LCP(q; M )), anderenfalls von einem nichtlinearen Komplementaritätsproblem (engl.: nonlinear complementarity problem; kurz: NCP(F )). Der Zusammenhang zwischen einer Variationsungleichung und einem Komplementaritätsproblem wird in dem folgenden Resultat geklärt. Lemma 3.4 Sei X D RnC . Dann löst ein Vektor x 2 Rn genau dann die Variationsungleichung VIP.X; F /, wenn x das Komplementaritätsproblem NCP(F ) löst. Beweis Sei x 2 Rn zunächst eine Lösung von VIP.X; F / mit X D RnC . Dann gilt x 0 und F .x /T .x x / 0 für alle x 0. Speziell für x WD x C ei 0 ist dann Fi .x / D F .x /T .x x / 0 8i D 1; : : : ; n; also F .x / 0. Insbesondere ist F .x /T x 0. Angenommen, es existiert ein Index i 2 f1; : : : ; ng mit Fi .x /xi > 0. Wähle dann x WD x xi ei 0. Aus 0 > Fi .x /xi D F .x /T .x x / 0 folgt dann ein Widerspruch. Somit ist auch F .x /T x D 0; und x löst NCP(F ).
3.1 Nash-Gleichgewichte und Variationsungleichungen
45
Sei umgekehrt x 2 Rn eine Lösung von NCP(F ), also x 0; F .x / 0 und F .x /T x D 0. Sei ferner x 0 beliebig. Dann gilt F .x /T .x x / D F .x /T x F .x /T x D F .x /T x 0; d. h. x ist eine Lösung von VIP.X; F / mit X D RnC .
Wie wir im Minimumprinzip, also Lemma 2.20, schon gesehen haben, stehen Optimierungsprobleme min f .x/ x
u. d. N. x 2 X:
(3.1)
in einem engen Zusammenhang mit der Variationsungleichung VIP.X; rf /: Ist X konvex und f stetig differenzierbar auf einer offenen Obermenge von X, so ist jedes lokale Minimum von (3.1) auch eine Lösung der Variationsungleichung VIP.X; rf /. Ist zusätzlich f pseudokonvex, so gilt auch die umgekehrte Implikation, d. h. eine Lösung der Variationsungleichung liefert eine Lösung des Optimierungsproblems. Als Nächstes wollen wir zeigen, dass man Nash-Gleichgewichte ebenfalls durch die Lösung einer zugehörigen Variationsungleichung bestimmen kann. Dieses Resultat wird uns später sowohl von theoretischem (Existenz- und Eindeutigkeitsresultate bei NashGleichgewichtsproblemen) als auch praktischem (numerische Lösung von Nash-Gleichgewichtsproblemen) Nutzen sein. Darüber hinaus besitzen Variationsungleichungen zahlreiche weitere Anwendungen und stellen ein eigenes Forschungsgebiet dar. Formal müssten wir, wann immer wir in Zukunft fordern, dass eine Funktion f W X ! R auf einer abgeschlossenen Menge X Rn stetig differenzierbar ist, eigentlich voraussetzen, dass f auf einer offenen Obermenge von X definiert und stetig differenzierbar ist. Um den Blick auf die wesentlichen Voraussetzungen der nachfolgenden Resultate nicht zu verschleiern, erlauben wir uns aber die kleine Ungenauigkeit, die offene Obermenge nicht explizit zu erwähnen. Satz 3.5 Gegeben sei ein Spiel D fX ; gN D1 mit nichtleeren, abgeschlossenen und konvexen Strategiemengen X Rn sowie Auszahlungsfunktionen W X ! R von x für jedes (mit X WD X1 : : : XN ) derart, dass .x ; x / als Funktion T feste x pseudokonvex sei. Dann ist x D x ;1 ; : : : ; x ;N genau dann ein NashGleichgewicht von , wenn x die Variationsungleichung VIP.X; F / mit 0 1 rx 1 1 .x/ B C :: C F .x/ WD B : @ A rx N N .x/ löst.
46
3
Existenz von Nash-Gleichgewichten
T Beweis Sei x D x ;1 ; : : : ; x ;N zunächst ein Nash-Gleichgewichtspunkt von . Dann ist x ; für jedes D 1; : : : ; N eine Lösung des Optimierungsproblems min .x ; x ; / x
u. d. N.
x 2 X :
(3.2)
Wegen Lemma 2.20 gilt dann rx .x /T .x x ; / 0 8x 2 X für alle D 1; : : : ; N . Hieraus folgt unmittelbar F .x /T .x x / D
N X
rx .x /T .x x ; / 0 8x D .x 1 ; : : : ; x N /T 2 X:
D1
Also ist x eine Lösung von VIP.X; F /. Sei umgekehrt x jetzt eine Lösung der Variationsungleichung VIP.X; F /. Dann gilt F .x /T .x x / 0 8x 2 X: Speziell für einen Vektor der Gestalt x WD .x ; x ; / 2 X mit einem beliebigen x 2 X folgt hieraus rx .x /T .x x ; / 0 8x 2 X : Wegen Lemma 2.20 und der vorausgesetzten Pseudokonvexität von . ; x ; / ergibt sich hieraus, dass x ; das Optimierungsproblem (3.2) löst. Also ist x ein Nash-Gleichgewicht von . Man beachte, dass wir im Beweis die Pseudokonvexität von . ; x / nur benötigt haben, um zu zeigen, dass eine Lösung der Variationsungleichung auch ein NashGleichgewicht ist. Allerdings ist dies die Implikation, welche später meistens verwendet wird. Wegen Korollar 2.5 gilt die Charakterisierung aus dem Satz 3.5 insbesondere für den Fall von konvexen Auszahlungsfunktionen . ; x / für alle D 1; : : : ; N .
3.2 Existenz von Nash-Gleichgewichten via Variationsungleichungen In diesem Abschnitt weisen wir nach, dass ein strategisches Spiel unter gewissen Voraussetzungen stets eine Lösung besitzt. Ferner beweisen wir auch ein Eindeutigkeitsresultat. Hierfür zeigen wir zunächst Existenz- und Eindeutigkeitsresultate für Lösungen von Variationsungleichungen, aus denen sich durch Spezialisierung wegen des im Satz 3.5 genannten Zusammenhanges dann sofort entsprechende Resultate für Nash-Gleichgewichtsprobleme ergeben.
3.2 Existenz von Nash-Gleichgewichten via Variationsungleichungen
47
Unser erstes Ziel wird es sein, eine äquivalente Formulierung der Variationsungleichung VIP.X; F / als ein Fixpunktproblem herzuleiten. Diese Fixpunktcharakterisierung ist sowohl theoretisch als auch numerisch von erheblicher Bedeutung. In diesem Abschnitt werden wir aus diesem Resultat zunächst einen Existenzsatz für VIP.X; F / herleiten. Später gehen wir auch auf algorithmische Anwendungen ein. Satz 3.6 Sei X Rn nichtleer, abgeschlossen und konvex, F W X ! Rn , G 2 Rnn symmetrisch und positiv definit sowie > 0. Dann ist x 2 Rn eine Lösung der Variationsungleichung VIP.X; F / genau dann, wenn x ein Fixpunkt der Abbildung H.x/ WD PX;G x G 1 F .x/ ist, d. h. wenn x D H.x / gilt. Beweis Aufgrund des Projektionssatzes 2.25 gelten die folgenden Äquivalenzen: x löst VIP.X; F /
” ” ” ”
F .x /T .x x / 0 8x 2 X T G 1 F .x / G.x x / 0 8x 2 X T x x G 1 F .x / G.x x / 0 8x 2 X x D PX;G x G 1 F .x / D H.x /:
Damit ist die Aussage des Satzes auch schon bewiesen.
Zur Anwendung des Satzes 3.6 benötigen wir noch den fundamentalen Fixpunktsatz von Brouwer1 , siehe zum Beispiel [20] für einen Beweis. Satz 3.7 (Fixpunktsatz von Brouwer) Sei X Rn eine nichtleere, konvexe und kompakte Menge sowie f W X ! X stetig. Dann besitzt f einen Fixpunkt in X. Das erste zentrale Resultat dieses Abschnittes ist der folgende Existenzsatz. Satz 3.8 Sei X Rn eine nichtleere, konvexe und kompakte Menge sowie F W X ! Rn stetig. Dann besitzt die Variationsungleichung VIP.X; F / (mindestens) eine Lösung. Beweis Betrachte wieder die in Satz 3.6 eingeführte Abbildung H.x/ WD PX;G x G 1 F .x/ 1
Luitzen Egbertus Jan Brouwer (1881–1966), Mathematiker (Topologe)
48
3
Existenz von Nash-Gleichgewichten
mit beliebigen Parametern > 0 und G 2 Rnn symmetrisch positiv definit. Aus Lemma 2.26 und der vorausgesetzten Stetigkeit von F ergibt sich unmittelbar, dass auch die Abbildung H stetig ist. Ferner ist H W X ! X nach Konstruktion eine Selbstabbildung. Da die Menge X außerdem den Voraussetzungen des Brouwerschen Fixpunktsatzes 3.7 genügt, besitzt H einen Fixpunkt x 2 X. Nach Satz 3.6 ist dieser Vektor x auch eine Lösung von VIP.X; F /. Als Nächstes wollen wir zeigen, dass die Lösungsmenge einer Variationsungleichung VIP.X; F / mit pseudomonotonem F stets konvex ist. Dabei ist das folgende Resultat von zentraler Bedeutung. Lemma 3.9 Sei X Rn nichtleer, abgeschlossen und konvex sowie F W X ! Rn stetig und pseudomonoton. Dann sind die folgenden Aussagen äquivalent: (a) x 2 X löst VIP.X; F /, d. h. F .x /T .x x / 0 8x 2 X. (b) F .x/T .x x / 0 8x 2 X. Beweis Gilt Aussage (a), so folgt (b) unmittelbar aus der Definition einer pseudomonotonen Funktion. Umgekehrt möge nun (b) gelten. Fixiere ein beliebiges x 2 X. Dann gilt für alle t 2 Œ0; 1 wegen der Konvexität von X auch x C t.x x / 2 X. Aus Voraussetzung (b) folgt daher T F x C t.x x / t.x x / 0 8 t > 0: Also ist auch T F x C t.x x / .x x / 0 8 t > 0: Der Grenzübergang t ! 0C liefert aufgrund der Stetigkeit von F somit F .x /T .x x / 0: Da dies für alle x 2 X gilt, ist x eine Lösung von VIP.X; F /.
Hiermit lässt sich die schon angedeutete Konvexität der Lösungsmenge für pseudomonotone Variationsungleichungen sehr leicht beweisen. Lemma 3.10 Sei X Rn nichtleer, abgeschlossen und konvex sowie F W X ! Rn stetig und pseudomonoton. Dann ist die Lösungsmenge von VIP.X; F / konvex (eventuell leer).
3.2 Existenz von Nash-Gleichgewichten via Variationsungleichungen
49
Beweis Seien x1 ; x2 2 X zwei Lösungen von VIP.X; F / und 2 .0; 1/. Aufgrund von Lemma 3.9 gelten dann F .x/T .x x1 / 0 8x 2 X; F .x/T .x x2 / 0 8x 2 X: Speziell für x WD x1 C .1 /x2 2 X gilt daher F .x/T .x x / D F .x/T .x C .1 /x x1 .1 /x2 / D F .x/T .x x1 / C .1 /F .x/T .x x2 / 0 für alle x 2 X. Nach Lemma 3.9 ist x daher eine Lösung von VIP.X; F /.
Wir wollen nun zeigen, dass VIP.X; F / unter gewissen Voraussetzungen an die Funktion F auch dann eine (eindeutige) Lösung besitzt, wenn die Menge X unbeschränkt ist. Dazu beginnen wir zunächst mit dem nachstehenden Resultat. Lemma 3.11 Sei X Rn nichtleer, abgeschlossen und konvex sowie F W X ! Rn strikt monoton. Dann besitzt VIP.X; F / höchstens eine Lösung. Beweis Angenommen, VIP.X; F / besitzt zwei Lösungen x 1 ; x 2 2 Rn mit x 1 ¤ x 2 . Dann gelten F .x 1 /T .x x 1 / 0 und F .x 2 /T .x x 2 / 0 für alle x 2 X. Wegen x 1 ; x 2 2 X ergeben sich daher insbesondere F .x 1 /T .x 2 x 1 / 0 und F .x 2 /T .x 1 x 2 / 0: Addition dieser beiden Ungleichungen liefert unter Anwendung der strikten Monotonie von F 0 < .x 1 x 2 /T .F .x 1 / F .x 2 // 0 und damit einen Widerspruch. Für ein r > 0 definieren wir im Folgenden ˇ ˚
K r .0/ WD x 2 Rn ˇ kxk r
50
3
Existenz von Nash-Gleichgewichten
als die abgeschlossene Kugelumgebung um den Nullpunkt vom Radius r. Ist X Rn gegeben, so wird mit Xr die Schnittmenge Xr WD X \ K r .0/ bezeichnet. Ist X abgeschlossen und konvex, so ist offenbar auch Xr abgeschlossen (sogar kompakt) und konvex. Ist ferner X nichtleer, so ist auch die Menge Xr nichtleer für alle hinreichend großen r > 0. Die Bedeutung der Menge Xr ergibt sich aus folgendem Lemma, welches selbst wiederum für den nachfolgenden Existenzsatz wichtig ist. Lemma 3.12 Sei X Rn nichtleer, abgeschlossen und konvex sowie F W X ! Rn stetig. Dann besitzt VIP.X; F / genau dann eine Lösung x ; wenn es ein r > kx k gibt, sodass x auch die Variationsungleichung VIP.Xr ; F / löst. Beweis Zunächst besitze VIP.X; F / eine Lösung x . Wähle dann r > kx k beliebig. Wegen x 2 Xr X ist x insbesondere eine Lösung von VIP.Xr ; F /. Sei umgekehrt ein r > 0 gegeben, sodass VIP.Xr ; F / eine Lösung x besitzt mit kx k < r. Sei x 2 X beliebig. Für hinreichend kleines > 0 ist dann y WD x C .x x / 2 Xr : Da x das Problem VIP.Xr ; F / löst, gilt F .x /T .x x / D F .x /T .y x / 0 und somit auch F .x /T .x x / 0 wegen > 0. Also ist x bereits eine Lösung von VIP.X; F /.
Im folgenden Satz wird die Existenz einer Lösung von VIP.X; F / auch für nicht notwendig beschränktes X nachgewiesen unter der Voraussetzung, dass die Funktion F einem gewissen Wachstumsverhalten genügt. Satz 3.13 Sei X Rn nichtleer, abgeschlossen und konvex sowie F W X ! Rn stetig. Existiert ein xN 2 X mit .x x/ N T F .x/ F .x/ N D 1; (3.3) lim x2X;kxk!1 kx xk N so besitzt VIP.X; F / (mindestens) eine Lösung.
3.2 Existenz von Nash-Gleichgewichten via Variationsungleichungen
51
Beweis Aufgrund der Voraussetzung (3.3) existieren Konstanten > kF .x/k N und r > kxk N mit N > kx xk N .x x/ N T F .x/ F .x/ für alle x 2 X mit kxk r. Daher ist N > kx xk N C F .x/ N T .x x/ N F .x/T .x x/ kx xk N kF .x/k N kx xk N D kF .x/k N kx xk N kF .x/k N kxk kxk N
(3.4)
>0 für alle x 2 X mit kxk r. Betrachte nun die Menge Xr WD X \K r .0/. Diese ist konvex, kompakt und nichtleer wegen xN 2 Xr . Aufgrund des Satzes 3.8 besitzt die zugehörige Variationsungleichung VIP.Xr ; F / daher eine Lösung x . Folglich gilt F .x /T .x x / 0 für alle x 2 Xr . Insbesondere ist daher F .x /T .xN x / 0 also
F .x /T .x x/ N 0:
Wegen (3.4) muss somit kx k < r gelten. Aufgrund des Lemma 3.12 ist x deshalb bereits eine Lösung von VIP.X; F /. Als unmittelbare Konsequenz aus den obigen Ergebnissen erhalten wir das nachstehende Existenz- und Eindeutigkeitsresultat. Korollar 3.14 Seien X Rn nichtleer, abgeschlossen und konvex sowie F W X ! Rn stetig und gleichmäßig monoton. Dann besitzt VIP.X; F / genau eine Lösung. Beweis Da F gleichmäßig monoton (auf X) ist, genügt F insbesondere der Wachstumsbedingung (3.3) für ein beliebiges xN 2 X. Wegen Satz 3.13 besitzt VIP.X; F / daher mindestens eine Lösung. Auf der anderen Seite ist die gleichmäßig monotone Funktion F insbesondere strikt monoton, sodass VIP.X; F / höchstens eine Lösung besitzt, vergleiche Lemma 3.11. Also hat VIP.X; F / genau eine Lösung. Durch Anwendung der Resultate dieses Abschnittes in Kombination mit Satz 3.5 erhalten wir die nachstehenden Aussagen über die Existenz von Nash-Gleichgewichten.
52
3
Existenz von Nash-Gleichgewichten
Korollar 3.15 Sei D fX ; gN D1 ein Spiel mit stetig differenzierbaren Auszahlungsfunktionen sowie nichtleeren, abgeschlossenen und konvexen Strategiemengen X Rn ; D 1; : : : ; N . Setze 0
1 rx 1 1 .x/ B C :: C: F .x/ WD B : @ A rx N N .x/ Dann gelten die folgenden Aussagen: (a) Ist F pseudomonoton, so ist die Menge aller Nash-Gleichgewichte konvex (eventuell leer). (b) Ist F strikt monoton, so existiert höchstens ein Nash-Gleichgewicht. (c) Ist F gleichmäßig monoton, so gibt es genau ein Nash-Gleichgewicht. (d) Sind alle Strategiemengen X kompakt und alle Auszahlungsfunktionen pseudokonvex in x , so gibt es mindestens ein Nash-Gleichgewicht. Wir können die Ergebnisse dieses Abschnitts auch auf Optimierungsprobleme anwenden und erhalten dann insbesondere das nachstehende Resultat. Korollar 3.16 Betrachte das Optimierungsproblem min f .x/ x
u. d. N. x 2 X
(3.5)
mit X Rn nichtleer, abgeschlossen und konvex sowie f W X ! R stetig differenzierbar. Dann gelten die folgenden Aussagen: (a) Ist f pseudokonvex, so ist die Menge aller Minima konvex (eventuell leer). (b) Ist f strikt konvex, so existiert höchstens ein Minimum. (c) Ist f gleichmäßig konvex, so existiert genau ein Minimum. Beweis Wegen des Minimumprinzips 2.20 ist x für jede zumindest pseudokonvexe Funktion f genau dann ein Minimum von (3.5), wenn x die zugehörige Variationsungleichung VIP.X; F / mit F .x/ WD rf .x/ löst. Aufgrund der Resultate im Abschn. 2.2 ist rf genau dann pseudomonoton (strikt monoton, gleichmäßig monoton), wenn f pseudokonvex (strikt konvex, gleichmäßig konvex) ist. Damit erhalten wir alle Aussagen als Folgerungen der Ergebnisse dieses Abschnitts.
3.3 Der Existenzsatz von Nikaido-Isoda
53
Die vorausgesetzte Differenzierbarkeit von f im vorigen Resultat ist übrigens nur unserem Zugang über Variationsungleichungen geschuldet. Die Aussagen stimmen für beliebige auf X stetige und konvexe Funktionen f . Teil (a) und (b) lassen sich direkt nachrechnen, für Teil (c) beachte man, dass die gleichmäßige Konvexität impliziert, dass die Levelmengen von f beschränkt sind.
3.3 Der Existenzsatz von Nikaido-Isoda Im vorigen Abschnitt haben wir die Existenz von Nash-Gleichgewichten über den Umweg der Variationsungleichungen bewiesen. Dieser Ansatz liefert gleichzeitig einen numerisch brauchbaren Zugang zur Lösung von Nash-Gleichgewichtsproblemen, benötigt als Voraussetzung jedoch die stetige Differenzierbarkeit aller Auszahlungsfunktionen . Andererseits zeigte bereits das sehr einfache Duopol-Modell, dass die Auszahlungsfunktionen nicht differenzierbar sein müssen. Wir wollen in diesem Abschnitt daher einen Existenzsatz unter schwächeren Glattheitsvoraussetzungen beweisen. Dabei werden wir ganz wesentlich auf den Fixpunktsatz von Kakutani2 zurückgreifen. Zu dessen Formulierung werden noch einige Begriffe benötigt. Definition 3.17
Sei X Rn . Dann heißt jede Abbildung F W X ! P .Rm /, wobei P .Rm / die Potenzmenge des Rm bezeichnet, eine Korrespondenz oder mengenwertige Abbildung. Wir schreiben hierfür auch kurz F W X Rm . Mengenwertige Abbildungen treten in vielen Zusammenhängen auf. Ist beispielsweise g W Rm ! Rn eine gegebene Funktion, so ist die Abbildung F W Rn Rm , die jedem Element x 2 Rn das Urbild F .x/ WD g 1 .x/ zuordnet, eine Korrespondenz. Ebenso ist die schon früher aufgetretene Beste-Antwort-Abbildung x 7! S .x / für jeden Spieler D 1; : : : ; N eine Korrespondenz. Sollten die Lösungsmengen S .x / hierbei stets eindeutig sein, handelt es sich bei diesen Korrespondenzen natürlich um eine Abbildung im herkömmlichen Sinne. Ein wichtiger Begriff im Zusammenhang mit mengenwertigen Abbildungen ist die nachfolgende Eigenschaft. Definition 3.18
Sei X Rn . Eine mengenwertige Abbildung F W X Rm heißt abgeschlossen in x 2 X, falls für je zwei konvergente Folgen .x k /k ! x und .y k /k ! y mit x k 2 X und y k 2 F .x k / für alle k 2 N auch y 2 F .x/ gilt. Damit sind wir nun in der Lage, den Fixpunktsatz von Kakutani zu formulieren. Auf einen Beweis verzichten wir an dieser Stelle und verweisen dazu auf die Literatur, etwa [20]. 2
Shizuo Kakutani (1911–2004), Mathematiker (Funktionalanalysis)
54
3
Existenz von Nash-Gleichgewichten
Satz 3.19 (Fixpunktsatz von Kakutani) Sei X Rn nichtleer, konvex und kompakt sowie F W X X eine abgeschlossene Korrespondenz derart, dass die Bildmengen F .x/ für alle x 2 X nichtleer und konvex sind. Dann besitzt F einen Fixpunkt, d. h. es existiert ein x 2 X mit x 2 F .x /. Es sei an dieser Stelle kurz erwähnt, dass man aus dem Fixpunktsatz von Kakutani sehr leicht den Fixpunktsatz von Brouwer erhält: Sei dazu X Rn eine nichtleere, konvexe und kompakte Menge sowie f W X ! X stetig. Setze F .x/ WD ff .x/g für alle x 2 X. Dann ist F W X X eine Korrespondenz und die Bildmengen F .x/ sind stets einelementig, also insbesondere nichtleer und konvex. Für zwei konvergente Folgen .x k /k ! x mit x k 2 X sowie .y k /k ! y mit y k 2 F .x k / für alle k 2 N gilt außerdem y k D f .x k /, also y D f .x/ 2 F .x/ für k ! 1 aufgrund der vorausgesetzten Stetigkeit von f . Nach dem Fixpunktsatz von Kakutani besitzt F daher einen Fixpunkt x 2 X. Gemäß der Definition von F gilt dann x D f .x / und damit ist der Fixpunktsatz von Brouwer bewiesen. Wir kehren jetzt wieder zur Spieltheorie zurück und beweisen den nachstehenden Existenzsatz für Nash-Gleichgewichtsprobleme als Anwendung des Fixpunktsatzes von Kakutani, vergleiche auch die zugehörige Originalarbeit [36]. Satz 3.20 (Existenzsatz von Nikaido-Isoda3 ) Sei D fX ; gN D1 ein Spiel mit folgenden Eigenschaften für alle D 1; : : : ; N : (a) Die Strategiemengen X Rn sind nichtleer, konvex und kompakt. (b) Die Auszahlungsfunktionen W X ! R (mit X WD X1 : : : XN ) sind stetig. (c) Die Auszahlungsfunktionen .x ; x / sind quasikonvex als Abbildung in x (für alle festen x ). Dann besitzt das Spiel einen Nash-Gleichgewichtspunkt. Beweis Sei x 7! S .x / die Beste-Antwort-Funktion des Spielers , also S .x / die Menge aller Lösungen des Optimierungsproblems .x ; x / min x
u. d. N. x 2 X
für D 1; : : : ; N . Wir betrachten nun die hierdurch induzierte Korrespondenz S.x/ WD S1 .x 1 / : : : SN .x N /: 3
Hukukane Nikaido (1923–2001), Mathematiker und Ökonom
(3.6)
3.3 Der Existenzsatz von Nikaido-Isoda
55
Offenbar ist S eine Abbildung von X in P .X/, also S W X X. Aus Voraussetzung (a) folgt außerdem, dass X D X1 : : : XN nichtleer, konvex und kompakt ist. Die Lösungsmengen S .x / sind stets nichtleer, denn die Zielfunktion in (3.6) ist stetig und der zulässige Bereich X in (3.6) nichtleer und kompakt. Ferner ist S .x / für jedes D 1; : : : ; N konvex, da es sich um die Lösungsmenge des quasikonvexen Optimierungsproblems (3.6) handelt, vergleiche Korollar 2.8. Als kartesisches Produkt von nichtleeren und konvexen Mengen ist dann auch S.x/ D S1 .x 1 / : : : SN .x N / nichtleer und konvex für alle x 2 X. Wir zeigen als Nächstes, dass die Korrespondenz S W X X auch abgeschlossen im Sinne der Definition 3.18 ist. Seien dazu zwei Folgen .x k /k X und .s k /k gegeben mit .x k /k ! x, .s k /k ! s und s k 2 S.x k /. Somit gilt .s k; ; x k; / .x ; x k; / 8x 2 X
8k 2 N
und für alle D 1; : : : ; N . Aus der Stetigkeit von folgt für k ! 1 somit .s ; x / .x ; x / 8x 2 X und alle D 1; : : : ; N . Also ist s für jedes D 1; : : : ; N eine Lösung des Optimierungsproblems .x ; x / min x
u. d. N. x 2 X :
Folglich gilt s D .s 1 ; : : : ; s N / 2 S.x/, d. h., die Korrespondenz S ist abgeschlossen. Somit können wir den Fixpunktsatz 3.19 von Kakutani anwenden: Die mengenwertige Abbildung S besitzt einen Fixpunkt x . Per Definition von S gilt für diesen dann x ; 2 S .x ; / für alle D 1; : : : ; N . Wegen Satz 1.6 ist x daher ein Nash-Gleichge wichtspunkt des gegebenen Spiels . Der Satz 3.20 ist im Prinzip eine Verallgemeinerung von Korollar 3.15 (d) auf die Klasse der stetigen (statt stetig differenzierbaren) Funktionen . Eine ganz wesentliche Voraussetzung ist hierbei die Kompaktheit von X . Ohne diese Voraussetzung lässt sich der Fixpunktsatz von Kakutani nicht anwenden. Allerdings haben wir in Korollar 3.15 auch die Existenz von Nash-Gleichgewichten bei nicht notwendig beschränkten Strategiemengen X bewiesen (für stetig differenzierbare Funktionen ). Die Namensgebung des Satzes 3.20 variiert in der Literatur etwas, so wird er in [14] beispielsweise als Satz von Debreu, Glicksberg und Fan bezeichnet. Abb. 3.1 fasst noch einmal alle in den letzten beiden Abschnitten hergeleiteten Existenzresultate für Nash-Gleichgewichte zusammen.
56
3
Existenz von Nash-Gleichgewichten
Xν ⊆ Rnν nichtleer, abgeschlossen, konvex θν : X → R stetig ja Xν beschränkt nein
ja
F glm. mon. mindestens ein Nash-G.
ja θν differenzierbar, pseudokonv. in xν nein
mindestens ein Nash-G.
ja
ja genau ein Nash-G.
nein F strikt mon.
ja höchstens ein Nash-G.
nein
θν quasikonv. in xν
F pseudomon.
ja konvexe Menge von Nash-G.
Abb. 3.1 Überblick über Existenzresultate für Nash-Gleichgewichte
3.4 Aufgaben 1. Betrachten Sie das quadratische Minimierungsproblem min x
1 T x Qx C c T x C 2
u. d. N.
Ax b; x 0
mit einer symmetrischen Matrix Q. Aus Abschn. 2.3 ist bekannt, dass eine Lösung x dieses Problems den folgenden (Karush-Kuhn-Tucker-) Bedingungen genügen muss: Qx C c C AT D 0; Ax b 0; 0; T .Ax b/ D 0; x 0; 0; T x D 0: Formulieren Sie diese Bedingungen als lineares Komplementaritätsproblem, d. h. schreiben Sie diese in der Form 0 y ? My C q 0 mit einer quadratischen Matrix M und einem Vektor q. 2. Betrachten Sie das nichtlineare Optimierungsproblem min f .x/ u. d. N. x
g.x/ 0; h.x/ D 0
mit f W Rn ! R, gW Rn ! Rm und hW Rn ! Rp stetig differenzierbar.
3.4 Aufgaben
57
Aus Abschn. 2.3 ist bekannt, dass unter einer Constraint Qualification zu jedem lokalen Minimum x dieses Problems Lagrange-Multiplikatoren 2 Rm und 2 Rp existieren, sodass die folgenden KKT-Bedingungen erfüllt sind: rf .x / C rg.x / C rh.x / D 0; g.x / 0; 0; g.x /T D 0; h.x / D 0: Finden Sie eine Variationsungleichung F .z /T .z z / 0
8z 2 Z;
deren Lösungen äquivalent zu den Lösungen der KKT-Bedingungen sind. 3. Betrachten Sie ein Spiel mit N Teilnehmern, wobei das Problem von Spieler gegeben sei durch min x
1 T .x / Q x C c T x 2
u. d. N.
A x b ; x 0
mit symmetrisch positiv semidefiniten Matrizen Q 2 Rn n . (a) Welcher ist der Zusammenhang zwischen den Nash-Gleichgewichten dieses Spiels und den Lösungen der zugehörigen Variationsungleichung? (b) Zeigen Sie, dass die Menge aller Nash-Gleichgewichte konvex (eventuell leer) ist. (c) Zeigen Sie, dass das Spiel mindestens ein Nash-Gleichgewicht besitzt, falls alle Mengen fx 2 Rn j A x b ; x 0g beschränkt sind. n 4. Sei D fX ; gN D1 ein Spiel mit X R nichtleer, abgeschlossen und konvex und W X ! R stetig differenzierbar für alle D 1; : : : ; N . Definiere
0
1 rx 1 1 .x/ B C :: C: F .x/ D B : @ A rx N N .x/ (a) Zeigen Sie, dass aus der Monotonie von F die Konvexität von . ; x /W X ! R für beliebiges x 2 X und alle D 1; : : : ; N folgt. (b) Zeigen Sie, dass aus der Pseudomonotonie von F die Pseudokonvexität von . ; x /W X ! R für beliebiges x 2 X und alle D 1; : : : ; N folgt. (c) Zeigen Sie, dass aus der (Pseudo-) Konvexität von . ; x / für alle D 1; : : : ; N im Allgemeinen nicht die (Pseudo-) Monotonie von F folgt. 5. Aus [2, Cor. 4.2] ergibt sich folgendes Existenzresultat: Gegeben sei ein Nash-Gleichgewichtsn problem D fX ; gN und gleichmäßig konvex als Funktion von x (bei D1 mit X D R festem x ) für alle D 1; : : : ; N . Dann hat das Nash-Gleichgewichtsproblem eine Lösung. Stimmt diese Aussage?
4
Zwei-Personen-Spiele
In diesem Kapitel betrachten wir Spiele mit zwei Spielern und endlichen Strategiemengen, also Matrix- und Bi-Matrixspiele. Für diese Spiele untersuchen wir die Existenz von Nash-Gleichgewichten, führen Nash-Gleichgewichte in gemischten Strategien als neues Lösungskonzept ein und leiten Umformulierungen von (Bi-) Matrixspielen her, die eine algorithmische Bestimmung der Gleichgewichte in gemischten Strategien erlauben.
4.1
Matrixspiele
Wir betrachten in diesem Abschnitt Matrixspiele in der Maximierungsform, also endliche Zwei-Personen-Nullsummenspiele der Gestalt maxx 1
1 .x/
u. d. N. x 2 X1 1
2 .x/
maxx 2
u. d. N. x 2 2 X2
mit der Eigenschaft 1 .x/ D 2 .x/ für alle x 2 X1 X2 . Da die Strategiemengen X1 und X2 endlich sind, bezeichnen wir ihre Elemente einfach mit X1 D f1; : : : ; mg und X2 D f1; : : : ; ng. Die Auszahlungen von Spieler 1 können dann mittels der zugehörigen Auszahlungsmatrix A 2 Rmn mit den Elementen aij WD 1 .i; j / 8i D 1; : : : ; m;
8j D 1; : : : ; n
dargestellt werden. Dann ist B WD A automatisch die Auszahlungsmatrix von Spieler 2. Bevor wir mit einigen allgemeinen Ergebnissen über Matrixspiele fortfahren, beginnen wir mit einem kleinen Beispiel aus [19].
© Springer Nature Switzerland AG 2018 C. Kanzow, A. Schwartz, Spieltheorie, Mathematik Kompakt, https://doi.org/10.1007/978-3-319-96679-3_4
59
60
4
Zwei-Personen-Spiele
Beispiel Wir untersuchen hier ein Matrixspiel mit m D 2; n D 3 und der Auszahlungsmatrix
3 A WD 4
! 8 : 0
1 10
Welche Strategie wird Spieler 1 (= Zeilenspieler) sinnvoll wählen? Nimmt er die erste Strategie, so liegt sein minimaler Gewinn bei 1 (= minimaler Eintrag in der ersten Zeile). Entscheidet er sich für die zweite Strategie, so beläuft sich sein minimaler Gewinn auf 0 (= minimaler Eintrag in der zweiten Zeile). Nimmt er daher das Maximum dieser Werte über die Zeilen, so beträgt sein minimaler Gewinn max min aij D 1: i
j
Spieler 2 (= Spaltenspieler) verhält sich ähnlich: Bei Wahl der Strategie 1 hat er einen maximalen Verlust von 4 (= maximaler Eintrag in Spalte 1). Entscheidet er sich hingegen für seine zweite bzw. dritte Strategie, so beträgt sein maximaler Verlust 10 bzw. 8. Um seinen Verlust insgesamt zu minimieren, nimmt er das Minimum über diese Werte. Sein maximaler Verlust beträgt demzufolge min max aij D 4: j
i
Wir zeigen im folgenden Resultat ganz allgemein, dass der minimale Gewinn (auch Maxmin-Strategie genannt) stets eine untere Schranke für den maximalen Verlust (auch als Minmax-Strategie bezeichnet) darstellt. Lemma 4.1 Für jedes Matrixspiel mit Auszahlungsmatrix A 2 Rmn gilt max min aij min max aij : j
i
j
i
(4.1)
Beweis Für jeden festen Spaltenindex ` 2 f1; : : : ; ng und alle i 2 f1; : : : ; mg gilt zunächst min aij ai ` : j
Hieraus folgt natürlich max min aij max ai ` : j
i
i
Da dies letztlich für jeden Spaltenindex ` 2 f1; : : : ; ng der Fall ist, ergibt sich max min aij min max aij ; i
j
wenn wir statt ` einfach j schreiben.
j
i
4.1 Matrixspiele
61
Die beiden in (4.1) auftretenden Größen v WD max min aij i
j
und v WD min max aij j
i
heißen auch unterer Spielwert und oberer Spielwert des gegebenen Matrixspiels. Lemma 4.1 lässt sich hiermit kurz schreiben als v v. Im Folgenden wird vor allem der Fall von Interesse sein, bei dem hier Gleichheit gilt. Zu diesem Zweck beginnen wir mit einigen Vorüberlegungen, die insbesondere auf einen anderen Sprachgebrauch im Zusammenhang mit Matrixspielen führen. Sei dazu .i ; j / ein Nash-Gleichgewichtspunkt des gegebenen Matrixspiels, also 1 .i ; j / 1 .i; j / 8i 2 D1
und 2 .i ; j / 2 .i ; j / 8j
”
1 .i ; j / 1 .i; j / 8i
und 1 .i ; j / 1 .i ; j / 8j
”
1 .i; j / 1 .i ; j / 1 .i ; j / 8i; j
”
aij ai j ai j
8i; j:
Ein Strategiepaar .i ; j / mit der Eigenschaft aij ai j ai j
8i D 1; : : : ; m;
j D 1; : : : ; n
wird als Sattelpunkt des Matrixspiels bezeichnet. Mit den obigen Überlegungen haben wir dann das folgende Resultat. Satz 4.2 Gegeben sei ein Matrixspiel mit Auszahlungsmatrix A 2 Rmn . Dann ist das Strategiepaar .i ; j / genau dann ein Nash-Gleichgewicht, wenn .i ; j / ein Sattelpunkt ist. Das nachstehende Resultat besagt nun, dass genau dann ein Sattelpunkt (bzw. NashGleichgewicht) existiert, wenn in (4.1) Gleichheit gilt, also unterer und oberer Spielwert übereinstimmen. Satz 4.3 Gegeben sei ein Matrixspiel mit Auszahlungsmatrix A 2 Rmn . Dann existiert genau dann ein Sattelpunkt (bzw. Nash-Gleichgewicht), wenn in (4.1) Gleichheit gilt, d. h. v D max min aij D min max aij D v: i
j
j
i
62
4
Zwei-Personen-Spiele
Beweis Sei .i ; j / zunächst ein Sattelpunkt des gegebenen Matrixspiels, also aij ai j ai j
8i D 1; : : : ; m;
8j D 1; : : : ; n:
Hieraus folgt insbesondere max aij ai j min ai j : j
i
Dies impliziert wiederum v D min max aij ai j max min aij D v: j
i
i
j
Wegen Lemma 4.1 gilt dann zwangsläufig die Gleichheit v D v. Sei umgekehrt vDv
”
max min aij D min max aij : j
i
j
i
(4.2)
Aus der Definition von v sowie v ergibt sich unmittelbar die Existenz von Indizes i und j mit v D min ai j j
und v D max aij : i
Aus der Ungleichung v D min ai j ai j max aij D v j
i
ergibt sich mit v D v daher min ai j D ai j D max aij : j
i
Dies impliziert aber gerade ai j aij 8i D 1; : : : ; m
und ai j ai j 8j D 1; : : : ; n;
also ist das Indexpaar .i ; j / ein Sattelpunkt des gegebenen Matrixspieles.
Die wegen Satz 4.3 im Falle der Existenz von Nash-Gleichgewichten eindeutig bestimmte Größe v WD max min aij D min max aij i
j
heißt der Wert eines Matrixspiels.
j
i
”
v WD v D v
4.1 Matrixspiele
63
Zum Abschluss dieses Abschnitts betrachten wir noch eine spezielle Klasse von Matrixspielen. Definition 4.4
Ein Matrixspiel mit Auszahlungsmatrix A 2 Rmn heißt symmetrisch, wenn n D m und A D AT gilt. In einem symmetrischen Matrixspiel haben beide Spieler die gleichen Strategiemöglichkeiten 1; : : : ; n und sind homogen in dem Sinne, dass sich die Auszahlungsmatrix A nicht ändert, wenn man Spieler 1 und 2 vertauscht. Deshalb ist in einem symmetrischen Matrixspiel die Auszahlungsmatrix A nicht symmetrisch, sondern schiefsymmetrisch. Die Diagonalelemente von A müssen Null sein. Ein Beispiel für ein symmetrisches Matrixspiel im gerade definierten Sinn ist „Stein, Schere, Papier“. Für symmetrische Matrixspiele lässt sich die Existenz von Sattelpunkten wie folgt charakterisieren: Satz 4.5 Ein symmetrisches Matrixspiel mit Auszahlungsmatrix A 2 Rnn besitzt genau dann einen Sattelpunkt (bzw. Nash-Gleichgewichtspunkt), wenn ein Index i 2 f1; : : : ; ng existiert mit ai j 0 8j D 1; : : : ; n:
(4.3)
In diesem Fall ist .i ; i / ein Sattelpunkt und v D 0 der Wert des Matrixspiels. Beweis Sei .i ; j / zunächst ein Sattelpunkt, also ai j ai j aij
8i; j D 1; : : : ; n:
Speziell für i D j folgt hieraus ai j aj j D 0 für alle j D 1; : : : ; n. Sei umgekehrt i 2 f1; : : : ; ng ein Index mit der Eigenschaft (4.3). Dann folgt mit A D AT , also aij D aj i für alle i; j D 1; : : : ; n, unmittelbar aj i D ai j 0 8j D 1; : : : ; n: Somit ist ai j 0 aj i
8j D 1; : : : ; n:
Wegen ai i D 0 ist .i ; i / daher ein Sattelpunkt des symmetrischen Matrixspiels.
64
4
Zwei-Personen-Spiele
Das Kriterium (4.3) für symmetrische Matrixspiele ist offenbar sehr handlich: Es muss nur eine Zeile i mit lauter nichtnegativen Einträgen geben. Beispielsweise definiert die Auszahlungsmatrix 0
0 1
B A WD B @1
0
1 1
1
1
C 1C A 0
ein symmetrisches Matrixspiel, bei dem der Index i WD 2 dem Kriterium aus Satz 4.5 genügt, so dass .2; 2/ ein Sattelpunkt und daher auch ein Nash-Gleichgewicht des zugehörigen Spieles ist. Auf der anderen Seite sieht man sofort, dass für unser Stein-ScherePapier-Spiel kein Index i mit der Eigenschaft (4.3) existiert.
4.2 Matrixspiele in gemischten Strategien Gegeben sei wieder ein Matrixspiel mit Auszahlungsmatrix A 2 Rmn . Bei der Untersuchung solcher Spiele haben wir im letzten Abschnitt ausschließlich „reine“ Strategien betrachtet, d. h. die Spieler entscheiden sich für genau ein Element ihrer jeweiligen Strategiemenge. Wie das Beispiel des Stein-Schere-Papier-Spiels zeigte, muss ein solches Spiel aber kein Nash-Gleichgewicht besitzen. Obendrein ist es nicht immer sinnvoll, sich für genau eine Strategie zu entscheiden. Wird ein Spiel beispielsweise mehrfach wiederholt, so macht es mehr Sinn, dass jeder Spieler eine Strategie mit einer gewissen Wahrscheinlichkeit spielt. Spieler 1 wählt also einen Vektor x 2 Rm mit x D .x1 ; : : : ; xm /T ;
m X
xi D 1;
xi 0 8i D 1; : : : ; m;
i D1
Spieler 2 wählt einen Vektor y 2 Rn mit y D .y1 ; : : : ; yn / ; T
n X
yj D 1;
yj 0 8j D 1; : : : ; n:
j D1
Dabei gibt xi bzw. yj die Wahrscheinlichkeit an, mit welcher Spieler 1 bzw. 2 die Strategie i bzw. j wählt. Man nennt dies ein Matrixspiel in gemischten Strategien (bzw. das zum gegebenen Matrixspiel zugehörige Matrixspiel in gemischten Strategien). Hierbei enthält jeder solche Vektor x bzw. y eine gemischte Strategie. Ist einer dieser Vektoren der Einheitsvektor, so spricht man auch von einer reinen Strategie. Dies entspricht gerade dem bisher betrachteten Spezialfall aus dem vorigen Abschn. 4.1.
4.2 Matrixspiele in gemischten Strategien
65
Bei einem Matrixspiel in gemischten Strategien sind die Strategiemengen von Spieler 1 bzw. 2 somit gegeben durch m ˇX n ˇ xi D 1; XO WD x 2 Rm ˇ
xi 0 8i D 1; : : : ; m
o
i D1
und n ˇX n ˇ yj D 1; YO WD y 2 Rn ˇ
o yj 0 8i D 1; : : : ; n :
j D1
Wählt Spieler 1 die gemischte Strategie x 2 XO und wählt Spieler 2 die gemischte Strategie y 2 YO , so ist der Erwartungswert für die Auszahlung an Spieler 1 gegeben durch den Ausdruck .x; y/ WD x T Ay: Damit können wir den Begriff des Nash-Gleichgewichts auf Matrixspiele in gemischten Strategien erweitern. Definition 4.6
Für eine gegebene Auszahlungsmatrix A 2 Rmn seien XO ; YO und wie oben definiert. Dann heißt ein Paar .x ; y / 2 XO YO ein Nash-Gleichgewicht in gemischten Strategien für das Matrixspiel, wenn .x ; y / .x; y / 8x 2 XO
und .x ; y / .x ; y/
8y 2 YO
gelten, wenn also .x ; y / ein Sattelpunkt von ist. Der gerade eingeführte Begriff eines Nash-Gleichgewichtes in gemischten Strategien ist offenbar nichts anderes als die Definition des üblichen Nash-Gleichgewichtes für das 2-Personenspiel mit den Auszahlungsfunktionen 1 WD und 2 WD und den Strategiemengen X1 WD XO und X2 WD YO der Spieler 1 und 2. Da die Mengen XO und YO beide offenbar nichtleer, konvex und kompakt sind und sowohl linear in x als auch linear in y ist, erhalten wir aus dem Satz 3.20 unmittelbar das folgende Existenzresultat von Nash [35]. Satz 4.7 (Existenzsatz von Nash) Jedes Matrixspiel besitzt mindestens ein NashGleichgewicht in gemischten Strategien.
66
4
Zwei-Personen-Spiele
Der Satz 4.7 zeigt also einen fundamentalen Unterschied auf zwischen Matrixspielen in gemischten Strategien auf der einen Seite und Matrixspielen in reinen Strategien auf der anderen Seite. Das nächste Resultat ist insbesondere von großer praktischer Bedeutung, da es das Lösen eines Matrixspiels auf ein lineares Programm zurückführt. Satz 4.8 Gegeben sei ein Matrixspiel mit Auszahlungsmatrix A 2 Rmn . Ferner seien ; XO und YO wie oben definiert. Dann ist .x ; y / genau dann ein Nash-Gleichgewicht in gemischten Strategien, wenn die beiden folgenden Aussagen gelten: (a) x (zusammen mit einer skalaren Größe v ) löst das (primale) lineare Programm u. d. N. x T A ve T ;
max v v;x
m X
xi D 1; x 0:
(4.4)
i D1
(b) y (zusammen mit einer skalaren Größe w ) löst das (duale) lineare Programm min w w;y
u. d. N. Ay we;
n X
yj D 1; y 0:
(4.5)
j D1
Hierbei bezeichnet e WD .1; : : : ; 1/T den Einsvektor in der jeweils passenden Dimension. Beweis Sei .x ; y / zunächst ein Nash-Gleichgewicht in gemischten Strategien, also .x; y / .x ; y / .x ; y/
O 8x 2 X;
8y 2 YO :
(4.6)
Setze v WD .x /T Ay
und w WD .x /T Ay :
Wir behaupten, dass .v ; x / das lineare Programm (4.4) und .w ; y / das lineare Programm (4.5) lösen. Betrachte hierzu zunächst .v ; x /. Aus (4.6) folgt zunächst v .x /T Ay für alle y 2 YO . Speziell für die in YO liegenden Einheitsvektoren y D ei 2 Rn liefert dies v Œ.x /T A i für alle i D 1; : : : ; n. Hieraus ergibt sich insbesondere die Zulässigkeit von .v ; x / für das lineare Programm (4.4). Angenommen, .v ; x / sei nicht optimal. Dann existiert ein für (4.4) zulässiger Vektor .v; N x/ N mit vN > v . Multiplikation T von ŒxN A j vN mit yj 0 und anschließende Summation ergibt dann den Widerspruch xN T Ay D
n X j D1
ŒxN T A j yj vN
n X
yj D vN > v D .x /T Ay
j D1
zu der linken Ungleichung in (4.6). Somit ist .v ; x / in der Tat eine Lösung von (4.4).
4.2 Matrixspiele in gemischten Strategien
67
Wir betrachten als Nächstes den Punkt .w ; y /. Aus (4.6) folgt x T Ay .x /T Ay D w für alle x 2 XO und damit speziell für die Einheitsvektoren x D ei 2 Rm die Abschätzung ŒAy i w . Dies zeigt die Zulässigkeit von .w ; y / für das lineare Programm (4.5). Angenommen, es gibt einen für (4.5) zulässigen Vektor .w; N y/ N mit wN < w . Multi plizieren wir die Ungleichung ŒAy
N i wN dann mit xi 0 und summieren anschließend auf, so folgt der Widerspruch
.x /T AyN D
m X
xi ŒAy
Ni
i D1
m X
xi wN D wN < w D .x /T Ay
i D1
zu der rechten Ungleichung in (4.6). Also ist .w ; y / Lösung von (4.5). Sei umgekehrt .v ; x / eine Lösung von (4.4) und .w ; y / eine Lösung von (4.5). Aus den Nebenbedingungen von (4.4) und (4.5) sowie dem starken Dualitätssatz für lineare Programme, siehe zum Beispiel [17], folgt für alle x 2 XO und alle y 2 YO dann x T Ay w e T x D w D v D v e T y .x /T Ay: Ebenso ergibt sich aus w D w e T x D .w e/T x .Ay /T x D .x /T A y v e T y D v D w auch w D .x /T Ay D v . Folglich ist .x; y / .x ; y / .x ; y/
O 8y 2 YO ; 8x 2 X;
also .x ; y / ein Nash-Gleichgewicht in gemischten Strategien.
Wir betrachten kurz ein Beispiel zu dem obigen Resultat. Beispiel Betrachte ein Matrixspiel mit der Auszahlungsmatrix
1 A WD 1
! 0 : 2
Offensichtlich existiert kein Nash-Gleichgewicht in reinen Strategien. Löst man die zugehörigen linearen Programme aus dem Satz 4.8, so erhält man die Lösungen x WD
3 1 ; 4 4
T
und y WD
1 1 ; 2 2
T
mit v WD 12 . Auf lange Sicht kann Spieler 1 also einen Gewinn von 12 erwarten, wenn er mit 75% die erste Strategie und mit 25% die zweite Strategie wählt. Spieler 2 hingegen wird seine erste und zweite Strategie jeweils mit 50% wählen, um seinen Verlust auf Dauer einzudämmen auf 12 pro Spiel.
68
4
4.3
Zwei-Personen-Spiele
Bi-Matrixspiele und quadratische Programme
Wir betrachten in diesem Abschnitt Bi-Matrixspiele der Gestalt minx 1
1 .x/
u. d. N. x 2 X1 1
minx 2
2 .x/
u. d. N. x 2 2 X2 :
Anders als in den beiden vorigen Abschnitten untersuchen wir (ohne Beschränkung der Allgemeinheit) also Spiele in Minimierungsform. Die beiden endlichen Strategiemengen seien wie vorher gegeben durch X WD X1 WD f1; : : : ; mg und Y WD X2 WD f1; : : : ; ng: Dann lassen sich die beiden Auszahlungsfunktionen 1 und 2 (für die jetzt im Allgemeinen 1 ¤ 2 gilt) durch die Matrizen A D .aij / 2 Rmn und B D .bij / 2 Rmn mit den Elementen aij WD 1 .i; j /;
bij WD 2 .i; j / 8i D 1; : : : ; m; j D 1; : : : ; n
beschreiben. Da die zuvor behandelten Matrixspiele ein Spezialfall der Bi-Matrixspiele sind, werden letztere im Allgemeinen ebenfalls keine Lösung besitzen. Wir benutzen daher die Idee des letzten Abschnitts und gehen gleich zu dem zugehörigen Bi-Matrixspiel in gemischten Strategien über. Dazu definieren wir wieder die beiden Mengen m ˇX o n ˇ xi D 1; xi 0 8i D 1; : : : ; m ; XO WD x 2 Rm ˇ i D1
n ˇX o ˇ YO WD y 2 Rn ˇ yj D 1; yj 0 8j D 1; : : : ; n :
n
j D1
Für einen Vektor x 2 XO mit x D .x1 ; : : : ; xm /T bezeichnet xi somit die Wahrscheinlichkeit, dass Spieler 1 die Strategie i wählt. Entsprechend ist die Interpretation von y D .y1 ; : : : ; yn /T . Definition 4.9
Seien XO und YO wie oben definiert. Dann heißt ein Paar .x ; y / 2 XO YO ein NashGleichgewicht in gemischten Strategien für das gegebene Bi-Matrixspiel, wenn gilt .x /T Ay x T Ay .x /T By .x /T By
für alle x 2 XO und für alle y 2 YO :
4.3 Bi-Matrixspiele und quadratische Programme
69
Die Nash-Gleichgewichte in reinen Strategien sind in der Definition 4.9 mit enthalten für den speziellen Fall, dass .x ; y / D .ei ; ej / für gewisse Einheitsvektoren ei und ej ist. Der Zusammenhang zwischen solchen Nash-Gleichgewichten in reinen Strategien und Nash-Gleichgewichten in gemischten Strategien wird in dem folgenden Resultat geklärt. Lemma 4.10 Jedes Nash-Gleichgewicht in reinen Strategien eines gegebenen BiMatrixspieles ist stets auch ein Nash-Gleichgewicht in gemischten Strategien. Beweis Sei .x ; y / ein Nash-Gleichgewicht in reinen Strategien, etwa .x ; y / D .ei ; ej / für den i-ten Einheitsvektor ei 2 Rm und den j -ten Einheitsvektor ej 2 Rn . Dann gelten also aij D eiT Aej ekT Aej D akj
8k D 1; : : : ; m
bij D eiT Bej eiT Bek D bi k
8k D 1; : : : ; n:
und
Für alle gemischten Strategien x 2 XO und y 2 YO folgt daher x T Ay D x T ŒAej D
m X
xk akj
kD1
m X
xk aij D aij D .x /T Ay
kD1
und, analog, .x /T By D eiT By D
n X kD1
yk bi k
n X
yk bij D bij D .x /T By :
kD1
Also ist .x ; y / D .ei ; ej / auch ein Nash-Gleichgewicht in gemischten Strategien.
Hat man ein Nash-Gleichgewicht in reinen Strategien für ein gegebenes Bi-Matrixspiel gefunden, so besagt das Lemma 4.10 im Prinzip, dass man sich gar nicht weiter auf die Suche nach Nash-Gleichgewichten in gemischten Strategien machen muss, da ein solches bereits vorliegt. Oft allerdings gibt es kein solches Nash-Gleichgewicht in reinen Strategien. In diesem Fall bildet das Nash-Gleichgewicht in gemischten Strategien eine alternative Lösung an. Wir werden jetzt kurz argumentieren, warum ein solches Gleichgewicht stets existiert. Die obige Definition eines Nash-Gleichgewichtes in gemischten Strategien entspricht gerade der üblichen Definition eines Nash-Gleichgewichtes (für Spiele in Minimierungsform) für das 2-Personenspiel mit den Auszahlungsfunktionen O1 .x; y/ WD x T Ay und O2 .x; y/ WD x T By (dies sind die Erwartungswerte der Auszahlungen an die Spieler 1
70
4
Zwei-Personen-Spiele
und 2) und den Strategiemengen XO und YO für Spieler 1 und 2. Da die Mengen XO und YO wieder nichtleer, konvex und kompakt sowie die Funktionen O1 und O2 linear in x und y sind, erhalten wir aus dem Satz 3.20 wieder folgendes Existenzresultat, vergleiche den entsprechenden Satz 4.7 für Matrixspiele. Satz 4.11 Jedes Bi-Matrixspiel besitzt mindestens ein Nash-Gleichgewicht in gemischten Strategien. Wir wollen in diesem Abschnitt zeigen, dass man ein Nash-Gleichgewicht in gemischten Strategien finden kann, indem man ein zugehöriges Optimierungsproblem löst. Dieser Ansatz stammt von Mangasarian und Stone [31] und verwendet das quadratische Programm min
x;y;v;w
x T Ay C x T By v w
u. d. N. Ay ve; B T x we;
(4.7)
x T e D 1; y T e D 1; x; y 0;
wobei v; w 2 R skalare Größen sind. Hier bezeichnet e D .1; : : : ; 1/T wieder den Einsvektor in passender Dimension. Bei der Untersuchung dieses quadratischen Programms erweist sich die nachstehende Charakterisierung von Nash-Gleichgewichtspunkten als hilfreich. Lemma 4.12 Seien x 0, y 0 mit e T x D 1 und e T y D 1 gegeben. Dann ist .x ; y / genau dann ein Nash-Gleichgewicht in gemischten Strategien, wenn .x /T Ay e Ay
und .x /T By e B T x
(4.8)
gelten. Beweis Sei .x ; y / zunächst ein Nash-Gleichgewicht in gemischten Strategien. Speziell für x D ei bzw. y D ej folgt dann .x /T Ay eiT Ay D ŒAy i
8i D 1; : : : ; m
4.3 Bi-Matrixspiele und quadratische Programme
71
bzw. .x /T By .x /T Bej D Œ.x /T B j D ŒB T x j
8j D 1; : : : ; n
und somit die Gültigkeit von (4.8). Sei umgekehrt .x ; y / ein Paar von gemischten Strategie-Vektoren mit der Eigenschaft (4.8). Für alle gemischten Strategien x bzw. y gilt dann x T e D .x /T Ay x T Ay .x /T Ay „ƒ‚… D1
bzw. y T B T x D .x /T By .x /T By y T e D .x /T By ; „ƒ‚… D1
so dass .x ; y / ein Nash-Gleichgewichtspunkt ist.
Einige wichtige Eigenschaften des quadratischen Programms (4.7) sind in dem folgenden Resultat zusammengefasst. Satz 4.13 Sei q.x; y; v; w/ WD x T Ay C x T By v w die Zielfunktion des quadratischen Programms (4.7). Dann gelten: (a) Es ist q.x; y; v; w/ 0 für alle zulässigen Vektoren .x; y; v; w/ für das quadratische Programm (4.7). (b) Ist .x ; y / ein Nash-Gleichgewicht in gemischten Strategien, so ist der zugehörige Vektor .x ; y ; v ; w / mit v WD .x /T Ay , w WD .x /T By ein globales Minimum des quadratischen Programms (4.7) mit q.x ; y ; v ; w / D 0. (c) Das quadratische Programm (4.7) besitzt stets eine Lösung (globales Minimum), und für jede solche Lösung .x; y; v; w/ ist q.x; y; v; w/ D 0. Beweis (a) Sei .x; y; v; w/ ein beliebiger zulässiger Punkt. Dann gelten wegen x 0, y 0 sowie Ay ve, B T x we offenbar xT e D v x T Ay v „ƒ‚… D1
und x T By D y T B T x w y T e D w: „ƒ‚… D1
Also ist q.x; y; v; w/ 0. (b) Sei .x ; y / ein Nash-Gleichgewicht in gemischten Strategien. Wir zeigen zunächst, dass .x ; y ; v ; w / mit v WD .x /T Ay , w WD .x /T By zulässig ist für
72
4
Zwei-Personen-Spiele
das quadratische Programm (4.7). Zunächst gilt offensichtlich x 0; y 0 sowie .x /T e D 1, .y /T e D 1. Ferner gilt nach Lemma 4.12 Ay v e
und B T x w e:
Also ist .x ; y ; v ; w / in der Tat zulässig für (4.7). Aus der Definition von v ; w folgt außerdem q.x ; y ; v ; w / D 0, so dass der Vektor .x ; y ; v ; w / wegen Teil (a) ein globales Minimum des quadratischen Programms (4.7) ist. (c) Wegen Satz 4.11 besitzt ein Bi-Matrixspiel ein Nash-Gleichgewicht in gemischten Strategien. Nach Teil (b) liefert jedes solche Gleichgewicht eine Lösung des zugehörigen quadratischen Programms (4.7) mit dem Funktionswert Null. Wir zeigen als Nächstes die vollständige Äquivalenz zwischen Nash-Gleichgewichten in gemischten Strategien auf der einen Seite sowie Lösungen des quadratischen Programms (4.7) auf der anderen Seite. Satz 4.14 Genau dann ist .x ; y / ein Nash-Gleichgewicht in gemischten Strategien für das gegebene Bi-Matrixspiel mit den Auszahlungsmatrizen A; B 2 Rmn , wenn der Vektor .x ; y ; v ; w / mit v WD .x /T Ay , w WD .x /T By eine Lösung des quadratischen Programms (4.7) mit q.x ; y ; v ; w / D 0 ist. Beweis Jeder Nash-Gleichgewichtspunkt liefert wegen Satz 4.13 (b) bereits ein globales Minimum des quadratischen Programms (4.7), so dass wir nur noch die Rückrichtung beweisen müssen. Sei dazu .x ; y ; v ; w / eine Lösung von (4.7). Wegen Satz 4.13 ist der zugehörige Funktionswert dann Null, woraus wir .x /T Ay C .x /T By D v C w
(4.9)
erhalten. Andererseits genügt .x ; y ; v ; w / allen Nebenbedingungen des quadratischen Programms (4.7), so dass wir .x /T Ay v .x /T e D v und .x /T By D .y /T B T x w .y /T e D w haben. Zusammen mit (4.9) liefert dies .x /T Ay D v
und .x /T By D w :
(4.10)
4.3 Bi-Matrixspiele und quadratische Programme
73
Seien nun x; y 0 mit x T e D 1, y T e D 1 beliebig gegeben. Wiederum aus den Restriktionen in (4.7) folgt dann x T Ay v x T e D v und .x /T By D y T B T x w y T e D w : Gemeinsam mit (4.10) bekommen wir nun die Ungleichungen x T Ay v D .x /T Ay
und .x /T By w D .x /T By :
Da x; y beliebig gewählte gemischte Strategien waren, folgt somit, dass .x ; y / ein Nash Gleichgewicht in gemischten Strategien ist. Damit ist gezeigt, dass man einen Nash-Gleichgewichtspunkt mittels der Lösung eines quadratischen Programms bestimmen kann. Dieses quadratische Programm lässt sich im Prinzip mit den üblichen Methoden der Optimierung lösen. Wegen Satz 4.13 sollte man hierbei allerdings den optimalen Zielfunktionswert kontrollieren: Liegt dieser bei Null, so haben wir einen Nash-Gleichgewichtspunkt berechnet. Anderenfalls wurde nur ein lokales Minimum gefunden, welches dann keinem Nash-Gleichgewichtspunkt entspricht. Dieser Fall kann durchaus auftreten, da das quadratische Programm aus (4.7) im Allgemeinen nicht konvex ist. Anders verhält es sich in dem Spezialfall eines Nullsummenspiels mit B D A. Dann reduziert sich das quadratische Programm (4.7) auf ein lineares Programm, vergleiche Aufgabe 5. Beispiel Wir betrachten ein Bi-Matrixspiel, dessen Auszahlungsmatrizen in Maximierungsform gegeben sind durch ! ! 1 0 1 1 : und B WD A WD 1 4 2 0
Man bestätigt leicht, dass hier kein Nash-Gleichgewicht in reinen Strategien existiert. Wir suchen daher ein Nash-Gleichgewicht in gemischten Strategien mit Hilfe des quadratischen Programms T T aus (4.7). So erhalten wir x D 34 ; 14 sowie y D 12 ; 12 als vermeintlich optimales NashGleichgewicht in gemischten Strategien. Da der zugehörige, numerisch bestimmte, Funktionswert der quadratischen Zielfunktion 4;4409 1016 0 beträgt, kann man die obige gemischte Strategie getrost als Lösung akzeptieren.
74
4
Zwei-Personen-Spiele
4.4 Bi-Matrixspiele und lineare Komplementaritätsprobleme Wir betrachten weiterhin ein Bi-Matrixspiel mit gemischten Strategien. Die Mengen XO und YO seien dazu wie im vorigen Abschnitt definiert. Ferner bezeichnen wir die zugehörigen Auszahlungsmatrizen wieder mit A und B, wobei beide Matrizen im Rmn liegen. Wir geben in diesem Abschnitt eine weitere Charakterisierung des Nash-Gleichgewichts in gemischten Strategien an, und zwar unter Verwendung eines linearen Komplementaritätsproblems, vergleiche Definition 3.3. Wir erinnern hier nur kurz daran, dass ein lineares Komplementaritätsproblem LCP.q; M / definiert ist durch eine Matrix M 2 Rnn und einen Vektor q 2 Rn . Gesucht ist dann eine Lösung des Systems z 0;
M z C q 0;
z T .M z C q/ D 0:
Derartige Komplementaritätsprobleme spielen bei vielen ökonomischen Gleichgewichtsmodellen eine große Rolle. Das Standardverfahren zur Lösung solcher Probleme ist der Lemke-Algorithmus1 , der in [29, 30] (für Bi-Matrixspiele) eingeführt wurde und beispielsweise in [5, 34] ausführlich besprochen wird. Zunächst zeigen wir, dass wir ohne Einschränkung davon ausgehen können, dass die Elemente der Matrizen A und B alle positiv sind. Lemma 4.15 Sei 2 R beliebig gegeben und E 2 Rmn die Matrix mit Einträgen eij D 1 für alle i; j . Dann ist .x ; y / genau dann ein Nash-Gleichgewicht in gemischten Strategien zum Bi-Matrixspiel .A; B/, wenn .x ; y / ein Nash-Gleichgewicht in gemischten Strategien zum Bi-Matrixspiel .A C E; B C E/ ist. Beweis Sei .x ; y / zunächst ein Nash-Gleichgewicht zum Spiel mit den Auszahlungsmatrizen .A; B/. Dann gilt m n X X xi D 1; yj D 1 x 0; y 0; i D1
sowie .x /T Ay x T Ay T
j D1
für alle x 2 XO ;
T
.x / By .x / By
für alle y 2 YO :
Für alle gemischten Strategien x 2 XO folgt dann .x /T .A C E/y D .x /T Ay C .x /T Ey D .x /T Ay C .x /T e „ ƒ‚ … „ƒ‚… D1
e
D .x /T Ay C
x T Ay C
D x T Ay C „ƒ‚… xT e
D x T Ay C x T Ey „ƒ‚…
D1
D x T .A C E/y : 1
Carlton Lemke (1920–2004), Mathematiker (Operations Research, Spieltheorie)
De
4.4 Bi-Matrixspiele und lineare Komplementaritätsprobleme
75
Analog folgt für alle gemischten Strategien y auch .x /T .A C E/y .x /T .A C E/y: Also ist .x ; y / ein Nash-Gleichgewicht in gemischten Strategien zum Bi-Matrixspiel mit den Auszahlungsmatrizen .A C E; B C E/. Der Beweis der Umkehrung erfolgt analog bzw. durch Addition von E zu den beiden Matrizen A C E und B C E. Lemma 4.15 besagt, dass ein Bi-Matrixspiel mit Auszahlungsmatrizen A; B strategisch äquivalent im Sinne von Satz 1.9 zu dem Bi-Matrixspiel mit Auszahlungsmatrizen A C E; B C E für alle 2 R ist. Durch Wahl eines hinreichend großen > 0 kann man stets erreichen, dass die beiden Matrizen A C E und B C E lauter positive Einträge haben. Daher können wir ohne Einschränkung annehmen, dass A und B selbst bereits ausschließlich positive Einträge besitzen. Nach diesen Vorbereitungen kommen wir nun zum Hauptresultat dieses Abschnitts, der Umformulierung des Bi-Matrixspieles als ein lineares Komplementaritätsproblem. Satz 4.16 Betrachte ein Bi-Matrixspiel mit den Auszahlungsmatrizen A; B 2 Rmn , deren Einträge ohne Einschränkung allesamt positiv seien. Definiere außerdem ! ! A 0mm e und q WD M WD : e BT 0nn Dann gelten: (a) Ist .x ; y / ein Nash-Gleichgewicht in gemischten Strategien, so ist x y .x; y/ WD ; .x /T By .x /T Ay eine Lösung von LCP.q; M /. (b) Ist .x; y/ eine Lösung von LCP.q; M /, so ist x y .x ; y / WD ; xT e y T e ein Nash-Gleichgewicht in gemischten Strategien. Beweis (a) Sei .x ; y / ein Nash-Gleichgewicht in gemischten Strategien. Dann ist ˛ WD .x /T Ay > 0 (wegen A > 0) und ˇ WD .x /T By > 0 (wegen B > 0). Folglich ist x y ; .x; y/ WD ˇ ˛
76
4
Zwei-Personen-Spiele
wohldefiniert mit x 0, y 0. Da .x ; y / ein Nash-Gleichgewicht ist, gilt außerdem .x /T Ay e Ay
und .x /T By e B T x
wegen Lemma 4.12. Dies lässt sich schreiben als ˛ e Ay
und ˇ e B T x :
Gemäß Definition von x und y ist dies äquivalent zu e Ay
und e B T x:
(4.11)
Ferner gelten x T .Ay e/ D x T Ay x T e 1 1 D .x /T Ay .x /T e ˛ ˇ „ ƒ‚ … ˇ „ ƒ‚ … D˛
D1
(4.12)
1 1 D ˇ ˇ D0 und y T .B T x e/ D x T By y T e 1 1 D .x /T By .y /T e „ ƒ‚ … ˛ ˇ ˛ „ ƒ‚ … Dˇ
D1
(4.13)
1 1 D ˛ ˛ D 0: Aus x; y 0 sowie (4.11), (4.12) und (4.13) sowie der Definition von M und q folgt daher, dass z WD .x; y/ eine Lösung des linearen Komplementaritätsproblems LCP.q; M / ist. (b) Sei z D .x; y/ eine Lösung von LCP.q; M /, also x 0; Ay e 0; y 0; B x e 0; T
x T .Ay e/ D 0; y .B x e/ D 0: T
T
Dann sind x ¤ 0, y ¤ 0, also x T e > 0, y T e > 0 und deshalb x y ; .x ; y / WD xT e y T e
(4.14) (4.15)
4.5 Aufgaben
77
zumindest wohldefiniert. Außerdem folgt aus der Definition sofort x 0;
y 0;
.x /T e D 1 und .y /T e D 1:
(4.16)
Aus (4.14) bzw. (4.15) ergibt sich ferner e Ay
und x T e D x T Ay
bzw. e BT x
und y T e D x T By:
Die Definition von .x ; y / impliziert daher .x /T Ay e D
1 1 T 1 1 x Aye D T e T Ay D Ay xT e yT e y e y e
bzw. .x /T By e D
1
1
T
T
x ey e
x T Bye D
1 T
x e
e
1 xT e
B T x D B T x:
Wegen (4.16) und Lemma 4.12 ist .x ; y / somit ein Nash-Gleichgewicht in gemischten Strategien.
4.5
Aufgaben
1. Betrachten Sie ein Matrixspiel D fX ; g2D1 mit Auszahlungsmatrix A 2 Rmn . (a) Nehmen Sie an, dass Spieler 1 und 2 die Rollen tauschen, d. h. betrachten Sie das Spiel Q D fY ; g2D1 mit Y1 WD X2 , Y2 WD X1 , 1 .i; j / WD 2 .j; i / und 2 .i; j / WD 1 .j; i /. Bestimmen Sie die Auszahlungsmatrix des Spiels Q . (b) Welcher Zusammenhang besteht zwischen Teil (a) und der Definition von symmetrischen Matrixspielen? 2. Betrachten Sie ein Matrixspiel mit Auszahlungsmatrix A 2 Rmn , und sei .x ; y / ein NashGleichgewicht in gemischten Strategien. Zeigen Sie, dass Spieler 1 indifferent zwischen allen Strategien i 2 f1; : : : ; mg mit xi > 0 ist, d. h. dass all diese Strategien zur gleichen erwarteten Auszahlung eiT Ay führen. 3. Ein lineares Programm in primaler Form ist ein Optimierungsproblem der Form min c T x x
u. d. N.
Ax D b; x 0:
Das zugehörige duale Problem lautet max b T y y
u. d. N.
AT y b:
78
4
Zwei-Personen-Spiele
Zeigen Sie, dass die folgenden beiden linearen Programme, die für die Umformulierung von Matrixspielen verwendet werden, zueinander dual sind: min v
u. d. N.
x T A ve T ; x T e D 1; x 0;
max w
u. d. N.
Ay we; e T y D 1; y 0:
x;v
y;w
Hinweis: Es mag hilfreich sein, Variablen ohne Vorzeichenbeschränkung wie v durch v D v C v mit v C ; v 0 zu ersetzen und Schlupfvariablen einzuführen, um Ungleichungen in Gleichungen umzuschreiben. 4. Betrachten Sie das Matrixspiel mit Auszahlungsmatrix A WD
1 0
1 2
! :
Zeigen Sie, dass dieses Spiel kein Nash-Gleichgewicht in reinen Strategien besitzt, und bestimmen Sie das Nash-Gleichgewicht in gemischten Strategien. 5. Nach Satz 4.14 ist .x ; y / genau dann ein Nash-Gleichgewicht des Bi-Matrixspiels mit Auszahlungsmatrizen A; B, wenn der Vektor .x ; y ; v ; w / mit v WD .x /T Ay und w WD .x /T By das quadratische Programm min x T Ay C x T By v w
x;y;v;w
u. d. N.
Ay ve; x T B we T ; x T e D 1; x 0; y T e D 1; y 0
mit optimalem Funktionswert Null löst. Zeigen Sie, dass sich im Fall B D A das quadratische Programm auf die beiden linearen Programme aus Satz 4.8 für Matrix-Spiele reduziert.
5
Verallgemeinerte Nash-Gleichgewichtsprobleme
Bisher haben wir Spiele der Form .x ; x / u. d. N. x 2 X min x
für alle Spieler D 1; : : : ; N betrachtet. Jeder Spieler hatte dabei eine eigene Strategiemenge X , die nicht von den Entscheidungsvariablen der anderen Spieler abhing. Wir wollen diese Annahme nun aufweichen und erlauben, dass nicht nur die Auszahlungsfunktion , sondern auch die Strategiemenge X eines Spielers von den gegnerischen Strategien x abhängen darf.
5.1
Problemstellung und Beispiele
Ein verallgemeinertes Nash-Gleichgewichtsproblem (engl.: Generalized Nash Equilibrium Problem, kurz: GNEP) sieht wie folgt aus: Jeder Spieler D 1; : : : ; N löst das Optimierungsproblem .x ; x / u. d. N. x 2 X .x / min x
mit Auszahlungsfunktion und Strategiemenge X .x /. Im Gegensatz zu den bisher betrachteten Spielen sind die Strategiemengen X Rn jetzt nicht mehr fixiert, sondern die zulässigen Strategien für Spieler hängen von den gewählten Strategien aller Gegenspieler ab. Die Spieler haben also gemeinsame Restriktionen. In den Anwendungen mögen dies gemeinsame Leitungen in einem Stromnetz oder im Internet sein, die über ihre maximale Kapazität hinaus nicht beansprucht werden können, oder es sind politisch-ökologische Vorgaben an alle Unternehmen (= Spieler) einer Region, die zusammen eine gemeinsame Obergrenze für einen Schadstoffausstoß nicht überschreiten dürfen. © Springer Nature Switzerland AG 2018 C. Kanzow, A. Schwartz, Spieltheorie, Mathematik Kompakt, https://doi.org/10.1007/978-3-319-96679-3_5
79
80
5 Verallgemeinerte Nash-Gleichgewichtsprobleme
Im allgemeinen Fall sind die Strategiemengen etwa von der Form X .x / D fx 2 Rn j h .x / 0; g .x ; x / 0g; wobei wir uns der Übersichtlichkeit wegen auf Ungleichungsrestriktionen beschränkt haben. Ist für alle Spieler die Menge X .x / und die Funktion . ; x / für alle x konvex, so nennt man das GNEP Spieler-konvex (engl.: player convex). Häufig gibt es jedoch eine gemeinsame Menge X Rn mit X .x / D fx 2 Rn j .x ; x / 2 Xg 8 D 1; : : : ; N: Ist die Menge X konvex und sind . ; x / für alle x und alle Spieler konvex, so nennen wir ein derartiges Spiel konvex (engl.: jointly convex). Wir beschränken uns im Rest des Kapitels auf diesen Spezialfall. Definition 5.1
Ein Vektor x D .x ;1 ; : : : ; x ;N / 2 X heißt ein Nash-Gleichgewicht für das GNEP, wenn für alle D 1; : : : ; N gilt .x ; ; x ; / .x ; x ; / 8x 2 X .x ; /: Die Problematik der von den Entscheidungsvariablen der anderen Spieler abhängigen Strategiemengen wird kurz an dem folgenden Beispiel illustriert. Beispiel Wir betrachten ein GNEP mit den beiden Spielern 1 und 2, wobei x1 bzw. x2 die jeweils einzige Entscheidungsvariable von Spieler 1 bzw. 2 sei. Die Optimierungsprobleme der beiden Spieler seien gegeben durch
minx1 u. d. N.
1 .x1 ; x2 / x12 C x22 1
minx2 u. d. N.
2 .x1 ; x2 / x12 C x22 1
mit Auszahlungsfunktionen 1 ; 2 , die hier nicht weiter spezifiziert werden, da es nur auf die zulässige Menge ankommt. In der obigen Notation ist der Einheitskreis ˚
X WD .x1 ; x2 /T 2 R2 j x12 C x22 1 die gemeinsame Strategiemenge beider Spieler. Bezeichnet x WD .x 1 ; x 2 /T 2 X einen beliebigen Punkt aus diesem Einheitskreis, so sind
˚ X1 .x 2 / D x1 j x12 1 x 22
˚ und X2 .x 1 / D x2 j x22 1 x 21
die von x 2 bzw. x 1 abhängigen Strategiemengen von Spieler 1 bzw. 2. Die Problematik wird in der Abb. 5.1 für zwei verschiedene Werte x 2 und xO 2 illustriert.
5.1 Problemstellung und Beispiele
81 x2
Abb. 5.1 Die Mengen X1 .x2 / in Abhängigkeit von x2
1 X1 (0.5)
X
0 X1 (0)
1
x1
In vielen Fällen wird ein GNEP vorliegen, wo jeder Spieler zum einen Restriktionen besitzt, die nur von seinen eigenen Entscheidungsvariablen abhängen, und zum anderen Nebenbedingungen hat, die auch von den Variablen der Gegenspieler abhängen. In diesem Zusammenhang ist die folgende Bemerkung manchmal hilfreich. I Bemerkung 5.2 Betrachte ein GNEP mit N Spielern, bei dem jeder Spieler 2
f1; : : : ; N g ein Optimierungsproblem der Gestalt .x ; x / u. d. N. min x
h .x / 0; g.x ; x / 0
zu lösen hat. Hierbei bezeichnet h W Rn ! Rp eine Funktion, in der alle nur von x abhängigen Restriktionen zusammengefasst sind, während gW Rn ! Rm diejenigen Nebenbedingungen repräsentiert, die allen Spielern gemein sind und gegebenenfalls von den Entscheidungsvariablen aller Spieler abhängen (entsprechend können auch Gleichheitsrestriktionen zugelassen werden). Dann ist ein Vektor x D .x ;1 ; : : : ; x ;N / offenbar genau dann eine Lösung dieses GNEPs, wenn derselbe Vektor dasjenige GNEP löst, bei dem .x ; x / min x
u. d. N. h.x ; x / 0; g.x ; x / 0
mit 1 h1 .x 1 / C B :: C h.x/ WD B : A @ N N h .x / 0
das Problem des -ten Spielers darstellt. Ohne Einschränkung der Allgemeinheit kann man also diejenigen Restriktionen als Nebenbedingungen in das Optimierungsproblem des -ten Spielers mit aufnehmen, die nur von den Variablen aller Gegenspieler abhängen. N Auf diese Weise erhält
man als gemeinsame zulässige Menge dann X WD fx 2 R j g.x/ 0; h.x/ 0 .
82
5 Verallgemeinerte Nash-Gleichgewichtsprobleme
Das Oligopol-Modell aus Kap. 1, bei dem es sich zunächst um ein reines Nash-Gleichgewichtsmodell handelte, wird in etlichen Fällen tatsächlich ein GNEP sein. Dies wird durch das folgende Beispiel angedeutet. Beispiel (Oligopol-Modell mit geteilter Ressource) Wir betrachten zunächst wieder das Oligopol-Modell aus Kap. 1, bei dem das Unternehmen 2 f1; : : : ; N g das Optimierungsproblem
max .x/ u. d. N. x
x 0
zu lösen hatte, wobei die Auszahlungsfunktion definiert war durch X x c .x / .x/ WD x p x C ¤
mit der inversen Nachfragefunktion p und der Kostenfunktion c . Aufgrund von gemeinsam verwendeten Ressourcen (dies können Rohstoffe sein oder auch Zulieferbetriebe) kann die gesamte Produktionsmenge x1 C : : : C xN aller Unternehmen eine gewisse obere Schranke K > 0 nicht überschreiten. Als Modifikation des Oligopol-Modells ergibt sich für das Unternehmen damit die Aufgabe, das Optimierungsproblem max .x/ u. d. N. x
x 0;
N X
x K
D1
zu lösen. Im Hinblick auf die Bemerkung 5.2 handelt es sich hierbei um ein GNEP mit der gemeinsamen Strategiemenge N X ˚
X WD x 2 RN j x 0 für alle D 1; : : : ; N; x K : D1
Das nächste Beispiel stammt aus der Umweltpolitik und wurde der Arbeit [28] entnommen. Beispiel (Flussverschmutzung) Drei Unternehmen D 1; 2; 3 mögen ein gewisses Produkt herstellen. Sei x dabei die Produktionsmenge vom Unternehmen . Alle Unternehmen mögen an demselben Fluss liegen. In begrenztem Umfang dürfen sie ihre bei der Produktion entstehenden Schadstoffe in den Fluss leiten. Allerdings darf der Fluss insgesamt nicht zu stark belastet werden. Zur Überprüfung der Schadstoffbelastung sind entlang des Flusses dazu zwei Kontrollstellen ` D 1; 2 eingerichtet worden. Sei .x/ WD x d1 d2 .x1 C x2 C x3 / c1 x C c2 x2 ; D 1; 2; 3;
die (zu maximierende) Auszahlungsfunktion des Unternehmens mit gewissen Konstanten d1 ; d2 ; c1 ; c2 . Die Produktionsmengen x seien alle nichtnegativ. An den beiden Kontrollstellen soll außerdem 3 X D1
u` e x K` ;
` D 1; 2;
5.2 Normalisierte Nash-Gleichgewichte
83
gelten. Dabei sind K` die maximalen Schadstoffbelastungen, e die Emissionskoeffizienten des Unternehmens und u` gewisse Konstanten, die den Abbau des Schadstoffes in Abhängigkeit der Entfernung des Unternehmens zur nächsten Kontrollstelle ` berücksichtigen. Wegen Bemerkung 5.2 liegt somit ein GNEP mit der gemeinsamen Strategiemenge 3 X ˇ
˚ u` e x K` für ` D 1; 2 X WD x 2 R3 ˇ x1 0; x2 0; x3 0; D1
vor. Da wir dieses Beispiel später für numerische Zwecke verwenden wollen, sollen hier kurz die in [28] vorgeschlagenen Konstanten d1 D 3; d2 D 0;01; K1 D 100; K2 D 100 und Unternehmen 1 2 3
c1 0;10 0;12 0;15
c2 0;01 0;05 0;01
e 0;50 0;25 0;75
u1 6;5 5;0 5;5
u2 4;583 6;250 3;750
angegeben werden.
5.2 Normalisierte Nash-Gleichgewichte Im Zusammenhang mit GNEPs spielt insbesondere die nachfolgende Klasse von NashGleichgewichten ein Rolle, die (in etwas anderer Formulierung) schon von Rosen1 [39] eingeführt wurde, vergleiche hierzu auch die Bemerkung 5.5. Definition 5.3
Ein Vektor x D .x ;1 ; : : : ; x ;N / 2 X heißt normalisiertes (oder variationelles) NashGleichgewicht (engl.: normalized Nash equilibrium) des GNEPs, wenn sup .x ; y/ D 0 y2X
gilt, wobei .x; y/ WD
N X
Œ .x ; x / .y ; x /
D1
die so genannte Nikaido-Isoda-Funktion (oder auch Ky-Fan-Funktion) bezeichnet. 1
J. Ben Rosen (1923–2009), Mathematiker (numerische Optimierung)
84
5 Verallgemeinerte Nash-Gleichgewichtsprobleme
Wir zeigen nun, dass ein normalisiertes Nash-Gleichgewicht stets auch ein NashGleichgewicht ist, und dass beide Begriffe übereinstimmen, wenn sich das GNEP auf ein gewöhnliches Nash-Gleichgewichtsproblem reduziert, also X die Struktur eines kartesischen Produktes X D X1 : : : XN aufweist. Lemma 5.4 Betrachte ein GNEP. Dann gelten: (a) Ist x ein normalisiertes Nash-Gleichgewicht, so ist x auch ein Nash-Gleichgewicht. (b) Ist X D X1 : : : XN (das GNEP also ein NEP), so ist x genau dann ein normalisiertes Nash-Gleichgewicht, wenn x ein Nash-Gleichgewicht ist. Beweis (a) Sei x ein normalisiertes Nash-Gleichgewicht. Dann ist x 2 X und .x ; y/ 0 8y 2 X; per Definition der Nikaido-Isoda-Funktion also N X
Œ .x ; ; x ; / .y ; x ; / 0 8y 2 X:
D1
Speziell für einen Vektor der Gestalt y WD x ;1 ; : : : ; x ;1 ; y ; x ;C1 ; : : : ; x ;N D .y ; x ; / 2 X folgt somit .x ; ; x ; / .y ; x ; / 8y W .y ; x ; / 2 X: Da dies für alle D 1; : : : ; N gilt, handelt es sich bei x somit um ein Nash-Gleichgewicht des GNEPs. (b) Sei X D X1 : : : XN und x 2 X ein Nash-Gleichgewicht des GNEPs bzw. NEPs. Dann ist für alle D 1; : : : ; N .x ; ; x ; / .y ; x ; / 8y 2 X : Wegen der Struktur von X ergibt sich hieraus unmittelbar .x ; y/ D
N X
.x ; ; x ; / .y ; x ; / 0 8y D .y 1 ; : : : ; y N / 2 X:
D1
Speziell für y D x 2 X gilt .x ; x / D 0, so dass wir insgesamt supy2X .x ; y/ D 0 erhalten. Folglich ist x ein normalisiertes Nash-Gleichgewicht.
5.2 Normalisierte Nash-Gleichgewichte
85
Wir zeigen durch das folgende Beispiel aus [8], dass die Umkehrung der Aussage (a) im Lemma 5.4 im Falle von GNEPs im Allgemeinen nicht gilt, sondern hier die Menge der Nash-Gleichgewichtspunkte tatsächlich echt größer sein kann als die Menge der normalisierten Nash-Gleichgewichte. Beispiel Wir betrachten ein GNEP mit zwei Spielern. Spieler 1 hat als Entscheidungsvariable x1 , Spieler 2 die Entscheidungsvariable x2 . Man beachte hier, dass wir untere (statt obere) Indizes in diesem Beispiel verwenden, damit keine Verwechslungen mit auftretenden Quadraten vorkommen können. Die Optimierungsprobleme der beiden Spieler lauten wie folgt:
minx1 u. d. N.
.x1 1/2 x1 C x2 1
minx2 u. d. N.
.x2 12 /2 x1 C x2 1:
Zu gegebenem x D .x1 ; x2 / lauten die zugehörigen Lösungsmengen offenbar ( ( 1 1; falls x2 0; ; falls x1 12 ; S1 .x2 / D S2 .x1 / D 2 1 x2 ; falls x2 0 1 x1 ; falls x1 12 : Nun ist x D .x1 ; x2 / genau dann ein Nash-Gleichgewicht, wenn x1 2 S1 .x2 / und x2 2 S2 .x1 / gelten. Im Hinblick auf die obigen Darstellungen der beiden Lösungsmengen ist dies äquivalent zu ( ( 1 1; falls x2 0; ; falls x1 12 ; x1 D x2 D 2 1 x2 ; falls x2 0; 1 x1 ; falls x1 12 : Hieraus ergibt sich mittels einer einfachen geometrischen Überlegung, vergleiche die Abb. 5.2a, des gegebenen GNEPs ist, wenn x in der Menge dass x˚ genau dann ein Nash-Gleichgewicht
1 S WD .˛; 1 ˛/ j ˛ 2 Œ 2 ; 1 liegt. Insbesondere gibt es also ein ganzes Kontinuum von Lösungen. Auf der anderen Seite ist x 2 X genau dann ein normalisierter Nash-Gleichgewichtspunkt, wenn .x ; y/ 0
8y 2 X
gilt. Gemäß Definition der Nikaido-Isoda-Funktion ist dies äquivalent zu N X
.x ; ; x ; / .y ; x ; / 0
8y 2 X:
D1
Speziell für das gegebene GNEP lässt sich dies schreiben als 1 .x1 ; x2 / 1 .y1 ; x2 / C 2 .x1 ; x2 / 2 .x1 ; y2 / 0
8y W y1 C y2 1:
Dies ist wiederum äquivalent zu 1 1 .x1 1/2 C .x2 /2 .y1 1/2 C .y2 /2 2 2
8y W y1 C y2 1:
Aus dieser Darstellung sowie einer einfachen geometrischen Überlegung, vergleiche dazu die Abb. 5.2b, folgt relativ schnell, dass unser gegebenes GNEP genau einen normalisierten NashGleichgewichtspunkt besitzt, nämlich x WD . 34 ; 14 /.
86
5 Verallgemeinerte Nash-Gleichgewichtsprobleme x2
x2
1 S1 (x2 )
1
1 2
1 2 1 4
1 2
1
Nash-Gleichgewichte
x1 S2 (x1 )
x∗ 3 4
1
x1
normalisiertes Nash-Gleichgewicht
Abb. 5.2 Illustration des Unterschieds zwischen Nash-Gleichgewichten und normalisierten NashGleichgewichten
Wir beschließen diesen Abschnitt mit einer nicht ganz unwichtigen Bemerkung. I Bemerkung 5.5 Betrachte ein beliebiges GNEP mit Auszahlungsfunktionen für D
1; : : : ; N sowie einer gemeinsamen Strategiemenge X Rn . Satz 1.9 gilt dann auch in dieser Situation, d. h. die Menge der Nash-Gleichgewichte des GNEPs ändert sich nicht, .x/ WD r .x/ C .x / ersetzen, wobei r > wenn wir die Abbildungen durch e 0 Konstanten und von x unabhängige Funktionen sind. Der Beweis des Satzes 1.9 überträgt sich nämlich fast wörtlich. Ganz anders sieht dies bei den normalisierten Nash-Gleichgewichten aus. Betrachten wir hierzu noch einmal das vorige Beispiel mit den beiden Auszahlungsfunktionen 1 .x/ WD .x1 1/2 und 2 .x/ WD .x2 12 /2 und dem eindeutig bestimmten normalisierten Nash-Gleichgewichtspunkt x WD . 34 ; 14 /T . Multiplizieren wir 1 mit r1 WD 1 (lassen 1 also unverändert) und 2 mit r2 WD 2, so kann man nachrechnen, dass dieses leicht modifizierte GNEP den eindeutig bestimmten normalisierten Nash-Gleichgewichtspunkt xQ WD . 23 ; 13 /T besitzt, der sich somit von x unterscheidet. Diese Beobachtung führt letztlich auf die Originaldefinition von Rosen [39], wonach x 2 X ein normalisierter (Nash-) Gleichgewichtspunkt des GNEPs mit Auszahlungsfunktionen ist, wenn es Faktoren r > 0 gibt derart, dass x im Sinne der Definition 5.3 ein normalisierter Nash-Gleichgewichtspunkt des GNEPs mit den Auszahlungsfunktionen e WD r ist.
5.3
Charakterisierung normalisierter Nash-Gleichgewichte
In diesem Abschnitt wollen wir eine Charakterisierung der gerade eingeführten Klasse von normalisierten Nash-Gleichgewichten angeben. Insbesondere wird sich herausstellen, dass diese wiederum äquivalent zu einer geeignet definierten Variationsungleichung sind.
5.3 Charakterisierung normalisierter Nash-Gleichgewichte
87
Zu diesem Zweck sei wieder .x; y/ WD
N X
Œ .x ; x / .y ; x /
D1
die Nikaido-Isoda-Funktion. Wegen .x ; x / D 0 für jeden Vektor x 2 X erhalten wir dann die folgenden Äquivalenzen: x ist ein normalisiertes Nash-Gleichgewicht von GNEP ”
sup .x ; y/ D 0 y2X
”
.x ; y/ 0 für alle y 2 X
”
x löst das Problem max .x ; y/
”
x löst das Problem max
N X D1
”
u. d. N. y 2 X
.x ; ; x ; / .y ; x ; / u. d. N. „ ƒ‚ …
y2X
konstant bzgl. y
x löst das Problem max
N X
Œ .y ; x ; /
u. d. N. y 2 X
D1
”
x löst das Problem min
N X
.y ; x ; /
u. d. N. y 2 X:
D1
Damit ist ein Teil des folgenden Resultates bewiesen, das mehrere Charakterisierungen für das Vorliegen von normalisierten Nash-Gleichgewichten angibt. Satz 5.6 Seien die Strategiemenge X Rn nichtleer, abgeschlossen und konvex sowie die Auszahlungsfunktionen .x/ D .x ; x / konvex in x . Dann sind die folgenden Aussagen äquivalent: (a) x ist ein normalisiertes Nash-Gleichgewicht des GNEPs. (b) Es ist supy2X .x ; y/ D 0. (c) x löst das Problem
min y
N X D1
.y ; x ; / u. d. N. y 2 X:
(5.1)
88
5 Verallgemeinerte Nash-Gleichgewichtsprobleme
Sind die Funktionen außerdem stetig differenzierbar und definieren wir 0 1 rx 1 1 .x 1 ; x 1 / B C :: C; F .x/ WD B : @ A rx N N .x N ; x N / so sind (a), (b) und (c) außerdem zu jeder der folgenden Aussagen äquivalent: (d) x löst die Variationsungleichung VIP.X; F /. (e) x ist ein Fixpunkt der Abbildung G.x/ WD PX x F .x/ (mit einem beliebigen > 0). Beweis Die Äquivalenz von (a) und (b) ergibt sich gerade aus der Definition eines normalisierten Nash-Gleichgewichts. Die Übereinstimmung von (b) und (c) dagegen folgt aus dem Vorspann zu diesem Resultat. Sei nun stetig differenzierbar. Dann ist auch f .y/ WD
N X
.y ; x ; /
D1
stetig differenzierbar. Ferner bestätigt man leicht, dass f außerdem eine konvexe Funktion ist. Wegen des Minimumprinzips aus dem Lemma 2.20 gilt daher: x löst das Optimierungsproblem (5.1) ”
x löst das Optimierungsproblem min f .y/
”
u. d. N. y 2 X
x löst die Variationsungleichung VIP(X; rf ):
Wegen rf .y/ D F .y/ folgt daher die Äquivalenz von (c) und (d). Teil (e) wiederum ist wegen Satz 3.6 nur eine Umformulierung von (d). Teil (d) des vorigen Resultats motiviert die ebenfalls gebräuchliche Bezeichnung „variationelles Nash-Gleichgewicht“ für normalisierte Nash-Gleichgewichte. Wir betrachten als Nächstes eine konkrete Darstellung der bislang abstrakten Menge X durch
˚ (5.2) X WD x 2 Rn j g.x/ 0 mit einer stetig differenzierbaren Funktion g W Rn ! Rm derart, dass alle Komponenten gi W Rn ! R konvex sind. Prinzipiell könnten auch (lineare) Gleichheitsrestriktionen zugelassen werden, um aber den schreibtechnischen Aufwand in Grenzen zu halten, verzichten wir an dieser Stelle auf die explizite Betrachtung von Gleichheitsbedingungen.
5.3 Charakterisierung normalisierter Nash-Gleichgewichte
89
Sei nun x 2 X eine Lösung des GNEPs. Per Definition ist x ; für jedes D 1; : : : ; N dann ein Minimum des Problems ˚
min .x ; x ; / u. d. N. x 2 X .x ; / D x j g.x ; x ; / 0 : Sofern eine geeignete Regularitätsbedingung erfüllt ist, genügt x ; den zugehörigen KKT-Bedingungen rx .x ; ; x ; / C rx g.x ; ; x ; /
D 0;
0; g.x ; ; x ; / 0; g.x ; ; x ; /T
D0
(5.3)
für einen gewissen Multiplikator 2 Rm . Auf der anderen Seite können wir auch die KKT-Bedingungen von Problem (5.1) betrachten. Zur Abkürzung verwenden wir die Funktion F aus Satz 5.6. Ist x eine Lösung von (5.1) und ist eine geeignete Regularitätsbedingung erfüllt, so lauten die zugehörigen KKT-Bedingungen F .x / C rg.x / D 0; 0; g.x / 0; g.x /T
D0
(5.4)
mit einem geeigneten Multiplikator 2 Rm . Wegen des Auftretens der Funktion F nennt man diese Bedingungen auch die zu VIP.X; F / gehörigen KKT-Bedingungen, vergleiche Definition 8.26. Hierbei ist 1 0 1 0 rx 1 g.x/ j j C B C B :: C B C rg.x/ D B : A @rx g1 .x/ : : : rx gm .x/A DW @ j j rx N g.x/ mit den partiellen Jacobi-Matrizen rx g.x/ 2 Rn m . Durch Vergleich der beiden KKTBedingungen erhalten wir das folgende Resultat. Satz 5.7 Seien X wie in (5.2) mit g W Rn ! Rm stetig differenzierbar und (komponentenweise) konvex gegeben sowie .x ; x / stetig differenzierbar und konvex in x für alle D 1; : : : ; N . Dann gelten: (a) Sei x eine Lösung von (5.1) derart, dass die KKT-Bedingungen (5.4) gelten. Dann ist x eine Lösung des GNEPs, und die zugehörigen KKT-Bedingungen (5.3) sind mit 1 WD : : : WD N WD erfüllt. (b) Sei umgekehrt x eine Lösung des GNEPs derart, dass die KKT-Bedingungen (5.3) mit 1 D : : : D N gelten. Dann genügt .x ; 1 / den KKT-Bedingungen (5.4) und x ist somit eine Lösung von (5.1).
90
5 Verallgemeinerte Nash-Gleichgewichtsprobleme
Beweis (a) Aus der Gültigkeit von (5.4) folgt durch unmittelbaren Vergleich mit den KKTBedingungen aus (5.3), dass diese mit 1 WD : : : WD N WD ebenfalls gelten. Insbesondere ist x dann eine Lösung des GNEPs, denn aus Konvexitätsgründen sind die KKTBedingungen (5.3) stets hinreichend für das Vorliegen eines Minimums. Alternativ folgt auch aus dem Satz 5.6, dass x zwangsläufig ein (sogar normalisiertes) Nash-Gleichgewicht des GNEPs ist. (b) Sei umgekehrt x eine Lösung des GNEPs derart, dass die zugehörigen KKTBedingungen (5.3) mit 1 D : : : D N gelten. Dann folgt sofort, dass .x ; 1 / auch den KKT-Bedingungen (5.4) genügt. Diese Bedingungen sind aber wieder hinreichend dafür, dass x Lösung von (5.1) ist. Wir illustrieren den Zusammenhang zwischen normalisierten Nash-Gleichgewichten und der Variationsungleichung VIP.X; F / noch durch ein Beispiel. Beispiel Betrachte erneut das vorige Beispiel für ein GNEP mit zwei Spielern. Die Menge der Nash-Gleichgewichte war gegeben durch
˚
1 2
S D .˛; 1 ˛/ j ˛ 2 Œ ; 1 :
In jeder Lösung genügen die Nebenbedingungen von beiden Spielern zum Beispiel der LICQ. Also existieren zugehörige Lagrange-Multiplikatoren 1 .˛/ und 2 .˛/ derart, dass die entsprechenden KKT-Bedingungen erfüllt sind. Mittels elementarer Rechnung erkennt man, dass diese (von ˛ abhängigen) Lagrange-Multiplikatoren gegeben sind durch 1 .˛/ D 2 2˛
und 2 .˛/ D 2˛ 1:
Also existiert genau ein ˛ mit 1 .˛/ D 2 .˛/, nämlich ˛ D 34 . Die zugehörige Lösung des GNEPs ist gerade das normalisierte Nash-Gleichgewicht x D . 34 ; 14 / mit dem Multiplikator D 12 . Betrachte nun die zugehörige Variationsungleichung VIP.X; F / mit ˚ X D .x1 ; x2 / 2 R2 j x1 C x2 1g;
! 2x1 2 : F .x/ WD 2x2 1
Die Abbildung F ist offenbar gleichmäßig monoton, so dass VIP.X; F / wegen Korollar 3.14 genau eine Lösung besitzt. Mittels elementarer Rechnung bestätigt man leicht, dass diese durch x D . 34 ; 14 / gegeben ist. Als zugehörigen Lagrange-Multiplikator erhält man auch hier D 12 .
5.4
Existenz normalisierter Nash-Gleichgewichte
Aus der äquivalenten Formulierung eines GNEPs in Form einer Variationsungleichung im Satz 5.6 erhalten wir in Analogie zum Korollar 3.15 sofort das nachstehende Existenzund Eindeutigkeitsresultat.
5.4 Existenz normalisierter Nash-Gleichgewichte
Korollar 5.8 Seien X Rn nichtleer, abgeschlossen zierbar sowie in x konvex und 0 rx 1 1 .x 1 ; x 1 / B :: F .x/ WD B : @
91
und konvex, stetig differen1 C C: A
rx N N .x N ; x N / Dann gelten die folgenden Aussagen: (a) Ist F pseudomonoton, so ist die Menge aller normalisierten Nash-Gleichgewichte konvex (eventuell leer). (b) Ist F strikt monoton, so existiert höchstens ein normalisiertes Nash-Gleichgewicht. (c) Ist F gleichmäßig monoton, so gibt es genau ein normalisiertes Nash-Gleichgewicht. (d) Ist X kompakt (und F ansonsten beliebig), so gibt es mindestens ein normalisiertes Nash-Gleichgewicht. Wir wollen jetzt noch die Aussage (d) des Korollars 5.8 auf nicht notwendig differenzierbare Auszahlungsfunktionen erweitern. Dies geschieht in dem folgenden Resultat, das als Analogon des Satzes 3.20 von Nikaido-Isoda aufgefasst werden kann. Man beachte in diesem Zusammenhang, dass wir hier einen vollständig anderen Beweis geben als für den Satz 3.20. Satz 5.9 Betrachte ein GNEP mit folgenden Eigenschaften: (a) Die gemeinsame Strategiemenge X Rn ist nichtleer, konvex und kompakt. (b) Die Auszahlungsfunktionen W X ! R sind stetig für alle D 1; : : : ; N . (c) Die Auszahlungsfunktionen . ; x / sind konvex als Abbildung in x (für alle x ). Dann besitzt das GNEP (mindestens) einen normalisierten Nash-Gleichgewichtspunkt. Beweis Sei .x; y/ WD
N X .x ; x / .y ; x / D1
die zugehörige Nikaido-Isoda-Funktion. Gemäß Definition 5.3 gilt für ein x 2 X dann die folgende Aussage: x ist ein normalisiertes Nash-Gleichgewicht ”
sup .x ; y/ D 0 y2X
”
max .x ; y/ D 0; y2X
(5.5)
92
5 Verallgemeinerte Nash-Gleichgewichtsprobleme
denn speziell für den Vektor y WD x wird das Supremum natürlich angenommen. Wir nehmen nun an, dass es kein normalisiertes Nash-Gleichgewicht für unser GNEP gibt. Wegen (5.5) existiert zu jedem x 2 X daher ein y 2 X mit .x; y/ > 0. Die Familie der nach Voraussetzung (b) offenen Mengen ˇ
˚ U.y/ WD x 2 X ˇ .x; y/ > 0 ; y 2 X; bildet somit eine Überdeckung von X, d. h. [ U.y/: XD y2X
Wegen Voraussetzung (a) ist X aber kompakt, so dass bereits r [
XD
U.y j /
(5.6)
j D1
für endlich viele Punkte y 1 ; : : : ; y r 2 X gilt. Zur Anwendung des Fixpunktsatzes von Brouwer konstruieren wir nun eine Abbildung f W X ! X auf die folgende Weise: Setze ˚
dj .x/ WD max 0; .x; y j / 8j D 1; : : : ; r; dj .x/ j .x/ WD Pr i D1 di .x/ und damit schließlich f .x/ WD
8j D 1; : : : ; r
r X
j .x/y j
j D1
für x 2 X. Gemäß Definition ist dj .x/ 0 für alle j D 1; : : : ; r und alle x 2 X. Wegen (5.6) kann außerdem kein x 2 X existieren mit dj .x/ D 0 für alle j D 1; : : : ; r. Folglich sind die Abbildungen j .x/ allesamt wohldefiniert. Wegen j .x/ 0 8j D 1; : : : ; r
und
r X
j .x/ D 1
(5.7)
j D1
für alle x 2 X ist f .x/ stets ein Element der konvexen Hülle von y 1 ; : : : ; y r 2 X und damit selbst in X. Somit gilt tatsächlich f W X ! X. Per Konstruktion bzw. Voraussetzung (b) ist f außerdem stetig und besitzt daher nach dem Fixpunktsatz von Brouwer einen Fixpunkt in X. Es existiert also ein x 2 X mit
x D f .x / D
r X
j .x /y j :
j D1
Nach Voraussetzung (c) sind alle konvex in ihrem Argument x . Daher ist
r X j D1
r X j .x /y j; ; x ; j .x / y j; ; x ; j D1
(5.8)
5.5 Aufgaben
93
für alle D 1; : : : ; N . Wegen x ; D
r X
j .x /y j;
8 D 1; : : : ; N
j D1
nach (5.8) impliziert dies 0 D .x ; x / D
N X
.x ; ; x ; / .x ; ; x ; /
D1 N h r X i X .x ; ; x ; / D j .x /y j; ; x ; j D1
D1
r X
j .x /
j D1
D
r X
N X
.x ; ; x ; / .y j; ; x ; /
D1
j .x / .x ; y j /
j D1
X
D
j .x / .x ; y j /
j Wj .x />0
> 0; wobei einerseits (5.7) und andererseits j .x / > 0 für mindestens einen Index j 2 f1; : : : ; rg ausgenutzt wurde. Ferner ergibt sich die letzte Ungleichung aus der Tatsache, dass j .x / > 0
”
dj .x / > 0
”
.x ; y j / > 0
gemäß Definition von j .x / gilt. Insgesamt folgt aus dem obigen Widerspruch die Aussage, dass unser GNEP doch mindestens einen normalisierten Nash-Gleichgewichtspunkt haben muss.
5.5
Aufgaben
1. Seien F W Rn ! Rn gegeben und KW Rn Rn , wobei der Doppelpfeil andeuten soll, dass es sich bei F um eine mengenwertige Abbildung handelt, also die Bilder K.x/ für jedes x 2 Rn selbst Teilmengen des Rn sind. Unter einer Quasi-Variationsungleichung (engl.: quasi-variational inequality; kurz: QVI) versteht man dann die Aufgabe, ein x 2 Rn zu finden mit x 2 K.x / und F .x /T .x x / 0 8x 2 K.x /:
94
5 Verallgemeinerte Nash-Gleichgewichtsprobleme Speziell für K.x/ K für alle x 2 Rn mit einer nichtleeren, abgeschlossenen und konvexen Menge K reduziert sich eine QVI also auf eine gewöhnliche VI. Zeigen Sie, dass sich ein Spieler-konvexes GNEP mit stetig differenzierbaren Auszahlungsfunktionen äquivalent schreiben lässt als eine QVI.
2. Betrachten Sie nochmals die QVI aus der vorigen Aufgabe, wobei die mengenwertige Abbildung K die Eigenschaft habe, dass ihre Bilder K.x/ abgeschlossene und konvexe Mengen seien (für gewisse x mögen diese Mengen hingegen leer sein). Zeigen Sie, dass x genau dann eine Lösung der QVI ist, wenn x der Fixpunktgleichung x D PK.x/ x F .x/ für ein beliebig gegebenes > 0 genügt. Bemerkung: Diese Fixpunkt-Charakterisierung einer QVI kann sowohl theoretisch (Existenzresultate) als auch numerisch (Fixpunktverfahren) ausgenutzt werden. Auf die numerische Anwendung werden wir in den Aufgaben 2 und 3 in Kap. 7 etwas näher eingehen.
6
Numerische Verfahren für NEPs
In diesem Kapitel betrachten wir ausschließlich Standard-Nash-Gleichgewichtsprobleme, also Spiele mit N Personen, bei dem der -te Spieler das Problem .x ; x / u. d. N. x 2 X min x
zu lösen hat, wobei W Rn ! R die Auszahlungsfunktion und X Rn die Strategiemenge des Spielers 2 f1; : : : ; N g bezeichnet. Wir führen zunächst die in der Praxis sehr beliebten Diagonalisierungsverfahren nach Jacobi1 und Gauß2 -Seidel3 ein. Da die Konvergenztheorie für allgemeine NEPs sehr starke Voraussetzungen benötigt, betrachten wir anschließend noch zwei Variationen des GaußSeidel-Verfahrens für Potentialspiele.
6.1
Diagonalisierung nach Jacobi und Gauß-Seidel
Wir beschreiben in diesem Abschnitt zwei sehr einfache Zugänge zur Lösung dieses Spiels, die eine gewisse Ähnlichkeit mit dem Jacobi- bzw. Gauß-Seidel-Verfahren zur Lösung von linearen Gleichungssystemen besitzen und daher auch deren Namen tragen (in der Literatur ist die Namensgebung allerdings nicht einheitlich). Algorithmus 1 (Diagonalisierungsverfahren nach Jacobi) (S.0) Wähle Startpunkte x 0; 2 X für alle D 1; : : : ; N , setze x 0 WD .x 0;1 ; : : : ; x 0;N / und k WD 0. (S.1) Ist x k ein Nash-Gleichgewicht: STOP 1
Carl Gustav Jacob Jacobi (1804–1851), Mathematiker Carl Friedrich Gauß (1777–1855), Mathematiker und Physiker 3 Ludwig Seidel (1821–1896), Mathematiker und Physiker 2
© Springer Nature Switzerland AG 2018 C. Kanzow, A. Schwartz, Spieltheorie, Mathematik Kompakt, https://doi.org/10.1007/978-3-319-96679-3_6
95
96
6
Numerische Verfahren für NEPs
(S.2) Für alle Spieler D 1; : : : ; N bestimme eine Lösung x kC1; von min .x ; x k; / u. d. N. x 2 X x
(S.3) Setze x kC1
WD x kC1;1 ; : : : ; x kC1;N und k
k C 1; gehe zu (S.1).
Im Diagonalisierungsverfahren nach Jacobi, vergleiche Algorithmus 1, bestimmt jeder Spieler , ausgehend von der aktuellen Iterierten x k , seine beste Antwort x kC1; als Lösung von x k;1 ; : : : ; x k;1 ; x ; x k;C1 ; : : : ; x k;N (6.1) u. d. N. x 2 X : min x
Anschließend werden alle besten Antworten x kC1; in der neuen Iterierten x kC1 gesammelt. In jeder Iteration sind also N Optimierungsprobleme zu lösen. Ein Vorteil dieses Zuganges ist, dass die N Optimierungsprobleme parallel gelöst werden können, zum Beispiel von den einzelnen Spielern. Löst man die N Optimierungsprobleme hingegen sequentiell, so sieht man an der ausgeschriebenen Form (6.1) der Zielfunktion , dass im Allgemeinen nicht die neueste Information benutzt wird. Bei der Bestimmung von x kC1; kennen wir nämlich schon x kC1;1 ; : : : ; x kC1;1 und können diese neueren Werte an Stelle von x k;1 ; : : : ; x k;1 verwenden. Dies ergibt das Diagonalisierungsverfahren nach Gauß-Seidel, vergleiche Algorithmus 2. Algorithmus 2 (Diagonalisierungsverfahren nach Gauß-Seidel) (S.0) Wähle Startpunkte x 0; 2 X für alle D 1; : : : ; N , setze x 0 WD .x 0;1 ; : : : ; x 0;N / und k WD 0. (S.1) Ist x k ein Nash-Gleichgewicht: STOP (S.2) Für alle Spieler D 1; : : : ; N bestimme eine Lösung x kC1; von min x kC1;1 ; : : : ; x kC1;1 ; x ; x k;C1 ; : : : ; x k;N u. d. N. x 2 X (6.2) x
(S.3) Setze x kC1 WD x kC1;1 ; : : : ; x kC1;N und k
k C 1; gehe zu (S.1).
Das Diagonalisierungsverfahren nach Gauß-Seidel ist meist beliebter als jenes nach Jacobi, weshalb wir im Folgenden auch nur einen Konvergenzsatz für den Algorithmus 2 angeben. Entsprechend lässt sich allerdings auch die Konvergenz des Algorithmus 1 nachweisen. Satz 6.1 Sei W Rn ! R stetig differenzierbar und in x konvex für alle D 1; : : : ; N , X Rn nichtleer, konvex und abgeschlossen sowie .x k /k eine durch den Algorithmus 2 erzeugte Folge. Konvergiert die ganze Folge gegen ein x , so ist x D .x ;1 ; : : : ; x ;N / ein Nash-Gleichgewichtspunkt.
6.1 Diagonalisierung nach Jacobi und Gauß-Seidel
97
Beweis Da für alle D 1; : : : ; N die Menge X abgeschlossen ist und x k; 2 X für alle k 2 N gilt, folgt sofort x ; 2 X . Als Lösung des stetig differenzierbaren Optimierungsproblems (6.2) genügt x kC1; der notwendigen Optimalitätsbedingung rx .x kC1;1 ; : : : ; x kC1;1 ; x kC1; ; x k;C1 ; : : : ; x k;N /T .x x kC1; / 0 8x 2 X für D 1; : : : ; N , vergleiche das Minimumprinzip aus dem Lemma 2.20. Der Grenzübergang k ! 1 liefert wegen der vorausgesetzten Konvergenz der gesamten Folge .x k /k gegen x daher rx .x /T .x x ; / 0 8x 2 X : Wegen der Konvexität von als Funktion in x sind dies aber gerade die notwendigen und hinreichenden Optimalitätsbedingungen dafür, dass x ; das Problem .x ; x ; / u. d. N. x 2 X min x
löst. Also ist x D .x
;1
; : : : ; x ;N / ein Nash-Gleichgewichtspunkt.
Es sei an dieser Stelle ausdrücklich darauf hingewiesen, dass in Satz 6.1 die Konvergenz der gesamten Folge .x k /k vorausgesetzt wird. Ist x nur ein Häufungspunkt der Folge .x k /k , so handelt es sich bei x im Allgemeinen nicht um einen Nash-Gleichgewichtspunkt. Ferner sei erwähnt, dass wir hier implizit die Existenz der Folge .x k /k annehmen, was ohne weitere Voraussetzungen (etwa der Kompaktheit aller Mengen X ) auch nicht der Fall sein muss. Zur Illustration der Diagonalisierungsverfahren betrachten wir das folgende konkrete Beispiel eines Oligopols aus [33] (vergleiche auch [37]). Beispiel (konkretes Oligopol-Modell) Betrachte das Oligopol-Modell aus Kap. 1 mit N Unternehmen, wobei Unternehmen das Optimierungsproblem (hier als Minimierungsproblem formuliert)
.x/ u. d. N. min x
mit der Funktion
x 0
X .x/ WD c .x / x p x C x ¤
zu lösen hat. Die Kostenfunktion sei hierbei definiert durch c .x / WD c x C
1Cˇ 1 ˇ L ˇ x ˇ ; 1 C ˇ
während die inverse Nachfragefunktion gegeben ist durch p./ WD
1 ˛ :
98
6
Numerische Verfahren für NEPs
Dabei wird speziell N D 5 gewählt sowie ˛ WD 5000; WD 1;1 und die Parameter c ; ˇ ; L sind in der nachstehenden Tabelle angegeben. c ˇ L
1 10 1;2 5
2 8 1;1 5
3 6 1;0 5
4 4 0;9 5
5 2 0;8 5
Wendet man den Algorithmus 1 auf das konkrete Oligopol-Modell mit dem Startvektor x WD .10; : : : ; 10/T an und benutzt man das (sicherlich verbesserbare) Abbruchkriterium kx kC1 x k k " mit der nicht zu hohen Genauigkeit " WD 105 (da der Algorithmus 1 im Allgemeinen nur sehr langsam konvergiert, sollte man hier keine zu großen Forderungen stellen), so bricht das Verfahren nach 32 Iterationen mit dem Näherungsvektor x .36;933; 41;818; 43;707; 42;659; 39;179/T ab, der in etwa dem in [33] angegebenen Lösungsvektor entspricht. Der Aufwand des Jacobi-Verfahrens ist dabei nicht ganz unerheblich, da in jeder Iteration k insgesamt N (im Beispiel also N D 5) nichtlineare Optimierungsprobleme gelöst werden müssen. Wendet man andererseits den Algorithmus 2 auf das konkrete Oligopol-Modell an und benutzt dabei denselben Startvektor und dasselbe Abbruchkriterium, so benötigt das Diagonalisierungsverfahren von Gauß-Seidel lediglich 20 Iterationen, was eine nicht unerhebliche Verbesserung gegenüber dem Diagonalisierungsverfahren von Jacobi darstellt. Allerdings ist auch das Diagonalisierungsverfahren von Gauß-Seidel mit jeweils N D 5 zu lösenden Optimierungsproblemen pro äußerer Iteration k nicht gerade günstig. 0
6.2 Potentialspiele Wie wir in Satz 6.1 gesehen haben, müssen wir voraussetzen, dass die gesamte von Algorithmus 2 erzeugte Folge .x k /k konvergiert, um garantieren zu können, dass es sich bei dem Grenzwert um ein Nash-Gleichgewicht handelt. Für die Klasse der Potentialspiele, die wir in diesem Abschnitt kurz einführen wollen, sind stärkere Konvergenzresultate möglich. Potentialspiele sind in der Literatur nicht einheitlich definiert. Für unsere Zwecke genügt die nachstehende Definition. Definition 6.2
Ein Nash-Gleichgewichtsproblem D fX ; gN D1 heißt ein Potentialspiel, wenn es n eine stetige Abbildung P W R ! R gibt, so dass für alle D 1; : : : ; N und alle x 2 X gilt .x ; x / .y ; x / D P .x ; x / P .y ; x / 8x ; y 2 X : Die Abbildung P heißt Potentialfunktion des Potentialspiels.
6.3 Konvergenz des Diagonalisierungsverfahrens für zwei Spieler
99
Für alle Spieler kann also der Effekt einer Abweichung von x auf y mit Hilfe der gemeinsamen Potentialfunktion P dargestellt werden. Diese Eigenschaft der Potentialfunktion wird in der nachfolgenden Konvergenztheorie eine erhebliche Rolle spielen. Als Beispiel für ein Potentialspiel betrachte Nash-Gleichgewichtsprobleme D fX ; gN D1 mit Auszahlungsfunktionen der Form .x/ D c.x/ C d .x / 8x 2 Rn
8 D 1; : : : ; N:
Alle Auszahlungsfunktionen besitzen also einen gemeinsamen Term c.x/, der von allen Blöcken x 1 ; : : : ; x N abhängen mag, sowie einen zweiten Term d , der lediglich die Entscheidungsvariablen des Spielers enthält und von Spieler zu Spieler verschieden sein darf. Dann sieht man schnell, dass die Funktion P .x/ WD c.x/ C
N X
d .x /
8x 2 Rn
D1
eine Potentialfunktion von ist. Eine etwas allgemeinere Definition von Potentialspielen findet man in [12]. Dieser Arbeit sind, in stark vereinfachter Form, auch die Konvergenzaussagen der nachfolgenden beiden Abschnitte entnommen.
6.3
Konvergenz des Diagonalisierungsverfahrens von Gauß-Seidel für Potentialspiele mit zwei Spielern
Wir betrachten nun noch einmal das Diagonalisierungsverfahren von Gauß-Seidel, allerdings für den Spezialfall eines Potentialspiels mit N D 2 Spielern. Ähnlich wie schon bei gemischten Strategien für 2-Personen-Spiele bezeichnen wir die Variablenvektoren von Spieler 1 und 2 mit x und y und die zulässigen Mengen mit X und Y . Der Vollständigkeit halber formulieren wir das Gauß-Seidel-Verfahren für zwei Spieler unter Verwendung dieser Notation nochmals in dem folgenden Algorithmus. Algorithmus 3 (Diagonalisierungsverfahren nach Gauß-Seidel für zwei Spieler) (S.0) Wähle einen zulässigen Startpunkt .x 0 ; y 0 / 2 X Y , setze k WD 0. (S.1) Ist .x k ; y k / ein Nash-Gleichgewicht: STOP (S.2) Bestimme eine Lösung x kC1 von min 1 .x; y k / u. d. N. x 2 X: x
(S.3) Bestimme eine Lösung y
kC1
von
min 2 .x kC1 ; y/ y
(S.4) Setze k
k C 1; gehe zu (S.1).
u. d. N.
y 2 Y:
100
6
Numerische Verfahren für NEPs
Im nachstehenden Konvergenzsatz wird implizit wieder davon ausgegangen, dass das Abbruchkriterium nie erfüllt ist und die beiden zu lösenden Teilprobleme stets ein Minimum besitzen. Hingegen verlangt der Konvergenzsatz keinerlei Konvexitäts-Voraussetzung, geht allerdings davon aus, dass wir für beide Spieler tatsächlich in der Lage sind, eine Lösung x kC1 , y kC1 im Sinne eines globalen Minimums zu bestimmen. Satz 6.3 Betrachte ein Potentialspiel mit N D 2 Spielern und stetiger Potentialfunktion P sowie abgeschlossenen Mengen X; Y . Dann ist jeder Häufungspunkt .x ; y / einer durch Algorithmus 3 erzeugten Folge .x k ; y k /k ein Nash-Gleichgewicht. Beweis Gemäß Konstruktion im Algorithmus 3 gilt 1 .x kC1 ; y k / 1 .x; y k / 2 .x
kC1
;y
kC1
/ 2 .x
kC1
; y/
8x 2 X;
(6.3)
8y 2 Y:
(6.4)
Insbesondere liefert dies 1 .x kC1 ; y k / 1 .x k ; y k /
und 2 .x kC1 ; y kC1 / 2 .x kC1 ; y k /
für alle k 2 N. Aus der Definition der Potentialfunktion folgt daher P .x k ; y k / P .x kC1 ; y k / D 1 .x k ; y k / 1 .x kC1 ; y k / 0; P .x kC1 ; y k / P .x kC1 ; y kC1 / D 2 .x kC1 ; y k / 2 .x kC1 ; y kC1 / 0 für alle k 2 N. Zusammen impliziert dies P .x kC1 ; y kC1 / P .x kC1 ; y k / P .x k ; y k /;
(6.5)
insbesondere also die Monotonie der gesamten Folge .P .x k ; y k //k . Sei nun .x k ; y k /k2K mit einer unendlichen Teilmenge K N eine gegen den Häufungspunkt .x ; y / konvergente Teilfolge. Aus (6.5) und Stetigkeitsgründen existiert dann der (endliche) Grenzwert lim P .x k ; y k / D lim P .x kC1 ; y k / D P .x ; y /:
k!1
k!1
(6.6)
Wir wollen zeigen, dass .x ; y / ein Nash-Gleichgewicht ist, also 1 .x ; y / 1 .x; y / 8x 2 X
2 .x ; y / 2 .x ; y/
8y 2 Y
und
(6.7) (6.8)
6.3 Konvergenz des Diagonalisierungsverfahrens für zwei Spieler
101
gilt. Der Beweis geschieht durch Widerspruch. Nehmen wir zunächst an, dass (6.7) nicht O y / < 1 .x ; y /. Aus der Definition der Potengelte. Dann existiert ein xO 2 X mit 1 .x; tialfunktion folgt P .x; O y / P .x ; y / < 0:
(6.9)
O y k / und somit Wegen (6.3) ist andererseits 1 .x kC1 ; y k / 1 .x; P .x; O y k / P .x kC1 ; y k / 0:
(6.10)
Verwenden wir (6.6) und lassen k !K 1 in (6.10) gehen, so folgt O y k / P .x kC1 ; y k / 0: P .x; O y / P .x ; y / D lim P .x; k2K
Dies steht aber im Widerspruch zu (6.9). Auf ähnliche Weise zeigen wir, dass auch die Eigenschaft (6.8) erfüllt ist. AngenomO < 2 .x ; y /. Dann wäre auch men, es gäbe ein yO 2 Y mit 2 .x ; y/ O P .x ; y / < 0: P .x ; y/
(6.11)
O woraus sich wiederum P .x k ; y/ O Wegen (6.4) ist andererseits 2 .x k ; y k / 2 .x k ; y/, k k P .x ; y / 0 ergäbe. Indem wir den Grenzwert k ! 1 auf der Teilfolge K nehmen, O P .x ; y / 0, was den gewünschten Widerspruch zu erhielten wir somit P .x ; y/ (6.11) liefert. Der obige Beweis funktioniert für mehr als zwei Spieler nicht mehr. Für N D 3 Spieler müsste man zum Nachweis, dass ein Häufungspunkt .x ; y ; z / tatsächlich ein NashO z k / bestimGleichgewicht ist, für einen Vergleichswert yO den Grenzwert von P .x kC1 ; y; men. Man weiß aber nur, dass .x k ; y k ; z k /k auf einer Teilfolge K N gegen .x ; y ; z / konvergiert. Wir betrachten zum Abschluss dieses Abschnitts noch ein Gegenbeispiel aus [12], wonach die Aussage des vorigen Resultats für mehr als zwei Spieler tatsächlich nicht mehr gelten muss. Beispiel Wir betrachten ein NEP mit N D 3 Spielern. Jeder Spieler verfügt über genau eine Variable, die wir daher einfach mit x; y und z bezeichnen. Entsprechend heißen die zulässigen Mengen X; Y und Z. Diese seien gegeben durch X D Y D Z WD Œ10; C10 . Die Zielfunktionen seien allesamt identisch mit 1 D 2 D 3 DW , wobei W R3 ! R gegeben ist durch
.x; y; z/ WD xy yz xz C .x 1/2C C .x 1/2C C .y 1/2C C .y 1/2C C .z 1/2C C .z 1/2C ;
102
6
Numerische Verfahren für NEPs
wobei wir aC WD max f0; ag für ein beliebiges a 2 R schreiben. Ganz offensichtlich handelt es sich somit um ein Potentialspiel. Wir wenden nun das Gauß-Seidel-Verfahren an mit dem Startwert 0 0 0 1 1 x ; y ; z WD 1 "; 1 C "; 1 " ; 2 4 wobei " > 0 klein sei (formal genügt " 2 .0; 8 , um die Zulässigkeit zu garantieren). Nach einiger Rechnung sieht man, dass die ersten sechs Iterierten gegeben sind durch 0
0 0 1 1 1 1 C 18 " 1 C 18 " 1 C 18 " B B B C 1 C 1 C "A ! @1 16 "A @ 1 C 12 " A ! @1 16 1 1 1 1 4 " 1 4 " 1 C 32 " 1 1 1 0 0 0 1 1 1 " " " 1 64 1 64 1 64 C C B B B 1 C 1 1 ! @1 16 "A ! @ 1 C 128 " A ! @ 1 C 128 " A: 1 1 1 1 C 32 " 1 C 32 " 1 256 " Dieser letzte Punkt stimmt aber mit dem Startpunkt überein, wenn man dort " durch Durch Fortsetzung des Verfahrens erhält man daher die sechs Häufungspunkte 0
1 1 B C @ 1A ; 1
0
1 1 B C @1A ; 1
0
1 1 B C @1A ; 1
0
1 1 B C @1A ; 1
0
1 1 B C @ 1A ; 1
1 64 "
ersetzt.
0 1 1 B C @ 1A : 1
Wie man sich leicht überzeugt, ist jedoch keiner dieser Häufungspunkte ein Nash-Gleichgewicht.
6.4 Ein regularisiertes Diagonalisierungsverfahren für Potentialspiele mit mehr als zwei Spielern Wir betrachten wieder ein Nash-Gleichgewichtsproblem der Gestalt .x ; x / u. d. N. x 2 X min x
für jeden Spieler D 1; : : : ; N , wobei in diesem Abschnitt explizit der Fall N > 2 erlaubt sei. Die Diagonalisierungsverfahren nach Jacobi und Gauß-Seidel sind dann, wie wir gesehen haben, im Allgemeinen nicht konvergent, auch nicht für die Klasse der Potentialspiele. Wir modifizieren in diesem Abschnitt die Diagonalisierungsverfahren geringfügig und zeigen, dass man auf diese Weise unter gewissen Voraussetzungen ein konvergentes Verfahren erhält. Der folgende Algorithmus beschreibt ein Gauß-Seidel-artiges Verfahren, bei dem zu jeder Zielfunktion ein quadratischer Regularisierungsterm in x addiert wird. Diese vermeintlich geringe Modifikation des üblichen Gauß-Seidel-Verfahrens hat erhebliche Auswirkungen auf (die Wohldefiniertheit und) das Konvergenzverhalten des Verfahrens.
6.4 Ein regularisiertes Diagonalisierungsverfahren für Potentialspiele
103
Algorithmus 4 (Regularisiertes Diagonalisierungsverfahren nach Gauß-Seidel) (S.0) Wähle Startpunkte x 0; 2 X für alle D 1; : : : ; N und einen Regularisierungsparameter > 0, setze x 0 WD .x 0;1 ; : : : ; x 0;N / und k WD 0. (S.1) Ist x k ein Nash-Gleichgewicht: STOP (S.2) Für alle Spieler D 1; : : : ; N bestimme eine Lösung x kC1; von min x kC1;1 ; : : : ; x kC1;1 ; x ; x k;C1 ; : : : ; x k;N C kx x k; k2 x
x 2 X WD x kC1;1 ; : : : ; x kC1;N und k
u. d. N. (S.3) Setze x kC1
k C 1; gehe zu (S.1).
Wir werden insbesondere voraussetzen, dass die Zielfunktionen .:; x / als Funktion von x konvex und die zulässigen Mengen X Rn nichtleer, abgeschlossen und konvex sind. Damit sind alle im Algorithmus 4 auftretenden Zielfunktionen aufgrund des quadratischen Regularisierungsterms gleichmäßig konvex. Folglich besitzen die auftretenden Optimierungsprobleme für jeden Spieler eine eindeutig bestimmte Lösung x kC1; , vergleiche Korollar 3.16 und anschließende Bemerkung. Daher ist der Algorithmus 4 wohldefiniert. Nach diesen Vorbemerkungen kommen wir zum eigentlichen Konvergenzsatz. Satz 6.4 Gegeben sei ein Potentialspiel D fX ; gN D1 mit stetig differenzierbaren und in x konvexen Funktionen sowie nichtleeren, abgeschlossenen und konvexen Mengen X , D 1; : : : ; N . Sei > 0 beliebig. Dann ist jeder Häufungspunkt x einer durch den Algorithmus 4 erzeugten Folge .x k /k ein Nash-Gleichgewicht des gegebenen Potentialspiels. Beweis Zur Vereinfachung der Notation führen wir die Hilfsvektoren xk;C1 WD x kC1;1 ; : : : ; x kC1; ; x k;C1 ; : : : ; x k;N ein, bei denen wir zur besseren Unterscheidung bewusst untere Indizes verwenden. Insbesondere gilt also xk; D x kC1;1 ; : : : ; x kC1;1 ; x k; ; : : : ; x k;N ; xk;1 D x k ; xk;N C1 D x kC1 : Per Konstruktion gilt xk; 2 X1 : : :XN für alle ; k. Unter Verwendung dieser Notation folgt aus Algorithmus 4 unmittelbar x kC1; ; xk; (6.12) x k; ; xk; kx kC1; x k; k2 8k; :
104
6
Numerische Verfahren für NEPs
Für die zugehörige Potentialfunktion P gilt deshalb insbesondere P x kC1; ; xk; P x k; ; xk; 0 8k; : Wegen xk; D x k; ; xk; ; xk;C1 D x kC1; ; xk; lässt sich dies schreiben als P .xk;C1 / P .xk; /
8k; :
Sukzessive ergibt sich hieraus P .x kC1 / D P .xk;N C1 / : : : P .xk; / : : : P .xk;1 / D P .x k /:
(6.13)
Damit ist die gesamte Folge .P .x k //k monoton fallend. Bezeichnen wir mit .x k /K eine gegen den Häufungspunkt x konvergente Teilfolge, so gilt also PN WD P .x / D lim P .x k / D lim P .xk; / 8 D 1; : : : ; N k!1
k!1
aufgrund von (6.13). Aus der Definition einer Potentialfunktion erhält man daher lim x k; ; xk; x kC1; ; xk; D 0:
k!1
Wegen (6.12) erhalten wir somit lim kx kC1; x k; k D 0
k!1
8 D 1; : : : ; N:
(6.14)
Aus .x k /k2K ! x folgt dann auch lim xk; D x
k2K
8 D 1; : : : ; N:
Da alle X abgeschlossen sind, gilt zumindest x ; 2 X für alle D 1; : : : ; N . Zu zeigen bleibt die Optimalität, also .x ; ; x ; / .x ; x ; / 8x 2 X für alle Spieler D 1; : : : ; N . Angenommen, es gäbe ein 2 f1; : : : ; N g und ein y ; 2 X mit der Eigenschaft .y ; ; x ; / < .x ; ; x ; /. Für d WD y ; x ; gilt dann wegen Satz 2.3 und der vorausgesetzten Konvexität von als Funktion von x rx .x ; ; x ; /T d .y ; ; x ; / .x ; ; x ; / < 0:
(6.15)
Andererseits ergibt sich aus den Optimalitätsbedingungen für das Minimierungsproblem des Spielers im Algorithmus 4 die Gültigkeit von T T x x kC1; C 2 x kC1; x k; x x kC1; 0 8x 2 X : rx x kC1; ; xk;
6.5 Aufgaben
105
Setzen wir hierin speziell x D y ; 2 X , so erhalten wir ; T T y x kC1; C 2 x kC1; x k; y ; x kC1; 0: rx x kC1; ; xk; Aus Stetigkeitsgründen ergibt sich durch den Grenzübergang k ! 1 auf der Teilfolge K daher rx .x ; ; x ; /T .y ; x ; / 0, wobei wir (6.14) verwendet haben. Wegen d D y ; x ; steht dies aber im Widerspruch zu (6.15).
6.5
Aufgaben
1. Implementieren Sie die Algorithmen 1 und 2 und testen Sie diese an dem konkreten OligopolModell sowie an mindestens einem weiteren Beispiel Ihrer Wahl. Testen Sie verschiedene Startvektoren und Abbruchkriterien. Wieviele (äußere) Iterationen werden jeweils benötigt? 2. Betrachten Sie ein Potentialspiel D fX ; gN D1 mit Auszahlungsfunktionen .x/ WD c.x/ C d .x / 8 D 1; : : : ; N; wobei alle Funktionen c; d stetig differenzierbar und (in ihren jeweiligen Variablen) konvex sowie die zulässigen Mengen X nichtleer, abgeschlossen und konvex seien. Mit P .x/ WD c.x/ C
N X
d .x /
D1
bezeichnen wir die aus dem Abschn. 6.2 bekannte Potentialfunktion. Zeigen Sie, dass x genau dann ein Nash-Gleichgewicht von ist, wenn x ein Minimum der konvexen Funktion P ist (dies motiviert insbesondere den Begriff eines Potentialspiels). Verwenden Sie diese Beobachtung, um damit (neue) Existenzresultate für Potentialspiele herzuleiten. 3. Verifizieren Sie detailliert alle einzelnen Schritte im Gegenbeispiel aus dem Abschn. 6.3.
7
Numerische Verfahren für GNEPs
In diesem Kapitel betrachten wir zunächst verallgemeinerte Nash-Gleichgewichtsprobleme der Form .x ; x / u. d. N. .x ; x / 2 X: min x
Wir gehen also davon aus, dass die Strategiemengen aller Spieler von der Form X .x / D fx j .x ; x / 2 Xg mit einer gemeinsamen nichtleeren, abgeschlossenen und konvexen Menge X Rn sind. In der Literatur werden derartige GNEPs häufig als jointly convex bezeichnet. Wir entwickeln zunächst Verfahren zur Bestimmung normalisierter Nash-Gleichgewichte. In Abschn. 7.5 betrachten wir dann die allgemeinere Klasse der Spieler-konvexen GNEPs und entwickeln ein Multiplier-Penalty-Verfahren. Alle in diesem Kapitel beschriebenen Verfahren sind natürlich auch auf gewöhnliche Nash-Gleichgewichtsprobleme anwendbar. Wir werden uns in diesem Kapitel, wie auch in den beiden anderen numerischen Kapiteln, darauf beschränken, Spiele derart umzuformulieren, dass die Teilprobleme in den resultierenden Algorithmen mit Methoden aus der nichtlinearen Optimierung gelöst werden können. Auf die hierfür jeweils möglichen Optimierungsverfahren wollen wir an dieser Stelle nicht weiter eingehen, sondern verweisen auf Bücher wie [17, 42].
© Springer Nature Switzerland AG 2018 C. Kanzow, A. Schwartz, Spieltheorie, Mathematik Kompakt, https://doi.org/10.1007/978-3-319-96679-3_7
107
108
7.1
7
Numerische Verfahren für GNEPs
Die Nikaido-Isoda-Funktion und ein Relaxationsverfahren
Gegeben seien eine gemeinsame Strategiemenge X Rn aller Spieler D 1; : : : ; N , die als nichtleer, kompakt1 und konvex vorausgesetzt werde. Die Auszahlungsfunktion von Spieler sei wieder mit bezeichnet und zumindest stetig. Das von jedem Spieler zu lösende Optimierungsproblem lautet dann .x ; x / u. d. N. .x ; x / 2 X: min x
Mit .x; y/ WD
N X
Œ .x ; x / .y ; x /
D1
bezeichnen wir wieder die zugehörige Nikaido-Isoda-Funktion, vergleiche Definition 5.3. Mittels der Nikaido-Isoda-Funktion definieren wir nun V .x/ WD max .x; y/; y2X
x 2 X:
Wegen der vorausgesetzten Stetigkeit aller ist auch die Nikaido-Isoda-Funktion stetig (insbesondere stetig als Funktion in y), so dass die Kompaktheit von X garantiert, dass es zu jedem x 2 X stets mindestens ein yx 2 X gibt mit V .x/ D x; yx . Mit ˇ
˚ y.x/ WD yx 2 X ˇ V .x/ D .x; yx /
(7.1)
bezeichnen wir für jedes x 2 X die Menge aller Punkte in X, in denen das Maximum in der Definition von V .x/ angenommen wird. Man beachte hierbei, dass diese Menge im Allgemeinen nicht einelementig sein wird. Die wesentlichen Eigenschaften von V sind im folgenden Resultat enthalten. Satz 7.1 Betrachte das GNEP mit X Rn nichtleer, kompakt und konvex sowie stetig und, als Funktion von x , konvex. Dann gelten die folgenden Aussagen: (a) V .x/ 0 für alle x 2 X. (b) x ist genau dann ein normalisiertes Nash-Gleichgewicht, wenn x 2 X ein globales Minimum von V auf X ist mit V .x / D 0.
1
Es wird gleich klar werden, warum wir in diesem Abschnitt die Menge X sogar als kompakt (und nicht nur als abgeschlossen) voraussetzen. Die folgenden Abschnitte werden dann wieder mit lediglich abgeschlossenen Mengen X arbeiten.
7.1 Die Nikaido-Isoda-Funktion und ein Relaxationsverfahren
109
Beweis (a) Für alle x 2 X gilt V .x/ D max .x; y/ .x; x/ D 0; y2X
womit (a) auch schon bewiesen ist. (b) Sei x zunächst ein normalisierter Nash-Gleichgewichtspunkt. Per Definition ist dann x 2 X und maxy2X .x ; y/ D 0. Dies impliziert unmittelbar V .x / D maxy2X .x ; y/ D 0. Sei umgekehrt x 2 X mit V .x / D 0 gegeben. Dann ist .x ; y/ 0 8y 2 X: Andererseits ist .x ; x / D 0, also maxy2X .x ; y/ D 0. Gemäß Definition 5.3 handelt es sich bei x daher um ein normalisiertes Nash-Gleichgewicht. Wegen des Satzes 7.1 kann man ein Nash-Gleichgewicht x also als globales Minimum des restringierten Optimierungsproblems min V .x/ u. d. N.
x2X
berechnen. Einfache Beispiele zeigen jedoch, dass die Zielfunktion V im Allgemeinen nicht differenzierbar ist, was letztlich an der Mehrelementigkeit der Menge y.x/ liegt. Im nächsten Abschnitt wird gezeigt, wie man dies umgehen kann. Wir wollen aber noch eine Weile in diesem Abschnitt bleiben und geben mittels der mengenwertigen Abbildung x 7! y.x/ noch eine Fixpunktcharakterisierung von normalisierten Nash-Gleichgewichtspunkten an. Lemma 7.2 Betrachte ein GNEP mit einer nichtleeren, kompakten und konvexen Strategiemenge X Rn sowie stetigen Auszahlungsfunktionen , die bzgl. x konvex seien. Dann ist x genau dann ein normalisierter Nash-Gleichgewichtspunkt, wenn x 2 y.x / gilt, wobei die Menge y.x / wie in (7.1) definiert sei. Beweis Sei x zunächst ein normalisierter Nash-Gleichgewichtspunkt. Per Definition ist dann maxy2X .x ; y/ D 0. Andererseits gilt offenbar .x ; x / D 0. Also ist x 2 y.x /. Der Beweis der Umkehrung geschieht auf analoge Weise. Nehmen wir im Folgenden an, dass die Menge y.x/ für jedes x 2 X einelementig ist. Wegen Lemma 7.2 ist x genau dann ein normalisierter Nash-Gleichgewichtspunkt, wenn x D y.x / gilt. (Eigentlich müssten wir hier fx g D y.x / schreiben, was wir aber zur Vereinfachung der Notation nicht tun wollen.) Dies motiviert das einfache Fixpunktverfahren x kC1 WD y.x k / als Iterationsvorschrift zur Bestimmung eines normalisierten
110
7
Numerische Verfahren für GNEPs
Nash-Gleichgewichtes. In [43] (siehe auch [28] für eine Modifikation) wird die relaxierte Variante x kC1 WD .1 tk /x k C tk y.x k /
(7.2)
betrachtet, bei der mittels einer Schrittweite tk 2 .0; 1 die neue Iteratierte x kC1 als Konvexkombination aus der alten Iterierten x k mit dem Element y.x k / entsteht. Der Spezialfall tk D 1 liefert gerade die obige Fixpunktiteration. Die Vorschrift (7.2) wird in der Literatur als das Relaxationsverfahren2 zur Lösung von GNEPs bezeichnet. Unter einer Reihe von zum Teil recht technischen Bedingungen wird in [43] gezeigt, dass jede durch das Relaxationsverfahren erzeugte Folge .x k /k gegen einen normalisierten Nash-Gleichgewichtspunkt konvergiert, sofern die Schrittweiten tk so gewählt werden, dass tk 2 .0; 1 8k 2 N;
tk # 0;
1 X
tk D 1
kD0 1 gilt. Dies motiviert die Wahl von der harmonischen Folge tk WD kC1 für alle k 2 N. In der Praxis erweist es sich meist aber als vorteilhaft, zu Beginn relative große Schrittweiten tk zu wählen, etwa
( tk WD
t; t
1 ; kk0
falls k k0 ; falls k > k0
für eine Konstante t 2 .0; 1 und ein k0 2 N. Relativ gut bewährt hat sich beispielsweise t D 0;5 und k0 D 40, so dass in den ersten 40 Iterationen die konstante Schrittweite tk D 0;5 gewählt wird, bevor sie allmählich verkleinert wird. Beispiel Betrachte das GNEP aus dem Flussverschmutzungsbeispiel aus Kap. 5 mit den dort spezifizierten Daten. Anwendung des Relaxationsverfahrens mit dem Startvektor x 0 WD .0; 0; 0/T und dem durch den Satz 7.1 motivierten Abbruchkriterium V .x k / " mit " WD 108 liefert nach 34 Iterationen die Näherungslösung x .21;144; 16;028; 2;726/T , welche ziemlich exakt jener Lösung entspricht, die auch in der Arbeit [28] angegeben wird.
Vergleicht man das Relaxationsverfahren mit den beiden Diagonalisierungsverfahren aus dem vorigen Abschnitt, so muss zunächst festgehalten werden, dass es nicht nur auf das übliche Nash-Gleichgewichtsproblem, sondern sogar auf ein GNEP anwendbar ist. Außerdem wird pro Iteration nur ein einziges Optimierungsproblem gelöst. Allerdings ist auch das Relaxationsverfahren im Allgemeinen nur relativ langsam konvergent. Zudem hängt die Konvergenz relativ stark von der (letztlich weitgehend heuristischen) Wahl der 2 In der Theorie der Fixpunktverfahren spricht man auch von der Krasnoselskii-Mann-Iteration, vergleiche [3].
7.2 Die regularisierte Nikaido-Isoda-Funktion
111
Schrittweite tk ab. In [28] wird zwar eine optimale Schrittweite untersucht, deren Berechnung in der Praxis allerdings dafür sorgt, dass pro Iteration wieder mehrere nichtlineare Optimierungsprobleme gelöst werden müssen.
7.2 Die regularisierte Nikaido-Isoda-Funktion Wir betrachten weiterhin das verallgemeinerte Nash-Gleichgewichtsproblem mit N Spielern, einer gemeinsamen Strategiemenge X Rn , die jetzt wieder als nichtleer, abgeschlossen (statt kompakt) und konvex angenommen wird, sowie Auszahlungsfunktionen W Rn ! R für D 1; : : : ; N . Das Optimierungsproblem des -ten Spielers lautet also: min .x ; x / u. d. N. .x ; x / 2 X: x
Hierbei seien die Funktionen wieder stetig und, bezüglich der Variablen x , konvex. Wir folgen nun einer Idee aus [18, 21] und betrachten für einen festen Parameter ˛ > 0 die so genannte regularisierte Nikaido-Isoda-Funktion N h i X ˛ .x ; x / .y ; x / kx y k2 : ˛ .x; y/ WD 2 D1
Analog zur Konstruktion im vorigen Abschnitt definieren wir mittels dieser regularisierten Nikaido-Isoda-Funktion die Abbildung V˛ .x/ WD max ˛ .x; y/ y2X
N h i X ˛ .x ; x / .y ; x / kx y k2 y2X 2 D1 h i ˛ D max .x; y/ kx yk2 ; y2X 2
D max
wobei .x; y/ die übliche Nikaido-Isoda-Funktion bezeichnet. Wegen der Konvexität von als Funktion in x ist die Abbildung y 7! .x; y/ für jedes feste x offenbar konkav, also die Abbildung y 7! .x; y/
˛ kx yk2 2
gleichmäßig konkav. Wegen Korollar 3.16 und anschließender Bemerkung existiert zu jedem festen x daher genau ein Maximum y˛ .x/. Daher ist die Abbildung V˛ .x/ (auch bei nicht notwendig kompaktem X) stets wohldefiniert, und wir haben V˛ .x/ D max ˛ .x; y/ D ˛ x; y˛ .x/ y2X
112
7
Numerische Verfahren für GNEPs
mit dem gerade eingeführten Maximum y˛ .x/. Das folgende Resultat ist nun analog zum Satz 7.1 für die regularisierte Nikaido-Isoda-Funktion. Satz 7.3 Betrachte ein GNEP mit einer nichtleeren, abgeschlossenen und konvexen Strategiemenge X Rn sowie stetigen Auszahlungsfunktionen , die bzgl. x konvex seien. Dann gelten die folgenden Aussagen: (a) Es ist V˛ .x/ 0 für alle x 2 X. (b) x ist genau dann ein normalisiertes Nash-Gleichgewicht, wenn x ein globales Minimum von V˛ auf X ist mit V˛ .x / D 0. Beweis (a) Für alle x 2 X gilt V˛ .x/ D max ˛ .x; y/ ˛ .x; x/ D 0; y2X
womit Teil (a) bereits bewiesen ist. (b) Sei x 2 X zunächst ein normalisiertes Nash-Gleichgewicht. Dann ist x 2 X und supy2X .x ; y/ D 0. Also gilt .x ; y/ 0 für alle y 2 X, woraus ˛ .x ; y/ D .x ; y/
˛ kx yk2 .x ; y/ 0 8y 2 X 2
folgt. Hieraus folgt V˛ .x / D maxy2X ˛ .x ; y/ 0. Zusammen mit Teil (a) erhalten wir somit V˛ .x / D 0. Sei umgekehrt x 2 X mit V˛ .x / D 0 gegeben. Dann ist ˛ .x ; y/ 0 8y 2 X:
(7.3)
Angenommen, es existiert ein Vektor yO 2 X mit .x ; y/ O > 0. Dann ist x C.1/yO 2 X für alle 2 .0; 1/. Aus der offensichtlichen Konkavität der Abbildung y 7! .x ; y/ ergibt sich daher für alle 2 .0; 1/ O D .1 / .x ; y/ O > 0: x ; x C .1 /yO .x ; x / C .1 / .x ; y/ Dies impliziert ˛ O 2 kx x .1 /yk 2 ˛ D .x ; x C .1 /y/ O .1 /2 kx yk O 2 2 ˛ .1 / .x ; y/ O .1 /2 kx yk O 2 2 >0
˛ .x ; x C .1 /y/ O D .x ; x C .1 /y/ O
für alle 2 .0; 1/ hinreichend nahe bei 1, im Widerspruch zu (7.3).
7.2 Die regularisierte Nikaido-Isoda-Funktion
113
Wegen des Satzes 7.3 können wir das Nash-Gleichgewichtsproblem wiederum äquivalent schreiben als das globale restringierte Minimierungsproblem min V˛ .x/ x
u. d. N.
x 2 X:
(7.4)
Dabei handelt es sich sogar um ein stetig differenzierbares Problem, wie wir im Folgenden noch andeuten wollen. Als wichtiges Hilfsmittel benötigen wir hierzu das nachstehende Resultat. Satz 7.4 (Satz von Danskin) Sei X Rn nichtleer, abgeschlossen und konvex, f W X X ! R stetig differenzierbar auf einer offenen Obermenge von X X und f .x; y/ für jedes feste x 2 X gleichmäßig konkav in y. Dann existiert zu jedem x 2 X ein eindeutig bestimmtes Element H.x/ 2 X mit f x; H.x/ D max f .x; y/: y2X
Ist die hierdurch definierte Abbildung x 7! H.x/ stetig, so ist die durch g.x/ WD max f .x; y/ D f x; H.x/ y2X
definierte Funktion g W X ! R stetig differenzierbar mit rg.x/ D rx f .x; yx /; wobei yx D H.x/ gesetzt wurde. Beweis Wir zeigen zunächst die Richtungsdifferenzierbarkeit von g. Seien dazu x 2 X und d 2 Rn n f0g beliebig. Aus der Definition von g.x/ und H.x/ folgt dann g.x C td / g.x/ f x C td; H.x/ f x; H.x/ 8 t > 0: Division durch t > 0 und anschließender Grenzübergang t # 0 liefert dann lim inf t #0
T g.x C td / g.x/ rx f x; H.x/ d; t
(7.5)
wobei wir berücksichtigt haben, dass die Funktion f (als Abbildung der ersten Variablen) stetig differenzierbar und somit insbesondere richtungsdifferenzierbar mit der auf der rechten Seite angegebenen Richtungsableitung ist. Auf ähnliche Weise erhalten wir die Ungleichung g.x C td / g.x/ f x C td; H.x C td / f x; H.x C td / 8 t > 0: (7.6)
114
7
Numerische Verfahren für GNEPs
Nach dem Mittelwertsatz der Differentialrechnung existiert zu jedem t > 0 ein Zwischenpunkt t 2 .x; x C td / mit T f x C td; H.x C td / f x; H.x C td / D trx f t ; H.x C td / d: Dividiert man (7.6) durch t > 0, so folgt daher T g.x C td / g.x/ rx f t ; H.x C td / d: t Für t # 0 liefert die stetige Differenzierbarkeit von f dann lim sup t #0
T g.x C td / g.x/ rx f x; H.x/ d; t
(7.7)
da offensichtlich t ! x für t # 0 gilt (hierbei haben wir auch die vorausgesetzte Stetigkeit von H ausgenutzt). Wegen (7.5) und (7.7) müssen lim inf und lim sup gleich sein, so dass g richtungsdifferenzierbar im Punkt x in Richtung d ist mit T g 0 .xI d / D rx f x; H.x/ d: Da d beliebig gewählt war, folgt hieraus rg.x/ D rx f x; H.x/ . Da f nach Voraussetzung jedoch stetig differenzierbar und auch H noch stetig ist, ergibt sich unmittelbar die stetige partielle Differenzierbarkeit von g, die wiederum äquivalent ist mit der stetigen Differenzierbarkeit von g. Mittels des Satzes 7.4 sind wir nun in der Lage, die angekündigte (stetige) Differenzierbarkeit von V˛ zu beweisen. Satz 7.5 Sei X Rn nichtleer, abgeschlossen und konvex sowie stetig differenzierbar und, als Funktion in x , konvex. Dann ist V˛ stetig differenzierbar mit ˇ rV˛ .x/ D rx ˛ .x; y/ˇyDy˛ .x/
0
1 1 1 r / 1 1 .y˛ .x/; x x N X C B :: C D r .x ; x / r .y˛ .x/; x / C B : @ A D1 rx N N .y˛N .x/; x N / ˛.x y˛ .x//:
Beweis Wir haben schon vorher bemerkt, dass die Abbildung y 7! ˛ .x; y/ für jedes feste x gleichmäßig konkav ist. Die stetige Differenzierbarkeit von V˛ ist daher eine unmittelbare Konsequenz des Satzes 7.4 von Danskin. Die dabei benutze Stetigkeit der Abbildung
7.2 Die regularisierte Nikaido-Isoda-Funktion
115
x 7! y˛ .x/ ergibt sich aus allgemeinen Resultaten der Sensitivitätsanalyse, auf die an dieser Stelle nicht näher eingegangen werden soll, siehe etwa [22, Korollar 8.1 und 9.1]. Die explizite Formel für die Ableitung folgt schließlich aus dem Satz 7.4 von Danskin und elementaren Ableitungsregeln. Für spätere Zwecke erwähnen wir noch eine weitere Charakterisierung von NashGleichgewichten, die auf den bei der regularisierten Nikaido-Isoda-Funktion V˛ auftretenden Vektoren (Maxima) y˛ .x/ basiert. Satz 7.6 Sei X Rn nichtleer, abgeschlossen und konvex sowie stetig differenzierbar und, als Funktion in x , konvex. Dann ist x genau dann ein normalisierter Nash-Gleichgewichtspunkt, wenn x ein Fixpunkt der Abbildung x 7! y˛ .x/ ist, also x D y˛ .x / gilt. Beweis Sei x zunächst ein normalisierter Nash-Gleichgewichtspunkt. Dann ist einerseits V˛ .x / D 0 nach Satz 7.3, also 0 D V˛ .x / D max ˛ .x ; y/ D ˛ x ; y˛ .x / y2X
gemäß Definition von y˛ .x /, und andererseits gilt auch ˛ .x ; x / D 0. Da das Maximum y˛ .x / aber eindeutig bestimmt ist, erhalten wir auf diese Weise unmittelbar x D y˛ .x /. Sei umgekehrt x ein Fixpunkt von y˛ . Dann ist 0 D ˛ .x ; x / D ˛ x ; y˛ .x / D V˛ .x /; und die Behauptung folgt daher aus dem Satz 7.3.
Es sei an dieser Stelle ausdrücklich erwähnt, dass der Satz 7.6 keinerlei Glattheitsvoraussetzungen (wie Differenzierbarkeit) an stellt. Ansonsten motiviert der Satz 7.6 die Anwendung des Fixpunktverfahrens x kC1 WD y˛ .x k / oder einer geeigneten Modifikation, um einen normalisierten Nash-Gleichgewichtspunkt zu finden. So lässt sich insbesondere auch das im vorigen Abschnitt angedeutete Relaxationsverfahren benutzen, indem man dort überall y.x/ durch y˛ .x/ ersetzt. Der in [43] angegebene Konvergenzbeweise für das Relaxationsverfahren überträgt sich unmittelbar auf die jetzige Situation. Wir kehren an dieser Stelle noch einmal zu der Formulierung (7.4) des GNEPs als glattes, restringiertes Optimierungsproblem zurück. Um eine Lösung des GNEPs zu erhalten, müssen wir ein globales Minimum von (7.4) berechnen. Da die meisten Algorithmen nur stationäre Punkte finden, stellt sich die Frage, unter welchen Bedingungen ein derartiger stationärer Punkt bereits ein globales Minimum ist. Diese Bedingung wird in der folgenden Voraussetzung eingeführt.
116
7
Numerische Verfahren für GNEPs
Voraussetzung 7.7 Für gegebenes x 2 X mit x ¤ y˛ .x/ gelte die Ungleichung N X
T r .x ; x / r .y˛ .x/; x / x y˛ .x/ > 0:
D1
Wir verschieben zunächst eine Diskussion dieser Voraussetzung an das Ende dieses Abschnitts. Das folgende Resultat zeigt, dass die Voraussetzung 7.7 eine hinreichende Bedingung dafür liefert, dass der stationäre Punkt bereits ein globales Minimum und deshalb ein normalisiertes Nash-Gleichgewicht des GNEPs ist. Satz 7.8 Sei x 2 X ein stationärer Punkt von (7.4), also rV˛ .x /T .x x / 0 8x 2 X:
(7.8)
Falls die Voraussetzung 7.7 in x D x erfüllt ist, dann ist x ein normalisiertes NashGleichgewicht des GNEPs. Beweis Unter Verwendung von (7.8) und der Darstellung des Gradienten rV˛ .x / aus Satz 7.5 erhalten wir 0 rV˛ .x /T .x x / D
N X
T r .x ; ; x ; / r .y˛ .x /; x ; / .x x /
D1
C
N X
T rx .y˛ .x /; x ; /T .x x ; / ˛ x y˛ .x / .x x /
D1
D
N X
T r .x ; ; x ; / r .y˛ .x /; x ; / .x x /
D1
C
N X
T rx .y˛ .x /; x ; / ˛ x ; y˛ .x / x x ;
D1
für alle x 2 X. Speziell für x D y˛ .x / ergibt sich daher 0
N X
T r .x ; ; x ; / r .y˛ .x /; x ; / .y˛ .x / x /
D1 N X T C rx .y˛ .x /; x ; / ˛.x ; y˛ .x // .y˛ .x / x ; /: D1
(7.9)
7.2 Die regularisierte Nikaido-Isoda-Funktion
117
Per Definition ist y˛ .x / die einzige Lösung des Optimierungsproblems max y
N X
.x ; ; x ; / .y ; x ; /
D1
˛ ; kx y k2 u. d. N. 2
y 2 X:
Daher genügt y˛ .x / den zugehörigen Optimalitätsbedingungen 1T rx 1 1 .y˛1 .x /; x ;1 / ˛.x ;1 y˛1 .x // C B :: C z y˛ .x / 0 8z 2 X: B : A @ rx N N .y˛N .x /; x ;N / ˛.x ;N y˛N .x // 0
Mit z D x erhalten wir daher N X
T rx .y˛ .x /; x ; / ˛.x ; y˛ .x // x ; y˛ .x / 0:
D1
Insgesamt ergibt sich somit 0
N X
T r .x ; ; x ; / r .y˛ .x /; x ; / y˛ .x / x
(7.10)
D1
aus (7.9). Aus der Annahme x ¤ y˛ .x / ergäbe sich mit (7.10) und Voraussetzung 7.7 unmittelbar der Widerspruch 0 < 0. Also ist x D y˛ .x / und der Punkt x somit wegen Satz 7.6 ein normalisierter Nash-Gleichgewichtspunkt des GNEPs. Die Voraussetzung 7.7 kann als eine Art strikte Monotonie oder positive Definitheit angesehen werden. Um diesen Punkt zu illustrieren, betrachten wir im Folgenden den Fall, in dem alle Auszahlungsfunktionen quadratisch sind, etwa X 1 .x /T A x .x/ D .x /T A x C 2 D1 N
(7.11)
¤
für gewisse Matrizen A 2 Rn n mit A symmetrisch (ohne Beschränkung der Allgemeinheit). Zusätzliche lineare Terme sind erlaubt, aber sie verändern nicht die nachfolgende Diskussion. Sei A 2 Rnn die Matrix mit den Block-Komponenten A , also A D .A /N ;D1 . Dann gilt folgendes Resultat. Satz 7.9 Die Auszahlungsfunktionen seien für alle D 1; : : : ; N durch (7.11) gegeben. Ferner sei die hiermit definierte Matrix A D .A /N ;D1 positiv definit. Dann ist die Voraussetzung 7.7 in jedem beliebigen Punkt x 2 Rn erfüllt.
118
7
Numerische Verfahren für GNEPs
Beweis Sei x 2 Rn beliebig gegeben. Dann ist rx .x ; x / D AT x
8 ¤
und r .x ; x x
/ D A x C
N X
A x :
D1 ¤
Mittels einer elementaren Rechnung erhalten wir daher N X
T r .x ; x / r .y˛ .x/; x / x y˛ .x/
D1
D
N N X X
T rx .x ; x / rx .y˛ .x/; x / x y˛ .x/
D1 D1
D
N X T x y˛ .x/ A x y˛ .x/ ;D1
T D x y˛ .x/ A x y˛ .x/ > 0; falls x ¤ y˛ .x/. Also ist die Voraussetzung 7.7 erfüllt.
7.3
Die Differenz zweier regularisierter Nikaido-Isoda-Funktionen
Wir betrachten weiterhin unser GNEP mit einer gemeinsamen Strategiemenge X Rn , die als nichtleer, abgeschlossen und konvex vorausgesetzt werde, sowie mindestens stetigen Auszahlungsfunktionen W Rn ! R, die konvex in x seien. Das Optimierungsproblem des -ten Spielers ist somit gegeben durch .x ; x / u. d. N. .x ; x / 2 X: min x
Ferner seien im gesamten Abschnitt zwei feste Parameter 0 0. Daher ist y˛ .x / D yˇ .x /. Damit vereinfacht sich (7.14) zu .ˇ ˛/ x y˛ .x / D 0. Wegen ˛ < ˇ impliziert dies x D y˛ .x /. Folglich ist x ein normalisiertes Nash-Gleichgewicht wegen Satz 7.6.
7.4 Berechnung nicht-normalisierter Lösungen von GNEPs
123
Wir illustrieren die Ergebnisse dieses Abschnitts kurz an einem numerischen Beispiel. Beispiel Zur unrestringierten Minimierung der Funktion V˛ˇ verwenden wir das Barzilai-Borwein-Gradientenverfahren in seiner Ursprungsversion aus [1]. Dieses benutzt die Iterationsvorschrift
x kC1 WD x k tk rV˛ˇ .x k /;
k D 0; 1; 2; : : :
mit der Schrittweite tk WD
sT y ; sT s
wobei wir zur Abkürzung s WD x k x k1
und y WD rV˛ˇ .x k / rV˛ˇ .x k1 /
gesetzt haben. Dieses Verfahren hat also den Vorteil, eine explizite Formel für die Schrittweite zu verwenden, so dass diese nicht erst durch eine in unserem Zusammenhang sehr teure Schrittweitenstrategie berechnet werden muss. (Die Auswertung von V˛ˇ an einem Zwischenpunkt würde der Lösung zweier restringierter Optimierungsprobleme entsprechen.) Verwenden wir dieses Verfahren zur Lösung des Flussverschmutzungsbeispiels mit den Parametern ˛ WD 0;02 und ˇ WD 0;05 sowie dem Abbruchkriterium V˛ˇ .x k / " mit " WD 108 , so erhalten wir nach 18 Iterationen die Näherungslösung x .21;147; 16;028; 2;724/.
7.4 Berechnung nicht-normalisierter Lösungen von GNEPs Wir haben bisher gesehen, dass für ein konvexes GNEP der Form min .x ; x / u. d. N. .x ; x / 2 X x
die Berechnung einer Lösung, und zwar eines normalisierten Nash-Gleichgewichts, im Allgemeinen nicht schwerer ist als die Bestimmung einer Lösung eines NEPs. So macht es zum Beispiel für die bisher betrachteten, auf der Nikaido-Isoda-Funktion basierenden, Verfahren keinen großen Unterschied, ob X eine beliebige konvexe Menge oder von der Form X D X1 : : : ; XN ist. Dies gilt auch für den Zugang über Variationsungleichungen, vergleiche hierzu speziell die Sätze 3.5 und 5.6. Nun mag ein GNEP aber auch nicht-normalisierte Lösungen besitzen, die man auf diese Weise nicht erhält, die aber in gewissen Anwendungen durchaus eine Rolle spielen können. Wir beschreiben in diesem Abschnitt daher einen auf [13] zurückgehenden Zugang für eine spezielle Klasse von konvexen GNEPs, mit dessen Hilfe man auch nichtnormalisierte Lösungen bestimmen kann. Tatsächlich liefert dieser Zugang sogar die Möglichkeit, alle Lösungen eines GNEPs zu berechnen. Die hier betrachtete Klasse von GNEPs ist gegeben durch die Optimierungsprobleme .x/ u. d. N. min x
Ax D b;
g .x / 0
(7.15)
124
7
Numerische Verfahren für GNEPs
für Spieler D 1; : : : ; N mit W Rn ! R stetig differenzierbar und konvex als Funktion von x , A D .A1 ; : : : ; AN / 2 Rpn mit A 2 Rpn ; b 2 Rp und g W Rn ! Rm stetig differenzierbar sowie konvex. Dabei gelte wieder n D n1 C : : : C nN und m D m1 C : : : C mN . Die gemeinsame konvexe Strategiemenge ist also gegeben durch X D fx 2 Rn j Ax D b;
g .x / 0 8 D 1; : : : ; N g:
In diesem Fall sind die zulässigen Mengen aller Spieler nur über die lineare Restriktion Ax D
N X
A x D b
D1
gekoppelt. Wählt man also einen beliebigen zulässigen Punkt xN 2 X und erlaubt jedem Spieler nur noch Strategien x zu wählen mit A x D A xN , so gilt für jede Kombination solcher Strategien Ax D
N X
A x D
D1
N X
A xN D AxN D b:
D1
Dies motiviert statt des GNEPs für gegebenes xN 2 X das folgende, als NEP.x/ N bezeichnete, Standard-Nash-Gleichgewichtsproblem zu betrachten, bei welchem Spieler das folgende Optimierungsproblem zu lösen hat: .x/ u. d. N. A x D A xN ; min
g .x / 0:
x
(7.16)
Sowohl (7.15) als auch (7.16) ist ein konvexes Optimierungsproblem, d. h. die KKTBedingungen sind hinreichende Optimalitätsbedingungen für das Vorliegen eines globalen Minimums. Sind zusätzlich die Funktionen g linear oder gilt eine andere geeignete Regularitätsbedingung, so handelt es sich bei den KKT-Bedingungen auch um notwendige Optimalitätskriterien. Die KKT-Bedingungen von (7.15) sind gegeben durch rx .x/ C AT C rx g .x / D 0; Ax D b; 0;
g .x / 0;
(7.17)
g .x / D 0
T
mit gewissen Lagrange-Multiplikatoren 2 Rm und 2 Rp . Die KKT-Bedingungen von (7.16) lauten: rx .x/ C AT C rx g .x / D 0; A x D A xN ; 0;
g .x / 0;
g .x / D 0:
T
(7.18)
7.4 Berechnung nicht-normalisierter Lösungen von GNEPs
125
Durch genaue Inspektion der beiden KKT-Bedingungen aus (7.17) und (7.18) erhält man das nachstehende Resultat. Satz 7.16 Betrachte das GNEP aus (7.15) mit den dort formulierten Voraussetzungen. Mit SOL bzw. SOL(x) N bezeichnen wir die Lösungsmengen von GNEP bzw. NEP(x). N Handelt es sich bei den KKT-Bedingungen (7.17) bzw. (7.18) um notwendige Optimalitätskriterien für das Vorliegen einer Lösung von (7.15) bzw. (7.16), so gilt SOL D
[
SOL.x/; N
x2X N
wobei X WD fx 2 Rn j Ax D b; g .x / 0 8 D 1; : : : ; N g die zulässige Menge des GNEPs bezeichnet. Beweis Sei zunächst xO 2 SOL.x/ N für ein xN 2 X. Nach Voraussetzung existieren dann Lagrange-Multiplikatoren ; derart, dass die KKT-Bedingungen (7.18) für alle D 1; : : : ; N mit x D xO erfüllt sind. Summation der Gleichheitsrestriktionen liefert wegen xN 2 X dann insbesondere AxO D
N X D1
A xO D
N X
A xN D AxN D b:
D1
Folglich genügt das Tripel .x; O ; / auch den KKT-Bedingungen (7.17) für alle D 1; : : : ; N , so dass xO in der Tat eine Lösung des GNEPs darstellt. Sei umgekehrt xN eine Lösung des GNEPs. Nach Voraussetzung sind dann die KKTBedingungen aus (7.17) mit x D xN und gewissen Multiplikatoren ; für alle D N ; / auch 1; : : : ; N erfüllt. Nun gilt ganz offensichtlich A xN D A xN , so dass .x; den KKT-Bedingungen (7.18) für alle D 1; : : : ; N genügt. Diese sind aber hinreichend dafür, dass xN das NEP.x/ N löst. Insgesamt ist damit die Behauptung bewiesen. Der Satz 7.16 legt folgende Vorgehensweise nahe: Zur Bestimmung einer Lösung des gegebenen GNEPs aus (7.15) berechnet man zunächst einen zulässigen Punkt xN 2 X. Anschließend löst man das zugehörige NEP.x/. N Dies liefert dann eine Lösung des GNEPs, die im Allgemeinen nicht normalisiert sein muss. Theoretisch könnte man sogar alle Lösungen des GNEPs bestimmen, indem man xN die gesamte Menge X durchlaufen lässt. Besonders praktikabel ist das natürlich nicht, weil X einerseits (überabzählbar) unendlich viele Elemente enthalten mag und andererseits allein die Berechnung eines einzelnen Punktes xN 2 X durchaus schon mit Schwierigkeiten verbunden sein mag. Sind alle g linear, so handelt es sich bei X um eine polyedrische Menge, ein zulässiger Punkt ließe sich in diesem Fall etwa durch die Lösung eines linearen Programms bestimmen.
126
7.5
7
Numerische Verfahren für GNEPs
Ein Multiplier-Penalty-Zugang
Im Gegensatz zu den vorherigen Abschnitten dieses Kapitels betrachten wir jetzt ein Spieler-konvexes GNEP, d. h. für jeden Spieler D 1; : : : ; N sei das Optimierungsproblem von der Form .x ; x / min x
u. d. N. x 2 X .x /
mit einer stetig differenzierbaren und bezüglich der Variablen x konvexen Zielfunktion W Rn ! R sowie einer individuellen Strategiemenge, die explizit durch (parametrisierte) Ungleichungen ˚
X .x / WD x 2 Rn j g .x ; x / 0 8 D 1; : : : ; N mit einer stetig differenzierbaren und bezüglich x konvexen Abbildung g W Rn ! Rm gegeben sei. Zusätzliche (lineare) Gleichheitsrestriktionen können ebenfalls berücksichtigt werden, sollen zur Vereinfachung der Notation hier aber nicht mit aufgenommen werden. Anders als in den vorherigen Abschnitten dürfen die Funktionen g jetzt also von allen Variablen x und x abhängen und von Spieler zu Spieler verschieden sein. Die hier betrachtete Klasse von GNEPs ist also deutlich allgemeiner als die bislang untersuchten NEPs oder GNEPs. Ähnlich wie beim Multiplier-Penalty-Verfahren in der Optimierung ersetzen wir nun das restringierte Minimierungsproblem .x ; x / min x
u. d. N. g .x ; x / 0
des Spielers durch die unrestringierte Aufgabenstellung min La .x; uI / x
mit der Abkürzung x D .x ; x / und der Multiplier-Penalty-Funktion n
u o 2 La .x; uI / WD .x/ C max 0; g .x/ C 2
des Spielers . Hierbei ist u eine Näherung für einen Lagrange-Multiplikator und > 0 bezeichnet den Penalty-Parameter. Wir verwenden La als Notation für die Multplier-Penalty-Funktion, da sie im Englischen oft als augmented Lagrangian bezeichnet wird. Mit dieser Bezeichnungsweise lässt sich das Multiplier-Penalty-Verfahren für ein GNEP wie im Algorithmus 5 formulieren. Im Zusammenhang mit dem hier untersuchten MultiplierPenalty-Verfahren verweisen wir auch auf die Originalarbeiten [26, 38]. Haben wir bei restringierten Optimierungsproblemen in jedem Iterationsschritt bekanntlich ein unrestringiertes Optimierungsproblem zu lösen, so treten bei Algorithmus 5
7.5 Ein Multiplier-Penalty-Zugang
127
gewöhnliche (und unrestringierte) NEPs als Teilprobleme auf, die mit den bereits bekannten Methoden im Prinzip gelöst werden können. Ansonsten unterscheidet sich der Algorithmus 5 von einem klassischen Multiplier-Penalty-Verfahren durch die zusätzlich vorhandene Folge .uk /k , die gemäß Konstruktion in der beschränkten Menge Œ0; umax m liegt. Beim klassischen Multiplier-Penalty-Zugang würde die Folge .uk /k nicht auftreten und die Aufdatierung ˚
kC1; WD max 0; k; C ;k g .x kC1 / verwendet werden, bei der also uk; durch k; ersetzt wurde. Die globalen Konvergenzeigenschaften für dieses Analogon zum klassischen Verfahren sind allerdings schlechter als die für den Algorithmus 5, vergleiche [27], weshalb wir hier die Variante mit der beschränkten (aber ansonsten frei wählbaren) Folge .uk /k präsentieren. Der Zusammenhang mit dem klassischen Verfahren motiviert allerdings die konkrete Aufdatierungsvorschrift WD PŒ0;umax .kC1 / ukC1 i i
8i D 1; : : : ; m
in Algorithmus 5. Auf diese Weise erhält man eine Übereinstimmung zwischen dem klassischen und dem modifizierten Multiplier-Penalty-Verfahren, solange der Multiplikator kC1 WD : : : ; kC1; ; : : : die obere Schranke umax nicht überschreitet und damit beschränkt bleibt. Anderenfalls projiziert man dessen Wert (bzw. die zugehörigen Komponenten) auf das Intervall Œ0; umax . Algorithmus 5 (Multiplier-Penalty-Verfahren) (S.0) Wähle Parameter umax 0; 2 .0; 1/; > 1 und ;0 > 0 für alle D 1; : : : ; N . Wähle Startwerte x 0 2 Rn ; 0 2 Rm ; u0 2 Œ0; umax m , setze k WD 0. (S.1) Ist x k ein Nash-Gleichgewicht: STOP (S.2) Berechne eine Lösung x kC1 des durch die folgenden Optimierungsprobleme definierten unrestringierten Standard-NEPs min La .x; uk; I ;k /
x 2Rn
8 D 1; : : : ; N:
(S.3) Setze für alle Spieler D 1; : : : ; N ˚
kC1; WD max 0; uk; C ;k g .x kC1 / : (S.4) Für alle Spieler D 1; : : : ; N : Gilt k minfg .x kC1 /; kC1; gk k minfg .x k /; k; gk, setze ;kC1 WD ;k . Andernfalls erhöhe den Penalty-Parameter ;kC1 WD ;k . k C 1; gehe zu (S.1). (S.5) Wähle ukC1 2 Œ0; umax m ; und setze k
128
7
Numerische Verfahren für GNEPs
Zur Konvergenzuntersuchung des Algorithmus 5 benötigen wir die nachfolgende Regularitätsbedingung. Es handelt sich hierbei um eine auf Nash-Spiele angepasste Version der EMFCQ aus Definition 2.23. Definition 7.17
Betrachte ein Spieler-konvexes GNEP mit stetig differenzierbaren Abbildungen g W Rn ! Rm . Sei 2 f1; : : : ; N g ein gegebener Index und x 2 Rn ein fester Punkt. Dann genügt g der extended Mangasarian-Fromovitz constraint qualification bezüglich Spieler (kurz EMFCQ ), wenn ein d 2 Rn existiert mit der Eigenschaft 8i 2 f1; : : : ; m g W gi .x/ 0
H)
rx gi .x/T d < 0:
Wir sagen weiterhin, dass das GNEP der GNEP-EMFCQ in dem Punkt x genügt, wenn für jeden Spieler 2 f1; : : : ; N g die Funktion g die Eigenschaft EMFCQ erfüllt. Wir wollen als Nächstes die gerade definierten Begriffe etwas näher studieren. Dazu ist es sinnvoll, aus den individuellen Restriktionen g die neue Funktion gW Rn ! Rm mit m WD m1 C : : : C mN und 0
1 g 1 .x/ B : C : C g.x/ WD B @ : A g N .x/
(7.19)
zu definieren. Beispiel (Vergleich GNEP-EMFCQ und EMFCQ) In den beiden hier betrachteten Beispielen gebe es zwei Spieler D 1; 2, ferner seien n1 D n2 D 1 und die Abbildung g wie oben aus g 1 und g 2 zusammengesetzt. Statt g11 ; g12 schreiben wir für die Komponenten von g im Folgenden zur Vereinfachung g1 ; g2 . (a) Betrachte die Abbildung
x1 g.x1 ; x2 / WD x1 C x22
!
sowie den Punkt x WD .0; 0/ mit g.x / D .0; 0/T . Speziell für d WD .1; 0/ gelten dann rg1 .x /T d < 0 und rg2 .x /T d < 0, so dass Standard-MFCQ für die Ungleichungen g.x/ 0 in x D x erfüllt ist. Auf der anderen Seite ist rx2 g2 .x / D 0, so dass EMFCQ2 nicht gelten kann und somit GNEP-EMFCQ in x verletzt ist. (b) Betrachte die Funktion 2x1 x22 1 g.x1 ; x2 / WD 2x2 x12 1
!
7.5 Ein Multiplier-Penalty-Zugang
129
und den Punkt x WD .1; 1/ mit g.x / D .0; 0/T . Wegen rx1 g1 .x/ D rx2 g2 .x/ D 2 ist GNEPEMFCQ offenbar erfüllt. Dagegen sind die Gradienten von g gegeben durch ! ! 2 2x1 ; rg2 .x/ D rg1 .x/ D 2 2x2 und somit (E)MFCQ in x ganz offensichtlich verletzt.
Aufgrund des vorherigen Beispiels haben EMFCQ und GNEP-EMFCQ im Allgemeinen nichts miteinander zu tun. Hängen die Abbildungen g jedoch für alle D 1; : : : ; N nur von den Variablen x ab, wie das beim Standard-NEP der Fall ist, so hat die transponierte Jacobi-Matrix rg.x/ für die Funktion g aus (7.19) die Blockstruktur 0 B rg.x/ D B @
1
rx 1 g 1 .x 1 / ::
:
C C A rx N g N .x N /
mit rx g .x / 2 Rn m :
In diesem Fall lässt sich relativ leicht herleiten, dass EMFCQ für g äquivalent ist zu GNEP-EMFCQ in einem Punkt x 2 Rn . Damit nun zu dem entscheidenden Konvergenzsatz des Algorithmus 5. Satz 7.18 Betrachte ein Spieler-konvexes GNEP mit stetig differenzierbaren und bezüglich x konvexen Funktionen und g . Sei xN ein Häufungspunkt einer durch den Algorithmus 5 erzeugten Folge .x k /k derart, dass GNEP-EMFCQ in x erfüllt sei. Dann ist x eine Lösung des gegebenen GNEPs. Beweis Sei .x kC1 /k2K eine gegen den Häufungspunkt x konvergente Teilfolge. Gemäß Definition von x kC1 gilt 0 D rx La x kC1 ; uk; I ;k D rx x kC1 C rx g x kC1 uk; C ;k g .x kC1 / C D rx x kC1 C rx g x kC1 kC1;
(7.20)
für alle Spieler D 1; : : : ; N . Wir werden nun zeigen, dass x zusammen mit einem geeigneten Multiplikator ; für jedes D 1; : : : ; N den KKT-Bedingungen des Optimierungsproblems .x ; x ; / min x
u. d. N. g .x ; x ; / 0
genügt und x somit aus Konvexitätsgründen eine Lösung des gegebenen GNEPs ist. Sei dazu 2 f1; : : : ; N g fest gewählt. Wir unterscheiden dann zwei Fälle.
130
7
Numerische Verfahren für GNEPs
Fall 1: Die Folge . ;k /k ist beschränkt. Nach Konstruktion ist dann ;k D ;k0 für alle k k0 für ein hinreichend großes k0 2 N. Die Aufdatierungsvorschrift für ;kC1 liefert daher ˚
min g .x kC1 /; kC1; ! 0 für k ! 1:
(7.21)
Da die Folge .uk /k insgesamt beschränkt ist, können wir o. E. (notfalls durch Übergang auf weitere Teilfolgen) davon ausgehen, dass uk; ! u; k2K
kC1; mit geeignetem Grenzwert u; 2 Rm C gilt. Aus der Aufdatierungsvorschrift für folgt dann
˚
kC1; ! max 0; u; C ;k0 g .x / DW ; : k2K
Damit ergibt sich aus (7.21) durch Grenzübergang auf der Teilmenge K sofort
˚ min g .x /; ; D 0; was sich äquivalent schreiben lässt als g .x / 0;
; 0 und .; /T g .x / D 0:
Durch einen entsprechenden Grenzübergang auf derselben Teilfolge in (7.20) folgt 0 D rx .x / C rx g .x /; ; womit bewiesen ist, dass .x ; ; / den behaupteten KKT-Bedingungen genügt. Fall 2: Die Folge . ;k /k ist unbeschränkt. Aus dem Algorithmus 5 folgt dann ;k ! C1 für k ! 1. Für einen beliebigen Punkt x 2 Rn definieren wir die Indexmenge ˚
I .x/ WD i j gi .x/ 0 der in x aktiven oder verletzten Ungleichungsrestriktionen des Spielers . Wegen .x kC1 /k2K ! x gilt aus Stetigkeitsgründen dann I .x kC1 / I .x /
8k 2 K hinreichend groß:
Da .uk /k beschränkt ist, haben wir kC1 / 0 8i … I .x / 8k 2 K hinreichend groß: uk; i C ;k gi .x
7.5 Ein Multiplier-Penalty-Zugang
131
Aus der Aufdatierungsvorschrift für kC1; erhalten wir daher kC1; D 0 8i … I .x / 8k 2 K hinreichend groß; i also WD lim kC1; D 0 8i … I .x /: ; i i k2K
Wir zeigen nun, dass die restlichen Folgen .kC1; /k2K für i 2 I .x / im Fall I .x / ¤ ; i /i 2I .x / k ! beschränkt sind. Angenommen, dies wäre nicht der Fall, also o. E. k.kC1; i C1 für k 2 K. Wiederum durch Übergang auf eine weitere Teilfolge können wir davon ausgehen, dass für die zugehörigen normalisierten Folgen gilt kC1; i i 2I .x / kC1; ! O i i 2I .x / ¤ 0: k2K i
i 2I .x /
/i 2I .x / k und bilden anschließend Dividieren wir nun die Gleichung (7.20) durch k.kC1; i den Grenzwert k ! 1, so folgt in dem hier betrachteten Fall K
0D
X
O i rx gi .x /
(7.22)
i 2I .x /
mit O i 0, wobei mindestens ein Skalar echt positiv ist, da der Vektor .O i /i 2I .x / gemäß Konstruktion die Norm Eins hat. Wegen gi .x / 0 für alle i 2 I .x / folgt aus der Gültigkeit von EMFCQ für den Spieler die Existenz eines Vektors d 2 Rn mit der Eigenschaft rx gi .x /T d < 0 8i 2 I .x /: Multiplizieren wir daher die Identität (7.22) mit .d /T , so erhalten wir den Widerspruch X O i rx gi .x /T d < 0: 0D i 2I .x /
Also sind die Folgen .kC1; /k2K für alle i 2 I .x / ebenfalls beschränkt. Ohne Eini schränkung können wir davon ausgehen, dass kC1; ! ; i i k2K
8i 2 I .x /
0. Bilden wir dann den Grenzwert auf der Teilfolge gilt mit gewissen Grenzwerten ; i K in (7.20), so folgt 0 D rx .x / C
m X i D1
; rx gi .x /: i
132
7
Numerische Verfahren für GNEPs
Gemäß Konstruktion ist außerdem ; 0; i
gi .x / 0;
; gi .x / D 0 8i D 1; : : : ; m ; i
wobei sich die Zulässigkeit von x für die Ungleichungen g in dem hier betrachteten Fall unmittelbar aus der Aufdatierungsvorschrift von kC1; und der Beschränktheit von uk; ergibt. Also genügt .x ; N / den KKT-Bedingungen des Optimierungsproblems von Spieler , womit der Beweis vollständig erbracht ist. Abschließend soll noch kurz auf einen Spezialfall des Algorithmus 5 eingegangen werden. I Bemerkung 7.19 Wählt man im Algorithmus 5 stets uk D 0, so reduziert sich insbe-
sondere die Multiplier-Penalty-Funktion von Spieler zu 2
P .x; / WD La .x; 0I / D .x/ C maxf0; g .x/g : 2 Dies ist das GNEP-Analogon der klassischen (quadratischen) Penalty-Funktion aus der Optimierung für das Problem .x ; x / min x
u. d. N. g .x ; x / 0
des Spielers . Da die Konvergenztheorie für jede beschränkte Folge .uk /k Rm C richtig bleibt, erhalten wir auf diese Weise auch einen globalen Konvergenzsatz für einen klassischen Penalty-Ansatz zur Lösung von GNEPs, bei dem in jedem Iterationsschritt ein unrestringiertes NEP mit den Minimierungsproblemen P .xI /; min x
x 2 Rn
für alle Spieler D 1; : : : ; N zu lösen ist.
7.6 Aufgaben 1. Betrachten Sie das 2-Personen-Spiel D fX ; g2D1 mit X1 D X2 D Œ0; 32
und
1 .x/ D 2 .x/ D cos.x1 x2 /;
wobei die Zielfunktionen minimiert werden sollen. Da jeder Spieler nur eine Variable kontrolliert, schreiben wir x1 ; x2 statt x 1 ; x 2 . (a) Bestimmen Sie alle Nash-Gleichgewichte des Spiels. (b) Die Nikaido-Isoda-Funktion ist für 2 Spieler definiert als .x; y/ D 1 .x1 ; x2 / 1 .y1 ; x2 / C 2 .x1 ; x2 / 2 .x1 ; y2 /: Bestimmen Sie für dieses Spiel.
7.6 Aufgaben
133
(c) Mit y.x/ bezeichnen wir die Menge aller Lösungen von max .x; y/ u. d. N. y
y 2 X:
Bestimmen Sie y.x/ für x 2 X . Was fällt auf? (d) Die Funktion V .x/ ist definiert als V .x/ WD max .x; y/ D .x; y.x//: y2X
Bestimmen Sie V .x/ für x 2 X . Was fällt auf? (e) Zeigen Sie, dass alle Nash-Gleichgewichte x die Eigenschaft V .x / D 0 haben. 2. Wir betrachten eine QVI wie in der Aufgabe 1 in Kap. 5 mit F Lipschitz-stetig und gleichmäßig monoton mit Modulus L bzw. sowie nichtleeren, abgeschlossenen und konvexen Mengen K.x/ für alle x 2 Rn . Es gelte die Eigenschaft kPK.x/ .z/ PK.y/ .z/k ˛kx yk 8x; y; z 2 Rn
(7.23)
mit einer geeigneten Konstanten ˛ > 0. Sei .x k /k eine durch die Fixpunkt-Iteration x kC1 WD PK.x k / x k F .x k / definierte Folge für ein gegebenes > 0 (vergleiche hierzu die Aufgabe 2 in Kap. 5 als Motivation). Zeigen Sie, dass dann die Abschätzung p kx kC1 x k ˛ C 1 2 C 2 L2 kx k x k für jede Lösung x (sofern existent) der QVI gilt. Für welchen Wert von wird der Vorfaktor auf der rechten Seite minimal? Für welche Werte von ˛ handelt es sich dann um eine Kontraktion? 3. In dieser Aufgabe soll die zentrale Voraussetzung (7.23) betrachtet werden. Zu diesem Zweck untersuchen wir eine spezielle Klasse von QVIs mit der Menge K.x/ gegeben durch K.x/ D c.x/ C K mit einer Funktion c W Rn ! Rn sowie einer nichtleeren, abgeschlossenen und konvexen (festen) Menge K Rn . (Eine solche QVI wird manchmal als „moving set case“ bezeichnet; die Mengen K.x/ sind dann ebenfalls nichtleer, abgeschlossen und konvex). Die Abbildung c genüge der Lipschitz-Bedingung kc.x/ c.y/k ˛kx yk 8x; y 2 Rn mit einer Konstanten ˛ > 0. Zeigen Sie, dass die Eigenschaft (7.23) dann (mit demselben ˛) erfüllt ist.
8
Numerische Verfahren für VIPs
In diesem Kapitel beschreiben wir verschiedene Verfahren zur Lösung der Variationsungleichung VIP.X; F /: Für gegebenes X Rn und F W X ! Rn finde x 2 X mit F .x /T .x x / 0 8x 2 X: Im Hinblick auf die Sätze 3.5 und 5.6 können diese Verfahren insbesondere auch zur Lösung von (verallgemeinerten) Nash-Gleichgewichtsproblemen benutzt werden. Dies ist in der Tat ein gängiger Weg zur numerischen Lösung von (normalisierten) Nash-Gleichgewichtsproblemen, denn die Verfahren für Variationsungleichungen sind mittlerweile sehr ausgereift, während es vergleichsweise weniger Verfahren zur Lösung von NEPs und GNEPs gibt. Noch eine Bemerkung in eigener Sache: In diesem Kapitel greifen wir großenteils auf Inhalte aus dem Buch [17] von Geiger und Kanzow zurück, da dieses einen guten Einstieg in numerische Verfahren zur Lösung von Variationsungleichungen liefert.
8.1 Projektionsverfahren Betrachte also die Variationsungleichung VIP.X; F /. Aufgrund des Satzes 3.6 ist x 2 X genau dann eine Lösung von VIP.X; F /, wenn x ein Fixpunkt der Abbildung x 7! PX x F .x/ ist, wobei > 0 ein beliebiger Parameter sein darf. Dies motiviert Algorithmus 6. Algorithmus 6 (Fixpunkt-/Projektionsverfahren für VIP.X; F /) (S.0) Wähle einen Startwert x 0 2 X, einen Parameter > 0 und setze k WD 0. (S.1) Ist x k eine Lösung von VIP.X; F /: STOP © Springer Nature Switzerland AG 2018 C. Kanzow, A. Schwartz, Spieltheorie, Mathematik Kompakt, https://doi.org/10.1007/978-3-319-96679-3_8
135
136
8
Numerische Verfahren für VIPs
(S.2) Bestimme x kC1 WD PX .x k F .x k //: (S.3) Setze k
k C 1; gehe zu (S.1).
Um einen Konvergenzsatz für den Algorithmus 6 beweisen zu können, erinnern wir zunächst an den fundamentalen Fixpunktsatz von Banach, der hier nur in etwas vereinfachter Form wiedergegeben wird. Satz 8.1 (Fixpunktsatz von Banach) Sei X Rn eine nichtleere und abgeschlossene Menge sowie H W X ! X eine kontrahierende Selbstabbildung, d. h. es gibt eine Konstante 2 .0; 1/ mit kH.x/ H.y/k kx yk
8x; y 2 X:
Dann besitzt H genau einen Fixpunkt x in X. Ferner konvergiert für jeden Startwert x 0 2 X die durch die Vorschrift x kC1 WD H.x k / erzeugte Folge .x k /k gegen diesen Fixpunkt x . Wir kommen nun zu dem bereits angekündigten Konvergenzsatz für den Algorithmus 6, wobei wir implizit davon ausgehen, dass der Algorithmus nicht nach endlich vielen Schritten mit einer Lösung von VIP.X; F / abbricht. Satz 8.2 Sei X Rn nichtleer, abgeschlossen und konvex. Sei ferner F W X ! Rn gleichmäßig monoton mit Modulus > 0 sowie Lipschitz-stetig auf X mit Konstante L > 0. Sei < 2=L2 . Dann konvergiert die durch den Algorithmus 6 erzeugte Folge .x k /k gegen die eindeutige Lösung von VIP.X; F /. Beweis Offenbar genügt die Menge X den Voraussetzungen des Fixpunktsatzes 8.1 von Banach. Ferner ist die Abbildung H.x/ WD PX x F .x/ eine Selbstabbildung von X. Wegen 2 kH.x/ H.y/k2 D PX x F .x/ PX y F .y/ 2 x y C F .y/ F .x/ D kx yk2 2 .x y/T F .x/ F .y/ C 2 kF .x/ F .y/k2 .1 C 2 L2 2 /kx yk2 ; wobei die erste Ungleichung aus dem Lemma 2.26 folgt, gilt kH.x/ H.y/k kx yk
8.1 Projektionsverfahren
137
für alle x; y 2 X mit WD
p 1 C 2 L2 2 :
Wegen < 2=L2 ist 2 .0; 1/, d. h., die Abbildung H ist kontrahierend. Aufgrund des Satzes 8.1 konvergiert die durch den Algorithmus 6 erzeugte Folge .x k /k daher gegen den eindeutig bestimmten Fixpunkt x 2 X von H , welcher nach den einleitenden Bemerkungen dieses Abschnittes auch die eindeutige Lösung von VIP.X; F / ist. (Dass VIP.X; F / unter den Voraussetzungen dieses Satzes eine eindeutige Lösung besitzt, folgt auch unmittelbar aus dem Korollar 3.14.) Die Voraussetzungen des Satzes 8.2 sind relativ stark. Weder die gleichmäßige Monotonie noch die (globale) Lipschitz-Stetigkeit von F sind im Allgemeinen erfüllt. Ferner sind die Konstanten > 0 und L > 0 oft nicht bekannt, so dass auch eine geeignete Wahl von > 0 Schwierigkeiten bereitet. Ein wichtiger Spezialfall, bei dem die Voraussetzungen des Satzes 8.2 auch praktisch erfüllbar sind, wird in der folgenden Bemerkung diskutiert. I Bemerkung 8.3 Seien M 2 Rnn positiv definit (nicht notwendig symmetrisch), q 2
Rn und F .x/ WD M x C q. Aufgrund der Bemerkung 2.13 ist F dann eine gleichmäßig monotone Funktion. Genauer gilt für alle x; y 2 Rn : .x y/T F .x/ F .y/ D .x y/T M.x y/ 1 D .x y/T M C M T .x y/ 2 1 min M C M T kx yk2 ; 2
wobei min .A/ den kleinsten Eigenwert der symmetrischen Matrix A 2 Rnn bezeichnet. Die positive Definitheit von M garantiert, dass WD
1 min M C M T 2
(8.1)
positiv ist und daher als Modulus für die gleichmäßige Monotonie benutzt werden kann. Ferner ist kF .x/ F .y/k kM k kx yk für alle x; y 2 Rn , so dass L WD kM k
(8.2)
eine geeignete Lipschitz-Konstante ist. Da sowohl als auch L aus (8.1) bzw. (8.2) (zumindest approximativ) berechenbar sind, lässt sich für affin-lineares F ein geeignetes > 0 bestimmen, so dass der Algorithmus 6 konvergiert.
138
8
Numerische Verfahren für VIPs
Man beachte, dass der Algorithmus 6 keinerlei Informationen über die Jacobi-Matrix F 0 .x/ verwendet, sondern lediglich Funktionswerte F .x/ benötigt. Das Fixpunktverfahren 6 konvergiert daher im Allgemeinen auch nur sehr langsam. Dafür müssen auch keine linearen Gleichungssysteme gelöst werden. Der Hauptaufwand im Algorithmus 6 besteht dagegen in der Berechnung der Projektionen eines Vektors auf die Menge X. Diese kann sehr teuer sein, für speziell strukturierte Mengen X, wie sie bei Variationsungleichungen häufig auftreten, gibt es zum Teil sehr effiziente Verfahren. I Bemerkung 8.4 Es gibt eine Reihe von Modifikationen des einfachen Projektionsver-
fahrens aus dem Algorithmus 6, von denen unter deutlich schwächeren Voraussetzungen die Konvergenz gegen eine Lösung von VIP.X; F / gezeigt werden kann. Hierzu gehört beispielsweise das so genannte Extragradientenverfahren 8k D 0; 1; 2; : : : x kC1 WD PX x k F PX .x k F .x k // mit einem Startvektor x 0 2 X und einem festen Parameter > 0. Diese Extragradientenverfahren konvergiert für die Klasse der monotonen und (global) Lipschitz-stetigen Funktionen F , sofern > 0 hinreichend klein gewählt wird, vergleiche [17]. Wird statt des festen Parameters ein geeigneter und vom Iterationsindex k abhängiger Wert k im Extragradientenverfahren genommen, so kann die relativ starke Voraussetzung der globalen Lipschitz-Stetigkeit noch durch die wesentlich schwächere Bedingung der Stetigkeit von F ersetzt werden, siehe wiederum [17] für ein derartiges Verfahren. Wenden wir das Projektionsverfahren auf das konkrete Oligopol-Modell aus Kap. 6 (formuliert als Variationsungleichung im Sinne des Satzes 3.5) mit dem Startvektor x 0 WD .0; : : : ; 0/T , dem Parameter WD 0;1 und dem Abbruchkriterium kx k PX .x k F .x k //k " WD 105 an, so bricht das Verfahren nach 485 Iterationen und dem Lösungsvektor x .36;933; 41;818; 43;707; 42;659; 39;179/T ab. Im Vergleich zu den Methoden aus dem vorigen Kapitel ist die Iterationszahl natürlich sehr hoch, wegen der sehr einfachen Gestalt der zulässigen Menge im betrachteten Beispiel ist jede einzelne Iteration beim Projektionsverfahren aber außerordentlich günstig, was man bei einem fairen Vergleich der Verfahren zu berücksichtigen hat.
8.2 Josephy-Newton-Verfahren Betrachte weiterhin die Variationsungleichung VIP.X; F /, wobei F in diesem Abschnitt als stetig differenzierbar vorausgesetzt wird. Die zentrale Idee des Josephy-Newton-Verfahrens1 besteht darin, eine Folge .x k /k zu erzeugen, wobei x kC1 Lösung einer im All1
Isaac Newton (1642/3–1726/7), Naturwissenschaftler und Philosoph; Norman Josephy (https:// faculty.bentley.edu/details.asp?uname=njosephy)
8.2 Josephy-Newton-Verfahren
139
gemeinen einfacher zu lösenden Variationsungleichung VIP.X; Fk / ist. Beim JosephyNewton-Verfahren wählt man für Fk W X ! Rn die Linearisierung Fk .x/ WD F .x k / C F 0 .x k /.x x k /:
(8.3)
Andere Verfahren unterscheiden sich hiervon durch eine andere Wahl von Fk . Insbesondere wird die Jacobi-Matrix F 0 .x k / in (8.3) gerne durch eine geeignete Approximation ersetzt. Hier beschränken wir uns aber auf das klassische Josephy-Newton-Verfahren mit der Wahl (8.3) für Fk . Das Verfahren wird in Algorithmus 7 beschrieben. Man beachte, dass das in jeder Iteration zu lösende Hilfsproblem VIP.X; Fk / im Allgemeinen tatsächlich einfacher zu lösen sein wird als das Ausgangsproblem VIP.X; F / selbst, da die Funktion Fk nur linear ist. Insbesondere kann man zur Lösung dieser Hilfsprobleme die bereits vorher behandelten Projektionsverfahren heranziehen. Im Fall einer polyedrischen Menge X eignet sich das Lemke-Verfahren meist besser, vergleiche hierzu die Bemerkung 8.9. Algorithmus 7 (Lokales Josephy-Newton-Verfahren für VIP.X; F /) (S.0) Wähle einen Startwert x 0 2 X und setze k WD 0. (S.1) Ist x k eine Lösung von VIP.X; F /: STOP (S.2) Definiere Fk .x/ WD F .x k / C F 0 .x k /.x x k / und bestimme x kC1 als Lösung von VIP.X; Fk /, d.h. (S.3) Setze k
T F .x k / C F 0 .x k /.x kC1 x k / .x x kC1 / 0 8x 2 X:
k C 1; gehe zu (S.1).
Wir wollen im Folgenden zeigen, dass das Josephy-Newton-Verfahren aus dem Algorithmus 7 unter gewissen Voraussetzungen lokal wohldefiniert ist und Q-superlinear bzw. sogar Q-quadratisch konvergiert im Sinne der folgenden Definition. Definition 8.5
Sei .x k /k Rn eine gegen ein x 2 Rn konvergente Folge. Dann konvergiert .x k /k gegen x (a) Q-superlinear, falls kx kC1 x k D o.kx k x k/ gilt; (b) Q-quadratisch, falls kx kC1 x k D O.kx k x k2 / gilt. Zum Nachweis der lokal schnellen Konvergenz des Josephy-Newton-Verfahrens benötigen wir noch zwei einfache Lemmata. Das erste Lemma ist eine unmittelbare Konsequenz des Satzes von Taylor bzw. des Mittelwertsatzes, so dass wir hier auf einen genauen Beweis verzichten, vergleiche [17].
140
8
Numerische Verfahren für VIPs
Lemma 8.6 Seien X Rn nichtleer, F W X ! Rn und .x k /k X eine gegen ein x 2 X konvergente Folge. Dann gelten: (a) Ist F stetig differenzierbar, so ist kF .x k / F .x / F 0 .x k /.x k x /k D o.kx k x k/: (b) Ist F stetig differenzierbar mit lokal Lipschitz-stetiger Ableitung, so ist kF .x k / F .x / F 0 .x k /.x k x /k D O.kx k x k2 /: Das zweite Lemma besagt, dass sich die positive Definitheit der Jacobi-Matrix F 0 .x/ auf eine Umgebung von x überträgt, und zwar sogar gleichmäßig. Lemma 8.7 Seien X Rn nichtleer, x 2 X und F W X ! Rn stetig differenzierbar mit F 0 .x / positiv definit. Dann existieren Konstanten ˛; ı > 0 mit d T F 0 .x/d ˛kd k2 für alle x 2 Rn mit kx x k ı und alle d 2 Rn , d. h., die Jacobi-Matrizen F 0 .x/ sind lokal gleichmäßig positiv definit. Beweis Angenommen, die Behauptung ist falsch. Dann existiert eine Folge .x k /k mit x k ! x sowie Vektoren d k 2 Rn mit .d k /T F 0 .x k /d k <
1 k 2 kd k : k
(8.4)
O. B. d. A. kann dabei angenommen werden, dass kd k k D 1 für alle k gilt. Dann besitzt die Folge .d k /k eine gegen ein d ¤ 0 konvergente Teilfolge .d k /K . Wegen F 0 .x k / ! F 0 .x / ergibt sich aus (8.4) durch Grenzübergang auf dieser Teilfolge .d /T F 0 .x /d 0: Wegen d ¤ 0 widerspricht dies der positiven Definitheit von F 0 .x /.
Wir kommen nun zu dem schon angekündigten lokalen Konvergenzsatz für das Josephy-Newton-Verfahren.
8.2 Josephy-Newton-Verfahren
141
Satz 8.8 Seien X Rn eine nichtleere, abgeschlossene und konvexe Menge sowie F W X ! Rn stetig differenzierbar. Sei ferner x 2 X eine Lösung der Variationsungleichung VIP.X; F /, sodass die Jacobi-Matrix F 0 .x / positiv definit ist. Dann existiert ein ı > 0, so dass für jeden Startwert x 0 2 Rn mit kx 0 x k ı die folgenden Aussagen gelten: (a) Das Josephy-Newton-Verfahren in Algorithmus 7 ist wohldefiniert. (b) Die Folge .x k /k konvergiert Q-superlinear gegen x . (c) Die Folge .x k /k konvergiert Q-quadratisch gegen x , falls F sogar eine lokal Lipschitz-stetige Ableitung besitzt. Beweis Wegen Lemma 8.7 existieren ein ı1 > 0 und ein ˛ > 0 mit d T F 0 .x/d ˛kd k2
(8.5)
für alle d 2 Rn und alle x 2 Rn mit kx x k ı1 . Sei r 2 .0; 1/ fest gewählt. Aufgrund des Lemmas 8.6 (a) existiert dann ein ı2 > 0 mit kF .x/ F .x / F 0 .x/.x x /k
r˛ kx x k 2
(8.6)
für alle x 2 Rn mit kx x k ı2 . Setze nun ı WD minfı1 ; ı2 g; und wähle x 0 2 Rn mit kx 0 x k ı. Dann ist F 0 .x 0 / positiv definit wegen (8.5). Also besitzt die im Josephy-Newton-Verfahren auftretende Variationsungleichung VIP.X; F0 / wegen Korollar 3.14 eine eindeutige Lösung x 1 , denn die Funktion F0 ist aufgrund der Bemerkung 2.13 gleichmäßig monoton. Als Lösung von VIP.X; F0 / genügt x 1 2 X der Ungleichung T F .x 0 / C F 0 .x 0 /.x 1 x 0 / .x x 1 / 0 8 x 2 X:
(8.7)
Ferner ist x 2 X Lösung von VIP.X; F /, so dass F .x /T .x x / 0 8 x 2 X
(8.8)
gilt. Einsetzen von x D x in (8.7) und x D x 1 in (8.8) und anschließende Addition dieser beiden Ungleichungen ergibt: .x x 1 /T F .x 0 / F .x / F 0 .x 0 /.x 0 x C x x 1 / 0:
(8.9)
142
8
Numerische Verfahren für VIPs
Aus (8.5)–(8.9) erhält man mit der Cauchy-Schwarzschen Ungleichung: ˛kx 1 x k2 .x x 1 /T F 0 .x 0 /.x x 1 / .x x 1 /T F .x 0 / F .x / F 0 .x 0 /.x 0 x / kx x 1 k kF .x 0 / F .x / F 0 .x 0 /.x 0 x /k r˛ kx x 1 k kx 0 x k: 2
(8.10)
Hieraus ergibt sich kx 1 x k
r 0 kx x k < kx 0 x k; 2
(8.11)
d. h., auch x 1 liegt in der ı-Umgebung von x . Durch Induktion folgt daher die Wohldefiniertheit des Josephy-Newton-Verfahrens. Außerdem liefert (8.11) mittels Induktion unmittelbar kx k x k
r k 2
kx 0 x k
und damit wegen r 2 .0; 1/ die Konvergenz von .x k /k gegen x . Ebenfalls durch Induktion ergibt sich aus (8.10) die Ungleichung ˛kx kC1 x k2 kx x kC1 k kF .x k / F .x / F 0 .x k /.x k x /k; also ˛kx kC1 x k kF .x k / F .x / F 0 .x k /.x k x /k: Die beiden Aussagen über die lokale Konvergenzgeschwindigkeit folgen daher unmittel bar aus dem Lemma 8.6. Die im Konvergenzsatz 8.8 geforderte Bedingung der positiven Definitheit von F 0 .x / lässt sich noch erheblich abschwächen, wenn man etwas mehr über die lokale Struktur der zulässigen Menge X in einer Umgebung von x weiß. Wir gehen hierauf aber nicht weiter ein und verweisen nur auf die entsprechende Literatur [10, 11, 24]. Auf der anderen Seite ist die Bedingung der positiven Definitheit von F 0 .x / sicherlich für gleichmäßig monotones F erfüllt, vergleiche den Satz 2.15, der Satz 8.8 also insbesondere für gleichmäßige monotone Funktionen F richtig. I Bemerkung 8.9 Numerisch besteht bei der Durchführung des Josephy-Newton-Ver-
fahrens 7 das Hauptproblem darin, in jeder Iteration die linearisierte Variationsungleichung lösen zu können. Sofern es sich bei X um eine polyedrische Menge handelt, etwa
8.3 Die (regularisierte) Gap-Funktion
143
in der Gestalt X D fx 2 Rn j Ax b; x 0g, so kann man diese linearisierte Variationsungleichung unter Verwendung der Ergebnisse aus dem späteren Abschn. 8.5 relativ leicht in ein lineares Komplementaritätsproblem umformulieren und dieses dann mit dem schon im Abschn. 4.4 genannten Lemke-Verfahren lösen. Schreiben wir die linearisierte Funktion nämlich in der Gestalt F .x/ D Qx C c, so ist die linearisierte Variationsungleichung äquivalent zu ihren KKT-Bedingungen, die offenbar wie folgt lauten: x 0; Qx C c C AT 0; x T Qx C c C AT D 0; 0; b Ax 0; T b Ax D 0: Dies ist aber ein lineares Komplementaritätsproblem LCP(q; M ) mit q WD
c b
! und M WD
Q
AT
A
0
! :
Beispiel Wir illustrieren das numerische Verhalten des Josephy-Newton-Verfahrens an dem konkreten Oligopol-Modell aus Kap. 6. Hierbei brechen wir ab, sobald kx kC1 x k k " mit " WD 106 gilt, und lösen die linearisierten Variationsungleichungen in jedem Schritt mit dem zuvor angesprochenen Lemke-Verfahren. Schon nach 7 Iterationen erhält man die Näherungslösung
x .36;933; 41;818; 43;7067; 42;659; 39;179/: Ab etwa Iteration 5 beobachtet man eine sehr schnelle Verkleinerung von kx kC1 x k k, die sich letztlich aus der lokal quadratischen Konvergenz des Verfahrens ergibt.
8.3
Die (regularisierte) Gap-Funktion
In diesem gesamten Abschnitt seien X Rn eine nichtleere, abgeschlossene und konvexe Menge sowie F W X ! Rn eine zumindest stetige Funktion. Wir betrachten wieder die Variationsungleichung VIP.X; F /: Finde ein x 2 X mit F .x /T .x x / 0 für alle x 2 X: Dieses Problem ist offenbar äquivalent dazu, einen Vektor x 2 X zu finden mit F .x /T .x x/ 0 für alle x 2 X: Diese Formulierung der Variationsungleichung VIP.X; F / ist für die Zwecke dieses und des folgenden Abschnittes manchmal angemessener. Die hier vorgestellten Ergebnisse basieren auf den Originalarbeiten [15, 32, 41] und stellen ein Analogon zu den Untersuchungen mit der (regularisierten) Nikaido-IsodaFunktion bei (G)NEPs dar, vergleiche Abschn. 7.1, 7.2 und 7.3.
144
8
Numerische Verfahren für VIPs
Definition 8.10
Die durch g.x/ WD supfF .x/T .x y/g y2X
definierte Funktion gW Rn ! R[fC1g heißt die der Variationsungleichung VIP.X; F / zugeordnete Gap-Funktion. Das folgende Lemma fasst die beiden wohl wichtigsten Eigenschaften der Gap-Funktion zusammen. Lemma 8.11 Sei g die Gap-Funktion von VIP.X; F /. Dann gelten: (a) g.x/ 0 für alle x 2 X. (b) x 2 X löst VIP.X; F / genau dann, wenn g.x / D 0 gilt. Beweis (a) Sei x 2 X beliebig. Dann gilt: g.x/ D supfF .x/T .x y/g F .x/T .x x/ D 0: y2X
(b) Sei x 2 Rn eine Lösung von VIP.X; F /. Dann ist x 2 X und es gilt F .x/T .x y/ 0 für alle y 2 X; also g.x/ D 0 wegen Teil (a). Sei umgekehrt x 2 X gegeben mit g.x/ D 0, also supfF .x/T .x y/g D 0: y2X
Daraus folgt F .x/T .x y/ 0 für alle y 2 X; d. h., x 2 X ist Lösung von VIP.X; F /.
Das Lemma 8.11 legt es nahe, die Variationsungleichung VIP.X; F / umzuformulieren als ein restringiertes Optimierungsproblem der Gestalt min g.x/ u. d. N. x 2 X: x
8.3 Die (regularisierte) Gap-Funktion
145
Dieses Optimierungsproblem hat jedoch einige Nachteile, da es der Gap-Funktion an einigen wünschenswerten Eigenschaften mangelt: Zum einen ist g im Allgemeinen nicht überall stetig differenzierbar, und zum anderen ist der Wertebereich der Gap-Funktion nicht notwendig endlich. Obgleich das letztgenannte Problem im Fall einer beschränkten und damit kompakten Menge X nicht zutrifft (in diesem Fall lässt sich das Supremum in der Definition der Gap-Funktion durch ein Maximum ersetzen), wollen wir auf die GapFunktion im Rahmen dieses Skriptes nicht weiter eingehen. Eine Modifikation der Gap-Funktion wird uns im Folgenden aber auf die so genannte regularisierte Gap-Funktion führen, die in diesem Abschnitt von zentraler Bedeutung ist. Hierfür verwenden wir wieder die in Abschn. 2.4 eingeführte gewichtete Norm p kxkG WD x T Gx mit G 2 Rnn symmetrisch positiv definit. Definition 8.12
Seien G 2 Rnn symmetrisch und positiv definit sowie ˛ > 0. Die durch n o ˛ g˛ .x/ WD max F .x/T .x y/ kx yk2G y2X 2 definierte Funktion g˛ W Rn ! R heißt die der Variationsungleichung VIP.X; F / zugeordnete regularisierte Gap-Funktion. Wir wollen im Folgenden zeigen, dass die regularisierte Gap-Funktion nicht mehr die weiter oben erwähnten Nachteile der Gap-Funktion besitzt. I Bemerkung 8.13 Setze
f˛ .x; y/ WD F .x/T .x y/
˛ kx yk2G : 2
Dann ist g˛ .x/ D max f˛ .x; y/: y2X
Da die Funktion f˛ .x; :/ gleichmäßig konkav bzgl. der y-Variablen ist, besitzt das Maximierungsproblem n o ˛ (8.12) max F .x/T .x y/ kx yk2G y2X 2 bzw. das hierzu äquivalente gleichmäßig konvexe Minimierungsproblem n o ˛ min F .x/T .y x/ C kx yk2G y2X 2
(8.13)
146
8
Numerische Verfahren für VIPs
aufgrund des Korollars 3.16 eine eindeutige Lösung für jedes feste x; d. h. g˛ .x/ ist stets wohldefiniert und endlich. Man beachte, dass der „Regularisierungsterm“ ˛2 kx yk2G in der Definition von g˛ hierbei von entscheidender Bedeutung ist. Im folgenden Resultat gehen wir auf eine explizite Darstellung der eindeutigen Lösung von (8.12) ein. Lemma 8.14 Seien G 2 Rnn symmetrisch und positiv definit sowie ˛ > 0 beliebig. Dann ist 1 H˛ .x/ WD PX;G x G 1 F .x/ ˛ die eindeutig bestimmte Lösung des Problems (8.12). Beweis Wie bereits erwähnt, ist das Maximierungsproblem (8.12) äquivalent zu dem Minimierungsproblem (8.13). Da sich die Lösung eines Minimierungsproblems durch Addition einer Konstanten und durch Multiplikation der Zielfunktion mit einer positiven Zahl nicht ändert, ist (8.13) wiederum äquivalent zu 2 1 T 2 T 1 (8.14) F .x/ .y x/ C kx ykG C 2 F .x/ G F .x/ I min y2X ˛ ˛ hierzu beachte man, dass nur bezüglich y minimiert wird und x daher konstant ist. Durch einfache Umformulierung der Zielfunktion in (8.14) erhält man die folgende äquivalente Formulierung von (8.14): 2 1 min y x G 1 F .x/ : (8.15) y2X G ˛ Per Definition ist 1 H˛ .x/ WD PX;G x G 1 F .x/ ˛ aber gerade die eindeutige Lösung von (8.15) und damit auch von (8.12).
Wir beweisen nun das Analogon des Lemmas 8.11 für die regularisierte Gap-Funktion. Lemma 8.15 Seien G 2 Rnn symmetrisch und positiv definit sowie ˛ > 0 beliebig. Sei ferner g˛ die regularisierte Gap-Funktion von VIP.X; F /. Dann gelten: (a) g˛ .x/ 0 für alle x 2 X. (b) x 2 X löst VIP.X; F / genau dann, wenn g˛ .x/ D 0 gilt.
8.3 Die (regularisierte) Gap-Funktion
147
Beweis (a) Es bezeichne H˛ .x/ wieder die im Lemma 8.14 definierte Lösung von (8.12), so dass sich die regularisierte Gap-Funktion g˛ schreiben lässt in der Form ˛ g˛ .x/ D F .x/T x H˛ .x/ kx H˛ .x/k2G : 2
(8.16)
Eine einfache algebraische Manipulation zeigt, dass sich g˛ auch wie folgt darstellen lässt: 2 2 1 1 ˛ 1 1 g˛ .x/ D x x G F .x/ H˛ .x/ x G F .x/ : G G 2 ˛ ˛ Da der erste Term gerade den Abstand (in der k:kG -Norm) von x ˛1 G 1 F .x/ zu x 2 X angibt und der zweite Term gerade der Abstand von x ˛1 G 1 F .x/ zu seiner Projektion H˛ .x/ auf X ist, vergleiche Lemma 8.14, ergibt sich unmittelbar die Behauptung (a). (b) Auf der anderen Seite ist g˛ .x/ D 0 genau dann, wenn diese beiden Abstände gleich sind, was notwendigerweise H˛ .x/ D x impliziert. Letzteres ist aufgrund des Lemmas 8.14 und des Satzes 3.6 aber äquivalent dazu, dass x die Variationsungleichung VIP.X; F / löst. Lemma 8.15 motiviert wieder, die Variationsungleichung VIP.X; F / als ein restringiertes Optimierungsproblem min g˛ .x/ u. d. N. x
x2X
(8.17)
aufzufassen. Wir wollen im Folgenden zeigen, dass es sich hierbei um ein stetig differenzierbares Optimierungsproblem handelt. Der Beweis dieser Aussage beruht wiederum auf dem Satz 7.4 von Danskin. Lemma 8.16 Seien X Rn nichtleer, abgeschlossen und konvex, G 2 Rnn symmetrisch und positiv definit, ˛ > 0 sowie F W X ! Rn stetig differenzierbar. Dann ist auch die regularisierte Gap-Funktion g˛ W X ! R stetig differenzierbar mit rg˛ .x/ D F .x/ C F 0 .x/T ˛G x H˛ .x/ :
Beweis Die Behauptung ergibt sich durch einfache Anwendung des Satzes 7.4 von Danskin. Hierzu sei nur daran erinnert, dass das Maximierungsproblem (8.12) die eindeutige und als Projektion stetige Lösung H˛ .x/ besitzt, siehe Lemma 8.14. Wir untersuchen als Nächstes die Frage, unter welchen Bedingungen an die Variationsungleichung VIP.X; F / ein stationärer Punkt des Optimierungsproblems (8.17) bereits ein globales Minimum und damit eine Lösung von VIP.X; F / ist. Diese Frage ist von zentraler praktischer Bedeutung, da die üblichen Optimierungsverfahren zur Lösung von (8.17) im Allgemeinen nur einen solchen stationären Punkt von (8.17) finden werden.
148
8
Numerische Verfahren für VIPs
Satz 8.17 Seien X Rn nichtleer, abgeschlossen und konvex, G 2 Rnn symmetrisch und positiv definit, ˛ > 0 sowie F W X ! Rn stetig differenzierbar. Sei x ein stationärer Punkt des Optimierungsproblems (8.17), d. h. rg˛ .x /T .x x / 0
(8.18)
für alle x 2 X (vgl. Lemma 2.20), so dass die Jacobi-Matrix F 0 .x / positiv definit ist. Dann löst x die Variationsungleichung VIP.X; F /. Beweis Aus (8.18) und Lemma 8.16 folgt T F .x / C .F 0 .x /T ˛G/.x H˛ .x // .x x / 0 für alle x 2 X. Speziell für x D H˛ .x / ist daher T F .x / ˛G x H˛ .x / .H˛ .x / x / T H˛ .x / x F 0 .x / H˛ .x / x :
(8.19)
Wegen Lemma 8.14 ist aber 1 H˛ .x / D PX;G x G 1 F .x / ; ˛ so dass sich aus dem Projektionssatz 2.25 ergibt: T 1 x G 1 F .x / H˛ .x / G x H˛ .x / 0 ˛ für alle x 2 X. Insbesondere für x D x ist damit T 1 x G 1 F .x / H˛ .x / G x H˛ .x / 0: ˛ Multiplikation mit ˛ > 0 liefert somit T F .x / ˛G.x H˛ .x // H˛ .x / x 0: Also folgt aus (8.19) sofort T H˛ .x / x F 0 .x / H˛ .x / x 0: Die positive Definitheit von F 0 .x / impliziert daher H˛ .x / D x ; so dass x in der Tat eine Lösung der Variationsungleichung VIP.X; F / ist aufgrund des Lemmas 8.14 und des Satzes 3.6.
8.3 Die (regularisierte) Gap-Funktion
149
Im Folgenden wollen wir noch andeuten, wie die regularisierte Gap-Funktion dazu benutzt werden kann, um das nur lokal konvergente Josephy-Newton-Verfahren aus dem vorigen Abschnitt zu globalisieren. Zu diesem Zweck betrachte wieder das im k-ten Schritt auftretende Teilproblem VIP.X; Fk /, wobei erneut Fk W Rn ! Rn die Linearisierung Fk .x/ WD F .x k / C F 0 .x k /.x x k / sei, vergleiche (8.3). Lemma 8.18 Sei X Rn nichtleer, abgeschlossen und konvex, G 2 Rnn symmetrisch und positiv definit, ˛ > 0 sowie F W X ! Rn stetig differenzierbar und gleichmäßig monoton mit Modulus > 0. Ist x k 2 X noch keine Lösung von VIP.X; F / und ist xN k die eindeutige Lösung des Teilproblems VIP.X; Fk /, so genügt der Vektor d k WD xN k x k der Ungleichung ˛ rg˛ .x k /T d k < kGk kd k k2 : 2 Insbesondere ist d k daher eine (zulässige) Abstiegsrichtung für g˛ , falls ˛kGk < 2 gilt. Beweis Aus Lemma 8.16 und d k D xN k x k ergibt sich durch Einfügen einer geeigneten Null: rg˛ .x k /T d k D F .x k /T .xN k x k / C .xN k x k /T F 0 .x k /T ˛G x k H˛ .x k / T D F .x k / C F 0 .x k /.xN k x k / .xN k x k / .xN k x k /T F 0 .x k /T .xN k x k / T C F .x k / C F 0 .x k /.xN k x k / .x k H˛ .x k // F .x k /T .x k H˛ .x k // ˛.xN k x k /T G.x k H˛ .x k // T D F .x k / C F 0 .x k /.xN k x k / .H˛ .x k / xN k / ˛ C F .x k /T .H˛ .x k / x k / C kH˛ .x k / x k /k2G 2 ˛ k T ˛ k T 0 k T k .d / F .x / d C .d / Gd k kxN k H˛ .x k /k2G : 2 2 Im Folgenden wollen wir die letzten drei Terme dieser Gleichungskette näher untersuchen. Da xN k das linearisierte Problem VIP.X; Fk / löst, gilt T F .x k / C F 0 .x k /.xN k x k / .H˛ .x k / xN k / 0:
150
8
Numerische Verfahren für VIPs
Auf der anderen Seite ist der zweite Term gleich g˛ .x k /, vergleiche (8.16). Da x k nach Voraussetzung noch keine Lösung von VIP.X; F / ist, folgt somit F .x k /T .H˛ .x k / x k / C
˛ kH˛ .x k / x k k2G < 0 2
wegen Lemma 8.15. Aus der gleichmäßigen Monotonie von F und Satz 2.15 ergibt sich ferner .d k /T F 0 .x k /T d k D .d k /T F 0 .x k /d k kd k k2 : Daher gilt aufgrund der Cauchy-Schwarzschen Ungleichung die folgende Abschätzung für den dritten Term: ˛ k T ˛ .d / Gd k kxN k H˛ .x k /k2G 2 2 ˛ k T k T 0 k T k .d / F .x / d C .d / Gd k 2 ˛ kGk kd k k2 : 2
.d k /T F 0 .x k /T d k C
Insgesamt folgt also ˛ rg˛ .x k /T d k < kGk kd k k2 : 2
Hieraus ergeben sich alle Behauptungen. Algorithmus 8 (Globalisiertes Josephy-Newton-Verfahren für VIP.X; F /)
(S.0) Wähle x 0 2 X; ˇ 2 .0; 1/; 2 .0; 1/; 2 .0; 1/; " 0; ˛ > 0; G 2 Rnn symmetrisch und positiv definit, und setze k WD 0. (S.1) Ist g˛ .x k / ": STOP (S.2) Definiere Fk .x/ WD F .x k / C F 0 .x k /.x x k /; bestimme xN k als Lösung von VIP.X; Fk / und setze d k WD xN k x k (S.3) Gilt g˛ .x k C d k / g˛ .x k /, setze tk WD 1. Andernfalls bestimme eine Schrittweite tk WD maxfˇ ` j ` D 0; 1; 2; : : :g mit g˛ .x k C tk d k / g˛ .x k / C tk rg˛ .x k /T d k : (S.4) Setze x kC1 WD x k C tk d k und k
k C 1; gehe zu (S.1).
8.4 Die D-Gap-Funktion
151
Das vorstehende Lemma motiviert Algorithmus 8. Ist F W X ! Rn stetig differenzierbar und gleichmäßig monoton und gilt ˛kGk < 2; so lässt sich zeigen, dass der Algorithmus 8 wohldefiniert ist und die durch ihn erzeugte Folge .x k /k gegen die eindeutig bestimmte Lösung x konvergiert, und zwar bei beliebiger Wahl des Startwertes x 0 2 X. Außerdem erbt der Algorithmus 8 die lokal quadratische Konvergenz des lokalen Josephy-Newton-Verfahrens, vergleiche [41].
8.4 Die D-Gap-Funktion Sei weiterhin X Rn eine nichtleere, abgeschlossene und konvexe Menge und F W Rn ! Rn . In diesem Abschnitt untersuchen wir eine Umformulierung der Variationsungleichung VIP.X; F / als ein unrestringiertes Minimierungsproblem. Von zentraler Bedeutung ist dabei die nachstehende Modifikation der regularisierten Gap-Funktion. Definition 8.19
Seien 0 < ˛ < ˇ zwei beliebig vorgegebene Parameter, G 2 Rnn symmetrisch und positiv definit sowie F W Rn ! Rn . Dann heißt die durch g˛ˇ .x/ WD g˛ .x/ gˇ .x/ definierte Funktion g˛ˇ W Rn ! R die der Variationsungleichung VIP.X; F / zugeordnete D-Gap-Funktion. Dabei bezeichnet g für 2 f˛; ˇg die regularisierte GapFunktion zum Parameter . Die D-Gap-Funktion wird aus g˛ .x/ also auf ähnliche Weise konstruiert wie die Abbildung V˛ˇ im Abschn. 7.3 aus der regularisierten Nikaido-Isoda-Funktion. Der Name „D-Gap-Funktion“ soll dabei andeuten, dass g˛ˇ gerade die Differenz zweier regularisierter Gap-Funktionen ist. Aus den uns bereits bekannten Eigenschaften der regularisierten Gap-Funktion können wir unmittelbar die folgende Bemerkung herleiten. I Bemerkung 8.20
(a) Die D-Gap-Funktion g˛ˇ ist stets wohldefiniert und endlich. (b) Ist F W Rn ! Rn stetig differenzierbar, so ist auch die D-Gap-Funktion g˛ˇ wegen Lemma 8.16 stetig differenzierbar mit rg˛ˇ .x/ D F 0 .x/T Hˇ .x/ H˛ .x/ C ˇG x Hˇ .x/ ˛G x H˛ .x/ ; wobei H .x/; 2 f˛; ˇg; die im Lemma 8.14 definierte Größe bezeichnet. Um zu zeigen, dass Nullstellen der D-Gap-Funktion ebenfalls Lösungen von VIP.X; F / charakterisieren, benötigen wir zunächst das folgende Hilfslemma.
152
8
Numerische Verfahren für VIPs
Lemma 8.21 Seien 0 < ˛ < ˇ zwei beliebig vorgegebene Parameter, G 2 Rnn symmetrisch und positiv definit sowie F W Rn ! Rn . Dann gilt für alle x 2 Rn ˇ˛ ˇ˛ kx Hˇ .x/k2G g˛ˇ .x/ kx H˛ .x/k2G : 2 2 Beweis Aus den Definitionen der D-Gap-Funktion und der regularisierten Gap-Funktion ergibt sich unmittelbar unter Verwendung des Lemmas 8.14 n o ˛ ˇ T 2 T 2 g˛ˇ .x/ D max F .x/ .x y/ kx ykG max F .x/ .x y/ kx ykG y2X y2X 2 2 ˛ T 2 F .x/ x Hˇ .x/ kx Hˇ .x/kG 2 ˇ T F .x/ x Hˇ .x/ C kx Hˇ .x/k2G 2 ˇ˛ D kx Hˇ .x/k2G 2 für alle x 2 Rn . Völlig analog lässt sich die rechte Ungleichung verifizieren, so dass wir hier auf die Details verzichten. Als unmittelbare Konsequenz des Lemmas 8.21 erhalten wir den nachstehenden und sehr wichtigen Satz. Satz 8.22 Seien 0 < ˛ < ˇ und G 2 Rnn symmetrisch und positiv definit. Sei ferner g˛ˇ die D-Gap-Funktion von VIP.X; F /. Dann gelten: (a) g˛ˇ .x/ 0 für alle x 2 Rn . (b) x 2 Rn löst VIP.X; F / genau dann, wenn g˛ˇ .x / D 0 gilt. Beweis Teil (a) ergibt sich unmittelbar aus der linken Ungleichung des Lemmas 8.21. Betrachte daher Teil (b). Gilt g˛ˇ .x/ D 0, so ist x D Hˇ .x/ wiederum aufgrund des Lemmas 8.21. Folglich ist x eine Lösung von VIP.X; F / aufgrund des Satzes 3.6 sowie des Lemmas 8.14. Ist umgekehrt x eine Lösung von VIP.X; F /, so ist aus denselben Gründen auch x D H˛ .x/. Daher ist g˛ˇ .x/ D 0 aufgrund der rechten Ungleichung im Lemma 8.21. Der Satz 8.22 besagt, dass man die Variationsungleichung VIP.X; F / als ein unrestringiertes Minimierungsproblem min g˛ˇ .x/; x
x 2 Rn ;
auffassen kann, das aufgrund der Bemerkung 8.20 (b) sogar stetig differenzierbar ist.
8.4 Die D-Gap-Funktion
153
Im Folgenden wollen wir ein hinreichendes Kriterium dafür angeben, dass ein stationärer Punkt der D-Gap-Funktion g˛ˇ bereits ein globales Minimum dieses Minimierungsproblemes und damit eine Lösung der Variationsungleichung VIP.X; F / ist. Dazu benötigen wir zunächst das nachstehende Resultat. Lemma 8.23 Seien 0 < ˛ < ˇ; G 2 Rnn symmetrisch und positiv definit sowie g˛ˇ die D-Gap-Funktion von VIP.X; F /. Dann gilt T Hˇ .x/ H˛ .x/ G ˇ x Hˇ .x/ ˛ x H˛ .x/ 0 für alle x 2 Rn . Beweis Sei x 2 Rn beliebig. In Analogie zur Bezeichnungsweise in der Bemerkung 8.20 setze f .x; y/ WD F .x/T .x y/
kx yk2G 2
für 2 f˛; ˇg. Dann ist H .x/ die Lösung des Problems max f .x; y/ y2X
oder, äquivalent, des Problems min f .x; y/; y2X
vergleiche das Lemma 8.14. Aufgrund des Lemmas 2.20 (a) ist daher H .x/ Lösung der Variationsungleichung VIP(X; ry f .x; y/). Wegen ry f .x; y/ D F .x/ G.x y/ ist daher T z H .x/ 0 F .x/ G x H .x/ für alle z 2 X. Insbesondere sind daher T Hˇ .x/ H˛ .x/ 0; F .x/ ˛G x H˛ .x/ T F .x/ ˇG x Hˇ .x/ H˛ .x/ Hˇ .x/ 0:
(8.20) (8.21)
154
8
Numerische Verfahren für VIPs
Nun ist
T Hˇ .x/ H˛ .x/ G ˇ x Hˇ .x/ ˛ x H˛ .x/ T D Hˇ .x/ H˛ .x/ ˇG x Hˇ .x/ F .x/ T C Hˇ .x/ H˛ .x/ F .x/ ˛G x H˛ .x/ 0
wegen (8.20) und (8.21), womit die Behauptung auch schon bewiesen ist.
Damit kommen wir zu dem angekündigten hinreichenden Kriterium dafür, dass ein stationärer Punkt der D-Gap-Funktion bereits eine Lösung der Variationsungleichung ist. Satz 8.24 Seien 0 < ˛ < ˇ; G 2 Rnn symmetrisch und positiv definit, F W Rn ! Rn stetig differenzierbar, g˛ˇ die D-Gap-Funktion von VIP.X; F / und x ein stationärer Punkt von g˛ˇ , so dass die Jacobi-Matrix F 0 .x / positiv definit ist. Dann ist x bereits eine Lösung von VIP.X; F /. Beweis Sei x 2 Rn ein stationärer Punkt von g˛ˇ . Wegen der Bemerkung 8.20 (b) ist dann 0 D rg˛ˇ .x / (8.22) D F 0 .x /T Hˇ .x / H˛ .x / C ˇG x Hˇ .x / ˛G x H˛ .x / : Multiplikation von links mit .Hˇ .x / H˛ .x //T liefert daher T 0 D Hˇ .x / H˛ .x / F 0 .x /T Hˇ .x / H˛ .x / T C Hˇ .x / H˛ .x / ˇG x Hˇ .x / ˛G x H˛ .x / : Der erste Summand ist nichtnegativ aufgrund der positiven Definitheit von F 0 .x / und der zweite Summand ist nichtnegativ wegen Lemma 8.23. Daher ist insbesondere T Hˇ .x / H˛ .x / F 0 .x / Hˇ .x / H˛ .x / D 0 und somit Hˇ .x / D H˛ .x /, da F 0 .x / nach Voraussetzung positiv definit ist. Aus (8.22) ergibt sich daher 0 D .ˇ ˛/G x H˛ .x / : Dies impliziert wegen ˛ ¤ ˇ und G positiv definit unmittelbar x D H˛ .x /. Wegen Lemma 8.14 und Satz 3.6 ist x dann eine Lösung von VIP.X; F /.
8.5 Verallgemeinerte KKT-Bedingungen
155
8.5 Verallgemeinerte KKT-Bedingungen Betrachte wieder die Variationsungleichung VIP.X; F /. In diesem Abschnitt werden aus den KKT-Bedingungen eines zugeordneten Optimierungsproblems die (verallgemeinerten) KKT-Bedingungen von VIP.X; F / hergeleitet. Das folgende Lemma ist dabei von zentraler Bedeutung. Lemma 8.25 Sei x 2 X eine Lösung von VIP.X; F /. Dann ist x 2 X auch eine Lösung des (von x abhängenden) Optimierungsproblems min f .x/ WD F .x /T .x x / x
u. d. N. x 2 X:
(8.23)
Beweis Da x 2 X die Variationsungleichung VIP.X; F / löst, gilt F .x /T .x x / 0
für alle x 2 X:
Folglich ist 0 D f .x / f .x/
für alle x 2 X;
d. h. x 2 X ist ein globales Minimum von (8.23).
Man beachte, dass das Lemma 8.25 im Folgenden zwar von großem theoretischen Interesse ist, dass die praktische Bedeutung insbesondere des zugeordneten Optimierungsproblems (8.23) allerdings nur sehr gering ist, da man die Zielfunktion f nicht kennt. Für den Rest dieses Abschnittes nehmen wir nun an, dass die zulässige Menge X der Variationsungleichung VIP.X; F / in der folgenden Gestalt geschrieben werden kann: X D fx 2 Rn j g.x/ 0; h.x/ D 0g;
(8.24)
wobei gW Rn ! Rm und hW Rn ! Rp stetig differenzierbare Funktionen sind. Ferner sei F W X ! Rn stetig. Die bislang stets geforderte Konvexität der Menge X wird in diesem Abschnitt nur indirekt und auch nicht immer eine Rolle spielen. Sie ergibt sich bei einigen (aber eben nicht allen) der nachfolgenden Resultate aus den Voraussetzungen an die Funktionen g und h. Wir beginnen zunächst mit einer Definition.
156
8
Numerische Verfahren für VIPs
Definition 8.26
Ein Tripel .x ; ; / 2 Rn Rm Rp heißt ein (verallgemeinerter) KKT-Punkt von VIP.X; F /, wenn es den folgenden so genannten (verallgemeinerten) KKT-Bedingungen von VIP.X; F / genügt: F .x/ C rg.x/ C rh.x/ D 0; g.x/ 0;
0;
g.x/T D 0;
(8.25)
h.x/ D 0: Die Vektoren und werden dann auch als (verallgemeinerte) Lagrange-Multiplikatoren von VIP.X; F / bezeichnet. Gibt es eine stetig differenzierbare Funktion f W X ! R mit F .x/ D rf .x/ für alle x 2 X, so stimmen die (verallgemeinerten) KKT-Bedingungen (8.25) offenbar überein mit den KKT-Bedingungen des Optimierungsproblems min f .x/ x
u. d. N. x 2 X:
Im Allgemeinen existiert eine solche Funktion f jedoch nicht. Wir werden die (verallgemeinerten) KKT-Bedingungen im Folgenden einfach als KKT-Bedingungen bezeichnen. Durch einfache Anwendung des Lemmas 8.25 auf die bekannten Ergebnisse aus der restringierten Optimierung ergeben sich die nachstehenden Sätze, vergleiche hierzu Abschn. 2.3 und [17, 42]. Satz 8.27 Sei x 2 X eine Lösung von VIP.X; F /, so dass die Mangasarian-Fromovitz-Bedingung MFCQ in x erfüllt ist. Dann existieren Lagrange-Multiplikatoren 2 Rm und 2 Rp , so dass das Tripel .x ; ; / ein KKT-Punkt von VIP.X; F / ist. Beweis Wegen Lemma 8.25 ist die Lösung x 2 X der Variationsungleichung VIP.X; F / ein globales Minimum des Optimierungsproblems (8.23). Da MFCQ in x erfüllt ist und X von der Gestalt (8.24) ist, existieren bekanntlich Lagrange-Multiplikatoren 2 Rm und 2 Rp mit rf .x / C rg.x / C rh.x / D 0; g.x / 0;
0;
g.x /T D 0; h.x / D 0:
Wegen rf .x / D F .x / folgt die Behauptung.
8.5 Verallgemeinerte KKT-Bedingungen
157
Man beachte wieder, dass der Satz 8.27 insbesondere auch dann gilt, wenn die MFCQBedingung durch die LICQ-Bedingung ersetzt wird, wobei in diesem Fall die LagrangeMultiplikatoren und außerdem eindeutig bestimmt sind. Analog zum Beweis des Satzes 8.27 erhält man das folgende Ergebnis unter Verwendung bekannter Resultate aus der Optimierungstheorie. Satz 8.28 Sei x 2 X eine Lösung von VIP.X; F /. Seien gW Rn ! Rm und hW Rn ! Rp affin-lineare Funktionen. Dann existieren Vektoren 2 Rm und 2 Rp ; so dass .x ; ; / ein KKT-Punkt von VIP.X; F / ist. Analog zum Beweis von Satz 8.27 lässt sich auch der nächste Satz herleiten. Satz 8.29 Sei x 2 X eine Lösung von VIP.X; F /. Seien hW Rn ! Rp affin-linear und jede Komponentenfunktion von gW Rn ! Rm konvex. Die Menge X genüge der SlaterBedingung. Dann existieren Vektoren 2 Rm und 2 Rp , so dass .x ; ; / ein KKT-Punkt von VIP.X; F / ist. Beweis Zum Beweis sei nur erwähnt, dass die im zugeordneten Optimierungsproblem (8.23) auftretende Zielfunktion f .x/ D F .x /T .x x / stets linear und somit insbesondere konvex ist. Also lässt sich ein bekanntes Optimalitäts kriterium der konvexen Optimierung anwenden. Nachdem wir in den Sätzen 8.27, 8.28 und 8.29 gezeigt haben, dass die KKT-Bedingungen unter geeigneten Voraussetzungen notwendige Bedingungen für eine Lösung x von VIP.X; F / darstellen, wollen wir als Nächstes auch ein hinreichendes Kriterium angeben. Satz 8.30 Sei .x ; ; / 2 Rn Rm Rp ein KKT-Punkt von VIP.X; F /. Seien hW Rn ! Rp affin-linear und alle Komponentenfunktionen von gW Rn ! Rm konvex. Dann ist x eine Lösung von VIP.X; F /. Beweis Unter den genannten Voraussetzungen ist das der Variationsungleichung VIP.X; F / zugeordnete Optimierungsproblem (8.23) konvex (beachte erneut: die Zielfunktion f .x/ D F .x /T .x x / ist stets konvex). Somit sind die KKT-Bedingungen für (8.23), welche mit den KKT-Bedingungen von VIP.X; F / übereinstimmen, bereits
158
8
Numerische Verfahren für VIPs
hinreichende Optimalitätsbedingungen für das Vorliegen eines (globalen) Minimums. Also folgt 0 D f .x / f .x/ D F .x /T .x x / für alle x 2 X; d. h. x löst VIP.X; F /.
Es sei ausdrücklich darauf hingewiesen, dass der Satz 8.30 ohne irgendwelche (Monotonie-) Voraussetzungen an die Funktion F gilt. Der Zusammenhang zwischen einer Variationsungleichung und ihren KKT-Bedingungen ist also stärker als bei Optimierungsproblemen. Insbesondere erhalten wir aus den Sätzen 8.28 und 8.30 die folgende Charakterisierung einer Lösung von VIP.X; F / im Falle von affin-linearen Restriktionen: Korollar 8.31 Seien gW Rn ! Rm und hW Rn ! Rp affin-linear. Dann ist ein Vektor x 2 X eine Lösung von VIP.X; F / genau dann, wenn es Vektoren 2 Rm und 2 Rp gibt, so dass .x ; ; / ein KKT-Punkt von VIP.X; F / ist. Die wohl erfolgreichsten Verfahren zur Lösung von Variationsungleichungen nutzen den engen Zusammenhang zwischen Variationsungleichungen und ihren KKT-Bedingungen aus und lösen tatsächlich die KKT-Bedingungen. Hierzu gehören insbesondere eine Reihe von Newton-ähnlichen Methoden. Deren Konvergenzuntersuchung bedarf allerdings Techniken aus der nichtglatten Analysis, vergleiche [10, 11]. Da (G)NEPs häufig keine isolierten Lösungen besitzen, liefern die für allgemeine VIPs sonst gut funktionierenden Newton-artigen Verfahren nicht zwangsläufig auch geeignete Lösungsmethoden für (G)NEPs, so dass hier oft weitere Modifikationen nötig sind, siehe z. B. [7, 9, 16].
8.6 Aufgaben 1. Sei X Rn nichtleer, abgeschlossen und konvex. Eine Abbildung F W X ! Rn heißt ko-koerziv, wenn es eine Konstante c > 0 gibt, so dass .F .x/ F .y//T .x y/ ckF .x/ F .y/j22
8x; y 2 X:
Zeigen Sie die folgenden Aussagen: (a) Ist F ko-koerziv mit Konstante c, so ist F Lipschitz-stetig mit Konstante L D 1c . (b) Ist F gleichmäßig monoton mit Konstante und Lipschitz-stetig mit Konstante L, dann ist F ko-koerziv mit Konstante c D L2 . (c) Die Abbildung x 7! PX .x/ ist ko-koerziv mit Konstante c D 1.
8.6 Aufgaben
159
2. Sei X Rn nichtleer, abgeschlossen und konvex und F W X ! Rn gleichmäßig monoton mit Konstante > 0 und Lipschitz-stetig mit Konstante L > 0. Betrachte für einen beliebigen Startwert x 0 2 X und Schrittweiten k > 0 mit lim k D 0
k!1
und
1 X
k D 1
kD0
die rekursiv definierte Folge .x k /k2N mit x kC1 WD PX x k k F .x k / : Zeigen Sie, dass die Folge .x k /k2N gegen die eindeutige Lösung x der Variationsungleichung VIP.X; F / konvergiert. Hinweis: Verwenden Sie x D PX .x k F .x // und zeigen Sie kx kC1 x k2 1 2 k C L2 k2 kx k x k2 : 3. Sei X Rn nichtleer, abgeschlossen und konvex. Eine Folge .x k /k2N Rn heißt Fejérmonoton2 bezüglich X , falls für alle k 2 N gilt kx kC1 xk kx k xk
8x 2 X
Zeigen Sie, dass für eine bezüglich X Fejér-monotone Folge .x k /k2N Rn gilt: (a) .x k /k2N ist beschränkt und dist x kC1 ; X dist x k ; X für alle k 2 N. N Gilt xN 2 X , dann ist die Folge .x k /k2N (b) .x k /k2N hat mindestens einen Häufungspunkt x. konvergent. (c) Die Folge PX .x k / k2N ist konvergent. (d) Die folgenden Aussagen sind äquivalent: (i) .x k /k2N konvergiert gegen xN 2 X . (ii) dist.x k ; X / k2N konvergiert gegen 0. (iii) x k PX .x k / k2N konvergiert gegen 0.
2
Leopold Fejér (1880–1959), Mathematiker (Analysis)
Literatur
1. J. Barzilai, J. M. Borwein, Two-point step size gradient methods. IMA J. Numer. Anal. 8(1), 141–148 (1988) 2. T. Ba¸sar, G. J. Olsder, Dynamic Noncooperative Game Theory (SIAM, 1998) 3. H. H. Bauschke, P. L. Combettes, Convex Analysis and Monotone Operator Theory in Hilbert Spaces. CMS Books in Mathematics, Bd. 408 (Springer, 2011) 4. S. C. Billups, Algorithms for Complementarity Problems and Generalized Equations, PhD thesis, University of Wisconsin-Madison, 1995 5. R. W. Cottle, J.-S. Pang, R. E. Stone, The Linear Complementarity Problem (SIAM, 2009) 6. M. Ehrgott, Multicriteria Optimization (Springer Science & Business Media, 2006) 7. F. Facchinei, A. Fischer, M. Herrich, An LP-Newton method: nonsmooth equations, KKT systems, and nonisolated solutions. Math. Progr. 146(1–2), 1–36 (2014) 8. F. Facchinei, A. Fischer, V. Piccialli, On generalized Nash games and variational inequalities. Oper. Res. Lett. 35(2), 159–164 (2007) 9. F. Facchinei, A. Fischer, V. Piccialli, Generalized Nash equilibrium problems and newton methods. Math. Progr. 117(1), 163–194 (2009) 10. F. Facchinei, J.-S. Pang, Finite-dimensional Variational Inequalities and Complementarity Problems, Volume I (Springer Science & Business Media, 2007) 11. F. Facchinei, J.-S. Pang, Finite-dimensional Variational Inequalities and Complementarity Problems, Volume II (Springer Science & Business Media, 2007) 12. F. Facchinei, V. Piccialli, M. Sciandrone, Decomposition algorithms for generalized potential games. Comput. Optim. Appl. 50(2), 237–262 (2011) 13. F. Facchinei, S. Sagratella, On the computation of all solutions of jointly convex generalized Nash equilibrium problems. Optim. Lett. 5(3), 531–547 (2011) 14. D. Fudenberg, J. Tirole, Game Theory (MIT Press, Cambridge, MA, 1991) 15. M. Fukushima, Equivalent differentiable optimization problems and descent methods for asymmetric variational inequality problems. Math. Progr. 53(1–3), 99–110 (1992) 16. L. Galli, C. Kanzow, M. Sciandrone, A nonmonotone trust-region method for generalized Nash equilibrium problems with strong convergence properties. Comput. Optim. Appl. 69(3), 629– 652 (2017) 17. C. Geiger, C. Kanzow, Theorie und Numerik restringierter Optimierungsaufgaben (Springer, 2013) 18. G. Gürkan, J.-S. Pang, Approximations of nash equilibria. Math. Progr. 117(1–2), 223–253 (2009) 19. A. Haurie, J. B. Krawczyk, An Introduction to Dynamic Games, Vorlesungsskript, 2000 20. H. Heuser, Lehrbuch der Analysis, Bd. 2. Mathematische Leitfäden, Bd. 13 (Teubner, Stuttgart, 1988) © Springer Nature Switzerland AG 2018 C. Kanzow, A. Schwartz, Spieltheorie, Mathematik Kompakt, https://doi.org/10.1007/978-3-319-96679-3
161
162
Literatur
21. A. von Heusinger, C. Kanzow, Optimization reformulations of the generalized Nash equilibrium problem using Nikaido-Isoda-type functions. Comput. Optim. Appl. 43(3),353–377 (2009) 22. W. W. Hogan, Point-to-set maps in mathematical programming. SIAM Rev. 15(3), 591–603 (1973) 23. J. Jerger, Spieltheorie Vorlesungsskript, Wirtschaftswissenschaftliche Fakultät, Universität Regensburg, 2006 24. N. H. Josephy, Newton’s method for generalized equations, Technical report, Mathematical Research Center, University of Wisconsin, Madison, WI, 1979 25. C. Kanzow, Optimierungsmethoden II Vorlesungsskript, Institut für Angewandte Mathematik und Statistik, Universität Würzburg, 2005 26. C. Kanzow, D. Steck, Augmented Lagrangian methods for the solution of generalized Nash equilibrium problems. SIAM J. Optim. 26(4), 2034–2058 (2016) 27. C. Kanzow, D. Steck, An example comparing the standard and modified augmented Lagrangian methods Operat. Res. Lett. 45(6), 598–603 (2017) 28. J. B. Krawczyk, S. Uryasev, Relaxation algorithms to find Nash equilibria with economic applications. Environ. Model. Assess. 5(1), 63–73 (2000) 29. C. E. Lemke, Bimatrix equilibrium points and mathematical programming. Manag. Sci. 11(7), 681–689 (1965) 30. C. E. Lemke, J. T. Howson, Jr., Equilibrium points of bimatrix games. J. Soc. Ind. Appl. Math. 12(2), 413–423 (1964) 31. O. L. Mangasarian, H. Stone, Two-person nonzero-sum games and quadratic programming. J. Math. Anal. Appl. 9(3), 348–355 (1964) 32. P. Marcotte, J.-P. Dussault, A note on a globally convergent Newton method for solving monotone variational inequalities. Oper. Res. Lett. 6(1), 35–42 (1987) 33. F. H. Murphy, H. D. Sherali, A. L. Soyster, A mathematical programming approach for determining oligopolistic market equilibrium. Math. Progr. 24(1), 92–106 (1982) 34. K. G. Murty, F.-T. Yu, Linear Complementarity, Linear and Nonlinear Programming. Sigma Series in Applied Mathematics, Bd. 3 (Heldermann, Berlin, 1988) 35. J. Nash, Non-cooperative games. Ann. Math. 54, 286–295 (1951) 36. H. Nikaidô, K. Isoda, Note on non-cooperative convex game. Pac. J. Math. 5(5), 807–815 (1955) 37. J. Outrata, M. Kocvara, J. Zowe, Nonsmooth Approach to Optimization Problems with Equilibrium Constraints: Theory, Applications and Numerical results. Nonconvex Optimization and Its Applications, Bd. 28 (Springer Science & Business Media, 2013) 38. J.-S. Pang, M. Fukushima, Quasi-variational inequalities, generalized nash equilibria, and multileader-follower games. Comput. Manag. Sci. 2(1), 21–56 (2005) 39. J. B. Rosen, Existence and uniqueness of equilibrium points for concave n-person games. Econometrica J. Econom. Soc. 33, 520–534 (1965) 40. W. Schlee, Einführung in die Spieltheorie: mit Beispielen und Aufgaben (Springer, 2013) 41. K. Taji, M. Fukushima, T. Ibaraki, A globally convergent newton method for solving strongly monotone variational inequalities. Math. Progr. 58(1), 369–383 (1993) 42. M. Ulbrich, S. Ulbrich, Nichtlineare Optimierung (Springer, 2012) 43. S. Uryasev, R. Y. Rubinstein, On relaxation algorithms in computation of noncooperative equilibria. IEEE Trans. Autom. Control 39(6), 1263–1267 (1994)
Sachverzeichnis
A Abbildung abgeschlossene, 53 mengenwertige, 53 B Beispiel Duopol-Modell, 10 Flussverschmutzung, 82, 110, 123 Gefangenendilemma, 2 Kampf der Geschlechter, 3 Oligopol-Modell, 4, 82, 97, 138, 143 Schere Stein Papier, 3 Beste-Antwort-Funktion, 9 C Constraint Qualifications, 37, 38 GNEP-EMFCQ, 128 E Existenzsatz von Nash, 65 Existenzsatz von Nikaido-Isoda, 54 F Fixpunktsatz von Banach, 136 von Brouwer, 47 von Kakutani, 54 Funktion gleichmäßig konvexe, 20 gleichmäßig monotone, 28 konkave, 28 konvexe, 20 monotone, 28 pseudokonvexe, 24 pseudomonotone, 33 quasikonvexe, 25
strikt konvexe, 20 strikt monotone, 28 G Gap-Funktion, 144 Differenz von, 151 regularisierte, 145 Gleichgewicht in dominanten Strategien, 13 in gemischten Strategien, 65, 68 Nash-, 8, 80 normalisiertes Nash-, 83 Pareto-, 15 K KKT-Bedingungen für Optimierungsprobleme, 37 für Variationsungleichungen, 89, 156 Komplementaritätsproblem, 44 Konvergenzgeschwindigkeit, 139 M Matrixspiel Sattelpunkt, 61 symmetrisches, 63 Wert, 61, 62 Minimumprinzip, 35 N Nikaido-Isoda-Funktion, 83, 108 Differenz von, 119 regularisierte, 111 P Projektion, 38 Projektionssatz, 39 163
164 S Satz von Danskin, 113 Spiel abzählbares, 5 Bi-Matrixspiel, 6, 68 einmaliges, 7 endliches, 5 Konstantsummen-, 5 kontinuierliches, 5 kooperatives, 6 Matrixspiel, 6, 59 mit vollständiger Information, 7 Normalform, 1 Nullsummen-, 5 Potentialspiel, 98 simultanes, 7 verallgemeinertes, 79 Strategische Äquivalenz, 12
Sachverzeichnis V Variationsungleichung, 43 Verfahren Barzilai-Borwein-Gradienten-, 123 Elimination dominierter Strategien, 14 Extragradientenverfahren für VIPs, 138 Gauß-Seidel-, 96, 99, 103 Jacobi-, 95 Josephy-Newton-, 139, 150 LCP-Formulierung für Bi-Matrixspiele, 75 LP-Formulierung für Matrixspiele, 66 Multiplier-Penalty-, 127 Projektionsverfahren für VIPs, 135 QP-Formulierung für Bi-Matrixspiele, 70 Relaxationsverfahren für GNEPs, 110 zur Bestimmung nicht-normalisierter Gleichgewichte, 125