Spieltheorie - ethik-und-anthropologie.de

Neben den Varianten von Tit fot Tat gibt es noch eine andere sehr starke Strategie, Pavlov genannt. Nach dieser verweigert man Kooperation, wenn der gegnerische Zug anders war als der eigene: „Wenn ich eine Belohnung für gemeinsame Zusammenarbeit erhalten habe, wiederhole ich meinen kooperativen Zug; wenn ich eine Bestrafung bekommen habe, weil wir beide einander betrügen wollten, versuche ich es wieder mit Zusammenarbeit. Nach einer Verlockung (wenn ich also den anderen erfolgreich hereingelegt habe) probiere ich das gleiche noch einmal: wenn ich den Schaden habe, also übertölpelt worden bin, kooperiere ich nicht wieder. […] Im englischen Telegrammstil: Win-stay, lose-shift.“[2] Sowohl Pavlov als auch Tit for Tat üben (maßvolle) Vergeltung. Ein Fehltritt bei zwei Pavlov-Spielern hat aber nur eine Runde von beidseitiger Verweigerung zur Folge, dann kehren beide (im Gegensatz zu Tit for Tat) zur Kooperation zurück. „Wenn ein Pavlov-Spieler freilich bemerkt, daß sein Gegenspieler nicht zurückschlägt, beutet er ihn konsequent aus. Auch das trägt zur Stabilität bei, denn dadurch können Spieler, die bedingungslos kooperieren, nicht Fuß fassen.

Dagegen behandelt eine Gemeinschaft nachsichtiger Tit-for-Tat-Spieler solche Gimpel nicht schlechter als ihresgleichen – eine sympathische Eigenschaft, die aber auf Dauer teuer zu stehen kommt. Denn dadurch können sich Spieler, die unfähig sind, zurückzuschlagen, in der Bevölkerung ausbreiten und sie gegen Ausbeuter anfällig machen.“[3] Andererseits kommen die Vorteile der Pavlov-Strategie „erst dann zur Geltung, wenn die Population durch andere strengere Strategien wie etwa Tit for Tat oder Grimm zum Kooperieren gebracht worden ist.“[4]

[1] Martin A. Nowak/Robert M. May/Karl Sigmund, Das Einmaleins des Miteinander, in: Spektrum der Wissenschaft 8/1995, S. 46–53, S. 51.
[2] A.O. S. 51f.
[3] A.O. S. 52.
[4] S. 50.

In einem weiteren Turnier wurden die guten Strategien weiter verfeinert. Dabei wurde auch eine Kündigungsmöglichkeit eingeräumt. Man kann wie im wirklichen Leben die weitere Kooperation aufkündigen, wenn man sich keinen Gewinn mehr verspricht. Die drei Sieger[1]:

„Ich kooperiere im ersten Zug und solange der andere kooperiert. Alle 20 Züge bestimme ich meine Gesamtpunktzahl und kündige, wenn meine Durchschnittsgewinn pro Zug unter 1,5 liegt. Wenn mein Gegner betrügt, eröffne ich eine Vergeltungsserie; wenn ich mich schon in einer solchen befinde, eröffne ich keine neue. Die erste Vergeltungsserie besteht aus einmal Betrügen plus zweimal Kooperieren, einerlei, was der andere tut. Jede folgende Vergeltungsserie ist länger als die vorige; die n-te besteht aus n(n+1)/2 mal Betrügen und zweimal Kooperieren. […] Sie wird zunehmend strenger gegen vorbestrafte Rückfalltäter, denn sie vergilt den ersten Betrug mit einmal Betrügen, den zweiten mit dreimal, den dritten mit sechsmal und so weiter. Nach einer Vergeltungsserie versucht sie den Übeltäter zu resozialisieren, indem sie Vertrauensvorschuß gewährt (zweimal kooperiert).“ (Bessere Strategie scheint zu sein, dem Gegner auch die Betrugsakte in den Vergeltungsserien anzurechnen.)
„Ich spiele nacheinander je fünf Züge von TIT FOR TAT, LIEB, GRIMMIG und PERIODISCH ZIEMLICH LIEB. Ich berechne die mittlere Punktzahl pro Zug für die letzten vier Züge jeder Serie. (*) Wenn der beste unter diesen Mittelwerten unter 1,5 liegt, kündige ich. Ansonsten spiele ich zwölf Züge der bisher besten Strategie. Aus den Ergebnissen dieser zwölf Züge berechne ich eine neue mittlere Punktzahl für die gespielte Strategie. Zurück nach (*). Diese Strategie ist zwar böse, denn sie betrügt unprovoziert innerhalb ihrer Periodisch-ziemlich-lieb-Phase. Aber das Risiko, das sie damit eingeht, wird offensichtlich aufgewogen durch die raffinierte Kombination von Test und Entscheidung, die sie praktiziert.“ (Bessere Strategie scheint zu sein: ich beginne die Testserie erst, wenn ich betrogen worden bin.)
„Am Anfang bin ich im Zustand ´friedlich´. In diesem Zustand spiele ich TIT FOR TAT; aber wenn mein Partner mich betrügt, werde ich sauer. Wenn ich im Zustand ´sauer´ bin und er kooperiert, werde ich wieder friedlich und kooperiere ebenfalls; aber wenn er mich betrügt, gerate ich in den Zustand ´wütend´. Wenn ich wütend bin, betrüge ich stets; wenn mein Gegner zwölfmal hintereinander betrogen hat, schaue ich nach, ob er bisher öfter betrogen als kooperiert hat. Wenn das der Fall ist, kündige ich; ansonsten nehme ich die Kooperation wieder auf und bin nur noch sauer. […] wenn sie wütend ist, versucht sie ihren Gegner auszubeuten, indem sie permanent betrügt; wenn er das nicht mit sich machen läßt – wovon sie ausgeht, nachdem er zwölfmal hintereinander betrogen hat -, gibt sie ihm eine letzte Chance, wenn er bis jetzt nicht zu böse war; wenn doch, gibt sie es auf.“ (Bessere Strategie scheint zu sein: Ich werde erst beim zweiten unfreundlichen Akt sauer.)

[1] Vgl. Jean-Paul Delahaye/Philippe Mathieu, Altruismus mit Kündigungsmöglichkeit, in: Spektrum der Wissenschaft 2/1998, S. 8–14.