Neben den Vari­an­ten von Tit fot Tat gibt es noch eine ande­re sehr star­ke Stra­te­gie, Pav­lov genannt. Nach die­ser ver­wei­gert man Koope­ra­ti­on, wenn der geg­ne­ri­sche Zug anders war als der eige­ne: „Wenn ich eine Beloh­nung für gemein­sa­me Zusam­men­ar­beit erhal­ten habe, wie­der­ho­le ich mei­nen koope­ra­ti­ven Zug; wenn ich eine Bestra­fung bekom­men habe, weil wir bei­de ein­an­der betrü­gen woll­ten, ver­su­che ich es wie­der mit Zusam­men­ar­beit. Nach einer Ver­lo­ckung (wenn ich also den ande­ren erfolg­reich her­ein­ge­legt habe) pro­bie­re ich das glei­che noch ein­mal: wenn ich den Scha­den habe, also über­töl­pelt wor­den bin, koope­rie­re ich nicht wie­der. […] Im eng­li­schen Tele­gramm­stil: Win-stay, lose-shift.“[2] Sowohl Pav­lov als auch Tit for Tat üben (maß­vol­le) Ver­gel­tung. Ein Fehl­tritt bei zwei Pav­lov-Spie­lern hat aber nur eine Run­de von beid­sei­ti­ger Ver­wei­ge­rung zur Fol­ge, dann keh­ren bei­de (im Gegen­satz zu Tit for Tat) zur Koope­ra­ti­on zurück. „Wenn ein Pav­lov-Spie­ler frei­lich bemerkt, daß sein Gegen­spie­ler nicht zurück­schlägt, beu­tet er ihn kon­se­quent aus. Auch das trägt zur Sta­bi­li­tät bei, denn dadurch kön­nen Spie­ler, die bedin­gungs­los koope­rie­ren, nicht Fuß fassen.

Dage­gen behan­delt eine Gemein­schaft nach­sich­ti­ger Tit-for-Tat-Spie­ler sol­che Gim­pel nicht schlech­ter als ihres­glei­chen – eine sym­pa­thi­sche Eigen­schaft, die aber auf Dau­er teu­er zu ste­hen kommt. Denn dadurch kön­nen sich Spie­ler, die unfä­hig sind, zurück­zu­schla­gen, in der Bevöl­ke­rung aus­brei­ten und sie gegen Aus­beu­ter anfäl­lig machen.“[3] Ande­rer­seits kom­men die Vor­tei­le der Pav­lov-Stra­te­gie „erst dann zur Gel­tung, wenn die Popu­la­ti­on durch ande­re stren­ge­re Stra­te­gien wie etwa Tit for Tat oder Grimm zum Koope­rie­ren gebracht wor­den ist.“[4]

[1] Mar­tin A. Nowak/Robert M. May/Karl Sig­mund, Das Ein­mal­eins des Mit­ein­an­der, in: Spek­trum der Wis­sen­schaft 8/1995, S. 46–53, S. 51.
[2] A.O. S. 51f.
[3] A.O. S. 52.
[4] S. 50.

In einem wei­te­ren Tur­nier wur­den die guten Stra­te­gien wei­ter ver­fei­nert. Dabei wur­de auch eine Kün­di­gungs­mög­lich­keit ein­ge­räumt. Man kann wie im wirk­li­chen Leben die wei­te­re Koope­ra­ti­on auf­kün­di­gen, wenn man sich kei­nen Gewinn mehr ver­spricht. Die drei Sie­ger[1]:

  1. „Ich koope­rie­re im ers­ten Zug und solan­ge der ande­re koope­riert. Alle 20 Züge bestim­me ich mei­ne Gesamt­punkt­zahl und kün­di­ge, wenn mei­ne Durch­schnitts­ge­winn pro Zug unter 1,5 liegt. Wenn mein Geg­ner betrügt, eröff­ne ich eine Ver­gel­tungs­se­rie; wenn ich mich schon in einer sol­chen befin­de, eröff­ne ich kei­ne neue. Die ers­te Ver­gel­tungs­se­rie besteht aus ein­mal Betrü­gen plus zwei­mal Koope­rie­ren, einer­lei, was der ande­re tut. Jede fol­gen­de Ver­gel­tungs­se­rie ist län­ger als die vori­ge; die n-te besteht aus n(n+1)/2 mal Betrü­gen und zwei­mal Koope­rie­ren. […] Sie wird zuneh­mend stren­ger gegen vor­be­straf­te Rück­fall­tä­ter, denn sie ver­gilt den ers­ten Betrug mit ein­mal Betrü­gen, den zwei­ten mit drei­mal, den drit­ten mit sechs­mal und so wei­ter. Nach einer Ver­gel­tungs­se­rie ver­sucht sie den Übel­tä­ter zu reso­zia­li­sie­ren, indem sie Ver­trau­ens­vor­schuß gewährt (zwei­mal koope­riert).“ (Bes­se­re Stra­te­gie scheint zu sein, dem Geg­ner auch die Betrugs­ak­te in den Ver­gel­tungs­se­ri­en anzurechnen.)
  2. „Ich spie­le nach­ein­an­der je fünf Züge von TIT FOR TAT, LIEB, GRIMMIG und PERIODISCH ZIEMLICH LIEB. Ich berech­ne die mitt­le­re Punkt­zahl pro Zug für die letz­ten vier Züge jeder Serie. (*) Wenn der bes­te unter die­sen Mit­tel­wer­ten unter 1,5 liegt, kün­di­ge ich. Ansons­ten spie­le ich zwölf Züge der bis­her bes­ten Stra­te­gie. Aus den Ergeb­nis­sen die­ser zwölf Züge berech­ne ich eine neue mitt­le­re Punkt­zahl für die gespiel­te Stra­te­gie. Zurück nach (*). Die­se Stra­te­gie ist zwar böse, denn sie betrügt unpro­vo­ziert inner­halb ihrer Peri­odisch-ziem­lich-lieb-Pha­se. Aber das Risi­ko, das sie damit ein­geht, wird offen­sicht­lich auf­ge­wo­gen durch die raf­fi­nier­te Kom­bi­na­ti­on von Test und Ent­schei­dung, die sie prak­ti­ziert.“ (Bes­se­re Stra­te­gie scheint zu sein: ich begin­ne die Test­se­rie erst, wenn ich betro­gen wor­den bin.)
  3. „Am Anfang bin ich im Zustand ´fried­lich´. In die­sem Zustand spie­le ich TIT FOR TAT; aber wenn mein Part­ner mich betrügt, wer­de ich sau­er. Wenn ich im Zustand ´sau­er´ bin und er koope­riert, wer­de ich wie­der fried­lich und koope­rie­re eben­falls; aber wenn er mich betrügt, gera­te ich in den Zustand ´wütend´. Wenn ich wütend bin, betrü­ge ich stets; wenn mein Geg­ner zwölf­mal hin­ter­ein­an­der betro­gen hat, schaue ich nach, ob er bis­her öfter betro­gen als koope­riert hat. Wenn das der Fall ist, kün­di­ge ich; ansons­ten neh­me ich die Koope­ra­ti­on wie­der auf und bin nur noch sau­er. […] wenn sie wütend ist, ver­sucht sie ihren Geg­ner aus­zu­beu­ten, indem sie per­ma­nent betrügt; wenn er das nicht mit sich machen läßt – wovon sie aus­geht, nach­dem er zwölf­mal hin­ter­ein­an­der betro­gen hat -, gibt sie ihm eine letz­te Chan­ce, wenn er bis jetzt nicht zu böse war; wenn doch, gibt sie es auf.“ (Bes­se­re Stra­te­gie scheint zu sein: Ich wer­de erst beim zwei­ten unfreund­li­chen Akt sauer.)

[1] Vgl. Jean-Paul Delahaye/Philippe Mathieu, Altru­is­mus mit Kün­di­gungs­mög­lich­keit, in: Spek­trum der Wis­sen­schaft 2/1998, S. 8–14.