In de jaren dertig werden John von Neumann en Oscar Morgenstern de grondleggers van een nieuwe en interessante tak van de wiskunde die 'speltheorie' wordt genoemd. In de jaren vijftig raakte de jonge wiskundige John Nash geïnteresseerd in deze richting. De theorie van het evenwicht werd het onderwerp van zijn proefschrift, dat hij schreef op 21-jarige leeftijd. Zo ontstond een nieuwe spelstrategie genaamd "Nash Equilibrium", die vele jaren later - in 1994 - de Nobelprijs won.
De lange kloof tussen het schrijven van een proefschrift en algemene erkenning is een test geworden voor een wiskundige. Genius zonder erkenning resulteerde in ernstige psychische stoornissen, maar John Nash was in staat om dit probleem op te lossen dankzij zijn uitstekende logische geest. Zijn Nash Equilibrium-theorie won een Nobelprijs en zijn leven werd gefilmd in Beautiful mind.
Kort over speltheorie
Aangezien de Nash-evenwichtstheorie het gedrag van mensen verklaart in de omstandigheden van interactie, is het de moeite waard om de basisconcepten van de speltheorie te overwegen.
Speltheorie bestudeert het gedrag van deelnemers (agenten) in termen van interactie met elkaar als een spel, waarbij de uitkomst afhangt van de beslissing en het gedrag van meerdere mensen. De deelnemer neemt beslissingen op basis van zijn voorspellingen over het gedrag van anderen, wat de spelstrategie wordt genoemd.
Er is ook een dominante strategie waarbij de deelnemer het beste resultaat krijgt voor elk gedrag van andere deelnemers. Dit is de beste win-winstrategie van de speler.
Prisoner's dilemma en wetenschappelijke doorbraak
Prisoner's dilemma is een geval van een spel waarbij deelnemers worden gedwongen om rationele beslissingen te nemen en een gemeenschappelijk doel te bereiken in het licht van een conflict van alternatieven. De vraag is welke van deze opties hij zal kiezen, rekening houdend met persoonlijk en algemeen belang, evenals de onmogelijkheid om beide te krijgen. De spelers lijken opgesloten te zitten in een moeilijke spelomgeving, waardoor ze soms erg productief denken.
Dit dilemma werd onderzocht door de Amerikaanse wiskundige John Nash. De balans die hij vond was op zijn eigen manier revolutionair. Deze nieuwe gedachte beïnvloedde bijzonder helder de mening van economen over hoe marktspelers keuzes maken, rekening houdend met de belangen van anderen, met nauwe interactie en kruising van belangen.
Het is het beste om speltheorie te bestuderen aan de hand van concrete voorbeelden, aangezien deze wiskundige discipline zelf niet droog theoretisch is.
Prisoner's dilemma voorbeeld
Bijvoorbeeld, twee mensen hebben een overval gepleegd, zijn in handen van de politie gevallen en worden in aparte cellen verhoord. Tegelijkertijd bieden politieagenten elke deelnemer gunstige voorwaarden waaronder hij wordt vrijgelaten als hij tegen zijn partner getuigt. Iederecriminelen hebben de volgende reeks strategieën die hij zal overwegen:
- Beiden getuigen tegelijkertijd en krijgen 2,5 jaar gevangenisstraf.
- Beiden zwijgen tegelijkertijd en krijgen elk 1 jaar, omdat in dit geval de bewijsbasis van hun schuld klein zal zijn.
- Een getuigt en wordt vrijgelaten, terwijl de ander zwijgt en 5 jaar gevangenisstraf krijgt.
Uiteraard hangt de uitkomst van de zaak af van de beslissing van beide deelnemers, maar ze kunnen het niet eens worden, omdat ze in verschillende cellen zitten. Het conflict van hun persoonlijke belangen in de strijd voor een gemeenschappelijk belang is ook duidelijk zichtbaar. Elk van de gevangenen heeft twee opties voor actie en vier opties voor resultaten.
Keten van logische gevolgtrekkingen
Dus, overtreder A overweegt de volgende opties:
- Ik zwijg en mijn partner zwijgt - we krijgen allebei 1 jaar gevangenisstraf.
- Ik geef mijn partner aan en hij geeft mij aan - we krijgen allebei 2,5 jaar gevangenisstraf.
- Ik zwijg en mijn partner verraadt me - ik krijg 5 jaar gevangenisstraf en hij komt vrij.
- Ik overhandig mijn partner, maar hij zwijgt - ik krijg vrijheid en hij krijgt 5 jaar gevangenisstraf.
Laten we voor de duidelijkheid een matrix van mogelijke oplossingen en uitkomsten geven.
Tabel met mogelijke uitkomsten van het prisoner's dilemma.
De vraag is, wat zal elke deelnemer kiezen?
"Zwijg, je kunt niet praten" of "Je kunt niet zwijgen, je kunt niet praten"
Om de keuze van de deelnemer te begrijpen, moet je de keten van zijn gedachten doorlopen. In navolging van de redenering van crimineel A: als ik zwijg en mijn partner zwijgt, dan krijgen we een minimale termijn (1 jaar), maar ikIk weet niet hoe hij zich zal gedragen. Als hij tegen mij getuigt, kan ik maar beter getuigen, anders kan ik 5 jaar gaan zitten. Ik ga liever 2,5 jaar zitten dan 5 jaar. Als hij zwijgt, dan moet ik des te meer getuigen, want zo krijg ik mijn vrijheid. Deelnemer B.
Het is niet moeilijk om te zien dat de dominante strategie voor elk van de daders is om te getuigen. Het optimale punt van dit spel komt wanneer beide criminelen getuigen en hun "prijs" ontvangen - 2,5 jaar gevangenisstraf. De speltheorie van Nash noemt dit evenwicht.
Niet-optimale optimale Nash-oplossing
De revolutionaire aard van de Nashiaanse visie is dat zo'n evenwicht niet optimaal is als je kijkt naar de individuele deelnemer en zijn eigenbelang. De beste optie is tenslotte om te zwijgen en vrijuit te gaan.
Nash-evenwicht is een punt van convergentie van belangen, waarbij elke deelnemer alleen de optie kiest die voor hem optimaal is als andere deelnemers een bepaalde strategie kiezen.
Gezien de optie wanneer beide criminelen zwijgen en slechts 1 jaar krijgen, kunnen we het een Pareto-optimale optie noemen. Het is echter alleen mogelijk als de criminelen van tevoren akkoord kunnen gaan. Maar zelfs dit zou deze uitkomst niet garanderen, aangezien de verleiding groot is om zich terug te trekken uit de overeenkomst en straf te vermijden. Het gebrek aan volledig vertrouwen in elkaar en het gevaar om 5 jaar gedwongen te worden voor de optie met erkenning te kiezen. Denk na over waar deelnemers zich aan zullen houdenoptie met stilte, in overleg handelen, is gewoon irrationeel. Een dergelijke conclusie kan worden getrokken als we het Nash-evenwicht bestuderen. Voorbeelden bewijzen alleen maar dat je gelijk hebt.
Egoïstisch of rationeel
De Nash Equilibrium Theory leverde verrassende conclusies op die de eerder bestaande principes weerlegden. Zo beschouwde Adam Smith het gedrag van elk van de deelnemers als volkomen egoïstisch, waardoor het systeem in evenwicht kwam. Deze theorie werd de 'onzichtbare hand van de markt' genoemd.
John Nash zag dat als alle deelnemers handelen in hun eigen belang, dit nooit tot een optimaal groepsresultaat zal leiden. Aangezien rationeel denken inherent is aan elke deelnemer, is de keuze die wordt geboden door de Nash-evenwichtsstrategie waarschijnlijker.
Puur mannelijk experiment
Een goed voorbeeld is het blonde paradox-spel, dat, hoewel schijnbaar niet op zijn plaats, een duidelijke illustratie is van hoe de Nash-speltheorie werkt.
In dit spel moet je je voorstellen dat een gezelschap van gratis jongens naar een bar kwam. In de buurt is een gezelschap van meisjes, waarvan er een de voorkeur heeft boven anderen, zeg maar een blondine. Hoe handelen jongens om de beste vriendin voor zichzelf te krijgen?
Dus de redenering van de jongens: als iedereen kennis begint te maken met de blondine, zal waarschijnlijk niemand het begrijpen, dan zullen haar vrienden geen kennis willen maken. Niemand wil de tweede fallback zijn. Maar als de jongens ervoor kiezen om te vermijden?blond, dan is de kans voor elk van de jongens om een goede vriendin onder de meisjes te vinden groot.
De Nash-evenwichtssituatie is niet optimaal voor mannen, omdat iedereen, die alleen zijn eigen egoïstische belangen nastreeft, voor de blondine zou kiezen. Het is duidelijk dat het nastreven van alleen egoïstische belangen neerkomt op de ineenstorting van groepsbelangen. Nash-evenwicht betekent dat elke man handelt in zijn eigen belangen, die in contact staan met de belangen van de hele groep. Dit is niet de beste optie voor iedereen persoonlijk, maar de beste voor iedereen, gebaseerd op de algemene strategie voor succes.
Ons hele leven is een spel
Besluitvorming in de echte wereld lijkt veel op een spel waarbij je ook bepaald rationeel gedrag van andere deelnemers verwacht. In zaken, op het werk, in een team, in een bedrijf en zelfs in relaties met het andere geslacht. Van grote deals tot alledaagse situaties, alles gehoorzaamt aan de ene of de andere wet.
Natuurlijk zijn de bovenstaande spelsituaties met criminelen en een bar gewoon uitstekende illustraties die het Nash-evenwicht demonstreren. Voorbeelden van dergelijke dilemma's doen zich vaak voor in de echte markt, en dit werkt vooral in gevallen waarin twee monopolisten de markt beheersen.
Gemengde strategieën
Vaak zijn we niet bij één, maar bij meerdere games tegelijk betrokken. Het kiezen van een van de opties in het ene spel, geleid door een rationele strategie, maar je komt in een ander spel terecht. Na een paar rationele beslissingen kan het zijn dat je resultaat niet naar wens is. Watnemen?
Laten we eens kijken naar twee soorten strategieën:
- Pure strategie is het gedrag van de deelnemer, dat voortkomt uit het nadenken over het mogelijke gedrag van andere deelnemers.
- Gemengde strategie of willekeurige strategie is de willekeurige afwisseling van pure strategieën of de keuze van een pure strategie met een bepaalde waarschijnlijkheid. Deze strategie wordt ook wel randomized genoemd.
Rekening houdend met dit gedrag, krijgen we een nieuwe kijk op het Nash-evenwicht. Als eerder werd gezegd dat de speler één keer een strategie kiest, dan is een ander gedrag denkbaar. Er kan worden aangenomen dat de spelers willekeurig een strategie kiezen met een bepaalde waarschijnlijkheid. Games die Nash-evenwichten niet kunnen vinden in pure strategieën, hebben ze altijd in gemengde strategieën.
Nash-evenwicht in gemengde strategieën wordt gemengd evenwicht genoemd. Dit is een evenwicht waarbij elke deelnemer de optimale frequentie kiest om zijn strategieën te kiezen, op voorwaarde dat andere deelnemers hun strategieën met een bepaalde frequentie kiezen.
Sancties en gemengde strategie
Een voorbeeld van een gemengde strategie is te vinden in het voetbalspel. De beste illustratie van een gemengde strategie is misschien wel een strafschoppenserie. We hebben dus een keeper die maar in één hoek kan springen en een speler die de pen alty neemt.
Dus, als de speler de eerste keer de strategie kiest om in de linkerhoek te schieten, en de keeper v alt ook in deze hoek en vangt de bal, hoe kunnen de dingen zich dan de tweede keer ontwikkelen? Als de spelerin de tegenovergestelde hoek zal raken, is dit waarschijnlijk te voor de hand liggend, maar slaan in dezelfde hoek is niet minder voor de hand liggend. Daarom hebben zowel de keeper als de kicker geen andere keuze dan te vertrouwen op willekeurige selectie.
Dus door willekeurige selectie af te wisselen met een bepaalde pure strategie, proberen de speler en de keeper het maximale resultaat te behalen.