http://index.hu/tudomany/til/2015/03/05/a_vilag_legszerencsesebb_embere_negyszer_utotte_meg_a_jackpotot/
Magamról annyit, hogy azon elvetemültek közzé tartozom, aki óvodás koromtól napjainkig (a negyvenediket töltöm idén) imádtam és imádom a matematikát, világ életemben kitűnő eredménnyel végeztem a kapcsolódó tárgyakat, az egyetemi matematika és statisztika szigorlatokkal bezárólag. Közgazdászként végeztem, e minőségemben tanultam gazdasági matematikát, operációkutatást, játékelméletet és gazdaságpszichológiát is, a játékelmélet terén faltam a szakirodalmat, amely sajnálatos módon a legfontosabb munkák tekintetében egy pár egyetemi jegyzettől eltekintve a mai napig csak angolul (vagy német nyelvű munkák angol fordításaiként) érhetőek el, kissé meglepő módon még a számos magyar matematikus szakirányú munkái is. Ezzel együtt nem vagyok sem matematikus, sem statisztikus, a témában járatos embernek tartom magam, de nem vagyok tévedhetetlen sem ebben, sem más témában, így minden vitára objektíven nyitott, a személyeskedéseknek viszont ellensége vagyok.
A legtöbb játékban, amely esetében a véletlen szerepet játszik, ismeretes a pechszéria fogalma. A nemzetközi szakirodalom ezt ’bad streak’, ’streak of bad luck’, vagy ’losing streak’ néven említi: akik angol nyelvtudás birtokában rákeresnek ezen fogalmak bármelyikére, számolatlanul találnak a témában tudományos igénnyel megírt munkák tucatjait éppúgy, mint amatőr vélemények és esetleírások ezreit. A legtöbb összeesküvés elmélet talán a pechszériák, közkeletűbb nevén ’szopóroller’ témában született a témában, így ennek egy külön cikket szánnék, ha lesz rá érdeklődés, „de még nem most… nem most…”
A legtöbb publikáció, különösen a tudományos alapossággal készült elemzések a póker világából származnak. Némi nemzeti érzelmű kikacsintással itt jegyezném meg, hogy talán nem erős úgy fogalmazni, hogy Neumann János játékelméleti munkásságát is nem kis mértékben póker iránti játékszenvedélyének köszönhetjük.
A póker a pechszériák elméletei megalapozása szempontjából azért nagyon jó példa, mert a véletlen, illetve a szerencse szerepét ebben a játékban senki számára nem kell magyarázni, ugyanakkor az amatőr játékosok többsége, míg a profi pókervilág egésze, tisztában van vele, hogy a pókerben a (játék)tudás és a képességek/készségek (analitikus képesség, emberismeret stb.) kimagasló fontosságú, és a nagyszámok törvénye alapján hosszú távon az nyer többet (azaz az maximalizálja a játékból származó nyereségét), aki jobb, tapasztaltabb, a játékot és ellenfelei stratégiáit (és azok ellenszerét) jobban ismerő játékos. Ezt a témát ha lesz érdeklődés majd kifejtem bővebben, elöljáróban annyit szögeznék le, hogy matematikailag igazolható, hogy a pechszériák (definiáljuk ezt bárhogy) minden összeesküvés-elmélettől függetlenül szükségszerű velejárói azoknak a játékoknak (eseményeknek), amelyekben a véletlen szerepet kap, összességében mégis igazolható, hogy a jobb képességű játékosokat ritkábban sújtja, mint a gyengébbeket, illetve átlagosan rövidebb pechszériák sújtják a hosszabbakkal szemben, azaz a hosszabb (nagyobb elemszámú) pechsorozatok kisebb valószínűséggel sújtják a jó játékosokat, mint a rosszabbakat. Ennek analógiájára a jobb játékosok nagyobb valószínűséggel számolhatnak azonos elemszámú győzelmi szériák bekövetkeztével, és ezzel el is érkeztünk oda, hogy kellően nagyszámú csata mellett az átlag reális (>a várható) értéket fogja mutatni.
Nem kívánok tudományos mélységekbe menni, de talán itt érdemes a nagyszámok törvényét, még ha konyhanyelven is, kifejteni, mert ez a kifejezés manapság gyakori a köznyelvben, mégsem közkeletű annak pontos jelentése, ami aztán számos téves következtetéshez vezet. Első cikkem éppen ezért erre a fogalomra, és ez ebből levonható konzekvenciákra fokuszál a továbbiakban.
A nagyszámok törvénye a matematika, azon belül is a valószínűség-számítás egyik tétele, amely azt mondja ki, hogy egy kísérletet (kellően) sokszor elvégezve az eredmények átlaga egyre közelebb lesz a várható értékhez. Nézzük meg a definícióban szereplő egyes fogalmakat közelebbről.
Kísérlet alatt egy véletlen esemény megfigyelését kell érteni. Pl. egy póker leosztás, vagy a WoT esetében egy csata. Olyan eseménysorozatoknál, amelyeknél a kimenetelek nem természeti törvények által determináltak (ezek nem is tárgyai a valószínűség-számításnak), hanem különböző valószínűséggel eltérő kimenetelek fordulhatnak elő, általános érvényű megállapítás, hogy „egy kísérlet nem kísérlet”.
De mit jelent, hogy „sokszor” elvégezve? A kísérletek olyan sorozata, amely az események, illetve a lehetséges kimenetelek számosságát figyelembe véve elegendő mintát, eredményt biztosítva alkalmas megalapozott következtetések levonására. Ezt nagyon fontos megérteni, hogy az „elegendő” minta számossága nagy mértékben függ a vizsgált esemény sorozat összetettségétől. Például a pénzfeldobás két lehetséges kimenetellel rendelkezik (fej vagy írás), így ha eltekintünk olyan tényezőktől, minthogy géppel (mindig azonos módon) vagy kézzel dobjuk-e fel (eltérő erővel és ívben), vagy van-e légmozgás, vagy tapad-e az érmére valahol kosz, akkor jóval kevesebb kísérlet elegendő a pénzfeldobás megfigyelésére és tapasztalati leírására, mint mondjuk a póker esetében az egyes leosztások elemzéséhez 4, 6, vagy akár 8 játékossal az asztal körül. Ez azért fontos, mert a vizsgált eseménysor összetettsége határozza meg, hogy mi az a minimális minta, amely alkalmas következtetések levonására, azaz mi az a minimálisan elvégzendő kísérletszám, amelyek eredménye már jó közelítéssel eredményezi a várható értéket. Az általában köztudott, hogy legalább 100 elemet számláló minta elvárhatónak tekinthető statisztikai elemzésekre, és ennél kevesebb mintával csak akkor lehet megelégedni, ha az adott eseménysor nagyon ritkán figyelhető meg (azaz nincs elegendő minta). Az elvárt eseményszám statisztikai módszerek segítségével meghatározható az események (kimenetelek) gyakorisága és az elvárt értékekhez kapcsolódó szórásfüggvények jellemzői alapján. Ez a vizsgált tényezők szempontjából eltérő mennyiségű mintát igényelhet akár ugyanazon játék esetében is. Például a játékosok egyedi statisztikái szempontjából (WR, WN8) ez nagyjából 1000 csatát igényel. Ugyanakkor a mindenkori WN8 „expected” értékek meghatározásához ez verziónként tankonként legalább 5 ezer csatát igényel, amelynél csak olyan játékosokat vesznek figyelembe, akik legalább 2500 csatát játszottak, az adott vizsgált tankkal pedig legalább 50 csatát mentek, a fiók szintű győzelmi arányuk pedig 50 és 57% közötti (kiszűrendő a szélsőséges játékosokat).
Ezzel együtt az igazán megbízható adathalmaz az elvárt értékek meghatározásához valahol 50-100 ezer csata környékén van, de ez az adathalmaz a jelenleg játékban található tankok nagyjából háromnegyedénél a verzióváltásokat követő 2 héten belül általában rendelkezésre áll.
Miért fontos a nagy számok törvénye?
Hiába megy valaki egy adott napon 50, vagy 100 csatát, vagy egy adott héten 500 csatát, statisztikai következtetések levonására még ez is kevés, és messzemenő következtetéseket csak az utolsó 1000 csata (vagy egyugyanazon tankkal kb. 100 csata) átlagában lehet levonni. Ez nem védőbeszéd sem a WG, sem a ’wotlabzos’ statisztikus fiúk védelmében: ez pusztán a tudományos megközelítés kritériuma. Azok a következtetések, amelyek esetében nem éri el ezt a méretű mintát a vizsgált események száma, az annál nagyobb spekuláció, minél kisebb méretű mintán vonták le a következtetéseket.
Megfordítva, statikus megközelítés esetén az utolsó ezer csata eredményei (átlaga) alapján megbecsülhető, hogy az adott játékosnak például mi a győzelemre vonatkozó várható értéke, azaz milyen eséllyel fog megnyerni egy adott csatát, illetve a következő lejátszott n csatában várhatóan milyen győzelmi arányt fog elérni. Ennél a statikus megközelítésnél jelenleg egyik statisztikai oldal sem vállalkozik összetettebb előrejelzésre, bár a wotlabs-on már elkezdtek cikkezni összetettebb statisztikai predikciós (előrejelzési) eszközök alapján kalkulált értékekről.
http://forum.wotlabs.net/index.php?/topic/13587-newcurrently-unnamed-rating-system/
Ez nagyon érdekes téma, de egyelőre tegyük félre, legyen elég annyi, hogy józan paraszti ésszel is könnyű belátni, hogy a statikus megközelítés torzít, mert nem veszi figyelembe az időhöz köthető változásokat. A statisztikus megközelítés nem veszi figyelembe, hogy a játékosok fejlődnek, és a fejlődésnek nem csak trendje, de „íve” is van. Van egy pont, ahol a játékosok fejlődése általában felgyorsul (nagyjából az átlagos értékek közelében), majd a személyes képességek korlátjához közeledve a fejlődés mértéke lelassul. A másik tényező, hogy nem mindegy milyen összetételű volt a vizsgált minta. Pl. hogy milyen tankokkal vagy milyen szinten játszotta a vizsgált személy az utolsó 1000 csatát. Könnyű belátni, hogy ha valaki Tiger II-vel 1500 csatát játszott, akkor az utolsó 1000 csatájának az eredménye elég jó közelítéssel alkalmas a következő 1000 csatájának az átlagos kimenetelét előrejelezni Tiger II tankban ülve. Megfordítva, ha valaki az utolsó 1000 csatáját 10 tankkal játszotta, egyenként mondjuk 100-100 csatát harcolva mindegyikben ötödik szinten, majd mindegyiket eladja, és a következő 1000 csatáját 10 db hatodik szintű tankban fogja tölteni, akkor az előző 1000 csatájának eredménye már csak kisebb-nagyobb torzítások mellett alkalmas a következő 1000 csata eredményének előrejelzésére. Nyilván a torzítás erősebb, ha olyan tankok következnek, amelyek fájdalmas fejlesztési fával rendelkeznek, illetve a legénységet tapasztalati veszteség mellett (ezüstért vagy ingyen) képezi át a játékos, de ha elfogadjuk, hogy jellemzően a fejlesztési ágakban pár kivételtől eltekintve hasonló tankok követik egymást, még ez is jobban alkalmazható predikció, mintha valaki 1000 TD-ben töltött csata után fejlesztési ágat váltva 1000 könnyű tankos csatával folytatja.
Ezen tényezők kiküszöbölésén dolgozik egy wotlabs-os (privát véleményem szerint kockafejű a szó jó értelmében) statisztikus, de attól eltekintve hogy a többi (akár magamfajta) kockafejűnek örömet okoz egy statisztikai predikció alapú összemérés, az átlag játékos számára semmivel sem lesz nagyobb információ értéke az így kreált értékeknek a WN8-hoz képest, mint ahogy annak idején WN8 bevezetése sem jelentett számottevő változást az átlag játékosnak a WN7-hez képest.
Összefoglalásképpen: a nagyszámok törvényének egyik közkeletű konyhanyelvi interpretációja, hogy figyelembe véve, hogy az idő a végtelenbe tart, egy absztrakt halhatatlan majom egy írógép előtt ülve akár kipötyögheti spontán Shakespeare összes művét irodalmi nyelven, de tudományos alapon ennek a matematikai valószínűsége ettől még konvergál a nullához. Ennek analógiájára, tetszőleges hosszúságú veszteség-sorozat elképzelhető azokban a játékokban, amelyekben a véletlen szerepet kap. Akár 100 csatán keresztül is veszthet valaki, de azon nem változtat egyetlen pechszéria sem, hogy több ezer csata átlagában a győzelmek aránya az adott egyén képességeire/játéktudására jellemző értéket vesz fel, és az utolsó 1000 csata eredménye alkalmas a jövőbeni teljesítményének becslésére (predikció), annál inkább, minél inkább azonos minta szerint választ a csatára a garázsban található tankjai közül.
"You've been thunderstruck."
TierX szinten ...