Kuklus statistikos žavesys: ką gali nuobodžiausiu vadinamas mokslas
Kaip „Netflix" atrenka filmus?
„Netflix" - amerikiečių filmų ir serialų srautinių transliacijų kompanija. Jos rekomendacijos kiekvienam konkrečiam žiūrovui pasižymi itin dideliu „pataikymų" procentu. O tokio taiklumo pagrindas yra meistriškas statistikos duomenų naudojimas.
Procesas vyksta taip: kino žiūrovas reitinguoja filmą, o programa įsimena įvertinimą. Paskui ji ieško tų, kas filmą įvertino taip pat, ir jau iš jų žiūrėtų filmų atrenka tuos, kuriuos jie įvertino taip pat gerai. Šie filmai ir rekomenduojami minėtam kino žiūrovui.
Kaip prekybos centras sužino apie nėštumą?
Kartą į prekybos centrą Amerikoje užėjo vyras pasiskųsti vadybininkui dėl įkyrios reklamos: savo pašto dėžutėje jis pradėjo nuolatos rasti lankstinukų su pasiūlymais būsimoms mamoms.
Bet to vyro dukrai ką tik sukako 18, todėl jų šeimai nėštumo klausimas visai nebuvo aktualus. Vadybininkas atsiprašė. Bet po kelių dienų tas vyras vėl paskambino ir dabar jau atsiprašė pats, nes pasirodė, kad jo dukra vis dėlto laukiasi.
Kaip kompanijos specialistai galėjo apie tai sužinoti anksčiau už šeimos narius? Tai - taip pat darbas su statistiniais duomenimis. Bendrovė buvo sudariusi dviejų dešimčių prekių, perkamų nėščių moterų, sąrašą, o šios pirkėjos buvo įtrauktos į atskirą nuolatinių parduotuvės klienčių registrą.
Kiekvieno naujo kliento pirkiniai buvo analizuojami ir lyginami su tuo prekių sąrašu. Jeigu pasirenkamos prekės pradeda sutapti, tai ir leidžia daryti atitinkamą išvadą.
Kaip įminti Mončio Holo mįslę?
Montis Holas (Monty Hall) - buvęs populiaraus Amerikos televizijos šou vedėjas. Žaidimo finale laimėtojui būdavo siūloma pasirinkti vienas iš trejų durų, už kurių yra pagrindinis prizas.
Dalyviui parodžius duris, vedėjas atverdavo vienas iš dviejų kitų, už kurių nieko nebūdavo, o paskui užduodavo svarbiausią klausimą: ar dalyvis nori pakeisti savo pradinį pasirinkimą ir rinktis antrąsias uždarytas duris?
Šis nelengvas uždavinys - iš tikimybių teorijos srities, susijusios su statistika. Pasirodo, pakeitęs sprendimą, finalininkas turėdavo 66 proc. šansų laimėti palyginus su pradiniais 33 procentais.
Kam reikalingi sudėtingi slaptažodžiai?
Pavyzdys su paskyrų ir elektroninio pašto slaptažodžiais - vienas elementariausių, bet suprantamai atskleidžiančių statistikos taikomąją vertę.
Jeigu į jūsų paskyrą niekada nebuvo įsilaužta, tai tikriausiai kada nors yra nutikę jūsų pažįstamiems. Mat daug kas iki šiol naudoja paprastą šešiaženklį slaptažodį, pavyzdžiui, gimimo datą. Parinkti tokį derinį kompiuteris galės per sekundės dalį, juk variantų - vos milijonas.
Tikimybė paskaičiuojama dauginant galimus skaičius, tai yra, šeši slaptažodžio skaičiai ir dešimt kiekvieno skaičiaus nuo 0 iki 9 reikšmių sudaro formulę 10x10x10x10x10x10=10 000 000 derinių. Todėl į slaptažodį įvesti simboliai ir raidės gerokai apsunkina uždavinį, nes derinių skaičius gali siekti daugybę trilijonų.
Kaip Holivudas sudaro filmų reitingus?
Dabar pažiūrėkime, kaip galima statistika manipuliuoti savo naudai. Pavyzdžiui, daugiausiai uždirbusių 2011 metų Holivudo filmų sąrašo pirmojoje vietoje yra „Įsikūnijimas", o penktąją užima „Šrekas". O kaip gi kino klasika ir tokie šedevrai kaip „Krikštatėvis" arba „Vėjo nublokšti"?
Holivudo užduotis - parodyti, kad kiekvienas naujas jo kūrinys yra geresnis už ankstesnįjį. Kartu taip kuriamas įvaizdis ir be perstojo pildomas biudžetas.
Norint išsiaiškinti tikrąjį vaizdą, reikia atsižvelgti į tokį veiksnį, kaip paklaida dėl infliacijos. Pagal šį - tikrąjį - vertinimą sąraše pirmautų „Vėjo nublokšti". „Įsikūnijimas" atsidurtų 14-oje vietoje, o „Šrekas" apskritai pradėtų tik ketvirtą šio sąrašo filmų dešimtį.
Ką statistika sako apie loterijas?
JAV loterijų istorijoje buvo du atvejai, kai tas pats žmogus dukart laimėjo pagrindinį loterijos prizą - milijoną dolerių. Tokio sutapimo tikimybė yra maždaug 1:27 000 000 000 000! Ką gi, pasitaiko ir taip, nors tokiu atveju tikriausiai reikėtų patikrinti laimės kūdikio giminystės ryšius su loterijos organizatoriais!
O šiaip laimėjimų loterijose tikimybė yra skaičiuojama sumuojant visų kategorijų prizų laimėjimų tikimybes.
Pavyzdžiui, jeigu bilietas kainuoja 1 dolerį, o pagrindinis 1000 dolerių prizas laimimas 1 kartą iš 4000, vidutinis laimėjimas bus lygus apie 56 ct.
Visai tikėtina, kad jūs, nusipirkę vieną ar du bilietus, atsitiktinai laimėsite 20 arba 200 dolerių. Na, bet jeigu nusipirksite tūkstantį bilietų, statistika nurungs hipotetinę sėkmę ir greičiausiai bendras jūsų laimikis sudarys tik 560 dolerių.
Testų rezultatai mokykloje
Statistika nepateikia vienareikšmiškų atsakymų, kuriuos būtų galima naudoti kaip geležinius įrodymus.
Užtat ji, remdamasi tikimybių teorija, nustato vienokių ar kitokių rezultatų tikimybės laipsnį.
Pavyzdžiui, jeigu mokinių testuose yra tam tikras skaičius neteisingų atsakymų, ištaisytų į teisingus, tai nerodo kokių nors mokytojų machinacijų. Bet kai tik norma yra gerokai viršijama, tai gali būti vertinama kaip signalas dėl jų nesąžiningumo.
Kitas pavyzdys: dauguma mokinių į klausimus atsako vienodai neteisingai. Tikimybė, kad neteisingą atsakymą visi nusirašė nuo vieno mokinio, yra daug didesnė negu tuo atveju, kai visi atsakymai būtų teisingi.
Ar prestižinis diplomas padeda gyvenime?
Tokie atsakymai statistikoje yra vieni sudėtingiausių ir suteikia daug peno protui. Tyrimus atliekant su Harvardo auklėtiniais, sunkiausia buvo surinkti kontrolinę grupę - tuos abiturientus, kurie turėjo galimybę įstoti į Harvardą, bet dėl kokių nors priežasčių ja nepasinaudojo.
Kontrolinė grupė visada yra būtina, kad būtų galima palyginti rezultatus su eksperimentine grupe.
O kaip rasti kontrolinę grupę, kai jos atrankos principas yra klausimas: kas būtų buvę, jeigu įvykiai būtų klostęsi priešingai?
Tai yra, į eksperimentinę grupę priėmus konkretų žmogų, įstojusį į Harvardą, kontrolinėje grupėje turi būti visiškai toks pat žmogus, bet neįstojęs studijuoti. Tik tada galima kalbėti apie gautųjų išvadų teisingumą.
Šiuo atveju tyrinėtojai nustatė tiesioginį studijų Harvarde ir vėlesnės sėkmės ryšį tik vaikų iš nepasiturinčių šeimų gyvenime. O dėl viso kito išvada pasirodė visiškai nebanali: aukštosios mokyklos pavadinimas diplome mažiau lemia tolesnę sėkmę negu gabumai, motyvacija ir ambicijos.
Ką dar gali statistika?
Statistika - sudėtingas mokslas, bet ji suteikia stebėtinų galimybių orientuotis šiuolaikiniame gyvenime.
Pavyzdžiui:
Kaip išskirti racionalų grūdą iš informacijos apie šalies gyventojų vidutines pajamas, kai tie duomenys statistiškai yra teisingi, bet neatspindi realios padėties?
Kaip tūkstančio žmonių apklausos pagrindu gauti duomenų apie visus gyventojus?
Kaip nustatyti, kas būtent sukelia ligas, bet kartu nedaryti eksperimentų su žmonėmis?
Kaip paskaičiuoti, ar policininkų arba gydytojų skaičiaus didėjimas mažina nusikalstamumą arba susirgimų skaičių?
Rašyti komentarą