Týmto článkom by som Vás mohol otravovať serióznou štatistikou. Vymenovať základné pojmy, zadefinovať základné vzorce a prepočtami odvodzovať vypovedaciu hodnotu prieskumov preferencií. Skúsim to inak. Laicky, aby som to vysvetlil aj človeku bez štatistických znalostí
V štatistike existuje pojem Spoľahlivosť. Spoľahlivosť vyjadruje to, s akou pravdepodobnosťou nastane / nastal nejaký štatistický jav. Vyjadruje sa v percentách. Vo vede sa považuje vedecký dôkaz za akceptovaný, ak je preukázaný štatistikou kde je Spoľahlivosť nad 95% (štatisticky v rámci 3 sigma)
Toto je významné číslo z toho dôvodu, že ak sa nejaký jav preukáže štatisticky že platí pre obrovskú skupinu danej vzorku (Spoľahlivosť nad 95%), tak sa dá usudzovať, že to platí všeobecne pre celok
Aby ste si predstavili takýmto spôsobom bol napríklad odhalený v minulosti Higgsov bozón – „božská častica“ v kvantovej fyzike v CERNe. Nikto túto časticu nevidel a ani sa nijako nedá pozorovať priamo. Dajú sa zachytiť iba prejavy tejto častice. Sformulujú sa hypotézy a tie sa štatisticky potvrdzujú alebo vyvracajú výsledkami a kalkuláciou Spoľahlivosti na základe nameraných hodnôt prejavov vlastností. Ak vyšla vedcom Spoľahlivosť niekde 80-95%, tak je daný jav pravdepodobný, ale nie istý. Musia spresňovať svoje metódy merania tak, aby sa dostali nad 95%
Z laického hľadiska, aby bola spoľahlivosť vysoká, tak musí dôjsť
- k vysokému počtu meraní z celej meranej vzorky
- z tohto vysokého počtu musí dané množstvo vyhovovať – byť správne
Prieskumy preferencií hovoria o štatistickej odchýlke okolo 3%, ale nehovoria o Spoľahlivosti
Nebudem uvádzať štatistický postup, ale ak niekto povie, že na základe 1000 respondentov z 2 miliónov voličov „podľa štatistických metód“ štatisticky zistil prieskum, ktorý prezentuje so štandardnou odchýlkou okolo 3%, tak buď to
- robil so Spoľahlivosťou takmer 0%, alebo
- pri vysokej Spoľahlivosti zabudol použiť iné štatistické metódy
Všetky tieto prieskumy sú čírim nezmyslom a nevyjadrujú štatisticky takmer vôbec nič v realite. Na základe prieskumnej vzorky 1000 ľudí z 2 miliónov sa nedá urobiť žiaden seriózny prieskum s trošku významnejšou Spoľahlivosťou
Tu by som chcel uviesť, že všetky tieto prieskumy zavádzajú aj v tom, že ľudia si myslia, že to percento štatistickej odchýlky, ktoré tipnú – 3% znamená, že je to tip +-3%. Bohužiaľ to nie je tak. Ak by aj dosiahli štatistickú odchýlku okolo 3%, to neznamená výsledok +-3%
Ako to vlastne je? Ak chcete 95% Spoľahlivosť, tak tú štandardnú odchýlku musíte vynásobiť *3 (3 sigma). To znamená, že 95% Spoľahlivosť získate tak, že dané číslo napríklad pre nejakú stranu – napríklad že získa 10% upravíte na výsledok 10%+-3%*3, teda 10%+-9%, teda strana získa podľa odhadu od 1% do 19%.
To znamená, že aj prieskum, ktorý hovoril, že ĽSNS v posledných voľbách „neklamal“, pretože hovoril, že ĽSNS získa 1%+-9%, teda 0%-10%. Len bohužiaľ jedno je štatistika a vytiahnuté prezentované parametre a druhé je naše vnímanie a realita
Ako je potom vypovedací údaj, že daná strana získa 10%, ak ich prieskum ukázal (ak vôbec), že to znamená 1%-19%?
Celý článok doteraz sa zaoberal čisto štatistikou a nezaoberal sa tým kto, od koho, akým spôsobom atď získal informácie. A tu vidím najväčší priestor na manipulácie. Aby som zdôraznil neodbornosť metód používaných v našej spoločnosti pripájam link na článok. Tu sa jeden zástupca agentúry rozhovorom snaží obhájiť „pravdivosť“ exit pollov po voľbách a vyhovárať sa jednotlivý omyl či zlyhanie, hanblivosť voličov, či zmenami preferencií, aby si udržal kredibilitu takto podsúvaných prieskumov danou prieskumnou agentúrou. Pričom všimnite si ako sa agentúra pomýlila pri strane Smer už v exit pooloch o takmer 7% a nie to ešte v obyčajných prieskumoch. Dokonca už po podaní informácií od reálnych voliteľov je tento rozdiel obrovský. Aká je Spoľahlivosť potom prieskumov? Ak agentúry uvádzajú za odhadovaným percentom 2 desatinné čísla, tak to robia, aby zvyšovali svoju vnímanú odbornosť, pretože časť verejnosti sú puntičkári. Ale zo štatistického hľadiska je to ako keď do vane s vodou prilejete ešte pohár vody.
Veľmi dobrým príkladom boli naposledy exit pooly pri referende o Brexite, kde bola prognóza v smere Nie. N. Farage už ohlásil v noci po vyhlásení exit pollov svoju porážku. Do rána bolo všetko inak
Už bolo popísaných veľa článkov o metódach agentúr, ktoré tieto prieskumy vyrábajú na objednávku. Takisto aj prečo to robia. Chcel som len poukázať na to, že viera v takéto prieskumy aj zo štatistického hľadiska aj keby to chceli fakt dobre spraviť je pri použitých metódach veľmi kontroverzná