Štítky článku: •  

Ošidnost statistiky

Statistický úřad poskytuje periodicky nějaké výstupy zpracování statistických dat. Jedním z dosti iritujících výstupů je výše průměrné mzdy v ČR.

Jedním z výstupů, který Statistický úřad dává k dispozici je oborová struktura zaměstnanosti a příslušné mzdy v daném oboru:

g1-dle-cetnosti.png (54,428 kiB)
Graf G1a seřazený podle četnosti (počtu zaměstnanců v oboru)
g1-dle-prumeru.png (54,123 kiB)
Graf G1b seřazený podle průměrné mzdy
g1-dle-medianu.png (54,375 kiB)
Graf G1c seřazený podle mediánu

Z uvedených tabulek je patrná diskrepance mezi kupeckým průměrem a mediánem zejména v oborech profesní, vědecké a technické činnosti: medián nám odhaluje vysoké procento nekvalifikovaných, resp. špatně placených zaměstnanců. Podobně ve stavebnictví a v obchodu a opravárenství.

Lze odvodit, že i v oboru peněžnictví a bankovnictví existuje malá skupina špičkově placených bankéřů a poměrně veliká masa o mnoho hůře placených přepážkových zaměstnanců.

Podobně můžeme odvodit ze srovnání průměru a mediánu, že značné rovnostářství panuje zejména ve státním sektoru: počínaje veřejnou správou, přes zdravotní a sociální péči, zdravotnictví,vzdělávání až po kulturní a zábavní činnosti.

Dalším závěrem je, že třetí nejlépe placenou oborovou skupinou je výroba a rozvod energií. Není bez zajímavosti, že obor je polostátní a tzv. „přirozeně“ monopolní.

Co nám do statistiky vnesl medián?

A co to je medián?

Kdysi dávno ve škole Vás naučili dělat nějaké globální závěry ze skupiny dat pomocí kupeckého průměru. Jeho vypovídací schopnost je však malá až žádná. Mějme příklad: 1 celá husa a 4 strávníci. Jenže Otesánek sežere husu celou a ostatní 3 neolíznou ani kost.

Podívejme se na srovnávací tabulku:

Část husy Průměr Medián Kvartily Význam
Otesánek 1 0,25 0 1 = MAXIMUM
2. člověk 0 0,25 0 0,25 = 3. kvartil
3. člověk 0 0,25 0 0 = MEDIAN
4. člověk 0 0,25 0 0 = 1. kvartil
0 = MINIMUM

Vidíme, že v průměru se všichni dobře najedli.

Daleko lepším způsobem analýzy vstupních dat jsou statistické metody medián (střední hodnota ze skupiny podle velikosti seřazených hodnot). Další statistická zpracování množiny vstupních dat jsou decily – seřazená skupina dat je rozdělena na desetiny (MS Excel decil nedovede vypočítat) a percentil– seřazená skupina dat je rozdělena na kvantifikační setiny (0,00-1,00).

Výklad kvantilů viz Wikipedie

S užitím mediánu tedy vidíme, že střední hodnotou množiny strávníků je hlad. Kvartil nám na stejná vstupní data poskytuje jiný pohled: Otesánek měl maximum z možného, 2. člověk cítil, jak husa voní a slyšel Otesánka mlaskat. Ostatní hlady šilhají.

Vraťme se ale zpět ke mzdám:

  1. Nutno konstatovat, že Statistický úřad sady vstupních dat úzkostlivě tají. Zřetelně z důvodu, aby někdo nepoužil průkaznější analýzu.
  2. Data, která jsou k dispozici, jsou už státním úřadem „předžvýkána“.
  3. Ani kontrolní součty a průměry výstupu SÚ neodpovídají tabulce. (viz. tabulka)
  4. Stále se ale pohybujeme pouze ve mzdové sféře. Kde jsou ostatní subjekty???
Sekce CZ-NACE osob průměr medián
Zemědělství, lesnictví a rybářství 89 300 17 491,78 Kč 16 025,89 Kč
Těžba a dobývání 33 200 29 509,81 Kč 26 147,21 Kč
Zpracovatelský průmysl 1 001 900 23 572,86 Kč 19 962,84 Kč
Výroba a rozvod elektřiny, plynu, tepla 27 600 44 500,41 Kč 31 979,63 Kč
Zásobování vodou, činnosti související s odpady 48 700 22 608,07 Kč 20 219,65 Kč
Stavebnictví 209 000 22 105,95 Kč 18 039,20 Kč
Obchod, opravy motorových vozidel 459 500 22 194,98 Kč 16 695,32 Kč
Doprava a skladování 229 400 23 806,78 Kč 20 895,28 Kč
Ubytování, stravování a pohostinství 102 700 13 003,02 Kč 10 601,64 Kč
Informační a komunikační činnosti 93 100 45 602,27 Kč 33 825,61 Kč
Peněžnictví a pojišťovnictví 66 600 54 634,03 Kč 35 319,45 Kč
Činnosti v oblasti nemovitostí 45 400 21 052,14 Kč 17 788,83 Kč
Profesní, vědecké a technické činnosti 142 900 29 067,33 Kč 21 145,95 Kč
Administrativní a podpůrné činnosti 130 500 16 991,75 Kč 12 976,56 Kč
Veřejná správa, obrana, sociální zabezpečení 268 500 25 785,98 Kč 23 927,89 Kč
Vzdělávání 264 500 22 328,13 Kč 21 340,99 Kč
Zdravotní a sociální péče 253 900 24 394,60 Kč 21 450,80 Kč
Kulturní, zábavní a rekreační činnosti 47 100 19 591,53 Kč 18 430,71 Kč
Ostatní činnosti 42 800 19 678,27 Kč 16 938,75 Kč
Celkem 3 556 600 24 209,12 Kč 19 940,23 Kč
Medián 22 608,07 Kč 20 219,65 Kč
Průměr 26 206,30 Kč 21 248,01 Kč

Zjednodušeně řečeno: výstupy ČSÚ jsou „hausnumera“ vycházející ze zvolené metodiky podle požadovaného výstupu. (Kým, proč? Cui bono?)

Na základě zaměstnaneckých mezd ČSÚ jsem si vytvořil náhodnou skupinu dat, do které jsem ale zahrnul i skupinu lidí žijících pod existenčním minimem, skupinu velmi podprůměrných mezd, skupinu podprůměrných, skupinu nadprůměrných a skupinu velmi nadprůměrných (tedy Martinů Romanů, Fejků apod.). Kvantifikace je čistě mojí svévolí, ale ze zkušenosti a z praktického života jsem se snažil být co nejobjektivnější. Berte to jako teoretickou studii statistiky.

Z této skupiny 284 pseudonáhodných dat můžeme učinit řadu závěrů:

Průměr
Mzdy 55 776,51 Kč

Průměrná mzda je čistou lží.

Medián
Mzdy 12 768,50 Kč

Medián sice ukazuje, že velká masa lidí žije v podprůměru (střední hodnota je o mnoho nižší, než průměr), ale až tak zásadní úhel pohledu nám medián vlastně neposkytuje.

1. kvartil 2. kvartil 3. kvartil 4. kvartil
Mzdy 9 679,25 Kč 12 768,50 Kč 18 085,00 Kč 2 920 459,00 Kč

Kvartily nám ukazují v podstatě čtvrtinu obyvatel s velmi malou mzdou (příjmem), čtvrtinu obyvatel s podprůměrnou mzdou, atd.

g2-kvartil.png (6,888 kiB)
Graf G2 podle kvartilu
Percentil/Kč
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Mzdy 2 051 6 665 8 822 10 228 11 486 12 768 14 840 16 537 21 574 43 358 2 920 459

Decily Excel neumí, tedy jsem použil percentily se škálou 0 – 1 po 0,1. Z tabulky můžeme dovodit, že desetina občanů žije pod existenčním minimem, cca 8/10 obyvatel žije pod tím statistickým průměrem a jedna desetina je nad vodou a jedna desetina je za vodou. (Omlouvám se za nepřesnost, ale to je vina absence decilu v Excelu.) Meritum je zachováno.

g2-percentil.png (16,443 kiB)
Graf G2 podle percentilu

Pokud jste sledovali vývody, pak je Vám jasné, že stejnou skupinu vstupních dat můžete interpretovat řadou metod, z nichž každá je jen více, nebo méně pravdivá. Soudím, že kdyby ČSÚ interpretoval vstupní data pomocí decilů, lépe bychom pochopili (v součinnosti s tabulkou struktury zaměstnanců), kde leží problémy.

Sociální nůžky jsou rozevřeny k prasknutí. A na jedné čepeli sedí Babiš & spol., na druhé pracující této země. A mezi nimi je „střední pseudotřída“ státních zaměstnanců. Asi nastal čas na střih. Možná lepší slovo je kastrace.

Autor článku: | Vydáno: | Přečteno: 2 504 × | Prestiž Q1: 12,92

+22 plus Známkuj článek minus –0

Interní diskuse

Komentáře

Článek má 0 komentářů.

Pravidla pro diskutující

Přidáním komentáře souhlasíte s tím, že budete dodržovat základní pravidla slušné výměny názorů. Vítám jejich střet, ale snažte se je vždy vést v rámci kultivované debaty. Bude-li se někdo chovat jako sprostý nevychovanec, pokud bude urážet ostatní komentující, spamovat, nebo tapetovat diskuse zcela mimo téma článku, nebo ji zanášet reklamou, takové příspěvky nekompromisně zablokuji. Na oplátku slibuji, že i kontroverzní příspěvky nebudu editovat, ani mazat. Za deset porušení těchto pravidel budete z diskuse nekompromisně a navždy vyřazeni (včetně IP adresy). PeTaX

Článek už je přlíliš starý. Diskuse k němu byly uzavřeny.

Dosud bez komentářů

Svobodný svět

Jen svoboda jednotlivce vede ke svobodné společnosti

top