STATISTIKA PRO EKONOMY KURZ Úroveň Bc. stupeň studia 1. TÉMA Úvodní metody popisné statistiky Cíle kapitoly: 1. Charakteristika základních pojmů z popisné statistiky 2. Seznámení s etapami statistického zkoumání 3. Znalost pojmů tabulky rozdělení četností, intervalové rozdělení četností, jednorozměrné a dvourozměrné tabulky rozdělení četností a příslušné statistické grafy 1. Charakteristika základních pojmů z popisné statistiky Statistika představuje teoretickou disciplínu, zabývající se metodami zkoumání hromadných jevů, spočívající ve sběru, zpracování a vyhodnocování statistických údajů. Slouží jako významná pomoc pro manažerské rozhodování, ale také v jiných oblastech lidské činnosti, například v: o biologii, medicíně, fyzice, technických disciplínách, o ekonometrii, marketingu, sociálně-ekonomických vědách. Termín „statistika" vznikl v 18. století. Další rozvoj statistiky proběhl v 19. a 20. století významní statistici Lapiace, Gauss, Pearson, Fischer a další. Moderní statistika 20. století vznikla z úředních zjišťování, univerzitní státovědy, politické aritmetiky a teorie pravděpodobnosti. 1.1 Základní statistické pojmy Hromadné jevy o se masově vyskytují a mohou se libovolně opakovat; o měříme j e u prvků, které nazýváme statistické j ednotky; o to co měříme, nazýváme statistické znaky či proměnné. Statistický soubor o představuj e určitou věcně, prostorově a časově vymezenou množinu všech zkoumaných statistických jednotek, u kterých zjišťujeme hodnoty sledovaných statistických znaků, o jednorozměrný, dvourozměrný, vícerozměrný, o základní soubor (populace) a výběrový soubor (vzorek) - obsahuje všechny nebo jen vybrané j ednotky. Základní soubor většinou není možné z časových, finančních či jiných důvodů zkoumat v rámci úplného šetření = vyčerpávající = značíme „cenzus". Z tohoto důvodu se provádí výběrové šetření, který představuje vzorek ze souboru základního. Výběrové šetření probíhá na základě získávání a shromažďování údajů pomocí náhodného výběru ze základního souboru, sledováním, dle dat Českého statistického úřadu, anketou, záměrným výběrem, vícestupňovým náhodným výběrem a jiné. Rozsah souboru o udává počet j eho stati stických j ednotek, o základní „N"; o výběrový „n". Statistické jednotky jsou základem pro vytvoření statistického souboru. Je jimi právě určen rozsah souboru. Statistický znak kvantitativní (číselné) ^ kvalitativní (kategoriální, slovní) kvantitativní (číselné) znaky diskrétní (nespojité) znaky spojité (kontinuální) znaky kvalitativní (kategoriální, slovní) binární nominální ordinální Další struktura (klasifikace) statistického znaku: Statistické znaky (proměnné) kvantitativní (číselné) měřitelné kvalitativn í (slovní, kategoriální) pořadové alternativní 1 mnozne nespojité (diskrétní) spojité Ostatní podoby statistických dat o poměrová o intervalová o absolutní o relativní o pořadí o procento o míra pravděpodobnosti o vizuální škála (hodnocení kvality života) 2. Seznámení s etapami statistického zkoumání Statistická šetření (zjišťování) o použití sekundárních dat (publikovaná CSU, ČNB apod.), o primární data - získaná od zpravodajských jednotek nebo respondentů (přímé pozorování, dotazníky, anketa, z výkazů). Setření úplné = vyčerpávající (cenzus) a neúplné = dílčí (výběr, zatíženo výběrovou chybou); expediční, korespondenční (telefonické nebo přes internet). Výběr pravděpodobnostní = náhodný (reprezentativní) a nenáhodný (záměrný = úsudkový, kvótní aj.). Statistické zpracování (na počítači) o kontrola dat, tabulka, třídění a shromažďování dat, číselné charakteristiky, stanovení hypotéz, co je cílem statistické analýzy, jaké statistické metody či analýzy vhodně vybrat na základě povahy dat, stanovení postupů analýzy dat Statistické vyhodnocování (rozbor) aprezentace dat o slovní text, prezentační tabulka nebo graf, v prezentačním programu na počítači o výsledná interpretace analyzovaných dat Následující obrázek znázorňuje obecný proces statistického zkoumání (analyzování). co je předmětem zkoumání základní (populační) soubor výběrový soubor - metody výběrového šetření stanovení hypotéz, co je cílem zkoumání zvolení vhodné statistické metody interpretace výsledků 3. Znalost pojmů tabulky rozdělení četností, intervalové rozdělení četností, jednorozměrné a dvourozměrné tabulky rozdělení četností a příslušné statistické grafy Jedná se o problematiku zpracování elementárních dat, tedy o zpracování nominální, ordinální proměnné, včetně proměnné pořadové a kvantitativní. Na základě těchto proměnných se vytvoří tabulka variant a jejich četností neboli frekvencí. Tabulka obsahuje absolutní m a relativní pi četnosti. počet výskytů i-té varianty poměr výskytů i-té varianty Pro zpracování absolutních, relativních, popřípadě kumulovaných absolutních a relativních četností je nutné nejprve určit počet disjunktních intervalů. K tomu slouží tzv. Sturgesovo pravidlo, tedy 1 + 3,3 * log (n). Na základě odborné literatury se doporučuje 5 až 20 intervalů, a to podle rozsahu statistického souboru. Pokud je statistický soubor rozsahem menší jak 100, volíme 7-10 intervalů. Pokud je statistický soubor rozsahem mezi 100-500, volíme maximálně 15 intervalů. Pokud je statistický soubor rozsahem větší jak 500, volíme maximálně 20 intervalů. Sturgesovo pravidlo nám udává právě přesný počet disjunktních intervalů. Od tohoto pravidla se lze odchýlit o dvě třídy nahoru nebo dolu. Dalším krokem je určení vhodné délky jednoho disjunktního intervalu. Je nutné znát počet intervalů atzv. variační rozpětí. To se stanoví jako rozdíl mezi nejvyšší hodnotou statistického znaku ve statistickém souboru a nejnižší hodnotou. Neberte v úvahu extrémní hodnoty, kterou se mohou vyskytovat v souboru. V takovém případě je vhodné je nezahrnovat do výpočtu variačního rozpětí - mají vliv na zkreslení délky intervalu. Extrémní hodnoty se přiřadí k intervalu otevřenému (například 655 +). Délka intervalu se stanoví jako podíl variačního rozpětí s počtem intervalů dle Sturgesova pravidla. Každý interval by měl mít stejnou délku. Následující ilustrační příklad a obrázek znázorňuje jednorozměrné a vícerozměrné četnosti, včetně vhodného počtu a délky intervalů. „ U studentů na Vysoké škole technické a ekonomické, oboru Technologie dopravy a přepravy, jsme provedli náhodný výběr a zjistilijejich peněžní hotovost v Kč. Statistický soubor obsahuje údaje o peněžní hodnotě, kterou student má k dispozici. Zjistěte počet a délku disjunktních intervalů. Zjistěte absolutní a relativní četnosti". Intervaly absolutní četnost relativní četnost 0-150 11 29% 151-301 5 13% 302-452 4 11% 453-603 4 11% 604-754 5 13% 755+ 9 24% Následující obrázek ilustruje vícerozměrné absolutní četnosti jiné případové studie. stáří stromu roční sklízen 3 4 7 5 5 5 KU ra4 9 5 7 6 8 7 8 KU ra 5 9 8 9 10 7 7 > 6 10 8 10 10 10 9 7 9 7 8 9 10 9 • Ň <= O >QJ n8 8 7 7 8 6 10 Zjišt< 9 5 4 6 7 6 8 Zjišt< Absolutní četnosti stáří/sklizeň 4 5 6 7 8 9 10 celkem 3 1 3 0 1 0 0 0 5 4 0 1 1 2 2 1 0 7 5 0 0 0 2 1 2 1 6 6 0 0 0 0 1 1 4 6 7 0 0 0 1 1 3 1 6 8 0 0 1 2 2 0 1 6 9 1 1 2 1 1 0 0 6 celkem 2 5 4 9 8 7 7 42 Absolutní četnosti lze vyjádřit také grafickým způsobem. Nejčastěji tzv. histogramem a polygonem. 15 10 5 0 Histogram - grafické zobrazení absolutních četností JK Vodorovná osa (kategorie) intervaly Polygonem se rozumí spojnicový graf. Histogram je sloupcový graf bez mezer mezi sloupcem. Relativní četnosti se graficky znázorňují prostřednictvím výsečového grafu. Zobrazení relativní četnosti • 0-150 - 151-301 -302-45 2 453-603 - 604-754 - 755+ U vícerozměrných absolutních četností graf vypadá následovně: U vícerozměrných relativních četností se většinou graf neuvádí. Shrnutí: 1. Charakteristika základních pojmů z popisné statistiky Hromadné jevy, populační, výběrový soubor, statistická jednotka, statistický znak. Statistické znaky (proměnné) kvantitativní kvalitativní (číselné) (Slovní, kategonalni) měřitelné pařadově alternativní 1nespojité _|_ spojité (diskrétní) 2. Seznámení s etapami statistického zkoumání Statistická šetření, zpracování a vyhodnocování dat. oje předmětem zkoumání základní (populai soubor 3. Znalost pojmů tabulky rozdělení četností, intervalové rozdělení četností, jednorozměrné a dvourozměrné tabulky rozdělení četností a příslušné statistické grafy Sturgesovo pravidlo, variační rozpětí, absolutní, relativní četnost, polygon, histogram. Histogram-Kralické Zdroje: ADAMEC, V., L. STŘELEC, a D., HAMPEL, 2017. Ekonometrie I: učební text. Druhé nezmenené vydání. Brno: Mendelova univerzita v Brně. ISBN 978-80-7509-480-3. (s. 6-20) HINDLS, R. a kol.: Statistika pro ekonomy, 8. vydání. Praha: Professional Publishing, 2006, ISBN 80-86946-16-9. s. (11-25) MOŠNA, F., 2017. Základní statistické metody. Praha: Univerzita Karlova v Praze. ISBN 978- 80-7290-972-8. (s. 4-9) ŠŤUCHLY, J., 2015. Statistické analýzy dat: vysokoškolská učebnice. České Budějovice: Vysoká škola technická a ekonomická v Českých Budějovicích. ISBN 978-80-7468-087-8. (s. 1-16)