1
Vysoká škola technická a ekonomická
v Českých Budějovicích
Pokročilé metody analýz a modelování
Studijní opora pro kombinovanou formu studia
Garant: doc. RNDr. Jaroslav Stuchlý, CSc.
Ústav podnikové strategie
Katedra ekonomiky
Autoři: doc. RNDr. Jaroslav Stuchlý, CSc.,
Ing. Marek Vokoun, Ph.D.
2
Obsah
1 Anotace...........................................................................................................................5
2 Příprava na přednášky ..................................................................................................10
2.1 Představení pokročilých metod analýz a modelování v ekonomickém
aplikovaném výzkumu a v podnikové praxi. Přednosti a nedostatky popisné analýzy dat,
využívání vizualizovaných dat.........................................................................................10
2.2 Představení pravidel logiky a matematického zápisu množin, možnosti zapisování
modelů, pravděpodobnost a statistické rozdělení dat.......................................................13
2.3 Představení parametrického a neparametrického přístupu v modelování. Pravidla
regresní analýzy pro průřezová data ................................................................................17
2.4 Pravidla vícenásobné regresní analýzy pro časové řady.......................................20
2.5 Testování předpokladů konvenční asymptotické teorie pro odhady časových řad
metodou nejmenších čtverců, transformace časových řad, časové řady typu I(0) a I(1).23
2.6 Modelování časových řad pomocí regresní analýzy .............................................26
2.7 Časové řady v ekonomickém výzkumu a podnikové praxi, možnosti pokročilých
metod ...............................................................................................................................29
2.8 Pokročilé modelování časových řad pomocí regresní analýzy .............................32
2.9 Základní principy teorie fuzzy množin a fuzzy logiky .........................................36
2.10 Fuzzy systémy, adaptace ve fuzzy systémech.......................................................39
2.11 Uvedení příkladů aplikací fuzzy logiky v rozhodování, jako je např. manažerské a
investiční rozhodování, predikce atd................................................................................41
2.12 Modelování časových řad pomocí fuzzy logiky ...................................................44
2.13 Umělé neuronové sítě (UNS): Seznámení se se základními pojmy v oblasti
umělých neuronových sítí, uvedení pojmu perceptron ....................................................47
2.14 Vícevrstvá neuronová síť a její parametry............................................................50
2.15 Uvedení příkladů aplikace UNS pro investiční rozhodování, odhady cen výrobků
a množstevní odhady........................................................................................................54
3
2.16 Uvedení příkladů aplikace UNS pro odhad cen nemovitostí, oceňování bonity
klienta atd.........................................................................................................................57
2.17 Modelování časových řad pomocí UNS ...............................................................60
2.18 Pokročilé modelování časových řad pomocí UNS................................................63
2.19 Genetické algoritmy (GA): Seznámení se základy genetiky, analogií mezi
přírodou a matematickým popisem, umožňující řešení problémů rozhodování..............65
2.20 Uvedení použití GA v oblasti optimalizace široké palety problémů – optimalizace
investiční strategie, řízení výroby, řezných plánů, aproximace křivek, řešení problému
obchodního cestujícího, využití shlukové analýzy apod..................................................68
2.21 Optimalizační úlohy v GA, schémata, cykly, smyčky..........................................71
2.22 Modelování časových řad pomocí GA..................................................................74
2.23 Teorie chaosu: Teorie pojednává o možnosti lepšího popisu ekonomických jevů,
než je tomu u klasických metod. Je objasněn pojem chaos a řád, fraktál........................77
2.24 Uvedení využití teorie chaosu u měřeného sledovaného systému, uvedení příkladů
z ekonomického výzkumu a podnikové praxe.................................................................81
2.25 Uvedení pojmu datamining, textmining a definování cílů, výběr techniky
modelování, zdroje a příprava dat, tvorba modelů, jejich ověření, vyhodnocení,
implementace a údržba.....................................................................................................84
2.26 Uvedení příkladů použití dataminingu v Business Intelligence a pro volbu
strategie spolupráce se zákazníkem, direct mailing apod. ...............................................87
3 Příprava na semináře ....................................................................................................89
3.1 Popisná statistika a analýza dat, vizualizace dat, příklady pravidel logiky a
matematického zápisu množin, možnosti zapisování modelů .........................................89
3.2 Počet pravděpodobnosti a statistické rozdělení dat. Pravidla regresní analýzy pro
průřezová data ..................................................................................................................93
3.3 Testování předpokladů konvenční asymptotické teorie pro odhady metodou
nejmenších čtverců pro průřezová data a pro časové řady...............................................96
3.4 Modelování časových řad pomocí regresní analýzy ...........................................100
4
3.5 Pokročilé modelování časových řad pomocí regresní analýzy ...........................103
3.6 Průběžný test .......................................................................................................107
3.7 Procvičování základních principů teorie fuzzy množin a fuzzy logiky ..............112
3.8 Modelování časových řad pomocí fuzzy logiky .................................................114
3.9 Procvičování základních principů umělých neuronových sítí ............................116
3.10 Modelování časových řad pomocí UNS .............................................................118
3.11 Pokročilé modelování časových řad pomocí UNS..............................................120
3.12 Procvičování základních principů genetických algoritmů ..................................122
3.13 Modelování časových řad pomocí GA................................................................124
5
1 Anotace
Období 1. semestr/ 1. ročník
Název
předmětu
Pokročilé metody analýz a modelování
Vyučovací
jazyk
český
Garant
předmětu
doc. RNDr. Jaroslav Stuchlý, CSc.
Garanční ústav Ústav podnikové strategie
Katedra Katedra ekonomiky
Vyučující
(přednášející)
doc. RNDr. Jaroslav Stuchlý, CSc.
Vyučující
(cvičící)
Ing. Marek Vokoun, Ph.D.
Ukončení
předmětu
zkouška
Poznámka
k ukončení
docházka na semináře 70 % včetně dalších poznámek garanta předmětu
Rozsah 4/2
Počet kreditů 8
Cíle předmětu
výstupy z učení
Cílem předmětu je seznámení se s některými pokročilými metodami
analýz a technikami modelování za účelem podpory rozhodování
v podniku. Předmět si rovněž klade za cíl vysvětlit princip těchto teorií,
naučit studenta pracovat s těmito teoriemi a jejich aplikací.
Výstupy z učení Po úspěšném absolvování předmětu student:
16.1 zná základní pojmy a pravidla fuzzy logiky,
16.2 rozumí fungování umělých neuronových struktur,
16.3 rozumí genetickým algoritmům,
16.4 zná teorii chaosu,
16.5 rozumí dataminingu a textminingu,
16.6 modeluje časové řady pomocí fuzzy logiky,
16.7 modeluje časové řady pomocí umělých neuronových struktur,
16.8 modeluje časové řady pomocí genetických algoritmů,
16.9 zná aplikace modelů časových řad v podnikové praxi.
Osnova
předmětu
Přednášky
1.Představení pokročilých metod analýz a modelování v ekonomickém
aplikovaném výzkumu a v podnikové praxi. Přednosti a nedostatky
popisné analýzy dat, využívání vizualizovaných dat. (16.9)
2.Představení pravidel logiky a matematického zápisu množin, možnosti
6
zapisování modelů, pravděpodobnost a statistické rozdělení dat. (16.1,
16.2, 16.3)
3.Představení parametrického a neparametrického přístupu v modelování.
Pravidla regresní analýzy pro průřezová data. (16.6, 16.7, 16.8)
4.Pravidla vícenásobné regresní analýzy pro časové řady. (16.6, 16.7,
16.8)
5.Testování předpokladů konvenční asymptotické teorie pro odhady
časových řad metodou nejmenších čtverců, transformace časových řad,
časové řady typu I(0) a I(1). (16.6, 16.7, 16.8)
6.Modelování časových řad pomocí regresní analýzy. (16.6, 16.7, 16.8)
7.Časové řady v ekonomickém výzkumu a podnikové praxi, možnosti
pokročilých metod. (16.6, 16.7, 16.8)
8.Pokročilé modelování časových řad pomocí regresní analýzy. (16.6,
16.7, 16.8)
9.Základní principy teorie fuzzy množin a fuzzy logiky. (16.1)
10. Fuzzy systémy, adaptace ve fuzzy systémech. (16.1)
11. Uvedení příkladů aplikací fuzzy logiky v rozhodování, jako je např.
manažerské a investiční rozhodování, predikce atd. (16.1)
12. Modelování časových řad pomocí fuzzy logiky. (16.1, 16.6)
13. Umělé neuronové sítě (UNS): Seznámení se se základními pojmy v
oblasti umělých neuronových sítí, uvedení pojmu perceptron. (16.2)
14. Vícevrstvá neuronová síť a její parametry. (16.2)
15. Uvedení příkladů aplikace UNS pro investiční rozhodování, odhady
cen výrobků a množstevní odhady. (16.7)
16. Uvedení příkladů aplikace UNS pro odhad cen nemovitostí,
oceňování bonity klienta atd. (16.7)
17. Modelování časových řad pomocí UNS. (16.2, 16.7)
18. Pokročilé modelování časových řad pomocí UNS. (16.2, 16.7)
19. Genetické algoritmy (GA): Seznámení se základy genetiky, analogií
mezi přírodou a matematickým popisem, umožňující řešení problémů
rozhodování. (16.3)
20. Uvedení použití GA v oblasti optimalizace široké palety problémů –
optimalizace investiční strategie, řízení výroby, řezných plánů,
aproximace křivek, řešení problému obchodního cestujícího, využití
shlukové analýzy apod. (16.3)
21. Optimalizační úlohy v GA, schémata, cykly, smyčky. (16.3)
22. Modelování časových řad pomocí GA. (16.3, 16.8)
23. Teorie chaosu: Teorie pojednává o možnosti lepšího popisu
ekonomických jevů, než je tomu u klasických metod. Je objasněn
pojem chaos a řád, fraktál. (16.4)
24. Uvedení využití teorie chaosu u měřeného sledovaného systému,
uvedení příkladů z ekonomického výzkumu a podnikové praxe. (16.4)
25. Uvedení pojmu datamining, textmining a definování cílů, výběr
techniky modelování, zdroje a příprava dat, tvorba modelů, jejich
ověření, vyhodnocení, implementace a údržba. (16.5)
26. Uvedení příkladů použití dataminingu v Business Intelligence a pro
volbu strategie spolupráce se zákazníkem, direct mailing apod. (16.4)
7
Semináře
1.Popisná statistika a analýza dat, vizualizace dat, příklady pravidel
logiky a matematického zápisu množin, možnosti zapisování modelů.
(16.6, 16.7, 16.8)
2.Počet pravděpodobnosti a statistické rozdělení dat. Pravidla regresní
analýzy pro průřezová data. (16.6, 16.7, 16.8)
3.Testování předpokladů konvenční asymptotické teorie pro odhady
metodou nejmenších čtverců pro průřezová data a pro časové řady.
(16.6, 16.7, 16.8)
4.Modelování časových řad pomocí regresní analýzy. (16.6, 16.7, 16.8)
5.Pokročilé modelování časových řad pomocí regresní analýzy. (16.6,
16.7, 16.8)
6.Průběžný test. (16.6, 16.7, 16.8)
7.Procvičování základních principů teorie fuzzy množin a fuzzy logiky.
(16.1, 16.6)
8.Modelování časových řad pomocí fuzzy logiky. (16.1, 16.6)
9.Procvičování základních principů umělých neuronových sítí. (16.2,
16.7)
10. Modelování časových řad pomocí UNS. (16.2, 16.7)
11. Pokročilé modelování časových řad pomocí UNS. (16.2, 16.7)
12. Procvičování základních principů genetických algoritmů. (16.3, 16.8)
13. Modelování časových řad pomocí GA. (16.3, 16.8)
Organizační
formy výuky
přednáška, seminář
Komplexní
výukové metody
frontální výuka
projektová výuka
skupinová výuka – kooperace
brainstorming
kritické myšlení
samostatná práce – individuální nebo individualizovaná činnost
výuka podporovaná multimediálními technologiemi
Studijní zátěž
Aktivita
Počet hodin za semestr
Prezenční
forma
Kombinovaná
forma
Příprava na průběžný test 18 32
Příprava na přednášky 26 0
Příprava na seminář, cvičení,
tutoriál
11 90
Příprava seminární práce 25 0
Průběžný test 2 2
Závěrečný test 2 2
8
Účast na přednáškách 52 0
Účast na
semináři/cvičeních/tutoriálu/exkurzi
26 24
Příprava na závěrečný test 46 58
Celkem: 208 208
Metody
hodnocení a
jejich poměr
závěrečný test 70 %
seminární práce 20 %
průběžný test 10 %
Podmínky pro
úspěšné
absolvování
předmětu včetně
jejich hodnocení
Celková klasifikace předmětu, tj. body za závěrečný test (70 - 0) + body z
průběžného hodnocení (30 - 0): A 100 – 90, B 89,99 – 84, C 83,99 – 77,
D 76,99 – 73, E 72,99 – 70, FX 69,99 – 30, F 29,99 - 0.
Informace
učitele
Účast na výuce ve všech formách řeší samostatná vnitřní norma VŠTE
(Evidence docházky studentů na VŠTE). Pro studenty prezenční formy
studia je na seminářích a cvičeních povinná 70% účast.
Literatura
povinná
COUFAL, J., 2014. Logika a logické myšlení. [Praha]: Vysoká škola
ekonomie a managementu. ISBN 978-80-87839-59-1.
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě.
Brno: CERM Akademické nakladatelství. ISBN 978-80-7204-898-4.
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3.
přeprac. vyd. Brno: Mendelova univerzita. ISBN 978-80-7509-427-8.
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním
hodnocení podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5.
Literatura
doporučená
DOSTÁL, P., 2012. Pokročilé metody rozhodování v podnikatelství a
veřejné správě. Brno: CERM Akademické nakladatelství. ISBN 978-80-
7204-798-7.
FONG, L. Y. a K. Y. SZETO, 2001. Rules extraction in short memory
time series using genetic algorithms. The European Physical Journal BCondensed
Matter and Complex Systems. 20(4), 569-572. ISSN 1434-
6028.
Webové stránky https://is.muni.cz/el/1431/podzim2007/Bi3101/um/skripta.pdf (Učební
text k matematickému modelování)
http://www1.osu.cz/~zacek/mopop/mopop.pdf (Učební text o modelování
podnikových procesů)
Publikační
činnost
Garant předmětu a přednášející (doc. RNDr. Jaroslav Stuchlý, CSc.)
CAHA, Z., J. STUCHLÝ, M. RUSCHAK a M. ŠUTA, 2017.
MANAŽERSKÉ VZDĚLÁVÁNÍ V MALÝCH A STŘEDNĚ
VELKÝCH FIRMÁCH V ČESKÉ REPUBLICE. Mladá veda. 5(9), 1-
9
12. ISSN 1339-3189.
STUCHLÝ, J., 2015. Statistické analýzy dat: vysokoškolská učebnice.
České Budějovice: Vysoká škola technická a ekonomická v Českých
Budějovicích. ISBN 978-80-7468-087-8.
ZEMAN, R. a J. STUCHLÝ, 2014. Predicting stock prices in Bank VIG.
Logi. 5(2), 116-129. ISSN 1804-3216.
ŠOLC, L. a J. STUCHLÝ, 2013. Preference kvality nebo ceny při
nákupech spotřebního zboží. Littera Scripta. 6(1), 158-169. ISSN 1802-
503X.
ZEMAN, R. a J. STUCHLÝ, 2013. Prognoznyje modeli dlja akcij «Erste
Bank». Vestnik Astrachanskogo gosudarstvennogo techničeskogo
universiteta. 2013(2), 104-111. ISSN 2073-5537.
Cvičící (Ing. Marek Vokoun, Ph.D.)
VOKOUN, M., 2016. Innovation behaviour of firms in a small open
economy: the case of the Czech manufacturing industry. Empirica. 43(1),
111-139. ISSN 0340-8744.
NOVÁK, V., M. VOKOUN, F. STELLNER a M. VOCHOZKA, 2016.
Institutional analysis of contemporary regional labour market in the
Czech Republic. E+M Ekonomie a Management. 19(3), 4-19. ISSN
1212-3609.
VOKOUN, M. a F. STELLNER, 2015. Czech economic historians and
interdisciplinary approach. Économies et Sociétés. Série "Histoire
Économique Quantitative". 50(6), 857-875. ISSN 0013-0567.
STELLNER, F. a M. VOKOUN, 2014. Internet, social sciences and
humanities. Human Affairs: Postdisciplinary Humanities & Social
Sciences Quarterly. 24(4), 492-510. ISSN 1210-3055.
VOKOUN, M., 2013. Cliometrie. In: Nové přístupy k metodologii
hospodářských a politických dějin. Praha: Setoutbooks.cz, 127-152. ISBN
978-80-86277-77-6.
Témata
diplomových
prací
Modelování stochastických procesů v podnikové ekonomice a financích
Modelování procesů na finančních trzích
Složitější modely teorie zásob
10
2 Příprava na přednášky
2.1 Představení pokročilých metod analýz a modelování v
ekonomickém aplikovaném výzkumu a v podnikové praxi.
Přednosti a nedostatky popisné analýzy dat, využívání
vizualizovaných dat
Klíčová slova
Statistika, ekonomie, přehledové statistiky, měření
Cíle kapitoly
Cílem je pochopení významu pokročilých metod analýz a modelování v ekonomickém
aplikovaném výzkumu a v podnikové praxi. Cílem je pochopit přednosti a nedostatky
popisné analýzy dat a využívání vizualizovaných dat.
Výstupy z učení
 16.9 zná aplikace modelů časových řad v podnikové praxi
Abstrakt
Ekonometrie je součástí společenských věd, představuje měření v ekonomii, resp. je to
kvantitativní ekonomická analýza s přímou vazbou na matematicko-statistické metody a
obvykle neoklasickou ekonomii. Problémem ekonometrie je absence analýzy věrohodnosti
použitých materiálů vzhledem ke kontextu a snaha parametrizovat a linearizovat
ekonomické problémy, které jsou z povahy věcí komplexní strukturou (chaos, dynamické
systémy, adaptivní systémy apod.). Součástí každého vědeckého článku je proto kapitola
materiály a metody, případně data a proměnné. V těchto kapitolách pozorujeme přehledové
statistiky (počet pozorování, průměr, směrodatná odchylka, minimum a maximum) a odkud
data pocházejí. Avšak neměla by chybět i analýza toho, co daná data doopravdy popisují,
jak věrohodná jsou a jak reprezentují populaci. Tyto povinná kritika dat, pramenů a teorií je
typická pro historiografii, méně už pro ekonomii.
11
Proměnné vstupující do ekonometrického modelu mohou být transformované, očištěné
(prázdná pozorování), podmíněné (nenulové hodnoty, jen muži apod.), využívající data
k tvorbě nových proměnných (interakce, dummy proměnné, kvadratické proměnné,
nepozorované proměnné). Transformace dat je obvykle založena na zlepšení interpretace
zkoumané problematiky. Např. logaritmická transformace – přirozený logaritmus ln(x) – se
využívá pro procentní interpretaci a pro data, kde je vhodné sledovat pokles či růst. Dále se
využívá transformace na jednotku (na kg, na zaměstnance…), procentní podíl na celku,
kvadratická transformace (výnosy z rozsahu), rozdíly (růsty mezi obdobím, vůči průměru,
od konstanty) a inverzní hyperbolický sinus (podobně jako logaritmická transformace,
avšak s možností použít i nulové hodnoty, např. u příjmových studií).
Mezi obvyklé popisné statistiky a analýzy patři: (1) jedna proměnná – střední hodnoty,
odchylky, podobnost vůči standardnímu rozdělení, (2) dvě proměnné – vzájemný vztah,
podobnost, rozdílnost, korelace, přímková regrese (3) tři a více proměnných – regrese
průřezových dat, kontingenční tabulky, regrese panelových dat, regrese časové řady.
Průměrná hodnota se zapisuje jako: 𝑦𝑖̅ =
∑ 𝑦 𝑖𝑗
𝑛 𝑖
𝑗=1
𝑛 𝑖
. Např. jde o pozorování výšky (znak y) lidí
(i), kteří reprezentují výběr (n) z populace (N). Označení proměnné se stříškou 𝑦𝑖̂ je
v ekonometrii vyhrazeno pro označením modu, avšak častěji se využívá pro označení
odhadnutých hodnot ekonometrického modelu. Např. pro odhad reziduální složky je
obvyklé označení 𝑢𝑖̂. Rezidua modelu jsou označována také jako „u_hat“ (u_stříška), na
této složce regresního modelu testujeme nedostatky, které by model mohl mít, tj. neplní
některé Gauss-Markovy podmínky.
V ekonomickém výzkumu je obvyklé využívat tabulky. Grafy jsou obvykle součástí
přílohy, avšak představují důležitý prvek analýzy dat. Histogram pomůže při pohledu na
normalitu a rozdělení dané proměnné. Korelogram je pro analýzu autokorelace v časové
řadě, zde pohledem a obvykle i doprovodnou statistikou (Durbinův-Watsonův alternativní
test) zjišťujeme, zda se mezi pozorováními vyskytuje silná závislost (korelační koeficient
blízký jedničce). Např. nabývá-li koeficient utilizace (u proměnné y) hodnoty 0,79 a
v předchozím období hodnoty 0,8, resp. hodnoty koeficientů mezi obdobími budou vždy
blízké hodnotě 0,8, vztah bude podobný rovnici y=1*yt-1 +u, kde číslo 1 je odhadnutý beta
koeficient a yt-1 je hodnota y v předchozím období. Mezi hodnotami (a 0,79 a 0,80) a
následně i dalšími páry (0,8 a 0,81) je v čase silná závislost. Tato autokorelace vlastnost
časových řad, která je sice využitelná, ale typicky nebezpečná, protože svádí k naivní
12
interpretaci (zdánlivá regrese). Tyto řady je možné zpracovávat a interpretovat při zapojení
dalších pokročilých metod, mezi které patří Box Jenkinsonova metoda, fuzzy logika,
genetické algoritmy a neuronové sítě.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 1-6)
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 1-10)
Kontrolní otázky
1. Co je podmínkou kvalitního ekonometrického výzkumu?
2. Jaké pokročilé metody ekonomických analýz znáte?
3. Jaké existují datové struktury?
4. Jaké existují vizualizační pomůcky v ekonometrickém výzkumu?
5. Jaké ekonometrické metody se používají v podnikové praxi?
6. Jaké jsou přednosti popisné statistiky?
7. Jaké jsou nedostatky popisné statistiky?
8. K čemu slouží transformace dat?
9. Po jaká data je vhodná logaritmická transformace dat?
10. K čemu slouží kvadratická transformace dat?
Odkaz na praktickou část
3.1 Popisná statistika a analýza dat, vizualizace dat, příklady pravidel logiky a
matematického zápisu množin, možnosti zapisování modelů
13
2.2 Představení pravidel logiky a matematického zápisu
množin, možnosti zapisování modelů, pravděpodobnost a
statistické rozdělení dat
Klíčová slova
Množina, operace, axiom, věta, důkaz
Cíle kapitoly
Cílem kapitoly je pochopení důležitost pravděpodobnostního rozdělení, výrokové logiky,
množinového zápisu a výstavby matematického vyjadřování (axiómy, definice, věty,
důkazy).
Výstupy z učení
 16.1 zná základní pojmy a pravidla fuzzy logiky
 16.2 rozumí fungování umělých neuronových struktur
 16.3 rozumí genetickým algoritmům
Abstrakt
Pro pochopení tzv. statistických rozdělení, křivek a funkcí používáme křivku Gaussovu,
Studentova t rozdělení, Fisherova F rozdělení a dalších. Např. u Studentova t a normálního
rozdělení pozorujeme asymptotický „blob“, který se nedotýká osy x v bodě y=0. Tyto
křivky jsou pokaždé jinak „laděné“, závisí na střední hodnotě, směrodatné odchylce a počtu
pozorování.
Centrální limitní teorém (Ljapunovova věta) se zabývá následující problematikou: Součet
křivek rozdělení vzájemně nezávislých veličin xi při dostatečně velkém počtu pozorování
konverguje k normálnímu rozdělení, a to bez ohledu na tvar těchto rozdělní. Důležitá je
také notace, kdy nějaký jev nastane pouze za určité podmínky. K označení „za předpokladu
je svislá čárka „|”. P(C|B) = 0,5 pak čteme jako: pravděpodobnost jevu C za vzhledem
k podmínkám B je 0,5. Nebo E (u | x1, x2, x3) = c pak čteme jako: střední hodnota
(označení E) reziduí (označení u) je rovna konstantě (označení c), za podmínky, že máme
14
nezávislé proměnné x1, x2 a x3. V pravděpodobnosti je velmi důležitá Bayesova věta pro
schopnost interpretovat odhadnuté skutečnosti. Ta udává, jak podmíněná pravděpodobnost
nějakého jevu souvisí s opačnou podmíněnou pravděpodobností: P(A|B) =
[P(B|A)*P(A)]/P(B).
V logice výrokem nazýváme každou formalizovanou (vyslovenou, napsanou) myšlenku, o
níž má smysl říci, že je buď pravdivá, nebo nepravdivá. Výrokem je pouze a jen věta
oznamovací. Výroky označujeme obvykle velkými písmeny (např. výrok A, výroky B,
výrok C) a jejich pravdivostní hodnotu (pravdivost, nebo nepravdivost) označíme
symbolem (číslicí) 1 (pravda), resp. 0 (nepravda).
Hypotézou nazýváme výrok, jehož pravdivostní hodnotu neznáme a pokoušíme se ji
odvodit logickými operacemi z jiných pravdivých výroků. Z výroků lze vytvářet nové
výroky negací, užitím logických spojek a závorek.
Negace výroku A je zcela nový výrok, který vyjadřujeme slovy „neplatí A“. Tuto negaci
označujeme symbolem non A. Je-li výrok A pravdivý, je výrok non A nepravdivý; je-li
výrok A nepravdivý, je výrok non A pravdivý. Výroky A a non A se vzájemně vylučují,
jejich pravdivostní hodnoty jsou opačné.
Logické spojky jsou čtyři: (1) Spojka „a“, kterou označujeme symbolem ; (2) spojka
„nebo“ (); (3) spojka „jestliže – pak“ (); (4) spojka „právě tehdy, když“ ().
Pomocí logických spojek vytváříme z výroků A, B nové výroky. (1) Konjunkce výroků A,
B je výrok, který vyjadřujeme spojkou a; označujeme jej A B, což čteme A a B.
Konjunkce je pravdivým výrokem, právě když oba výroky A a B jsou pravdivé. (2)
Disjunkce výroků A, B je výrok, který vyjadřujeme spojkou nebo; označujeme jej A B,
což čteme A nebo B. Disjunkce je pravdivým výrokem, když je pravdivý aspoň jeden z
výroků A, B. (3) Implikace výroků A, B (na daném pořadí záleží!) je výrok, který
vyjadřujeme slovním spojením jestliže - pak. Označujeme jej A B, což čteme: Jestliže
platí A, pak platí B. Implikace je pravdivým výrokem při všech možných pravdivostních
hodnotách výroků A, B kromě případu, kdy A je pravdivým a B nepravdivým výrokem.
(4) Ekvivalence výroků A, B je výrok, který vyjadřujeme slovním spojením právě
tehdy, když. Označujeme jej A B, což čteme: A platí právě tehdy, když platí B.
Ekvivalence je pravdivým výrokem, pokud výroky A, B jsou oba pravdivé nebo výroky A,
B jsou oba nepravdivé.
15
Výroková forma (formule) představuje formalizovaný zápis, kdy používáme písmena a
logické spojky. Tautologie je výroková formule, která nabývá ve všech případech
pravdivostní hodnoty 1. Výroková forma S(x) je slovní vyjádření, v němž se vyskytuje
proměnná x. Toto vyjádření má tu vlastnost, že se stane výrokem, jen tehdy a tehdy, když
proměnnou nahradíme prvky jisté množiny, kterou označujeme D, definiční obor výrokové
formy S(x). Množinu všech prvků, pro něž je S(x) pravdivým výrokem, nazýváme oborem
pravdivosti výrokové formy S(x) a označujeme jej P. Z výrokových forem, podobně jako
z výroků, lze tvořit nové výrokové formy pomocí logických spojek („a“, „nebo“, „jestližepak“,
„právě tehdy, když“).
Kvantifikátory představují další možnost formalizovaného zápisu. Symbol je tzv. obecný
kvantifikátor. Výrok „Pro všechna reálná čísla x, y platí x + y = y + x“, lze formalizovat
pomocí obecného kvantifikátoru jako „x, y R: x + y = y + x“. Symbol je tzv.
existenční kvantifikátor. Výrok „Existují taková reálná čísla x, y, že platí x > y“, lze
formalizovat ve tvaru „x, y R: x y“ .
Studijní literatura
Povinná literatura
COUFAL, J., 2014. Logika a logické myšlení. [Praha]: Vysoká škola ekonomie a
managementu. ISBN 978-80-87839-59-1. (s. 6-16)
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 8-10)
Kontrolní otázky
1. Co vyjadřuje Centrální limitní teorém?
2. Co v počtu pravděpodobnosti znamená Zákon velkých čísel?
3. Definujte výrok.
4. Co je to hypotéza?
5. Jaké existují logické spojky?
6. Co je to výroková forma?
7. Jaké se v logice používají kvantifikátory?
8. Co je to axióm?
9. Co je to definice?
16
10. Co je to věta?
Odkaz na praktickou část
3.1 Popisná statistika a analýza dat, vizualizace dat, příklady pravidel logiky a
matematického zápisu množin, možnosti zapisování modelů
17
2.3 Představení parametrického a neparametrického přístupu
v modelování. Pravidla regresní analýzy pro průřezová
data
Klíčová slova
Distribuční funkce, histogram, rozptyl, podobnost, medián, průměr, odchylka
Cíle kapitoly
Cílem je pochopení a použití parametrického a neparametrického přístupu v modelování.
Cílem je pochopení pravidel regresní analýzy pro průřezová data.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Abstrakt
Metody a přístupy ve statistickém modelování lze obecně rozdělit na základě jejich
předpokladu o popisném charakteru pozorovaných dat. Tyto přístupy se nazývají
parametrický a neparametrický. Parametrické metody vyžadují specifikaci konkrétního
rozdělení náhodné veličiny (normální rozdělení, F rozdělní, Poissonova rozdělní apod.).
Neparametrické a semi-parametrické metody pak žádné zvláštní předpoklady ohledně
statistického rozdělení pravděpodobnosti náhodné veličiny nevyžadují.
Podmínkou pro parametrické přístupy je nejčastěji tzv. B.L.U.E. podmínka (Best Linear
Unbiased Estimator) odhadu. Zde je využito Gaussova-Markovova teorému. Tyto
podmínky nazýváme klasickými předpoklady obecného v parametrech lineárního
regresního modelu (GLM – general linear model). Tyto podmínky jsou důležité pro
analýzy typu ANOVA, MANOVA, t-test F-test, jednoduchá regrese (SLR) a vícenásobná
regrese (MLR).
18
Nechť je standardní funkci, která je lineární v parametrech (bety – bi): „y = b0 + b1x1 + u“,
kde u jsou nepozorované faktory, disturbance, chybový člen. Potom označení „
xy 10
ˆˆˆ   + u“ je odhad pomocí metody nejmenších čtverců (ordinary least squares OLS,
nebo též MNČ). Přímka „začíná“ (pro y=0) v bodě úrovňové konstanty 0
ˆ a sklon
přímky je 1
ˆ . Odhadnutá chybová složka má označení û, což lze vyjádřit jako rozdíl
skutečnosti znaku y a odhadu yˆ . Jednotlivé rozdíly odhadu a skutečnosti, je vhodné mít co
nejmenší. Zároveň jejich součet musí být nulový. Je nutné podotknout, že û není náhodná
složka, je to pouze odhad náhodné složky. Pokud má tento odhad podobné vlastnosti jako
očekávaná náhodná složka u pro normální rozdělní, pak produkujeme tzv. BLUE odhad.
Gaussovy-Markovovy podmínky pro mnohonásobnou v parametrech lineární regresi jsou
následující. Podmínka MLR 1 se věnuje linearitě v parametrech. MLR. 2 je o náhodnosti
výběru dat. U průřezových dat se snažíme zajistit reprezentativní datový vzorek, který má
dostatečný počet pozorování. U náhodnosti výběru je požadována také nulová sériová
korelace (autokorelace, série je zde označení pro časové řady) pro nepozorované faktory
v náhodné složce u, tedy i pro její odhad û. Zároveň je nutné, aby chybová složka u (a
zároveň odhad û) byla náhodně distribuovaná a nezávislá na každé proměnné v modelu.
Problémy s autokorelací (sériovou korelací) nastávají vždy pro časové řady (time series,
série dat). MLR.3 znamená absence perfektní kolinearity. Většina programových balíků
tuto podmínku hlídá. Identické proměnné, nebo proměnné s vysokou vzájemnou korelací
jsou z modelu odebrány. Programy hlídají i počet proměnných (k), těch musí být méně, než
je počet pozorování (n). Přesněji je to n≥k+1, jde o maticovou logiku a problém tzv. stupňů
volnosti. Přičemž je vhodné sledovat i pestrost použitých statistických rozdělení. Při
absenci ordinálních proměnných (věk, tržby, počet zaměstnanců apod.) dochází ke
zkreslení chyby odhadu parametrů v modelu. MLR.4 je o nulovém podmíněném průměru
pro chybovou složku u. Přesněji jde o vyjádření E(u|x1, x2, …, xk) = 0. Ve skutečnosti není
nutné, aby to byla nula, protože v regresi máme přítomnu konstantu, která nulovou hodnotu
zajistí. Proto je vhodné konstantu v modelu vždy ponechat. Problémy s podmínkou MLR4
způsobují zejména vynechané proměnné, chyba měření, špatná funkční forma, simultaneita
a endogenita proměnných.
Další podmínky (pátá a šestá podmínka) jsou obvyklé už jen pro jednoduchý lineární
regresní model (SLR), protože je lze v MLR modelech snadno vyřešit nastavením designu
19
modelu. SLR je přímková regrese s jednou vysvětlovanou a vysvětlující proměnnou. SLR.5
znamená, že je vyžadována homoskedasticita (konstantní rozptyl) chybové složky u (i
odhadnuté složky û). Konkrétní zápis je var(u|x1, …, xk)=σ2
. SLR.5 je vhodné u
vícenásobné regrese ošetřit zvolením robustních standardních chyb, abychom měli vždy
konzistentní odhad s opravenou nestranností. SLR.6 vyžaduje u jednoduché regresní
přímky normalitu (u) chybového členu. U vícenásobné regrese je vhodné, aby rezidua měla
rozdělení alespoň podobné normálnímu rozdělení. Platí zde předpoklad centrální limitní
věty, tj. že toto rozdělení se s počtem pozorování „dorovná“ do normálního. Výrazné
odchylky od normálního rozdělení pak znamenají, že máme nějaký problém v MLR 2 a
MLR 4.
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 10-14)
Kontrolní otázky
1. Jaké existují parametrické metody odhadu?
2. Co je to neparametrický odhad?
3. Co je to tzv. BLUE odhad?
4. Definujte 1. Gausovu-Markovovu podmínku pro vícenásobnou lineární regresi.
5. Definujte 2. Gausovu-Markovovu podmínku pro vícenásobnou lineární regresi.
6. Definujte 3. Gausovu-Markovovu podmínku pro vícenásobnou lineární regresi.
7. Definujte 4. Gausovu-Markovovu podmínku pro vícenásobnou lineární regresi.
8. Definujte 5. Gausovu-Markovovu podmínku pro vícenásobnou lineární regresi.
9. Definujte 6. Gausovu-Markovovu podmínku pro jednoduchou lineární regresi.
10. Co je to náhodná složka u, a jak se liší od tzv. reziduí?
Odkaz na praktickou část
3.2 Počet pravděpodobnosti a statistické rozdělení dat. Pravidla regresní analýzy pro
průřezová data
20
2.4 Pravidla vícenásobné regresní analýzy pro časové řady
Klíčová slova
Gaussovy-Markovovy podmínky, proměnná, chyba odhadu, signifikance, F-test
Cíle kapitoly
Cílem je pochopení pravidel pro vícenásobnou regresní analýzu pro průřezová data a pro
časové řady.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Abstrakt
Časové řady představují pozorování jednoho jevu yi (HDP, objem produkce, příjmy,
náklady…aj.) ve více časových (t) okamžicích, označujeme jako yit. Pohledem na jejich
průběh v čase jsou rozeznávány časové řady stochastické a deterministické. Stochastické se
vyznačují odchylkou od rovnovážné hodnoty, jsou stacionární (ustálené). Tyto řady jsou
označovány jako proces I(0), tj. časová řada integrovaná (I) řádu nula (0). V
jednorovnicovém vyjádření při konečném zpoždění, jde o autoregresní funkci, kde máme
zpožděnou vysvětlovanou proměnnou na pravé straně rovnice (yt-1). Konečné zpoždění
jednoho období AR(1) lze vyjádřit jako rovnici: „𝑦𝑡 = konstanta + 𝛼1trend + 𝛼2 𝑦𝑡−1 +
𝜀𝑡“ s trendem, nebo bez trendu: „ 𝑦𝑡 = konstanta + 𝛼2 𝑦𝑡−1 + 𝜀𝑡“.
Deterministické časové řady se vyznačují předurčeným trendem, mají v sobě
zakomponovánu počáteční podmínku a odchylka má povahu tzv. „náhodné procházky“
(random walk). Hodnoty se „nevrací“ k nějaké konstantě či trendu, povaha řady je
nestacionární (neustálená). V našem zkoumání budeme nejčastěji tyto řady označovat jako
I(1), integrované (I) řádu (1), případně jako I(d) integrované vyššího řádu.
U deterministických (nestacionárních) řad se objevuje problém v MLR.2 a MLR.4. Tento
problém nazýváme zdánlivou regresí. Analýza nestacionárních časových řad je
21
komplikovanější. Obvykle je nutné odstranit problém nestacionarity např. pomocí
transformace dat na jejich první diferenci (odečíst od sebe pozorování v čase, např. yt = yt
- yt-1), avšak tím už sledujeme v odhadu změnovou proměnnou yt místo úrovňové
proměnné yt. Vyhledávanou vlastností u těchto řad je možnost sledovat vztah vzhledem
k jiné časové řadě. Jde o tzv. kointegraci, kdy je provedena analýza 2 (a více)
nestacionárních časových řad (např. HDP a spotřeba), které jsou integrovány stejného řádu
a jejich společné namodelované ekvilibrium je časová řada stacionární I(0).
Obrázek 1: Ukázka nestacionární řady
Zdroj: Vlastní zpracování
V těchto případech je možné zvažovat i další analýzu pomocí modelů s korekcí chyby
(„Error correction models“) a tzv. Grangerovu kauzalitu. Při interpretaci Grangerovy
kauzality vždy používáme toto slovní spojení, protože se nejedná o kauzalitu skutečnou.
V Grangerově kauzalitě testujeme pouze směr, ve kterém hodnoty v minulosti jedné
proměnné ovlivňují hodnoty v následujícím období jiné proměnné. Grangerova kauzalita
může být obousměrná a je tu stále velké riziko zdánlivé regrese anebo vynechaní klíčové
tzv. třetí proměnné z modelu.
Kointegrační analýzu je nutné podložit ekonomickou teorií a historickým kontextem. Je
nutné zdůvodnění, proč jsou dané řady vzájemně v ekvilibriu. Pokud nemáme dostatečný
teoretický podklad, lze takto odhadnout i nesmyslné vztahy (S&P index a cena oběda
v Menze).
22
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 15-48)
Kontrolní otázky
1. Uveďte příklady časových řad – sérií.
2. Definujte stochastický proces.
3. Definujte stacionární proces.
4. K jakému problému dochází u časových řad při podmínce MLR 2.?
5. K jakému problému dochází u časových řad při podmínce MLR 4.?
6. Co je to jednotkový kořen a jak se testuje?
7. Co je to kointegrace?
8. Jak je definována Grangerova kauzalita?
9. Jaký je vztah mezi kauzalitou a regresí?
10. Co je to zdánlivá regrese?
Odkaz na praktickou část
3.2 Počet pravděpodobnosti a statistické rozdělení dat. Pravidla regresní analýzy pro
průřezová data
23
2.5 Testování předpokladů konvenční asymptotické teorie pro
odhady časových řad metodou nejmenších čtverců,
transformace časových řad, časové řady typu I(0) a I(1)
Klíčová slova
Stacionarita, jednotkový kořen, bílý šum, náhodná procházka, zdánlivá regrese
Cíle kapitoly
Cílem je pochopení testování předpokladů konvenční asymptotické teorie pro odhady
časových řad metodou nejmenších čtverců. Cílem je pochopit transformaci časových řad na
časové řady typu I(0).
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Abstrakt
V této kapitole je představen postup pro rozšířený Dickeův Fullerův test (Augmented
Dickey Fuller – ADF). ADF testování přítomnosti jednotkového kořenu je součástí každé
analýzy časových řad. Nechť jsou definovány tyto základní modely vycházející z předpisu
pro AR(1): „𝑦𝑡 = konstanta + 𝛼1trend + 𝛼2 𝑦𝑡−1 + 𝜀𝑡“. Konstanta je výchozí průměrná
úroveň, trend odpovídá zapojení časové proměnné (rok, čtvrtletí apod.) do modelu a 𝑦𝑡−1 je
o jedno období zpožděná vysvětlovaná proměnná 𝑦𝑡. Před dalším zkoumáním a
modelováním je nutné otestovat přítomnost jednotkového kořenu v časové řadě.
Rovnice pro rozšířený Dickeyův Fullerův (ADF) test s trendem má podobu: „∆yt =
konstanta + β1trend + (β2 − 1)yt−1 + ∑ ωm∆yt−m
k
m=1 + ut “. U této rovnice ADF platí
předpoklad, že je vhodné sledovat i koeficient trendu (β1trend). Takový ADF test je
vhodné použít pro časové řady, které viditelně rostou, nebo klesají. To samé platí i o počtu
přidaných časových zpoždění v předposledním členu rovnice ADF testu ∑ ωm∆yt−m
k
m=1 ,
24
které redukují problém autokorelace. U ročních časových řad je vhodné přidat minimálně
zpoždění dvou let, logicky pak u měsíčních časových řad pak minimálně 24 zpoždění. Pro
ADF je model co nejvíce doplnit dalšími exogenními proměnnými.
Rovnice pro ADF test bez trendu má podobu: “∆yt = konstanta + (β2 − 1)yt−1 +
∑ ωm∆yt−m
k
m=1 + ut “ předpokládá se, že trend v časové řadě nedává smysl, je to
například u časových řad, které obvykle nemají jasný klesající či rostoucí trend. Nebo u
časových řad, kde např. ekonomická teorie ani nepředpokládá výskyt členu β1trend. ADF
test je součástí běžných statistických programů a zobrazuji se i kritické hodnoty pro
vyhodnocení t-testu pro sledovaný koeficient (β2 − 1). Kritické hodnoty jsou striktnější a
odlišné od standardního dvoustranného (two-tailed) t-testu pro testování nulové hypotézy
H0, která říká, že: Zkoumaná časová řada obsahuje jednotkový kořen a není řadou
stacionární.
ADF test není silným testem a neposkytuje vždy přesné výsledky a je vhodné vždy
používat intuici, data nejprve zobrazit a poté rozhodnout o strategii testování. Pro ujištění
se, zda testování jednotkového kořene bylo úspěšné, je vhodné použít i další testy
jednotkového kořene např. Phillipsův-Perronův test a verzi ADF testu odhadovanou
pomocí generalizovaných nejmenších čtverců (Generalized Least Squares).
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 49-54)
Kontrolní otázky
1. Na jakém principu funguje ADF test?
2. Jakým způsobem upravujeme parametry ADF testu, na čem naše taktika testování
závisí?
3. Pro jaké časové řady použijeme ADF, kdy testujeme přítomnost jednotkového
kořenu bez trendu?
4. Kolik období je vhodné mít pro zpoždění v modelu, pokud jednotkou je týden,
abychom předešli problémy s autokorelací?
5. Jaké testy používáme pro ověření přítomnosti autokorelace?
25
6. Jaký test nám pomůže odhalit sériovou korelaci na konkrétním stupni zpoždění?
7. Popište problémy, které mají časové řady při plnění Gaussových – Markovových
podmínek?
8. Co je to striktní exogenita a podmíněná exogenita časových řad?
9. Které metody s kontrolou na autokorelaci lze použít pro odhad stacionárních
časových řad.
10. Jaké transformace využíváme pro odhad časových řad?
Odkaz na praktickou část
3.3 Testování předpokladů konvenční asymptotické teorie pro odhady metodou
nejmenších čtverců pro průřezová data a pro časové řady
26
2.6 Modelování časových řad pomocí regresní analýzy
Klíčová slova
Autoregresní model, dlouhodobý efekt, Box-Jenkinsonova metoda
Cíle kapitoly
Cílem kapitoly je osvojení si principů Box-Jenkinsonovy metodologie a pochopení
modelování časových řad pomocí regresní analýzy.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Abstrakt
Standardní regresní analýza je aplikována na odhad stacionární časové řady. V
autoregresních modelech (AR) se zpoždění vysvětlované proměnné objevuje na pravé
straně rovnice. Avšak lze zapojit i zpožděné vysvětlující proměnné, které jsou na pravé
straně rovnice. Tím se odhaduje efekt minulých hodnot exogenních proměnných (LRP Long
run propensity).
Klasický AR(1) model má podobu: yt = konstanta + β’X’t + λyt-1 + u pro zapojení jednoho
zpoždění (yt-1) vysvětlované proměnné yt s vektorem exogenních vysvětlujících
proměnných X’t a chybové složky u. Dalším příkladem je zapojení zpoždění vysvětlujících
proměnných. yt = konstanta + βxt + γxt-1 + u. V tomto případě lze sledovat souhrnný
dlouhodobý efekt (LRP) vysvětlující proměnné. Kolik zpoždění xt + xt-1 +xt-2 + xt-3 apod.
bude v modelu zapojeno je testováno společným F-testem odhadnutých koeficientů.
V obou příkladech je možné dále zapojit trend, a to buď prostý lineární yt = konstanta +
β’X’t + t + u, nebo kvadratický t*t, případně kubický t*t*t apod.
Základní transformací pro odhad časových řad je běžná diference ∆y 𝑡 = yt − yt−1, anebo
logaritmická diference ∆log y 𝑡 = log yt − log yt−1, která zajistí odstranění
jednotkového kořenu. Problémem je však, že touto transformací ztrácíme informaci o
27
úrovni sledované proměnné yt a máme informaci pouze o průběhu změny ∆y 𝑡, případně
procentní změny u logaritmické diference. Např. nevysvětluje se úroveň HDP v mld. Kč
ale absolutní, případně procentní růst HDP. Dále se používá Boxova-Jenkinsonova metoda,
která ztotožňuje systematickou část časové řady s částí deterministickou (nestacionarita) a
je založena na myšlence, že časová řada může být vždy chápána jako řada stochastického
charakteru.
Pro testování autokorelace se používá Durbinův Watsonův alternativní test, který dokáže
identifkovat problém autokorelace. Pokud nás zajímá autokorelace pro vybraná použitá
zpoždění, které se použily v modelu, je vhodné použít Breuschův – Godfreyův test
využívající Lagrangeovy multiplikátory (LM). Pro stacionární řady bez jednotkového
kořene lze využít přímo metodu odhadu, která pracuje se korelací časových řad. První je
Praisova – Winstenova metoda, případně Cochranova-Orcuttova metoda AR(1) regrese.
Obě metody využívají iterací (pro chybovou složku), a pokud dojde ke konvergenci
v parametru rhó, je výsledný model bez autokorelace. Další metodou je např. Feasible
generalized least squared (FGLS).
Rovince regrese yt = konstanta + βxt + γxt-1 + ut. (1)
Rovnice Durbin –Watson d statistiky (2) pro rovnice regrese (1):
𝑑 =
∑ (𝑢̂ 𝑡+1− 𝑢̂ 𝑡)2𝑛−1
𝑡=1
∑ 𝑢̂ 𝑡
2𝑛
𝑡=1
(2)
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 67-76)
Kontrolní otázky
1. Popište rovnici AR(1) modelu.
2. Popište rovnici AR(1) modelu se zpožděnou vysvětlující proměnnou.
28
3. Sestavte rovnici AR(1) modelu tak, abyste mohli definovat LRP pro 3 období
vysvětlující proměnné.
4. Jaké druhy trendu lze použít v AR(1) modelech?
5. Jak lze otestovat stacionaritu AR(1) modelu?
6. Jak lze otestovat přítomnost sériové korelace v AR(1) modelu?
7. K čemu slouží Praisova – Winstenova metoda odhadu?
8. Jak otestuji heteroskedasticitu v AR(1) modelu?
9. Co je hlavním problémem transformace nestacionární časové řady pomocí
diferencí?
10. Proč se využívá logaritmická transformace, jaké má praktické výhody?
Odkaz na praktickou část
3.3 Testování předpokladů konvenční asymptotické teorie pro odhady metodou
nejmenších čtverců pro průřezová data a pro časové řady
29
2.7 Časové řady v ekonomickém výzkumu a podnikové praxi,
možnosti pokročilých metod
Klíčová slova
Box-Jenkinsonova metoda, stacionární řady, nestacionární řady, ARIMA, GARCH
Cíle kapitoly
Cílem je pochopení modelování časových řady v ekonomickém výzkumu a podnikové
praxi při využití pokročilých metod pro nestacionární časové řady.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Abstrakt
Stochastický proces je striktně stacionární. Protože striktní stacionaritu je v praxi obtížné
ověřovat, je v analýze časových řad zavedena postačující podmínka „slabé stacionarity“.
Stochastický proces je slabě stacionární jen tehdy a tehdy, když µt = µ, σt
2
= σ2
pro všechna
t a kovarianční a korelační funkce závisí pouze na časové vzdálenosti náhodných veličin.
Invertibilní proces je lineární proces, který umožňuje zápis ve tvaru, kdy jeho současná
hodnota je vyjádřena pomocí minulých hodnot (t-p) a současné hodnoty bílého šumu (ut).
Invertibilita má stěžejní význam pro konstrukci předpovědí.
Identifikace použití základního nebo pokročilého modelu je počátečním krokem tzv.
Boxovy-Jenkinsovy metodologie. Pro modely stacionárních časových řad jde o
autoregresní procesy (AR), procesy klouzavých průměrů (MA), o smíšené procesy
AR+MA (ARMA). Modely nestacionárních časových řad identifikují procesy náhodné
procházky (Random Walk Process), procesy ARIMA, modely sezonních časových řad,
sezonní autoregresní procesy (SAR), sezonní procesy klouzavých průměrů (SMA), smíšené
sezonní a nesezonní procesy (SARMA), modely sezonních integrovaných časových řad
(SARIMA), modely časových řad s dlouhou pamětí, modely s režimy určenými
30
nepozorovatelnými veličinami – model MSW (Markov-Switching). Samostatnou kategorií
jsou lineární modely volatility v analýze finančních dat, modely ARCH (Autoregressive
Conditional Heteroscedasticity), modely GARCH (Generalized ARCH), nelineární modely
volatility – modely EGARCH (Exponential GARCH). Druhým krokem tzv. BoxovyJenkinsovy
metodologie je samotný odhad parametrů modelu a třetím krokem je intenzivní
testování – ověřování modelu.
Mezi základní modely stacionárních procesů patří AR(1), což je autoregresní proces
prvního řádu. Pokročilou metodou je AR(p), kdy v modelu je více než jedno roční
zpoždění: yt = konstanta + β*xt + γ*yt-1 +…+ ut. Je-li model klouzavých průměrů
reziduální složky konečného stupně MA(stupeň), je vždy stacionární. Proces klouzavých
průměrů prvního řádu má formu yt = at - θ1at-1, u vyšších stupňů máme více zpoždění
proměnné at: yt = at - θ1at-1- θ2at-2- …- θpat-p. ARMA(1,1) proces je MA(1) proces se
zpožděnou vysvětlovanou proměnnou AR(1) dohromady tedy ARMA (AR stupeň p, MA
stupeň q): yt = yt-1 + at - θ1at-1.
Model ARIMA (p,d,q) se nazývá autoregresním integrovaným procesem klouzavých
průměrů řádu p, d, q (z angl. autoregressive integrated moving average). Z modelu
ARIMA(p,d,q) se stává po diferenci d-tého řádu model ARMA(p,q), což lze vyjádřit jako
Xt ∼ ARIMA(p, d, q) X ∼ ARMA (p, q), kde je operátor diference. U konstrukce
ARIMA modelu se mj. díky diferenci nepožaduje stacionarita analyzované řady.
Identifikace modelu je první fází výstavby modelu. Úkolem při pohledu na vizualizovanou
časovou řadu (graf časové řady) je rozhodnout, jaký typ modelu použít (AR, MA, ARIMA
apod.) a explicitně určit i řád modelu. Vlastní identifikace je založena na zkoumání
průběhu odhadnuté autokorelační funkce a parciální autokorelační funkce. Chování
autokorelační funkce napovídá, jaký typ modelu je vhodné pro danou řadu použít (test
jednotkového kořenu). Odhad parametrů modelu je komplikovaný a k jejich provedení je
zapotřebí použít naprogramované funkce a výpočetního výkonu počítače. Ověřování
modelu pomocí dodatečných testů má za úkol nezamítnout adekvátnost modelu. Existuje
více metod ověření modelu, testy „přeparametrizování“ modelu, různé testy autokorelace a
odhadnutých reziduí apod.
31
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 77-86)
Kontrolní otázky
1. Proč časové řady neplní podmínku tzv. striktní exogenity.
2. Popište podmínky „slabé stacionarity“.
3. Co je to tzv. invertibilní proces?
4. Co je to bílý šum?
5. Jaké pokročilé metody odhadu lze použít pro stacionární časové řady?
6. Jaké pokročilé metody odhadu lze použít pro nestacionární časové řady?
7. Popište vazby mezi AR(1), MA (1) a ARMA(1,1) procesem.
8. Jak se liší ARMA a ARIMA proces?
9. Jaké testy jsou vhodné ve fázi post odhadu časové řady v případě pokročilých
metod?
10. Jaké pokročilé metody lze použít pro lineární modely volatility v analýze finančních
dat?
Odkaz na praktickou část
3.3 Testování předpokladů konvenční asymptotické teorie pro odhady metodou
nejmenších čtverců pro průřezová data a pro časové řady
32
2.8 Pokročilé modelování časových řad pomocí regresní
analýzy
Klíčová slova
Logaritmická transformace, dummy, kvadratická proměnná, proxy, instrument
Cíle kapitoly
Cílem je pochopení pokročilého modelování časových řad pomocí regresní analýzy
s využitím různých druhů transformace proměnných a proměnných typu IV a proxy.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Abstrakt
Dummy proměnná v MLR modelu umožňuje přidat „přepínač“, který nám upravuje
výchozí hodnotu β0. Tím dochází k předefinování toho, co obsahuje konstanta v modelu
(β0). Konstanta popisuje výchozí populaci pokud je vysvětlovaná proměnná nulová, je to
skupina, vůči které srovnáváme a interpretujeme další odhadnuté koeficienty v regresním
modelu. Nechť y = β0 + … + βkxk + u …kde βkxk jsou klasické exogenní kvantitativní
proměnné typu příjem, výška, množství a počet let. Pak β0 je úrovňová konstanta vzorku.
Např. průměrná výchozí výška zkoumané populace, za jinak nezměněných podmínek: ŷ =
179 + … + βkxk + u, kde 179 je průměrná výchozí výška zkoumané populace za jinak
nezměněných podmínek. Pokud do MLR modelu přidáme proměnnou x1_dummy, která
nabývá hodnot 0 a 1, a hodnoty 1, když jde o ženy. Např. ŷ = 175 + 4 x1_dummy … + βkxk +
u, kde 175 je průměrná výchozí výška mužů ve zkoumané populaci za jinak nezměněných
podmínek. Průměrná výchozí výška žen ve zkoumané populaci je o 4 cm vyšší (175+4) za
jinak nezměněných podmínek. Obvykle se používá více dummy proměnných v modelu.
Úrovňovou konstantu lze pak popsat jako průměrnou výchozí hodnotu vysvětlované
proměnné, když všechny dummy proměnné se rovnají 0. Problém „dummy trap“ neboli
33
past dummy proměnných nastane, pokud v modelu máme kolineární dummy proměnnou.
Např. x1_dummy (=1 když žena) a zároveň x2_dummy (=1 když muž), pokud muž a žena jsou jediné
definované pohlaví, pak dummy proměnná pro ženy plně vysvětluje dummy proměnnou
pro muže (přítomnost perfektní kolinearity).
Kvadratická proměnná v rovnici y = b0 + b1z1 + b2(z1)2
+ ... + bkxk + u se používá s cílem
zjistit, zda existují rostoucí (b1z+ b2z2
) nebo klesající (b1z - b2z2
) výnosy z rozsahu. Cílem
je odhadnout „optimální“ hodnotu, resp. hodnotu globálního extrému z* a parciální efekt:
z
z
y
21 2 


, přičemž tento efekt vypočteme jako
2
1
2


z .
Logaritmované proměnné v MLR modelu, kombinace ln(x1) a ln(y)
I. Typ log-level: ln(y) = β0 + β1x1 + ... + β kxk + u
II. Typ level-log: y = β0 + β1ln(x1) + ... + β kxk + u
III. Typ log-log: ln(y) = β0 + β1ln(x1) + ... + β kxk + u
Interpretace pro konkrétní hodnotu logaritmicky transformované proměnné je přímočará.
Hodnota je dosazena do výsledné rovnice a v případě potřeby převedeme vysvětlovanou
proměnnou (typ I. a III.) zpět na tzv. netransformovanou „level hodnotu“ pomocí inverzní
funkce k přirozenému logaritmu, tj. jde o exponenciální funkci. Avšak snadnost
interpretace je právě v možnosti interpretovat situaci i procentně. Zde je třeba rozlišit tři
případy, které mohou nastat.
I. Odhadnutá rovnice (pod koeficienty v závorce je standardní chyba):
ŷ = ln(hodinová mzda) = 1.56 - 0,251*ženy + 0,0112*věk + u
Pak β0 je úrovňová konstanta a nabývá hodnoty 1,56. Po převedení na exponenciální
hodnotu exp(1,56304) nabývá hodnoty 4,76, což představuje nikoliv aritmetický průměr,
ale průměr geometrický, pouze pro muže a to ve věku 0 let. Úrovňová konstanta proto zde
není pro interpretaci zajímavá. Růst věku o jednotku (zde je jednotka 1 rok) způsobí růst
platu v (geometrickém) průměru o [exp(0,0111950)-1], což je 1,122 %, za jinak
nezměněných podmínek. Při velmi malých hodnotách beta koeficientů jsou si hrubé (1,112
%) a skutečné vyjádření (1,122 %) více podobné.
II. Odhadnutá rovnice (pod koeficienty v závorce je standardní chyba):
ŷ = hodinová mzda = -4.03 - 1.77*ženy + 3.47*ln(věk)
Pak β0 je úrovňová konstanta a nabývá průměrné (aritmetické) hodnoty -4,032 dolarů za
hodinu pro muže ve věku nula let. Úrovňová konstanta v tomto „level-log“ modelu není
34
nijak zajímavá. Pro případnou interpretaci je nutné zvolit např. úroveň mzdy pro 25leté,
nebo jinou konkrétní hodnotu. Odhadnutý efekt věku zde není lineární (i když efekt
3.47*ln(věk) je lineární v paramteru). Díky logaritmování má efekt věku průběh
logaritmické funkce. To znamená, že není možné použít absolutní změnu ve věku (o 10
let), ale změnu relativní, např. o 10 %.
Vyjádřeno formálně 10 % změna u věku je hodnota ln(1,1) a tou vynásobíme odhadnutý
koeficient u věku (3.46983). Při 10% změně věku sledujeme v průměru (aritmetickém) růst
hodinové mzdy o ln(1,1)* 3.46983 = 0,33 dolaru.
III. Odhadnutý logaritmovaný model hodinové mzdy v dolarech v podobě:
ŷ = ln(hodinová mzda) = -0.921 - 0.268*ženy + 0.536*ln(věk) + 0.0783*vzdělání
Pak β0 je úrovňová konstanta a nabývá hodnoty -0,92. Po převedení na exponenciální
hodnotu exp(-0,92) nabývá hodnoty 0,3985, což představuje nikoliv aritmetický průměr,
ale průměr geometrický pro hodinovou mzdu a to pouze pro muže, ve věku 0 let a s 0 lety
vzdělání. Úrovňová konstanta opět není nijak zajímavá a museli bychom arbitrárně vybrat
pro interpretaci zajímavější skupinu mužů, např. ve věku 40 let a průměrného počtu 12 let
vzdělání, pokud bychom vůči této skupině chtěli srovnávat a dávat příklady.
Odhadnutý efekt věku zde není lineární, má průběh logaritmické funkce. To znamená, že
nelze použít absolutní změnu ve věku, ale změnu relativní, např. o 10 %, 5 % anebo 1 %.
Při 10% změně věku je v průměru (geometrickém) růst hodinové mzdy 1,1^0.535984=
1,0524 o 5,24 %.
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 87-93)
Kontrolní otázky
1. Co je to dummy proměnná?
2. Co je to dummy trap?
3. K čemu slouží v modelu kvadratická proměnná?
4. Popište výpočet globálního extrému kvadratické funkce.
5. Jak interpretujeme tzv. „log – level“ model?
35
6. Jak interpretujeme tzv. „level – log“ model?
7. Jak interpretujeme tzv. „log – log“ model?
8. Co je to proxy proměnná?
9. Uveďte příklad proxy proměnné.
10. Co je to instrumentální proměnná?
11. Popište podmínky použití instrumentální proměnné.
Odkaz na praktickou část
3.4 Modelování časových řad pomocí regresní analýzy
36
2.9 Základní principy teorie fuzzy množin a fuzzy logiky
Klíčová slova
Množina, logika, fuzzy logiky, věty, inference
Cíle kapitoly
Cílem je pochopení základních principů teorie fuzzy množin a fuzzy logiky. cílem je
pochopit konstrukci množin a tzv. funkcí příslušnosti.
Výstupy z učení
 16.1 zná základní pojmy a pravidla fuzzy logiky
Abstrakt
Fuzzy je slovo pocházející z angličtiny a znamená mlhavý, nejasný, nebo neostrý. Fuzzy
logika je také mlhavá, nejasná, neostrá a je na první pohled značně neurčitá. Standardní
matematická a výroková logika je věda o zákonech správného myšlení, o zákonech a
pravidlech nutných pro vyvozování správných závěrů. Tato logika je postavena na
hodnocení výroku (věty, výrazu apod.) a nabývá hodnot ANO a NE. „ANO, toto tvrzení je
pravdivé“ nebo „NE, toto tvrzení není pravdivé“.
V praxi se však člověk pohybuje v prostředí, kde neurčitost, mlhavost a nejasnost hraje
hlavní roli při každodenní komunikaci. Fuzzy logika se proto hodí pro společenské vědy,
avšak objevuje se i v exaktních vědách. Fuzzy logika pomáhá při konstrukci například
elektronického tlumočníka, při rozvoji a konstrukci umělé inteligence, která je schopna
provést výtah textu, provést diagnózu pacienta, nebo řídit automobil v hustém provozu.
Fuzzy logika staví na tom, že člověk stojící před řešením složitého úkolu neuvažuje a
nepočítá ve své mysli pomocí přesně definovaných nula jedničkových hodnot, ale spíše
„počítá“ s několika mlhavými pojmy najednou, které nabývají hodnot jako nedaleko, skoro
dobře, přijatelně, rychle, málo, vlažně apod. Jde o nenumerické pojmy, které umí vhodně
zpracovávat algoritmus neuronové sítě, genetické algoritmy a zejména teorie fuzzy množin.
37
Mlhavé pojmy je možno popsat matematicky přesně s použitím nástrojů tradiční logiky a
následně s nimi v rámci povolených operací pracovat. Výsledkem je schopnost systému
využívat rozhodovacích procesů, do kterých vstupují neurčité a mlhavé vstupní údaje.
Standardně vyučovaná matematická teorie množin připouští pro příslušnost prvku do
množiny pouze dvě možnosti. Prvek buď do množiny patří (hodnota 1) nebo nepatří
(hodnota 0). Příkladem může být poloha knih na čtvercovém stole (viz Obrázek níže).
Prvek (kniha) je buď v levé polovině, nebo pravé polovině. Pokud by ležel na rozhraní, pak
musíme vytvořit novou množinu, nebo využijeme fuzzy množin a prvku přisoudíme
jakousi váhu, pravděpodobnost příslušnosti k systému. Předmět (Kniha C) je na rozhraní.
Z fuzzy logiky je z 80 % na levé straně a z 20 % na pravé straně.
Obrázek 2: Fuzzy množina a charakteristická fuzzy funkce náležitosti do množiny A
Zdroj: Vlastní zpracování
Věrnější popis Knihy C tedy je, že do množiny A patří jen částečně. Hodnota funkce μA(x)
= 0,8, tj. 80% náležitost do množiny A. Charakteristickým rysem fuzzy množiny tedy je, že
Kniha
C
Kniha
A
Kniha
B
Množina A
Levá strana stolu
Množina B
Pravá strana stolu
1
0,8
0
Funkce μA příslušnosti prvku x do
množiny A: μA(x)
μA(x)  [0,1]
μA(x)
Prvek
x
38
příslušnost není dána hodnotou 0 nebo 1, ale celým intervalem od nuly do jedné <0,1>.
Charakteristická funkce μ se v teorii fuzzy množin nazývá funkce příslušnosti prvku do
množiny.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 6-15)
Doporučená literatura
DOSTÁL, P., 2012. Pokročilé metody rozhodování v podnikatelství a veřejné správě. Brno:
CERM Akademické nakladatelství. ISBN 978-80-7204-798-7. (s. 1-26)
Kontrolní otázky
1. Co znamená slovo fuzzy?
2. Jak se liší fuzzy logika a tradiční výroková logika?
3. Proč je fuzzy logika vhodná pro společenské vědy?
4. Kde se využívá fuzzy logika v ekonomii?
5. Kde se využívá fuzzy logika v exaktních vědách?
6. Jaký je rozdíl mezi numerickými a nenumerickými pojmy?
7. Co je to fuzzy výrok?
8. Co je to fuzzy funkce náležitosti do množiny?
9. Jakých hodnot nabývá fuzzy funkce náležitosti do množiny?
10. Jakých hodnot by tato funkce náležitosti do množiny nabývala v klasické výrokové
logice?
Odkaz na praktickou část
3.4 Modelování časových řad pomocí regresní analýzy
39
2.10 Fuzzy systémy, adaptace ve fuzzy systémech
Klíčová slova
Inference, integrace, fuzzifikace, operátor
Cíle kapitoly
Cílem je pochopení fuzzy systémů, procesu adaptace ve fuzzy systémech. Cílem je
seznámit se s fuzzifikací a základními operacemi s fuzzy množinami.
Výstupy z učení
 16.1 zná základní pojmy a pravidla fuzzy logiky
Abstrakt
Zatímco v klasické teorii množin charakteristická funkce příslušnosti prvku do množiny
nabývá jen dvou hodnot: 0 nebo 1, v teorii fuzzy množin charakteristická funkce
příslušnosti do fuzzy množiny nabývat všech hodnot od 0 do 1. Tvar funkce příslušnosti
může být různý. Nejčastěji se používají tvary sestavené z lomených přímek. Používají se i
hladké průběhy jako je uvedeno v předchozí kapitole pro příslušnost knihy do množiny. V
extrémních případech se používá tvar nazývaný singleton, což je případ jednobodové
množiny. Rozsah charakteristické funkce příslušnosti do fuzzy množiny se nazývá
univerzum.
Pro fuzzy výroky existují operátory A (AND) a NEBO (OR). Využívá se též logická
negace a skládání (doplněk množiny A =1- μA, průnik množiny A a B = minimum{μA(x),
μB(x)}, sjednocení = maximum{μA(x), μB(x)}. Místo implikací se využívá když-potom (IFTHEN)
relací. Podmínek a pravidel v relaci může být více. Do relace vstupují fuzzy
množiny, podléhají soboru pravidel, dochází k agregaci výsledného souladu s pravidly a
formování výstupní fuzzy množiny.
Inference slouží ke konstrukci fuzzy systémů. Ostré hodnoty z báze dat jsou podkladem pro
tvorbu fuzzy množin „proces fuzzifikace“. Tyto množiny vstupují do relace (inferenční
mechanismus s bází pravidel, který opět využívá bází dat), vzniká nová fuzzy množina,
dochází k defuzzifikaci a získání ostré hodnoty.
40
Tento fuzzy systém si lze představit na příkladu. Představte si, že expert daný problém
vyjadřuje slovním popisem typu „jestliže x1 je malé a současně x2 je dostatečně pružné,
potom veličina y je středně velká“. Tento popis je fuzzy pravidlem a důležitá je zde slovní
klasifikace „malý, dostatečně pružný, středně velký“. Tuto expertní znalost je však potřeba
„vytěžit“ z experta a naučit i ostatní schopnosti posuzovat realitu pojmy „malý, dostatečně
pružný, středně velký“.
Aproximace je další pojem související s fuzzy logikou. Libovolnou spojitou funkci
definovanou na kompaktní množině je možno s libovolnou přesností aproximovat fuzzy
systémem. to znamená, že fuzzy systém je univerzální aproximátor.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 16-33)
Kontrolní otázky
1. Jaký je obvyklý tvar funkce příslušnosti?
2. Co je to singleton?
3. Co je to univerzum fuzzy funkce?
4. Definujte doplněk fuzzy množiny.
5. Definujte průnik fuzzy množin A a B.
6. Definujte sjednocení fuzzy množin A a B.
7. Jak je definována implikace ve fuzzy teorii?
8. Co jsou to fuzzy relace?
9. Co je to fuzzifikace?
10. Popište proces defuzzifikace.
Odkaz na praktickou část
3.5 Pokročilé modelování časových řad pomocí regresní analýzy
41
2.11 Uvedení příkladů aplikací fuzzy logiky v rozhodování,
jako je např. manažerské a investiční rozhodování,
predikce atd.
Klíčová slova
Finanční trhy, ceny, kolísání, pravděpodobnost
Cíle kapitoly
Cílem je pochopení fuzzy systémů a příkladů aplikací fuzzy logiky v manažerském a
investičním rozhodování a při predikci časových řad.
Výstupy z učení
 16.1 zná základní pojmy a pravidla fuzzy logiky
Abstrakt
Fuzzy logika je hojně využívána v ekonomickém výzkumu, a to v oblastech: Predikce
ekonomických časových řad, predikce volatility časových řad na kapitálových trzích, zde je
možné zpracovávat data o obchodování s akciemi a vytvářet vlastní fuzzy systémy (kurzy
měn, ceny derivátů, akcií, dluhopisů, komodit atd.). V podnikovém a data miningu umí
fuzzy logika získávat expertní znalosti a informací skryté v chaotickém a na první pohled
nesrozumitelném kvantu dat. Dále při řízení vztahů se zákazníky a při řízení zdrojů. Díky
tomu je možné, jak snížit náklady, tak zvýšit zisk firmy, a tudíž přispět k alokační
efektivnosti firmy.
K modelování příkladů se využívá nástroje MATLAB – počítačový program. Ten obsahuje
tzv. toolbox s názvem „Fuzzy Logic“, zde je možné nastavit počet vstupních proměnných,
počet výstupních proměnných, označit (identifikovat) proměnné a definovat metodu
defuzzifikace. Definování funkce příslušnosti (Membership function) sestává z počtu,
tvaru, jména a rozsahu proměnných. Vybrat lze mnoho funkcí a tvarů od klasických
„trojúhelníkových tvarů“, Gaussovu křivku a další. Poté je možné definovat inference typu
„if-then“ (jestliže „fuzzy výrok“ – pak „fuzzy výrok“).
42
Fuzzy množiny jsou vhodné tam, kde je více kritérií ohodnocení. Např. hodnocení přístupu
operátora zákaznické podpory ke klientovi, které sestává i z jeho schopnost vyřešit
konkrétní problém, a následně je hodnoceno na úrovni 0 až 10. Jakou měsíční odměnu k
platu dostane, pokud ta je v průměru 3 000,- Kč? Manažer oddělení definuje fuzzy pravidla
(jestliže-pak) následovně: Jestliže je přístup operátora nevhodný, potom je odměna nižší.
Jestliže je přístup operátora dobrý, potom je odměna průměrná. Jestliže je přístup výborný,
potom je odměna vyšší. Jestliže problém nevyřeší, potom je odměna nízká. Jestliže
problém vyřeší, potom je odměna vyšší. Funkce příslušnosti jsou následující, pro ilustraci
problému je použita klasické trojúhelníková funkce příslušnosti (viz Obrázek níže):
Obrázek 3: Funkce příslušnosti pro hodnocení odměny zákaznické podpory
Zdroj: Vlastní zpracování
Zpracování pravidel pak probíhá postupně, začneme prvním: Jestliže je přístup operátora
nevhodný, potom je odměna nižší (viz Obrázek níže).
Obrázek 4: Zpracování prvního pravidla
Zdroj: Vlastní zpracování
Pravděpodobnost
0%100%
Přístup operátora Vyřešení problému Výše odměny (tis. Kč)
Nevhodný – Dobrý – Výborný Nevyřeší Vyřeší Nižší - Průměrná - Vyšší
0 2,5 5 7,5 10 0 5 10 0 1,5 3 4,5 6
Přístup operátora Výše odměny (tis. Kč)
Pravděpodobnost
0%100%
0 2,5 4 5 7,5 10 0 1,5 3 4,5 6
43
Z obrázku je patrné, že operátor může dostat odměnu od nuly do 4,5 tisíce Kč, pokud jeho
hodnocení přístupu je na úrovni 4 bodů z 10. V obrázku pro přístup operátora v bodě 4 je
protnuta jak funkce pro nevhodný přístup, tak pro dobrý přístup, rozhodně není protnuta
fialově znázorněná funkce pro výborný přístup. Výše odměny pak spadá do barevně
ohraničeného intervalu, přičemž zde existuje zajímavý průnik mezi hodnotami 1,5 až 3
tisíce Kč. K danému schéma lze přidat i třetí dimenzi, a to je operátorova schopnost vyřešit
problém. Takto lze graficky zpracovávat funkce příslušnosti a poté v programech typu
MATLAB postupně využít tzv. Mandaniho nebo Sugeno metody defuzzifikace pro
výsledné určení výše odměny.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 34-70)
Kontrolní otázky
1. Jak lze fuzzy logiku použít v dataminingu?
2. Jak byste použili fuzzy logiku pro predikci cen akcií?
3. Jaké počítačové programy lze využít pro modelování fuzzy systémů?
4. Co je to vícekriteriální analýza, kde se používá a proč je vhodné používat v těchto
případech fuzzy logiky?
5. Načrtněte fuzzy množiny s trojúhelníkovou funkcí příslušnosti pro hodnocení
výkonu zaměstnance.
6. Definujte fuzzy pravidlo pro hodnocení zaměstnance.
7. Graficky zpracujte toto pravidlo.
8. Co je to Mandaniho metoda defuzzifikace?
9. Co je to Sugeno metoda defuzzifikace?
10. Co je to Gaussova křivka?
Odkaz na praktickou část
3.6 Průběžný test
44
2.12 Modelování časových řad pomocí fuzzy logiky
Klíčová slova
Zpoždění, časový úsek, perioda, vzorce
Cíle kapitoly
Cílem je pochopit proces modelování časových řad pomocí fuzzy logiky a pochopit systém
fuzzifikace časových řad.
Výstupy z učení
 16.1 zná základní pojmy a pravidla fuzzy logiky
 16.6 modeluje časové řady pomocí fuzzy logiky
Abstrakt
Časové řady lze modelovat pomocí funkcí. První z nich je reprezentace pomocí „hustoty“.
Stupeň příslušnosti vyjadřuje, jak moc je pravdivý výrok „prvek X je přibližně r“. Pro
základní výpočty a využití fuzzy logiky se využívá toho, že funkce příslušnosti jsou
lineární (trojúhelníková fuzzy čísla). Pomocí distribuce vyjadřujeme, jak moc je pravdivý
výrok „prvek X je větší než fuzzy číslo A“, případně jak moc je pravdivý výrok „prvek X
je menší než fuzzy číslo B“. To umožňuje modelovat ostrá fuzzy čísla, nekonečná fuzzy
čísla, číselné intervaly apod.
Nejčastěji se fuzzy logiky využívá pro nákup a prodej na finančních trzích. Jsou zde
pokyny pro obchodníky, kteří hospodaří s portfolii a zajišťují např. podnik proti cyklickým
výkyvům ekonomiky, či výkyvům měnových kurzů. Jde o příkazy typu silné doporučení
pro prodej (krátká pozice), spíše prodej, držet, spíše koupě, doporučení koupit (dlouhá
pozice). Pravidlo jestliže – pak (if-then) pro fuzzy systém definujeme interně. Např.
Jestliže jdou-li ceny akcií dolů, nakupujeme bezpečné dluhopisy firem a výhodné státní
dluhopisy.
U časových řad identifikujeme podobně jako u genetických algoritmů bloky a úseky
v minulosti, tj. trendy a výkyvy časových řad. Při zapojení dalších pravidel jde o doplnění
technické analýzy o další prvky ocenění aktiv na finančních trzích, jako je fundamentální
45
analýza a psychologická analýza. To však vyžaduje kvalitní přístup k datům z finančních
trhů. Dále se využívá kombinace s umělými neuronovými sítěmi, kdy definujeme vstupní a
výstupní proměnné, proces učení a hlavní roli hraje expertní nastavení sítě.
Používané tvary funkcí příslušnosti jsou S tvar (Γ–funkce), L tvar, trojúhelník (Λ–funkce),
lichoběžník (Π–funkce), goniometrické funkce (sin, cos, sinh apod.), Gaussova funkce
(Studentovo t rozdělní, F rozdělní, normální rozdělení), sigmoida a další nelineární funkce.
Důležitým termínem pro fuzzy funkce příslušnosti je α–řez (α–cut, strong α–cut). Alfa řez
je označení podmnožiny prvků x fuzzy množiny A definované na univerzu X, do které
spadají všechny prvky, jejichž stupeň příslušnosti (definován funkcí) je vyšší nebo roven
zvolené hodnotě α.
Obrázek 5: Alfa řez fuzzy množiny
Zdroj: Vlastní zpracování
Nosič fuzzy množiny A definované na univerzu X s prvky x je ostrá množina všech prvků
s nenulovou příslušností do této fuzzy množiny.
Obrázek 6: Nosič fuzzy množiny
Zdroj: Vlastní zpracování
Jádro fuzzy množiny A definované na univerzu X s prvky x je ostrá množina všech prvků
jejichž příslušnost se rovná hodnotě 1, alfa = 1.
46
Obrázek 7: Jádro fuzzy množiny
Zdroj: Vlastní zpracování
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 70-110)
Doporučená literatura
DOSTÁL, P., 2012. Pokročilé metody rozhodování v podnikatelství a veřejné správě. Brno:
CERM Akademické nakladatelství. ISBN 978-80-7204-798-7. (s. 26-45)
Kontrolní otázky
1. Co je to reprezentace fuzzy funkcí pomocí hustoty?
2. Co je to reprezentace fuzzy funkcí pomocí distribuce?
3. Jaké časové řady obvykle zpracovává fuzzy systém?
4. Jaké další nástroje se používají pro zpracování fuzzy časových řad?
5. Popište Γ funkci příslušnosti a uveďte příklad.
6. Popište Λ funkci příslušnosti a uveďte příklad.
7. Popište Π funkci příslušnosti a uveďte příklad.
8. Popište funkci příslušnosti tzv. sigmoidu a uveďte příklad.
9. Co je to alfa řez?
10. Definujte a nakreslete příklad nosiče fuzzy množiny.
11. Definujte a nakreslete příklad jádra fuzzy množiny.
Odkaz na praktickou část
3.6 Průběžný test
47
2.13 Umělé neuronové sítě (UNS): Seznámení se se
základními pojmy v oblasti umělých neuronových sítí,
uvedení pojmu perceptron
Klíčová slova
Neuron, percepton, zpracování dat, vrstva, síť
Cíle kapitoly
Cílem je pochopit umělé neuronové sítě (UNS) a základní pojmy v oblasti umělých
neuronových sítí. Cílem je pochopení pojmu perceptron.
Výstupy z učení
 16.2 rozumí fungování umělých neuronových struktur
Abstrakt
Umělá neuronová síť je analytický nástroj, který pomocí algoritmů simuluje myšlenkové
pochody člověka. Umělá neuronová síť je modelem biologické nervové soustavy, která je
postavena na neuronech. Ty představují základní části biologického nervového systému a
jsou přenašeči informací. Neurony mají tělo, které obsahuje jádro. Do tohoto těla vedou
krátké výběžky, kterým říkáme dendrity. Ty vedou informaci směrem do buňky a z těla pak
vystupuje jeden dlouhý výběžek. Tomu říkáme axon, který vede vzruch směrem z buňky.
Umělý neuron jako jednotka umělé neuronové sítě je stavěna podobně jako biologický
neuron (Vochozka et al. 2017).
Umělý neuron je na rozdíl od biologického definován konečným počtem vstupů. Umělý
neuron má pak stejně jako biologický jeden výstup, který je schopen přenášet informaci
dál. Umělé neurony podobně jako biologické jsou mezi sebou navzájem propojeny. To,
jakým způsobem jsou umělé neurony napojeny, definuje architektura (či topologie)
neuronové sítě. UNS je analytickým nástrojem vyhodnocujícím vstupní informace, které
vyhodnotí nastavením architektury a poskytuje výstupy. Prvním modelem neuronové sítě
48
byl tzv. perceptron a jde o nejjednodušší neuronovou síť, která se skládá z jediného
výkonného prvku (Vochozka et al. 2017).
UNS se tedy skládá ze vstupních neuronů, ty jsou dále v síti navázány na výstupní neurony.
Každému spojení je přiřazena váha. Přenášená informace vstupními neurony je buď binární
(ano/ne; 1/0), nebo bipolární (-1, 0, 1). Perceptronová síť je jednovrstvá. Princip adaptace
(učení) vstupních neuronů se děje podle tzv. Hebbova pravidla. To je postaveno na
minimalizaci Euklidovské vzdálenosti (kvadratické odchylky) požadované odezvy sítě a
vnitřního potenciálu neuronu. Kromě Hebbovského učení je zde i princip adaptace
s názvem ADALINE dle Widrowse a Hoffa. To je postaveno na kvantifikaci chyby
neuronu. Při modelování UNS se využívá tzv. Rosenblattova perceptronu a MinskyPapertova
perceptronu. Tyto modely lze aplikovat na libovolnou aritmetickou nebo
logickou funkci (Vochozka et al. 2017).
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 111-139)
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 67-80)
Kontrolní otázky
1. Co je to UNS?
2. Jaká je podobnost s biologickou neuronovou sítí?
3. Jaká je rozdílnost oproti biologické neuronové síti?
4. Definujte umělý neuron.
5. Co je to perceptron?
6. Jaká je povaha přenášené informace mezi umělými neurony?
7. Co je to Hebbovské učení?
8. Co je to ADALINE?
9. Jaké perceptronové modely se využívají?
10. Na co lze aplikovat UNS?
49
Odkaz na praktickou část
3.7 Procvičování základních principů teorie fuzzy množin a fuzzy logiky
50
2.14 Vícevrstvá neuronová síť a její parametry
Klíčová slova
Skrytá vrstva, trénink, neuron, percepton, váhy
Cíle kapitoly
Cílem je pochopení principů vícevrstvých neuronová síť a osvojení si pojmů jako je skrytá
vrstva a proces učení.
Výstupy z učení
 16.2 rozumí fungování umělých neuronových struktur
Abstrakt
Perceptronová síť využívala jednu vrstvu. Vícevrstvá neuronová síť využívá principu
„učení s učitelem“ a vychází ze struktury lidského mozku. Ve výzkumu se minimálně
využívá třívrstvá neuronová síť s jednou skrytou vrstvou. Tato síť je pak schopna
realizovat libovolné zobrazení z prostoru Rn
do prostoru Rm
. R prostory jsou množiny
uspořádaných n-tic reálných čísel. Zobrazení matice Rn
do prostoru Rm
je reprezentováno
maticí A typu (m, n). Existuje mnoho typů vícevrstvých neuronových sítí. První typ je
s tzv. „dopředným šířením“, další typ je tzv. „rekurentní síť“, která je vhodná pro
zpracování časových řad (Vochozka et al., 2017).
Struktura třívrstvé L1-L2-L3 neuronové sítě typu perceptron může být například tvořena
první vrstvou (L1), tzv. vrstva vstupní. Do této vrstvy je vložen vstupní vzor. Za touto
vrstvou následuje jedna či více skrytých vrstev (L2). Počet buněk v těchto vrstvách
odpovídá složitosti realizovaného zobrazení Rn
> Rm
. K těmto vrstvám je navíc připojen
jeden neuron s pevně danou výstupní hodnotou rovnou 1, reprezentující práh neuronu.
Výstupní vrstva (L3) obsahovat jednu či více buněk dle rozměru Rm
. Neuronová síť pracuje
pouze s číselnými hodnotami. Jak vstupní, tak výstupní hodnoty je vhodné normovat do
intervalu [0; 1], případně do rozšířeného intervalu [-1, 0, 1] (Vochozka et al., 2017).
Model s učením backpropagation se vyznačuje tím, že jednotlivé vrstvy sítě jsou plně
propojeny vahami, vždy směřujícími od vstupu směrem k výstupu. Na hodnoty vah
51
jednotlivých spojů mezi umělými neurony nejsou kladena žádná omezení. Obvykle se
využívají sítě s jednou skrytou vrstvou. Neurony vstupní vrstvy jsou pasivní, protože pouze
zobrazují příslušnou vstupní souřadnici předloženému vzoru. Neurony skryté a výstupní
vrstvy jsou neurony aktivní, protože realizují výpočty na základě vstupních vah, které do
nich směřují. Každý neuron z těchto dvou vrstev má stejný výpočetní algoritmus pro
zpracování vstupu. Na těch je nejprve proveden jejich vážený součet xj reprezentující
vnitřní stav neuronu j z vrstvy J, přičemž váhy wij jsou zde váhy příslušných spojení mezi
neurony i předchozí vrstvy I a sledovaným neuronem j z vrstvy J. Hodnoty tohoto
váženého součtu mohou být vysoké a značně se vymykající požadovanému intervalu
výstupu [0; 1]. Za tím účelem je na vážený součet uplatněna výstupní funkce s(x). Tato
funkce je obvykle nelineární a spojitá, například jde o Gaussovu křivku a tzv. sigmoidální
funkci s(x)=1/[1-e^(-x)]. Hodnota výstupní funkce s(x) je potom výstupem neuronu, který
je dále šířen prostřednictvím spojů do neuronů vyšší vrstvy. Výstupem celého modelu jsou
potom výstupy buněk výstupní vrstvy (Vochozka et al., 2017).
Produkční fáze činnosti sítě (vybavování) vychází z předložení vstupního vzoru na buňky
vstupní vrstvy a postupného šíření předložených hodnot prostřednictvím sítě až k vrstvě
výstupní. Nejprve po předložení vzoru na vstupní vrstvu jsou tedy vypočítány vážené
součty a výstupní funkce vrstvy skryté a na základě jejích výstupů rovněž vážené součty a
výstupy vrstvy výstupní. Tím produkční fáze činnosti sítě končí. Po produkční fázi sítě
následuje fáze adaptace parametrů sítě (vah jednotlivých spojů) tak, aby se výstup sítě
přiblížil výstupu požadovanému. Pro tento krok je k dispozici několik učebních algoritmů,
přičemž nejpoužívanějším z nich je algoritmus označovaný jako zpětné šíření chyby (back
propagation of error). Algoritmus získal svůj název podle své základní myšlenky: síť
nejprve provede vybavování vzoru, po kterém je porovnán požadovaný výstup sítě. Na
každé buňce výstupní vrstvy tak vzniká rozdílová chyba (skutečný výstup neuronu minus
výstup požadovaný). Tato chyba je následně zpětně šířena od výstupní vrstvy, přes skrytou
až směrem k vrstvě vstupní. Proces adaptace vah je charakterizován obecným koeficientem
α, který udává míru, s jakou bude příslušná chyba eliminována. Adaptační proces probíhá
po každém předložení vstupního vzoru síti ve fázi učení, tedy samostatně pro každý vstupní
vzor ze vstupní množiny. Zejména z důvodu obvykle většího počtu vstupních vzorů a
rovněž z důvodu existence koeficientu α je i v tomto modelu nutno provádět učení
iterativně opakovaným předkládáním vstupní množiny a postupným snižováním chyby na
52
výstupu modelu. I zde je zásadní, jakým způsobem bude voleno kritérium pro ukončení
učebního procesu. Použita byla varianta ukončení učení po dosažení dostatečně malého
rozdílu v celkové chybě E mezi vybranými iteracemi. Druhou možností učení vícevrstvé
sítě je využití mechanismu RBF (Radial Basis Function). Formálně má síť stejný tvar jako
sítě s učením backpropagation, vnitřní postupy jsou však zcela jiné. Vstupní vrstva má opět
pouze formální význam a umožňuje modelu předložit vstupní vzory (vektory). Výstupy
vstupní vrstvy se zpracovávají ve vrstvě skryté, kde je použita nelineární funkce ϕ, kterou
je nejčastěji Gaussova funkce. V uvedeném vzorci je důležitý vektor výstupu neuronů
vstupní vrstvy, který obsahuje µj (střední hodnoty Gaussova rozložení pro j-tý neuron
skryté vrstvy) a σj (šířka neboli směrodatná odchylka střední hodnoty Gaussova rozložení
pro j-tý neuron skryté vrstvy). Právě hodnoty µj a σj jsou u této RBF sítě nastavitelné
hodnoty. Dalším nastavitelným parametrem jsou hodnoty vah mezi skrytou a výstupní
vrstvou wjk. V procesu učení je tedy nutné optimalizovat parametry sítě µj, σj a wj
(Vochozka et al. 2017).
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 140-182)
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 80-106)
Kontrolní otázky
1. Jaký je rozdíl mezi jednovrstvou a vícevrstvou UNS?
2. Popište prvky třívrstvé UNS.
3. Co znamená zobrazení z prostoru Rn
do prostoru Rm
?
4. Popište model UNS s učením backpropagation.
5. Co je to sigmoidální funkce?
6. Co je to produkční fáze činnosti UNS?
7. Jak probíhá adaptace UNS?
8. Co je to mechanismus RBF (Radial Basis Function)?
9. Jaký je rozdíl mezi RBF a principem UNS s backpropagation?
53
10. Jaký je rozdíl mezi principem UNS s dopředným šířením a tzv. „rekurentní sítí?
Odkaz na praktickou část
3.7 Procvičování základních principů teorie fuzzy množin a fuzzy logiky
54
2.15 Uvedení příkladů aplikace UNS pro investiční
rozhodování, odhady cen výrobků a množstevní odhady
Klíčová slova
Samoorganizace, mapa, shluková analýza, časové řady
Cíle kapitoly
Cílem je pochopení příkladů aplikací UNS pro investiční rozhodování, odhady cen výrobků
a množstevní odhady.
Výstupy z učení
 16.7 modeluje časové řady pomocí umělých neuronových struktur
Abstrakt
Stejně jako v ekonometrickém regresním modelu i u umělých neuronových sítí, je vhodné
promyslet celý experiment dopředu. Náhodné použití variant standardních modelů
neuronových sítí nevede vždy k žádoucím výsledkům. Proto byl navržen vícestupňový
mechanismus pro zpracování ekonomických dat. Pro ekonomická data je vhodná umělá
neuronová síť s učícím Kohonenovým algoritmem. Použití Kohonenovy mapy spočívá v
nastavení pomocí trénovací množiny. 2D vrstva sítě je adaptována pouze na základě
vzájemných podobností vstupních vzorů z hlediska jejich souřadnic. V této vrstvě tedy
můžeme sledováním počtu vzorů přiřazených k jednotlivým neuronům detekovat shluky
neuronů zastupujících vzory odlišné od ostatních. Shluky jsou vcelku jasně
identifikovatelné, jejich hranice obvykle tvoří neurony zastupující jen velmi malý počet
vstupních vzorů (Vochozka et al. 2017).
V dalším kroku nastavení se celý proces učení opakuje s redukovanou trénovací množinou
a novou instancí Kohonenovy mapy. Základní myšlenkou je využití interních mechanismů
Kohonenovy mapy (zejména pak systém utlumení často vybíraných neuronů v 2D vrstvě)
tak, aby síť v každém kroku zpřesnila své klasifikační schopnosti. Interní mechanismy zde
zaručí, že plocha 2D vrstvy bude plně adaptována (všechny neurony budou mít nastavené
váhy interního vektoru zastupovaného neuronem) (Vochozka et al. 2017).
55
Tento proces postupné redukce trénovací množiny je možné chápat i jako postupné
zvyšování citlivosti sítě na odchylky v trénovací množině. Tomu odpovídají i
experimentální výsledky, kdy se během vícekrokového procesu postupně eliminují
zařaditelné vzory a zůstávají vzory přiřazené k neuronům zastupujícím i další vzory jinak
kategorizované. Obecně zde můžeme hovořit o určité formě hierarchického učení, jehož
výsledkem je posloupnost nastavených Kohonenových map, z nichž každá je učena na
menší trénovací množině než předchozí (Vochozka et al. 2017).
Pro aplikaci uvedeného vícekrokového mechanismu jsou zásadní dvě kritéria: kritérium
naučení sítě v každém kroku hierarchického učení; a kritérium celkové schopnosti množiny
naučených modelů správně klasifikovat trénovací a později i testovací množinu vzorů. V
produkční fázi se způsob klasifikace liší podle toho, zda se nacházíme v posledním modelu
hierarchické struktury či nikoliv. Pro všechny ostatní modely je v produkční fázi použito
kritérium absolutní shody. Testovací vzor je správně zařazen, pokud je přiřazen k neuronu
zastupujícímu pouze vzory klasifikované během učení do stejné kategorie. Pro poslední
model v hierarchické struktuře je pak použit pravděpodobností přístup, kdy je vzor zařazen
do kategorie, která v daném neuronu převažovala v procesu učení (Vochozka et al. 2017).
Hierarchický model (více k modelu viz povinná literatura) je charakterizován sadou
parametrů. Parametry mají velmi rozdílný charakter (celé číslo, text, číslo s desetinnou
částí). Proto bylo rozhodnuto o doplnění modelu o optimalizační vrstvu, schopnou tyto
parametry testovat a zvolit jejich nejlepší možnou hodnotu. Optimalizačních nástrojů
existuje celá řada, obvykle však jde o uzavřená řešení, často vázaná na jediný typ dat.
Vhodné je užití tzv. genetických algoritmů. Tato skupina nástrojů vychází z několika
základních a jednoduchých východisek, které (jak již název napovídá) mají svůj základ v
přírodě a evolučním vývoji. Prvním pravidlem je, že přežívá nejlepší. Systém generuje
různá řešení (v našem případě nastavení parametrů) označovaná jako chromozomy. Tato
řešení jsou následně testována. To vede k tomu, že jsou vybrány pouze chromozomy s
nejlepším ohodnocením (Vochozka et al. 2017).
Podobně jako v přírodě je nutné nastavit mechanismus generování nových chromozomů,
aby se populace mohla vyvíjet směrem k lepším hodnotám. To je zachyceno evaluační
funkcí v. Jedná se o proces vybírající z aktuální populace náhodný chromozom, jehož
náhodný atribut (hodnota parametru) se změní. Tím vznikne nový chromozom mírně
odlišný od svého originálu, který se zařadí do populace. Procento mutace v populaci je
56
spolu s maximální velikostí populace hlavním parametrem optimalizačního systému. Jeho
činnost probíhá v iterativních krocích obsahujících mutaci, vyhodnocení populace a
odstranění nejhorších chromozomů. Tyto kroky se označují jako generace. Již po cca 30
generacích jsou další změny jen velmi malé (Vochozka et al. 2017).
Studijní literatura
Povinná literatura
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 107-130)
Kontrolní otázky
1. Popište rámec zpracování ekonomických dat pro UNS aplikace.
2. Co jsou to samoorganizující se mapy?
3. Co je to Kohenova mapa?
4. Popište princip trénování UNS.
5. Co je to testovací množina?
6. Co je to koeficient alfa v Kohenově mapě?
7. Co je to evaluační funkce?
8. Jak je možné přidat genetické algoritmy do UNS?
9. Co je to koeficient k f Kohenově mapě?
10. Jak je definována velikost Kohenovy vrstvy?
Odkaz na praktickou část
3.8 Modelování časových řad pomocí fuzzy logiky
57
2.16 Uvedení příkladů aplikace UNS pro odhad cen
nemovitostí, oceňování bonity klienta atd.
Klíčová slova
Finanční analýza, situační analýza, zdraví podniku, hodnocení podniku, rating
Cíle kapitoly
Cílem je pochopení příkladů aplikací UNS pro odhad cen nemovitostí, oceňování bonity
klienta a osvojení si pokročilých metod finanční analýzy.
Výstupy z učení
 16.7 modeluje časové řady pomocí umělých neuronových struktur
Abstrakt
Predikčních modely v ekonomii a podnikové ekonomice využívajících umělé neuronové
sítě na rating podniků (bonita, riziko bankrotu). Jde o důležitou informaci pro vlastníky,
dodavatele, investory, banky a pojišťovny. Pokud jsou vstupní data věrohodná, pak UNS
dokáže rychle a snadno poskytnout odhad toho, jak se bude společnost chovat v recesi nebo
při stagnaci hrubého domácího produktu. Modely umělých neuronových sítí předpovídají
také obchodní úspěch (tržby z produkce vlastního zboží a služeb, investiční zisky apod.)
firem a pomáhají vyhodnocovat start-up projekty. Investoři, banky a pojišťovny využívají
převážně statistické techniky (strukturální regresní modely, modely volatility časových řad
apod.). Z ostatních technik využívají např. rozhodovací stromy, genetické algoritmy a
postupně i umělé neuronové sítě. UNS mají lepší predikční vlastnosti než rozhodovací
stromy, diskriminační analýzy a lze je použít i pro predikci vývoje finančního selhání
malých a středních podniků (Vochozka et al. 2017).
V závislosti na celosvětové finanční krizi roku 2008 se rozšířilo uplatnění systému umělých
neuronových sítí. Model UNS lze použít na předpovědi bankrotu obchodních bank,
finanční situaci podniků v jednotlivých hospodářských odvětvích (primární sektor,
stavebnictví apod.). Uplatňují se kombinace genetického algoritmu a umělých neuronových
sítí. Neuronové sítě byly v minulosti vytvářeny jako jednoúčelový hardware, nebo na míru
58
dělaný software, který byl schopen řešit jeden problém. V současné době jsou neuronové
struktury vytvářeny především v podobě univerzálního software. Tyto programy jsou
schopny zvládnout různé úlohy a nabízejí různá nastavení UNS. Tento vývoj je možný díky
pokrokem v oblasti výpočetní techniky – výpočetního výkonu (Vochozka et al., 2017).
Bonitní diagnostické modely UNS jsou založeny na ekonomických teoretických poznatcích
a jsou často doplněny o empirické poznatky finančních analytiků. Tyto modely klasifikují
podnik podle stupně finančního zdraví. Index bonity je založen na diskriminační analýze a
skládá se z šesti poměrových ukazatelů (cash flow, cizí zdroje, aktiva/cizí zdroje,
zisk/aktiva, zisk/výnosy, zásoby/výnosy, výnosy/aktiva). Záporné hodnoty indexu
znamenají bankrotní podnik. Hodnoty indexu v intervalu (-nekonečno, -2) naznačují, že jde
o extrémně špatnou ekonomickou situaci podniku, hodnoty od mínus dvou (včetně) do
mínus jedné <-2, -1) naznačují velmi špatnou ekonomickou situaci a hodnoty od mínus
jedné do nuly <-1; 0) naznačují špatnou ekonomickou situaci. Naopak bonitní podniky se
vyznačují kladnými hodnotami indexu bonity. Hodnoty indexu v intervalu < 0; 1 ) označují
podnik v problematické ekonomické situaci, hodnoty v intervalu < 1 ; 2 ) v dobré
ekonomické situaci, hodnoty v intervalu od < 2 ; 3 ) ve velmi dobré ekonomické situaci a
hodnoty od tří a výše pak za podnik v extrémně dobré ekonomická situaci.
Grünwaldův index analyzující finanční situaci podniku používá naprosto odlišný systém
vah od ostatních bonitních indexů. Dvě ze šesti užitých vah jsou proměnlivé (průměrná
úroková míra z úvěrů a zdaněná úroková míra z úvěrů), ostatní jsou konstantní. Užité
konstantní váhy přiřazují největší důležitost poměru „cash flow / dlouhodobé úvěry“, dále
„čistý pracovní kapitál / zásoby“, „(finanční majetek + krátkodobé pohledávky) /
krátkodobý cizí kapitál“ a „zisk / nákladové úroky“ (Vochozka et al. 2017).
Kralickův Quick test je využíván především v německy mluvících zemích. Na základě
ukazatelů z jednotlivých oblastí finanční analýzy udává celkové hodnocení všech druhů
podniků. Kralickův test je vhodný zejména pro obchodní společnosti, uplatní se ale také ve
výrobních společnostech. Původní varianta je koncipována jako jednorozměrný
známkovací test, kde vybraným ukazatelům z jednotlivých oblastí finanční analýzy
(finanční, likvidační, rentabilní a výnosové) jsou přiřazeny známky, jejichž součet udává
celkové hodnocení firmy. Ukazatel Rychlého Kralickova testu K1 se vypočte jako prostý
aritmetický průměr známek obdržených za hodnoty jednotlivých ukazatelů. Významný
rozdíl mezi původní a modifikovanou variantou Rychlého Kralickova testu je fakt, že
59
výsledné hodnoty jednotlivých ukazatelů nejsou poměřovány s konkrétními, předem
určenými hodnotami. Výsledné hodnoty ukazatelů jsou poměřovány s percentily
oborových hodnot. Tamariho model využívá sedmi podílových ukazatelů, které jsou
bodově ohodnocovány. Podnik je poté hodnocen dle součtu získaných bodů. Celkový
Tamariho index (Ta) je vyjádřen součtem získaných bodových hodnot (Vochozka et al.
2017).
Studijní literatura
Povinná literatura
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 131-142)
Kontrolní otázky
1. Které instituce potřebují provádět rating firem a proč?
2. Jaké další metody se k UNS přidávají k zvýšení predikční schopnosti?
3. Na čem jsou založeny bonitní modely UNS?
4. Popište index bonity.
5. Popište Grünwaldův index.
6. Co je to Kralickův Quick test?
7. Definujte Tamariho model.
8. Jaký software lze použít pro modelování UNS?
9. Proč se v minulém století nevyužívali hojně UNS?
10. Jaký je rozdíl mezi rozhodovací stromy a UNS?
Odkaz na praktickou část
3.8 Modelování časových řad pomocí fuzzy logiky
60
2.17 Modelování časových řad pomocí UNS
Klíčová slova
Bayesovský klasifikátor, algoritmus, pravidla sítě, učení
Cíle kapitoly
Cílem je pochopení procesu modelování časových řad pomocí UNS a osvojení si principů
UNS jako je učení s učitelem a učení bez učitele.
Výstupy z učení
 16.2 rozumí fungování umělých neuronových struktur
 16.7 modeluje časové řady pomocí umělých neuronových struktur
Abstrakt
Modelování časových řad pomocí UNS využívá klasických vícevrstvých neuronových sítí
typu multilayer perceptron. Ty používají hodnoty souřadnic vstupních vektorů pro výpočty
vah. Použít je možné i tzv. asociativní paměť (jednovrstvá neuronová síť), či Kohonenovy
mapy pro vizualizaci podobnosti vstupních vektorů a jejich shlukování. Při použití technik
umělé inteligence obvykle využíváme dostupná data pro nastavení zvoleného typu modelu,
tento proces je obecně označován jako učení. Jeho cílem je získat nastavený model, který je
schopen určité míry generalizace, tedy adekvátní odezvy i na vzory, na které nebyl učen. I
z tohoto pohledu lze nahlížet na vstupní data a jejich možné využití při nastavení modelu.
Hovoříme zde o tzv. učení s učitelem a bez učitele (Vochozka et al. 2017).
Učení bez učitele v podstatě znamená, že máme k dispozici pouze nehodnocená vstupní
data, která hodláme nějakým způsobem analyzovat. Učení bez učitele se typicky používá v
počátečních fázích analýzy dat, kdy zkoumáme strukturu dat, jejich vzájemné vztahy a
charakter.
Typickým příkladem je použití shlukové analýzy, např. algoritmu ART, či Kohonenových
map. Ty mají na vstupu vzory (vektory), které na základě vnitřních pravidel zařazují do
jednotlivých výstupních kategorií. Charakteristika těchto kategorií není předem předepsána
a je výsledkem zpracování. Chod těchto algoritmů je možno ovlivnit jejich parametry, tedy
61
např. citlivostí na rozdíly ve vstupních datech. Čím bude tato citlivost vyšší, tím více
výstupních kategorií či shluků systém vytvoří (Vochozka et al. 2017).
Při učení s učitelem systému předložíme nejenom vstup, ale rovněž požadovaný výstup u
jednotlivých vzorů (či příkladů zobrazení vstup – výstup). Tyto dvojice (vstup, požadovaný
výstup) algoritmus používá pro své učení, a tedy formování vnitřních pravidel, či nastavení
parametrů modelu. Metod na tomto principu je několik různých druhů. Typickým
příkladem je neuronová síť s algoritmem učení pomocí zpětného šíření chyby
(backpropagation). Příkladem učení s učitelem je také tzv. Bayesovský klasifikátor, který
zařazuje vstupní vektory do výstupních kategorií podle výskytu těchto kategorií v okolí
příslušného vstupního vektoru. Bylo-li např. v okolí vstupního vzoru klasifikováno 9
příkladů do jedné kategorie a 1 příklad do druhé a obě kategorie jsou ve vstupní množině
zastoupeny stejně, potom můžeme říci, že Bayesovský klasifikátor přiřadí zkoumaný
vektor do první kategorie s pravděpodobností 90 %. Pro zpracování ordinálních vstupních
dat je tento model mírně upraven (Vochozka et al. 2017).
Aby bylo možné ověřit kvalitu nastavení modelu, je nutné ještě před procesem učení
rozdělit vstupní množinu příkladů na dvě disjunktní podmnožiny. Trénovací, na které se
příslušný systém učí, a testovací, která je systému předložena pro ověření správnosti jeho
reakcí i na předem neznámé příklady. Rozdělení do těchto dvou množin (trénovací a
testovací) je často provedeno podle rovnoměrného rozložení a obvykle lze použít rozdělení
vstupní množiny na tyto dvě části. V případě nedostatku vstupních vzorů je více vzorů
umisťováno do trénovací množiny, aby bylo zajištěno lepší naučení sítě, zbytek je
množinou testovací. Mezi metody zpracování nominálních vstupních dat učením s učitelem
lze zařadit rovněž rozhodovací stromy, např. s algoritmem TDIDT. Algoritmy
rozhodovacích stromů jsou založeny na vytvoření stromu, v jehož uzlech jsou jednotlivé
atributy (souřadnice) vstupního vektoru a hrany z uzlu vycházející označují všechny
hodnoty, kterých příslušný atribut nabývá v celé trénovací množině. Koncové (listové) uzly
stromu pak označují hodnoty požadovaného výstupu, který je často tvořen jediným
atributem. Těchto hodnot může být i více než 2. Pokud bychom vyšli pouze z této definice
je zřejmé, že pro jeden úkol je možno vytvořit celou řadu rozhodovacích stromů. Aby byl
vytvořený rozhodovací strom sestaven efektivně, vychází se při jeho konstrukci z výpočtu
entropie pro jednotlivé vstupní atributy v závislosti na požadovaných hodnotách
výstupního atributu. Jinak řečeno jsou nejdříve vybrány ty atributy pro uzly rozhodovacího
62
stromu, které přinášejí nejvyšší hodnotu diskriminační informace umožňující odlišit od
sebe jednotlivé výstupní kategorie vstupních vzorů (Vochozka et al. 2017).
Studijní literatura
Povinná literatura
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 143-152)
Kontrolní otázky
1. Popište síť typu multilayer perceptron.
2. Co je to princip učení UNS?
3. Jaký je rozdíl v učení UNS s učitelem a bez učitele?
4. Co je to Bayesovský klasifikátor?
5. Proč rozdělujeme trénovací a testovací vzorek?
6. Jak fungují algoritmy rozhodovacích stromů?
7. Co jsou to vstupní vzory?
8. Jakou transformaci dat využíváme pro UNS?
9. Uveďte příklad aplikace UNS pro manažerské rozhodování.
10. Uveďte příklad aplikace UNS v ekonomickém výzkumu.
Odkaz na praktickou část
3.9 Procvičování základních principů umělých neuronových sítí
63
2.18 Pokročilé modelování časových řad pomocí UNS
Klíčová slova
Predikce, řízen zdrojů, logistika, prodejní data
Cíle kapitoly
Cílem je pochopení pokročilého modelování časových řad pomocí UNS při použití
vícevrstvých sítí.
Výstupy z učení
 16.2 rozumí fungování umělých neuronových struktur
 16.7 modeluje časové řady pomocí umělých neuronových struktur
Abstrakt
Ve společenských vědách jsou UNS aplikovány na oblasti ekonomie (makroekonomie,
např. predikce GPN a modelu spotřeby; mikroekonomie, např. stanovení burzovních
indexů; klasifikace výsledků akciové společnosti; zpracování marketingových studií),
sociologie (např. oblast zpracování sociologických informací, predikce a klasifikace
sociologických dat), psychologie (např. modulace lidského chování, simulace lidského
vnímání, přenosu informací, procesy učení včetně predikce chování jednotlivce i skupin
lidí). Dále jsou UNS využity na dílčí problematiky jako marketing a prodej, skladové
hospodářství, prodej a výdej zboží, vnitropodniková doprava, klasifikuje i jednotlivé
procesy skladování včetně balení výrobků, uvádí využití neuronových sítí i u základních
manažerských funkcí podniku, jako je plánování, organizování a kontroly, zabývá se i
samotným řízením pracovních operací i celého výrobního procesu (Vochozka et al. 2017).
UNS není možné využívat na veškeré podnikové operace. V některých aplikacích zůstávají
přednostní volbou pro jejich řešení algoritmické informační technologie (např. pro
provádění numerických výpočtů). Je tedy zřejmé, že umělé neuronové sítě se využívají v
případech, kdy není znám ani přibližný, natož přesný algoritmus řešení. V současné době
jsou využívány zejména pro konstrukci podpůrných podnikových softwarů. Pro umělé
neuronové sítě v podnikovém řízení jsou vhodné takové úkoly, které vyžadují řešení
64
pomocí adaptivních metod (učící se expertní systémy, predikce časových řad, analýza i
syntéza přirozené řeči apod.) (Vochozka et al. 2017).
Nejčastější výtky k umělým neuronovým sítím jsou směřovány k retrospektivnosti
použitých dat. Pro predikci se používají starší data, která již nemusí reflektovat aktuální
stav. Jako možnou nevýhodou se také jeví skutečnost, že může dojít k tzv. přetrénování
sítě, kdy vlivem opakovaného testování ztrácí neuronová síť schopnost klasifikace a
generalizace poznatků a výstupů. Tomuto problému se dá předejít použitím různých
testovacích setů obsahujících odlišná vstupní data. Tím by měla být zachována samoučící
se schopnost neuronové sítě. Nakonec se jako největší problém neuronových sítí může jevit
jejich vlastnost označovaná jako tzv. Black box. Neuronová síť je totiž schopna predikovat
velkou řadu jevů, ale již není schopna provést klasifikaci svého hodnocení (Vochozka et al.
2017).
Studijní literatura
Povinná literatura
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 153-166)
Kontrolní otázky
1. Uveďte příklad aplikace UNS na vybrané makroekonomické časové řadě.
2. Uveďte příklad aplikace UNS pro analýzu mikroekonomického trhu.
3. Uveďte příklad aplikace UNS pro zpracování marketingových studií.
4. Uveďte příklad aplikace UNS pro predikci spotřeby materiálu.
5. Uveďte příklad aplikace UNS pro zhodnocení portfolia.
6. Uveďte příklad aplikace UNS pro simulaci lidského vnímání.
7. Uveďte příklad aplikace UNS pro manažerské rozhodování.
8. Co je to problém retrospektivnosti použitých dat v UNS?
9. Popište, kdy dojde k přetrénování sítě?
10. Dokáže UNS provést klasifikaci svého hodnocení?
Odkaz na praktickou část
3.9 Procvičování základních principů umělých neuronových sítí
65
2.19 Genetické algoritmy (GA): Seznámení se základy
genetiky, analogií mezi přírodou a matematickým popisem,
umožňující řešení problémů rozhodování
Klíčová slova
Evoluce, optimalizace, proces, chromozóm, mutace
Cíle kapitoly
Cílem je pochopení genetických algoritmů a seznámení se základy genetiky. Cílem je
osvojit si analogií mezi biologickým a matematickým popisem GA, které umožňují řešit
náročné problémy v rozhodování.
Výstupy z učení
 16.3 rozumí genetickým algoritmům
Abstrakt
Genetické algoritmy (GA) jsou založeny na darwinovském principu evoluce. GA
napodobují evoluční procesy známé z biologie jako je dědičnost, mutace, přirozený výběr a
křížení. Zakladatelem této vědní disciplíny je John Holland. GA slouží pro řešení
optimalizačních problémů. Díky tomu, že jsou založeny na principech genetiky a
mechanismech přirozeného výběru jsou na rozdíl od matematických optimalizačních metod
velmi jednoduché.
Principy a vlastnosti těchto algoritmů jsou definovány pomocí těchto pojmů: chromozóm,
gen, populace a fitness hodnota. Chromozóm je řetězec informací, který v sobě nese
vlastnosti a chování jedince. Nejčastěji jde o řetězec nul a jedniček, použít můžeme i reálná
čísla, matice, vektory i křivky. Gen je nejmenší a dále nedělitelná část chromozómu.
Populace je skupina jedinců popsaných svými chromozómy v rámci jedné generace.
Fitness hodnota je číselné vyjádření kvality jedince. Obvykle jde o reálné číslo v rozsahu
od 0 do 1 (0–100 %). Činnost genetických algoritmů je velmi jednoduchá, používají se 3
základní operace: selekce (výběr), křížení a mutace.
66
Obrázek 8: Proces genetického algoritmu
Zdroj: Vlastní zpracování
Inicializace (Start) znamená vytvoření počáteční populace. Ta může být sestavena
záměrnou selekcí, nebo může být vygenerována zcela náhodně. Selekce tedy slouží
k výběru jedinců z populace. Výběr „rodičů“ by měl respektovat pravidla přirozeného
výběru dle Darwinovy teorie. Využívá se vzorce pi = fi /Suma všech (fitness hodnot fi).
Díky tomu je pravděpodobnost rodičovství vyšší pro schopnější jedince (dáno hodnotící
funkcí – posouzením kvality jedince). Nebo dochází k ořezávání populace, kdy méně
schopní jedinci nejsou rodiči vůbec. Uplatňuje se také zcela náhodný výběr, nebo i metoda
turnaje náhodně vybrané skupiny jedinců mezi sebou.
Křížení navazuje na selekci. Rodiče si vymění část svého genetického kódu, tedy část
chromozómu. Využívá se jednobodového a vícebodového křížení. Mutace je poslední fází.
U každého jedince z nové generace procházíme celý chromozóm a s velmi malou
pravděpodobností měníme hodnoty některých genů z 0 na 1 a obráceně. Význam mutace je
v tom, že se může v dané generaci objevit vlastnost, kterou dosud žádný jedinec neměl a
nemohl ji tedy předat potomkům.
Opakováním cyklu se vytvořené potomstvo stává novou generací a starou generaci již
nebereme v úvahu. Jedná se o nejjednodušší generační strategii. Celý cyklus se opakuje,
67
dokud není splněna ukončovací podmínka. Ukončení algoritmu může vyvolat například
maximální počet cyklů, nalezení uspokojivé mutace či generace atd.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 183-197)
Kontrolní otázky
1. Co jsou GA?
2. Kdo se zabýval studiem GA?
3. Čím se zabývá genetika?
4. Co je to chromozóm?
5. Popište proces genetického algoritmu.
6. Co je to výběr?
7. Co je to křížení?
8. Co je to selekce?
9. Co je to mutace?
10. Co je to hodnotící funkce?
Odkaz na praktickou část
3.10 Modelování časových řad pomocí UNS
68
2.20 Uvedení použití GA v oblasti optimalizace široké palety
problémů – optimalizace investiční strategie, řízení výroby,
řezných plánů, aproximace křivek, řešení problému
obchodního cestujícího, využití shlukové analýzy apod.
Klíčová slova
Délka cesty, křížení, optimum, sub-optimum
Cíle kapitoly
Cílem je pochopení použití GA v oblasti optimalizace široké palety problémů –
optimalizace investiční strategie, řízení výroby, řezných plánů, aproximace křivek, řešení
problému obchodního cestujícího a shlukové analýzy.
Výstupy z učení
 16.3 rozumí genetickým algoritmům
Abstrakt
Problém obchodního cestujícího (Travelling Salesman Problem - TSP) je jedním z
nejznámějších kombinatorických problémů. Od roku 1759 se úlohou tohoto typu zabýval
švýcarský matematik Leonhard Euler, který se zajímal o vyřešení „problému jezdce”.
Řešení popisuje způsob, jakým jezdec při své cestě navštíví každé z 64 polí na šachovnici
právě jednou.
Problém obchodního cestujícího lze formalizovat a definovat. Je dána množina měst {c1,
c2, . . . , cN } a pro každou dvojici {ci, cj} navzájem různých měst je dána vzdálenost d (ci,
cj). Úkolem obchodního cestujícího je najít uspořádání π všech měst, které minimalizuje
hodnotu délky cesty, kterou obchodní cestující ujede, než projede všemi městy v pořadí
daném permutací π a vrátí se do výchozího města. Výsledná celková délka cesty je chápána
jako cena cesty. Pojem cena tedy můžeme chápat podle potřeby – jako skutečnou
vzdálenost, jako čas potřebný k ujetí z města do města nebo jako ekonomické náklady na
cestu.
69
Problém obchodního cestujícího je výpočetně komplikovaný. Je třeba znát třídy výpočtové
složitosti. K tomu se využívá pojem Turingův stroj. Třída složitosti P obsahuje všechny
úlohy, jejichž řešení lze nalézt deterministickým Turingovým strojem v polynomiálním
čase. Třída složitosti NP je množina problémů, které lze řešit v polynomiálně omezeném
čase na nedeterministickém Turingově stroji. To je počítač, který umožňuje v každém
kroku rozvětvit výpočet na n větví, v nichž se posléze řešení hledá současně. NP-úplné
problémy jsou takové nedeterministicky polynomiální problémy, na které jsou
polynomiálně redukovatelné všechny ostatní problémy z NP. NP-úplné problémy jsou
zpravidla ty nejtěžší úlohy z NP třídy.
Problém obchodního cestujícího patří do třídy NP-úplných problémů. Jednoduchý
algoritmus prohledávající všechny cesty musí projít všechny permutace množiny 1 až N,
kterých je N!. Je zřejmé, že z hlediska času výpočtu je tento postup nepoužitelný již pro
relativně malé hodnoty N. Proto se většinou musí udělat nějaký kompromis, kdy řešení je
sice horší, ale nalezneme ho v přijatelném čase. K tomu byly navrženy mnohé aproximační
algoritmy.
V genetických algoritmech jsou jedinci reprezentováni pomocí řetězců – chromozomů.
Každá pozice v řetězci se v analogii s obecnou genetikou nazývá alela a konkrétní symbol
v chromozomu se nazývá gen. Historicky nejstarší je binární kódování řetězce (0 a 1) s
fixní délkou (např. 0011). Pro toto kódování se využívá metod jako je sousedská
reprezentace, ordinální reprezentace a přirozená reprezentace. Při křížení se využívá
metody s částečným zobrazením – PMX, cyklický operátor křížení – CX, operátor křížení
se zachováním pořadí – OX, operátor křížení s rekombinací hran – ERX (symetrické
úlohy), operátor křížení se střídáním pozic – AP. Mutace využívá operátorů založený na
posunutí – DM, operátoru mutace založený na výměně – EM, na vložení – ISM, inverzní
mutace – SIM, zkracující inverzní mutace – ZIM a další.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 198-217)
70
Kontrolní otázky
1. Co je to problém obchodního cestujícího?
2. Jak lze vyjádřit cenu cesty v problému obchodního cestujícího?
3. Co je to Turingův stroj?
4. Popište třídu složitosti P.
5. Popište třídu složitosti NP.
6. Popište třídu složitosti NP – úplná.
7. Co je principem aproximačních algoritmů?
8. Co je to binární kódování řetězce?
9. Popište metodu křížení PMX.
10. Popište metodu mutace DM.
Odkaz na praktickou část
3.10 Modelování časových řad pomocí UNS
71
2.21 Optimalizační úlohy v GA, schémata, cykly, smyčky
Klíčová slova
Náhodnost, vyřazení, schopnost přežít, kvalita.
Cíle kapitoly
Cílem je pochopení použití GA v optimalizačních úlohách. Cílem je si osvojit principy
schémat, cyklů a smyček v úlohách GA.
Výstupy z učení
 16.3 rozumí genetickým algoritmům
Abstrakt
Generační přístup je základem pro optimalizační řešení. Zpravidla se používá následující
schéma: (1) vytvoříme náhodnou populaci, (2) populaci seřadíme podle účelové funkce
(přisuzující kvalitu jedincům), (3) vyřadíme nejhorší jedince, (4) populaci doplníme o
jedince, vytvořené křížením a mutací. Jak křížením, tak mutacemi může vzniknout jedinec,
který není podle definice problému přípustný. Proto po každém generování proběhne
kontrola přípustnosti a nevhodní jedinci se vyřadí.
Evoluční výpočetní techniky (genetické algoritmy, genetické programování, gramatická
evoluce) používáme tam, kde ostatní metody umělé inteligence (např. neuronové sítě) nelze
použít nebo z nějakých důvodů selhávají (např. doba řešení je nepřijatelná). Klíčové
problémy genetických algoritmů jsou (A) popis problému pomocí sady symbolů, (B)
stanovení účelové funkce (kvality).
Schéma pro evoluční výpočetní techniky nabízí teorie Markovových řetězců. Tyto řetězce
jsou k vhodné, neboť populace v evolučních algoritmech závisí pouze na stavu předchozí
populace pravděpodobnostním způsobem. Využívá se dimenzionální analýzy, která se
pokouší identifikovat důležité vlastnosti a klíčové znaky a závislosti zkoumaného systému.
Dále se využívá kvantitativní genetika, která je zaměřena na aditivně separovatelné fitness
funkce a nekonečně velké populace. Dalším přístupem je analýza ortogonálních funkcí
(Fourierovy, Walshovy a Haarovy funkce), které jsou používány jako nástroj pro vytváření
72
fitness funkcí. Dále se využívají kvadratické dynamické systémy a statistická fyzika. Pro
genetické programování lze využít např. výpočetním systému MATLAB.
Tabulka 1: Genetický algoritmus – evoluční pojetí kódu
t: = 0 Počátek algoritmu
Initialize G(0) Vytvoření počáteční generace
Evaluate G(0) Ohodnocení počáteční generace
do while not Done Dokud není splněna ukončovací podmínka, proveď cyklus t := t + 1
Select G(t) from
G(t-1)
Proveď přirozený výběr. Cílem je, aby průměrné ohodnocení nové
generace bylo lepší než průměrné ohodnocení generace předchozí.
Crossover G(t) Aplikuj křížení
Mutate G(t) Aplikuj mutaci
Evaluate G(t) Proveď ohodnocení nové generace
loop Opakuj cyklus
Zdroj: Vlastní zpracování
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 218-230)
Kontrolní otázky
1. Popište proces vytvoření náhodné populace.
2. Popište proces sestavení účelové funkce.
3. Popište proces vyřazení nejhorších jedinců.
4. Popište proces křížení.
5. Popište proces mutací.
6. Pomocí vybraného programového kódu definujte obecně genetický algoritmus.
7. Co jsou to Markovovy řetězce?
8. Jaké funkce jsou ortogonální?
9. Jaký software se využívá pro analýzu pomocí GA?
10. Jaké další techniky a metody lze spojit s analýzou GA?
73
Odkaz na praktickou část
3.11 Pokročilé modelování časových řad pomocí UNS
74
2.22 Modelování časových řad pomocí GA
Klíčová slova
Náhodnost, vyřazení, schopnost přežít, kvalita.
Cíle kapitoly
Cílem je pochopení použití GA v úlohách modelování časových řad.
Výstupy z učení
 16.3 rozumí genetickým algoritmům
 16.8 modeluje časové řady pomocí genetických algoritmů
Abstrakt
Použití genetických algoritmů lze aplikovat na časové řady. Většinou jde o kombinaci
neuronových sítí a genetických algoritmů. Parametrické, lineární a na statistickém rozdělní
závislé metody (např. GARCH a ARIMA) mají problém s přesností predikce výnosů
finančních instrumentů, neboť jde o data s trendem, sezónností, nelinearitou a především
heteroskedasticitou, která se v čase mění. S těmito problémy se velmi dobře umějí
vypořádat genetické algoritmy.
Spektrální analýza časových řad využívá Fourierovu transformaci. Časově spojité
periodické signály (data např. z měsíční časové řady) lze pomocí Fourierovy řady rozložit
na součet harmonických funkcí. Vzniká spektrální vyjádření časové řady. Nevýhodou
Fourierovy transformace je, že nedokáže přesně analyzovat finanční časové řady, které se
vyznačují náhlými změnami a celkovou nepředvídatelností.
Díky vlnkové transformaci (pomocí funkcí sin a cos) je možné analyzovat i tyto
nepředvídatelné nestacionární signály (časové řady typu „náhodná procházka“ – Random
walk). Avšak transformace už neposkytuje rozklad ryze na harmonické funkce.
Genetické algoritmy se využívají i pro nalezení maxima funkce. Jde o tzv. extremální
problém. Graf řešené funkce obsahuje často hned několik lokálních extrémů (lokální
minimum, resp. lokální maximum) a jen jeden globální extrém. Lokální extrémy jsou
překážky, které musí umět GA překonat. Cílem programování je, aby GA neuvízl
75
v lokálním extrému a našel globální extrém funkce. Proto je nutné vhodně ošetřit
algoritmus v části evoluce populace.
Fong a Szeto (2001) využili GA pro predikci časových řad finančních výnosů aktiva.
Predikce je úloha GA, kdy se snažíme nalézt opakující se vzor v časové řadě. Nalezení
opakujících se vzorů je předáno další populaci dané GA. Pro každý interval (stejně dlouhý)
jsou zaznamenány čtyři hodnoty: cena při zahájení intervalu, maximum ceny daného
intervalu, minimum ceny daného intervalu a cena na konci intervalu. poté je z těchto 4
hodnot počítána střední hodnota xti z logaritmovaného maxima a minima intervalu a poté
odchylka v podobě volatility podle rovnice ve tvaru:
v(t) = odmocnina {1/n *suma absolutní hodnoty výrazu: [x(ti) − x(ti − ∆t) ]2
}.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 231-243)
Doporučená literatura
FONG, L. Y. a K. Y. SZETO, 2001. Rules extraction in short memory time series using
genetic algorithms. The European Physical Journal B-Condensed Matter and Complex
Systems. 20(4), 569-572. ISSN 1434-6028. (s. 569-572)
Kontrolní otázky
1. Jaké metody lze použít pro analýzu časových řad?
2. Jaké jsou nevýhody tradiční analýzy časových řad?
3. Jaké jsou výhody GA u časových řad?
4. Co je to Furierova transformace?
5. Jaké nevýhody má Furierova transformace?
6. Co je to vlnková transformace?
7. Co za problém způsobují tzv. lokální extrémy?
8. Jak probíhá predikce časové řady pomocí GA?
9. Uveďte příklad použití GA v mikroekonomickém výzkumu.
10. Uveďte příklad použití GA v podnikové praxi.
76
Odkaz na praktickou část
3.11 Pokročilé modelování časových řad pomocí UNS
77
2.23 Teorie chaosu: Teorie pojednává o možnosti lepšího
popisu ekonomických jevů, než je tomu u klasických
metod. Je objasněn pojem chaos a řád, fraktál
Klíčová slova
Determinace, složitost, jistota, pravděpodobnost, řád, fraktál
Cíle kapitoly
Cílem je pochopení teorie chaosu, která pojednává o možnosti lepšího popisu
ekonomických jevů, než je tomu u klasických ekonometrických metod. Cílem je osvojení si
pojmů chaos, řád a fraktál.
Výstupy z učení
 16.4 zná teorii chaosu
Abstrakt
Teorie pojednává o možnosti lepšího popisu nelineárních dynamických systémů, než je
tomu u klasických metod. Chování takových systémů (atmosférické jevy, turbulence
tekutin, vývoj populací, ekonomické jevy jako hospodářský růst, vývoj podniku apod.) se
jeví jako náhodné i přes to, že jsou zcela deterministické. Schopnost předvídat počasí se
jevila v minulosti jako nemožná. Celý systém atmosférických jevů je tak složitý, že nejde
vytvořit žádnou rozumnou předpověď. Je to chaos. Avšak s rozvojem vědy a techniky je
možné sebrat mnohem více dat, vyhodnotit je a pochopit alespoň část tohoto komplexního
systému. Jinak řečeno budeme-li vědět více o komplexním systému (chaosu), tak postupně
odstraníme zdroj náhodnosti.
S problematikou chaosu je spojen efekt motýlích křídel, který říká, že systém se chová
stejně, pokud jeho počáteční konfigurace je stejná. To, jak se chaotický systém chová,
závisí na počátečních podmínkách. Změny počátečních podmínek mohou mít za následek
velké variace v systému v delším období. Mezi umělé systémy, které tento efekt vykazují,
patří například Lorenzův atraktor.
78
Chaotický pohyb je nejsložitějšího typ chování systému. Aby systém byl chaotický, musí
splňovat tyto podmínky: musí být citlivý na počáteční podmínky (efekt motýlích křídel),
musí být topologicky tranzitivní, jeho periodické orbity musí být husté. Topologické
mixování (tranzitivita) popisuje situaci, kdy systém se v čase rozvine tak, že jakákoliv jeho
daná oblast se nakonec překrývá s jakoukoliv jinou součástí systému. Husté periodické
orbity v chaotickém systému jsou stav, kdy ke každému bodu v prostoru je možné se
(arbitrárně blízko) přiblížit periodickou orbitou. Příkladem je loviště (systém – prostor X),
které je plné zvěře (množina D). Tento systém musí být dostatečně hustý, aby byl
chaotický. Pokud hodíme na toto loviště libovolně velkou loveckou síť (s libovolně
uspořádaným vzorkem sítě), vždy ulovíme zvěř.
Vývoj dynamického systému se znázorňuje ve fázovém prostoru. Každý jednotlivý rozměr
představuje jednu stavovou proměnnou dynamického systému. V průběhu vývoje systému
lze ve fázovém prostoru pozorovat buď (1) křivku, pokud je čas spojitý, nebo (2) body,
pokud je čas diskrétní. Atraktorem se nazývá stav, do kterého daný dynamický systém
směřuje. Rozeznáváme několik typů atraktorů: (A) pevné body, (B) periodické nebo
kvaziperiodické body, (C) chaotické atraktory, (D) podivné atraktory. Podivný atraktor je z
hlediska teorie chaosu nejdůležitějším. Může vzniknout jen tehdy, je-li daný dynamický
systém popsán nejméně třemi diferenciálními rovnicemi. Např. Lorenzův atraktor,
Rösslerův atraktor, Hénonův atraktor, estetické atraktory (Kings Dream).
Pro pojem fraktál, je nejprve nutné zopakovat, co je to dimenze. Dimenze je počet vektorů
báze daného prostoru (počet souřadnic), které potřebujeme k jednoznačnému určení bodu v
prostoru. Můžeme také říct, že je to počet rozměrů daného objektu. Např.: dimenze roviny
je 2, jinak řečeno potřebujeme dvě souřadnice k určení bodu. Dimenze krychle je 3, má tři
rozměry: šířku, výšku a hloubku. Je-li hodnota dimenze celočíselná, pak řekneme, že toto
číslo je topologickou dimenzí daného objektu. Topologická dimenze popisuje geometricky
hladké objekty.
Fraktální dimenze říká, jak moc je daný útvar členitý. Existuje několik typů fraktálních
dimenzí: Hausdorffova dimenze (Hausdorff dimension), mřížková dimenze (box –
counting dimension), informační dimenze, korelační dimenze, Ljapunovova dimenze a
Kolmogorovova entropie. Poincarého mapa je zobrazení fázového diagramu vyšší dimenze
v dimenzi nižší. Jedná se o řez nebo projekci vícerozměrného útvaru, kdy jedna či více
proměnných je konstantní. Jev, kdy v systému při malé změně řídícího parametru dojde k
79
náhlé a výrazné změně vnitřního stavu systému, nazýváme bifurkací. Bifurkační diagram je
obrazec, kdy se na osu x se vynáší hodnota řídícího parametru a na osu y hodnota vnitřního
stavu systému. Existuje několik základních typů bifurkací: (1) Lokální (flip, fold,
transkritical, Hopfova, transcritical) a (2) globální (homoclinic, heteroclinic, infinite period,
blue sky catastrophe).
Neexistuje žádná definice pojmu fraktál, která by byla matematicky definovatelná.
Mandelbrotova definice uvádí, že fraktál je množina, jejíž Hausdorffova dimenze je větší
než dimenze topologická, jinak řečeno fraktál je takový útvar, jehož dimenze je
neceločíselná. avšak za fraktály považujeme i útvary mající celočíselnou dimenzi. Fraktál
lze nejlépe definovat pomocí jeho vlastností. Fraktál je geometrický útvar, který lze
rozdělit na části, přičemž tyto části jsou (alespoň přibližně) zmenšené kopie celého útvaru.
Tato vlastnost fraktálu se nazývá invariance vůči změně měřítka. Další definicí založenou
na vlastnostech je: Fraktál je nekonečně členitý útvar. Fraktály se rozdělují do několika
typů. (a) L – systémy, (b) IFS (Iterated Function Systems), (c) TEA (polynomické
fraktály), (d) náhodné fraktály.
Náhodné fraktály vznikají obohacením tvorby fraktálu o náhodný prvek. Existuje několik
způsobů, jak lze generovat náhodné fraktály: (i) simulace Brownova pohybu, (ii) metoda
přesouvání středního bodu, (iii) spektrální syntéza.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 291-318)
Kontrolní otázky
1. Popište základní princip teorie chaosu.
2. Vysvětlete rozdíl mezi deterministickým chaosem a „čistým“ chaosem.
3. Uveďte příklady chaosu v přírodě.
4. Uveďte příklady chaotických systémů analyzovaných ve společenských vědách.
5. Co je to efekt motýlích křídel?
6. Jaké podmínky má chaotický pohyb?
7. Co je to fázový prostor?
80
8. Co je to atraktor?
9. Co je to fraktál?
10. Jak lze generovat náhodné fraktály?
Odkaz na praktickou část
3.12 Procvičování základních principů genetických algoritmů
81
2.24 Uvedení využití teorie chaosu u měřeného sledovaného
systému, uvedení příkladů z ekonomického výzkumu a
podnikové praxe
Klíčová slova
Samoorganizace, bublina, krize, Elliotovy vlny, časová řada
Cíle kapitoly
Cílem je pochopení možných způsobů využití teorie chaosu u měřeného sledovaného
systému. Cílem je osvojit si teorii chaosu na příkladech z ekonomického výzkumu a
podnikové praxe.
Výstupy z učení
 16.4 zná teorii chaosu
Abstrakt
Mezi praktické aplikace teorie chaosu patří např. Samoorganizace. Tu lze definovat jako
jev, kdy se samostatné jednotky systému začnou chovat jako celek. Využití je v přírodních
i společenských vědách. Ekonomie se zabývá studiem komplexních systémů. Tyto systémy
jsou ovlivňovány fluktuacemi vnitřními i vnějšími. Pokud je systém vychýlen
(vnitřně/vně), může systém nabývat nových stavů. Protože ekonomika je plná nelineárních
vazeb, může dojít k posunu chování až do chaosu. Tento chaos má při dlouhodobějším
pohledu (100 let) určitou symetrii. V ekonomii je vhodné studovat výkyvy cen, události
známé jako ekonomické bubliny. Ekonomická bublina buď vyprchá a systém zaznamená
drobný výkyv, nebo praskne a dojde ke krizi – velkému výkyvu. Ceny v ekonomických
bublinách i v následné krizi neodpovídají reálným hodnotám (resp. hodnotám
v předcházejícím období stability, na pomyslném potenciálu). Prudký růst i pokles cen pak
dokáže znehodnotit bohatství a poškodit celou ekonomiku.
Kdy nastane příští Černý pátek? Teorie chaosu nám bohužel nic takového neřekne.
Dokonce nám to neřeknou ani ekonomické teorie, které mnohdy navíc zavádějí
82
nerealistické podmínky dokonalé racionality investorů a dokonalé předvídatelnosti
ekonomiky. Schopnost předpovědět ekonomickou bublinu a její prasknutí neexistuje. Isaac
Newton poté, co kleslo jeho bohatství účastí na ekonomické bublině krachu akcií South Sea
Company v roce 1720 údajně řekl, že dokáže spočítat pohyby planet na palec přesně, ale
nemá ani tušení, jakým směrem požene šílenství davů trh zítra. Ekonomové zatím ani
nedokáží předvídat ani racionální chování davů. Těch proměnných, které ovlivňují národní
natož globální trh, je zatím velmi mnoho.
Elliotovy vlny vznikly empirickým pozorováním dat New Yorské burzy. Popis chování
této vlny se datuje do období 1935–1947. Elliotovy vlny byly identifikovány jako fraktály a
celý jev lze zařadit do studia chaotických systémů. O fraktál se jedná proto, že se tvar této
vlny opakuje v ní samé. Dokonce její dobrá znalost nám umožňuje s velkou
pravděpodobností určit zlomy v cenovém vývoji a tím minimalizovat riziko obchodování.
Celá podstata Elliotových vln vychází z existence dvou fází: impulzní (vývoj ve směru
trendu) a korekční (vývoj proti směru trendu). Každá fáze se skládá z “pod-vln”. Díky
určité pravidelnosti, lze s vysokou pravděpodobností očekávat změnu ceny opačným
směrem, než jakým se ubíral dosavadní trend. Elliotovy vlny bývají velmi často různě
deformovány, což se také promítá do budoucího průběhu vývoje ceny.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 319-342)
Kontrolní otázky
1. Co je to samo-organizace?
2. Co jsou to komplexní systémy v ekonomii?
3. Uveďte příklad nelineárních vazeb v ekonomice.
4. Proč jsou cenové bubliny zajímavé z pohledu teorie chaosu?
5. Co jsou to Elliotovy vlny?
6. Jaká je podstata modelování časové řady pomocí Elliotových vln?
7. Jaké jsou limity teorie chaosu v ekonomickém výzkumu?
8. Uveďte příklad aplikace teorie chaosu ve finanční ekonomii.
83
9. Uveďte příklad aplikace teorie chaosu v podnikové praxi.
10. Uveďte příklad aplikace teorie chaosu v makroekonomickém výzkumu.
Odkaz na praktickou část
3.12 Procvičování základních principů genetických algoritmů
84
2.25 Uvedení pojmu datamining, textmining a definování cílů,
výběr techniky modelování, zdroje a příprava dat, tvorba
modelů, jejich ověření, vyhodnocení, implementace a
údržba
Klíčová slova
Datové sklady, OLAP, SQL, clustering, data, informace, znalost
Cíle kapitoly
Cílem je pochopení pojmu datamining, textmining. Cílem je získat schopnost definovat
výběr techniky modelování, připravit zdroje a data, vytvářet modely a ověřovat jejich
smysluplnost.
Výstupy z učení
 16.5 rozumí dataminingu a textminingu
Abstrakt
Data mining je o získávání užitečných informací ukrytých v datech. Do češtiny se občas
překládá jako „dolování“ či „vytěžování“ dat. Datový specialista potřebuje pro provádění
dataminingu rozumět jazyku SQL (zisk dat z databází), metodám a postupům
(ekonometrie, UNS, GA, teorie chaosu), musí umět vizualizovat a prezentovat data a být
schopen aplikovat pokročilé metody pro řešení zadaných úloh (testování hypotéz). K tomu
se v praxi využívají predikční modely, segmentace, asociační analýzy (clustering), analýza
časových řad a text mining. Rozdíl mezi dataminingem a textminingem je ten, že v
textminingu vychází vzory z přirozeného jazyka textu spíše než ze strukturovaných
databází (proměnné, datové typy).
Rizikem dataminingu je tzv. GIGO (Garbage In, Garbage Out), že i z nesmyslných dat je
možné dostat nějaké zdánlivě smysluplné výsledky. Problémem může být zdánlivá regrese,
nebo náhoda. To je nutné odhalit dodatečným testem, testem smysluplnosti, uvedením do
kontextu, ověřením datové základny, aby nedošlo ke špatné interpretaci výsledků.
85
Pro uložení dat ve velké organizaci se nejčastěji využívá podnikový informační systém
(PIS). Business Inteligence (BI) je jedním ze čtyř základních modulů současných ERP II
systémů (anglicky Enterprise Resource Planning, česky plánování podnikových zdrojů). BI
je důležitou podporou strategického rozhodování manažerů, neboť poskytuje
maticový/multidimenzionální pohled na podnik (kombinace ukazatelů v čase a prostoru.
Typické využití textminingu je při zkoumání konkurence, kdy dochází k analýze webových
stránek konkurence. Automatické zpracování obsahů webových stránek slouží jako velmi
efektivní způsob získávání významných obchodních informací (cena, slevová akce apod.) a
aktivitách konkurentů (nabírání pracovní síly, nové projekty, nové obchodní podmínky,
nové způsoby doručení zákazníkovy apod.). Analýza anket, poptávkových průzkumů,
odezvy zákazníků (hodnocení produktů a služeb) může objevit soubory slov a termínů
(zejména v otevřených otázkách), které respondenti vyžívají při popisu pozitiv a negativ
produktu nebo služby.
Užití ve filtrech a při automatické zpracování elektronických zpráv (instant messaging,
email apod.). Naprogramovaná textminingová aplikace pomáhá s automatickým tříděním
textů a pomáhá přesměrovat zprávy na správná oddělení. Vhodná aplikace může sloužit
jako screening příchozích zpráv a vyřadit (přesměrovat) ty, kde se vyskytují neznámá, či
vulgární slova.
Obrázek 9: Ukázka OLAP datové kostky
Zdroj: Vlastní zpracování
Židle
Pohovky
Gauče
Kuchyně
Křesla
Svítidla
Praha Brno Ostrava
Březen
Únor
Leden
86
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 343-350)
Kontrolní otázky
1. Definujte princip dataminingu.
2. Definujte princip text miningu.
3. Jak se liší data a text mining?
4. Co je to SQL?
5. Co je to OLAP?
6. Proč dochází k problémům v dataminingu?
7. Co je to GIGO?
8. Popište principy business intelligence.
9. Popište součásti ERP II informačních systémů.
10. Uveďte příklady využití textmingu.
Odkaz na praktickou část
3.13 Modelování časových řad pomocí GA
87
2.26 Uvedení příkladů použití dataminingu v Business
Intelligence a pro volbu strategie spolupráce se
zákazníkem, direct mailing apod.
Klíčová slova
Scoreboard, výkonnost, cíle, mise, strategie, plány, vyhodnocení
Cíle kapitoly
Cílem kapitoly je pochopení příkladů použití dataminingu. Cílem je pochopit principy
Business Intelligence pro vyhodnocení a volbu strategie.
Výstupy z učení
 16.4 zná teorii chaosu
Abstrakt
BI je množina technologií, postupů a procesů, která organizaci umožňuje získat nové
informace na základě vlastních dat. Jsou to statistické a softwarové nástroje či interní
procesy, které z obrovského množství firemních dat (datové kostky, data mining) pomohou
vytřídit jen ta důležitá. Software dokáže nesourodá data seskupit do ucelených přehledů
s důležitými informacemi, vhodně je prezentovat ve formě reportů, dashboardů a
scoreboardů. BI se snaží odbourat problém nadbytečného sběru a zpracování dat, čímž se
automatizuje práce s obrovským množstvím v podnikovém systému uložených dat.
Moduly s názvem Business intelligence využívají metod (ETL, DWH, OLAP), které
dokáží mapovat data v podniku. Mezi přínosy patří zejména detailní a přehlednější výstup
o skutečném stavu dosahování cílů, možnost objevení nových souvislostí a slabých míst
v procesním řízení, správa dat v podniku prostřednictvím jediného systému a vyvarování se
ukládání a desintegraci dat, kvalitní analýzy a možnost měřit výkon formou
personalizovaných reportů, dashboardů, forecastů a scorecardů. U menších organizací je
výhodou možnost sledovat vývoj online – za chodu.
Architektura vhodná pro procesní řízení se hodí i pro moduly business intelligence či ERP
88
II Podnikové informační systémy. BI software využívá datových skladů a datových úložišť.
Nejprve se pomocí datových pump dolují data, která se pak ukládají v tzv. OLAP
databázích (Online Analytical Processing), které pojmou i větší množství dat. Data se
ukládají specifickým způsobem tak, aby se dala interpretovat několika různými způsoby a
častým dotazování přes SQL jazyk.
Direct mailing je neslavná metoda přímého marketingu, která obecně dosahuje velké míry
ignorace a snahy zákazníků odhlásit se ze všech odběrů. Problémem je to, že email často
necílí na konkrétní potřebu zákazníka a email jej odradí. Snahou moderního Direct
mailingu je automatizovat emailovou komunikaci a posílat jen to, co zákazník očekává.
Data k odhadu toho, co zákazník očekává, jsou založena na datech o prohlíženém zboží,
nedokončených objednávkách, personalizací, anketou, zda se newsletter, nebo reklamní
sdělení líbilo.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 351-360)
Kontrolní otázky
1. Jaké metody využívá Business Intelligence?
2. Popište strukturu ukládání dat ve středně velkém podniku.
3. Co je to direct mailing?
4. Proč je direct mailing z velké části neúspěšný?
5. Co je to kontingenční tabulka?
6. Uveďte příklad použití dataminingu při řízení vztahu se zákazníkem.
7. Uveďte příklad použití dataminingu při řízení vztahu se dodavatelem.
8. Uveďte příklad použití dataminingu při řízení inovací
9. Uveďte příklad použití dataminingu při definování strategie.
10. Uveďte příklad použití dataminingu pro podporu marketingového plánu.
Odkaz na praktickou část
3.13 Modelování časových řad pomocí GA
89
3 Příprava na semináře
3.1 Popisná statistika a analýza dat, vizualizace dat, příklady
pravidel logiky a matematického zápisu množin, možnosti
zapisování modelů
Klíčová slova
Test dobré shody, korelace, závislost, ANOVA
Cíle kapitoly
Cílem kapitoly je procvičení popisné statistiky a analýzy dat, vizualizace dat, příkladů
pravidel logiky a matematického zápisu množin.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Příklad, uvedení vzorového úkolu
1. Statistická analýza kontingenčních tabulek
Dochází tak k dobývání dat a následně i znalostí. Příkladem je např. tabulka o podnicích s
webovými stránkami, které umožňují učinit online platbu platební kartou. Tato tabulka
vznikla agregací tisíců řádků dat o podnicích z dotazníkového šetření. Výsledkem je pohled
na data, kdy jedna osa vyjadřuje odvětví národního hospodářství na druhá osa pak velikost
podniku. Nyní je možné testovat několik tezí a z vybraných dat i informací o procentních
podílech firem získávat nové znalosti. Např. zda jsou rozdíly mezi malými středními a
velkými podniky, zda podíl ovlivňuje jako velikost podniku tak ekonomická činnost
podniku, zda závisí na ekonomické činnosti podniku.
90
Tabulka 2: Podniky s webovými portály s online platbou
Velikost podniku (počet
zaměstnanců)
Celkem 10–49 50–249 250+
Celkem 7,5 6,7 9,7 12,0
Zpracovatelský průmysl – C 4,5 4,0 4,3 5,9
Výroba a rozvod elektřiny, plynu, tepla;
Zásobování vodou, činnosti související s odpady
– D, E
2,7 1,8 2,6 12,7
Stavebnictví – F 1,9 1,7 3,7 2,0
Velkoobchod a maloobchod; opravy a údržba
motorových vozidel – G
16,8 14,6 30,5 30,7
Doprava a skladování – H 3,2 1,9 5,0 19,6
Ubytování, stravování a pohostinství – I 10,3 8,4 30,1 46,8
Informační a komunikační činnosti – J 17,3 15,6 20,0 32,8
Profesní, vědecké a technické činnosti – M 4,3 4,1 5,5 7,5
Administrativní a podpůrné činnosti – N 5,3 4,5 6,6 7,3
Zdroj: Český statistický úřad 2018, Veřejná databáze
Tyto otázky dokáže zodpovědět klasická analýza variability dat. Postup (Online Web
Statistical Calculators, 2018): Select the number of independent treatments below – zde
vybereme počet skupin testované proměnné % podílu podniků s webovými stránkami,
které umožňují učinit platbu. Testovat budeme tezi, zda závisí na velikostní kategorii.
Máme 3 kategorie (0–49, 50–249, 250+) proto zvolíme k= 3. Formulář odešleme klinutím
na „Proceed to enter your treatment data“ a nezapomeneme, že nechceme demo data –
checkbox pod kategoriemi je prázdný (viz obrázek).
Obrázek 10: První krok ANOVA analýzy
Zdroj: vlastní zpracování na základě Online Web Statistical Calculators, 2018
V dalším kroku zadáme hodnoty do připravené tabulky:
91
Obrázek 11: Druhý krok ANOVA analýzy
Zdroj: vlastní zpracování na základě Online Web Statistical Calculators, 2018
Tabulka 3: One–way ANOVA pro 3 nezávislé velikostní skupiny podniků
source
sum of
squares SS
degrees of
freedom νν
mean square
MS
F statistic p–value
treatment 650.1527 2 325.0763 2.7321 0.0831
error 3,212.6220 27 118.9860
total 3,862.7747 29
Zdroj: vlastní zpracování
Poté nám program zobrazí výsledky (viz tabulka výše). Z analýzy plyne, že na hladině
významnosti 5 % nelze říci, že skupiny se mezi sebou liší. Je to dáno tím, že v datech je
příliš mnoho výkyvů. Pokud bychom chtěli data podrobněji analyzovat (dropdown), mohli
bychom analyzovat konkrétní odvětví zpracovatelského průmyslu, nebo všechna odvětví
apod.
Zadání samostatné práce (úkolu)
Ze stránek Českého statistického úřadu zjistěte v datech o podnicích, zda závisí velikost
podniku na tom, zda webové stránky umožňující konfigurovat produkt či službu.
92
Tabulka 4: Podniky s webovými stránkami umožňujícími konfigurovat produkt či službu
Velikost podniku (počet zaměstnanců)
Celkem 10–49 50–249 250+
Celkem 10,7 9,8 13,6 17,3
Zpracovatelský průmysl – C 10,0 8,7 12,9 11,7
Výroba a rozvod elektřiny, plynu, tepla;
Zásobování vodou a činn.
související s odpady – D, E
6,7 3,8 7,6 32,7
Stavebnictví – F 4,6 4,3 6,8 6,7
Velkoobchod a maloobchod; opravy
a údržba motorových vozidel – G
16,0 14,2 26,6 30,2
Doprava a skladování – H 6,1 5,3 6,6 19,1
Ubytování, stravování a pohostinství – I 16,5 14,4 40,0 49,5
Informační a komunikační činnosti – J 20,7 18,3 24,4 44,9
Administrativní a podpůrné činnosti – N 9,1 9,9 5,8 14,2
Zdroj: Český statistický úřad, 2018 Veřejná databáze
Použité zdroje v příkladu:
Český statistický úřad, 2018. Veřejná databáze, [online]. Dostupné z: goo.gl/dctFSq
Online Web Statistical Calculators, 2018. One-way ANOVA with post-hoc Tukey HSD Test
[online]. Dostupné z: http://astatsa.com/
Studijní literatura
Povinná literatura
COUFAL, J., 2014. Logika a logické myšlení. [Praha]: Vysoká škola ekonomie a
managementu. ISBN 978-80-87839-59-1. (s. 6-16)
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 8-10)
93
3.2 Počet pravděpodobnosti a statistické rozdělení dat.
Pravidla regresní analýzy pro průřezová data
Klíčová slova
Normalita, histogram, četnost, data, proměnná
Cíle kapitoly
Cílem je procvičení počtu pravděpodobnosti, statistického rozdělení dat a pravidel regresní
analýzy pro průřezová data.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Příklad, uvedení vzorového úkolu
1. Příklad testování normality v programu Gretl na příkladu využití výrobní kapacity.
Gretl příklad
1. Spusťte Gretl, File > Databases > Gretl Native > dvojklik na
„fedstl“. V tabulce vyberte proměnnou cumfn „Capacity
utilization…“ a klikněte na modré plus vedle popelnice.
2. Zavřete aktivní okno, zůstane jen výchozí s přehledem
proměnných (const a cumfn)
3. Vyberte pravým myšítkem název proměnné „cumfn“ a zadejte volbu „Frequency
distribution“.
 Předpokládáme, že využití výrobních kapacit US ekonomiky mezi lety 1972 až
2015 bude mít normální rozdělní řekněme kolem 80 % (naivní odhad) +/- 10 %,
tj. že by to mohlo mít normální rozdělní.
4. V nabídce už jen vyberte Test against normal distribution.
94
5. Naběhnou dvě okna – Graf zhodnotíme pohledem - využití výrobních kapacit má až
na pár „děr“ a skoro normální rozdělení (v jednoduchém překladu „kolem průměrné
využíti kapacity 78 % je v průměru US ekonomika, pak to jde dolu, hodnoty jako
65 % je extrém s nízkou pravděpodobností“), jak jsme předpokládali.
6. Graf posuneme doprava nahoru, ať nám nepřekáží a podíváme se na to samé
v textové podobě. Hvězdičky také naznačují, že to je cca normální rozdělení. Počet
kategorií i šířka jsou určeny arbitrárně, Gretl pro výpočet používá odmocninu z počtu
pozorování. Zavřeme textovou podobu histogramu.
7. Pravím myšítkem se podíváme na summary statistics. Co známe a už víme, co
znamená? Průměr, medián (hodnota uprostřed intervalu), minimum, maximum,
standardní odchylka – jak hodně se pozorování „v průměru liší od průměru“, C.V. je
variační koeficient a ten jen jinak uvádí standardní odchylku jako procentní podíl
průměru (5,98 %), Skewness – skutečný blob je oproti tomu nakreslenému
normálnímu nižší (záporná hodnota). Kurtosis – skutečný blob je nakloněn více
napravo (pozitivní hodnota) od normálního rozdělení. Percentily – hodnoty na ose X
(50 % percentil je např. medián), Range je rozdíl mezi maximem a minimem (88,3-
63,9).
8. Test normality: Gretl uvádí Doornik-Hansen test – podívejte se do grafu nahoru: Test
statistics for normality. Vidíme, že statistika je vysoká, a proto i pravděpodobnost
takové hodnoty bude velmi nízká. Pravděpodobnost té statistiky (p-value v hranaté
závorce) je 4.06 %. Tj. na obvyklé hladině významnosti 5 % můžeme prohlásit
proměnou za normální (mající normální rozdělení).
9. Jak otestovat proměnou na normalitu rovnou, bez histogramu? Vyberte proměnou
(zmodrá řádek). Variable v menu a normality test.
Zadání samostatné práce (úkolu)
Z vybraných databází přítomných v programu Gretl otestujte normalitu vybrané proměnné
s využitím histogramu.
95
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 10-48)
96
3.3 Testování předpokladů konvenční asymptotické teorie pro
odhady metodou nejmenších čtverců pro průřezová data a
pro časové řady
Klíčová slova
Gaussovy-Markovovy podmínky, regrese, přímka, metoda odhadu
Cíle kapitoly
Cílem je procvičení a testování předpokladů konvenční asymptotické teorie pro odhady
metodou nejmenších čtverců pro průřezová data a pro časové řady.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Příklad, uvedení vzorového úkolu
1. Analyzujte vztah mezi mírou nezaměstnanosti a mírou inflace
Regresní přímku lze použít na vztah mezi mírou nezaměstnanosti (u2ratensa) a mírou
inflace CPI pro městské spotřebitele (cpiaucns). Pro účely dalšího testování je přidána
proměnnou měna v oběhu (currcir). Vše je k nalzení v nativní databázi programu Gretl.
Jak bude vypadat tento vzat? Proč ho zkoumáme? Mezi inflací a nezaměstnaností přece
ekonomové vidí vztah, tak se podívejme, zda tam nějaký je a zda jej dokáže odhalit
OLS a zůstat přitom „B.L.U.E.“.
 Použijeme regresní přímku (SLR), ta je lineární v parametrech MLR1  Ale pokud
náhodou projdeme přes MLR 4, musíme ještě zvažovat SLR 5 a SLR 6.
 Náhodnost výběru. Výběr není náhodný, máme časovou řadu, kde se vyskytuje
problém autokorelace. Pravděpodobně nesplníme podmínku MLR2.
 Absence perfektní kolinearity MLR3 pravděpodobně splníme, mezi oběma
proměnnými neočekáváme silnou korelaci.
97
 MLR.4: Nulový podmíněný průměr pro u splníme přítomností konstanty, avšak
budeme mít asi problém s vynecháním proměnných, které jsou pro vysvětlení
inflace klíčové. Pravděpodobně bude problém i se specifikací modelu.
 SLR 5: Odhad asi nebude mít konstantní rozptyl - Homoskedasticita.
 SLR 6: Neočekáváme, že by normální složka byla náhodná, vzhledem k podezření
na více problémů v modelu, můžeme otestovat rezidua z regrese a podívat se, zda
mají normální rozdělení.
GRETL – Model > OLS… > cpiaucns vložíme jako dependent a do regresorss ke konstantě
přidáme u2ratensa a zaškrtneme robust standard errors.
Tabulka 5: OLS model závislosti míry nezaměstnanosti a inflace, 1967:01-2015:07 (T = 583)
Coefficient Std. Error t-ratio p-value
const 90.7199 18.4824 4.9085 <0.0001 ***
u2ratensa 12.9657 5.4336 2.3862 0.0173 **
Mean dependent var 131.5407 S.D. dependent var 64.15422
Sum squared resid 2245695 S.E. of regression 62.17092
R-squared 0.062487 Adjusted R-squared 0.060874
F(1, 581) 5.693987 P-value(F) 0.017342
Log-likelihood −3233.964 Akaike criterion 6471.928
Schwarz criterion 6480.664 Hannan-Quinn 6475.333
rho 0.999288 Durbin-Watson 0.003874
xy 10
ˆˆˆ   + u  CPI = 90,72 + 12,97*Míra nezaměstnanosti + u
Zdroj: vlastní zpracování
Poznámka: Závislá: cpiaucns, HAC standard errors, bandwidth 6 (Bartlett kernel)
 Ekonomicky jsme spíše očekávali pří růstu míry nezaměstnanosti pokles inflace.
Takže už tady něco nehraje, model pravděpodobně bude trpět nedostatky.
 Ekonometricky testujeme druhou podmínku – pohledem na Durbin-Watson
statistiku
DW - H0: chybová složka netrpí autokorelací. Resp. HA: chyby jsou AR(1) proces
o ALT+T, D resp.: Tests > Durbin-Watson p-value „vyšlo“ významně na 10
%, takže zamítáme H0. MLR 2 
98
 MLR3 – plníme, resp. GRETL žádnou proměnnou nevyhodil, ale zkontrolujeme
tak, že se vrátíme do okna, kde jsou proměnné, obě vybereme a pravím myšítkem
correlation matrix.
 MLR.4a – konstanta je signifikantní, takže to vypadá dobře, ale otestujeme, zda je
model dobře specifikovaný, použijeme tzv. RESET test. Tests > RESET. Ten
testuje, zda náhodou není parabola (přítomnost yˆ 2
), nebo křivka s kubickým ( yˆ 3
)
členem lepší než současný odhad.
RESET - H0: koeficienty u dodatečných kvadratických a kubických regresorů jsou nevýznamné
o Vidíme, že všechny členy jsou významné, test „vyšel“, p-value blízké nule,
zamítáme H0.
o MLR 4a 
 MLR.4b – endogenita v MLR (potřebujeme více proměnných xi). Princip testování
je u průřezových dat poměrně jednoduchý, pokud předpokládáme, že naše
odhadnutá rezidua û (uhat) jsou blízká ideálu teoretické chybové složky u (která je
neznámá a nikdo neví, jak vypadá), která je nekorelovaná se všemi regresory (x1,
x2, …, xi) a to najednou, ve skupinkách i jednotlivě a ještě i s vysvětlovanou
proměnou. Z odhadnutých reziduí û (uhat) uděláme proměnnou a použijeme ji v
„obrácené“ regresi (prohodíme vysvětlovanou proměnnou za podezřelou
proměnnou z xi, odebereme jeden x regresor a přidáme uložená rezidua z původní
regrese).
o Přepneme se do hlavního okna a znovu zadáme OLS model, dáme více
proměnných. Dependent bude cpiuacns a do Regressors dáme zbytek
(u2ratensa a currcir)
o Z aktivní regrese si uložíme rezidua – Save, Residuals (uhat1).
o Přepneme se do hlavního okna a znovu zadáme OLS model, tentokát
obráceně a přidáme proměnnou uhat1. Model > OLS… > u2ratensa jako
dependent a Regressors bude uhat1 a cpiuacns.
o Pokud je náš model dobrý (víme, že není, není to překvapení, proměnné
jsou jasně endogenní), pak rezidua by neměla být signifikantní (p-value =
0.0299), což jasně jsou na alfa = 5 %, což indikuje endogenitu. MLR 4b 
99
 SLR 5: přítomnost heteroskedasticity  nevyžaduje se test, pokud jde o MLR a
používáte metody, které jsou robustní na heteroskedasticitu (tj. minimálně robustní
standardní chyby s popisem, co heteroskedasticitu v populaci způsobuje).
o Tests > heteroscedasticity > White’s test
White’s - H0: heteroskedasticity není přítomna.
o p-value „vyšlo“ významně na 10 %, takže zamítáme H0
o SLR 5 
 SLR 6: normalita chybové složky
o Zde máme možnost otestovat jen odhadnutou náhodnou složku.
o Tests > Normality of residuals
Doornik-Hansen test - H0: normalita
o p-value „vyšlo“ významně na 10 %, takže zamítáme H0 SLR 6 
Závěrem: model je ekonometricky špatně specifikovaný, nekonzistentní a vychýlený.
Zadání samostatné práce (úkolu)
Pomocí regrese analyzujte vztah mezi mírou nezaměstnanosti (u2ratensa) a mírou inflace
v České republice. Využijte dat z Českého statistického úřadu a programu Gretl.
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 49-76)
100
3.4 Modelování časových řad pomocí regresní analýzy
Klíčová slova
Jednotkový kořen, stacionarity, ADF, deterministická řada, diference
Cíle kapitoly
Cílem kapitoly je procvičení modelování časových řad pomocí regresní analýzy, zejména
pak proces testování stacionarity časové řady.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Příklad, uvedení vzorového úkolu
1. Testování jednotkového kořene – Vývoj populace na území ČR 1785 – 2010.
Tabulka 6: přehledové statistiky populace na území ČR 1785 – 2010
Proměnná Počet pozorování Průměr Směrodatná odchylka Minimum Maximum
Populace 226 8276268 2131372 4250000 1.12e+07
Zdroj dat: Vlastní zpracování
Nejprve si ukažme ADF testovací strategii na prvním příkladu pro typicky rostoucí (nebo
klesající) časovou řadu, jako je třeba roční vývoj populace na území České republiky (dále
to může být produkce, spotřeba, objem širšího peněžního agregátu apod.). Zde nejčastěji
předpokládáme, že časová řada má jednotkový kořen, je bez signifikantního trendu a se
signifikantní konstantou. ADF test provedeme v podobě rovnice (3) s trendem a přidáme
odpovídající počet zpoždění (např. 3). První krok je tedy testování jednotkového kořenu
(𝛽2 − 1) = 0 v rovnici (3) a sledování, zda zde existuje signifikantní (𝛽1trend) a nenulová
konstanta.
101
Tabulka 7: ADF test časové řady Populace na území ČR 1785-2010
D.populace Coef. Std. Err. t P>t
Populace
L1. -0.011 0.007 -1.680 0.094
L1D. 0.928 0.065 14.330 0.000
L2D. -0.601 0.080 -7.500 0.000
L3D. 0.303 0.065 4.640 0.000
Trend 252.901 215.893 1.170 0.243
Konstanta 72769.240 33302.250 2.190 0.030
Zdroj dat: Vlastní zpracování
Z provedeného ADF testu plyne, že trend není signifikantní, konstanta je signifikantní, a
pozorujeme koeficient u L1.Populace (jedno období zpožděná proměnná y_(t-1)), který je
blízký nule (-0,011). To vše jsou indicie, které ukazují na přítomnost jednotkového kořenu.
Pro otestování H0 o přítomnosti jednotkového kořenu máme přesnější informaci v hodnotě
MacKinnon p-value (= 0.7597). Ta podává informaci o tom, zda nám t statistika u
proměnné L1.populace (= -1.680) spadá do širšího intervalu (než u t rozdělní) spolehlivosti
od 1 % do 10 % (-3,999; -3,134) pro zamítnutí nulové hypotézy o jednotkovém kořenu.
Díky této hodnotě se nám nepodařilo zamítnout nulovou hypotézu o jednotkovém kořenu v
populaci. Populace na území ČR 1785 – 2010 je časová řada obsahující jednotkový kořen a
je řadou nestacionární.
Pokud by (𝛽2 − 1) < 0 a (𝛽1trend) ≠ 0, tj. řada by měla signifikantní trend a jednotkový
kořen by byl nejasný, pak je tu šance, že může jít o trendově stacionární časovou řadu H1,
nebo časovou řadu s jednotkovým kořenem a driftem H0. Drift a jednotkový kořen odhalí
společný F test koeficientů L1.populace a trendu. Pokud jsou společně signifikantní,
zamítneme H0 o jednotkovém kořenu a časová řada je díky tomu, že je typicky rostoucí,
nebo klesající velmi pravděpodobně trendově stacionární.
Zadání samostatné práce (úkolu)
Otestujte přítomnost jednotkového kořenu v časové řadě přirozeného přírůstku
obyvatelstva na území ČR.
102
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 77-93)
103
3.5 Pokročilé modelování časových řad pomocí regresní
analýzy
Klíčová slova
Panel, série dat, autokorelace, pevné efekty, náhodný efekt
Cíle kapitoly
Cílem je pokročilé modelování časových řad pomocí regresní analýzy. Cílem je pokročilé
modelování panelových dat pomocí regresní analýzy
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Příklad, uvedení vzorového úkolu
1. Analyzujte panelová data – EU letecký průmysl 2003-2009
Tabulka 8: Přehled proměnných pro panelovou analýzu dat, EU letecký průmysl 2003-
2009
Proměnná
Počet
pozorování
Průměr Std. Odchylka Minimum Maximum
Obrat (Y) 1021 671254.000 2377247 388 2.70E+07
Fixní aktiva (K) 1021 367185.800 1616156 5 1.68E+07
Zaměstnanců (L) 1021 2674.583 10248 50 110882
Veřejný podnik 1021 0.100 0.300 0 1
Strategie 1:
Nízkonákladový
podnik 1021 0.086 0.281 0 1
Strategie 2:
Podniky v alianci
dopravců 1021 0.085 0.279 0 1
Zdroj dat: Vlastní zpracování
104
Tradiční pojetí mikroekonometrické produkční funkce v ekonometrických modelech
vychází z klasického teoretického podkladu Cobb-Douglesovi (C-D) produkční funkce. Tu
definujeme jako produkční funkci vyjadřující závislost produktu na kapitálu a práci.
Vyznačuje se mnoha nereálnými předpoklady a zjednodušením, které lze
v ekonometrickém modelu do určité míry zohlednit. Jsou to např. konstantní výnosy
z rozsahu a konstantní podíly kapitálových důchodů a pracovních důchodů na vytvořeném
produktu. V práci použijeme v ekonometrickém modelu rozšířenou C-D produkční funkci.
Odvození funkce vyjadřující produktivitu práce Q/L na kapitálové intenzitě K/L vychází ze
standardní analýzy produkční funkce a je následující:
Q/L = Y = A.(K/L)α
(L)α+β-1
(1)
Ln(Y/L) = α.ln(K/L) + (α+β-1).ln(L) + ln(A) (2)
Panelový odhad s fixním efektem, kde „ai“ reprezentuje individuální efekty:
Ln(Yit/Lit) = ai + konstanta + β1. ln(K/L)it + β2ln(L)it + β´x´it + uit (3)
Panelový odhad s náhodným efektem s chybou ui, model bude obsahovat části
individuálních efektů společných mezi sledovanými jednotkami.
Ln(Yit/Lit) = µi + konstanta + β1. ln(K/L)it + β2ln(L)it + β´x´it + uit (4)
Protože předpokládáme, že sledovaná strategie podniků bude společně určovat jejich
strukturu a produktivitu, tj. efekt bude společný i mezi jednotkami v čase, otestujeme
vhodnost použití efektivnějšího modelu s náhodným efektem oproti modelu s pevnými
efekty Hausmanovým testem.
Tabulka 9: Odhad s fixním efektem
ln(Y/L)
Koef.
Robustní
Std. Ch.
t P>t
ln(K/L) 0.18 0.04 4.31 0.000
ln(L) -0.12 0.09 -1.28 0.200
konstanta 5.45 0.57 9.57 0.000
R-sq: within = 0.1358 F(2,211) = 9.61***
Zdroj dat: Vlastní zpracování
105
Panelový odhad s fixními efekty vysvětluje cca 14 % variability modelu a neposkytuje
příliš uspokojivé výsledky pro ověření stanovených hypotéz, protože veškeré časově stálé
proměnné z modelu odstranil. Pro použití náhodného efektu musíme mít odůvodnění,
samotné potvrzení Hausmanovým testem nestačí, v našem případě se domníváme, že
podniky v leteckém průmyslu jsou si v určitých prvcích, které jsou časově stálé podobné.
Provedený Hausmanův test (Prob>chi2
= 0.9315) nedokázal zamítnout nulovou hypotézu o
nesystematičnosti rozdílů v koeficientech. Za konzistentní odhad v testu považujeme odhad
s fixními efekty oproti pravděpodobně efektivnějšímu odhadu s náhodným efektem, který
ovšem nemusí být konzistentní. Hausmanův test potvrdil naši domněnku o vhodnosti
použití modelu s náhodným efektem a nyní je možné zapojit další proměnné definující
vlastnictví a strukturu.
Tabulka 10: Odhad s náhodným efektem
ln(Y/L)
Koef.
Robustní
Std. Ch.
t P>t
ln(K/L) 0.185 0.038 4.80 0.000
ln(L) -0.119 0.050 -2.39 0.017
Veřejný podnik -0.604 0.177 -3.41 0.001
Nízkonákladový
podnik 0.456 0.152 3.00 0.003
Podnik v alianci 0.563 0.170 3.31 0.001
Konstanta 5.423 0.323 16.81 0.000
R-sq: between = 0.1898 Wald chi2
(5) = 50.23***
Zdroj dat: Vlastní zpracování
Tato analýza se liší od původní autorčiny práce (Šubrtová, 2012) ve vynechání malých
společností. Dospěli jsme k podobným výsledkům a také k potvrzení hypotézy o
neefektivním veřejném vlastnictví v daném sledovaném období a výhodnosti strategického
chování. Výhodnější je strategie aliančního sdružování, což v exponenciálním vyjádření
(díky semilogaritmické podobě modelu v případě dummy proměnných) je přibližně rozdíl
produktivity o 1,1 % od geometrického průměru produktivity nízkonákladové společnosti
(357,45 tisíc eur). Na příkladu jsme si ukázali použití Hausmanova testu, který je
standardní součástí panelového odhadu, pokud zvažujeme model s náhodným efektem.
106
Zadání samostatné práce (úkolu)
V podnikové databázi vyberte dostupné podniky v období 2012-2015 z Jihočeského a
Středočeského kraje. Identifikujte proměnné Id, Rok účetní závěrky, Jihočeský kraj (0,1)
tržby, dlouhodobý kapitál, počet zaměstnanců. Pomocí produkční funkce proveďte analýzu
firem a rozhodněte o uplatnění modelu s náhodným efektem při zapojení časově stálé
proměnné kraj.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 6-33)
107
3.6 Průběžný test
Klíčová slova
Regresní model, časové řady, panelová data, logika
Cíle kapitoly
Cílem kapitoly je procvičit si látku z předchozích kapitol a připravit se na průběžný test.
Výstupy z učení
 16.6 modeluje časové řady pomocí fuzzy logiky
 16.7 modeluje časové řady pomocí umělých neuronových struktur
 16.8 modeluje časové řady pomocí genetických algoritmů
Příklad, uvedení vzorového úkolu
1. Jaký je rozdíl mezi odhadem panelových dat s fixními efekty a náhodným efektem?
Panelová data jsou ideální pro územní, mezioborové a meziodvětvové srovnání, kdy pro
sledovanou jednotku (i) území, jednotlivce, domácnost, či firmu máme více pozorování
v čase (t). Panelová struktura umožňuje sledovat zákonitosti a variabilitu uvnitř těchto
jednotek, dále prozkoumat zákonitosti mezi jednotkami a mezi samotnými obdobími,
pokud tyto jednotky mají např. nějaké společné prvky (forma vlastnictví, stejné odvětví,
úroveň bohatství, stupeň tolerance).
Fixní efekty v modelu jsou výchozí strategií pro panelový odhad. Předpokládáme, že zde
existují pevně dané nenáhodné a časově (t) stálé individuální charakteristiky jednotek (i),
které nevstupují do našeho odhadu a zkoumání. Jinak řečeno z modelu vyjmeme to, co by
mohlo porušit MLR 2 podmínky. Sledujeme tedy pouze odhad časově (t) proměnných
zákonitosti uvnitř sledovaných jednotek (i). Avšak ne vždy fixní efekty odpovídají realitě,
přesto je tato strategie odhadu důležitá pro další testování efektivnosti odhadu.
Odhad je postaven na OLS, se zahrnutím dummy proměnných pro každou firmu. Nechť
panel má následující strukturu.
108
Tabulka 11: Struktura dat
Id
(Panel
identifikátor)
Rok
(Panel
identifikátor)
Y
Tržby v mil.
Kč
X1
Počet
zaměstnanců
X2
Objem kapitálu v mil.
Kč
1 2004 145 123 17
1 2005 151 122 18
2 2004 144 105 5
2 2005 143 108 6
3 2004 1211 412 48
3 2005 1212 428 49
Zdroj dat: Vlastní zpracování
Abychom mohli v OLS modelu udělat fixní efekty, přidáme 3 dummy proměnné, počet
dummy proměnných odpovídá počtu unikátních id v datovém vzorku. Pokud bychom měli
pro 78 firem po 3 pozorování v letech 2004, 2005 a 2006, pak vytvoříme 78 dummy
proměnných. Zpět k našemu příkladu, kde máme jen 3 firmy.
Tabulka 12: Struktura dat s dummy proměnnou pro fixní efekty
Id
(Panel identifikátor)
Rok
(Panel identifikátor)
Y X1 X2 D_id_1
1 když
Id==1
Jinak 0
D_id_2
1 když
Id==2
Jinak 0
D_id_3
1 když
Id==3
Jinak 0
1 2004 145 123 17 1 0 0
1 2005 151 122 18 1 0 0
2 2004 144 105 5 0 1 0
2 2005 143 108 6 0 1 0
3 2004 1211 412 48 0 0 1
3 2005 1212 428 49 0 0 1
Zdroj dat: Vlastní zpracování
Zahrnutím dummy proměnných do modelu zajistíme „odfiltrování“ individuálních v čase
stejných charakteristik. Z předchozího výkladu o dummy proměnných si vzpomeňte, že
pomocí dummy proměnné vytváříme a definujeme nové konstanty pro všechny sledované
skupiny, které určují do modelu vložené dummy proměnné.
Yit = ai + konstanta + β1X1it + β2X2it + uit (1)
109
Rovnice 1 pak ukazuje, jak bude vypadat odhad. Výraz „ai“ lze rozepsat následovně:
ai = α1D_id_1 + α2D_id_2 + α3D_id_3 (2)
Výraz ai zahrnuje veškeré „ID dummy“ proměnné a abychom nespadli do pasti dummy
proměnných (dummy trap), jednu proměnnou (např. D_id_3) odebereme, ta je definována
konstantou v modelu (1). Konstanta v modelu popisuje průměrné tržby pro podnik s id = 3
při nula zaměstnancích a nulovém kapitálu.
Ale co když některé časově stále charakteristiky (zda je to firma v daném regionu, zda je to
technologicky náročné odvětví, zda je tam vysoký podíl manažerek…) jsou zajímavé?
Model s fixními efekty nám je „vyhodí“ a nelze je ani moc dobře interpretovat, víme např.,
že firmy se adaptují na nové technologie, mají nové zaměstnance, nové manažery a jen
velmi málo věcí zůstává časově neměnných. Nechť náš příklad se rozroste o takovou X3
dummy proměnnou (ženy ve vedení > 50 %), která je v čase stálá.
Tabulka 13: Struktura dat s dummy proměnnou pro fixní efekty a časově stálou
proměnnou
Id
(Panel
identifikátor)
Rok
(Panel
identifikátor)
Y X1 X2 D_id_1
1 když
Id==1
Jinak 0
D_id_2
1 když
Id==2
Jinak 0
D_id_3
1 když
Id==3
Jinak 0
X3
1 když
ženy
jinak 0
1 2004 145 123 17 1 0 0 1
1 2005 151 122 18 1 0 0 1
2 2004 144 105 5 0 1 0 0
2 2005 143 108 6 0 1 0 0
3 2004 1211 412 48 0 0 1 0
3 2005 1212 428 49 0 0 1 0
Zdroj dat: Vlastní zpracování
Lze vidět, že mezi lety 2004 a 2005 se X3 nemění, je to časově stálé a navíc v perfektní
kolinearitě se skupinou všech D_id_ proměnných. OLS odhad s fixními efekty proto
proměnnou vyhodí. Co když je ale X3 proměnná, která je náhodná a neporušuje MLR 2 a
MLR 4 podmínky? Pokud tomu tak je – lze použít odhad s náhodným efektem (RE model).
Yit = µi + konstanta + β1. Kit + β2Lit + γX3+ uit (3)
110
Náhodný efekt (RE) v modelu je alternativní metodou odhadu s fixními efekty (rovnice 3).
Fixní efekty, které byly dány stranou lze do určité míry „vpustit do modelu“. Aneb X3
proměnou vytáhneme z členu ai a ponecháme ji v odhadu. Člen µi jakoby rozdrobíme na:
µi = ai+ γX3 (4)
Tyto individuální efekty mohou být náhodné, dvě pozorování o dvou ID jednotkách (firma
2 a firma 3) si budou více podobná (manažerky zvyšují tržby), než dvě pozorování téže
jednotky (ve firmě 2, teoretická změna vedení z manažerek na manažery). Budou zde
existovat efekty, původně individuální, ale do určité míry vpuštěné do modelu, budou
s určitým vlivem na sledovanou vysvětlovanou proměnou a nezávislé na ostatních
vysvětlovaných proměnných a chybovém členu, nechceme aby γX3 bylo korelované s uit.
Tento model je pochopitelně mnohem efektivnější vysvětlenou variabilitou a měl by být
vždy upřednostněn před fixními efekty. Nicméně, my víme, že tento model je postaven na
možnosti porušit MLR 2 (náhodnost výběru), proto musíme být opatrní. V případě, že
„vpuštěný náhodný efekt“ koreluje s ostatními regresory (porušení MLR 4) a jsou si více
podobná dvě pozorování v čase o téže jednotce než mezi dvěma jednotkami ve stejném
období, model s náhodným efektem je nepoužitelný a zkreslený, porušující G-M
podmínky.
Pro test takové hypotézy slouží Sargan Hansenův, případně Hausmanův test, který pomůže
otestovat vhodnost použití efektivnějšího modelu s náhodným efektem, který využívá tzv.
GLS metodu odhadu – generalizované nejmenší čtverce, oproti modelu s fixními efekty.
Resp. Hausmanův test nám řekne, zda model s náhodným efektem lze použít. Co tento test
dělá? Postaví proti sobě odhadnuté koeficienty konzistentního modelu s fixními efekty,
oproti modelu s náhodným efektem (pravděpodobně porušení MLR 2 i MLR 4). Pokud se
odhadnuté koeficienty RE a FE modelu výrazně odlišují, bude Hausmanův test (p-value <
0.05) signifikantní, což podporuje tvrzení o nekonzistenci modelu s náhodným efektem a
musí být použit model s fixními efekty. Jinak řečeno, je nutné ponechat individuální efekty
„mimo“, protože mají vliv na konzistenci odhadu. Problémem Hausmanova testu však je,
že není silným testem. Nesignifikantní Hausmanův test by měl být doplněn vždy testem
silnějším. Hausmanův test vyžaduje splnění SLR 5 podmínky (homoskedastictu), jinak
řečeno nelze jej použít pro odhady s přítomnou heteroskedasticitou. Silnější test je SarganHansenův
test, který nevyžaduje striktní homoskedasticitu a otestuje heteroskedasticitně
robustní (robustní standardní chyba) RE oproti FE.
111
Zadání samostatné práce (úkolu)
1. Proveďte analýzu panelu dat firem, které školily své zaměstnance
Stáhněte si soubor JTRAIN.GDT pro program Gretl:
https://www.dropbox.com/s/cwxt4s27w59m83d/jtrain.gdt?dl=0
Ten popisuje panel dat firem, které školily své zaměstnance. Vysvětlovaná proměnná
„hrsemp“ je počet hodin školení na zaměstnance. Ostatní proměnné jsou vysvětlující
(počet zaměstnanců employ, logaritmovaný počet zaměstnanců lemploy, poskytnutý grant,
hodnota grantu v předchozím roce grant_1…). Odhadněte model s fixními efekty, robustní
standardní chybou a se zahrnutím časových indikátorových proměnných (stačí to
zaškrtnout ve specifikaci modelu a proměnné dt_2 a dt_3 se vytvoří samy:
Hrsempit = ai + konstanta + β1grantit + β2grant_1it + β3lemployit + γ4dt_2 + γ5dt_3 + uit
 Kolik firem bylo zahrnuto do odhadu?
 Kolik bylo celkem pozorování?
 Kolik by bylo celkem pozorování, pokud by byl panel balancovaný?
 Jaký je efekt grantu na počet hodin školení na zaměstnance?
 Jaké může být reálné vysvětlení toho, že proměnná grant_1 (grant v předchozím
roce) není statisticky signifikantní?
 Je efekt velikosti formy přítomný? Pokud má firma o 10 % více zaměstnanců,
jaký je efekt na počet hodin školení na zaměstnance?
 Plní model podmínku MLR 4? Jaká je střední hodnota reziduí? Mají rozdělení
alespoň podobné normálnímu?
Studijní literatura
Povinná literatura
HAMPEL, D., V. BLAŠKOVÁ a L. STŘELEC, 2016. Ekonometrie 2. 3. přeprac. vyd.
Brno: Mendelova univerzita. ISBN 978-80-7509-427-8. (s. 1-93)
112
3.7 Procvičování základních principů teorie fuzzy množin a
fuzzy logiky
Klíčová slova
Množina, sjednocení, funkce, náležitost
Cíle kapitoly
Cílem je procvičování základních principů teorie fuzzy množin a fuzzy logiky.
Výstupy z učení
 16.1 zná základní pojmy a pravidla fuzzy logiky
 16.6 modeluje časové řady pomocí fuzzy logiky
Příklad, uvedení vzorového úkolu
1. Definujte vhodnou funkci příslušnosti prvku x do množiny B
Obrázek 12: Fuzzy množina a charakteristická fuzzy funkce náležitosti do množiny A a B
Zdroj: Vlastní zpracování
Kniha
C
Kniha
A
Kniha
B
Množina A
Levá strana
stolu
Množina B
Pravá strana
stolu
1
0,2
Funkce μA příslušnosti prvku
x do množiny B: μA(x)
μA(x)  [0,1]
μA(x)
Prvek
x
113
Knihy C náleží do množiny B jen částečně, hodnota μB(x) = 0,2, tj. 20% náležitost do
množiny B.
Zadání samostatné práce (úkolu)
Definujte vhodnou funkci příslušnosti Knihy B do množiny B.
Obrázek 13: Fuzzy množina a charakteristická fuzzy funkce
Zdroj: Vlastní zpracování
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 6-54)
Kniha
C
Kniha
A
Kniha
B
Množina A
Levá strana stolu
Množina B
Pravá strana stolu
114
3.8 Modelování časových řad pomocí fuzzy logiky
Klíčová slova
Funkce příslušnosti, množinové operace, jádro, nosič
Cíle kapitoly
Cílem je procvičit modelování časových řad pomocí fuzzy logiky.
Výstupy z učení
 16.1 zná základní pojmy a pravidla fuzzy logiky
 16.6 modeluje časové řady pomocí fuzzy logiky
Příklad, uvedení vzorového úkolu
1. Pro danou funkci příslušnosti definujte nosič fuzzy množiny a jádro fuzzy množiny.
Obrázek 14: Funkce příslušnosti pro hodnocení odměny zákaznické podpory
Zdroj: Vlastní zpracování
Nosič fuzzy množiny A definované na univerzu X s prvky x je ostrá množina všech prvků
s nenulovou příslušností do této fuzzy množiny. V obrázku je vyznačeno světle zelenou
barvou.
Jádro fuzzy množiny A definované na univerzu X s prvky x je ostrá množina všech prvků,
jejichž příslušnost se rovná hodnotě 1, alfa = 1. V obrázku je vyznačeno žlutou barvou.
x
Pravděpodobnost
0%100%
115
Zadání samostatné práce (úkolu)
1. Pro danou funkci příslušnosti definujte nosič fuzzy množiny a jádro fuzzy množiny.
Obrázek 15: Funkce příslušnosti
Zdroj: Vlastní zpracování
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 55-110)
x
Pravděpodobnost
0%100%
116
3.9 Procvičování základních principů umělých neuronových
sítí
Klíčová slova
Skrytá, vstupní, výstupní vrstva, učení, neuron, perceptron
Cíle kapitoly
Cílem je procvičování základních principů umělých neuronových sítí.
Výstupy z učení
 16.2 rozumí fungování umělých neuronových struktur
 16.7 modeluje časové řady pomocí umělých neuronových struktur
Příklad, uvedení vzorového úkolu
1. Popište danou strukturu na obrázku:
Obrázek 16: Struktura sítě
Zdroj: Vlastní zpracování
Jde o jednoduchou třívrstvou neuronovou síť se třemi vstupy a dvěma výstupy. Uprostřed
je skrytá vrstva. Jednotlivé neurony jsou vzájemně propojeny spoji ohodnocenými vahami.
Základem této sítě je perceptron s prahem citlivosti neuronu.
117
Zadání samostatné práce (úkolu)
1. Popište daný obrázek
Obrázek 17: Struktura UNS
Zdroj: Vlastní zpracování
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 111-139)
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 67-80)
118
3.10 Modelování časových řad pomocí UNS
Klíčová slova
Statistica, programová výbava, vzorkování, zpoždění
Cíle kapitoly
Cílem kapitoly je procvičit modelování časových řad pomocí UNS.
Výstupy z učení
 16.2 rozumí fungování umělých neuronových struktur
 16.7 modeluje časové řady pomocí umělých neuronových struktur
Příklad, uvedení vzorového úkolu
Jak probíhá práce s časovými řadami v programu STATISTICA?
K modulu Automatizované neuronové sítě v programu STATISTICA se lze dostat přes
menu Statistiky. V úvodním dialogu neuronových sítí pro možnost Časové řady jsou
zvoleny „Proměnné“ a vybrána spojitá „Cílová proměnná“. Strategii pro vytváření
prediktivních modelů lze ponechat na defaultní možnosti „Vyhledávání automatiz. sítí
(ANS)“. Tato volba ulehčuje práci s neuronovými sítěmi, lze zvolit i Vlastní nastavení.
Dále v dialogovém okně „SANS: Výběr dat“ je třeba přepnout na záložku „Vzorkování
(VNS a ANS)“, kde je možnost výběru vzorkovacích metod.
Vstupní soubor je třeba rozdělit na 3 části. Trénovací množina – náhodně vybraná část dat,
která slouží pro učení sítě, Testovací množina – další část dat sloužící k zastavení
trénovaní, aby nedošlo k přeučení sítě, Validační množina – zbytek dat, na kterém se ověří
konečná kvalita modelu. Jde o data, která model dosud k dispozici neměl. Obvykle se
rozdělení datového souboru na tyto množiny doporučuje v poměru 50-25-25, případně 70-
15-15. V záložce Časové řady v úvodním dialogu SANS je dále k dispozici možnost
definovat počet období (např. dva minulé roky) zpožděných hodnot časové řady a také
počet predikovaných hodnot (pět budoucích let). V následujícím dialogu je vhodné vybrat i
síť RBF a poté již program vytvoří modely neuronových sítí. Po trénování sítí naběhne
119
výsledkový dialog „SANS: Výsledky“. Pro následné zkoumání kvality se doporučuje
vybrat ta síť, která je jednak nejlepší a jednak stabilní ve všech sledovaných výkonech.
Výsledky vybraného modelu lze vizualizovat pomocí tlačítka Graf projekce.
Zadání samostatné práce (úkolu)
Proveďte predikci časové řady indexu PX50 (měsíční průměry) pomocí 5 zpoždění a
predikcí 2 následujících období.
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 140-182)
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 80-106)
120
3.11 Pokročilé modelování časových řad pomocí UNS
Klíčová slova
Neuronové sítě, modelování, časové řady
Cíle kapitoly
Procvičit znalosti o fungování umělých neuronových struktur a modelování časových řad
pomocí umělých neuronových struktur.
Výstupy z učení
 16.2 rozumí fungování umělých neuronových struktur
 16.7 modeluje časové řady pomocí umělých neuronových struktur
Příklad, uvedení vzorového úkolu
Jaké jsou nejčastěji používané modely reálných vztahů v oblasti predikce ekonomických
proměnných? Jaké metody byste využili při modelování vývoje hrubého domácího
produktu pomocí dopředných neuronových sítí? Najděte v databázi Proquest tři další studie
aplikující neuronové sítě.
Řešení: metoda extrapolace časových řad, ekonometrické modely, metoda scénářů,
reflexivní a intuitivní metody, expertní metody.
Popis metod například: ŠEDA, I. a V. OLEJ, 2007. Modelování vývoje hrubého domácího
produktu pomocí dopředných neuronových sítí. Scientific papers of the University of
Pardubice. Series D, Faculty of Economics and Administration. 11(-), 118-125. ISSN
1211-555X.
Tři studie:
GJYLAPI, D. a V. DURMISHI, 2014. Artificial neural networks in forecasting tourists’
flow, an intelligent technique to help the economic development of tourism in Albania.
Academicus International Scientific Journal. -(10), 202-211. ISSN 2079-3715.
LAI, S. L. et al, 2014. Energy consumption forecasting in Hong Kong using ARIMA and
artificial neural networks models. Applied Mechanics and Materials. 672-674(-), 2085-
2097. ISSN 1662-7482.
121
AYYOUB, M. a A. RIAZ, 2017. The Artificial Neural Network Method: A Practical
Guide for Business Research. Journal of Business Strategies. 11(1), 113-132, 171-172.
ISSN 2085-2097.
Zadání samostatné práce (úkolu)
Práce s vědeckým textem – replikace modelu HDP
Seznamte se s tímto textem: ŠEDA, I. a V. OLEJ, 2007. Modelování vývoje hrubého
domácího produktu pomocí dopředných neuronových sítí. Scientific papers of the
University of Pardubice. Series D, Faculty of Economics and Administration. 11(-), 118-
125. ISSN: 1211-555X.
Zjistěte, jaký navrhli model na predikci hrubého domácího produktu.
Řešení:
ŠEDA, I. a V. OLEJ, 2007. Modelování vývoje hrubého domácího produktu pomocí
dopředných neuronových sítí. Scientific papers of the University of Pardubice. Series D,
Faculty of Economics and Administration. 11(-), 120-125. ISSN 1211-555X.
Studijní literatura
Povinná literatura
VOCHOZKA, M. et al., 2017. Využití neuronových sítí při komplexním hodnocení
podniků. Praha: C. H. Beck. ISBN 978-80-7400-642-5. (s. 107-166)
122
3.12 Procvičování základních principů genetických algoritmů
Klíčová slova
Genetické algoritmy, modelování, časové řady
Cíle kapitoly
Procvičit znalosti o genetických algoritmech, procvičit modelování časových řad pomocí
genetických algoritmů.
Výstupy z učení
 16.3 rozumí genetickým algoritmům
 16.8 modeluje časové řady pomocí genetických algoritmů
Příklad, uvedení vzorového úkolu
Zjistěte, jaké postupy byly využity – práce s vědeckým textem.
Zjistěte, jaké postupy byly využity při vytváření přehledu a srovnání existujících knihoven
pro genetické algoritmy v C# .NET v práci: HUNĚK, M., 2016. Knihovna pro genetické
algoritmy v C#.NET. Diplomová práce. Masarykova univerzita. Fakulta informatiky.
Dostupné z:
https://is.muni.cz/th/393640/fi_m/Knihovna_pro_geneticke_algoritmy_C_.pdf
Řešení:
HUNĚK, M., 2016. Knihovna pro genetické algoritmy v C#.NET. Diplomová práce.
Masarykova univerzita. Fakulta informatiky. Dostupné z:
https://is.muni.cz/th/393640/fi_m/Knihovna_pro_geneticke_algoritmy_C_.pdf, s. 28-65.
Zadání samostatné práce (úkolu)
Srovnejte mezi sebou tři základní operace genetických algoritmů, tj. selekce, křížení a
mutaci.
123
Řešení:
STUDNIČKA, V., 2010. Genetické algoritmy – Multi-core CPU implementace.
Diplomová práce. Vysoké učení technické v Brně. Fakulta strojního inženýrství. Ústav
automatizace a informatiky. Dostupné z:
https://www.vutbr.cz/www_base/zav_prace_soubor_verejne.php?file_id=33586
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 183-217)
124
3.13 Modelování časových řad pomocí GA
Klíčová slova
Genetické algoritmy, modelování, časové řady
Cíle kapitoly
Procvičit znalosti o genetických algoritmech, procvičit modelování časových řad pomocí
genetických algoritmů.
Výstupy z učení
 16.3 rozumí genetickým algoritmům
 16.8 modeluje časové řady pomocí genetických algoritmů
Příklad, uvedení vzorového úkolu
Seznamte se se zhodnocením provedených experimentů a metodickými doporučeními
v práci: ŠTENCL, M. 2010. Predikce a optimalizace reálných dat pomocí algoritmů umělé
inteligence. Disertační práce. Mendelova univerzita v Brně. Provozně ekonomická fakulta.
Dostupné z: https://is.mendelu.cz/lide/clovek.pl?zalozka=13;id=19296;studium=34172.
Jak byste mohli dané metody využít při zpracování Vaší diplomové práce?
Řešení:
ŠTENCL, M. 2010. Predikce a optimalizace reálných dat pomocí algoritmů umělé
inteligence.
Disertační práce. Mendelova univerzita v Brně. Provozně ekonomická fakulta. Dostupné z:
https://is.mendelu.cz/lide/clovek.pl?zalozka=13;id=19296;studium=34172. (s. 91-99)
Podstatné jsou autorova doporučení pro aplikace v rámci systémů podpory rozhodování a
pro využití neuronových sítí v rámci analytických nástrojů na úrovni operačního
managementu při paralelním využívání statistických metod. V závěru uvedl: „Obecně tak
lze doporučit použití neuronových sítí v rámci jednotlivých fází rozhodovacího procesu.
Pro nasazení metod neuronových sítí je třeba mít na paměti nutnost přeučování sítě.
125
Celkový proces nového natrénování sítě je však možné kombinovat s různými dalšími
technikami. Ve vlastní práci byla pro odvození vhodné topologie použita metoda crossvalidace.
Se správně připravenými datovými soubory by bylo možné metodu
naimplementovat automatizovaně. To je i oblast dalšího pokračování vlastní práce. Jako
další uváděnou metodu pro stanovení počtu neuronů lze zmínit genetické algoritmy. Právě
při pohledu na provedené experimenty ve vlastní práci je možné identifikovat hlavní
problém při použití neuronových sítí z hlediska automatizovaného zpracování. Zcela jistě
se jedná o proces trénování sítě, pomineme-li mohutnost použitých datových souborů.
Problém s mohutností datových souborů lze označit za obecný problém i při použití metod
statistiky. Problém trénování je spojen se dvěma rovinami. První jsou znalosti a zkušenosti
nutné pro kvalitní natrénování (včetně volby dalších typů sítí) neuronové sítě
s požadovanou přesností výstupu. Druhým problémem je výpočetní náročnost procesu
trénování. Ani jeden z těchto problémů nelze zatím účinně eliminovat. Pracovat však lze s
naučenou neuronovou sítí. Z pohledu uživatele jsou natrénované neuronové sítě černou
skříňkou, která mu vrací požadované údaje. Mnohdy tak ani neví, že pracuje s neuronovou
sítí (Štencl 2010, s. 98-99).
Zadání samostatné práce (úkolu)
Zjistěte studie, které se zabývají využitím neuronových sítí pro modelování na burze
cenných papírů. Porovnejte je, zda autoři doporučují nahradit statistické metody využitím
neuronových sítí.
Řešení:
GAVUROVÁ, B. et al, 2017. Analysis of impact of using the trend variables on
bankruptcy prediction models performance. Ekonomický časopis. 65(4), 370-383. ISSN
0013-3035.
NORADDIN, M. A., A. A. MOHAMMAD a M. F. MAHDI, 2014. An integrated system
based on fuzzy genetic algorithm and neural networks for stock price forecasting. The
International Journal of Quality & Reliability Management. 31(3), 281-292. ISSN 0265-
671X.
126
RAJIHY, Y., K. NERMEND a A. ALSAKAA, 2017. Back-propagation artificial neural
networks in stock market forecasting. an application to the warsaw stock exchange WIG20.
Aestimatio. -(15), 88-99. ISSN 2173-0164.
ZÁKOUTSKÝ, V., 2013. Modelování na burze cenných papírů metodami umělé
inteligence. Diplomová práce. Univerzita Pardubice. Fakulta ekonomicko-správní. Ústav
systémového inženýrství a informatiky. Dostupné z:
https://dk.upce.cz/bitstream/handle/10195/51913/ZakoutskyV_ModelovaniNaBurze_VO_2
013.pdf?sequence=3&isAllowed=y
Studijní literatura
Povinná literatura
DOSTÁL, P., 2015. Soft computing v podnikatelství a veřejné správě. Brno: CERM
Akademické nakladatelství. ISBN 978-80-7204-898-4. (s. 218-243)