Table of Contents
Prednaska 2
Model
Deleni modelu podle funkce
- Deskriptivni modely - shlukova analyza
- Predikcni modely - regrese, klasifikace
Prehled metod generujicich modely
- viz slidy
Klasifikace a regrese
model: y = f(x)
- Klasifikacni model - y je nominalni (nazev tridy)
- Regresni model - y je spojita velicina (teplota, vyska … cislo)
Klasifikacni model
- 2 faze
- uceni, trenovani-upravuje se vnitrni struktura, parametry
- vybavovani,pouziti - neovlivnuje model
1NN nejblizsi soused
- ma referencni data - vyhleda nejpodobnejsi(nejblizsi) z referencnich dat a klasifikuje ho stejnou tridou
- trenovani - ulozeni trenovacich dat
- vybavovani - aplikace modelu
Metrika
- Euklidovska vzdalenost
- Manhattonska vzdalenost
Vaha atributu
- atribut ma vahu podle sve hodnoty
- nutno normalizovat data <0,1> (napr normalizace - min/max)
kNN - k nejblizsich sousedu
- klasifikace - najdi k nejblizsich sousedu a klasifikuj majoritni tridou
- volba vhodneho k - problem
Preuceni
- klasifikuje dobre na trenovaci mnozine, ale neni aplikovatelny na realna data - vysoka chybovost
- reseni - rozdeleni trenovacich dat na trenovaci a testovaci
- uceni na trenovaci mnozine
- odhad chyby
- vypocet chyby modelu
- klasifikace
- procento nespravnych odpovedi
- regrese
- soucet (ctvercu) odchylek
- průměrný čtverec odchylky
- odmocnina průměrného čtverce odchylky (RMSE)
Cross validace
- rozdeleni trenovacich dat na foldy
- 1 fold na testovani, zbytek na trenovani
- N x menime testovaci fold