Table of Contents
Prednaska 2
Model
Deleni modelu podle funkce
Prehled metod generujicich modely
Klasifikace a regrese
Klasifikacni model
1NN nejblizsi soused
Metrika
Vaha atributu
kNN - k nejblizsich sousedu
Preuceni
Cross validace
Prednaska 2
Model
Deleni modelu podle funkce
Deskriptivni modely - shlukova analyza
Predikcni modely - regrese, klasifikace
Prehled metod generujicich modely
viz slidy
Klasifikace a regrese
model: y = f(x)
Klasifikacni model - y je nominalni (nazev tridy)
Regresni model - y je spojita velicina (teplota, vyska … cislo)
Klasifikacni model
2 faze
uceni, trenovani-upravuje se vnitrni struktura, parametry
vybavovani,pouziti - neovlivnuje model
1NN nejblizsi soused
ma referencni data - vyhleda nejpodobnejsi(nejblizsi) z referencnich dat a klasifikuje ho stejnou tridou
trenovani - ulozeni trenovacich dat
vybavovani - aplikace modelu
Metrika
Euklidovska vzdalenost
Manhattonska vzdalenost
Vaha atributu
atribut ma vahu podle sve hodnoty
nutno normalizovat data <0,1> (napr normalizace - min/max)
kNN - k nejblizsich sousedu
klasifikace - najdi k nejblizsich sousedu a klasifikuj majoritni tridou
volba vhodneho k - problem
Preuceni
klasifikuje dobre na trenovaci mnozine, ale neni aplikovatelny na realna data - vysoka chybovost
reseni - rozdeleni trenovacich dat na trenovaci a testovaci
uceni na trenovaci mnozine
odhad chyby
vypocet chyby modelu
klasifikace
procento nespravnych odpovedi
regrese
soucet (ctvercu) odchylek
průměrný čtverec odchylky
odmocnina průměrného čtverce odchylky (RMSE)
Cross validace
rozdeleni trenovacich dat na foldy
1 fold na testovani, zbytek na trenovani
N x menime testovaci fold