====== Prednaska 2 ====== ===== Model ===== ==== Deleni modelu podle funkce ==== * Deskriptivni modely - shlukova analyza * Predikcni modely - regrese, klasifikace ==== Prehled metod generujicich modely ==== * viz slidy ===== Klasifikace a regrese ===== model: y = f(x) * Klasifikacni model - y je nominalni (nazev tridy) * Regresni model - y je spojita velicina (teplota, vyska ... cislo) ==== Klasifikacni model ==== * 2 faze * uceni, trenovani-upravuje se vnitrni struktura, parametry * vybavovani,pouziti - neovlivnuje model ==== 1NN nejblizsi soused ==== * ma referencni data - vyhleda nejpodobnejsi(nejblizsi) z referencnich dat a klasifikuje ho stejnou tridou * trenovani - ulozeni trenovacich dat * vybavovani - aplikace modelu === Metrika === * Euklidovska vzdalenost * Manhattonska vzdalenost === Vaha atributu === * atribut ma vahu podle sve hodnoty * nutno normalizovat data <0,1> (napr normalizace - min/max) ==== kNN - k nejblizsich sousedu ==== * klasifikace - najdi k nejblizsich sousedu a klasifikuj majoritni tridou * volba vhodneho k - problem ==== Preuceni ==== * klasifikuje dobre na trenovaci mnozine, ale neni aplikovatelny na realna data - vysoka chybovost * reseni - rozdeleni trenovacich dat na trenovaci a testovaci * uceni na trenovaci mnozine * odhad chyby * vypocet chyby modelu * klasifikace * procento nespravnych odpovedi * regrese * **soucet (ctvercu) odchylek** * průměrný čtverec odchylky * **odmocnina průměrného čtverce odchylky (RMSE)** === Cross validace === * rozdeleni trenovacich dat na foldy * 1 fold na testovani, zbytek na trenovani * N x menime testovaci fold