Prednaska 2

Model

Deleni modelu podle funkce

  • Deskriptivni modely - shlukova analyza
  • Predikcni modely - regrese, klasifikace

Prehled metod generujicich modely

  • viz slidy

Klasifikace a regrese

model: y = f(x)

  • Klasifikacni model - y je nominalni (nazev tridy)
  • Regresni model - y je spojita velicina (teplota, vyska … cislo)

Klasifikacni model

  • 2 faze
    • uceni, trenovani-upravuje se vnitrni struktura, parametry
    • vybavovani,pouziti - neovlivnuje model

1NN nejblizsi soused

  • ma referencni data - vyhleda nejpodobnejsi(nejblizsi) z referencnich dat a klasifikuje ho stejnou tridou
  • trenovani - ulozeni trenovacich dat
  • vybavovani - aplikace modelu

Metrika

  • Euklidovska vzdalenost
  • Manhattonska vzdalenost

Vaha atributu

  • atribut ma vahu podle sve hodnoty
  • nutno normalizovat data <0,1> (napr normalizace - min/max)

kNN - k nejblizsich sousedu

  • klasifikace - najdi k nejblizsich sousedu a klasifikuj majoritni tridou
  • volba vhodneho k - problem

Preuceni

  • klasifikuje dobre na trenovaci mnozine, ale neni aplikovatelny na realna data - vysoka chybovost
  • reseni - rozdeleni trenovacich dat na trenovaci a testovaci
  • uceni na trenovaci mnozine
  • odhad chyby
  • vypocet chyby modelu
    • klasifikace
      • procento nespravnych odpovedi
    • regrese
      • soucet (ctvercu) odchylek
      • průměrný čtverec odchylky
      • odmocnina průměrného čtverce odchylky (RMSE)

Cross validace

  • rozdeleni trenovacich dat na foldy
  • 1 fold na testovani, zbytek na trenovani
  • N x menime testovaci fold
school/fit/miadm/prednaska02.txt · Last modified: 2018-06-21 19:48 (external edit)
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0