====== Prednaska 3 ====== skripta: Statisticke aspekty dobyvani znalosti z dat, Holena ==== Klasifikace ==== tridy: \\ C1 | C2 \\ ------- \\ C3 | C4 \\ === Klasifikator === f: X->{C1...Cn} * dalsim vystupem muze byt ohodnoceni spolehlivosti klasifikace * napr. <0,1> * f: X-> C in [0,1]^n (C1...Cn) == Chyba klasifikatoru == * E(C,f(x)) * vyjadreni pomoci matice M_ij ==== Regrese ==== g: R^n -> R^m \\ g: X -> Y={C1..Cn} * tento pripad shody s klasifikaci * klasifikator se da popsat jako specialni model regresniho modelu === Mereni vzdalenosti === * Manhattonska vzdalenost * Euklidovska vzdalenost * Kullback-Leibler - vzdalenost mezi dvema rozdelenimi pravdepodobnosti === Linearni regrese === * model je primka * f(x) = w^Tx + b * stabilita modelu: pri male zmene vstupu se vyrazne nemeni vystup - male vahy w^T * regularizacni opertaor phi(f) === Uceni zalozene na nahodnem vyberu ===