====== 1. prednaska ====== === Data mining === * Vznik v 80. letech * Dulezite definovat matematicky korektne == Priklad == Pravdepodobnost ze vyjde jedna z 5 hypotez na nahodnych datech na hladine spolehlivosti 5% je 1-(0,95)^5 \\ -> vysoka pravdepodobnost!\\ Reseni:\\ Vydeleni hladiny spolehlivosti 1/P^alpha\\ == Exploratory analyses == * prvni zkoumani dat * zpracovavaji pocitace * testuji vsechny mozne hypotezy * odbornik pak zhodnoti co je smysluplne a zajimave == Z ceho se sklada DM == * Statistics (correlation, regression) * Web * databases * DOOT (Cobra,RMI) * Neural networks * Logic (observational, fuzzy) * Machine learning (decision trees) === Univerzalni systemy pro DM === == Komercni == * IBM Model Builder (drive Clementine) (SPSS) * IBM Intelliget Miner(silny v 90. letech) * Enterprise miner(SAS) * KXEN * Statistica Data Miner == Nekomercni == * WEKA * Rapid Miner * Pentaha * R === Systemy pro podporu okamziteho rozhodovani na zaklade dat === * Decision site (Spotfire) * MS DataAnalyzer (nutnost MSSQL) === Systemy, ktere nejsou primarne urceny k DM === - Databazove systemy - Statisticke systemy - Obecne matematicke systemy (Matlab, Mathematica)