Table of Contents
1. prednaska
Data mining
- Vznik v 80. letech
- Dulezite definovat matematicky korektne
Priklad
Pravdepodobnost ze vyjde jedna z 5 hypotez na nahodnych datech na hladine spolehlivosti 5% je 1-(0,95)^5
→ vysoka pravdepodobnost!
Reseni:
Vydeleni hladiny spolehlivosti <m>1/P^alpha</m>
Exploratory analyses
- prvni zkoumani dat
- zpracovavaji pocitace
- testuji vsechny mozne hypotezy
- odbornik pak zhodnoti co je smysluplne a zajimave
Z ceho se sklada DM
- Statistics (correlation, regression)
- Web
- databases
- DOOT (Cobra,RMI)
- Neural networks
- Logic (observational, fuzzy)
- Machine learning (decision trees)
Univerzalni systemy pro DM
Komercni
- IBM Model Builder (drive Clementine) (SPSS)
- IBM Intelliget Miner(silny v 90. letech)
- Enterprise miner(SAS)
- KXEN
- Statistica Data Miner
Nekomercni
- WEKA
- Rapid Miner
- Pentaha
- R
Systemy pro podporu okamziteho rozhodovani na zaklade dat
- Decision site (Spotfire)
- MS DataAnalyzer (nutnost MSSQL)
Systemy, ktere nejsou primarne urceny k DM
- Databazove systemy
- Statisticke systemy
- Obecne matematicke systemy (Matlab, Mathematica)