1. prednaska

Data mining

  • Vznik v 80. letech
  • Dulezite definovat matematicky korektne
Priklad

Pravdepodobnost ze vyjde jedna z 5 hypotez na nahodnych datech na hladine spolehlivosti 5% je 1-(0,95)^5
→ vysoka pravdepodobnost!
Reseni:
Vydeleni hladiny spolehlivosti <m>1/P^alpha</m>

Exploratory analyses
  • prvni zkoumani dat
  • zpracovavaji pocitace
  • testuji vsechny mozne hypotezy
  • odbornik pak zhodnoti co je smysluplne a zajimave
Z ceho se sklada DM
  • Statistics (correlation, regression)
  • Web
  • databases
  • DOOT (Cobra,RMI)
  • Neural networks
  • Logic (observational, fuzzy)
  • Machine learning (decision trees)

Univerzalni systemy pro DM

Komercni
  • IBM Model Builder (drive Clementine) (SPSS)
    • IBM Intelliget Miner(silny v 90. letech)
  • Enterprise miner(SAS)
  • KXEN
  • Statistica Data Miner
Nekomercni
  • WEKA
    • Rapid Miner
  • Pentaha
  • R

Systemy pro podporu okamziteho rozhodovani na zaklade dat

  • Decision site (Spotfire)
  • MS DataAnalyzer (nutnost MSSQL)

Systemy, ktere nejsou primarne urceny k DM

  1. Databazove systemy
    1. Statisticke systemy
    2. Obecne matematicke systemy (Matlab, Mathematica)
school/fit/miadm/prednaska01.txt · Last modified: 2018-06-21 19:48 (external edit)
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0