/
Data Mining
Data Mining
- Ablauf einer Datenanalyse
- CRISP-Data-Mining-Modell
- Fehlerraten
- Grundsätze des Data Mining
- Gütemaße und Kenngrößen für Klassifikatoren
- SEMMA-Vorgehensmodell
Daten
Daten werden unterteilt in:
- unstrukturierte Daten
- semistrukturierte Daten
- strukturierte Daten
Datentypen
- nominale Daten (Geschlecht, Haarfarbe, Familienstand)
- ordinale Daten (Schulnoten, Meinung, Gesundheitszustand)
- metrische Daten (Jahreszahlen, Temperatur, Messwerte, Entfernung, Körpergröße, Zahl der Kinder)
- diskrete Daten
- kontinuierliche Daten
Distanzfunktionen
- Hamming-Distanz
- Euklidische Distanz
- Manhattan-Distanz
- Maximum-Distanz
- Mahalanobis Distanz2
- Hausdorff Distanz2
Quelle
Jürgen Cleve, Uwe Lämmel: Data Mining; S. 37 ff., De Gruyter Oldenbourg, 2. Aufl.
2 Anil K. Jain, Arun A. Ross, Karthik Nanadakumar, Introduction to Biometrics; S.189-190, Springer, 1. Aufl.