Data Mining


Daten

Daten werden unterteilt in:

  • unstrukturierte Daten
  • semistrukturierte Daten
  • strukturierte Daten

Datentypen

  • nominale Daten (Geschlecht, Haarfarbe, Familienstand)
  • ordinale Daten (Schulnoten, Meinung, Gesundheitszustand)
  • metrische Daten (Jahreszahlen, Temperatur, Messwerte, Entfernung, Körpergröße, Zahl der Kinder)
  • diskrete Daten
  • kontinuierliche Daten

Distanzfunktionen

  • Hamming-Distanz
  • Euklidische Distanz
  • Manhattan-Distanz
  • Maximum-Distanz
  • Mahalanobis Distanz2
  • Hausdorff Distanz2

Quelle

Jürgen Cleve, Uwe Lämmel: Data Mining; S. 37 ff., De Gruyter Oldenbourg, 2. Aufl.

2 Anil K. Jain, Arun A. Ross, Karthik Nanadakumar, Introduction to Biometrics; S.189-190, Springer, 1. Aufl.