Ablauf einer Datenanalyse

Phasen ¹

  • Selektion = Auswahl der geeigneten Datenmengen
  • Datenvorverarbeitung = Behandlung fehlender oder problembehafteter Daten
  • Transformation = Umwandlung in adäquate Datenformate
  • Data Mining = Suche nach Mustern
  • Interpretation und Evaluation = Interpretation der Ergebnisse und Auswertung

Prozessschritte ²

  1. Einlesen der Trainingsdaten
  2. Behandeln der fehlenden Daten
  3. Aufteilen der Trainingsmenge in eine Datei zum Trainieren und eine zum Testen
  4. Einsetzen des Knotens zum Entscheidungsbaum-Lernen
  5. Berechnen de Ergebnisses gemäß der Zielfunktion

Quelle

¹ Jürgen Cleve, Uwe Lämmel: Data Mining; S. 5/6, De Gruyter Oldenbourg, 2. Aufl.

² Jürgen Cleve, Uwe Lämmel: Data Mining; S. 262, De Gruyter Oldenbourg, 2. Aufl.