Gütemaße und Kenngrößen für Klassifikatoren

Gütemaße

Gütemaße am Beispiel für Kunden

AbkürzungBedeutung
TP (richtig positiv)Ein guter Kunde wird als guter Kunde erkannt
TN (richtig negativ)Ein nicht guter Kunde wird als nicht guter erkannt
FP (falsch positiv)Ein nicht guter Kunde wird als guter erkannt
FN (falsch negativ)Ein guter Kunde wird als nicht guter erkannt

Kenngrößen

Daraus abgeleitete Kenngrößen

NameFormelBedeutung
Korrekte KlassifikationenT=TP+TNalle korrekten Vorhersagen
Falsche KlassifikationenF=FP+FNalle falschen Vorhersagen
RelevanzR=TP+FNdie Anzahl der guten Kundne
IrrelevanzI=FP+TNdie Anzahl der nicht guten Kunden
PositivitätP=TP+FPdie Anzahl der als gut klassifizierten Kunden
NegativitätN=TN+FNdie Anzahl der als nicht gut klassifizierten Kunden
KorrektheitsrateT
n
der Anteil der korrekt klassifizierten Kunden
InkorrektheitsrateF
n
der Anteil der nicht korrekt klassifizierten Kunden
Richtig-positiv-RateTPR=TP
         R
Wie oft wurde ein guter Kunde als solcher erkannt (Sensitivität, Recall, Trefferquote)
Richtig-negativ-RateTNR=TN
          I
Wie oft wurde ein nicht guter Kunde auch als solcher klassifiziert
Falsch-Positiv-RateFPR=FP
          I
Wie oft wurde ein nicht guter Kunde als guter Kunde klassifiziert
Falsch-negativ-RateFNR=FN
          I
Wie oft wurde ein guter Kunde als nicht guter Kunde klassifiziert
Positiver Vorhersagewert,
Genauigkeit, Präzision (precision)
TP
P
Wie oft ist ein als gut vorhergesagter Kunde ein guter Kunde
Negativer VorhersagewertTN
N
Wie oft ist ein als nicht gut vorhergesagter Kunde dein nicht guter Kunde
Negative FalschklassifikationsrateFN
N
Wie oft ist ein als nicht gut vorhergesagter Kunde ein guter Kunde
Positive FalschklassifikationsrateFP
P
Wie oft ist ein als gut vorhergesagter Kunde ein nicht guter Kunde

Quelle

Jürgen Cleve, Uwe Lämmel: Data Mining; S. 236/237, De Gruyter Oldenbourg, 2. Aufl.