Die „Median absolute Abweichung“ (Median Absolute Deviation, MAD) ist ein statistischer Parameter, der als Maß für die Streuung oder Variabilität in einem Datensatz dient. Im Gegensatz zur mittleren absoluten Abweichung, die auf dem arithmetischen Mittel basiert, wird bei der MAD der Median des Datensatzes als Bezugspunkt verwendet. Dies macht die MAD unempfindlicher gegenüber Ausreißern oder extremen Werten im Datensatz, was sie zu einem robusten Maß für die Beschreibung der Verteilung von Daten macht.
Die Berechnung der MAD erfolgt in mehreren Schritten. Zunächst wird der Median des Datensatzes bestimmt. Anschließend wird für jeden einzelnen Wert die absolute Differenz zwischen diesem Wert und dem Median berechnet. Die MAD ist dann der Mittelwert dieser absoluten Abweichungen. Mathematisch kann dies wie folgt dargestellt werden:
[
text{MAD} = frac{1}{n} sum{i=1}^{n} |xi – tilde{x}|
]
wobei (x_i) die einzelnen Datenpunkte, (tilde{x}) den Median und (n) die Anzahl der Datenpunkte darstellt.
Die Median absolute Abweichung findet in vielen Anwendungen der künstlichen Intelligenz und des maschinellen Lernens Verwendung, insbesondere dort, wo die Robustheit gegenüber Ausreißern von Bedeutung ist. Ein Beispiel hierfür ist die Verwendung der MAD als Verlustfunktion in Regressionsmodellen, um die Auswirkungen von Ausreißern zu minimieren und ein stabileres Modell zu erhalten.
Zusammenfassend ist die Median absolute Abweichung ein nützliches Werkzeug zur Beschreibung der Verteilung von Daten und bietet aufgrund ihrer Robustheit gegenüber extremen Werten eine zuverlässige Alternative zu anderen Maßen der Streuung.