Ein „Tree“ (zu dt.: Baum) bezieht sich im Kontext der künstlichen Intelligenz (KI) auf eine Entscheidungsstruktur, die häufig in maschinellen Lernalgorithmen wie Entscheidungsbäumen verwendet wird. Diese Struktur ist ein grundlegendes Konzept im Bereich des maschinellen Lernens und dient zur Klassifizierung oder Regression von Daten.
Ein Entscheidungsbaum besteht aus Knoten und Verzweigungen, die eine hierarchische Struktur bilden. Die oberste Ebene wird als Wurzelknoten bezeichnet, der die Eingangsdaten empfängt. Jeder nachfolgende Knoten repräsentiert eine Entscheidung oder einen Vergleich, der auf den Merkmalen oder Attributen der Daten angewendet wird. Die Blattknoten stellen die resultierenden Vorhersagen oder Klassen dar.
Die Funktionsweise eines Entscheidungsbaums basiert auf der rekursiven Aufteilung der Daten in Untergruppen. Jede Aufteilung erfolgt anhand von Merkmalen, wodurch die Daten schrittweise in immer spezifischere Gruppen unterteilt werden. Dieser Prozess setzt sich fort, bis vorgegebene Kriterien erreicht sind, wie beispielsweise wenn alle Datenpunkte in einem Knoten einer einzigen Klasse angehören.
Vorteile von Entscheidungsbäumen liegen in ihrer Einfachheit und hohen Interpretierbarkeit, was sie besonders für Anwender ohne umfassende technische Kenntnisse geeignet macht. Sie können verschiedene Datentypen verarbeiten und sind effizient bei der Bearbeitung kleinerer Datensätze.
Allerdings neigen Entscheidungsbäume zu Überanpassung, insbesondere bei komplexen Strukturen. Um dies zu vermeiden, werden oft Ensemble-Methoden wie Random Forests oder Gradient Boosting eingesetzt, die multiple Bäume kombinieren, um die Genauigkeit zu verbessern und Überanpassung zu reduzieren.