- Dichtefunktion
-
Die Wahrscheinlichkeitsdichtefunktion, oft kurz Dichtefunktion, Wahrscheinlichkeitsdichte oder nur Dichte (abgekürzt WDF oder pdf von engl. probability density function) ist ein Hilfsmittel zur Beschreibung einer stetigen Wahrscheinlichkeitsverteilung. Die Integration der Wahrscheinlichkeitsdichte über ein Intervall [a,b] ergibt die Wahrscheinlichkeit dafür, dass eine Zufallsvariable mit dieser Dichte einen Wert zwischen a und b annimmt. Die Wahrscheinlichkeitsdichte kann Werte größer als 1 annehmen und sollte nicht mit der Wahrscheinlichkeit selbst verwechselt werden.
Formal handelt es sich um eine Dichte bezüglich des Lebesgue-Maßes.
Inhaltsverzeichnis
Einleitung
Während man im diskreten Fall Wahrscheinlichkeiten von Ereignissen durch Aufsummieren der Wahrscheinlichkeiten der einzelnen Elementarereignisse berechnen kann (ein idealer Würfel zeigt beispielsweise jede Zahl mit einer Wahrscheinlichkeit von ), so gilt dies nicht mehr für den kontinuierlichen Fall. Beispielsweise sind zwei Menschen kaum exakt gleich groß, sondern nur bis auf Haaresbreite oder weniger. In solchen Fällen sind Wahrscheinlichkeitsdichtefunktionen nützlich. Mit Hilfe dieser Funktionen lässt sich für ein beliebiges Intervall – beispielsweise eine Körpergröße zwischen 1,80000... und 1,80999... Meter – eine Aussage treffen, obwohl unendlich viele Werte in diesem Intervall liegen, von denen jeder einzelne eine Wahrscheinlichkeit hat, die nicht von 0 zu unterscheiden ist.
Definition
X sei eine reellwertige Zufallsvariable. Eine Funktion heißt Wahrscheinlichkeitsdichte der Zufallsvariable X (oder genauer: der Verteilung μ von X), falls gilt
- bzw.
für alle reellen Zahlen a < b.
Beispiele
Beispiele für Wahrscheinlichkeitsdichten sind in der Liste univariater Wahrscheinlichkeitsverteilungen zu finden.
Eigenschaften
Normierung und Eindeutigkeit
Die Fläche unter der Dichtefunktion hat den Inhalt 1, d. h.
- .
Die Wahrscheinlichkeitsdichte ist, bis auf Abweichungen in einer Nullmenge, nichtnegativ und eindeutig bestimmt. Sie kann im Gegensatz zur Verteilungsfunktion aber beliebig große Werte annehmen, wie aus dem Bild ersichtlich ist.
Umgekehrt gilt: Jede Funktion mit nichtnegativen Werten und ist die Dichtefunktion einer eindeutig bestimmten Wahrscheinlichkeitsverteilung.
Berechnung von Wahrscheinlichkeiten
Die Wahrscheinlichkeit für ein Intervall kann man mit der Wahrscheinlichkeitsdichte f oder der zugehörigen kumulativen Verteilungsfunktion F berechnen als
- .
Bei dem Intervall kann man die Randpunkte auch weglassen, denn einzelne Punkte haben hier die Wahrscheinlichkeit 0 – die Verteilungsfunktion ist stetig.
Für komplexere Mengen kann die Wahrscheinlichkeit analog durch Integrieren über Teilintervalle ermittelt werden. Allgemein erhält man die Wahrscheinlichkeit in der Form
- .
Bedingung für die Existenz einer Wahrscheinlichkeitsdichte
X besitzt eine Wahrscheinlichkeitsdichte f genau dann, wenn Verteilung von X absolutstetig bezüglich des Lebesgue-Maßes ist, d. h. wenn
für jede Lebesgue-Nullmenge A (Satz von Radon-Nikodým).
Zusammenhang von Verteilungsfunktion und Dichtefunktion
Die (kumulative) Verteilungsfunktion F erhält man als Integral über die Dichtefunktion:
Umgekehrt gilt: Wenn die Verteilungsfunktion F differenzierbar ist, ist ihre Ableitung eine Dichtefunktion der Verteilung:
Das gilt auch dann noch, wenn es abzählbar viele Stellen x gibt, an denen F stetig, aber nicht differenzierbar ist; welche Werte man an diesen Stellen für f(x) verwendet, ist unerheblich.
Allgemein existiert eine Dichtefunktion genau dann, wenn die Verteilungsfunktion F absolut stetig ist. Diese Bedingung impliziert unter anderem, dass F stetig ist und fast überall eine Ableitung besitzt, die mit der Dichte übereinstimmt.
Man beachte jedoch, dass es Verteilungen wie die Cantor-Verteilung gibt, die eine stetige, fast überall differenzierbare Verteilungsfunktion besitzen, aber dennoch keine Wahrscheinlichkeitsdichte. Fast überall differenzierbar sind Verteilungsfunktionen immer, aber die entsprechende Ableitung erfasst generell nur den absolutstetigen Anteil der Verteilung.
Dichten auf Teilintervallen
Die Wahrscheinlichkeitsdichte einer Zufallsvariable X, die nur Werte in einem Teilintervall I der reellen Zahlen annimmt, kann man so wählen, dass sie außerhalb des Intervalls den Wert 0 hat. Ein Beispiel ist die Exponentialverteilung mit . Alternativ kann man die Wahrscheinlichkeitsdichte als eine Funktion betrachten, d. h. als eine Dichte der Verteilung auf I bezüglich des Lebesgue-Maßes auf I.
Mehrdimensionale Zufallsvariable
Wahrscheinlichkeitsdichten kann man auch für mehrdimensionale Zufallsvariablen (oder Zufallsvektoren) definieren. Eine messbare Funktion ist eine Wahrscheinlichkeitsdichte einer Zufallsvariable X mit Werten in , wenn
für alle reellen Zahlen a1 < b1,...,an < bn.
Der Begriff der Verteilungsfunktion lässt sich ebenfalls auf mehrdimensionale Zufallsvariablen erweitern. Hier ist in der Notation das x ein Vektor und das -Zeichen komponentenweise zu lesen. F ist also hierbei eine Abbildung von in das Intervall [0,1]. Wenn F hinreichend oft differenzierbar ist, erhält man eine Wahrscheinlichkeitsdichte durch partielle Differentiation:
Schätzung einer Wahrscheinlichkeitsdichte anhand diskreter Daten
Diskret erfasste, aber eigentlich stetige Daten (Beispielsweise die Körpergröße in Zentimetern) können als Häufigkeitsdichte repräsentiert werden. Das so erhaltene Histogramm ist eine unstetige Dichtefunktion. Alternativ kann aus der Empirischen Verteilungsfunktion mit einem Kerndichteschätzer eine stetige Dichtefunktion geschätzt werden. Der dazu verwendete Kern sollte dem erwarteten Messfehler entsprechen.
Wikimedia Foundation.