Stochastische variabele
In de kansrekening is een stochastische variabele of stochastische grootheid een grootheid waarvan de waarde afhangt van de toevallige uitkomst in een kansexperiment. De stochastische variabele, ook toevalsvariabele, kansvariabele of stochast, is een eigenschap van de uitkomst die in een getal is uit te drukken, zoals de leeftijd of het inkomen van een toevallige voorbijganger. Het toeval bepaalt de uitkomst van het experiment, en bijgevolg is de waargenomen waarde van de stochastische variabele ook afhankelijk van het toeval. Bij een onderzoek naar de verdeling van de leeftijd is niet de toevallige voorbijganger zelf, de uitkomst, van belang, maar z'n leeftijd, een eigenschap van de uitkomst. Die leeftijd is in dit geval de stochastische variabele. Zo zijn ook het inkomen van een willekeurig gekozen Nederlander en het aantal keren dat 'kruis' gegooid wordt in een serie van 100 worpen met een munt, stochastische variabelen. Hoewel voor elke mogelijke uitkomst de waarde van de stochastische variabele vastligt, hangt de waargenomen waarde af van het toeval, als gevolg van de toevallige uitkomst. Formeel is een stochastische variabele daarmee een functie die aan elke uitkomst een getal, de waarde van de bedoelde eigenschap, toevoegt.
In veel kansexperimenten, zoals steekproeftrekkingen, wordt uit een populatie op basis van toeval een element, bijvoorbeeld een willekeurige voorbijganger, aangewezen. We vragen deze voorbijganger naar zijn leeftijd, inkomen, en dergelijke. Bij het herhalen hiervan treffen we vermoedelijk een andere voorbijganger met zeer waarschijnlijk andere antwoorden. Om een theoretisch begrip te hebben om over zaken als 'de leeftijd van een willekeurige voorbijganger' te kunnen spreken, is het begrip 'stochastische variabele' ingevoerd. Op basis van toeval wordt een uitkomst aangewezen - een of andere voorbijganger - en aan deze uitkomst wijzen we een getal toe - z'n leeftijd. Hieruit blijkt dat een 'stochastische variabele' een afbeelding is van de uitkomstenruimte naar de reële getallen.
Definitie
bewerkenEen stochastische variabele is een (meetbare) reële functie op de uitkomstenruimte van een kansruimte.
Omdat niet iedere deelverzameling van een gebeurtenis hoeft te zijn, is ook niet noodzakelijk iedere functie op een stochastische variabele. Daarom wordt geëist dat de functie meetbaar is, wat inhoudt dat het origineel van een interval een gebeurtenis is.
Zo kan op basis van toeval een proefpersoon worden aangewezen en stelt haar of zijn gewicht voor. De waarden van de stochastische variabele vormen eigenlijk weer een uitkomstenruimte, het waardenbereik, met daarop een kans bepaald door de kans op de oorspronkelijke uitkomstenruimte. Deze kans heet kansverdeling van en geeft voor (meetbare) deelverzamelingen van de kans dat een waarde aanneemt die ligt binnen .
Het waardenbereik van een stochastische variabele is dus een ‘vertaling’ van de uitkomstenruimte bij een kansexperiment. Het waardenbereik is een nieuwe uitkomsteruimte die de uitkomsten van de stochastische variabele bevat.
Als het experiment zo is ingericht dat een deelverzameling is van , en al de relevante informatie bevat, is het soms gemakkelijker een stochastische variabele te introduceren. De identieke afbeelding is dan de geschikte functie. Gooit men als experiment bijvoorbeeld zolang tot de uitkomst 6 boven komt, dan kan het benodigde aantal worpen direct als uitkomst opgevat worden. Het is dan gemakkelijker dit aantal ook te beschouwen als een stochastische variabele , waarop de theorie kan worden toegepast.
Niet altijd zal de onderzochte eigenschap van de uitkomsten uit een reëel getal zijn. Denk bijvoorbeeld aan kleuren, vormen, voornamen, namen van paarden bij een paardenrace. Men neemt dan wel zijn toevlucht de eigenschap te coderen met een getal en zo een stochastische variabele te introduceren, die dan in veel gevallen niet van ordinaal meetniveau is. Er is daar een voorbeeld van met het gooien met dartpijlen.
In de praktische toepassing is een stochastische variabele een model van de werkelijkheid en zal een van de waarden uit het waardenbereik zijn waargenomen. De waarde wordt een realisatie van de stochastische variabele genoemd.
De definitie van een stochastische variabele maakt het mogelijk dit begrip goed in te passen in de theorie, maar dat is niet wat ons vooral interesseert. Het belang zit vooral in de kansverdeling van een stochastische variabele, waarmee relevante kansen kunnen worden bepaald.
Generalisatie
bewerkenHet is in de huidige theorie gebruikelijk een ruimere klasse van meetbare afbeeldingen als stochastische variabelen te benoemen. Zo zijn er ook complexwaardige en meerdimensionale stochastische variabelen en algemeen afbeeldingen naar willekeurige meetbare ruimten.
Een stochastische variabele is een meetbare afbeelding van de kansruimte naar de meetbare ruimte .
en meetbaar houdt in dat voor alle geldt:
Typen
bewerkenMen kan verschillende typen stochastische variabelen onderscheiden. Een belangrijk onderscheid is in discrete en continue stochastische variabelen. Daarnaast zijn er gemengde stochastische variabelen, die opgevat kunnen worden als een mengsel van beide typen.
Voorbeeld
bewerkenBij het gooien met twee dobbelstenen bestaat de uitkomstenruimte uit de 6² = 36 paren mogelijke ogenaantallen:
Het totale aantal geworpen ogen wordt gedefinieerd door de stochastische variabele:
Het waardenbereik van is
Door alle deelverzamelingen als gebeurtenis toe te laten, wat in zo'n eenvoudige situatie mogelijk is, zijn er geen problemen betreffende de meetbaarheid van , want dan zijn alle functies meetbaar.
Kansverdeling
bewerkenEen belangrijk aspect van een stochastische variabele is de bijbehorende kansverdeling, die aangeeft wat de kansen zijn op de mogelijke waarden of waardenverzamelingen van de stochastische variabele. In de meeste gevallen is niet de stochastische variabele als afbeelding van belang, maar gaat het om zijn verdeling.
Notatie
bewerkenEr zijn verschillende notatieconventies voor stochastische variabelen in gebruik. Twee van de meest gebruikte conventies zijn: de stochastische variabele onderstrepen ( ) en de stochastische variabele aangeven met een hoofdletter ( ).