Deel XIV Kansrekenen 2 en verklarende statistiek

Page 1

Wiskunde In zicht een cursus wiskunde voor studierichtingen met component wiskunde derde graad algemeen secundair onderwijs geschreven door

Koen De Naeghel Deel XIV Kansrekenen 2 en verklarende statistiek

30/04/2018


CREATIVE COMMONS Naamsvermelding-NietCommercieel-GelijkDelen 3.0 (CC BY-NC-SA) Dit is de vereenvoudigde (human-readable) versie van de volledige licentie. De volledige licentie is beschikbaar op de webpagina http://creativecommons.org/licenses/by-nc-sa/3.0/nl/legalcode De gebruiker mag: het werk kopiëren, verspreiden en doorgeven Remixen - afgeleide werken maken

Onder de volgende voorwaarden: Naamsvermelding - De gebruiker dient bij het werk de door de maker of de licentiegever aangegeven naam te vermelden (maar niet zodanig dat de indruk gewekt wordt dat zij daarmee instemmen met je werk of je gebruik van het werk). Niet-commercieel - De gebruiker mag het werk niet voor commerciële doeleinden gebruiken. Gelijk delen - Indien de gebruiker het werk bewerkt kan het daaruit ontstane werk uitsluitend krachtens dezelfde licentie als de onderhavige licentie of een gelijksoortige licentie worden verspreid.

Met inachtneming van: Afstandname van rechten - De gebruiker mag afstand doen van een of meerdere van deze voorwaarden met voorafgaande toestemming van de rechthebbende. Publiek domein - Indien het werk of een van de elementen in het werk zich in het publieke domein onder toepasselijke wetgeving bevinden, dan is die status op geen enkele wijze beı̈nvloed door de licentie. Overige rechten - Onder geen beding worden volgende rechten door de licentie-overeenkomst in het gedrang gebracht: • Het voorgaande laat de wettelijke beperkingen op de intellectuele eigendomsrechten onverlet. • De morele rechten van de auteur. • De rechten van anderen, ofwel op het werk zelf ofwel op de wijze waarop het werk wordt gebruikt, zoals het portretrecht of het recht op privacy. Let op - Bij hergebruik of verspreiding dient de gebruiker de licentievoorwaarden van dit werk kenbaar te maken aan . derden door middel van een link naar http://creativecommons.org/licenses/by-nc-sa/3.0/nl/

Eerste druk: 2014 Versie: 30 april 2018 Gepubliceerd door: Online publicatie platform Issuu.com Auteursrecht omslagfoto: stylephotographs/123RF Stockfoto http://nl.123rf.com/profile stylephotographs Tekstzetsysteem: LATEX Royalty percentage: 0% c Koen De Naeghel, gelicenseerd onder een Creative Commons Naamsvermelding-NietCommercieel-GelijkDelen 3.0 i


Deel XIV

Toegepaste wiskunde Kansrekenen 2 en verklarende statistiek

â„Ś

X

P

G

pi = P (G)

pX

X

xi

pi

x1

p1

x2

p2

.. .

.. .

xn

pn 1

R

xi

XIV


Inhoudsopgave

Deel Kansrekenen 2 en verklarende statistiek

1 Stochasten 1.1

Discrete stochasten . . . . . . . . . . . . . . . . . . . . . . Definitie stochast . . . . . . . . . . . . . . . . . . . . . . . Verwachtingswaarde en variantie van een discrete stochast Rekenen met stochasten . . . . . . . . . . . . . . . . . . . . Onafhankelijke stochasten . . . . . . . . . . . . . . . . . . . Toepassing 1 - De Sint-Petersburg-paradox . . . . . . . . . Toepassing 2 - Wet van de grote aantallen . . . . . . . . . 1.2 Continue stochasten . . . . . . . . . . . . . . . . . . . . . . Oefeningen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Inzicht in psychologie - Gokverslaving en martingaal . . . . . . .

1 . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

Discrete stochasten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Uniforme kansverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bernoulli-kansverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Binomiale kansverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Continue stochasten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Uniform verdeelde stochasten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Normale verdeelde stochasten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Som van normaal verdeelde stochasten . . . . . . . . . . . . . . . . . . . . . . . Toepassing 1 - Steekproefgemiddelden en voorspellingsintervallen . . . . . . . . . Toepassing 2 - De centrale limietstelling . . . . . . . . . . . . . . . . . . . . . . . Toepassing 3 - Betrouwbaarheidsinterval voor het populatiegemiddelde . . . . . Toepassing 4 - De binomiale kansverdeling benaderen met de normale verdeling Toepassing 5 - Som van uniform verdeelde stochasten . . . . . . . . . . . . . . . Oefeningen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Inzicht in psychometrie - Giscorrectie . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

2 Bijzondere kansverdelingen 2.1

1 1 5 6 9 11 12 13 16 20

21 21 21 22 23 25 25 26 26 27 28 29 30 31 32 36

Antwoorden op geselecteerde oefeningen

37

Referentielijst

40


A students nightmare of statistics tends to build up at the introduction of the stochastic variable and its calculus. de auteur

Hoofdstuk 1

Stochasten In de statistiek kan men vanuit twee gezichtspunten aandacht besteden aan de uitkomsten van experimenten. In de eerste plaats is er het terrein van de beschrijvende statistiek, waarbij het gaat om het bewerken en presenteren van beschikbare waarnemingen. Deze waarnemingen werden op een empirische manier verkregen. Anderzijds kan men de verklarende statistiek aanwenden om kwantitatieve variabelen op een theoretische manier te behandelen. Dat gebeurt met het begrip stochast. Het accent ligt er juist op de nog te verschijnen uitkomsten. Men kan daarom stellen dat bij beschrijvende statistiek bepaalde bewerkingen achteraf worden verricht, terwijl bij verklarende statistiek juist vooraf bepaalde uitspraken worden gedaan over mogelijk te verschijnen uitkomsten. Om deze reden is de stochast wellicht het belangrijkste onderwerp binnen het vakgebied van de (verklarende) statistiek. In wat volgt wordt eerst uiteengezet wat stochasten zijn, welke bewerkingen daarmee kunnen worden uitgevoerd en wat daarvan de invloed is op gemiddelde uitkomst van een stochast. We maken het onderscheid tussen discrete en continue stochasten.

1.1

Discrete stochasten

Definitie stochast 3 Op ontdekking. Saartje gooit met twee eerlijke dobbelstenen, een rode en een witte. De uitkomstenverzameling is (vul aan) Ω = ... Omdat de dobbelstenen eerlijk zijn, heeft elke enkelvoudige gebeurtenis dezelfde kans. Dus de kansmaat is uniform (zie Deel Kansrekenen 1), met als functievoorschrift P : D(Ω) → [0, 1]

{(r, w)} 7→ P (r, w) = . . .

We stellen de kansmaat P schematisch voor:

Met een rode en een witte dobbelsteen zien we in dat de gebeurtenis (1, 1) slechts één keer voorkomt in de uitkomstenverzameling Ω.

Saartje is jarig vandaag en krijgt van haar vriend het totaal aantal ogen maal twintig euro. Wat is de kans dat Saartje 120 euro krijgt? Oplossing. We hebben (vul aan) P (het totaal aantal ogen maal twintig is 120) = P (het totaal aantal ogen is . . . ) = ...

XIV-1


Eigenlijk gaan we hier als volgt te werk. We zien het totaal aantal ogen maal twintig als een nieuwe functie X X:Ω→R

(r, w) 7→ X(r, w) = . . .

We stellen de functie X schematisch voor:

We noemen zo’n functie X een stochast. In dit voorbeeld is het beeld (bereik) van de stochast X gelijk aan ber(X) = . . . Deze elementen noemen we de waarden van de stochast. Omdat we in dit geval alle waarden kunnen opsommen in een rij (hier zelfs een eindige rij) noemen we de stochast X discreet.1 Om te weten wat de kans is op de waarde xi = 120, hechten we aan elke waarde xi van de stochast een kans. We doen dit met de zogenaamde kansverdelingsfunctie van de stochast X pX : ber(X) → [0, 1]

def

xi 7→ pX (xi ) = . . . | {z } pi

We kunnen de kansverdelingsfunctie voorstellen met een tabel van functiewaarden: de zogenaamde kansverdeling van de stochast X. Dat laatste kunnen we grafisch weergeven in een (kans)histogram. Vul aan:

waarden xi

kans pi

40

...

60

...

80

...

100

...

(kans)

X

pi 6 36 5 36 4 36

120

...

140

...

3 36

160

...

2 36

180

...

1 36

200

...

220

...

240

...

20

40

60

80

100

120

140

160

180

200

220

xi 240 (waarden)

1 Een verzameling waarbij alle elementen kunnen opgesomd worden in een rij noemt men een aftelbare verzameling. Dus een stochast X is discreet als de verzameling ber(X) aftelbaar is. Voorbeelden van aftelbare verzamelingen zijn eindige verzamelingen en de verzamelingen N, Z en Q. Een verzameling die bevat is in een aftelbare verzameling, is op zijn beurt aftelbaar. De verzameling van de reële getallen is niet aftelbaar, alsook elk interval van de vorm [a, b] met a < b.

XIV-2


Algemeen is er sprake van een stochast wanneer de volgende situatie zich voordoet: 1. beschouw een (kans)experiment met uitkomstenverzameling Ω en 2. ken aan elke uitkomst ω ∈ Ω precies één reëel getal toe.

In dit proces herkennen we het begrip functie (of afbeelding): aan elk element in Ω wordt een element in R geassocieerd. Dit leidt tot onze definitie van stochast. 3 Definitie (stochast). Gegeven een (kans)experiment met uitkomstenverzameling Ω. Een stochast (of stochastische veranderlijke, kortweg s.v., of kansvariabele) X van dat experiment is een functie die aan de uitkomsten reële getallen associeert X:Ω→R ω → X(ω)

Het bereik van de stochast X is de verzameling ber(X) = {X(ω) | ω ∈ Ω} Elementen van het bereik noemen we waarden van de stochast. 3 Definitie (discrete stochast). Gegeven een (kans)experiment met uitkomstenverzameling Ω. Een stochast X is discreet als men de waarden van de stochast kan opsommen in een rij: ber(X) = {x1 , x2 , x3 , . . .} In dat geval noteren we een willekeurige waarde van de stochast X met xi . Voor een kansmaat P van het experiment is de kansverdelingsfunctie (of kansfunctie) van een discrete stochast X de functie pX : ber(X) → [0, 1]

def

G = X −1 (xi ) X We schrijven in plaats van pX (xi ) ook wel P (X = xi ) of p(xi ) of pi . Merk op dat pi = 1. xi 7→ pX (xi ) = P (G)

waarbij

i

Een discrete stochast X met bijbehorende kansverdelingsfunctie pX kunnen we schematiseren zoals op onderstaande figuur (links). Noteren we alle waarden xi samen met de kansen pi in een tabel, dan verkrijgen we de kansverdeling van de stochast X (rechts).

X

P

G

pi = P (G)

pX

X

xi

pi

x1

p1

x2

p2

.. .

.. .

xn

pn 1

R

xi

In de praktijk is het lastig om meteen de kansverdeling van een stochast te geven. Handig is het aanwenden van volgend Stappenplan voor het bepalen van de kansverdeling van een stochast X. 1. Beschrijf het experiment in woorden. 2. Geef de uitkomstenverzameling Ω in symbolen. 3. Beschrijf de stochast X in woorden. 4. Bouw bovenstaand schema van de stochast X op: (a) Neem een specifieke uitkomst ω ∈ Ω en bepaal X(ω) = xi .

(b) Veralgemeen om op die manier de linkerkolom van de kansverdeling van X te verkrijgen. (c) Bepaal de gebeurtenis G = X −1 (xi ). (d) Bereken de kans p(ω) met behulp van P (G). (e) Veralgemeen om op die manier de rechterkolom van de kansverdeling van X te verkrijgen. XIV-3


We werken twee modelvoorbeelden uit. 3 Modelvoorbeeld 1. Jeroen gooit met twee eerlijke dobbelstenen (een rode en een witte). Daarna leest hij het aantal ogen af van de hoogste steen. Noem X de stochast die het aantal ogen van de hoogste steen geeft. (a) Stel de stochast X schematisch voor en geef de kansverdeling. (b) Geef het bereik van X. (c) Bepaal P (X ≤ 2). Oplossing. (a) We volgen het stappenplan op de voorgaande pagina (vul aan). Experiment: gooien met twee dobbelstenen. Uitkomstenverzameling Ω = . . . Stochast X: het aantal ogen van de hoogste steen. Schematisch:

Kansverdeling:

X

Ω P

...

p(. . .) = P (. . .

pX

X

R

...

xi

pi

x1

p1

x1

p1

x2

p2

.. .

.. .

xn

pn 1

(b) (c) 3 Modelvoorbeeld 2. Aan een telefooncel staan drie personen voor ons aan te schuiven. Onderzoek heeft uitgewezen dat elke man (gemiddeld) 5 minuten gebruik maakt van de telefooncel en elke vrouw 10 minuten. Stel de kansverdeling en kanshistogram op van de stochast die de wachttijd in minuten weergeeft. Ga ervan uit dat de kans op een man of een vrouw onder de wachtenden even groot is. Oplossing.

Publieke telefooncel in het Verenigd Koninkrijk, ontworpen door Sir Giles Gilbert Scott 1924.

XIV-4


Verwachtingswaarde en variantie van een discrete stochast 3 Op ontdekking (vervolg). We hernemen het voorbeeld van Saartje dat gooit met twee eerlijke dobbelstenen en van haar vriend het totaal aantal ogen maal twintig euro krijgt. Wat is de winst die Saartje gemiddeld kan verwachten? Oplossing. De stochast X is het totaal aantal ogen maal twintig en op pagina 2 vonden we als kansverdeling X

xi

40

60

80

100

120

140

160

180

200

220

240

pi = pX (xi )

1 36

2 36

3 36

4 36

5 36

6 36

5 36

4 36

3 36

2 36

1 36

Onderstel eerst dat Saartje n keer mag gooien. Noem ni het aantal keer dat ze xi euro wint. De gemiddelde winst per worp is dan de totale winst gedeeld door het aantal worpen: n1 x1 + n2 x2 + · · · + n11 x11 n1 n2 n11 Wtot = = x1 + x2 + · · · + x11 n n n n n → pi dus de winst die Saartje gemiddeld kan verwachten is

Wgem = Als n → +∞ dan zal

ni n

1 2 1 · 40 + · 60 + · · · + · 240 = 140 36 36 36 Daarom noemen we 140 de verwachtingswaarde E(X) van de stochast X. p1 x1 + p2 x2 + · · · + p11 x11 =

3 Definitie. Gegeven een experiment met uitkomstenverzameling Ω en kansmaat P . De verwachtingswaarde van een discrete stochast X gelijk aan:2 X def µX = E(X) = pi · xi i

en de variantie is gelijk aan:

def

2 σX = Var(X) =

X i

De standaardafwijking is σX =

p

pi · (xi − µX )2

Var(X).

3 Modelvoorbeeld 2 (vervolg). Aan een telefooncel staan drie personen voor ons aan te schuiven. Onderzoek heeft uitgewezen dat elke man (gemiddeld) 5 minuten gebruik maakt van de telefooncel en elke vrouw 10 minuten. (a) Bereken algebraı̈sch de wachttijd die we gemiddeld kunnen verwachten, vooraleer het onze beurt is. (b) Bereken algebraı̈sch variantie van de wachttijd. Controleer nadien je resultaten met behulp van je grafische rekenmachine. Oplossing.

Controle met behulp van de grafische rekenmachine.

2 Het concept verwachtingswaarde werd voor het eerst expliciet behandeld door Pierre-Simon Laplace in 1814. De notatie E(X) gaat terug naar William Allen Whitworth 1901, als eerste letter van de Engelse term expected value. Ook op het vasteland werd de notatie E(X) aangenomen, met Duitse term Erwartungswert en Franse term espérance mathématique. Merk op dat de verwachtingswaarde niet noodzakelijk het gemiddelde is van alle waarden xi . Ook hoeft de verwachtingswaarde niet voor te komen als waarde van X, zie Modelvoorbeeld 2 (vervolg). De term variantie werd geı̈ntroduceerd door Ronald Fisher in 1918.

XIV-5


Rekenen met stochasten 3 Op ontdekking (vervolg). We hernemen het voorbeeld van Saartje dat gooit met twee eerlijke dobbelstenen en van haar vriend het totaal aantal ogen maal twintig euro krijgt. De bijbehorende stochast X heeft als kansverdeling X xi

pi

40

1/36

60

2/36

80

3/36

.. .

.. .

240

1/36 1

(a) De papa van Saartje vindt het gedoe met de dobbelstenen nogal flauw en geeft Saartje 71 euro, ongeacht de uitkomst van de worp. Ook dit kan beschreven worden in een stochast, met slechts eĚ eĚ n waarde (71). De geldsom die Saartje van Jeroen en papa samen krijgt kan nu beschreven worden met een nieuwe stochast, die we logischerwijze met X + 71 noteren. De kansverdeling van X + 71 ligt voor de hand: 71

X xi

pi

40

1/36

60

2/36

80

X + 71 xi + 71

pi

1

40 + 71

1/36

1

60 + 71

2/36

3/36

80 + 71

3/36

.. .

.. .

.. .

.. .

240

1/36

240 + 71

1/36

71

1

1

Wat vermoed je voor de verwachtingswaarde en de variantie van de geldsom die Saartje nu krijgt? Vul aan: E(X + 71) = . . .

en

Var(X + 71) = . . .

(b) De mama wil het toch wat spannend maken en heeft een nieuw voorstel: in plaats dat papa 71 euro geeft, krijgt Saartje de waarde van de hoogste dobbelsteen maal zestien euro. We associeren dit met een nieuwe stochast Y . De geldsom die Saartje van Jeroen en mama samen krijgt kan nu beschreven worden met een nieuwe stochast, die we logischerwijze met X + Y noteren. Maar ditmaal ligt de kansverdeling van X + Y helemaal niet voor de hand: . De waarden van X + Y : in principe zijn alle combinaties xi + yj mogelijk! . De kans van xi + yj : er bestaat geen regel om deze onmiddellijk uit de kansverdeling van X en Y af te leiden! Het vereist dus wat moeite om de kansverdeling van X + Y op te stellen (ga na): Y

X

X +Y

xi

pi

yj

qj

xi + yj

?

40

1/36

16

1/36

40 + 16

1/36

60

2/36

32

3/36

60 + 32

2/36

80

3/36

48

5/36

80 + 32

1/36

.. .

.. .

.. .

.. .

.. .

.. .

240

1/36

96

11/36

240 + 96

1/36

1

1

1

Wat vermoed je voor de verwachtingswaarde van de geldsom die Saartje nu krijgt? Vul aan: E(X + Y ) = . . . XIV-6


3 Definitie. Gegeven een (kans)experiment met uitkomstenverzameling Ω. Zij X, Y stochasten en a ∈ R. (a) De somstochast X + a is de stochast X +a:Ω→R

def

ω → (X + a)(ω) = X(ω) + a = xi + a Analoog definieert men de productstochast a · X.

(b) De somstochast X + Y is de stochast

X +Y :Ω→R

def

ω 7→ (X + Y )(ω) = X(ω) + Y (ω) = xi + yj Analoog definieert men de productstochast X · Y en de kwadraatstochast X 2 . In termen van de kansverdeling van een stochast kunnen we deze bewerkingen catalogeren onder:3 (1) eenvoudig af te leiden uit de oorspronkelijke stochasten: de nieuwe stochasten X + a, a · X en X 2 : X xi

a·X

X +a pi

xi + a

pi

axi

X2

pi

x2i

pi

x21 x22

p1 p2 .. .

x1 x2 .. .

p1 p2 .. .

x1 + a x2 + a .. .

p1 p2 .. .

ax1 ax2 .. .

p1 p2 .. .

xn

pn

xn + a

pn

axn

pn

.. . x2n

pn

(2) moeilijk af te leiden uit de oorspronkelijke stochasten: de nieuwe stochasten X + Y en X · Y :4 X

X ·Y

X +Y

Y

?

? ? .. .

xi · yj

x1 · y1 x1 · y2 .. .

? ? .. .

x2 + y1 x2 + y2 .. .

? ? .. .

x2 · y1 x2 · y2 .. .

? ? .. .

xn + ym

?

xn · ym

?

xi

pi

yi

qi

xi + yj

?

x1 x2 .. .

p1 p2 .. .

y1 y2 .. .

q1 q2 .. .

x1 + y1 x1 + y2 .. .

xn

pn

ym

qm

De verwachtingswaarde en variantie van som-en productstochasten voldoen aan heel wat eigenschappen. Enkele daarvan komen aan bod in de volgende 3 Op ontdekking (vervolg). We hernemen het voorbeeld van Saartje dat gooit met twee eerlijke dobbelstenen en van haar vriend het totaal aantal ogen maal twintig euro krijgt. (a) Bereken de verwachtingswaarde E(X) en de variantie Var(X). (b) Geef de kansverdeling van de nieuwe stochast X 2 en bereken E(X 2 ). 2

(c) Bereken E(X 2 ) − (E(X)) . Wat merk je op? Oplossing.

3 Bij onze schrijfwijze voor de kansverdeling van de somstochast X +Y kunnen dezelfde waarden meerdere keren voorkomen, bijvoorbeeld als x1 +y3 = x5 +y2 . In dat geval kan men de kansverdeling vereenvoudigen door de waarden die meerdere keren voorkomen slechts eenmaal te schrijven en de bijbehorende kansen op te tellen. Daarbij moet men dan wel realiseren dat kansen zoals P (X + Y = 3), P (X + Y = 1 + 2) en P (X + Y = 2 + 1) elk hun specifieke betekenis blijven behouden: P (X + Y = 1 + 2) hoeft niet gelijk te zijn aan P (X + Y = 2 + 1) en beide dragen bij tot P (X + Y = 3). Analoog voor de productstochast X · Y . 4 De bijbehorende kansen kunnen berekend worden door middel van voorwaardelijke kansen. Indien de stochasten onafhankelijk zijn, dan kunnen deze kansverdelingen wel eenvoudig uit de kansverdelingen van X en Y afgeleid worden, zie pagina 9.

XIV-7


3 Eigenschappen. Gegeven een experiment met uitkomstenverzameling Ω en kansmaat P . Voor discrete stochasten X en Y geldt (waarbij a ∈ R) 1. Var(X) = E (X − E(X))2 2

2. Var(X) = E(X 2 ) − (E(X))

3. E(X + a) = E(X) + a en Var(X + a) = Var(X) 4. E(a · X) = a · E(X) en Var(a · X) = a2 · Var(X)

5. E(X + Y ) = E(X) + E(Y )

Merk op dat we eigenschap 5 kunnen uitbreiden voor discrete stochasten X1 , X2 , . . . , Xn E(X1 + X2 + . . . + Xn ) = E(X1 ) + E(X2 ) + . . . + E(Xn ) Bewijs van 1 en 2.5

3 Modelvoorbeeld 3. In een bepaalde stadswijk valt gedurende een maand een aantal straatlantaarns uit. Dit aantal X volgt een bepaalde kansverdeling, gegeven in de volgende tabel. xi

0

1

2

3

4

5

P (X = xi )

0, 15

0, 25

0, 30

0, 15

0, 10

0, 05

Eenmaal per maand gaat de monteur op controlebezoek in de wijk en vervangt defecte lampen. De kosten van deze controletocht bedragen 50 euro en verder moet voor iedere vervangen lamp 10 euro worden betaald. (a) Bereken de verwachtingswaarde en de variantie van de stochast X. (b) Druk de stochast Y : rekening van de monteur uit in functie van de stochast X. (c) Hoe groot is het verwachte bedrag van de rekening van de monteur? En de variantie? Bepaal dit met behulp van het antwoord dat je vond op vragen (a) en (b). Oplossing.

5 Voor

de bewijzen van eigenschappen 3, 4 en 5 verwijzen we naar de oefeningen.

XIV-8

straatlantaarn te Brugge


Onafhankelijke stochasten 3 Op ontdekking. We gooien twee keer met een eerlijk muntstuk. De stochast X telt hoeveel keer we in het totaal kop gegooid hebben. Stochast Y heeft als uitkomst 0 indien we twee verschillende worpen hadden en 1 indien we twee keer hetzelfde gegooid hebben. (a) Stel de stochasten X en Y schematisch voor en bepaal hun kansverdeling. (b) Stel de stochast X + Y schematisch voor en bepaal de kansverdeling. Bedenk hierbij dat kansen als P (X + Y = 2 + 1) berekend kunnen worden als P (X = 2 en Y = 1). (c) Is P (X = 1 en Y = 1) = P (X = 1) · P (Y = 1)? Oplossing.

3 Definitie. Gegeven zijn twee discrete stochasten X en Y van een experiment met uitkomstenverzameling Ω en kansmaat P . Voor elke waarde xi ∈ ber(X) en yj ∈ ber(Y ) geldt P (X = xi en Y = yj ) = P (X −1 (xi ) ∩ Y −1 (yj )) = P (X −1 (xi )) · P (Y −1 (yj ))

indien de gebeurtenissen X −1 (xi ) en Y −1 (yj ) onafhankelijk zijn

= P (X = xi ) · P (Y = yj ) Met andere woorden, als de kans op het al dan niet optreden van een waarde xi niet afhangt van het al dan niet optreden van een waarde van yj , dan is P (X = xi en Y = yj ) = P (X = xi ) · P (Y = yj ) Indien dit waar is voor alle waarden xi van X en alle waarden yj van Y , dan zeggen we dat de stochasten X en Y onafhankelijk zijn. 3 Eigenschappen (vervolg). Gegeven een experiment met uitkomstenverzameling Ω en kansmaat P . Voor discrete onafhankelijke stochasten X en Y geldt 6. E(X · Y ) = E(X) · E(Y )

7. Var(X + Y ) = Var(X) + Var(Y ) Merk op dat we eigenschap 7 kunnen uitbreiden voor discrete onderling onafhankelijke stochasten X1 , X2 , . . . , Xn Var(X1 + X2 + . . . + Xn ) = Var(X1 ) + Var(X2 ) + . . . + Var(Xn ) Bewijs. 6. Uitschrijven van de kansverdelingen van de stochasten X, Y en X · Y levert alvast X

X ·Y

Y

xi · yj

xi

pi

yi

qi

x1 x2 .. .

p1 p2 .. .

y1 y2 .. .

q1 q2 .. .

x1 · y1 x1 · y2 .. .

? ? .. .

xn

pn

ym

qm

xn · ym

?

XIV-9

?


Omdat X en Y onafhankelijk zijn, is ! P (X · Y = xi · yj ) = P (X = xi en Y = yj ) = P (X = xi ) · P (Y = yj ) = pi qj Op die manier kennen we de kansverdeling van de stochast X · Y X

X ·Y

Y

xi

pi

yi

qi

x1 x2 .. .

p1 p2 .. .

y1 y2 .. .

q1 q2 .. .

xn

pn

ym

qm

xi · yj

pi qj

x1 · y1 x1 · y2 .. .

p1 q1 p1 q2 .. .

x2 · y1 x2 · y2 .. .

p2 q1 p2 q2 .. .

xn · ym

pn qm

en hieruit volgt de laatste gelijkheid in de volgende berekening: ! ! X X E(X) · E(Y ) = pi xi · q j yj i

j

= (p1 x1 + p2 x2 + . . . + pn xn ) · (q1 y1 + q2 y2 + . . . + qm ym ) = p1 q1 x1 y1 + p1 q2 x1 y2 + . . . + pn qm xn ym X = pi qj xi yj i,j

= E(X · Y )

7. We berekenen (vul telkens de verantwoording aan) Var(X + Y ) = E (X + Y − E(X + Y ))2

wegens . . .

(X + Y − E(X + Y ))2

= (X − E(X) + Y − E(Y ))2

= (X − E(X))2 + 2(X − E(X)) · (Y − E(Y )) + (Y − E(Y ))2 = E (X − E(X))2 + 2(X − E(X)) · (Y − E(Y )) + (Y − E(Y ))2 = E (X − E(X))2 + E [2(X − E(X)) · (Y − E(Y ))] + E (Y − E(Y ))2 wegens . . . E [2(X − E(X)) · (Y − E(Y ))] 2E [(X − E(X)) · (Y − E(Y ))]

wegens. . .

= 2E [X − E(X)] · E [Y − E(Y )] Å ã Å ã = 2 E(X) − E [E(X)] · E(Y ) − E [E(Y )]

want. . .

= 2 (E(X) − E(X))) · (E(Y ) − E(Y )))

want. . .

wegens. . .

=0 = E (X − E(X))2 + E (Y − E(Y ))2 = Var(X) + Var(Y )

XIV-10

wegens . . .


Toepassing 1 - De Sint-Petersburg-paradox 3 Probleem. Veronderstel dat je met een eerlijk muntstuk een spel kop-of-munt speelt. Dus bij iedere worp zijn de kansen op kop en op munt gelijk aan 50%. Als er bij de eerste worp een kop valt, krijg je 2 euro. Als er bij de tweede worp voor de eerste maal kop verschijnt, dan ontvang je 2 × 2 euro = 4 euro. Valt kop voor de eerste maal bij de derde worp, dan ontvang je 2 × 2 × 2 euro = 8 euro. Valt kop voor het eerst bij de n-de worp, dan ontvang je 2n euro. Hoeveel inzet ben je bereid om te betalen voor een deelname aan dit spel? Oplossing. We stellen de stochast X het aantal uit te betalen euro’s schematisch voor en bepalen de kansverdeling:

Peterhof, Sint-Petersburg

Voor de verwachtingswaarde geldt dus (vul aan): X E(X) = pi · xi = pX (2) · 2 + pX (4) · 4 + pX (8) · 8 + pX (16) · 16 + . . . i

= ... = ...

Deze reeks divergeert naar +∞. Dit betekent dat de verwachte opbrengst van dit spel oneindig groot is! Antwoord. Ongeacht hoe hoog de inzet is bij deelname aan dit spel, verwacht men bij herhaaldelijk spelen dat de totale winst de totale inzet zal overtreffen, als men maar voldoende aantal keer het spel herhaalt. Een resultaat dat gevoelsmatig niet lijkt te kloppen, omdat het in strijd is met onze intuı̈tie.6 3 Opheffen van de paradox. De meestgebruikte benadering om deze paradox op te heffen gebeurt aan de hand van de economische nutstheorie. De naı̈eve strategie om de verwachte opbrengst te maximaliseren, wordt vervangen door de strategie om het verwachte nut te maximaliseren. Het achterliggende idee is de wet van de afnemende meeropbrengsten (ook wel grensnut genoemd). Deze wet zegt dat een twee keer zo’n hoge opbrengst niet overeenkomt met een twee keer zo hoog nut. Zo is het winnen van twee miljoen euro minder dan twee keer zo nuttig als het winnen van één miljoen euro. Introduceren we als nutsfunctie bijvoorbeeld u(x) = C · 2 log x

waarbij C ∈ R+ 0

dan is het verwachte nut van het spel gelijk aan EU (X) =

X i

X X C · 2 log 2i−1 i−1 = C· = C < +∞ pi u(xi ) = i 2 2i i i

Het verwachte nut is dus eindig en afhankelijk van de constante C die gekozen wordt. Is deze constante C groter dan het nut van de inlegging, dan verhoogt men zijn nut door het spel te spelen. De grootte van C hangt, onder andere, af van de rijkdom van de speler: voor een arm iemand zal een winst van 1000 euro van veel hoger nut zijn, dan voor een miljonair. Een alternatief om de paradox op te heffen steunt op het idee dat mensen zeer zeldzame gebeurtenissen zullen negeren. In deze paradox is de verwachte opbrengst oneindig groot, juist door zulke zeer zeldzame gebeurtenissen. Dan geven we bij de berekening van de verwachte opbrengst de zeldzame gebeurtenissen, bijvoorbeeld met een kans kleiner dan een op duizend, kans nul. Door deze aanpassing wordt de verwachte opbrengst 4, 50 euro, een stuk lager dus. Wanneer de grens bij een op een miljoen gelegd wordt, is de verwachte opbrengst 9, 50 euro. 6 Deze paradox kreeg grote bekendheid door Daniel Bernoulli en draagt de naam van de plaats waar hij deze voorgedragen heeft. De paradox is in 1738 gepubliceerd door de Keizerlijke Academie der Wetenschappen te Sint-Petersburg. De paradox is echter al 25 jaar eerder, in 1713 beschreven door Daniels neef Nicolaus I Bernoulli in een serie brieven aan Pierre Raymond de Montmort . Het idee om de paradox op te heffen met behulp van een logaritmische nutsfunctie komt van D. Bernoulli, het alternatief waarin men zeer zeldzame gebeurtenissen kans nul toekent is toe te schrijven aan N. Bernoulli. Deze aanpak is later bekritiseerd omdat de meeste mensen de kans op zeldzame (maar niet onmogelijke) gebeurtenissen juist overschatten, in plaats van onderschatten. Getuige de populariteit van kansspelen zoals de lotto.

XIV-11


Toepassing 2 - Wet van de grote aantallen De wet van de grote aantallen vormt de basis voor onze intuı̈tieve opvatting van het begrip kans, namelijk dat de relatieve frequentie van een gebeurtenis op de lange duur naar een limiet lijkt te convergeren (zie Deel Kansrekenen 1). Zo zien we dat bij herhaaldelijk werpen met een eerlijke dobbelsteen de relatieve frequentie van de worp 6 op de lange duur dicht in de buurt van de waarde 1/6 komt te liggen. Het begrip stochast laat ons toe om deze wet in termen van verwachtingswaarde en variantie te formuleren. We starten met een 3 Op ontdekking. Een zak nootjes weegt gemiddeld 300 gram en heeft een variantie van 100 vierkante gram. Men verpakt deze zakken per 25 in een kartonnen doos. (a) Noem Xi de stochast die hoort bij het gewicht van het i-de zakje. Bepaal het gemiddelde en de variantie van Xi . (b) Noem Y de stochast die hoort bij het gewicht van een doos. Bereken het gemiddelde en de variantie van Y . (c) Noem Z de stochast die hoort bij het gewicht van een gemiddeld zakje in een doos. Men noteert Z als X. Bereken het gemiddelde en de variantie van X. (d) Stel men verpakt de zakken nootjes per n = 50 in een doos. Wat is E(X) en Var(X) dan? En wat als n = 100? Oplossing.

3 Stelling (wet van de grote aantallen).7 Gegeven zijn discrete stochasten X1 , X2 , . . . , Xn , onderling onafhankelijk en met dezelfde verwachtingswaarde µ en variantie σ 2 . def 1 Beschouw de gemiddelde stochast X = (X1 + X2 + . . . + Xn ). Dan geldt n E(X) = µ

en

Var(X) =

σ2 n

√ Deze formules drukken uit dat de gemiddelde stochast rond µ is concentreerd, met een spreiding van σX = σ/ n. Naarmate n toeneemt zal σX naderen naar nul, zodat de stochast X zich meer en meer in de omgeving van µ ophoopt. De wet van de grote aantallen volgt uit de zogenaamde centrale limietstelling, een meer algemeen resultaat dat wij in hoofdstuk 2 zullen behandelen. 3 Voorbeeld. We gooien n keer een eerlijk muntstuk op. Noem Xi de stochast die bij de i-de worp de waarde 0 bij kop heeft en waarde 1 bij munt. De stochasten X1 , X2 , . . . , Xn zijn duidelijk onafhankelijk van elkaar en hebben elk verwachtingwaarde µ = 0, 5. Volgens de wet van de grote aantallen is E(X) = µ = 0, 5 Eigenlijk stelt de stochast X het gemiddeld aantal keren munt voor. Zo kunnen we verwachten dat de relatieve frequentie van munt f in functie van n (het aantal keer dat we gegooid hebben) zal evolueren naar 0, 5. Op die manier levert de limietwaarde van deze relatieve frequentie de theoretische kans op munt, namelijk P (M ) = lim f = 0, 5.

Experiment: relatieve frequentie van munt f in functie van het aantal worpen n ≤ 100.

n→+∞

7 In

de literatuur maakt men onderscheid tussen de experimentele, zwakke en sterke wet van de grote aantallen. De formulering die wij hier gebruiken is zwakker dan deze vormen, maar volstaat voor onze doeleinden. De eerste bekende vermelding van deze wetmatigheid werd opgetekend door Jakob Bernoulli 1713. Na hem heeft Siméon Denis Poisson de wetten verder uitgewerkt.

XIV-12


1.2

Continue stochasten

3 Op ontdekking. Saartje schiet een pijl af naar een schietschijf. Daarna meet haar vriend de afstand van de pijl tot de roos (het middelpunt van de schijf). In deze context is . Experiment: Saartje schiet een pijl af naar een schietschijf. Uitkomstenverzameling (noem r de straal van de schietschijf):8 Ω = {(x, y) ∈ R2 | x2 + y 2 ≤ r2 }

schietschijf

. Stochast X: afstand van de pijl tot de roos. Schematisch:

Het bereik van de stochast X is ber(X) = [0, r]. In dit geval kunnen we de waarden van de stochast niet opsommen in een rij.9 Daarom noemen we de stochast X continu. (a) Wat is de kans dat de pijl precies op afstand r1 van de roos komt? (b) Wat is de kans dat de pijl op een afstand tussen r1 en r2 van de roos komt? Oplossing. (a) Hiervoor moeten we de kans P (X = r1 ) berekenen. Dit is echter een onzinnige vraag. Immers, mocht P (X = r1 ) 6= 0 dan zou P (0 ≤ X ≤ r) = +∞! We weten echter dat P (0 ≤ X ≤ r) = 1. Daarom stelt men per definitie def P (X = r1 ) = 0 (b) Hiervoor moeten we de kans P (r1 ≤ X ≤ r2 ) berekenen. Welnu, P (r1 ≤ X ≤ r2 ) = . . .

Men noemt de functie fX (x) = 2x/r2 de kansdichtheidsfunctie voor de stochast X. We hebben de eigenschap dat Z r2

P (r1 ≤ X ≤ r2 ) =

fX (x) dx

r1

Zo is bijvoorbeeld P (0 ≤ X ≤ r) = . . . 8 We nemen aan dat Saartje voldoende bedreven is in de boogschutterskunst, zodat haar pijl altijd in de schijf landt. Stilzwijgend nemen we ook aan dat Saartje mikt naar de schijf, maar niet naar de roos. Bijgevolg is de kans dat de pijl in een bepaald gebied van de schietschijf landt in verhouding met de oppervlakte van dat gebied. 9 Een verzameling waarbij het niet mogelijk is om alle elementen op te sommen in een rij noemt men niet-aftelbaar of overaftelbaar. Dus een stochast is continu als de verzameling ber(X) overaftelbaar is. Voorbeelden van overaftelbare verzamelingen zijn R en C, alsook elk interval van de vorm [a, b] met a < b. Een verzameling die een overaftelbare verzameling bevat, is op zijn beurt overaftelbaar.

XIV-13


3 Definitie (continue stochast). Gegeven een (kans)experiment met uitkomstenverzameling Ω. Een stochast X is continu als men de waarden van de stochast niet kan opsommen in een rij. In het vervolg nemen we aan dat het bereik van een continue stochast steeds een gesloten interval is: ber(X) = [a, b] In dat geval noteren we een willekeurig deelinterval van het bereik als [x1 , x2 ]. Voor een kansmaat P van het experiment is de kansdichtheidsfunctie van een continue stochast X een functie fX : [a, b] → R

x 7→ fX (x)

die voldoet aan de volgende voorwaarden:10 1. f is continu over [a, b] 2. ∀x ∈ [a, b] : fX (x) ≥ 0 3. ∀x1 , x2 ∈ [a, b] : P (x1 ≤ X ≤ x2 ) =

Z

x2

fX (x) dx

x1

Rb Merk op dat a fX (x) dx = 1. Een continue stochast X kunnen we als volgt schematiseren (linkerfiguur), waarbij kansen berekend worden met behulp van kansdichtheidsfunctie fX van de stochast X (rechterfiguur):

Ω P

P (x1 ≤ X ≤ x2 ) = opp. Z x2 fX (x) dx =

y y = fX (x)

x1

X

a

x1

x2

R

b

a

x1

x2

b

x

We werken twee modelvoorbeelden uit. 3 Modelvoorbeeld 1. Julia heeft een afspraakje met Romeo die, zoals het een trouwe minnaar past, hoogstens 15 minuten te laat komt. De grafiek van de kansdichtheidsfunctie is een dalende rechte (zie figuur). (a) Bepaal het voorschrift van de kansdichtheidsfunctie. (b) Wat is de kans dat Romeo minder dan 3 minuten te laat is?

y a

y = fX (x)

Oplossing.

15

x

Om in voorgaand voorbeeld de verwachtingswaarde E(X) te bepalen, benaderen we de grafiek van de kansdichtheidsfunctie fX door het kanshistogram van een discrete stochast. Dan is de verwachtingswaarde van deze discrete stochast gelijk aan (duid aan op bovenstaande figuur) X X X pi xi = xi · P (xi−1 ≤ X ≤ xi ) = xi · fX (xi )∆xi i

i

i

zodat na limietovergang de verwachtingswaarde van X gelijk is aan (vul aan) Z 15 E(X) = x · fX (x) dx = . . . 0

Met de notatie P (x1 ≤ X ≤ x2 ) bedoelen we P X −1 ([x1 , x2 ]) = P (ω | x1 ≤ X(ω) ≤ x2 ). In de praktijk gaat men op zoek naar de geschikte kansdichtheidsfunctie fX . De kunst bestaat er dan in om een functie te construeren die voldoet aan deze drie voorwaarden. 10

XIV-14


3 Definitie. Gegeven een experiment met uitkomstenverzameling Ω en kansmaat P . De verwachtingswaarde (of gemiddelde) van een continue stochast X met bereik ber(X) = [a, b] gelijk aan def

µX = E(X) =

Z

a

en de variantie is gelijk aan def

2 = Var(X) = σX

De standaardafwijking is σX =

p

Z

a

b

x · fX (x) dx

b

(x − µX )2 · fX (x) dx

Var(X).

Men kan aantonen dat de eigenschappen op pagina’s 8-9 ook gelden ook voor continue stochasten. 3 Eigenschappen. Gegeven een experiment met uitkomstenverzameling Ω en kansmaat P . Voor continue stochasten X en Y geldt (waarbij a ∈ R): 1. Var(X) = E (X − E(X))2 2

2. Var(X) = E(X 2 ) − (E(X))

3. E(X + a) = E(X) + a en Var(X + a) = Var(X) 4. E(a · X) = a · E(X) en Var(a · X) = a2 · Var(X)

5. E(X + Y ) = E(X) + E(Y )

Zijn de stochasten X en Y onafhankelijk, dan geldt bovendien:11 6. E(X · Y ) = E(X) · E(Y )

7. Var(X + Y ) = Var(X) + Var(Y ) 3 Modelvoorbeeld 2. Een telefooncentrale is een installatie waarmee het mogelijk is telefoontoestellen zo te verbinden dat een gesprek mogelijk wordt. Noem X de stochast die het tijdsverloop tussen het ontvangen van een oproep in de telefooncentrale en het tot stand komen van de verbinding. Onderzoek heeft uitgewezen dat de kansdichtheidsfunctie voor de stochast X in een bepaalde centrale tijdens de daltijden gegeven wordt door fX (x) =

3 −3 x e 2 2

telefooncentrale (1967)

waarbij x uitgedrukt wordt in seconden. (a) Ga na dat P (X ≥ 0) = 1. Noteer je werkwijze.

(b) Bereken de kans dat men, bij het tot stand brengen van de verbinding, hoogstens twee seconden moet wachten. (c) Bereken de verwachtingswaarde en de variantie van de stochast. (d) Door een technologische verbetering wordt de wachttijd ingekort met factor 3. Bereken de nieuwe verwachtingswaarde en variantie. Oplossing.

11 Onafhankelijkheid van continue stochasten wordt op een analoge manier ingevoerd als de onafhankelijkheid van discrete stochasten. De formele definitie valt buiten het bestek van deze cursus.

XIV-15


Oefeningen 1 Stochasten

Basis

Verdieping

1.1 Discrete stochasten

1 2 3

4 5 6 7

8 9 10

3 11

1.2 Continue stochasten

17 18

19

20

21 22

12 13

Uitbreiding

14

23

15

16

24

25

Oefeningen bij §1.1 B

Oefening 1. Een panel van tien wijnexperts voor een tijdschrift over wijn wordt gevraagd een nieuwe witte wijn te proeven en deze een cijfer van 0, 1, 2 of 3 toe te kennen. Er wordt dan een score verkregen door de cijfers van de tien experts bij elkaar op te tellen. Bepaal het bereik van deze stochastische variabele.

B

Oefening 2. Een brik melk bevat gemiddeld 1 liter en heeft een variantie van 5 vierkante centiliter. Men verpakt deze brikken per 12 in een kartonnen doos. Bepaal de verwachtingswaarde en de variantie van de inhoud van een gemiddelde brik melk in zo’n doos. Oefening 3. Onderzoekers onderzochten langdurige droogteperiodes in een bepaald gebied. Als we de stochast X definiëren als het aantal jaren dat het duurt tot de volgende langdurige droogte, dan wordt de kansverdeling van X vastgelegd door de formule pX (x) = (0, 3)(0, 7)x−1 waarbij x = 1, 2, 3, . . . B V

(a) Bepaal P (X = 3) en P (X ≤ 3). P (b) Bewijs dat i pi = 1.

B?

Oefening 4. In het casino van Knokke wordt een gokspel gespeeld. Je werpt met een dobbelsteen. Is het aantal ogen oneven, krijg je 2 euro. Is het aantal ogen 2 of 4, dan krijg je 3, 5 euro. Is het aantal ogen 6, dan krijg je 5 euro. Om deel te nemen aan het spel betaal je 3 euro. Is dit spel verlieslatend of winstgevend voor de speler? Verklaar aan de hand van een berekening.

B?

Oefening 5. Een munstuk wordt net zo vaak opgeworpen tot er kop verschijnt, of tot er drie keer na elkaar munt verschijnt. Bepaal de verwachtingswaarde en de variantie van het aantal worpen.

B?

Oefening 6. Roulette is een gokspel dat men in casino’s speelt. De Amerikaanse variant double zero roulette telt 38 vakjes (de getallen van zero 0 tot en met 36 en double zero 00). Twee vakjes hebben een groene kleur (zero 0 en double zero 00), de overige even getallen zijn rood en de oneven getallen zijn zwart. Een speler kiest voor de inzetmogelijkheid straight up als hij op één nummer inzet (inclusief zero en double zero). Komt het nummer uit, dan wint de speler. Hij mag het ingezette fiche houden en ontvangt 35 fiches van de bank. Verliest de speler, dan is hij de ingezette fiche kwijt. Stel een speler zet 100 euro op één nummer in. Bereken de verwachte winst voor de speler.

B?

Oefening 7. Een verzekeringsmaatschappij verkoopt aan verzekerden met een bepaald profiel een levensverzekeringspolis van 10 000 euro met een looptijd van één jaar, voor een jaarpremie van 290 euro. Dit betekent: als de verzekerde binnen het jaar sterft, ontvangen de nabestaanden 10 000 euro en de kostprijs van de polis bedraagt 290 euro. Volgens de actuariële tabellen is de kans dat een persoon die de leeftijd, het geslacht, de gezondheid enzovoort van het profiel heeft, binnen een jaar sterft, gelijk aan 0, 1%. Wat is de verwachte winst (het bedrag dat door de verzekeringsmaatschappij wordt verdiend) voor een polis van dit type? Verklaar aan de hand van een berekening.

B??

Oefening 8. In het casino kun je het spel Gooi je rijk spelen. Hierbij gooit de speler met een dobbelsteen en ontvangt evenveel euro als de dobbelsteen aangeeft. Beschouw als stochast de winst van de speler. (a) Stel de stochast schematisch voor. (b) Geef de kansverdeling en teken het kanshistogram. (c) Hoe groot moet de inzet van een speler zijn om zeker te zijn dat het casino op lange termijn geen verlies lijdt met dit spel? Verklaar met een berekening.

XIV-16


B??

Oefening 9. Op weg naar school komt Saartje voorbij drie verkeerslichten. Jarenlang noteerde zij hoe vaak elk licht op rood stond. Zij kwam tot de volgende conclusies. . Licht A: 50% kans op rood. . Licht B: 30% kans op rood. . Licht C: 10% kans op rood. Noem X de stochast aantal keer dat Saartje op weg naar school moet stoppen. (a) Stel de stochast X schematisch voor. (b) Geef de kansverdeling en teken het kanshistogram. (c) Hoe vaak zal Saartje gemiddeld moeten stoppen?

B??

Oefening 10. We gooien twee keer met een dobbelsteen. De stochast X geeft de waarde van de hoogste worp, de stochast Y de waarde van de laagste worp. (a) Stel de stochasten X, Y en X + Y schematisch voor. (b) Bepaal de kansverdeling van de stochasten X, Y en X + Y . (c) Is E(X + Y ) = E(X) + E(Y )? Verklaar. (d) Is Var(X + Y ) = Var(X) + Var(Y )? Verklaar.

V

Oefening 11. Saartje is net 18 jaar en rijdt met een klassebak. Zij wil haar auto verzekeren voor 12 500 euro. De verzekeringsmaatschappij heeft nagetrokken dat bij dit type auto en leeftijd van de verzekerde de kans op een total loss 0, 2% is, de kans op 6250 euro vergoeding 1% is en de kans op 3125 euro kosten gelijk is aan 10%. Welke premie moet de maatschappij vragen om gemiddeld 25% winst te maken per verzekerde?

V?

Oefening 12. Een vliegtuigmaatschappij huurt 40 plaatsen bij SN Brussels Airlines voor zakenvluchten op Barcelona. Er wordt zoals steeds aan overboeking gedaan: men schrijft tot 42 reizigers in. De kans dat een klant die boekt de zakenreis effectief meevliegt wordt geschat op 90%. Bepaal de kansverdeling van de stochast die het aantal reizigers telt die effectief meevliegen. Bereken ook de verwachtingswaarde van deze stochast.

V?

Oefening 13. Een computerspel in een lunapark werkt als volgt. Jij moet op een witte of een zwarte knop drukken. Onafhankelijk van jouw keuze selecteert de computer ook wit of zwart. Indien beide kleuren wit zijn, win jij één jeton. Zijn beide kleuren zwart, dan win jij drie jetons. Maar als beide kleuren verschillend zijn dan verlies jij twee jetons aan de machine. Het computerprogramma is zo ingesteld dat de kans op het weergeven van wit door de computer een getal a is. (a) Geef de kansverdeling van de stochast X die staat voor jouw winst.

gokautomaat

(b) Bereken de gemiddelde winst (in functie van de constante a). (c) Toon aan dat men de waarde van a zo kan instellen dat jij op lange termijn verliest. V??

Oefening 14. In Nigeria is zowat 1 − p = 5% van de bevolking seropositief. Om de kostprijs te drukken, mengt men het bloed van b personen (met b ∈ N0 ) en voert men daarop de test uit. Is de test negatief, dan weet men dat geen van de b personen seropositief is. Is de test positief, dan moet men nadien de b stalen afzonderlijk testen. (a) Neem b = 10. Is deze werkwijze kostenbesparend? Verklaar met een berekening. (b) Bepaal algebraı̈sch de waarde van b waarvoor de nieuwe werkwijze het meest kostenbesparend is. (c) Bepaal algebraı̈sch alle waarden van p waarvoor de nieuwe werkwijze in vergelijking met de klassieke manier ook daadwerkelijk kostenbesparend is.

U?

Oefening 15 (eigenschappen van verwachtingswaarde en variantie van discrete stochasten). Gegeven een experiment met uitkomstenverzameling Ω en kansmaat P . Bewijs voor discrete stochasten X en Y de volgende eigenschappen vermeld op pagina 8 (waarbij a ∈ R). 3. E(X + a) = E(X) + a en Var(X + a) = Var(X) 4. E(a · X) = a · E(X) en Var(a · X) = a2 · Var(X) 5. E(X + Y ) = E(X) + E(Y ) XIV-17


U??

Oefening 16 (kansverdelingsfunctie van een discrete stochast). Gegeven een experiment met uitkomstenverzameling Ω en kansmaat P . Voor een (discrete) stochast X definieert men de kansverdelingsfunctie (of distributiefunctie) van X als de (reële) functie FX : R → R def x 7→ FX (x) = P (X ≤ x). (a) Beschouw het experiment eenmaal gooien met een eerlijke dobbelsteen en de stochast X aantal ogen maal tien euro. Schets de grafiek van de kansverdelingsfunctie van X. (b) Beschouw het experiment driemaal gooien met een eerlijk muntstuk en de stochast X aantal keer kop. Schets de grafiek van de kansverdelingsfunctie van X. (c) Bewijs dat de kansverdelingsfuncie van een willekeurige stochast X een niet-dalende functie is, dat wil zeggen FX (x1 ) ≤ FX (x2 ) voor elke x1 , x2 ∈ R met x1 ≤ x2 .

(d) Bewijs dat voor elke a, b ∈ R met a ≤ b geldt: P (a < X ≤ b) = FX (b) − FX (a).

Oefeningen bij §1.2 B

Oefening 17. Geef bij elke stochastische variabele aan of deze discreet of continu is en bepaal telkens het bereik. (a) De tijdsduur tussen het binnenkomen van twee opeenvolgende patiënten in een ziekenhuis. (b) Het aantal intekeningen bij een uitgifte van obligaties. (c) Het aantal consumenten in een steekproef van 500 dat de voorkeur geeft aan een bepaald product boven de concurrerende producten. (d) De hoeveelheid frisdrank die in een blikje van 0, 33 l terechtkomt bij het vullen van het blikje. (e) De diepte waarop een succesvolle olieboring voor het eerst olie aanboort (noem c de maximaal haalbare diepte).

B

Oefening 18. Gegeven is de functie f : [−2, 1] → R

B?

  

1 2 x+ als x ∈ [−2, 0] 3 3 x 7→ f (x) =   − 2 x + 2 als x ∈ ]0, 1] . 3 3 (a) Ga na dat f de kansdichtheidsfunctie van een continue stochast X voorstelt. Å ã 1 (b) Bereken P −1 ≤ X ≤ . 2 Oefening 19. Een continue stochast X heeft als kansdichtheidsfunctie 3 (2x − x2 ). 4 (a) Maak een grafische voorstelling van de kansdichtheidsfunctie fX . fX : [0, 2] → R : x 7→

(b) Toon aan dat P (X ≥ 0) = 1. (c) Bereken de kansen P (0, 5 < X < 1, 5), P (X > 1, 2) en P (X = 0, 4). (d) Bepaal de verwachtingswaarde µ en de standaardafwijking σ. B??

Oefening 20. Je grafische rekenmachine genereert een willekeurig reëel getal tussen 0 en 1 via het commando rand.12

MATH

PROB

1:rand

(a) Genereer met behulp van dit commando een willekeurig reëel getal tussen 100 en 200. (b) Noem X de stochast die de waarde uit (a) weergeeft. Geef het functievoorschrift en de grafiek van de kansdichtheidsfunctie. (c) Hoe groot is de kans dat het getal uit (a) kleiner dan 178 is? Toon aan met behulp van stochasten. (d) Bereken de verwachtingswaarde en de standaardafwijking van de stochast uit (a). 12 Om je at random generator te personaliseren, ga je als volgt te werk: tik je gsm-nummer in (9 of 10 opeenvolgende cijfers), dan sto, MATH, PROB, 1:rand, ENTER. Opgelet: dit mag je slechts één keer uitvoeren.

XIV-18


V

Oefening 21. Bepaal algebraı̈sch de exacte waarde van de constante c ∈ R waarvoor de functie ï ò 1 1 f: − , →R 2 2 c x 7→ √ 1 − x2 kan geı̈nterpreteerd worden als de kansdichtheidsfunctie van een continue stochast X.

V

Oefening 22. Bepaal algebraı̈sch de waarde(n) van de constante c ∈ R waarvoor de functie f : [0, +∞[ → R

x 7→ ce−cx

kan geı̈nterpreteerd worden als de kansdichtheidsfunctie van een continue stochast X.

U

Oefening 23 (kansverdelingsfunctie van een continue stochast). Gegeven een experiment met uitkomstenverzameling Ω en kansmaat P . Voor een (continue) stochast X definieert men de kansverdelingsfunctie (of distributiefunctie) van X als de (reële) functie FX : R → R

def

x 7→ FX (x) = P (X ≤ x). (a) Julia heeft een afspraakje met Romeo die, zoals het een trouwe minnaar past, hoogstens 15 minuten te laat komt. De kansdichtheidsfunctie heeft als voorschrift fX (x) = −

2 2 x+ . 225 15

Geef het functievoorschrift van de kansverdelingsfunctie FX . (b) Bewijs dat de kansverdelingsfuncie van een willekeurige stochast X een niet-dalende functie is, dat wil zeggen FX (x1 ) ≤ FX (x2 ) voor elke x1 , x2 ∈ R met x1 ≤ x2 . (c) Bewijs dat voor elke a, b ∈ R met a ≤ b geldt: P (a ≤ X ≤ b) = FX (b) − FX (a). U?

Oefening 24 (passingsproblemen). Een typische toepassing van verschilvariabelen treffen we aan bij de zogenaamde passingsproblemen, die men oplost met de verschilstochast X − Y . Een ring moet passen om een staaf, dat wil zeggen: de binnendiameter van de ring moet groter zijn dan de diameter van de staaf. Bij de productie van de ringen hangt de precieze waarde van de binnendiameter X van het toeval af. Bij de productie van de staven hangt de precieze diameter van de staaf Y ook van het toeval af; zowel X als Y zijn stochastische variabelen. De waarden van X en Y worden uitgedrukt in millimeter. De ring past om de staaf als X groter is dan Y , of anders gezegd: als X − Y positief is. Er is gegeven dat E(X) = 45, Var(X) = 0, 3 en E(Y ) = 44, Var(Y ) = 0, 4. Bovendien worden de ring en de staaf onafhankelijk van elkaar gemaakt. (a) Bepaal de verwachtingswaarde en de standaardafwijking van de verschilstochast X − Y . (b) Men beslist om de ring met factor 1, 2 en de staaf met factor 1, 15 groter te maken. Bepaal de nieuwe verwachtingswaarde en standaardafwijking van de nieuwe verschilstochast.

U??

Oefening 25 (eigenschappen van verwachtingswaarde en variantie van continue stochasten). Gegeven een experiment met uitkomstenverzameling Ω en kansmaat P . Bewijs voor continue stochasten X en Y de volgende eigenschappen vermeld op pagina 8 (waarbij a ∈ R). 1. Var(X) = E (X − E(X))2 2. Var(X) = E(X 2 ) − (E(X))

2

3. E(X + a) = E(X) + a en Var(X + a) = Var(X) 4. E(a · X) = a · E(X) en Var(a · X) = a2 · Var(X)

XIV-19


Inzicht in psychologie Pathologisch gokken, beter bekend als gokverslaving, is een psychiatrische stoornis die in het DSM is ingedeeld bij de stoornissen in de impulsbeheersing. Wie aan deze aandoening lijdt, kan geen weerstand bieden aan de drang om te gokken en vertoont een dwangmatig gedrag.13 Een typisch symptoom van aanhoudend en herhaaldelijk problematisch gokgedrag is het stelselmatig verhogen van de inzet. Dat kan het gevolg zijn van een bewuste strategie om alle voorgaande verliezen in één klap te compenseren. In de kansrekening staat zo’n strategie bekend als een martingaal: de speler verhoogt na elke nederlaag zijn inzet zodanig, dat hij bij de eerste winst alle vorige verliezen recupereert. Het begrip stochast geeft inzicht in de werking van zo’n matingaal. 3 Voorbeeld. Een beroepsgokker heeft als motto verdubbel je inzet tot je wint en stop dan. Concreet trekt hij elke avond naar het casino met 700 euro op zak. Bij de eerste worp (met een eerlijke munt) zet hij 100 euro in op kop en stopt als hij wint. Als hij verliest, zet hij bij de tweede worp 200 euro in op kop en stopt als hij wint. Als hij opnieuw verliest, zet hij zijn laatste 400 euro in op kop bij de derde worp. Als hij wint, is de uitbetaling gelijk aan het dubbele van zijn inzet. In deze context is: . Experiment: gooien met een muntstuk tot er kop verschijnt, of tot er drie keer na elkaar munt verschijnt. Uitkomstenverzameling: Ω = {K, MK, MMK, MMM} . Stochast X: (netto) winst voor de beroepsgokker. Om in te zien wat de waarden van de stochast zijn, gaan we bij elke uitkomst na wat de (netto) winst voor de speler is. Dat kan bijvoorbeeld met onderstaande tabel: uitkomst

K

MK

MMK

MMM

inzet

100

100 + 200

100 + 200 + 400

100 + 200 + 400

uitbetaald

200

0 + 400

0 + 0 + 800

0+0+0

netto winst

100

100

100

−700

Schematisch voorstellen van de stochast X en kansverdeling:

X

P

MMK MK K

p(100) = P ({K, MK, MMK}) = 1/2 + 1/4 + 1/8

pi

−700 1/8 100

pX

X

xi

7/8 1

−700

R

100

Verwachtingswaarde: E(X) =

X

pi xi =

i

7 1 · (−100) + 700 = 0 8 8

We besluiten dat deze strategie op lange termijn winstgevend noch verlieslatend is. Als gokstrategie is een martingaal een omgekeerde verzekeringspolis: de gokker heeft een grote kans om over de hele avond lichtjes positief te eindigen en daarnaast een kleine kans om compleet failliet te gaan. Deze strategie wordt vaak gepresenteerd als een ijzersterke truc waarmee men altijd zou winnen. Het vereist echter met iedere inzetronde tenminste een verdubbeling van de vorige inzet om eerdere verliezen te compenseren. Een martingaalspeler zal derhalve een lange adem en een flinke portemonnee moeten meenemen, want bij inzet van 1 euro bedraagt de inzet na 10 keer verliezen al 512 euro. Bovendien werken sommige casino’s met inzetmaxima waardoor een martingaal na verloop van tijd niet meer werkt. Een martingaalstrategie is derhalve zeer riskant en kan zelfs het opstapje vormen naar gokverslaving. 13 Diagnostic

and Statistical Manual of Mental Disorders (kortweg DSM) is een Amerikaans handboek voor diagnose en statistiek van psychische aandoeningen dat in de meeste landen als standaard in de psychiatrische diagnostiek dient. Voor de beschrijving van dit inzicht werd beroep gedaan op [4, Pathologisch gokken, Martingaal], het voorbeeld is ontleend aan [2, p.61].

XIV-20


Hoofdstuk 2

Bijzondere kansverdelingen In dit hoofdstuk bespreken we enkele veelvoorkomende kansverdelingen van stochasten1 : discrete stochasten met uniforme, Bernoulli- of binomiale kansverdeling; continue stochasten met uniforme of normale kansverdeling.

2.1

Discrete stochasten

Uniforme kansverdeling Een discrete stochast heeft uniforme kansverdeling (of Laplace kansverdeling) als elke waarde xi dezelfde kans heeft. 3 Voorbeeld. Saartje werpt één keer met een eerlijke dobbelsteen en krijgt als winst het aantal ogen maal tien euro. Stel een kansverdeling en kanshistogram op. Wat is de verwachtingswaarde? Oplossing. We stellen de stochast schematisch voor:

waarden xi

kans pi

10

...

20

...

30

...

40

...

50

...

60

...

(kans)

De kansverdeling en kanshistogram van de stochast X wordt gegeven door (vul aan):

pi 1 6

10

20

30

40

50

xi 60 (waarden)

1 Omdat elke waarde xi dezelfde kans heeft, noemen we de kansverdelingsfunctie pX een uniforme kansverdeling. We berekenen de verwachtingswaarde X E(X) = pi · xi = . . . i

3 Eigenschap. Gegeven een stochast X met uniforme kansverdeling. Dan is E(X) =

1 X xi n i

met n het aantal waarden van de stochast.

1 Andere

voorbeelden van kansverdelingen zijn binomiale, negatief binomiale, Poisson en geometrische (discreet) en exponentieel, gamma, normaal, lognormaal, Laplace, chi-kwadraat, student-t en Fisher (continu). Deze verdelingen vallen buiten het bestek van deze cursus, met uitzondering van de Poisson- en exponentiële verdeling, die kort beschreven worden in Oefening 13 en Oefening 22.

XIV-21


Bernoulli-kansverdeling Sommige toevalsexperimenten hebben slechts twee mogelijke uitkomsten, zoals ja-nee, goedgekeurd-afgekeurd . . . die we algemeen zullen schrijven als succes-mislukking.2 Zo’n experiment noemen we een Bernoulli-experiment. Nemen we als stochast X : Ω 7→ R

succes → 1

mislukking → 0 dan noemt men een kansverdeling van X een Bernoulli-kansverdeling. 3 Voorbeeld. Op training trapt Jeroen één keer een strafschop. Onderzoek door de trainer heeft uitgewezen dat de kans op succes (Jeroen maakt een goal) gelijk is aan p = 0, 7. Stel een kansverdeling en kanshistogram op. Wat is de verwachtingswaarde? Oplossing. Omdat het experiment Jeroen trapt één keer een strafschop maar twee mogelijke uitkomsten heeft (succes en mislukking), betreft het een Bernoulli-experiment. We stellen de stochast schematisch voor:

De kansverdeling en kanshistogram van de stochast X is (vul aan): kans pi

0

...

1

...

pi

(kans)

waarden xi

1

1

1 We berekenen de verwachtingswaarde E(X) =

X i

xi (waarden)

pi · xi = . . .

3 Eigenschap. Gegeven een stochast X met Bernoulli-kansverdeling, met p de kans op succes en q de kans op mislukking. Dan is E(X) = p en Var(X) = p q Bewijs.

2 De

termen succes en mislukking zijn enkel namen voor de gebeurtenissen en moeten niet letterlijk geı̈nterpreteerd worden.

XIV-22


Binomiale kansverdeling Toevalsexperimenten die bestaan uit n onafhankelijke herhalingen van een Bernoulli-experiment leiden tot een stochast X met binomiale kansverdeling is. Men schrijft dan X ∼ B(n, p) waarbij p staat voor de kans op succes.

3 Voorbeeld. De voetbalcoach vindt dat Jeroen best wel wat training kan gebruiken. Hij laat Jeroen vijf strafschoppen trappen. Bij elke strafschop is de kans op succes (Jeroen maakt een goal) gelijk aan p = 0, 7. Stel een kansverdeling en kanshistogram op. Wat is de verwachtingswaarde? Oplossing. Het experiment Jeroen trapt vijf keer een strafschop is een herhaling van vijf afzonderlijke Bernoulliexperimenten.3 Bij elke uitkomst telt de stochast X het aantal keren succes. We stellen de stochast schematisch voor:

Het experiment bestaat uit een herhaling van 5 Bernoulli-experimenten, daarom noemen we de stochast X binomiaal verdeeld en we schrijven:4 X ∼ B(5, 0.7). Om de kansverdeling en het kanshistogram te bepalen, berekenen we de volgende kansen (vul aan): P (X = 0) = kans op 0 keer succes = P (mmmmm) = . . . P (X = 1) = kans op 1 keer succes = P (smmmm) + P (msmmm) + P (mmsmm) + P (mmmsm) + P (mmmms) = ... P (X = 2) = kans op 2 keer succes = . . . P (X = 3) = kans op 3 keer succes = . . . P (X = 4) = kans op 4 keer succes = . . . P (X = 5) = kans op 5 keer succes = . . . In het algemeen is dus P (X = k) = Cnk pk (1 − p)n−k

waarden xi

kans pi

0

...

1

...

2

...

3

...

4

...

5

...

(kans)

De kansverdeling en kanshistogram van de stochast X is

pi

1.0

0.5

0 3 We 4 De

1

2

3

4

gaan ervan uit dat de uitkomsten van elk van deze Bernoulli-experimenten elkaar niet beı̈nvloeden. k. naam binomiaal duidt op de verwantschap met de binomiaalcoëfficiënten Cn

XIV-23

5

xi (waarden)


We kunnen de kansen pi ook met behulp van de grafische rekenmachine berekenen: 2ND

DISTR

A:binompdf(

We berekenen de verwachtingswaarde E(X) =

X i

pi · xi = . . .

3 Eigenschap. Gegeven een stochast X met binomiale kansverdeling (n herhalingen) met p de kans op succes en q de kans op mislukking. Dan is E(X) = np

en

Var(X) = npq

Bewijs. Het experiment bestaat uit een samenstelling van n Bernoulli-experimenten. Bij het i-de Bernoulliexperiment hoort een stochast Xi en uit het onderstaand schema volgt X = X1 + X2 + . . . + Xn

Wegens eigenschap 5 op pagina 8 is E(X) = E(X1 + X2 + . . . + Xn ) = E(X1 ) + E(X2 ) + . . . + E(Xn ) = p + p + ... + p | {z } n keer

= np

Omdat de Bernoulli-experimenten elkaar niet beı̈nvloeden zullen de stochasten X1 , X2 , . . . , Xn onafhankelijk zijn, zodat wegens eigenschap 6 op pagina 9 Var(X) = Var(X1 + X2 + . . . + Xn ) = Var(X1 ) + Var(X2 ) + . . . + Var(Xn ) = pq + pq + ... + pq | {z } n keer

= npq

XIV-24


2.2

Continue stochasten

Uniform verdeelde stochasten Continue stochasten waarvan de uitkomsten over het hele bereikt even waarschijnlijk zijn, noemen we uniform verdeelde stochasten. Als er bijvoorbeeld ergens een kortsluiting in een kabel van 5 meter is, is de kans wat deze in een bepaald stuk kabel van 1 cm voorkomt even groot voor elk kabelsegment van 1 cm, waar dit zich ook in de kabel bevindt. Of als een veiligheidsinspecteur een willekeurig tijdstip tijdens vier werkuren in de middag uitkiest om een onverwacht bezoek te brengen aan een bepaalde afdeling van een fabriek, dan heeft elk tijdsinterval van 1 minuut in deze periode van vier uur een even grote kans om gekozen te worden als tijdstip voor het bezoek. 3 Voorbeeld. Ann wacht in een restaurant op Pieter. Hij zal aankomen tussen 19 u. en 19.20 u. waarbij elk tijdstip even waarschijnlijk is. Noem X de stochast die de aankomsttijd van Pieter (in minuten) aangeeft. Stel de kansdichtheidsfunctie fX op. Wat is de verwachtingswaarde? Oplossing.

Omdat de kansdichtheidsfunctie fX een constante functie is, noemen we de stochast X uniform verdeeld. We bepalen de verwachtingswaarde en de variantie Z 20 E(X) = x · fX (x) dx = . . . 0

Var(X) =

Z

0

20

(x − µ)2 · fX (x) dx = . . .

3 Eigenschap. Gegeven een continue stochast X die uniform verdeeld is op [a, b]. Dan wordt de kansdichtheidsfunctie gegeven door fX : [a, b] → R x 7→ fX (x) =

1 b−a

en de verwachtingswaarde en variantie worden gegeven door E(X) =

a+b 2

en

Bewijs.

XIV-25

Var(X) =

(b − a)2 12


Normale verdeelde stochasten De normale verdeling speelt een zeer belangrijke rol in de theoretische statistiek en in de praktijk. Bij veel toevallige verschijnselen kan de kansverdeling van de relevante stochast goed worden benaderd door een normale verdeling. Geı̈nspireerd door de studie van de normale verdeling in Deel Beschrijvende statistiek vermelden we volgende definitie en eigenschap. 3 Definitie. Een continue stochast X noemt men normaal verdeeld indien de kansdichtheidsfunctie de volgende vorm aanneemt fX : R → R x 7→ fX (x) = √

1 x−µ 2 1 e− 2 ( σ ) 2πσ

2 voor zekere µ ∈ R en σ ∈ R+ 0 . In dat geval schrijven we X ∼ N (µ, σ ).

3 Eigenschap. Gegeven een continue stochast X die normaal verdeeld is, dus X ∼ N (µ, σ 2 ). Dan is E(X) = µ

en

Var(X) = σ 2

Som van normaal verdeelde stochasten Men kan aantonen dat de som van een aantal normaal verdeelde stochasten die onderling onafhankelijk zijn zelf ook normaal verdeeld is. Een bijzonder geval leidt tot de volgende 3 Eigenschap. Gegeven zijn stochasten X1 , X2 , . . . , Xn die normaal verdeeld zijn, onderling onafhankelijk en def met dezelfde verwachtingswaarde µ en variantie σ 2 . Beschouw de somstochast Xsom = X1 + X2 + . . . + Xn . Dan geldt: 1. de somstochast is normaal verdeeld,5 2. E(Xsom ) = nµ , 3. Var(Xsom ) = nσ 2 . Bewijs van 2 en 3.

3 Modelvoorbeeld. Een wereldreiziger koopt ten behoeve van zijn videocamera 25 batterijen waarvan de levensduur kan worden beschreven door een normale verdeling met µ = 20 uur en σ = 2 uur. Bereken de kans dat de totale draaitijd als geheel niet aan de norm van 480 uur voldoet. Oplossing.

3 Opmerking. Vorig voorbeeld illustreert dat bij opeenstapeling van variabelen de standaardafwijking relatief minder hard groeit dan de verwachtingswaarde van de som. Anders gezegd: bij een gemiddelde van 20 uur is een standaarddeviatie van 2 uur relatief groter dan bij een standaarddeviatie van 10 uur bij een gemiddelde van 500 uur. Dit komt nog meer tot uiting bij de volgende Toepassing 1. 5 Een

voor de hand liggende manier om dit te bewijzen is door het integraalvoorschrift van de kansdichtheidsfunctie Xsom , verkregen door een oneigenlijke convolutie-integraal, met behulp van enkele geschikte substituties te herleiden naar het voorschrift van een normale verdeling.

XIV-26


Toepassing 1 - Steekproefgemiddelden en voorspellingsintervallen Aangezien de som van een aantal normaal verdeelde stochasten zelf ook normaal verdeeld is, zal het gemiddelde (deel de som door het aantal) zelf ook normaal verdeeld zijn. In het bijzonder geldt 3 Eigenschap. Gegeven zijn stochasten X1 , X2 , . . . , Xn die normaal verdeeld zijn, onderling onafhankelijk en met dezelfde verwachtingswaarde µ en variantie σ 2 . def Beschouw de gemiddelde stochast X = n1 (X1 + X2 + . . . + Xn ). Dan geldt: 1. de gemiddelde stochast X is normaal verdeeld, 2. E(X) = µ , 3. Var(X) =

σ2 . n

Bewijs van 2 en 3. Wegens de eigenschap op pagina 26 is Å ã 1 1 1 · Xsom = · E(Xsom ) = · nµ = µ E(X) = E n n n en Å ã 1 1 σ2 1 Var(X) = Var · Xsom = 2 · Var(Xsom ) = 2 · nσ 2 = n n n n Dit besluit het bewijs. √ De formule σX = σ/ n drukt uit dat, bij een serie waarnemingen, de spreiding van de gemiddelde stochast een √ factor n kleiner is dan die van een losse waarneming (individuele stochast Xi ). In de literatuur noemt men deze formule soms de wortel-n-wet. Deze eigenschap is voor de praktische statistiek van buitengewoon belang. We illustreren met volgend 3 Modelvoorbeeld 1. Een variabele X is normaal verdeeld met µX = 100 en σX = 10. We doen van deze variabele 25 waarnemingen. (a) Hoe groot is de kans dat een afzonderlijke waarneming Xi meer dan 4 afwijkt van 100? (b) Hoe groot is de kans dat het gemiddelde van de 25 waarnemingen meer dan 4 afwijkt van 100? Oplossing. (a) Met behulp van het commando normalcdf vinden we P (X < 96) ≈ 0, 3446, zodat P (X < 96 of X > 104) ≈ 68, 92%. Dus ongeveer 69% van de individuele uitkomsten wijken minstens 4 eenheden af van het 100. (b) Het gemiddelde X van een serie van 25 waarnemingen is normaal verdeeld met σ µX = µX = 100 en σX = √X = 2 n De kans dat het gemiddelde van de 25 waarnemingen meer dan 4 afwijkt van 100 is dus P (X < 96) + P (X > 104) ≈ 0, 0456 = 4, 56% Op precies dezelfde manier als bij het bepalen van voorspellingsintervallen van normaal verdeelde variabelen (zie Deel Beschrijvende statistiek) kunnen we ook voor de gemiddelde variabele X een voorspellingsinterval construeren. 3 Modelvoorbeeld 2. De tijd die nodig is voor het lossen en opnieuw laden van een containerschip wordt beschreven door een variabele die normaal verdeeld is met µ = 180 minuten en σ = 20 minuten. Bepaal een 95%-voorspellingsinterval voor het gemiddelde van een steekproef van n = 25 waarnemingen voor de afhandeltijd van een willekeurig containerschip (dus een interval waarin met kans 95% het gemiddelde van een nog te nemen steekproef zal liggen). Oplossing.

XIV-27


Toepassing 2 - De centrale limietstelling In Toepassing 1 vonden we dat het gemiddelde van een aantal normaal verdeelde stochasten zelf ook normaal verdeeld is. Eén van de krachtigste resultaten in de statistiek is dat in het geval de stochasten niet normaal verdeeld zijn, dit resultaat nog steeds waar is. De bekendste formulering hiervan is de volgende 3 Stelling (centrale limietstelling van Lindeberg-Lévy).6 Gegeven zijn stochasten X1 , X2 , . . . , Xn die identiek verdeeld zijn, onderling onafhankelijk en met dezelfde verwachtingswaarde µ en variantie σ.7 Beschouw de gemiddelde stochast X = n1 (X1 + X2 + . . . + Xn ). Dan geldt: als n → +∞ dan is X normaal verdeeld met gemiddelde µ en variantie σ 2 /n Bewijs. Valt buiten het bestek van deze cursus. 3 Opmerking. De centrale limietstelling kan - onder geschikte voorwaarden - veralgemeend worden voor willekeurige stochasten X1 , . . . , Xn , die dus niet identiek verdeeld hoeven te zijn. Zo’n veralgemening verklaart meteen waarom bepaalde fenomenen normaal verdeeld zijn. Denken we bijvoorbeeld aan de heupomtrek van volwassen vrouwen, dan is deze bepaald door tal van factoren (leeftijd, gewicht, erfelijkheid, voeding, milieu, etc.). De heupomtrek van volwassen zal dus - de som van tal van stochasten zijnde - wegens de centrale limietstelling normaal verdeeld zijn. Een andere toepassing is volgend is een java-applet beschikbaar 3 Applet. Op de website http://www.stat.sc.edu/∼west/javahtml/CLT.html dat de centrale limietstelling demonstreert door het meermaals opgooien van dobbelstenen. In de volgende afdruk werden vijf dobbelstenen 10000 keer opgegooid. Het gemiddelde van deze 10 000 stochasten neigt duidelijk naar een normale verdeling.

3 Voorbeeld. Als men 300 willekeurige decimale getallen eerst tot op de dichtstbijzijnde eenheid afrondt en vervolgens optelt, wat is de kans dat de verkregen som ten hoogste vijf eenheden afwijkt van de werkelijke som van de decimale getallen? Oplossing. De fout die door afronding wordt gemaakt kan worden opgevat als een stochast die uniform verdeeld is over het interval [−0, 5; 0, 5]. Met andere woorden, stellen we stochast Xi afrondingsfout bij het i-de getal, dan is Xi uniform verdeeld met verwachtingswaarde en variantie (bereken): E(Xi ) = . . . Var(Xi ) = . . . zodat µ = 0 en σ 2 = 1/12. De totale fout kan dan beschreven worden door de stochast Xsom = X1 + X2 + . . . + X300 . Wegens de centrale limietstelling is de totale fout Xsom normaal verdeeld met gemiddelde µ = 0 en variantie 300 · σ 2 = 25. De kans dat de verkregen som ten hoogste vijf eenheden afwijkt van de werkelijke som is dan (vul aan) P (|Xsom | < 5) = P (−5 < Xsom < 5) = . . . 6 De centrale limietstelling kent een rijke geschiedenis. Een eerste versie werd gepostuleerd door Abraham de Moivre 1733, waar hij de normale verdeling gebruikte om, bij een lange reeks worpen van een eerlijk muntstuk, het aantal keer kop te benaderen. In 1812 breidde Pierre-Simon Laplace dit resultaat uit door de binomiale verdeling te benaderen met behulp van de normale verdeling, zie Toepassing 3. Het resultaat werd onderkend tot Aleksandr Lyapunov in 1901 het belang hiervan inzag en een meer algemene versie van de centrale limietstelling bewees. In 1920 vond Jarl Waldemar Lindeberg onafhankelijk een analoog resultaat. De term centrale limietstelling is afkomstig van George Pólya 1920, die met centraal het belang van dit resultaat in de kansrekening onderstreepte. Essentiële bijdragen werden ook geleverd door Cauchy, Bessel, Poisson, Mises, Khinchin, Lévy, Cramér, Chebyshev, Markov, Turing, Rice, Feller e.a.. Ten slotte vermelden we dat Olav Kallenberg in 1997 een zes-regel-bewijs van de centrale limietstelling opstelde, steunend op inverse Fourier-transformaties. 7 Met identiek verdeeld bedoelen we dat de stochasten X alle dezelfde kansverdelingsfunctie hebben. i

XIV-28


Toepassing 3 - Betrouwbaarheidsinterval voor het populatiegemiddelde Voor een variabele waarvan de verwachtingswaarde µ en standaardafwijking σ bekend zijn, kunnen we voorspellingen doen voor waarden en parameters van een nog uit te voeren steekproef. 3 Voorspellingsinterval bij een normale verdeling. Als de variabele normaal verdeeld is en als µ en σ bekend zijn, dan kan vooraf een interval bepaald worden waarbij we met 95% zekerheid kunnen zeggen dat een steekproef met één waarde in dat interval ligt. Zo’n interval noemen we een 95%-voorspellingsinterval (zie Deel Beschrijvende statistiek) en de formule wordt gegeven door het tweesigma-gebied [µ − 2 σ, µ + 2 σ]. Ook bij andere bijzondere kansverdelingen bestaan er formules voor zo’n voorspellingsinterval. 3 Voorspellingsinterval voor het steekproefgemiddelde. Als µ en σ bekend zijn, dan kan vooraf een interval bepaald worden waarbij we met 95% zekerheid kunnen zeggen dat het steekproefgemiddelde van een steekproef in dat interval ligt. Inderdaad, wegens de centrale limietstelling uit Toepassing 2 volgt dat √ de kansverdeling van het gemiddelde x normaal verdeeld is met verwachtingswaarde µ en standaardafwijking σ/ n, waarbij n staat voor de grootte van We kunnen met 95% zekerheid voorspellen dat het steekproefgemiddelde behoort tot √ de steekproef. √ [µ − 2 σ/ n, µ + 2 σ/ n]. Zo’n interval noemen we een 95%-voorspellingsinterval voor het steekproefgemiddelde (zie Toepassing 1). In de praktijk zal de verwachtingswaarde µ van de populatie onbekend zijn. Als we een voldoende grote steekproef nemen, waarvan we aannemen dat deze aselect is, dan kunnen we de onbekende parameter µ schatten door het steekproefgemiddelde x. Maar in welke mate kunnen we deze schatting betrouwen? Dat wordt uitgedrukt met een zogenaamd betrouwbaarheidsinterval. we de steekproef nemen bij Wegens de centrale limietstelling uit Toepassing 2 is het steekproefgemiddelde x voordat √ benadering normaal verdeeld met verwachtingswaarde µ en standaardafwijking σ/ n. Uit de voorgaande bespreking over voorspellingsintervallen volgt dan: ò ï σ σ 95% is de kans dat x ∈ µ − 2 √ , µ + 2 √ n n σ σ ⇒ 95% is de kans dat µ − 2 √ ≤ x en x ≤ µ + 2 √ n n σ σ ⇒ 95% is de kans dat µ ≤ x + 2 √ en x − 2 √ ≤ µ n n ï ò σ σ ⇒ 95% is de kans dat µ ∈ x − 2 √ , x + 2 √ n n √ √ Het interval [x − 2σ/ n, x + 2σ/ n] noemen we een 95%-betrouwbaarheidsinterval voor µ: het is een regel die ons zegt hoe we uit de steekproef een interval moeten berekenen dat de waarde van µ met een waarschijnlijkheid van 95% bevat. Meestal kennen we ook de waarde van de populatiestandaardafwijking σ niet. Maar voor grote steekproeven volstaat het om σ te vervangen door de standaardafwijking s van de steekproef. 3 Modelvoorbeeld. Een grote bank wil een schatting maken van het verwachte bedrag dat de bank tegoed heeft van nalatige debiteuren (debiteuren die meer dan twee maanden met hun betaling achterlopen). Daartoe neemt de bank een steekproef van 100 achterstallige rekeningen en verkrijgt als steefproefgemiddelde 233, 28 euro en standaardafwijking 90, 34 euro. Bepaal een 95%-betrouwbaarheidsinterval voor de verwachting van alle achterstallige tegoeden. Oplossing. Een 95%-betrouwbaarheidsinterval van het populatiegemiddelde µ wordt gegeven door ï ò ï ò s s 90, 34 90, 34 x − 2 √ , x + 2 √ = 233, 28 − 2 √ , 233, 28 + 2 √ = [215, 57; 250, 99] n n 100 100 Kunnen we er in voorgaand voorbeeld zeker van zijn dat µ, de werkelijke verwachtingswaarde, in het interval [215, 57; 250, 99] ligt? We kunnen er niet zeker van zijn, maar we kunnen er wel redelijk veel vertrouwen in hebben. Dit vertrouwen is gebaseerd op de wetenschap dat als we herhaaldelijk aselecte steekproeven van honderd meetwaarden uit deze populatie zouden nemen en iedere keer zo’n interval zouden vormen, in ongeveer 95% van de gevallen µ binnen het interval zal liggen. Nevenstaande figuur laat zien wat er gebeurt als er verschillende steekproeven uit een populatie worden getrokken en er steeds een betrouwbaarheidsinterval voor µ wordt berekend (horizontale lijnstukken). Die intervallen worden telkens vergeleken met de werkelijke verwachtingswaarde µ (verticale lijn). De uitkomsten van de betrouwbaarheidsintervallen verschillen van steekproef tot steekproef - meestal bevatten ze µ maar soms ook niet. Op den duur zal 95% van de intervallen µ wel bevatten en 5% niet. XIV-29


Toepassing 4 - De binomiale kansverdeling benaderen met de normale verdeling Het berekenen van kansen bij de binomiale verdeling gebeurt in principe door de formule van deze verdeling toe te passen (zie pagina 23): als X ∼ B(n, p) dan is P (X = k) = Cnk pk (1 − p)n−k

Indien de omvang n groot is, dan dreigen er moeilijkheden. Niet alleen wordt de uitdrukking Cnk uitermate lastig te berekenen, maar ook de getallen p en 1 − p zullen tot hoge machten moeten worden gebracht. Precies om dit soort moeilijkheden te omzeilen heeft men methoden ontwikkeld om de binomiale verdeling met andere kansverdelingen te benaderen, bijvoorbeeld met behulp van de normale verdeling.8 Deze benadering heeft ook theoretisch belang. 3 Voorbeeld. Een postorderbedrijf weet dat 60% van de gezinnen die een catalogus hebben aangevraagd ook daadwerkelijk een bestelling plaatsen. Na het verschijnen van de advertentie worden 20 exemplaren van de catalogus aangevraagd. Noem de stochast X: het aantal klanten dat een bestelling doet. (a) Bepaal het kanshistogram van de stochast X. (b) Bereken de kans dat minstens 15 van de 20 klanten een bestelling plaatsen: . met behulp van de binomiale verdeling, . met behulp van de benaderde normale verdeling. Oplossing. De stochast X is binomiaal verdeeld, waarbij n = 20 en p = 0, 6. Dus X ∼ B(20, 0.6). . Lijst met waarden 0, 1, . . . , 20 invoeren (stelt aantal keer succes voor):

2ND

LIST

OPS

. Lijst met kansen P (X = k) invoeren (stelt kans op k keer succes voor): seq(binompdf(20,0.6,A),A,0,20)

. Kanshistogram van de binomiale verdeling plotten:

Het kanshistogram lijkt normaal verdeeld. We moeten ons hierbij evenwel realiseren dat de binomiale verdeling discreet is, terwijl de normale verdeling een continu karakter heeft. Behalve de optische gelijkenis is er ook nog een ander argument dat ons brengt tot de normale verdeling. In Toepassing 2 noemden we reeds de centrale limietstelling, die zegt dat bij een lange serie identieke experimenten de verdeling van de som (of het gemiddelde) van de uitkomsten een kansvariabele is die bij benadering normaal verdeeld is. Om de passende normale verdeling te vinden, hanteren we de formules op pagina 23: µ = E(X) = np = 12 en σ 2 = Var(X) = npq = 4, 8 √ zodat µ = 12 en σ = 4, 8 ≈ 2, 19. Ter controle plotten we de grafiek van de normale verdeling. Ten slotte berekenen we de kans dat minstens 15 van de 20 klanten een bestelling plaatsen (een overschrijdingskans): . met behulp van de binomiale verdeling: 1− binomcdf( 20, 0.6, 14) = . . . . met behulp van de benaderde normale verdeling: normalcdf( 14.5, E99, 12, 2.19) = . . . 8 Een

andere bekende benadering is de zogenaamde poissonverdeling, zie Oefening 13.

XIV-30


Toepassing 5 - Som van uniform verdeelde stochasten Beschouw een aantal identiek verdeelde stochasten X1 , X2 , . . . , Xn , onderling onafhankelijk, met somstochast Xsom gemiddelde stochast X. Wegens de centrale limietstelling zal voor n → +∞ gemiddelde stochast X normaal verdeeld zijn. Dat betekent dat ook de somstochast Xsom normaal verdeeld is. Maar dat betekent geenszins dat een eindige som ook normaal verdeeld is. In het geval de stochasten Xi uniform verdeeld zijn, kan men de gemiddelde stochast X precies beschrijven. 3 Eigenschap. Gegeven zijn stochasten X1 , X2 , . . . , Xn die uniform verdeeld zijn, onderling onafhankelijk en met hetzelfde bereik [0, 1]. Dan heeft de somstochast X = Xsom = X1 + X2 + . . . + Xn als kansdichtheidsfunctie de zogenaamde Irwin - Hall distributie:9 fX (x, n) =

n X 1 (−1)k · Cnk · (x − k)n−1 · sign(x − k) 2(n − 1)! k=0

Bewijs. Valt buiten het bestek van deze cursus. Onderstaande figuur geeft de kansdichtheidsfuncties voor de gevallen n = 1, 2, 3 en 4 weer. Naarmate n groter wordt, neigt de vorm grafiek naar de Gausskromme. Aan de hand van deze kleine gevallen kan lezer patronen ontdekken, waaronder het feit dat 1 voor x ∈ [0, 1] geldt fX (x, n) = xn−1 (n − 1)!

Xsom = X1 y

Xsom = X1 + X2 y

fX (x, 1)

1

1

fX (x, 1) =

fX (x, 2)

1

(

1 0

x

1   x fX (x, 2) = 2 − x   0

als 0 ≤ x ≤ 1 elders

Xsom = X1 + X2 + X3

x

als 0 ≤ x ≤ 1 als 1 ≤ x ≤ 2 elders

Xsom = X1 + X2 + X3 + X4

y

y

1

1

fX (x, 3)

1

2

 1 2   2x    1   (−2x2 + 6x − 3) fX (x, 3) = 2 1    (x2 − 6x + 9)   2    0 9 Opgesteld

2

x

3

als 0 ≤ x ≤ 1 als 1 ≤ x ≤ 2 als 2 ≤ x ≤ 3 elders

door Joseph Oscar Irwin

en Philip Hall

fX (x, 4)

1

2

3

 1 3   6x    1   3 2   6 (−3x + 12x − 12x + 4)   fX (x, 4) = 1 (3x3 − 24x2 + 60x − 44)   6     1   (−x3 + 12x2 − 48x + 64)   6    0

in 1927.

XIV-31

4

x

als 0 ≤ x ≤ 1 als 1 ≤ x ≤ 2 als 2 ≤ x ≤ 3 als 3 ≤ x ≤ 4 elders


Oefeningen 2 Bijzondere kansverdelingen

Basis

Verdieping

Uitbreiding

2.1 Discrete stochasten

1 2 3 4

5 6

7 8 9

10 11

12

13

2.2 Continue stochasten

14 15 16

17 18

19 20 21

22

23

24

25

Oefeningen bij §2.1 B

Oefening 1. Geef bij elk experiment aan wat de bijzondere kansverdeling van de corresponderende discrete stochast is (uniform, Bernoulli of binomiaal). (a) Opgooien van een eerlijk muntstuk. (b) Geslacht van 10 pasgeboren kinderen. (c) Al dan niet groen zijn van iemands ogen. (d) Levensvatbaarheid van een mug nadat er insecticide is gespoten.

B

Oefening 2. Geef aan welke van de volgende beweringen niet waar is voor een binomiale kansverdeling. De succeskans p is constant bij iedere poging. Het aantal successen in n pogingen is constant. De verwachtingswaarde is np. De variantie is np(1 − p).

B

Oefening 3. Van een groep scholieren is bekend dat slechts 20% het huiswerk maakt voor een bepaald vak. De leerkracht besluit het werk van zes willekeurig gekozen leerlingen te controleren. Hoe groot is de kans dat hierbij slechts twee leerlingen zijn die hun huiswerk gemaakt hebben?

B

Oefening 4. Bij het toedienen van een geneesmiddel is er 15% kans op maagklachten. Bereken de kans dat bij tien willekeurige patiënten er minstens twee met maagklachten zijn.

B?

Oefening 5. Men heeft vastgesteld dat er bij tests met een leugendetector 20% kans is dat een persoon als leugenaar aangewezen wordt, terwijl hij toch de waarheid spreekt. Een groep van 25 sollicitanten voor een baan bij de staatsveiligheid wordt onderworpen aan een dergelijke test. Veronderstel dat al die sollicitanten eerlijk zijn. (a) Hoe groot is de kans dat de leugendetector geen enkele sollicitant als leugenaar aanwijst? (b) Hoe groot is de kans dat de leugendetector ten minste 3 leugenaars vindt?

B?

Oefening 6. Om de kwaliteit van twee merken van achterknipperlichten te toetsen, gaat men in n (onafhankelijke, identieke) auto’s links een knipperlicht van merk A en rechts een knipperlicht van merk B installeren. Noem succes als in een auto knipperlicht A langer meegaat dan B (en mislukking omgekeerd). Stel dat de beide knipperlichten juist even goed zijn (dus de kans op succes is 50%). (a) Stel n = 10. Hoe groot is de kans op 7 of meer successen? (b) Stel n = 100. Hoe groot is dan de kans op 70 of meer successen?

B??

Oefening 7. Op een autoweg zijn de verkeerslichten zo geregeld dat ze 65% van de tijd op groen staan en 35% van de tijd op rood. Iemand moet dagelijks de 7 kruispunten met verkeerslichten passeren. Bereken de kans dat deze persoon (a) vijf keer kan doorrijden, (b) minstens vier keer kan doorrijden, (c) minder dan vier keer kan doorrijden.

XIV-32


B??

Oefening 8. Een multiplechoice-examen bestaat uit tien vragen die elk drie antwoordmogelijkheden kennen, waarvan er precies één correct is. Een kandidaat die volstrekt niet weet wat hij moet antwoorden, kruist naar willekeur bij elk van de tien vragen een antwoord aan. (a) Bereken de kans op respectievelijk nul, één of twee antwoorden goed. (b) Bereken de kans dat hij slaagt (en dus minstens vijf antwoorden goed heeft). (c) Welk resultaat mag de kandidaat verwachten?

B??

Oefening 9. In sommige dozen waspoeder zit een bon waarmee je bij de volgende aankoop vier euro korting krijgt. Bij één op vijf dozen zit zo’n bon. (a) Wat is de kans dat je bij aankoop van drie dozen in totaal twee bonnen aantreft? (b) Wat is de kans dat je bij aankoop van 10 dozen minder dan 3 bonnen aantreft? (c) Wat is de kans dat je bij aankoop van 10 dozen meer dan 4 bonnen aantreft? (d) We gaan ervoor en kopen ineens 20 dozen waspoeder. Hoeveel bonnen mag je verwachten?

V

V

Oefening 10. Een vliegtuigmaatschappij huurt 40 plaatsen bij SN Brussels Airlines voor zakenvluchten op Barcelona. Er wordt zoals steeds aan overboeking gedaan: men schrijft tot 42 reizigers in. De kans dat een klant die boekt de zakenreis effectief meevliegt wordt geschat op 90%. Hoe groot is de kans dat door deze overboeking niet wasmachine uit 19e eeuw alle opgedaagde passagiers kunnen vertrekken? Oefening 11. Van een bloembollensoort is bekend dat 5% van de bollen niet opkomt. De bollen worden verpakt in dozen van tien stuks met de garantie dat ten minste negen van de tien bollen zullen opkomen. De bollen komen onafhankelijk van elkaar al dan niet op. (a) Bereken de kans dat van een doos alle bollen opkomen. (b) Bereken de kans dat een aselect gekozen doos de gegarandeerde eigenschap niet heeft.

V?

Oefening 12. Bij 10 worpen naar de ring is de kans dat een basketspeler 9 maal scoort even groot als de kans dat hij 10 maal scoort. We nemen hierbij aan dat de uitkomsten van de worpen elkaar niet beı̈nvloeden. Wat is kans op succes bij één worp?

U?

Oefening 13 (Poissonverdeling). Een type kansverdeling dat vaak bruikbaar is voor het beschrijven van het aantal gebeurtenissen dat in een bepaalde tijdsperiode of in een bepaald oppervlak of volume zal optreden, is de Poissonverdeling:10 λx e−λ pX (x) = x! waarbij λ > 0 staat voor het aantal gebeurtenissen in een bepaalde eenheid van tijd, oppervlakte, volume enzovoort. Met behulp van de grafische rekenmachine kunnen we pX (x) berekenen via 2nd DISTR B:poissonpdf(λ, x). Men kan aantonen dat voor een poissonverdeelde stochast X geldt dat E(X) = λ en Var(X) = λ. Voorbeelden van stochasten waarvoor de Poissonverdeling een goed model is, zijn: . het aantal bedrijfsongevallen in een maand in een fabriek, . het aantal zichtbare oppervlaktedefecten dat door kwaliteitsinspecteurs op een nieuwe auto wordt gevonden, . het aantal parts per million (ppm) van een giftige stof die in het afvalwater of in de afvalgassen van een fabriek wordt gevonden, . het aantal klanten dat in een bepaalde tijdseenheid de kassa van een supermarkt passeert, . het aantal fouten in 100 facturen in de boekhouding van een onderneming. Het aantal medewerkers van een onderneming dat op maandag afwezig is, wordt beschreven door een stochast X die Poissonverdeeld is. Gemiddeld zijn er 2, 6 medewerkers op maandag afwezig. (a) Bepaal de verwachtingswaarde en de standaardafwijking van het aantal medewerkers dat op een bepaalde maandag afwezig is. (b) Bepaal de kans dat precies vijf medewerkers op een maandag afwezig zijn. (c) Bepaal de kans dat minder dan twee medewerkers op een maandag afwezig zijn. (d) Bepaal de kans dat meer dan vijf medewerkers op een maandag afwezig zijn. 10

Siméon Denis Poisson 1837. Een bekende praktische toepassing van deze verdeling werd bescheven door Ladislaus Bortkiewicz in 1898, toen hem gevraagd werd het aantal soldaten uit het Pruisische leger te tellen die verongelukten door de stamp van een paard. De Poissonverdeling kan afgeleid worden als limietgeval van een binomiale verdeling met n herhalingen en kans op succes bij één poging p = λ/n, wanneer n naar oneindig gaat.

XIV-33


Oefeningen bij §2.2 B

Oefening 14. Veronderstel dat de tijdsduur X tussen opeenvolgende keren opladen van een mobiele telefoon een normale verdeling heeft met verwachting van tien uur en een standaardafwijking van 1, 5 uur. Bepaal een 95%voorspellingsinterval voor het gemiddelde van een steekproef van 30 waarnemingen voor de tijdsduur tussen opeenvolgende keren opladen van de mobiele telefoon.

B

Oefening 15. Van een bepaald type batterij heeft de gebruiksduur een standaardafwijking van 5 uur, maar is de gemiddelde gebruiksduur onbekend. Men neemt een aselecte steekproef van 100 batterijen en bepaalt de gebruiksduur. Dit levert een steekproefgemiddelde van 46 uur op. Bepaal de uitkomst van een 95%-betrouwbaarheidsinterval voor het populatiegemiddelde.

B

Oefening 16. Een aselecte steekproef van 70 waarnemingen wordt getrokken uit een normaal verdeelde populatie. Het steekproefgemiddelde bedraagt 26, 2 en de steekproefstandaardafwijking 4, 1. Bepaal de uitkomst van een 95%betrouwbaarheidsinterval voor µ.

B?

Oefening 17. Een fabrikant van autoaccu’s beweert dat de verdeling van de levensduur van zijn type accu een verwachtingswaarde van 54 maanden heeft, met een standaardafwijking van 6 maanden. Stel dat een consumentenorganisatie besluit om deze bewering te toetsen door een steekproef van 50 van dit type accu’s te kopen en hun levensduur te bepalen. (a) Als we aannemen dat de bewering van de fabrikant juist is, wat is dan de kans dat de 50 accu’s van de consumentenorganisatie een gemiddelde levensduur van 52 of minder maanden hebben? (b) Stel dat de steekproef van de consumentenorganisatie een gemiddelde van 52 maanden oplevert. Als we aannemen dat de standaardafwijking van de fabrikant juist is, bepaal dan een 95%-betrouwbaarheidsinterval voor de verwachting van alle autoaccu’s.

B?

Oefening 18. De researchafdeling van een staalfabrikant denkt dat één van de walsen van het bedrijf staalplaten met uniform variërende dikte produceert, waarbij de dikte een uniforme verdeling heeft met mogelijke waarden tussen 150 mm en 200 mm. Platen met een dikte van minder dan 160 mm vallen af, omdat ze voor de afnemer niet meer acceptabel zijn. (a) Bereken en interpreteer de verwachting en de standaardafwijking van de dikte van de platen die door deze machine wordt geproduceerd. (b) Maak een grafiek van de kansverdelingsfunctie en geef de verwachting op de horizontale as aan. Geef ook het interval met waarden aan die hoogstens 1 standaardafwijking van de verwachting liggen. (c) Bereken de fractie staalplaten uit deze machine die moeten afvallen.

B??

Oefening 19. De tijd die een vertegenwoordiger nodig heeft voor het bezoeken van een klant wordt weergegeven door de stochast X. Op grond van ervaring is bekend dat X normaal verdeeld is met µ = 45 minuten en σ = 10 minuten (in de tijdsduur X is ook de reistijd opgenomen). De tijdsduren van bezoeken zijn onderling onafhankelijk. (a) Hoe groot is de kans dat een willekeurig bezoek meer dan 60 minuten vergt? (b) Hoe groot is de kans dat acht bezoeken meer dan 6, 5 uren vergen? (c) De vertegenwoordiger moet op zekere dag tien klanten bezoeken. Hoeveel tijd T moet hij reserveren om met 95% kans de tien bezoeken binnen de tijdsduur T te kunnen afhandelen?

B??

Oefening 20. Een groothandel in geheugenchips levert partijen tweede soort die gemiddeld 20% defecte exemplaren bevatten. (a) Hoe groot is de kans dat bij vijf willekeurig gekozen geheugenchips precies één defect exemplaar is? (b) Bereken de kans op 0, 1, 2, 3, 4 en 5 defecte exemplaren bij de steekproef van vijf stuks. (c) Een afnemer wil bij de groothandel een partij tweede soort-geheugenchips bestellen. De afnemer heeft 50 deugdelijke geheugenchips nodig. Rekening hou-

magnetische geheugenchip

dend met de mogelijkheid dat een aantal exemplaren defect is, besteld hij een partij tweede soort van 60 stuks. Bereken de kans dat de bestelde partij minstens 50 deugdelijke geheugenchips bevat door de binomiale kansverdeling te benaderen met de normale verdeling.

XIV-34


B??

Oefening 21. De montagetijd van een apparaat is een fabriek is te beschouwen als een variabele die normaal verdeeld is met een verwachtingswaarde van 40 minuten en een standaardafwijking van 4 minuten. Na het invoeren van een nieuw systeem voor de montage is de chef van de afdeling benieuwd of de gemiddelde montagetijd hierdoor korter is geworden. Voor een aantal montages (noem dit aantal n) vond hij als gemiddelde montagetijd 36 minuten. We gaan ervan uit dat de montagetijden nog steeds normaal verdeeld zijn met σ = 4 minuten. Bereken een 95%-betrouwbaarheidsinterval voor µ in de volgende gevallen. (a) Als n = 16 waarnemingen zijn gebruikt voor het berekenen van x = 36 minuten. (b) Als n = 100 waarnemingen zijn gebruikt voor het berekenen van x = 36 minuten. (c) Als n = 4 waarnemingen zijn gebruikt voor het berekenen van x = 36 minuten.

V

Oefening 22. Een kansvariabele X volgt een uniforme verdeling op het interval [0, 1]. Van deze variabele doen we twaalf (onderling onafhankelijke) trekkingen. Bereken de kans dat de som van die twaalf trekkingen meer dan 8 is.

V?

Oefening 23. Een automobilist rijdt elke werkdag over een secundaire weg waarvoor een maximumsnelheid geldt van 70 kilometer per uur. Langs deze weg staat een flitspaal opgesteld waarmee de snelheid van auto’s wordt gemeten. Deze flitspaal functioneert gemiddeld één op de tien dagen. Onze automobilist rijdt op deze weg met een snelheid die normaal verdeeld is met µ = 68 kilometer per uur en σ = 4 kilometer per uur. (a) Hoe groot is de kans dat de automobilist op zekere dag harder rijdt dan 70? En harder dan 75? (b) Er wordt pas een boete van 50 euro gegeven indien voor de auto minstens een snelheid van 75 wordt gemeten. Hoe groot is naar verwachting het boetebedrag per jaar (250 dagen) van de automobilist (gegeven het feit dat de flitspaal lang niet altijd werkt)? (c) Indien de gemeten snelheid 80 kilometer per uur is of hoger, volgt een boete van 100 euro. Bereken opnieuw het jaarlijks te verwachten boetebedrag.

U?

Oefening 24 (exponentiële verdeling). De tijd die verstrijkt tussen de aankomst van opeenvolgende klanten bij een drive-throughrestaurant, het tijdsinterval tussen storingen in een productiemachine en het tijdsinterval tussen opeenvolgende registraties van claims bij een kleine verzekeringsmaatschappij zijn allemaal voorbeelden van gebeurtenissen in een bedrijf waarop we kansrekening zouden willen toepassen. Het tijdsinterval tussen opeenvolgende toevallige gebeurtenissen zoals deze, kan vaak worden beschreven door exponentiële verdeling (of wachttijdverdeling) fX : R+ → R

x 7→ fX (x) = λe−λx

waarbij λ > 0. Men kan aantonen dat voor een exponentieel verdeelde stochast X geldt dat E(X) = 1/λ en Var(X) = 1/λ. Uit Deel Integralen volgt onmiddellijk dat voor a ∈ R+ P (X ≥ a) = e−λa

Een fabrikant van magnetrons probeert te bepalen welke garantieperiode hij moet geven voor de magnetronbuis, het meest kritische onderdeel van de oven. Voorlopige tests hebben uitgewezen dat de levensduur X (in jaren) een exponentiële kansverdeling heeft met λ = 0, 16. (a) Bepaal de verwachtingswaarde en de standaardafwijking van de stochast X. (b) Stel dat er op de magnetronbuis een garantie van vijf jaar wordt gegeven. Welk percentage magnetronbuizen moet de fabrikant dan vervangen, gesteld dat het exponentiële model met λ = 0, 16 juist is?

U??

(c) Bepaal de kans dat de levensduur van een magnetronbuis binnen het interval µ − 2σ tot µ + 2σ ligt.

magnetronbuis

Oefening 25 (stochastische betekenis van het getal e). Beschouw het experiment waarbij je een willekeurig reëel getal x1 kiest in het interval [0, 1]. Is x1 < 1, kies dan een tweede reëel getal x2 in het interval [0, 1]. Is x1 + x2 < 1, kies dan een derde reëel getal x3 in het interval [0, 1]. Enzovoort, zodat je een eindige rij x1 , x2 , . . . , xt bekomt waarbij x1 + x2 + . . . + xt ≥ 1 en x1 + x2 + . . . + xt−1 < 1. Noem X de stochast die met elke uitkomst x1 , x2 , . . . , xt van het experiment het aantal stappen t associeert. (a) Bewijs met behulp van de kansverdeling van de stochast X dat 1=

1 2 3 4 + + + + ... 2! 3! 4! 5!

(b) Bewijs dat de verwachtingswaarde van de stochast X gelijk is aan het getal van Euler, neem hierbij aan dat e=1+

1 1 1 1 1 + + + + + ... 1! 2! 3! 4! 5! XIV-35


Inzicht in psychometrie Een meerkeuzevraag (ook wel multiplechoicevraag genoemd), is een vraag waarbij uit een beperkt aantal antwoorden kan worden gekozen. De aangeboden antwoorden worden in deze context alternatieven genoemd. Behalve bij schoolexamens worden meerkeuzetoetsen gebruikt bij quizzen, rijexamens en psychodiagnostische tests. Een meerkeuzevraag is een meetinstrument waarbij men peilt naar de kennis van de respondent en derhalve onderwerp van studie in de psychometrie, een tak van de toegepaste psychologie.11 3 Voorbeeld. Beschouw I. een acht-bij-acht schaakbord; II. een acht-bij-acht schaakbord waarbij twee tegenoverliggende hoeken verwijderd zijn; III. een acht-bij-acht schaakbord waarbij de vier hoeken verwijderd zijn. Welke van deze vormen kan betegeld worden met twee-bij-een dominostenen, zonder overlappingen of gaten? A. Enkel I.

Op een schaakbord hebben tegenoverliggende hoeken hetzelfde kleur.

B. Enkel II. C. Enkel I en II. D. Enkel I en III. E. I, II en III.

Voor het toekennen van de punten maken we onderscheid tussen twee evaluatiesystemen.

Klassieke evaluatie Bij een klassieke evaluatie kent men aan elk goed antwoord 1 punt toe en aan een fout of blanco antwoord 0 punten. Noemen we X de stochast die het aantal punten weergeeft bij het gissen van één vraag met N = 5 alternatieven (rechterfiguur), dan verkrijgen we als verwachtingswaarde X 1 1 4 E(X) = pi xi = · 0 + · 1 = = 20% 5 5 5 i Een respondent die zonder nadenken blindelings alternatieven aankruist, heeft in dit evaluatiesysteem statistisch gezien toch een positieve goedscore.

X

P

fout

p(0) = P (fout) = 4/5

goed

pX

X

xi

pi

0

4/5

1

1/5 1

0

1

R

Giscorrectie Om het gissen tegen te gaan, zal men de klassieke evaluatie corrigeren door c punten af te trekken bij een foutief antwoord. Deze evaluatie staat bij studenten bekend onder de term giscorrectie. De meest rechtvaardige manier van giscorrectie bepalen we door te zorgen dat de gissende respondent statistisch gezien geen goedscore, maar ook geen foutscore heeft. Noemen we Y de stochast die het aantal punten weergeeft bij het gissen van één vraag met N = 5 alternatieven (rechterfiguur), dan wordt onze eis uitgedrukt in E(Y ) = 0 waaruit de waarde van c volgt X 4 1 1 E(Y ) = qj yj = · (−c) + · 1 = 0 ⇒ c = 5 5 4 j

Y

P

fout

p(−c) = P (fout) = 4/5

goed

qj

−c 4/5

pY

Y

yj

1

1/5 1

−c

1

R

Bij vragen met N keuzemogelijkheden bestaat de meest rechtvaardige manier van giscorrectie erin om voor elk goed antwoord 1 punt te geven, voor elk blanco antwoord 0 punten te geven en voor elk fout antwoord 1/(N − 1) punten af te trekken. Of, na herschalen: Bij een meerkeuzevraag met N keuzemogelijkheden is de meest rechtvaardige giscorrectie: goed antwoord: N − 1 punten, blanco antwoord: 0 punten, fout antwoord: −1 punten

11 Psychometrie is een wetenschap die zich bezighoudt met de technieken van het meten van psychologische fenomenen zoals kennis, vaardigheden, attituden, eigenschappen en persoonskenmerken. Voorbeelden van psychometrische instrumenten zijn het intelligentiequotiënt en gestandaardiseerde lees- en rekenvaardigheidstesten. Een eerste gefundeerde bespreking van de meest rechtvaardige giscorrectie is afkomstig van Alexander Calandra 1941. Maar zelfs bij die evaluatie bestaat er een strategie om slaagkansen te optimaliseren [1, 3].

XIV-36


Antwoorden op geselecteerde oefeningen Hoofdstuk 1 (1) Het bereik van de stochast X is ber X = {0, 1, 2, . . . , 30}. (2) De verwachtingswaarde is 1 liter, de variantie is 0, 4166 . . . vierkante centiliter. (3) (a) 14, 7% (4) noch verlieslatend, noch winstgevend (5) E(X) = 1, 75 worpen, Var(X) = 0, 6875 (6) −5, 2631 . . . euro (7) 280 euro (8) (c) De inzet van de speler moet minstens 3, 5 euro zijn. (9) (c) Saartje zal gemiddeld 0, 9 keer moeten stoppen. (11) 533, 33 . . . euro (12) E(X) = 37, 8 (13) (c) Voor

2 3 < a < is E(X) < 0. 5 3

(14) (b) b = 20 1 (c) 1/e < p e (17) (a) continu, ber X = R+ 0 (b) discreet, ber X = N (c) discreet, ber X = {0, 1, 2, . . . , 500}

(d) continu, ber X = [0; 0, 33] (uitgedrukt in liter) (e) continu, ber X = [0, c] (18) (b) 75% (19) (c) 68, 75%, 35, 2% en 0 (d) µ = 1 en σ = 0, 4472 . . . (20) (a) 100 + 100 · rand(1) (c) 78%

(d) verwachtingswaarde 150, standaardafwijking 28, 86 . . . (21) c = 3/π (22) c ∈ R+ 0

  0 (23) (a) FX (x) = − 1/225 x2 + 2/15 x   1

als x < 0 als 0 ≤ x ≤ 15 als x > 15

(24) (a) verwachtingswaarde 1 mm, variantie 0, 7 mm2 (b) verwachtingswaarde 3, 4 mm, variantie 0, 961 mm2 XIV-37


Hoofdstuk 2 (1) (a) Bernoulli en uniform (b) binomiaal (c) Bernoulli (d) Bernoulli (3) 24, 576% (4) 45, 57 . . . % (5) (a) 0, 3777 . . . % (b) 90, 1774 . . . % (6) (a) 17, 1875 . . . % (b) 0, 003925 . . . % (7) (a) 29, 84 . . . % (b) 80, 01 . . . % (c) 19, 98 . . . % (8) (a) 1, 73 . . . %, 8, 67 . . . %, 19, 50 . . . % (b) 21, 31 . . . % (c) 3, 33 . . . juiste antwoorden (9) (a) 9, 6% (b) 67, 77 . . . % (c) 3, 27 . . . % (d) 4 bonnen (10) 6, 78 . . . % (11) (a) 59, 87 . . . % (b) 8, 61 . . . % (12) De kans op succes bij één worp is 0% of 90, 90 . . . %. (13) (a) E(X) = 2, 6 medewerkers, Var(X) = 2, 6 (b) 7, 35 . . . % (c) 26, 73 . . . % (d) 4, 90 . . . % (14) [9, 452 . . . ; 10, 547 . . .] (15) [45, 47] (16) [25, 219 . . . ; 27, 180 . . .] (17) (a) 0, 9211 . . . % (b) [50, 302 . . . ; 53, 697 . . .] (18) (a) µ = 175 mm, σ = 14, 43 . . . mm (c) 20% (19) (a) 6, 68 . . . % (b) 14, 44 . . . % (c) T = 502, 01 . . . minuten (20) (a) 40, 96% (b) 32, 768%, 40, 96%, 20, 48%, 5, 12%, 0, 64%, 0, 032% (c) 25, 93 . . . %

XIV-38


(21) (a) [34, 38] (b) [35, 2; 36, 8] (c) [32, 40] (22) 2, 27 . . . % (23) (a) 30, 85 . . . %, 4, 00 . . . % (b) 50, 07 . . . euro (c) 51, 08 . . . euro (24) (a) E(X) = 6, 25 jaar, Var(X) = 6, 25 (b) 55, 06 . . . % (c) 95, 02 . . . %

XIV-39


Referentielijst [1] K. De Naeghel, Giscorrectie en optimaliseren van slaagkansen, Uitwiskeling 30/1, 2-7, 2014. [2] G. Gijbels, E. Govaert, M. Jaenen, S. Janssens, B. Sevenhant, I. Vanderstichel, P. Weyenberg, Pienter leerboek telproblemen en kansrekening statistiek II voor de derde graad 6/8, Van In, 2005. [3] Website Koen De Naeghel, data voor optimale slaagkans bij giscorrectie, http://www.koendenaeghel.be/giscorrectie.htm . [4] Website Wikipedia, http://en.wikipedia.org/

en http://en.wikipedia.org/

XIV-40

.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.