VA
© N IN
IN Statistiek en kansrekenen
©
VA
N
Derde graad D/A
Liesbeth Huys Dirk Taecke MET MEDEWERKING VAN Etienne Goemaere Tom Van der Auwera Martine Verrelst Stephan Wellecomme
Via www.ididdit.be heb je toegang tot het onlineleerplatform bij Pienter derde graad. Activeer je account aan de hand van de onderstaande code en accepteer de gebruiksvoorwaarden. Kies je ervoor om je aan te melden met je Smartschool-account, zorg er dan zeker voor dat je e-mailadres aan dat account gekoppeld is. Zo kunnen we je optimaal ondersteunen.
IN
Let op: deze licentie is uniek, eenmalig te activeren en geldig voor een periode van 2 schooljaren. Indien je de licentie niet kunt activeren, neem dan contact op met onze klantendienst.
VA
N
Fotokopieerapparaten zijn algemeen verspreid en vele mensen maken er haast onnadenkend gebruik van voor allerlei doeleinden. Jammer genoeg ontstaan boeken niet met hetzelfde gemak als kopieën. Boeken samenstellen kost veel inzet, tijd en geld. De vergoeding van de auteurs en van iedereen die bij het maken en verhandelen van boeken betrokken is, komt voort uit de verkoop van die boeken. In België beschermt de auteurswet de rechten van deze mensen. Wanneer u van boeken of van gedeelten eruit zonder toestemming kopieën maakt, buiten de uitdrukkelijk bij wet bepaalde uitzonderingen, ontneemt u hen dus een stuk van die vergoeding. Daarom vragen auteurs en uitgevers u beschermde teksten niet zonder schriftelijke toestemming te kopiëren buiten de uitdrukkelijk bij wet bepaalde uitzonderingen. Verdere informatie over kopieerrechten en de wetgeving met betrekking tot reproductie vindt u op www.reprobel.be. Ook voor het digitale lesmateriaal gelden deze voorwaarden. De licentie die toegang verleent tot dat materiaal is persoonlijk. Bij vermoeden van misbruik kan die gedeactiveerd worden. Meer informatie over de gebruiksvoorwaarden leest u op www.ididdit.be. © Uitgeverij VAN IN, Wommelgem, 2023
De uitgever heeft ernaar gestreefd de relevante auteursrechten te regelen volgens de wettelijke bepalingen. Wie desondanks meent zekere rechten te kunnen doen gelden, wordt verzocht zich tot de uitgever te wenden.
©
Credits p. 8 verhouding van vrouwen en mannen in het Europees Parlement © Europees Parlement, p. 8 aantal fietsers in Kortrijk © Stad Kortrijk, p. 8 loonkloof per leeftijdsgroep © VRT, p. 17 cocaïnesporen in het afvalwater in Antwerpen © VRT, p. 17 evolutie van het aantal ziekenhuisbevallingen in Vlaanderen © VRT, p. 22 types personen © HLN, p. 22 gezondheid 45-plussers © NOS, p. 23 peiling Brexit © Daily Mail, p. 26, 46, 80, 128, 158 en 174 vragen JWO en VWO © Vlaamse Wiskunde Olympiade vzw, p. 48 mediaan brutosalaris © VRT, p. 48 top 5 best verkochte videogames © VRT, p. 65 Ivy League-schools in Amerika © Washington Post, p. 74 etiket met schoenmaat © ithanyakorn / Shutterstock, p. 82 postzegel Blaise Pascal © catwalker / Shutterstock, p. 108 kantoor Nationale Loterij © Werner Lerooy / Shutterstock, p. 125 Suske en Wiske © Jarretera / Shutterstock, p. 172 huiswerk © Kamil Zajaczkowski / Shutterstock Eerste druk 2023 ISBN 978-94-647-0085-5 D/2023/0078/111 Art. 603763/01 NUR 120
Ontwerp cover: KaaTigo Ontwerp binnenwerk: fikfak Tekeningen: Dirk Vandamme Zetwerk: Crius Group
Inhoudsopgave 4
Hoe werk je met iDiddit?
6
Hoofdstuk 1
Verzamelen van gegevens
7
Hoofdstuk 2
Verwerken van gegevens
27
Hoofdstuk 3
Statistische kengetallen
47
Hoofdstuk 4
Kansrekening
Hoofdstuk 5
De normale verdeling
Hoofdstuk 6
Correlatie en causaliteit
©
VA
N
IN
Hoe werk je met Pienter?
81
129 159
Hoe werk je met Pienter? Elk hoofdstuk start met een inhoudsopgave en een cartoon. Dat geeft je een eerste indruk van het hoofdstuk.
HOOFDSTUK 5 I DE NORMALE VERDELING
4.1.4 Het principe van de statistische stabiliteit Als je met een (onvervalste) dobbelsteen gooit, dan weet je dat je ‘één kans op zes’ hebt om bijvoorbeeld 5 ogen te gooien. Maar wat betekent ‘één kans op zes’? Zul je dan iedere 6 worpen één keer 5 ogen gooien? Zeker niet!
Bij het begin van elk hoofdstuk maak je aan de hand van een realistische inleiding of een kort onderzoek Met ICT kun je het experiment ‘gooien met een onvervalste kennis met het eenvoudig onderwerp dobbelsteen’ simuleren. dat aan bod zal komen. 5.1
5.1
Kansdichtheidsfunctie
130
5.2
De normale kansdichtheidsfunctie
133
5.3
Berekeningen met de normale verdeling 136
5.4 De standaardnormale verdeling 5.5
140
Niet alle gegevens zijn normaal verdeeld 147
Studiewijzer
157
Pienter problemen oplossen
158
Simulatie met Excel
Kansdichtheidsfunctie
In een bepaalde cel kiest Excel zelf random een getal van 1 tot en met 6. Je kunt willekeurig naar onder en naar rechts doorvoeren.
Als je een bakje aardbeien koopt van 500 g, dan bevat het bakje zelden exact 500 g. Je kunt moeilijk een aardbei in stukken snijden. Een aselecte steekproef bij 500 bakjes aardbeien leverde de volgende frequentietabel op. massa (g)
ni
fi
[478, 482[
3
0,60 %
[482, 486[ 12 Simulatie met GeoGebra [486, 490[ 28
2,40 %
25,00 %
IN
5.1.1 Symmetrische verdeling
21,60 %
20,00 %
5,60 %
19,00 %
18,40 %
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
129
relatief aantal bakjes
[490, 494[ experimenten 59 11,80 % Je laat het aantal (n) toenemen en bepaalt telkens, op 0,01 % nauwkeurig, 15,00 % de relatieve frequentie van [494, 498[ 92 de gebeurtenis 18,40 % A: ‘5 ogen gooien’.
750
1 000
5,80 %
2 3
4
[518, 522[
[514, 518[
[510, 514[
[498, 502[
[494, 498[
[490, 494[
[486, 490[
massa (g) 500 100,00 % De frequentiedichtheid is dus de relatieve frequentie per eenheid. _ •x =Bereken de frequentiedichtheid de frequentietabel. Me = voor elke klasse van modale klasse = Naarmate het aantal herhaalde experimenten stijgt, zal de relatieve frequentie De steekproef levert een symmetrische verdelingwaarde op. van een gebeurtenis steeds meer een bepaalde benaderen. mi i i Jemassa ziet dat(g) het gemiddelde enfde mediaanfdaan elkaar gelijk zijn en in de modale klasse liggen. De oppervlakte van het gedeelte van het histogram0,06 links van de verticale rechte x = 500 f.d. [478, 482[ 480 0,60 % van de statistische stabiliteit Deze wetmatigheid is het principe of is gelijk aan de oppervlakte rechts ervan. de wet van de grote aantallen. [482, 486[ 484 2,40 % 0,05 Als gegroepeerde gegevens symmetrisch verdeeld zijn 490[ 488 er5,60 In[486, de zijn statistiek bestaat ook een wet van kleine aantallen. Alsze je over weinig gegevens dan het gemiddelde en de% mediaan aande elkaar gelijk en liggen beschikt, dan zal een afwijkend gegeven daar een grote invloed op hebben, in het 494[ midden van [490, 492de modale 11,80 klasse. % 0,04 waardoor je gemakkelijk verkeerde besluiten trekt.
VA
Algemeen
0,40 %
N
1
[482, 486[
[478, 482[
Besluit
Stap voor stap kom je meer te weten over wiskunde in het dagelijks leven.
2,00 %
0,60 %
0,00 % De frequentiedichtheid van een 2,00 klasse%in een gegroepeerde frequentietabel is [514, 518[ 10 hetmerk quotiënt van de relatieve frequentie en de klassenbreedte. Wat op? [518, je 522[ 2 0,40 %
[506, 510[
Definitie
12,40 %
[502, 506[
5.1.2
11,80 %
[498, 502[ 108 21,60 % 10,00 % n 50 100 200 300 500 [502, 506[ 95 19,00 % 5,60 % Frequentiedichtheid en kansdichtheid nA [506, 510[ 62 12,40 % 5,00 % 2,40 % f (%) A [510, 514[ 29 5,80 % Frequentiedichtheid
Je leert formuleren in definities, eigenschappen, rekenregels of besluiten. Je leert ook eigenschappen bewijzen.
[494, 498[ 496 18,40 % GeoGebra Een voorbeeld: je bent een week in Spanje geweest en het regende vijf van de zeven dagen.
[510, 514[
3
REEKS A
4
5
512
5,80 %
0,01
eenvoudige toepassingen 0
[514, 518[
516
2,00 %
[518, 522[
520
0,40 %
14
Tot welke soort verdeling (symmetrisch S, rechtsscheef R, linksscheef L) m (g) histogrammen aanleiding? geven de volgende
REEKS B Naast debasisniveau tabel zie je het bijhorende dichtheidshistogram en de frequentiepolygoon.
6
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
MAANDELIJKS KLEDINGBUDGET VAN 2 000 PERSONEN 36,50 %
35,00 % Die frequentiepolygoon is een type lijndiagram die de punten (m i , fd i) met elkaar verbindt
op de horizontale as. REEKS C en die aansluit verdiepingsniveau
30,00 % 25,00 %
• Hoe kun je uit de frequentiedichtheid van een klasse de relatieve frequentie van die klasse
©
130
40,00 %
Oefeningen zijn genummerd per hoofdstuk berekenen? en aangeduid met een verticale streep. Wat is de grafische betekenis van die berekening?
19,00 %
20,00 % 15,00 %
9,50 %
7,50 %
7,00 % 4,00 %
5,00 %
Op iDiddit vind je extra oefeningen.
2,00 %
0,00 % [0, 100[
r r
L
r
1,00 %
S
r
0,50 %
[100, 200[ [200, 300[ [300, 400[ [400, 500[ [500, 600[ [600, 700[ [700, 800[ [800, 900[ [900, 1 000[
budget in euro
• Bereken de standaardafwijking met ICT: s =
In de marge worden soms pictogrammen Schat hoeveel procent van de gegevens hoogstens één keer de standaardafwijking afwijken gebruikt. Hieronder vind je hun betekenis. van het gemiddelde. Rond af op 1 %.
DIAMETER VAN 160 KOGELLAGERS
25,00 %
relatief aantal kogellagers
ICT
S R 13,00 %
10,00 %
21,25 %
20,00 %
16,25 %
15,63 %
15,00 %
Duidt aan wanneer je bij het onlinelesmateriaal ICT-hulpmiddelen vindt om in te zetten, L bv. Excel, GeoGebra … 10,63 %
10,00 %
5,00 %
0,00 %
R
10,00 %
8,13 %
7,50 %
5,63 %
5,00 %
r r
[20,0; 20,1[ [20,1; 20,2[ [20,2; 20,3[ [20,3; 20,4[ [20,4; 20,5[ [20,5; 20,6[ [20,6; 20,7[ [20,7; 20,8[ [20,8; 20,9[
Interessante weetjes of achtergrondinformatie herken je aan een kader met vraagteken. STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
131
diameter in mm
DUUR VAN DE ZWANGERSCHAP BIJ 10 000 VROUWEN 40,00 %
37,66 %
35,00 % relatief aantal vrouwen
1
2
relatief aantal personen
6
0,03 Na elk stuk je [498,theorie 502[ 21,60 %meteen Daaruit besluiten500 datkun Spanje een land is met veeloefenen. regen, is een verkeerde statistische methode. Oefeningen [502, 506[ 504 zijn 19,00even % Niet alle oefeningen moeilijk. 0,02 86 STATISTIEK I HOOFDSTUK 4 I KANSREKENING [506, 510[ 508 12,40reeksen: % Ze zijn opgedeeld in drie REEKS A
474 476 478 480 482 484 486 488 490 492 494 496 498 500 502 504 506 508 510 512 514 516 518 520 522 524
5
30,00 % 25,00 % 20,00 %
18,58 % 16,01 %
15,00 % 10,00 %
9,83 %
8,87 %
S
r
R
r
L
r
Je leerkracht zal telkens aangeven wat precies voor jou van toepassing is.
STUDIEWIJZER Verzamelen van gegevens 1.1
voor de leerling
Wat is statistiek KENNEN
voor de leerkracht
– + – +
Statistiek is de wetenschap die zich bezighoudt met het verzamelen, ordenen, verwerken, ontleden en verklaren van gegevens (‘data’) en dat met de bedoeling om inzicht te krijgen in verschijnselen in de samenleving, de natuur ... Statistiek leert je ook kritisch denken over hoe betrouwbaar bepaalde uitspraken zijn.
KUNNEN
– + – +
KENNEN
– + – +
Op het einde van elk hoofdstuk vind je alles wat je moet kennen en kunnen bijeengebracht in een studiewijzer. Dat is een ideale leidraad om je samenvatting te maken.
Statistische terminologie toepassen.
1.2 Verzamelen van gegevens
IN
De objecten (personen, dieren, goederen waaroverde je informatie wenst, ‘Pienter problemen oplossen’. Het is aan jou om aan de hand Elk hoofdstuk sluit af…) met rubriek zijn de elementen van het onderzoek. De verzameling die wordt onderzocht steekproef. van heuristieken enis deprobleemoplossend denken de problemen op te lossen. Een kenmerk of eigenschap van een element noem je een veranderlijke of variabele. De hoedanigheden of getallen die je verkrijgt na een statistisch onderzoek zijn de gegevens of data.
Categorische gegevens beschrijven een hoedanigheid die je niet kunt tellen of meten. • Niet-geordende categorische gegevens hebben geen natuurlijke ordening. • Geordende categorische gegevens hebben een natuurlijke ordening.
VAN IN Plus Soms is het handig dat je extra lesinformatie of een videofragment zelf kunt bekijken of beluisterenKUNNEN op je smartphone. Als je dit icoon ziet, open dan de VAN IN Plus-app en scan de – + – + pagina. Het onderscheid maken tussen de elementen van een onderzoek, de steekproef, Numerieke gegevens zijn het resultaat van telling en metingen. • Discrete numerieke gegevens beperken zich tot een aantal waarden. • Continue numerieke gegevens zijn reële waarden tussen bepaalde grenzen.
variabele en de data. VAN INdePlus
De soorten gegevens opsommen en toepassen.
N
Bij een onderzoek nagaan welke soort gegevens worden gebruikt.
1
VA
2 3
4 5
6
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
©
24
Het onlineleerplatform bij Pienter derde graad Mijn lesmateriaal Hier vind je alle inhouden uit het boek, maar ook meer, zoals Excelbestanden, filmpjes, GeoGebra-toepassingen, extra oefeningen ...
IN
Extra materiaal Bij bepaalde stukken theorie of oefeningen kun je extra materiaal openen. Dat kan een bijkomend audio- of videofragment zijn, een woorden- of begrippenlijst, een extra bron of een leestekst. Kortom, dit is materiaal dat je helpt om de leerstof onder de knie te krijgen.
Adaptieve oefeningen In dit gedeelte kun je de leerstof inoefenen op jouw niveau. Hier kun je vrij oefenen of de oefeningen maken die de leerkracht voor je heeft klaargezet.
N
Opdrachten Hier vind je de opdrachten die de leerkracht voor jou heeft klaargezet.
VA
Evalueren Hier kan de leerkracht toetsen voor jou klaarzetten.
Resultaten Wil je weten hoever je al staat met oefenen, opdrachten en toetsen? Hier vind je een helder overzicht van al je resultaten.
©
Notities Heb je aantekeningen gemaakt bij een bepaalde inhoud? Via je notities kun je ze makkelijk terug oproepen.
Meer weten? Ga naar www.ididdit.be
HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
Wat is statistiek
8
1.2
Verzamelen van gegevens
10
1.3 1.4
IN
1.1
Populatie en steekproef
12
Misleidende statistiek
21 24
Pienter problemen oplossen
26
©
VA
N
Studiewijzer
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
7
1.1
Wat is statistiek
1.1.1
Herhaling
N
IN
In het dagelijkse leven kom je veel in contact met statistiek. Denk maar aan enquêtes, tabellen met cijfers, grafieken … Je ziet ze bijvoorbeeld in onlinetijdschriften en -kranten, in wetenschappelijke boeken, op de radio en op de televisie.
5.000
1,97%
1,44%
Consumptieprijsindex (CPI)
Gezondheidsindex
07/2022
01/2022
07/2021
01/2021
07/2020
01/2020
07/2019
01/2019
07/2018
01/2018
07/2017
01/2017
0,74%
07/2016
01/2016
0,56%
07/2015
01/2015
Se
M
Maand
Som Totaal afgeschafte treinen
0,34%
07/2014
2
‘2
p
‘2
ei
n
Ja
p
Se
ei
M
2
2
‘2
1
‘2
1
‘2
‘2
n
Ja
Se
1
0
‘2
p
‘2
ei
M
n
‘2
0
0
0
2,44%
2,13% 2,05%
01/2014
1.000
07/2013
2.000
01/2013
VA
3.000
Ja
11,27% 11,25%
Inflatie (%)
4.000
Inflatie 12% 11% 10% 9% 8% 7% 6% 5% 4% 3% 2% 1% 1,11% 0% –1% –2%
Jaargemiddelde CPI
Loonkloof per leeftijdsgroep
−4 %
−3 %
−2 %
−1 %
0%
1%
2%
3%
4%
5%
6%
7%
8%
9%
3%
35-44 jaar
4,5 %
45-54 jaar
4,4 %
55-64 jaar
8,5 %
©
25-34 jaar
1
Bron: Statbel
2
Definitie
3
Statistiek Statistiek is de wetenschap die zich bezighoudt met het verzamelen, ordenen, verwerken, ontleden en verklaren van gegevens (‘data’) en dit met de bedoeling om een inzicht te krijgen in verschijnselen in de samenleving, de natuur ... Statistiek leert je ook kritisch denken over hoe betrouwbaar bepaalde uitspraken zijn.
4 5 6
8
10 %
−0,1 %
Jonger dan 25
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
1.1.2 Doel van statistiek Statistisch onderzoek kun je onderverdelen in twee grote categorieën. beschrijvende statistiek
verklarende statistiek
• verzamelen van informatie • verwerken en voorstellen van informatie (ordenen in tabellen, voorstellen in grafieken) • analyseren van informatie (kenmerkende maten bepalen zoals gemiddelde, mediaan, spreiding van de gegevens ...)
• nagaan van de betrouwbaarheid van de informatie • formuleren van conclusies
IN
Statistiek is overal aanwezig in het dagelijks leven en is voor de maatschappij van groot belang. De economie, de politiek, de wetenschappen, de sport ... Ze zijn ondenkbaar zonder gebruik te maken van statistische gegevens. Hoe zouden families hun budget beheren, hoe zou een land bestuurd worden, hoe zou je verschillende prestaties op gebied van school, sport … met elkaar vergelijken zonder gebruik te maken van statistiek?
N
In de statistiek worden veel numerieke berekeningen gemaakt. Dat rekenwerk is echter een hulpmiddel en geen doel. Het doel van de statistiek is het verwerven van inzicht vanuit getallen en die verwerken in een context. Het getal 77 heeft op zich geen betekenis als je niet weet dat het bijvoorbeeld gaat om de massa van een volwassen man en dat die massa in kilogram is. De context geeft dus betekenis aan de getallen.
VA
In België publiceert de Algemene Directie Statistiek (Statbel) bijna dagelijks nieuwe cijfergegevens over bevolking, samenleving, economie en financiën, industrie, diensten, handel en vervoer, landbouw ...
Zoek op de site van Statbel het antwoord op de volgende vragen. • Wat is de meest recente consumptieprijsindex?
• Wat is de populairste voornaam bij de geboorte van een jongen in het Vlaams Gewest?
©
• Hoeveel bedroeg de gemiddelde jaartemperatuur in Ukkel tijdens het voorbije jaar?
• Hoeveel procent van de Belgische bevolking leeft in het Brussels Hoofdstedelijk Gewest?
Ook de Vlaamse overheid levert heel wat cijfermateriaal via Statistiek Vlaanderen. De Europese Unie heeft ook haar eigen statistisch bureau: Eurostat.
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
9
1.2
Verzamelen van gegevens
1.2.1 Elementen, veranderlijken en gegevens In de statistiek verzamel je gegevens door kenmerken van elementen te onderzoeken. stappen in een statistisch proces
benamingen
↓ Er wordt een verzameling elementen samengesteld die aan het onderzoek zullen deelnemen. ↓
De objecten (personen, dieren, goederen ...) waarover je informatie wenst, zijn de elementen van het onderzoek.
IN
Je wenst informatie in te winnen over een, door het toeval bepaald, verschijnsel.
De verzameling elementen die wordt onderzocht is de steekproef.
In een statistisch onderzoek worden eigenschappen van elementen nagegaan.
Een kenmerk of eigenschap van een element noem je een veranderlijke of variabele.
↓ De hoedanigheden of getallen die je verkrijgt na een statistisch onderzoek zijn de gegevens of data. Die vormen een gegevensverzameling.
N
Bij het onderzoek worden hoedanigheden of getallen verzameld. ↓
VA
De gegevens worden verwerkt in tabellen en diagrammen. Je berekent statistische kentallen.
Om de gegevens te verwerken gebruik je frequentietabellen, diagrammen, centrummaten en spreidingsmaten.
Voorbeeld
lengte
schoenmaat
favoriete hobby
kleur ogen
Marie
167 cm
38
basketbal
groen
Jef
175 cm
43
gamen
blauw
Stefanie
170 cm
40
ballet
bruin
Rune
165 cm
39
vissen
groen
©
leerling
1
2 3 4 5 6
10
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
1.2.2 Soorten gegevens categorische gegevens VIDEO
numerieke gegevens Zijn het resultaat van tellingen en metingen.
Beschrijven een hoedanigheid, die je niet kunt tellen of meten. Die gegevens noem je ook kwalitatieve gegevens. Niet-geordende categorische gegevens hebben geen natuurlijke ordening.
Die gegevens noem je ook kwantitatieve gegevens. Discrete numerieke gegevens beperken zich tot een aantal waarden.
Geordende categorische gegevens hebben een natuurlijke ordening.
Voorbeeld veranderlijke: Voorbeeld veranderlijke: aantal kinderen lengte van een vrouw, in een gezin; in cm; gegevens: 0,1 ... gegevens: 152, 176 ...
IN
Voorbeeld veranderlijke: Voorbeeld veranderlijke: favoriete sport; score op een attituderapport; gegevens: basketbal, gegevens: zeer goed, dans, hockey … goed, …, zeer slecht.
Continue numerieke gegevens zijn reële waarden tussen bepaalde grenzen.
Voorbeelden
Vink het soort gegevens aan in de volgende voorbeelden.
nietgeordend categorisch
N
veranderlijke
gegevens
geordend categorisch
discreet numeriek
continu numeriek
aantal ogen bij het gooien van een dobbelsteen
VA favoriete artiest
levensduur (in h) van lampen
aantal verkeersongevallen per jaar in een stad
©
kledingmaten
Opmerking Soms worden kwalitatieve gegevens gekwantificeerd, zoals in onderstaand voorbeeld. Ik heb voldoende inspraak in de werking van de school.
helemaal niet akkoord = 1
eerder niet akkoord = 2
eerder akkoord = 3
1
2
3
4
volledig akkoord = 4
In dit geval zijn de getallen niet meer dan codes voor de geordende categorische gegevens.
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
11
1.3
Populatie en steekproef
1.3.1 Voorbeeld
VIDEO
Definitie
Je wilt de mening weten van Vlaamse leerkrachten over het al dan niet inkorten van de zomervakantie. Alle Vlaamse leerkrachten vormen de populatie. Het is onbegonnen werk om de mening van alle leerkrachten op te vragen en te verwerken. Daarom besluit je om 5 000 Vlaamse leerkrachten te ondervragen. Die 5 000 leerkrachten noem je de steekproef. Populatie en steekproef
IN
De volledige verzameling elementen waarover je informatie wilt verkrijgen, is de populatie. Een steekproef is een deelverzameling van de populatie die wordt onderzocht. Je trekt een steekproef uit de populatie. Het is de bedoeling dat je vanuit de steekproef een zo volledig mogelijk, representatief beeld verkrijgt voor de volledige populatie.
Als je een steekproef trekt van 5 000 Vlaamse leerkrachten, met welke factoren moet je rekening houden? Geef 4 voorbeelden.
N
De besluiten die je trekt uit een steekproef, gelden voor de volledige populatie. Daarom moet je een goede kijk hebben op de samenstelling van de populatie zelf en die goed definiëren.
VA
1.3.2 Het trekken van een steekproef
Om gegevens te verzamelen kun je mensen, dieren, voorwerpen … bestuderen. Je kunt databanken raadplegen of metingen doen. Bij mensen worden vaak enquêtes afgenomen. De ondervraagde mensen noemt men de respondenten.
©
De 3 meest voorkomende vormen van enquêtes zijn: • de schriftelijke enquête (vaak via internet), • het persoonlijk interview, eventueel via de telefoon, • de panelmethode, waarbij een vaste groep mensen ondervraagd wordt over allerlei onderwerpen (kijkgewoonten, gezinsbudget ...). soort enquête
schriftelijke enquête
1
2
persoonlijk interview
3 4 5
panelmethode
6
12
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
voordeel
nadeel
1.3.3 Representatieve steekproef Opdat de gegevens die verkregen zijn uit een steekproef op een verantwoorde manier zouden kunnen worden veralgemeend naar de volledige populatie, moet de steekproef: • een voldoende grote omvang hebben. Wat is ‘voldoende’? Dat hangt af van de aard van de populatie en van het onderzoek zelf. De grootte van de steekproef hangt ook vaak af van de beschikbare financiële middelen. • een getrouwe weergave zijn van de populatie, met andere woorden representatief zijn.
IN
Er bestaan verschillende methodes om een representatieve steekproef te trekken. Let wel, je hebt nooit 100 % garantie dat de steekproef representatief is voor de populatie. aselecte (lukrake) steekproef
selecte (gerichte) steekproef
systematische steekproef
Elk element van de steekproef wordt bij toeval gekozen. Elk element heeft evenveel kans om opgenomen te worden in de steekproef.
De populatie wordt verdeeld in deelgroepen, verhoudingsgewijs samengesteld vanuit die populatie. Vervolgens wordt binnen elke deelgroep een aselecte steekproef getrokken.
De steekproefelementen worden ‘systematisch’ uit de populatie gekozen. Bijvoorbeeld: elke 5 minuten wordt een product van de montageband genomen voor onderzoek.
N
Voorbeeld: Welke soort steekproef werd hier getrokken?
VA
In een middelbare school met 400 leerlingen (150 leerlingen eerste graad, 130 leerlingen tweede graad en 120 leerlingen derde graad) wil de directie de mening van de leerlingen weten over het afschaffen van de frisdrankautomaten. Ze besluit om een steekproef te nemen van 80 leerlingen. • De leerlingen van de school krijgen elk een nummer (van 1 tot 400) en uit deze 400 nummers worden er willekeurig 80 geloot.
• Uit elke klas wordt de leerling met klasnummer 5 en 10 ondervraagd.
©
• Er worden willekeurig 30 leerlingen van de eerste graad gekozen, 26 van de tweede graad en 24 van de derde graad
1.3.4 De respons Het aantal mensen dat antwoordt op een enquête noemt men de respons. Het aantal mensen dat wel gevraagd wordt om aan een onderzoek of enquête deel te nemen, maar weigert of niet antwoordt, is de non-respons. Beide waarden worden meestal uitgedrukt in procent. Non-respons kan de waarde van een onderzoek in belangrijke mate verminderen of zelfs volledig tenietdoen.
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
13
1.3.5 Steekproeffouten Bij het samenstellen van een steekproef kunnen fouten optreden. Opportunistische steekproef
IN
Een Waregemse journalist wil onderzoeken wat de favoriete voetbalploeg van de Jupiler Pro League is bij de Vlaamse jongeren tussen 15 en 18 jaar. Hij stelt een enquête op en verstuurt die naar alle leerlingen van de tweede en derde graad van de Waregemse scholen. Waarom is deze steekproef niet representatief?
De steekproef werd op een gemakkelijke en goedkope manier samengesteld. Dat noem je een opportunistische steekproef. Selectiebias
N
Een masterstudent diergeneeskunde wil voor zijn masterproef onderzoeken hoeveel huisdieren jaarlijks op controle gaan naar de dierenarts. Hij selecteert enkel eigenaren van honden. Waarom is deze steekproef niet representatief?
VA
Dat is een voorbeeld van selectiebias: de getrokken steekproef is geen goede weerspiegeling van de populatie. Selectiebias komt voor op twee mogelijke manieren: wanneer er een verkeerde steekproef wordt gekozen of wanneer er personen uit de steekproef uitvallen. Bias betekent vertekening. Er is sprake van bias als externe factoren de uitkomsten van het gevoerde onderzoek negatief beïnvloeden en onbetrouwbaar maken. Dat kan zich in elke fase van het statistisch onderzoek voordoen en verschillende vormen aannemen, zoals respons-bias. Daarbij hebben de respondenten de neiging om onnauwkeurige antwoorden te geven in enquêtes. Non-responsbias treedt op als een deelnemer zich terugtrekt vooraleer het onderzoek is afgerond. Onderzoekersbias doet zich voor als de onderzoeker de onderzoeksvragen laat beïnvloeden door zijn of haar verwachtingen en persoonlijke gevoelens.
©
Neutrale context
Als je een enquête afneemt, moet de context zo neutraal mogelijk zijn. Zou jij eerlijk je mening geven op de vraag ‘Wat vind je van de werking van de politie in jouw stad’ aan een politieagent in uniform? Non-respons
1
Enquêtes die afgenomen worden op basis van vrijwillige respons, brengen de representativiteit in gevaar. Vrijwillige respons wil zeggen dat de ondervraagde zelf kan beslissen om al dan niet deel te nemen aan de enquête.
2 3
Daarbij duiken er twee problemen op. Vaak is de non-respons groot; mensen willen meestal geen enquêtes invullen als er geen beloning aan vasthangt. Mensen met een uitgesproken positieve of negatieve mening zijn het meest gemotiveerd om een enquête in te vullen. Dat beïnvloedt de resultaten.
4 5 6
14
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
Oefeningen REEKS A 1
Geef van de volgende onderzoeken de populatie en de steekproef. a) Een modewinkel wil weten wat zijn klanten van de service vinden. Daarom krijgt elke kopende klant in de maand maart een enquête via mail toegestuurd. • populatie: • steekproef:
• populatie: • steekproef:
IN
b) Als kwaliteitscontrole worden bij een fabrikant van diepvriesfrieten elk uur 30 frietjes afgebakken en geproefd door de kwaliteitsdienst.
c) Het tijdschrift Klasse wil weten hoe leerlingen van secundaire scholen staan tegenover alcoholgebruik. Ze ondervraagt daarom alle leerlingen tussen 16 en 18 jaar in Brusselse scholen. • populatie:
N
• steekproef:
d) NADO Vlaanderen voert de dopingcontroles uit voor Vlaamse wielerwedstrijden. Voor de Ronde van Vlaanderen controleert ze de 1e, 11e, 21e, 31e … renner in het eindklassement. • populatie:
VA
• steekproef:
Over welk soort gegevens gaat het?
In Gent staat een mooi herenhuis uit 1960 (a) te koop. De gevel is in het lichtblauw (b) geschilderd. Het huis telt 4 slaapkamers (c), 2 badkamers en 1 ruime zolder. De tuin is eerder aan de kleine kant en meet 4 bij 5 m (d). De keuken is recent gerenoveerd en is voorzien van een nieuwe inductiekookplaat met een A+ label (e). De vraagprijs is 750 000 euro (f).
©
2
(a)
(d)
(b)
(e)
(c)
(f)
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
15
3
Over welk soort steekproef gaat het? a) Bij een onderzoek naar vandalisme in een bepaalde wijk, ondervraagt de politie alle bewoners die een veelvoud van vijf in hun huisnummer hebben.
b) Bij een onderzoek naar de gemiddelde lengte van een zonnebloem in Zuid-Frankrijk heeft een onderzoeker duizend zonnebloemen gemeten op honderd verschillende bloemenkwekerijen.
IN
c) In een fabriek werken 45 werknemers. De directie wil graag de mening weten over de netheid in de fabriek. Elke werknemer krijgt een nummer. De winnende lottocijfers bepalen welke 7 werknemers ondervraagd worden.
d) In een bedrijf werken 150 arbeiders, 40 bedienden en 10 managers. De CEO wil een onderzoek voeren over de tevredenheid van zijn werknemers en besluit om willekeurig 15 arbeiders, 4 bedienden en 1 manager te ondervragen.
4
Is de steekproef groot genoeg? Motiveer je antwoord.
N
a) Sciensano, het federale onderzoekscentrum voor de volksgezondheid, wil weten of er een bepaalde buitenlandse ziekte in ons land voorkomt. Die ziekte komt bij 0,01 % van de bevolking voor. Sciensano onderzoekt daarvoor vijfhonderd Belgen.
VA
b) De uitbater van een escaperoom wil weten welke leeftijdscategorie het vaakst voorkomt. Hij neemt in een willekeurig weekend een steekproef van 35 bezoekers en bevraagt de leeftijd.
©
c) In een autofabriek werken 7 000 werknemers. De directie wil een enquête afnemen bij zijn werknemers over de veiligheid op het werk. Ze besluit om 70 werknemers te ondervragen.
5
1
2
Je wilt een onderzoek voeren naar de vrijetijdsbesteding van de Belgen en trekt daarvoor een selecte steekproef. Geef 5 criteria waarmee je de representativiteit van je steekproef zult bevorderen.
3
•
•
4
•
•
5
•
•
6
16
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
REEKS B 6
Antwerpen topt opnieuw lijst van Europese steden met cocaïnesporen in afvalwater Uit een studie van het Europese Waarnemingscentrum voor Drugs en Drugsverslaving (EMCDDA) blijkt dat er nergens in Europa meer cocaïnesporen worden aangetroffen in het afvalwater dan in Antwerpen. Daarmee blijft Antwerpen op de eerste plaats staan in de lijst. De onderzoekers hebben waterstalen uit 104 Europese steden in 21 landen onderzocht op sporen van vijf illegale stimulerende middelen (cocaïne, amfetamine, methamfetamine, ecstasy en ketamine) en cannabis. ©VRTNWS
a) Wie heeft dit onderzoek uitgevoerd?
IN
b) Geef de populatie van dit onderzoek.
c) Geef de steekproef van dit onderzoek. d) Geef de variabele van dit onderzoek.
Op vrt.be stond onderstaand diagram over de evolutie van het aantal ziekenhuisbevallingen in Vlaanderen over de periode 2012-2022.
N
7
Evolutie van het aantal ziekenhuisbevallingen in Vlaanderen
80.000
VA
75.000
70.000
65.000
60.525
60.000
55.000
50.000
45.000
©
40.000 2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
a) Geef de populatie van dit onderzoek.
b) Geef de steekproef van dit onderzoek. c) Geef de variabele van dit onderzoek. d) Welke soort variabele werd onderzocht? STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
17
8
Geef van de volgende onderzoeken de mogelijke gegevens. Over welk soort gegevens gaat het? Geef een mogelijke omschrijving van de populatie. Welke soort steekproef is aangewezen? a) het geboortegewicht van baby’s in Vlaanderen • gegevens: • soort gegevens: • populatie:
b) de bloedgroep van de Belgen • gegevens: • soort gegevens: • populatie: • soort steekproef:
IN
• soort steekproef:
c) de inhoud van een flesje bier dat van een automatische vulmachine komt • gegevens:
N
• soort gegevens: • populatie:
• soort steekproef:
VA
d) de tevredenheid van de leerlingen van de school over het nieuwe schoolreglement • gegevens:
• soort gegevens: • populatie:
• soort steekproef:
e) het aantal kinderen van gezinnen die in de Benelux wonen • gegevens:
©
• soort gegevens: • populatie:
• soort steekproef:
f) het favoriete merk van auto waarmee de Vlaming rijdt
1
• gegevens:
2
• soort gegevens:
3
• populatie:
4
• soort steekproef:
5 6
18
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
Uit het ledenbestand van een kleine fitnesszaak blijkt dat ze 45 leden heeft onder de 18 jaar, 72 tussen de 18 en de 25 en 54 leden ouder dan 25. De zaakvoerder wil een representatieve steekproef trekken van 45 leden. Hoeveel leden uit elke leeftijdscategorie moet hij ondervragen?
10
Een lokale radiozender beweert dat een op de twee mensen dagelijks naar zijn programma’s luistert. Waarom neem je die bewering het best met een flinke korrel zout?
11
Om de vraag te beantwoorden of ouders, als ze mochten kiezen, nog kinderen zouden willen, houdt een populair dagblad (dat wekelijks 792 000 lezers bereikt) een enquête. Er komen 80 reacties waaruit blijkt dat 30 % geen kinderen meer zou willen. Geef 3 redenen waarom het verkregen percentage niet betrouwbaar is.
VA
N
IN
9
‘Bij dopingcontroles zijn er dit jaar meer positieve gevallen dan vorig jaar.’ Kun je hieruit besluiten dat er meer personen zijn die doping gebruiken?
13
‘Nooit eerder bliezen zo weinig chauffeurs positief tijdens bobcampagne’, kon je lezen in een krant op 3 februari 2023. ‘Tijdens de bob-wintercampagne van afgelopen winter had slechts 1,8 % van de gecontroleerde personen te veel gedronken.’ Welke bedenkingen kun je maken over dit krantenartikel?
©
12
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
19
14
Een onderzoeksbureau wil de mening weten van Vlamingen over het invoeren van de wegentaks op de autosnelwegen. Waarom zijn de volgende steekproeven niet representatief? a) In De Panne wordt een groot aantal toeristen op de zeedijk naar hun mening gevraagd.
15
IN
b) De reizigers op de IC-trein richting Antwerpen om 14 h worden ondervraagd.
Zijn de volgende steekproeven representatief? Zijn de steekproeven op een selecte manier getrokken? Verklaar telkens je antwoord.
N
a) Er wordt onderzoek gedaan naar het aantal uren schermtijd van leerlingen van het eerste middelbaar van een bepaalde school. Enkel de leerlingen die in de avondstudie blijven, worden ondervraagd.
VA
b) Er wordt onderzoek gedaan naar de hoeveelheid cola in een blikje van 33 cl. Van alle geproduceerde blikken wordt steeds het 15e blikje gewogen.
©
c) Er wordt onderzoek gedaan naar de tevredenheid van abonnees van een telecommunicatiebedrijf, door alle klanten die naar de helpdesk bellen te ondervragen.
d) Een winkelier van bakproducten doet onderzoek naar hoe tevreden zijn klanten zijn over de kwaliteit van zijn producten. Hij heeft een fysieke winkel en een onlineshop. Hij ondervraagt elke 10e klant die een onlinebestelling plaatst en elk uur de 5e klant die naar zijn fysieke winkel komt.
1
2 3 4 5 6
20
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
1.4
Misleidende statistiek Mensen en bedrijven gebruiken misleidende statistieken om hun standpunten in een goed daglicht te zetten. De data worden meestal op een correcte manier verzameld, maar in de manier van weergeven zitten fouten. Voorbeeld 1 Een Britse gezondheidsorganisatie onderzocht in 2022 de gemiddelde lichaamslengte van volwassen mannen en stelde de resultaten voor in het onderstaande diagram.
IN
Wat kun je besluiten uit de grafiek?
Average male height per country 6’0’’ 5’11’’ 5’10’’ 5’9’’ 5’8’’ 5’7’’ 5’6’’ 5’5’’ 5’4’’
N
5’3’’ 5’2’’
Waarom is deze grafiek zo misleidend?
5’1’’ 5’0’’
USA
India
Indonesia
VA
The Netherlands UK
Voorbeeld 2
De grafiek toont de gemiddelde aardolieprijzen (in euro).
8,1%
©
3,9%
1,86
1,6%
1,89
1,79
augustus 2022
Waarom is deze grafiek misleidend?
1,72
september 2022
oktober 2022
november 2022
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
21
Oefeningen REEKS A 16
Een diëtiste beweert dat haar dieet de beste resultaten oplevert en publiceert onderstaande grafiek op haar website. Welke grafische ingrepen hebben ervoor gezorgd dat het effect van het dieet spectaculairder lijkt dan het in werkelijkheid is? gewicht in kg 115
105 100 95 90 85
aantal maanden 1
6
15
In Het Laatste Nieuws kon je op 22 april 2023 onderstaand diagram terugvinden.
N
17
IN
110
VA
a) Wat valt er op?
b) Geef een mogelijke verklaring.
‘Nederlandse 45-plussers ervaren hun gezondheid slechter dan de Nederlandse jongeren.’ Dat lijkt onderstaand diagram jou te vertellen. Maar waarom is dit diagram misleidend?
©
18
1
2 3 4 5 6
22
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
Op 3 april 2016 publiceerde de Daily Mail onderstaande grafiek. Ze toont de uitkomst van een peiling van een andere krant (The Observer) over de Brexit. De Daily Mail probeert zijn lezers te manipuleren. Op welke manier gebeurt dat?
IN
19
REEKS B 20
De tabel geeft de slaagpercentages aan de universiteit volgens studiegroep en geslacht, voor een groep van 10 000 meisjes en evenveel jongens. (Bron: prof. H. Callaert, Centrum voor Statistiek, Universiteit Hasselt) meisjes
N
studiegroep
jongens
geslaagden
inschrijvingen
geslaagden
medisch
4 584
50,00 %
4 000
49,00 %
humaan
5 000
41,00 %
2 400
40,00 %
exact
416
62,02 %
3 600
60,56 %
TOTAAL
10 000
46,00 %
10 000
51,00 %
VA
inschrijvingen
a) Waarom lijken deze cijfers elkaar tegen te spreken?
©
b) Welke besluiten kun je in werkelijkheid trekken uit de tabel?
c) Is ‘exacte wetenschappen’ de ‘gemakkelijkste’ studiegroep?
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
23
STUDIEWIJZER Verzamelen van gegevens 1.1
voor de leerling
Wat is statistiek KENNEN
voor de leerkracht
– + – +
Statistiek is de wetenschap die zich bezighoudt met het verzamelen, ordenen, verwerken, ontleden en verklaren van gegevens (‘data’) en dat met de bedoeling om inzicht te krijgen in verschijnselen in de samenleving, de natuur ... Statistiek leert je ook kritisch denken over hoe betrouwbaar bepaalde uitspraken zijn.
KUNNEN
– + – +
1.2 Verzamelen van gegevens
IN
Statistische terminologie toepassen.
KENNEN
– + – +
De objecten (personen, dieren, goederen …) waarover je informatie wenst, zijn de elementen van het onderzoek. De verzameling die wordt onderzocht is de steekproef. Een kenmerk of eigenschap van een element noem je een veranderlijke of variabele. De hoedanigheden of getallen die je verkrijgt na een statistisch onderzoek zijn de gegevens of data.
N
Categorische gegevens beschrijven een hoedanigheid die je niet kunt tellen of meten. • Niet-geordende categorische gegevens hebben geen natuurlijke ordening. • Geordende categorische gegevens hebben een natuurlijke ordening. Numerieke gegevens zijn het resultaat van telling en metingen. • Discrete numerieke gegevens beperken zich tot een aantal waarden. • Continue numerieke gegevens zijn reële waarden tussen bepaalde grenzen.
VA
KUNNEN
Het onderscheid maken tussen de elementen van een onderzoek, de steekproef, de variabele en de data. De soorten gegevens opsommen en toepassen.
©
Bij een onderzoek nagaan welke soort gegevens worden gebruikt.
1
2 3 4 5 6
24
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
– + – +
voor de leerling
1.3 Populatie en steekproef KENNEN
voor de leerkracht
– + – +
De volledige verzameling elementen waarover je informatie wilt verkrijgen, is de populatie. Een steekproef is een deelverzameling van de populatie die wordt onderzocht. Een representatieve steekproef is een steekproef die • een voldoende grote omvang heeft; • een getrouwe weergave van de volledige populatie is en dus representatief is. Een aselecte (lukrake) steekproef is een steekproef waarbij elk element van de steekproef bij toeval gekozen wordt. Elk element heeft evenveel kans om opgenomen te worden in de steekproef.
IN
Een selecte (gerichte) steekproef is een steekproef waarbij de populatie wordt verdeeld in deelgroepen, verhoudingsgewijs samengesteld vanuit die populatie. Vervolgens wordt binnen elke deelgroep een aselecte steekproef getrokken. Een systematische steekproef bestaat uit steekproefelementen die ‘systematisch’ uit de populatie worden gekozen.
De ondervraagde mensen die antwoorden bij een steekproef noemt men de respons. Het aantal mensen dat weigert of niet antwoordt, is de non-respons. Steekproeffouten bij het samenstellen van een steekproef zijn: • opportunistische steekproef, • selectiebias, • verkeerde context, • non-respons.
N
KUNNEN
– + – +
Het verschil geven tussen een populatie en steekproef. Een representatieve steekproef herkennen.
De kenmerken van een representatieve steekproef opsommen. De verschillende soorten steekproefmethodes herkennen.
VA
Bij een populatie de juiste soort steekproefmethode voorstellen. Steekproeffouten herkennen.
1.4 Misleidende statistiek
KENNEN
– + – +
©
Kritisch omgaan met besluiten die uit een steekproef worden getrokken.
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
25
Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?
❑ filter
❑ schets
❑ patroon
❑ schema/tabel
❑ kennis
❑ vereenvoudig
❑ logisch nadenken
❑ gok verstandig
❑ ...
IN
❑ concreet materiaal
1. Merlijn schrijft tachtig keer het woord ABRACADABRA op en gebruikt daarbij telkens de laatste letter A als de eerste letter van het volgende woord. Hij schrijft dus ABRACADABRABRACADABRABRACADABRA … Wat is de tachtigste letter die hij opschrijft? A) A
B) B
C) C
D) D
E) R
N
JWO, editie 2022-2023, tweede ronde
©
VA
2. Deze twaalf tandenstokers vormen samen vier vierkanten. Maak van de vier vierkanten drie vierkanten door slechts drie tandenstokers te verplaatsen. Let op: je mag geen tandenstokers breken. Je moet elke tandenstoker gebruiken, alle vierkanten moeten even groot zijn en de vierkanten moeten met elkaar verbonden zijn.
3. Drie buren leggen de oogst van hun moestuin samen. • Annelies had drie tomaten en x paprika’s. • Boudewijn had y tomaten en drie wortels. • Claudia had vier tomaten, vijf paprika’s en z wortels. Na het verdelen heeft iedereen drie tomaten, twee paprika’s en vier wortels en is er geen overschot. Waaraan is x + y + z gelijk?
1
2 3 4
A) 4
5
B) 6
C) 8
VWO, editie 2015-2016, eerste ronde
6
26
STATISTIEK I HOOFDSTUK 1 I VERZAMELEN VAN GEGEVENS
D) 10
E) 12
HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
Verwerken van categorische gegevens
2.2
Verwerken van niet-gegroepeerde numerieke gegevens
2.3
28
IN
2.1
32
Verwerken van gegroepeerde
numerieke gegevens
37 45
Pienter problemen oplossen
46
©
VA
N
Studiewijzer
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
27
2.1
Verwerken van categorische gegevens
2.1.1 Frequentietabel Bij een aselecte steekproef wordt van 60 mensen de bloedgroep bepaald. De resultaten vind je in de tabel met ruwe gegevens. O
O
A
B
O
A
O
A
O
O
A
O
O
A
O
O
A
O
A
A
A
A
O
AB
O
A
O
A
O
O
A
O
A
O
A
AB
O
O
O
B
A
O
B
O
B
O
A
O
A
A
O
A
B
A
O
A
O
A
O
IN
A
Je krijgt een duidelijker beeld door een frequentietabel op te stellen.
bloedgroep
ni
fi
• Hoeveel mensen hebben bloedgroep A of B?
VA
A
N
De eerste kolom bevat de verschillende gegevens van de variabele ‘bloedgroep’. De volgorde speelt geen rol. In de tweede kolom tel je het aantal keer dat elk gegeven (in dit voorbeeld de verschillende soorten bloedgroep) voorkomt. Dat is de absolute frequentie ni . De som van de absolute frequenties is gelijk aan de omvang van de steekproef n. In de derde kolom bereken je tot slot het relatief aantal keer dat elk gegeven voorkomt, ook wel de relatieve frequentie fi genoemd. De som van de relatieve frequenties is gelijk aan 100 %.
B
• Van hoeveel mensen van jouw klas mag je verwachten dat ze bloedgroep AB hebben?
AB O
totaal
Definitie
Absolute en relatieve frequentie
De absolute frequentie n i van een gegeven is het aantal keer dat het gegeven x i voorkomt.
©
De relatieve frequentie f i is het quotiënt van de absolute frequentie en de omvang n van de steekproef: f i = ___i . n bloedgroep
1 1
2 3 4 5 6
28
antigeen antigeen antilichamen antilichamen mag bloed A B A B doneren aan
O
universele donor
A
A, AB
B
B, AB
AB
AB
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
Je bloedgroep wordt bepaald door het al dan niet aanwezig zijn van bepaalde moleculen (‘antigenen’ en ‘antilichamen’) op de rode bloedcellen in je bloed. Er zijn vier bloedgroepen: A, B, O en AB. Je hebt een positieve resusfactor als het D-antigeen aanwezig is of een negatieve resusfactor als dat antigeen er niet is.
2.1.2 Een frequentietabel opstellen met ICT Met Excel
IN
Open op iDiddit het bestand ‘BLOEDGROEP.xlsx’ en ga als volgt te werk.
Je vindt de frequentietabel ook terug in het bestand ‘BLOEDGROEP (frequentietabel).xlsx’. Met GeoGebra
Frequentietabel opstellen met GeoGebra
N
2.1.3 Grafische voorstellingen Je kunt categorische gegevens op verschillende manieren grafisch voorstellen. Je kunt er zelf voor kiezen om de absolute frequentie of de relatieve frequentie te gebruiken. Het staafdiagram en cirkeldiagram
BLOEDGROEP VAN 60 MENSEN
VA aantal personen
32 28 24 20 16 12 8 4 0
BLOEDGROEP VAN 60 MENSEN
29
24
5
A
48,33 %
40,00 %
2
B AB bloedgroep
A B AB O
8,33 %
O
3,33 %
BLOEDGROEP VAN 60 MENSEN
aantal personen
©
De dotplot
32 28 24 20 16 12 8 4 0
29 24
5 A
B
2 bloedgroep
AB
O
Grafische voorstellingen met Excel en GeoGebra STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
29
Oefeningen REEKS A
ICT
1
Een directeur van een school wil, bij de opmaak van de uurroosters, alle leerkrachten één vrije dag toekennen. Aan 40 van de 110 leerkrachten van de school wordt gevraagd hun favoriete vrije dag aan te duiden. a) Vervolledig de frequentietabel.
c) Mogen de 40 leerkrachten willekeurig gekozen worden?
vrije dag
n i
f i
ma
12
di
4
IN
b) Hoeveel procent kiest niet voor een verlenging van het weekend?
wo
do
4
vr
9
totaal
N
d) Hoeveel leerkrachten uit de volledige populatie kiezen voor een vrije dag op vrijdag?
2
Een chef-kok heeft van de laatste 45 gasten die bij hem biefstuk aten, bijgehouden of ze hun steak liever bleu (bijna rauw), saignant, à point of bien cuit wilden. In het onderstaande staafdiagram vind je de resultaten.
VA
ICT
©
aantal eters
BAKWIJZE VAN DE STEAK
20 18 16 14 12 10 8 6 4 2 0
bleu
bakwijze
n i
bleu
1
saignant
1
à point
bien cuit
totaal
2 3 4 5
f i
saignant
30
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
bien cuit
a) Vervolledig de frequentietabel. b) Welke bakwijze wordt het meest gekozen? c) Hoeveel procent kiest voor saignant? d) Hoeveel eters kiezen voor bleu of saignant?
d) Hoeveel procent kiest niet voor bien cuit?
6
à point
REEKS B
ICT
3
Aan 45 meisjes en evenveel jongens werd gevraagd welk ontbijt ze nemen. Er was keuze tussen niet ontbijten (N), ontbijtgranen (G), brood (B), fruit (F) en melkproducten (M). MEISJES
JONGENS
N
G
B
B
N
F
M
G
N
B
G
N
N
B
M
N
G
B
G
M
F
N
G
B
N
F
M
N
B
G
F
M
N
B
N
F
M
N
G
G
B
F
G
B
G
N
N
B
G
N
B
F
M
N
B
G
B
F
G
N
B
M
N
G
B
N
B
M
B
N
G
N
F
B
G
F
M
B
G
N
F
N
G
B
G
N
N
M
B
IN
G
a) Stel met ICT een frequentietabel op voor de meisjes en de jongens. n i
N
G
B
F
M
f i
ontbijt jongens
n i
N
G
B
F
N
ontbijt meisjes
M
f i
VA
b) Hoeveel procent neemt geen ontbijt?
c) Welk soort ontbijt is even populair bij de meisjes als bij de jongens? d) Welk ontbijt nemen de meisjes het vaakst? e) Hoeveel meer jongens dan meisjes kiezen voor een ontbijt met melkproducten?
60,00 % 50,00 % aantal (in %)
©
f) Maak een gepaste grafische voorstelling voor de relatieve frequentieverdeling, waarop de cijfers voor de meisjes, de jongens en de totalen af te lezen zijn.
40,00 % 30,00 % 20,00 % 10,00 % 0,00 %
N
G
B soort ontbijt
F
M
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
31
2.2
Verwerken van niet-gegroepeerde numerieke gegevens
2.2.1 Frequentietabel Aan 90 mensen die hun rijbewijs B kwamen afhalen aan het gemeenteloket, werd gevraagd na hoeveel keer ze geslaagd waren voor het praktisch rijexamen. 1
1
5
1
2
3
1
4
2
1
2
3
1
1
3
1
2
5
1
2
3
1
2
2
1
4
1
1
2
1
1
1
3
6
2
1
2
3
1
2
1
2
1
1
3
2
1
1
4
1
2
2
3
4
1
1
5
1
3
4
1
1
5
1
2
3
1
2
1
3
2
4
1
3
1
5
6
1
2
1
1
2
4
1
2
1
4
1
3
IN
2
VA
N
Je stelt een frequentietabel op om de gegevens te ordenen. De eerste kolom bevat de verschillende waarden xi van de onderzochte variabele. In de tweede kolom tel je hoe vaak elk verschillend gegeven voorkomt, ni . De som van die frequenties is gelijk aan de omvang n van de steekproef. In de derde kolom wordt de relatieve frequentie fi berekend (in procent). De som is gelijk aan 100 %. In de kolom met de cumulatieve absolute frequentie cni noteer je hoe vaak een getal voorkomt dat kleiner dan of gelijk is aan de waarde x i . In de laatste kolom bereken je de cumulatieve relatieve frequentie cfi , het quotiënt van de cumulatieve absolute frequentie en de omvang van de steekproef. xi
ni
fi
cni
cfi
1
2 3
4
• Hoeveel mensen behaalden onmiddellijk hun rijbewijs?
• Hoeveel procent van de ondervraagden had minstens 4 pogingen nodig?
5
©
6
totaal
• Geef de betekenis van de cumulatieve relatieve frequentie van het waarnemingsgetal 4.
1 1
2
Definitie
3 4 5 6
32
Cumulatieve absolute en relatieve frequentie De cumulatieve absolute frequentie cni van het waarnemingsgetal xi is het aantal keer dat een getal voorkomt dat kleiner dan of gelijk is aan xi : cni = n1 + n2 + ... + ni . De cumulatieve relatieve frequentie cfi is het quotiënt van de cumulatieve absolute frequentie en cn de omvang van de steekproef: cfi = ____i . n
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
2.2.2 Een frequentietabel opstellen met ICT Met Excel
IN
Open het bestand ‘RIJBEWIJS.xlsx’ en ga als volgt te werk.
Je vindt de frequentietabel ook terug in het bestand ‘RIJBEWIJS (frequentietabel).xlsx’.
Frequentietabel opstellen met GeoGebra
N
2.2.3 Grafische voorstellingen
VA
Je kunt numerieke gegevens op verschillende manieren grafisch voorstellen. Je kunt er zelf voor kiezen om de absolute frequentie of de relatieve frequentie te gebruiken. Voor een cumulatief staaf- of lijndiagram gebruik je de cumulatieve absolute of cumulatieve relatieve frequentie.
HET PRAKTISCH RIJEXAMEN
50,00 % 45,00 %
44,44 %
40,00 %
percentage geslaagden
©
Het staafdiagram
35,00 % 30,00 %
24,44 %
25,00 % 20,00 %
14,44 %
15,00 %
8,89 %
10,00 %
5,56 %
5,00 % 0,00 %
2,22 % 1
2
3 4 aantal pogingen tot slagen
5
6
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
33
Het lijndiagram HET PRAKTISCH RIJEXAMEN 44 40 36 32 aantal geslaagden
28 24 20 16 12
IN
8 4 0
1
2
3 4 aantal pogingen tot slagen
De dotplot
5
6
HET PRAKTISCH RIJEXAMEN
45 40
N
40
30 25
22
20
VA
aantal geslaagden
35
15
13
10
8
5
5 0
1
2
2 3
4
5
6
aantal pogingen tot slagen
1 1
2
HET PRAKTISCH RIJEXAMEN 88 83 75
90
62 40
1
2 3 4 5 aantal pogingen tot slagen
6
3 4
Grafische voorstellingen met Excel en GeoGebra
5 6
34
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
cumulatieve relatieve frequentie
90 80 70 60 50 40 30 20 10 0
©
cumulatief aantal geslaagden
Het cumulatief staaf – en lijndiagram
100,00 % 90,00 % 80,00 % 70,00 % 60,00 % 50,00 % 40,00 % 30,00 % 20,00 % 10,00 % 0,00 %
HET PRAKTISCH RIJEXAMEN
1
2
3 4 5 aantal pogingen tot slagen
6
Oefeningen REEKS A 4
Aan 90 Vlaamse gezinnen werd gevraagd naar het aantal kinderen. Je ziet een lijndiagram. AANTAL KINDEREN BIJ VLAAMSE GEZINNEN 30
27 23
20 15 10
15 10
10 3
5 0
IN
aantal gezinnen
25
1
0
1
2
3
4 5 aantal kinderen
a) Vervolledig de frequentietabel.
0 1 2 3
fi
VA
4
ni
7
1 8
cni
cfi
N
xi
6
0
5
6 7
8
©
b) Eén op de zes gezinnen heeft juist
kinderen.
c) Hoeveel procent van de gezinnen heeft 2 of 3 kinderen? d) Hoeveel gezinnen hebben hoogstens 1 kind? e) Welk deel van de gezinnen heeft minstens 3 kinderen? f) Iets meer dan de helft van de gezinnen heeft
of
kinderen.
g) Geef, op basis van de frequentietabel, twee voorbeelden om aan te tonen dat de steekproef het best niet veralgemeend wordt naar heel Vlaanderen.
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
35
REEKS B 5
In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten werden enkel heren tussen 165 cm en 195 cm ondervraagd. 41
42
39
42
40
43
44
41
43
44
42
41
38
41
43
42
43
45
40
43
42
39
41
43
46
42
41
42
43
42
40
45
41
43
42
41
40
43
42
45
43
42
43
41
46
47
43
42
45
40
42
38
42
46
48
44
41
44
43
45
43
41
47
41
44
41
46
47
43
45
a) Stel met ICT een frequentietabel op. x i
n i
f i
38
39
40
IN
ICT
c n i
cf i
45
46
47
48
41 42 43
VA
44
N
b) Wat is de meest voorkomende schoenmaat?
©
c) Als de steekproef representatief zou zijn, hoeveel mannen op 5 000 zouden dan die meest voorkomende schoenmaat hebben?
d) Hoeveel ondervraagde heren hebben een schoenmaat 44 of 45?
1
1
2
e) Hoeveel procent heeft hoogstens 40 als schoenmaat?
3
f) Wat is de ‘kans’ om een man aan te treffen met een schoenmaat groter dan 44?
4 5
g) Teken met ICT een staafdiagram voor de enkelvoudige absolute frequentieverdeling.
6
h) Teken met ICT een cumulatief lijndiagram voor de cumulatieve relatieve frequenties. 36
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
2.3
Verwerken van gegroepeerde numerieke gegevens
2.3.1 Frequentietabel Onderzoek naar de massa, in gram, van de boekentas bij 80 leerlingen van de derde graad leverde de volgende resultaten op. Hun boekentas wordt op 10 gram nauwkeurig gewogen. VIDEO
7 930 6 620 9 180 6 960 8 340 10 080 5 800 7 740 8 060 7 560 8 290 7 810 8 600 7 020 9 360 7 860 7 990 9 580 6 290 7 200 8 470 9 800 7 990 6 010 7 430 8 010 6 030 7 970 7 180 8 070 8 110 7 990 7 030 5 320 8 610 7 770
IN
9 860 6 570 7 050 8 860 9 970 7 660 9 370 7 910 7 330 8 710 6 240 7 510
6 230 8 140 8 730 8 220 8 860 5 390 8 010 8 950 6 150 8 950 7 830 9 460 9 330 8 600 8 720 6 730 7 340 8 030 8 520 8 110 8 090 6 280 5 480 8 790 7 470 5 650 8 350 9 120 7 960 8 100 6 800 7 190
Omdat er te veel verschillende (continue) waarnemingsgetallen zijn, worden ze in klassen gegroepeerd. m i
n i
f i
cn i
cf i
[5 300, 5 900[ 5 600
5
6,25 %
[5 900, 6 500[ 6 200
7
8,75 %
[6 500, 7 100[
6 800
8
10,00 %
• Een klasse is een interval dat gesloten is in zijn ondergrens en open in zijn bovengrens. 5 6,25 % Bijvoorbeeld: de klasse [ 5 900, 6 500 [. 12 15,00 % De grenzen van de klasse noem je 20 25,00 % de klassengrenzen.
[7 100, 7 700[
7 400 10
12,50 %
30
37,50 %
[7 700, 8 300[ 8 000 24
30,00 %
54
67,50 %
[8 300, 8 900[ 8 600 13
16,25 %
[8 900, 9 500[ 9 200
8
10,00 %
[9 500, 10 100[ 9 800
5
6,25 %
N
klasse
VA
• Het klassenmidden m i is het gemiddelde van de klassengrenzen van de i-de klasse. 67 83,75 % Bijvoorbeeld: het midden van de klasse 6 500 = 6 200. [5 900, 6 500 [ is ______________ 5 900 + 75 93,75 % 2 Het klassenmidden wordt gebruikt bij 80 100 % berekeningen en grafische voorstellingen.
80 100,00 %
• De klassenbreedte is het verschil tussen de bovengrens en de ondergrens van de klasse. Je kiest voor alle klassen een gelijke klassenbreedte. Bijvoorbeeld: de breedte van de klasse [ 5 900, 6 500 [is 6 500 – 5 900 = 600.
©
• Een gegeven kan maar tot één klasse behoren. Het kleinste gegeven behoort tot de eerste klasse en het grootste gegeven tot de laatste klasse. • Het aantal klassen is minimaal 5 en maximaal 15. • De klassenfrequentie n i van de i-de klasse is het aantal waarnemingsgetallen dat tot die klasse behoort. • De andere begrippen zijn analoog als bij een niet-gegroepeerde frequentietabel.
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
37
Opmerking • Als je werkt met een gegroepeerde frequentietabel krijg je een verlies van informatie. Er zijn bijvoorbeeld 5 gegevens die tot de klasse [5 300, 5 900 [ horen, maar wat die gegevens exact zijn, is niet zichtbaar. • Soms ligt een klassenindeling vast vanuit de aard van de gegevens. Als je bijvoorbeeld met leeftijden werkt, is het logisch om bijvoorbeeld een klassenbreedte 10 te gebruiken. Enkele vragen
IN
• Beschrijf welke soort steekproef je zelf zou uitvoeren in dit onderzoek.
• Hoeveel boekentassen wegen tussen 7 100 g en 8 900 g? • Drie op de tien boekentassen weegt tussen
en
• Een kwart van de boekentassen weegt minder dan
.
.
• Hoeveel boekentassen wegen meer dan 8 300 g?
N
• Geef de betekenis van de cumulatieve relatieve frequentie van de vierde klasse.
2.3.2 Een frequentietabel opstellen met ICT Met Excel
VA
Om de klassenfrequenties te bepalen, gebruik je de functie INTERVAL(gegevensmatrix, interval_verw). Die functie telt van een geselecteerd gebied (de gegevensmatrix) hoeveel elementen in een interval ]a, b] liggen, waarbij a en b twee opeenvolgende getallen zijn van de intervalverwijzing.
©
Omdat men in de statistiek met intervallen van de vorm [a, b [ werkt, moet je een hulpkolom gebruiken: per klasse voer je de werkelijke klassenbovengrenzen (w.k.b.) in.
1 1
Open het bestand ‘BOEKENTAS.xlsx’ en
ga als volgt te werk.
• Selecteer de cellen C15 tot en met C22. • Formule: =INTERVAL(A1:L7;G15:G22). • Druk op Shift + Ctrl + Enter.
• Het resultaat van de telling komt in de geselecteerde cellen te staan.
Je vindt de frequentietabel ook terug in het bestand ‘BOEKENTAS(frequentietabel).xlsx’.
2 3 4
Frequentietabel opstellen met GeoGebra
5 6
38
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
2.3.3 Grafische voorstellingen
VIDEO
Je kunt gegroepeerde gegevens op een aantal manieren grafisch voorstellen. Je kunt er zelf voor kiezen om de absolute frequentie of de relatieve frequentie te gebruiken. Voor een ogief gebruik je de cumulatieve absolute of cumulatieve relatieve frequentie. Het histogram Een histogram is een staafdiagram waarbij: • de staven tegen elkaar getekend zijn; • de klassen uitgezet zijn op de horizontale as; • de hoogte van elke rechthoek de (relatieve) frequentie van een klasse toont.
IN
BOEKENTASSEN VAN LEERLINGEN VAN DE DERDE GRAAD 30,00 %
32,00 %
aantal in procent
28,00 % 24,00 % 20,00 %
16,25 %
16,00 % 12,00 % 8,00 %
6,25 %
8,75 %
10,00 %
10,00 %
6,25 %
4,00 % 0,00 %
12,50 %
[5 300, 5 900[ [5 900, 6 500[ [6 500, 7 100[ [7 100, 7 700[ [7 700, 8 300[ [8 300, 8 900[ [8 900, 9 500[ [9 500, 10 100[
N
massa in gram
De frequentiepolygoon
m i
n i
f i
[4 700, 5 300[
5 000
0
0,00 %
[5 300, 5 900[
5 600
5
6,25 %
[5 900, 6 500[
6 200
7
8,75 %
[6 500, 7 100[
6 800
8
10,00 %
[7 100, 7 700[
7 400
10
12,50 %
[7 700, 8 300[
8 000
24
30,00 %
[8 300, 8 900[
8 600
13
16,25 %
[8 900, 9 500[
9 200
8
10,00 %
[9 500, 10 100[
9 800
5
6,25 %
10 400
0
0,00 %
←
©
VA
klasse
[10 100, 10 700[
Een frequentiepolygoon is een gebroken lijn die de roosterpunten (m i , n i ) of (m i , f i ) verbindt en die aansluit op de horizontale as in de punten (a, 0) en (b, 0). Daarbij is a het klassenmidden van de klasse die de eerste klasse van de steekproef voorafgaat en b het klassenmidden van de klasse die op de laatste klasse van de steekproef volgt. Op die manier ontstaat een veelhoek of polygoon.
←
BOEKENTASSEN VAN LEERLINGEN VAN DE DERDE GRAAD
26 24 22
aantal boekentassen
20 18 16 14 12 10 8 6 4 2 0
5 000
5 600
6 200
6 800
7 400 8 000 massa in gram
8 600
9 200
9 800
10 400
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
39
Het ogief cfi
bi
0
0,00 %
5 300
5
6,25 %
5 900
12
15,00 %
6 500
20
25,00 %
7 100
30
37,50 %
7 700
54
67,50 %
8 300
67
83,75 %
8 900
75
93,75 %
9 500
80
100,00 %
10 100 ↑
Een ogief is een gebroken lijn die de roosterpunten (a 1, 0) en (b i , cn i ) of (b i , cf i ) met elkaar verbindt. Daarbij is a 1de klassenondergrens van de eerste klasse en b i de klassenbovengrens van de i-de klasse. Bij deze grafische voorstelling wordt de cumulatieve frequentie van elke klasse dus toegekend aan de klassenbovengrens van de klasse. De klassenondergrens a 1van de eerste klasse is de klassenbovengrens van de klasse voorafgaand aan de eerste klasse van de steekproef. Die klasse geef je de cumulatieve frequentie 0 of 0 %.
IN
cni
BOEKENTASSEN VAN LEERLINGEN VAN DE DERDE GRAAD
100,00 % 90,00 %
60,00 % 50,00 % 40,00 %
N
70,00 %
VA
cumulatieve relatieve frequentie
80,00 %
30,00 % 20,00 % 10,00 %
0,00 % 5 300
5 900
6 500
7 100
7 700
8 300
8 900
9 500
massa in gram
Maak gebruik van het ogief om de volgende vragen op te lossen.
©
• Hoeveel procent van de boekentassen weegt minder dan 8 kg? • Hoeveel moet een boekentas wegen om tot de 20 % zwaarste boekentassen te behoren?
• Hoeveel procent van de boekentassen weegt tussen de 5,3 en 6,5 kg?
1 1
Grafische voorstellingen met Excel en GeoGebra
2 3 4 5 6
40
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
10 100
Oefeningen REEKS A 6
114 leerlingen studeerden vorig jaar af aan onze school. Hun procentuele jaartotalen voor het vak wiskunde vind je in het histogram. JAARTOTAAL WISKUNDE 35 30 26
24
25 20
IN
aantal leerlingen
30
15
9
10 5
5 0
5
9
4
1
1
[40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[ [65, 70[ [70, 75[ [75, 80[ [80, 85[ [85, 90[ jaartotaal (in %)
a) Geen enkele leerling behaalde of meer.
N
b) Hoeveel leerlingen zijn gedelibereerd voor wiskunde?
c) Hoeveel procent van de leerlingen behaalde tussen 60 % en 70 %?
VA
d) Hoeveel leerlingen behaalden meer dan 75 %?
Van 49 bezoekers aan de Zonnegloed werd de leeftijd gevraagd. Het resultaat is weergegeven in onderstaand ogief.
cumulatief relatief aantal bezoekers
AANTAL BEZOEKERS
©
7
100 % 90 % 80 % 70 % 60 % 50 % 40 % 30 % 20 % 10 % 0 % 0% 5
100,00 % 89,80 % 79,59 %
63,27 %
40,82 %
30,61 %
16,33 %
15
25
35
leeftijd
45
55
65
75
a) Geen enkele bezoeker was jonger dan jaar. b) Hoeveel procent van de bezoekers is ouder dan 55 jaar? c) Hoeveel bezoekers behoren tot de leeftijdsklasse [ 25, 35[? STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
41
REEKS B 8
Een conservenfabrikant krijgt klachten over de netto-inhoud van zijn blikken met erwtjes, die volgens de verpakking 1 l zou moeten bedragen. Daarom laat hij een steekproef uitvoeren. Om de 100 blikjes wordt er eentje van de lopende band genomen. In totaal wordt zo van 40 blikjes de inhoud, in ml, bepaald. 985
996
990
1 004
1 003
1 006
1 005
997
999
1 000
991
981
982
1 003
1 015
1 001
998
1 012
1 023
997
996
1 015
1 027
1 011
994
1 020
981
1 005
977
988
1 000
987
990
999
1 013
IN
ICT
988
998
1 009
1 003
a) Over welk soort steekproef gaat het? b) Stel een frequentietabel op met ICT. eerste klasse: laatste klasse:
N
c) Geef de betekenis van de cumulatieve relatieve frequentie van de vierde klasse.
d) Hoeveel procent bevat te weinig erwtjes?
e) Hoeveel blikjes bevatten tussen 980 ml en 1 020 ml?
VA
f) Stel de enkelvoudige absolute frequentieverdeling voor met een histogram.
g) Teken een frequentiepolygoon voor de enkelvoudige relatieve frequenties. h) Stel de cumulatieve relatieve frequentieverdeling voor met een ogief. i) Los de vragen op met behulp van het ogief.
• Hoeveel procent bevat minder dan 985 ml?
©
• Hoeveel blikjes bevatten meer dan 1 012 ml?
• Welk deel van de blikjes bevat tussen 993 ml en 1 007 ml?
1 1
• Hoeveel moet een blikje bevatten om tot de lichtste 25 % te behoren?
2
3 4
• Vanaf welke inhoud behoort een blikje tot de zwaarste 10 %?
5
6
42
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
992
De tabel bevat de procentuele jaartotalen voor het vak wiskunde van de 114 leerlingen die vorig jaar aan onze school afstudeerden. 63
56
82
45
62
67
70
76
52
88
61
67
46
71
66
64
80
59
64
77
71
58
81
47
78
66
64
75
53
72
84
73
63
54
69
61
64
71
70
80
65
46
67
72
75
61
69
62
62
84
61
54
69
74
75
66
77
71
66
65
70
69
68
44
66
65
64
63
52
61
71
82
60
74
65
66
71
70
72
74
76
73
57
61
65
69
73
67
61
65
62
63
IN
9
69
67
65
66
68
75
71
70
67
64
63
60
80
66
72
81
45
70
73
61
64
69
N
a) Stel een frequentietabel op. eerste klasse:
laatste klasse:
VA
b) Hoeveel leerlingen zijn niet geslaagd voor wiskunde?
c) Hoeveel procent van de leerlingen behaalde tussen 60 % en 70 %? d) Hoeveel procent van de leerlingen behaalde minder dan 75 %? e) Teken een frequentiepolygoon voor de enkelvoudige absolute frequenties. f) Stel de cumulatieve relatieve frequentieverdeling voor met een ogief. g) Los de vragen op met behulp van het ogief.
©
• Vanaf hoeveel procent behoorde een leerling tot het ‘betere kwart’? • Je behaalt onderscheiding als je jaartotaal tussen 67,5 % en 75 % ligt. Hoeveel leerlingen kunnen aanspraak maken op deze graad?
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
43
REEKS C 10
Een brouwer doet een aselecte steekproef om te weten te komen of de machines die de bierflesjes vullen, voldoende nauwkeurig werken. Op de etiketten van de bierflesjes staat dat de netto-inhoud 33 cl is. Van 50 flesjes wordt de inhoud, in cl, gecontroleerd. 32,6
33,3
32,5
33,2
34,5
31,8
35
34,4
33
34
31,7
34,3
32,9
32,5
33,6
33,1
34,2
31,4
32,6
34,6
34,9
33,4
31,6
34,5
35,1
35,3
34,1
34,2
31,1
36
34,2
32,7
34,6
32,2
33,8
34,4
31,7
35,6
33,9
32,1
33,7
32,3
33,7
31,9
33,5
32,6
33
34,8
35,7
32,8
a) Stel een frequentietabel op met ICT. eerste klasse: laatste klasse:
IN
ICT
b) Hoeveel procent van de flesjes bevat te weinig bier? c) Hoeveel flesjes bevatten minstens 35 cl?
N
d) Hoeveel procent van de flesjes bevat tussen 32 cl en 34 cl?
e) Teken een histogram voor de enkelvoudige absolute frequentieverdeling. f) Teken een frequentiepolygoon voor de enkelvoudige relatieve frequenties.
VA
g) Stel de cumulatieve relatieve frequentieverdeling voor met een ogief. h) Los de vragen op met behulp van het ogief.
• Hoeveel procent van de flesjes bevat meer dan 32,5 cl? • Hoeveel moet een flesje bevatten om tot de 20 % minst gevulde flesjes te behoren?
©
• Hoeveel procent van de flesjes heeft een inhoud die minstens 0,8 cl afwijkt van wat op het etiket staat?
1 1
2 3 4 5 6
44
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
STUDIEWIJZER Verwerken van gegevens voor de leerling
2.1 Verwerken van categorische gegevens KENNEN
voor de leerkracht
– + – +
De absolute frequentie n ivan een gegeven is het aantal keer dat het gegeven voorkomt. De relatieve frequentie f iis het quotiënt van de absolute frequentie en de omvang n van de steekproef: f i = ___i . n
KUNNEN
– + – +
Een frequentietabel voor kwalitatieve gegevens opstellen en interpreteren.
IN
Grafische voorstellingen maken van de frequentieverdeling: dotplot, staafdiagram en cirkeldiagram.
2.2 Verwerken van niet-gegroepeerde numeriek gegevens KENNEN
– + – +
N
De absolute frequentie n i van het waarnemingsgetal x iis het aantal keren dat dat gegeven voorkomt. De relatieve frequentie f iis het quotiënt van de absolute frequentie en de omvang n van de steekproef: f i = ___i . n
De cumulatieve absolute frequentie cn i van het waarnemingsgetal x iis het aantal keer dat een getal voorkomt dat kleiner dan of gelijk is aan x i ; cn i = n 1 + n 2+ ... + n i . De cumulatieve relatieve frequentie cf iis het quotiënt van cn i de cumulatieve absolute frequentie en de omvang van de steekproef: cf i = ____ . n
VA
KUNNEN
– + – +
Een frequentietabel voor niet-gegroepeerde numerieke gegevens opstellen en interpreteren. Grafische voorstellingen maken van de frequentieverdeling: dotplot, staafdiagram, lijndiagram, cumulatief staafdiagram en cumulatief lijndiagram.
2.3 Verwerken van gegroepeerde numerieke gegevens KENNEN
– + – +
Het klassenmidden m iis het gemiddelde van de klassengrenzen van de i-de klasse.
©
De klassenfrequentie n i van de i-de klasse is het aantal waarnemingsgetallen dat tot die klasse behoort.
KUNNEN
– + – +
Een frequentietabel voor gegroepeerde numerieke gegevens opstellen en interpreteren.
Grafische voorstellingen maken van de frequentieverdeling: histogram, frequentiepolygoon en ogief.
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
45
Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?
❑ filter
❑ schets
❑ patroon
❑ schema/tabel
❑ kennis
❑ vereenvoudig
❑ logisch nadenken
❑ gok verstandig
❑ ...
IN
❑ concreet materiaal
1. In een vaas zitten twee kleuren knikkers: groen en geel. Het percentage groene knikkers is 16 % en het aantal gele is 63. Hoeveel knikkers van elke kleur zitten in de vaas?
VA
N
2. Anika schrijft de getallen 1 tot en met 8 in de cirkels van onderstaand diagram, zodat geen twee rechtstreeks verbonden cirkels opeenvolgende getallen bevatten. Hoeveel bedraagt de som van de twee getallen in de gekleurde cirkels?
B) 5
©
A) 3
C) 7
D) 9
E) 11
JWO, editie 2022-2023, tweede ronde
1
3. Een stapelbare tuinstoel is 90 cm hoog. Een stapel van zes tuinstoelen is 150 cm hoog. Hoe hoog is een stapel van tien tuinstoelen?
1
2 3 4 5 6
46
STATISTIEK I HOOFDSTUK 2 I VERWERKEN VAN GEGEVENS
HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
Centrummaten
48
3.2
Kwartielen
61
3.3
IN
3.1
Spreidingsmaten
65 78
Pienter problemen oplossen
80
©
VA
N
Studiewijzer
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
47
3.1
Centrummaten Doorsnee voltijds werkende Vlaming verdient 3 300 euro bruto per maand
IN
VIDEO
VA
N
April 2023: kouder, natter en minder zon dan normaal
Top 5 best verkochte pc- en console videogames in België voor het jaar 2022
Bijna helft van de Belgen komt moeilijk rond
©
1
FIFA 23
2
3
4
5
Call of Duty: MWII
Grand Theft Auto V
Elden Ring
FIFA 22
Bron: Business AM
1
2
Om tot de bovenstaande besluiten te komen, gebruikt men kenmerkende getallen die het centrum van een gegevensrij weergeven, ook wel centrummaten genoemd. De meest gekende centrummaat is het (rekenkundig) gemiddelde, maar ook de mediaan en de modus zijn veelgebruikte statistische kengetallen om het centrum van een verdeling te beschrijven. Op die manier kun je verschillende statistische onderzoeken met elkaar vergelijken.
3 4 5 6
48
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
3.1.1 Het gemiddelde Ruwe gegevens Definitie
(Rekenkundig) gemiddelde _ Het gemiddelde x van een rij numerieke gegevens x 1, x 2, ..., x n is de som van die gegevens gedeeld door het aantal gegevens: x + x 2 + ... + x n _ _____________ x= 1 n
Opmerkingen
Voorbeeld
IN
• Het gemiddelde heeft dezelfde eenheid als de waarnemingsgetallen (cm, kg ...). • Je rondt het gemiddelde af op één cijfer meer na de komma dan de oorspronkelijke gegevens.
De tabel bevat het aantal tot het verkeer toegelaten nieuwe personenauto’s voor de periode 2015-2022 in België. jaar
2015
2016
2018
2019
2020
2021
2022
553 692 557 487 557 970 439 038 392 769 374 597
N
aantal nieuwe 506 284 546 142 personenwagens
2017
VA
Bereken het gemiddeld aantal nieuwe personenwagens per jaar.
Met ICT – Excel:
©
Open het bestand ‘AUTO.xlsx’.
GeoGebra
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
49
Niet-gegroepeerde frequentietabel Stel dat er k verschillende waarnemingsgetallen x i (x 1, x 2, ..., x k) zijn met respectievelijke frequenties n i (n 1, n 2, ..., n k). Formule
x + n 2 x 2 + ... + n k x k _ n________________________ x= 1 1 n Voorbeeld
ni
0
1
1
4
2
3
3
6
4
7
5
2
totaal
• Bereken het gemiddelde.
• Als je score boven het gemiddelde ligt, behoor je dan automatisch tot de ‘betere helft’ van de klas?
N
x i (punten op 5)
IN
De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden. In de frequentietabel vind je de resultaten van de klas.
Met ICT – Excel:
©
VA
Open het bestand ‘WISKUNDE.xlsx’.
GeoGebra
1
2
3 4 5 6
50
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
Gegroepeerde frequentietabel Stel dat er k klassen zijn met respectievelijk klassenmiddens m i (m, m 2, ..., m k) en klassenfrequenties n i (n 1, n 2, ..., n k). Formule
m 1 + n 2 m 2 + ... + n k m k _ n__________________________ x≈ 1 n
Merk op dat deze berekening een benadering is voor het gemiddelde, omdat je met de klassenmiddens werkt en niet met de werkelijke gegevens. Voorbeeld
IN
Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige per maand krijgt. Hij ondervraagt daarvoor 100 jongeren. mi
ni
[0, 5[
2,5
1
[5, 10[
7,5
8
[10, 15[
12,5
7
[15, 20[
17,5
20
[20, 25[
22,5
10
[25, 30[
N
• Bereken het gemiddelde.
zakgeld (in euro)
[30, 35[ [35, 40[ [40, 45[
25
32,5
10
37,5
15
42,5
2
47,5
2
VA
[45, 50[
27,5
• Wat is de betekenis van dit getal?
totaal
Met ICT – Excel:
©
Open het bestand ‘ZAKGELD.xlsx’.
GeoGebra STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
51
Eigenschappen van het gemiddelde eigenschap
voorbeeld De resultaten van een sporttest kun je zowel weergeven op 20 als op 100:
Als je alle waarnemingsgetallen met eenzelfde factor (≠ 0) vermenigvuldigt, dan wordt ook het gemiddelde met die factor vermenigvuldigd.
leerling
resultaat op 20
resultaat op 100
1
12
60
2
16
80
3
14
70
IN
Bereken het gemiddelde voor het resultaat op 20:
Bereken het gemiddelde voor het resultaat op 100:
Het gemiddelde maandloon is 1 654,20 euro. Iedereen krijgt 25 euro opslag per maand. Het nieuwe gemiddelde maandloon wordt
N
Als je bij elk waarnemingsgetal eenzelfde constante term optelt, dan wordt die term ook bij het gemiddelde opgeteld.
De som van de afwijkingen van alle waarnemingsgetallen ten opzichte van het gemiddelde is 0.
x i
_ x i – x
10
12
14
16
18
–4
–2
0
2
4
_ met x = 14
VA
De positieve en de negatieve afwijkingen ten opzichte van het gemiddelde heffen elkaar op.
Voor- en nadelen van het gemiddelde
Het gemiddelde houdt rekening met alle gegevens en is zeer geschikt bij wetenschappelijk onderzoek.
Voorbeeld
©
De tabel toont het aantal kinderen van 16 gezinnen. 2
1
3
0
2
1
4
3
0
9
1
2
2
3
0
1
Het gemiddelde is
1
Hoeveel gezinnen hebben minder kinderen dan het gemiddelde?
2
Er is één gezin met veel meer kinderen dan het gemiddelde. Verwijder de ‘uitschieter’ en
3
bereken opnieuw het gemiddelde:
4
Hoeveel waarnemingsgetallen liggen nu onder het gemiddelde?
5
6
Besluit: 52
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
.
3.1.2 De mediaan Ruwe gegevens Definitie
Mediaan
n+1. De mediaan Me van een gerangschikte rij met n getallen is het getal met rangorde _____ 2 De mediaan is • het middelste waarnemingsgetal als n oneven is; • het rekenkundig gemiddelde van de twee middelste waarnemingsgetallen als n even is.
Voorbeeld 1: n is oneven
IN
Er zijn evenveel waarnemingsgetallen kleiner dan of gelijk aan de mediaan als groter dan of gelijk aan de mediaan.
De eigenaar van een buurtwinkel noteert gedurende één week het aantal klanten per dag. De aantallen zijn al gerangschikt. Bepaal de mediaan. 15
28
35
36
39
40
, dus Me =
.
N
De mediaan is het getal met rangorde
66
Betekenis:
Voorbeeld 2: n is even
VA
Een hockeyploeg telt het aantal gemaakte doelpunten tijdens 8 wedstrijden. De gegevens staan al gerangschikt van klein naar groot. Bepaal de mediaan. 0
0
0
1
1
2
2
4
De mediaan is het getal met rangorde
. Je neemt het gemiddelde van de getallen
met rangorde
.
dus Me =
©
Betekenis:
en
Met ICT – Excel: Open het bestand ‘AUTO.xlsx’.
GeoGebra
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
53
Niet-gegroepeerde frequentietabel De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden. In de frequentietabel vind je de resultaten van de klas. x i (punten op 5)
n i
c n i
0
1
Om de mediaan te bepalen, gebruik je de cumulatieve frequentieverdeling.
1
4
De mediaan is het getal met rangorde
2
3
3
6
4
7
5
2
totaal
dus Me =
IN
Betekenis:
Met ICT – Excel:
GeoGebra
N
Er is geen specifieke formule om de mediaan te berekenen in een niet-gegroepeerde frequentietabel in Excel. Je kunt de bovenstaande werkwijze gebruiken.
Gegroepeerde frequentietabel
VA
Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren.
m i
n i
c n i
[0, 5[
2,5
1
[5, 10[
7,5
8
[10, 15[
12,5
7
[15, 20[
17,5
20
[20, 25[
22,5
10
[25, 30[
27,5
25
[30, 35[
32,5
10
[35, 40[
37,5
15
4
[40, 45[
42,5
2
5
[45, 50[
47,5
2
6
totaal
©
zakgeld (in euro)
1
2
3
54
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
Om de mediaan te bepalen, gebruik je de cumulatieve frequentieverdeling. De mediaan is het getal met rangorde en ligt dus in de klasse . Je noemt die klasse de mediaanklasse. Je neemt het midden van de mediaanklasse als eerste benadering voor de mediaan. Dus . Betekenis:
De mediaan bepalen via de klassenmiddens is niet nauwkeurig genoeg. Een betere benadering krijg je via het ogief. Je bepaalt de 50 %-grens. 100 %
96 %
98 %
100 %
81 %
80 % 71 %
70 % 60 % 50 %
46 %
40 %
36 %
30 % 20 %
16 % 9%
10 % 0%
0%
1%
0
5
IN
cumulatieve relatieve frequentie
90 %
Me
10
15
20
25
30
35
40
45
50
zakgeld (in euro)
Me Met ICT – Excel:
VA
GeoGebra
N
Er is geen specifieke formule om de mediaan te berekenen in een gegroepeerde frequentietabel in Excel. Je kunt de bovenstaande werkwijze gebruiken.
Voor- en nadelen van de mediaan
• Neem opnieuw het voorbeeld van het aantal kinderen van 16 gezinnen. 0
0
0
1
1
1
1
2
2
2
2
3
3
3
4
9
Me: getal met rangorde:
©
Betekenis mediaan:
_ x=
⇒ Me =
De mediaan is, door zijn gedefinieerde centrale ligging, niet gevoelig voor uitschieters.
• Voor een toets wiskunde behaalden 15 leerlingen van een klas de volgende punten. 6
6
6
6
6
6
6
7
7
7
9
9
10
10
Me: getal met rangorde:
6
⇒ Me =
De mediaan houdt enkel rekening met de rangorde van de gegevens, niet met de waarde van de gegevens boven of onder de mediaan. STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
55
3.1.3 De modus Definitie
Modus De modus Mo is het gegeven met de grootste frequentie. De modale klasse is de klasse met de grootste frequentie. Opmerkingen • Het kan voorkomen dat een rij waarnemingsgetallen 2 modi heeft. Je noemt dat een bimodale steekproef. • Zijn er 3 of meer getallen met eenzelfde grootste frequentie, dan wordt de modus (of modale klasse) niet gedefinieerd.
IN
Voorbeeld 1
De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden. In de frequentietabel vind je de resultaten van de klas. n i
0
1
1
4
2
3
3 4 5
Mo =
6
Betekenis:
7
2
23
VA
totaal
Bepaal de modus.
N
x i (punten op 5)
Voorbeeld 2
Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. m i
n i
[0, 5[
2,5
1
[5, 10[
7,5
8
[10, 15[
12,5
7
[15, 20[
17,5
20
[20, 25[
22,5
10
[25, 30[
27,5
25
[30, 35[
32,5
10
[35, 40[
37,5
15
[40, 45[
42,5
2
[45, 50[
47,5
2
©
zakgeld (in euro)
1
2
3 4 5 6
totaal 56
100
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
Bepaal de modale klasse = Betekenis:
Met ICT – Excel: Als je beschikt over een tabel met ruwe gegevens, dan gebruik je de functie ‘=MODUS.ENKELV(...)’. Beschik je niet over zo’n tabel, dan is er geen specifieke formule om de modus te berekenen.
GeoGebra
Voor- en nadelen van de modus • Het aantal huisdieren van een klas van 14 leerlingen is: 0
1
1
2
2
2
2 _ x=
Mo =
Betekenis:
1
1
2
3
3
6
IN
0
Me =
De modus is niet vatbaar voor uitschieters.
• De resultaten op 10 van een toets aardrijkskunde van een klas van 13 leerlingen zijn:
10 Mo =
5
6
7
8
10
10
10
10
10
9
_ x=
VA
Betekenis:
5
N
4
Me =
De modus ligt niet centraal in de gegevens en zegt dus weinig over het midden van de gegevens.
• Van een klas werd de oogkleur genoteerd. grijs
blauw
groen
groen
blauw
grijs
bruin
bruin
bruin
bruin
groen
grijs
bruin
blauw
bruin
©
Mo:
Het gemiddelde en de mediaan kun je niet bepalen, de modus wel. De modus kan dus ook gebruikt worden voor categorische gegevens.
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
57
Oefeningen REEKS A De tabel bevat de leeftijden van de dansers in een dansgroep. Bepaal de centrummaten en geef de betekenis. 16
17
18
18
18
19
20
De frequentietabel geeft het aantal geboren biggen per zeug weer in een bepaalde boerderij.
aantal biggen
5
6
7
8
9
10
11
ni
3
6
2
7
8
7
5 juist
fout
a) De helft van de zeugen krijgt hoogstens/minstens 9 biggen.
❒
❒
b) Het meest voorkomend aantal biggen per zeug is 6.
❒
❒
c) Het gemiddeld aantal biggen per zeug is 8,3.
❒
❒
© 3
totaal
Juist of fout? Vink aan en verbeter indien fout.
VA
2
16
IN
15
N
1
Jason speelt darts. In de frequentietabel vind je het aantal punten per worp van zijn laatste oefenspel. Punten per worp
[0, 10[
[10, 20[
[20, 30[
[30, 40[
[40, 50[
[50, 60[
4
7
3
4
1
2
mi ni
1
Bereken zijn gemiddelde werpscore.
2
3 4 5 6
58
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
REEKS B
ICT
4
In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten, werden enkel heren tussen 165 cm en 195 cm ondervraagd. 41 42 42 40 43 42 43
42 41 39 45 42 38 41
39 38 41 41 43 42 47
42 41 43 43 41 46 41
40 43 46 42 46 48 44
43 42 42 41 47 44 41
44 43 41 40 43 41 46
41 45 42 43 42 44 47
43 40 43 42 45 43 43
44 43 42 45 40 45 45
IN
a) Bereken het gemiddelde en geef de betekenis.
b) Bepaal de mediaan en geef de betekenis.
c) Bepaal de modus en geef de betekenis.
Om de maat van een hemd te bepalen wordt de omtrek van de hals (in cm) gemeten. Daarbij wordt een extra ruimte vrijgehouden van ongeveer ‘2 vingers’. Daarnaast moet je ook rekening houden met je figuur (‘regular fit’, ‘slim fit’ ...). De tabel bevat de maten van de hemden die in één week zijn verkocht in een kledingzaak.
N
5
maat
36
37
38
39
40
41
42
43
44
45
46
ni
5
10
17
20
26
22
16
8
5
2
3
c) De helft van de hemden heeft hoogstens maat
.
VA
ICT
a) Welke maat komt het meeste voor?
b) Bereken de gemiddelde maat.
6
Van de 163 kinderen die vorig jaar in een kraamkliniek werden geboren, is het geboortegewicht (in g) opgetekend. gewicht [1 100, 1 400[ [1 400, 1 700[ [1 700, 2 000[ [2 000, 2 300[ [2 300, 2 600[ [2 600, 2 900[ [2 900, 3 200[ [3 200, 3 500[ [3 500, 3 800[ [3 800, 4 100[ [4 100, 4 400[ [4 400, 4 700[ totaal
©
ICT
ni 1 3 2 7 13 28 41 35 19 8 4 2 163
a) Bereken het gemiddelde geboortegewicht. b) De helft van de pasgeborenen heeft een geboortegewicht van minstens/hoogstens
. (Los op via een ogief.)
c) De meeste voorkomende gewichtsklasse is
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
.
59
7
Hamza scoort op 3 testen chemie een gemiddelde van 75%. Als hij voor de laatste 3 testen 100% zou halen, wat is dan zijn nieuwe gemiddelde?
Bepaal a en b zodat het gemiddelde 30 en de mediaan 31 is. 5
10
18
25
_ Vul de rij getallen aan zodat Me = 4,5; x = 5en Mo = 2.
2
REEKS C
ICT
10
45
b
9
N
9
40
a
IN
8
Het ogief toont gegevens over de duur van een menselijke zwangerschap. 100 %
100 %
93 %
80 %
VA
cumulatieve relatieve frequentie
90 %
81 %
70 %
60 %
60 % 50 % 40 %
35 %
30 % 20 %
3%
230
©
10 % 0% 0% 220
16 %
6%
240
250
260
270
aantal dagen
a) De helft van de zwangerschappen duurt korter dan . b) Bepaal de modale klasse en geef de betekenis.
1
2
c) Bereken het gemiddelde en geef de betekenis.
3 4
5
6
60
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
280
290
300
3.2 Definitie
Kwartielen Kwartielen
n + 1 . (25 % van de gegevens ligt links van Q .) Het eerste kwartiel Q 1 is het getal met rangorde _____ 1 4 n + 1 . (50 % van de gegevens ligt links van Q .) Het tweede kwartiel Q 2 is het getal met rangorde _____ 2 2 ( ) 3 n + 1 Het derde kwartiel Q 3 is het getal met rangorde ________. (75 % van de gegevens ligt 4 links van Q3.) • De kwartielen verdelen de gegevensrij in 4 delen met evenveel waarnemingsgetallen. • Het tweede kwartiel Q2 is de mediaan Me.
25 %
25 %
25 %
IN
25 %
Ruwe gegevens Voorbeeld:
Aan 16 gezinnen werd het aantal kinderen gevraagd. 0
0
1
1
1
1
2
2
2
2
3
3
3
4
9
N
0
• Q 1 heeft rangorde Betekenis:
VA
• Q 2 heeft rangorde Betekenis:
• Q 3 heeft rangorde Betekenis:
⇒ Q1 = ⇒
Q2 =
⇒
Q3 =
Met ICT – Excel:
©
Open het bestand ‘AUTO.xlsx’.
GeoGebra STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
61
Niet-gegroepeerde frequentietabel Voorbeeld De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden. In de frequentietabel vind je de resultaten van de klas. Je bepaalt de kwartielen via de 25 %-grens, de 50 %-grens en de 75 %-grens.
x i (punten op 5)
n i
c n i
cf i
0
1
1
1
4
5
Betekenis:
2
3
8
3
6
14
4
7
21
5
2
23
totaal
23
IN
Q 1 = Q 2 = Q 3 =
Met ICT – Excel:
GeoGebra
N
Er zijn geen specifieke formules om de kwartielen te berekenen in een niet-gegroepeerde frequentietabel in Excel. Je kunt de bovenstaande werkwijze gebruiken.
VA
Gegroepeerde frequentietabel Voorbeeld
Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. Je bepaalt de kwartielen via de 25 %-grens, de 50 %-grens en de 75 %-grens. Een eerste benadering is door gebruik te maken van de klassen waarin de kwartielen gelegen zijn.
m i
n i
cf i
[0, 5[
2,5
1
[5, 10[
7,5
8
[10, 15[
12,5
7
[15, 20[
17,5
20
[20, 25[
22,5
10
1
[25, 30[
27,5
25
2
[30, 35[
32,5
10
3
[35, 40[
37,5
15
4
[40, 45[
42,5
2
5
[45, 50[
47,5
2
6
totaal
©
zakgeld (in euro)
62
100
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
Q 1 = Q 2 = = Q 3 = Betekenis:
De kwartielen bepalen via de klassenmiddens is niet nauwkeurig genoeg. Een betere methode is om te werken met het ogief. Via het ogief kun je eenvoudig de 25 %-grens, 50 %-grens en 75 %-grens bepalen. 100 %
96 %
98 %
100 %
90 % 81 % 71 %
70 % 60 % 50 %
46 %
40 %
36 %
30 % 20 %
16 % 9%
10 % 0%
IN
cumulatieve relatieve frequentie
80 %
0%
1%
0
5
10
15
Q1
20
25
Q2
30
Q3
35
40
45
50
N
zakgeld (in euro)
Q 1 ≈ Q 2 = Me ≈ Q 3 ≈ Opmerking:
VA
Op een analoge manier kun je een rij verdelen in 10 of 100 delen. Je spreekt dan van decielen en percentielen. Met ICT – Excel:
Er zijn geen specifieke formules om de kwartielen te berekenen in een gegroepeerde frequentietabel in Excel. Je kunt de bovenstaande werkwijze gebruiken.
©
GeoGebra
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
63
Oefeningen REEKS A De tabel bevat de leeftijden van de dansers in een dansgroep. Bepaal de kwartielen en geef de betekenis. 15
16
16
17
REEKS B 12
18
18
19
20
In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten, werden enkel heren tussen 165 cm en 195 cm ondervraagd. (zie oefening 4)
N
ICT
18
IN
11
VA
Bepaal de kwartielen en geef telkens de betekenis.
ICT
13
Om de maat van een hemd te bepalen wordt de omtrek van de hals (in cm) gemeten. Daarbij wordt een extra ruimte vrijgehouden van ongeveer ‘twee vingers’. Daarnaast moet je ook rekening houden met je figuur (‘regular fit’, ‘slim fit’ ...). (zie oefening 5) a) Een kwart van de verkochte hemden heeft hoogstens maat
.
b) De helft van de verkochte hemden heeft hoogstens maat
©
c) 75 % van de verkochte hemden heeft hoogstens maat
ICT
14
2
3 4 5 6
64
.
Van de 163 kinderen die vorig jaar in een kraamkliniek werden geboren, is het geboortegewicht (in g) opgetekend. (zie oefening 6) Bepaal de kwartielen via het ogief en geef telkens de betekenis.
1
.
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
3.3
Een middelgrote hond wordt gemiddeld 12 jaar. Een kwart van de honden wordt niet ouder dan 11 jaar en een kwart wordt zelfs ouder dan 13 jaar.
13,8 mm verschil in neerslag tussen de natste en de droogste dag in april.
IN
VIDEO
Spreidingsmaten
VA
N
Sint-Martens-Latem is opnieuw de gemeente met het hoogste gemiddelde inkomen.
Bron: hln.be
©
Wie in Amerika afstudeert aan één van de Ivy League-schools (zoals Harvard, Yale, Princeton ...) verdient meer dan wie naar een klassieke universiteit gaat.
Bron: U.S. Dept. of Education College Scorecard
De bovenstaande voorbeelden tonen dat er naast centrummaten nog andere kenmerkende getallen zijn die in een statistisch onderzoek worden gebruikt. Ze geven de spreiding weer ten opzichte van die centrummaten. Je noemt ze spreidingsmaten.
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
65
3.3.1 De variatiebreedte Definitie
Variatiebreedte De variatiebreedte R (‘range’) is het verschil tussen het grootste en het kleinste waarnemingsgetal. Ruwe gegevens Voorbeeld Aan 16 gezinnen werd het aantal kinderen gevraagd: 0
0
1
1
1
1
2
2
2
2
3
3
3
4
9
IN
0
Bepaal de variatiebreedte R = Niet-gegroepeerde frequentietabel n i
0
1
1
4
2
3
3
6
4 5 totaal
Voorbeeld
De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden.
N
x i (punten op 5)
Bepaal de variatiebreedte R =
7
2
23
VA
Gegroepeerde frequentietabel m i
n i
[0, 5[
2,5
1
[5, 10[
7,5
8
[10, 15[
12,5
7
[15, 20[
17,5
20
[20, 25[
22,5
10
[25, 30[
27,5
25
[30, 35[
32,5
10
[35, 40[
37,5
15
[40, 45[
42,5
2
[45, 50[
47,5
2
©
zakgeld (in euro)
totaal
100
In een gegroepeerde frequentietabel is het verschil tussen de bovengrens van de laatste klasse en de ondergrens van de eerste klasse een benadering voor de variatiebreedte. Voorbeeld Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. Bepaal de variatiebreedte R =
Voor- en nadelen van de variatiebreedte
1
De variatiebreedte is eenvoudig te berekenen en is daarom geschikt voor het snel verkrijgen van een eerste, vrij ruwe schets van de spreiding van de waarnemingsgetallen.
2
3
De nadelen zijn dat de variatiebreedte • enkel rekening houdt met de twee uiterste waarden en daardoor zeer gevoelig is voor uitschieters; • geen rekening houdt met de frequenties van de waarnemingsgetallen.
4 5 6
GeoGebra 66
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
3.3.2 De interkwartielafstand Definitie
Interkwartielafstand De interkwartielafstand IQR (‘interquartile range’) is het verschil tussen het derde en het eerste kwartiel. • De interkwartielafstand bakent de middelste 50 % van de gegevens af. • Hoe verder Q3 en Q1 uit elkaar liggen, hoe groter de spreiding is van de gegevens. Ruwe gegevens Aan 16 gezinnen werd het aantal kinderen gevraagd. 0
0
1
1
2
2
2
3
3
Q1 =
1
1
2
3
4
9
IN
0
(zie 3.2)
Q3 =
Niet-gegroepeerde frequentietabel
IQR =
De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden.
IQR =
(zie 3.2)
Q3 =
N
Q1 =
Gegroepeerde frequentietabel
VA
Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. Q1 =
IQR =
Q3 =
(zie 3.2)
Voor- en nadelen van de interkwartielafstand
De interkwartielafstand houdt in zekere mate rekening met de frequenties van de gegevens en kan relatief eenvoudig bepaald worden.
©
Het nadeel is dat de interkwartielafstand enkel de spreiding weergeeft van de middelste helft van de gegevens. Er wordt geen rekening gehouden met de 25 % kleinste en de 25 % grootste gegevens. GeoGebra
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
67
3.3.3 De boxplot De nadelen die de variatiebreedte en/of de interkwartielafstand opleveren, worden via de boxplot opgelost. VIDEO
De 5-getallen-samenvatting van een verdeling bestaat uit het minimum, het eerste kwartiel, de mediaan, het derde kwartiel en het maximum. Een boxplot is een grafische voorstelling van de 5-getallen-samenvatting en bestaat uit • een rechthoek (de box) met de interkwartielafstand als basis; • een verticale lijn in de box, die de plaats van de mediaan weergeeft; • lijnstukken die de box verbinden met het minimum en het maximum.
IN
Een boxplot verdeelt de gegevens in vier gebieden die elk 25 % van de waarnemingsgetallen bevatten. IQR
25 %
25 %
middelste 50 %
25 %
25 %
N
R MIN
Opmerking
Me
Q1
Q3
MAX
VA
• Bij gegroepeerde gegevens neem je als minimum de ondergrens van de eerste klasse en als maximum de bovengrens van de laatste klasse. • Je kunt het gemiddelde via de boxplot schatten door het midden van de box te bepalen. Voorbeeld
©
Teken de boxplot voor het aantal kinderen van de 16 gezinnen en bespreek.
0
1
2
3
4
5
6
GeoGebra
1
2
3 4 5 6
68
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
7
8
9
Oefeningen REEKS A 15
Bij een snelheidscontrole op een gewestweg werd op een vrijdag de snelheid van auto’s (in km/h) opgemeten. Van deze gegevens wordt een boxplot getekend. 43
61,5
68 70
89
a) Vul in:
IN
43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89
Een kwart van de auto’s rijdt hoogstens De helft van de auto’s rijdt minstens De maximaal gemeten snelheid is b) Bepaal: IQR =
.
.
N
R=
.
c) Schat het gemiddelde.
VA
REEKS B
Aan een aantal mensen is gevraagd hoeveel geld (in euro) ze afgelopen oudjaar aan cadeautjes hebben uitgegeven. Het resultaat vind je in de onderstaande boxplot. 0
0
25
10
20
50
30
40
50
77,50
60
70
80
90
77,60
100
110
120
130
140
150
160
Waar of niet waar? Verklaar met behulp van de boxplot.
©
16
a) Het bedrag dat werd uitgegeven aan cadeautjes varieert tussen 0 en 160 euro.
b) 50 % van de groep mensen geeft hoogstens 77,50 euro uit.
c) Er werden 100 mensen ondervraagd.
d) Er geven evenveel mensen minstens 77,50 euro uit als hoogstens 25 euro.
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
69
ICT
17
In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten, werden enkel heren tussen 165 cm en 195 cm ondervraagd. (zie oefeningen 4 en 12) a) Bereken de interkwartielafstand. b) Bereken de variatiebreedte. c) Teken de boxplot en bespreek.
ICT
18
IN
Om de maat van een hemd te bepalen wordt de omtrek van de hals (in cm) gemeten. Daarbij wordt een extra ruimte vrijgehouden van ongeveer ‘twee vingers’. Daarnaast moet je ook rekening houden met je figuur (‘regular fit’, ‘slim fit’ ...). (zie oefeningen 5 en 13) Teken de boxplot en bespreek.
N
19
Van de 163 kinderen die vorig jaar in een kraamkliniek werden geboren, is het geboortegewicht (in g) opgetekend. (zie oefeningen 6 en 14)
VA
ICT
Teken de boxplot en bespreek.
20
Een brouwer doet een aselecte steekproef om te weten te komen of de machine die de bierflesjes vult, voldoende nauwkeurig werkt. Op de etiketten van de bierflesjes staat dat de netto-inhoud 25 cl is. Van 65 flesjes wordt de inhoud (in cl) gecontroleerd.
©
ICT
klasse
n i
[22, 23[
2
[23, 24[
7
1
[24, 25[
13
2
[25, 26[
17
3
[26, 27[
14
[27, 28[
9
[28, 29[
3
4 5
a) Bepaal de variatiebreedte. b) Bepaal de kwartielen via het ogief en geef de betekenis. Q1 =
Q2 =
Q3 =
6
70
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
3.3.4 De standaardafwijking
x i
n i
_ x i – x
_ n i (x i – x )
_2 (x i – x )
_2 n i (x i – x )
1
3
2
3
3
7
4
5
5
2
som
IN
VIDEO
Een klas kreeg een toets voor wiskunde. Er konden 5 punten verdiend worden. De resultaten zie je in de frequentietabel. _ Bereken het gemiddelde x = .
Je kunt voor elk resultaat kijken hoe ver het zich van het gemiddelde bevindt. _ Voor elke x iverkrijg je zo de afwijking ten opzichte van het gemiddelde: x i – x .
Bereken je het gemiddelde van die afwijkingen, dan krijg je als resultaat: .
N
Dat komt omdat de afwijkingen ten opzichte van het gemiddelde zowel positief als negatief zijn. De positieve en negatieve afwijkingen neutraliseren elkaar. _2 Daarom kwadrateer je die afwijkingen: ( x i – x ) en bereken je de gemiddelde kwadratische afwijking. 2 Je noemt die gemiddelde kwadratische afwijking ook de variantie s : 2
s =
VA
De afwijkingen ten opzichte van het gemiddelde worden zo groter gemaakt dan ze in werkelijkheid zijn. Een ander probleem is dat het resultaat niet meer dezelfde eenheid heeft als de waarnemingsgetallen zelf. Een spreidingsmaat in dezelfde eenheid als de waarnemingsgetallen is de positieve vierkantswortel uit de variantie. Dat getal noem je de standaardafwijking: s=
De berekening van een standaardafwijking voor een populatie verschilt van die voor een steekproef.
Formule
Standaardafwijking van een populatie _____________________________ _2 _2 _2 ( x 1 – x ) + ( x 2 – x ) + ... + ( x n – x ) _____________________________ s = n
©
√
Bij een steekproef zul je een kleine correctie moeten maken omdat je niet met de volledige populatie werkt. In plaats van te delen door n, deel je bij de berekening van de variantie uit een steekproef door n – 1. Dat noem je de Gausscorrectie.
Formule
Standaardafwijking van een steekproef _____________________________ _2 _2 _2 x 1 – x ) + ( x 2 – x ) + ... + ( x n – x ) _____________________________ ( s = n–1
√
Opmerking • Je rondt de standaardafwijking af op twee cijfers meer na de komma dan de oorspronkelijke gegevens. • De betekenis van de standaardafwijking zul je later ontdekken in hoofdstuk 5. • Voor grote aantallen (n) is het verschil tussen s en s zeer klein. STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
71
Ruwe gegevens Voorbeeld: Aan 16 gezinnen werd het aantal kinderen gevraagd. 0
0
0
1
1
1
1
2
2
2
2
3
3
3
4
9
_ x=
(zie 3.1.1)
Met ICT – Excel: Open het bestand ‘AUTO.xlsx’.
.
IN
De standaardafwijking is s =
GeoGebra
N
Opmerking: STDEV.P gebruik je bij een populatie, STDEV.S gebruik je voor een steekproef.
VA
Niet-gegroepeerde frequentietabel Voorbeeld
De klas 5 Autotechnieken kreeg een opdracht voor wiskunde. Er konden 5 punten verdiend worden.
©
Open het bestand ‘WISKUNDE.xlsx’.
1
De standaardafwijking is s =
2
3
GeoGebra
4 5 6
72
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
.
Gegroepeerde frequentietabel Voorbeeld Een onderzoeker wil weten hoeveel zakgeld een Vlaamse 17-jarige krijgt per maand. Hij ondervraagt daarvoor 100 jongeren. Opmerking Bij een gegroepeerde frequentietabel kan de standaardafwijking enkel benaderd worden door gebruik te maken van de klassenmiddens.
N
IN
Open het bestand ‘ZAKGELD.xlsx’.
.
VA
De standaardafwijking is s ≈
©
GeoGebra
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
73
3.3.5 De standaardscore De gemiddelde schoenmaat van een Belgische vrouw is 39. De standaardafwijking is 1,62. In de Verenigde Staten is de gemiddelde schoenmaat 6,78 met een standaardafwijking van 0,873. De Vlaamse Talitha heeft maat 41, haar Amerikaanse nicht Jennifer heeft maat 7,5. Wie heeft relatief gezien de grootste maat?
Definitie
Standaardscore
IN
Om die vraag te kunnen beantwoorden, moet je de gegevens onafhankelijk maken van de meeteenheid. Daarvoor gebruik je de standaardscore. _ xi – x ______ . De standaardscore of z-score van een waarnemingsgetal x i is het getal z i = s
De z-score drukt het verschil uit van een waarnemingsgetal ten opzichte van het gemiddelde in verhouding tot de standaardafwijking. Gebruik van de standaardscore
N
Omdat de standaardscore onafhankelijk is van de meeteenheid, is het een goed instrument om gegevens van verschillende steekproeven met elkaar te vergelijken. standaardscore z < −2
betekenis
meer dan 2 keer de standaardafwijking onder het gemiddelde: uitzonderlijk laag laag
1<z<2
hoog
VA
−2 < z < −1 −1 < z < 1 z>2
minder dan 1 keer de standaardafwijking verwijderd van het gemiddelde: behorend tot de standaardgroep
meer dan 2 keer de standaardafwijking boven het gemiddelde: uitzonderlijk hoog
Wie heeft relatief de grootste schoenmaat?
©
zT =
Besluit:
1
Oefeningen
2
3
GeoGebra
4 5 6
74
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
zJ =
Oefeningen REEKS B
ICT
21
In opdracht van een schoenenfabrikant werd aan 70 volwassen heren (ouder dan 18 jaar) de schoenmaat gevraagd. Om de ‘uitzonderlijk’ grote maten uit te sluiten, werden enkel heren tussen 165 cm en 195 cm ondervraagd. (zie oefeningen 4, 12 en 17) a) Bereken de standaardafwijking. b) Diëgo heeft schoenmaat 46. Bereken de standaardscore en geef de betekenis.
IN
ICT
22
Een machine maakt kogellagers die een diameter van 20,50 mm moeten hebben. Bij een controle wordt van veertig kogellagers de diameter (in mm) bepaald.
20,48 20,32 20,53 20,82 20,20 20,44 20,48 20,71 20,55 20,33 20,39 20,38 20,73 20,50 20,26 20,65 20,72 20,81 20,44 20,57 20,51 20,49 20,43 20,32 20,50
N
20,53 20,36 20,86 20,54 20,41
20,53 20,36 20,32 20,67 20,69 20,42 20,56 20,34 20,44 20,52
a) Bereken het gemiddelde.
VA
b) Is de machine goed afgesteld?
c) Bereken de standaardafwijking.
23
Bepaalde doosjes met punaises zouden volgens het etiket 120 punaises bevatten. De fabrikant doet een steekproef bij 95 willekeurige doosjes punaises. Het resultaat zie je in de frequentietabel. x i
n i
115 116 117 118 119 120 121 122 123 124 125 126 totaal
2 5 7 10 12 18 13 12 6 6 3 1 95
©
ICT
a) Bereken het gemiddelde. b) Is de vulmachine goed afgesteld? c) Bereken de standaardafwijking.
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
75
ICT
24
Om de maat van een hemd te bepalen wordt de omtrek van de hals (in cm) gemeten. Daarbij wordt een extra ruimte vrijgehouden van ongeveer ‘twee vingers’. Daarnaast moet je ook rekening houden met je figuur (‘regular fit’, ‘slim fit’ ...). (zie oefeningen 5, 13 en 18) a) Bereken de standaardafwijking. b) Pjotr heeft maat 36. Bereken de standaardscore en geef de betekenis.
IN
Een leerkracht Frans geeft aan het begin van het schooljaar een woorddictee met 10 moeilijke woorden. De frequentietabel toont het aantal gemaakte fouten. x i
n i
0
7
a) Het gemiddeld aantal fouten is 3,4. Bereken de standaardafwijking.
N
25
1
10
2
9
3
14
4
8
5
11
6
8
7
6
totaal
73
b) Heeft iemand met 7 fouten een uitzonderlijk slecht dictee gemaakt?
VA
ICT
ICT
26
Van de 163 kinderen die vorig jaar in een kraamkliniek werden geboren, is het geboortegewicht (in g) opgetekend. (zie oefeningen 6, 14 en 19) Bereken de standaardafwijking.
©
27
1
2
De gemiddelde lengte van de Amerikaanse man is 175,5 cm, met een standaardafwijking van 5,82 cm. De gemiddelde Belgische man meet 180,4 cm en de standaardafwijking is 6,14 cm. Wie is relatief het grootst: een Amerikaan van 180 cm of een Belg van 185 cm?
3
4
5 6
76
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
28
Aan negentig Vlaamse gezinnen werd het aantal kinderen gevraagd. 3
2
2
2
3
0
4
1
0
3
1
5
2
3
2
0
1
1
0
2
2
2
1
3
1
2
3
4
2
1
2
4
2
1
3
3
1
1
5
4
2
2
4
3
1
0
2
2
3
1
0
1
4
0
1
2
0
4
5
2
1
2
1
2
2
1
4
4
1
2
2
2
4
2
3
0
1
3
2
0
1
2
1
6
3
1
8
3
1
3
IN
ICT
a) De helft van de gezinnen heeft minstens kinderen.
b) Een kwart van de gezinnen heeft hoogstens kinderen. c) Als je het aantal kinderen van 1 000 Vlaamse gezinnen samentelt, hoeveel kinderen kun je dan verwachten?
N
d) Bereken de standaardafwijking: e) Een gezin heeft 4 kinderen. Bereken de standaardscore en geef de betekenis.
VA
29
In een drukke winkelstraat werd aan 200 vrouwen gevraagd welk budget (in euro) ze elke maand aan kleding besteden. a) Vul in (maak gebruik van het ogief)
budget
n i
[0, 100[
15
[100, 200[
73
[200, 300[
38
[300, 400[
26
[400, 500[
19
[500, 600[
14
[600, 700[
8
[700, 800[
4
[800, 900[
2
[900, 1 000[
1
©
ICT
• Een kwart van de vrouwen besteedt minstens per maand.
• Een kwart van de vrouwen besteedt hoogstens per maand.
b) Gemiddeld besteedt een vrouw per maand aan kleding. c) Teken de boxplot en bespreek.
c) Bereken de interkwartielafstand: d) Bereken de variatiebreedte: e) Bereken de standaardafwijking: STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
77
STUDIEWIJZER Statistische kengetallen voor de leerling
3.1 Centrummaten KENNEN
_ Het gemiddelde x van een rij numerieke gegevens x 1, x 2, ..., x nis de som van die gegevens gedeeld door het aantal gegevens: x + x 2+ ... + x n _ _____________ x = 1 n
voor de leerkracht
– + – +
Stel dat er k verschillende waarnemingsgetallen x i (x 1, x 2, ..., x k) zijn met respectievelijke frequenties n i (n 1, n 2, ..., n k). 1 x 1 + n 2 x 2+ ... + n k x k _ n_______________________ x = n
IN
Stel dat er k klassen zijn met respectievelijk klassenmiddens m i (m, m 2, ..., m k) met klassenfrequenties n i (n 1, n 2, ..., n k). 1 m 1 + n 2 m 2+ ... + n k m k _ n x ≈ _________________________ n
n + . 1 De mediaan Me van een gerangschikte rij met n getallen is het getal met rangorde _____ 2 De modus Mo is het gegeven met de grootste frequentie. De modale klasse is de klasse met de grootste frequentie.
KUNNEN
– + – +
Het gemiddelde berekenen van een rij gegevens of vanuit een frequentietabel.
N
De betekenis van het rekenkundig gemiddelde formuleren.
De mediaan bepalen van een rij gegevens, vanuit een frequentietabel of met behulp van een ogief. De betekenis van de mediaan formuleren.
De modus of modale klasse bepalen van een rij gegevens vanuit een frequentietabel.
VA
De betekenis van de modus formuleren.
3.2 Kwartielen
KENNEN
– + – +
KUNNEN
– + – +
©
1 Het eerste kwartiel Q 1is het getal met rangorde _____ n + 4 (25 % van de gegevens ligt links van Q1). 1 Het tweede kwartiel Q 2is het getal met rangorde _____ n + 2 (50 % van de gegevens ligt links van Q2). 3 (n + 1) Het derde kwartiel Q 3is het getal met rangorde ________ 4 (75 % van de gegevens ligt links van Q3).
De kwartielen bepalen van een rij gegevens, vanuit een frequentietabel of met behulp van een ogief. De betekenis van de kwartielen formuleren.
1
2
3 4 5 6
78
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
voor de leerling
3.3 Spreidingsmaten KENNEN
voor de leerkracht
– + – +
De variatiebreedte R (‘range’) is het verschil tussen het grootste en het kleinste waarnemingsgetal. De interkwartielafstand IQR (‘interquartile range’) is het verschil tussen het derde en het eerste kwartiel.
De standaardafwijking van een populatie: ___________________________ _2 _2 _2 ( x 1 – x ) + ( x 2 – x ) + ... + ( x n – x ) = ___________________________ s n
√
De standaardafwijking van een steekproef: ___________________________ _2 _2 _2 ( x 1 – x ) + ( x 2 – x ) + ... + ( x n – x ) ___________________________ s = n–1
√
IN
De 5-getallen-samenvatting van een verdeling bestaat uit het minimum, het eerste kwartiel, de mediaan, het derde kwartiel en het maximum. Een boxplot is een grafische voorstelling van de 5-getallen-samenvatting.
_ x i – x ______ . De standaardscore of z-score van een waarnemingsgetal x i is het getal z i = s
KUNNEN
– + – +
De standaardafwijking berekenen van een rij gegevens of vanuit een frequentietabel.
©
VA
N
De standaardscore gebruiken om de ligging van een gegeven ten opzichte van het gemiddelde te specifiëren.
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
79
Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?
❑ filter
❑ schets
❑ patroon
❑ schema/tabel
❑ kennis
❑ vereenvoudig
❑ logisch nadenken
❑ gok verstandig
❑ ...
IN
❑ concreet materiaal
1. In een klas van 30 leerlingen met 12 meisjes en 18 jongens kiest elke leerling ofwel een bijkomend uur Italiaans ofwel een bijkomend uur Spaans. Er kiezen 24 leerlingen een uur Italiaans. De som van het aantal meisjes die Italiaans kiezen en het aantal jongens die Spaans kiezen, is 12. Hoeveel meisjes kiezen voor een uur Italiaans? A) 5
B) 6
C) 7
D) 8
E) 9
N
JWO, editie 2021-2022, tweede ronde
VA
2. Piet gooit 5 keer met 2 dobbelstenen. Het resultaat per worp wordt berekend door het aantal ogen van de 2 dobbelstenen te vermenigvuldigen (als Piet 3 en 6 gooit, is het resultaat van de worp 18). Piet gooit 5 keer met de dobbelstenen: • De 2e worp geeft 5 punten meer dan de 1e. • De 3e worp geeft 6 punten minder dan de 2e. • De 4e worp geeft 11 punten meer dan de 3e. • De 5e worp geeft 8 punten minder dan de 4e.
©
Hoeveel punten haalde Piet in elk van de 5 worpen?
3. In een klein stadspark met één ingang en één uitgang kun je enkel wandelen op eenrichtingspaden zoals in de figuur. Op hoeveel verschillende manieren kun je van de ingang naar de uitgang wandelen?
1
2
3 4
A) 4
5
B) 5
JWO, editie 2021-2022, tweede ronde
6
80
STATISTIEK I HOOFDSTUK 3 I STATISTISCHE KENGETALLEN
C) 6
D) 7
E) 8
HOOFDSTUK 4 I KANSREKENING
4.1
Basisbegrippen van de kansrekening
92
IN
4.2 Tellen met verzamelingen
82 99
4.4 De uniforme kansverdeling
109
4.5 Kansbomen
116
Studiewijzer
126
Pienter problemen oplossen
128
©
VA
N
4.3 De productregel
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
81
4.1
Basisbegrippen van de kansrekening
4.1.1 Inleiding Van waar is het woord ‘wiskunde’ afkomstig? In vele talen bestaat er een woord dat afgeleid is van het woord ‘mathematica’ (de wetenschap van de eigenschap van getallen en het meten van grootheden). Het woord ‘wiskunde’ komt van het middeleeuwse woord ‘wisconst’, bedacht door de Belg Simon Stevin (1548-1620). Het woord betekent ‘kunst van het zekere’.
In de statistiek beschrijf je toevalsveranderlijken met behulp van verzamelde data, die je analyseert en waaruit je besluiten trekt. In de kansrekening gebruik je wiskundige regels en modellen om het toeval te beschrijven. Beide deeldomeinen staan nooit los van elkaar en vullen elkaar aan.
N
Algemeen
IN
Maar vele zaken uit de natuur en de samenleving zijn niet met zekerheid voorspelbaar. Denk maar aan kansspelen, het aantal kinderen per gezin, het hebben van een ongeval ... Daarbij wordt de uitkomst bepaald door het toeval. De tak van de wiskunde die zich bezighoudt met het beschrijven van verschijnselen die door het toeval worden beheerst, is de waarschijnlijkheidsrekening. Die bestaat uit twee deeldomeinen: de statistiek en de kansrekening.
VA
In vele gebieden hield men jarenlang tabellen bij in verband met geboortes, sterftes, huwelijken, landbouw ..., maar pas in de zeventiende eeuw is men zich beginnen bezighouden met de wiskundige beschrijving van onzekerheden. Het begon toen de Franse wiskundige Blaise Pascal (1623-1662) in 1654 een brief kreeg van Chevalier de Méré. Daarin vroeg hij uitleg over twee ‘kansproblemen’. Het eerste probleem ging over het eerlijk verdelen van de inzet bij een gokspel als het spel vroegtijdig moet worden stopgezet.
©
Zijn tweede vraag ging over het feit waarom hij op de lange duur geld verloor als hij gokte dat bij 24 worpen met twee dobbelstenen er minstens één keer een dubbele zes zou komen. Pascal begon erover een briefwisseling met Pierre de Fermat (1601-1665) en uiteindelijk kwamen ze tot een oplossing. Je zult in dit hoofdstuk beide problemen ook zelf oplossen.
1
2 3
4 5 6
82
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
Het eerste bekende werk over kansrekening kwam er in 1713. In het boek Ars Conjectandi (‘de kunst van het gissen’) beschreef de Zwitser Jacob Bernoulli kansen als getallen die tussen 0 en 1 liggen.
4.1.2 Experiment, uitkomstenverzameling en gebeurtenis Experiment Als je een dobbelsteen opgooit en noteert hoeveel ogen je hebt geworpen, dan doe je een experiment. Je kunt dit experiment zo vaak herhalen als je maar wilt. Definitie
Experiment
IN
Een experiment is een handeling, een waarneming, een telling ... met als doel een door het toeval beheerst verschijnsel te onderzoeken. Een experiment moet zo vaak herhaald kunnen worden als wenselijk en dit onder dezelfde omstandigheden. Voorbeelden
• E1 : ‘een muntstuk opwerpen’ • E2 : ‘een leerling uit een klas van 20 leerlingen kiezen’ • E3 : ‘twee verschillende dobbelstenen opgooien’ De experimenten E1 , E2 zijn enkelvoudige experimenten. Het experiment E3 is een samengesteld experiment.
N
Uitkomstenverzameling Je gooit 4 ogen met een dobbelsteen. Het getal 4 is een uitkomst van het experiment. Welke uitkomsten zijn nog mogelijk?
Uitkomst en uitkomstenverzameling
Een uitkomst van een experiment is een resultaat van dat experiment. De uitkomstenverzameling U van een experiment is de verzameling van alle mogelijke uitkomsten van dat experiment.
VA
Definitie
Voorbeelden
• Bij het experiment E1 is de uitkomstenverzameling U1 =
• De uitkomstenverzameling van het experiment E3 is U3 =
©
De uitkomst van een experiment hoeft dus niet altijd een getal te zijn. In de kansrekening is het belangrijker het aantal elementen van een uitkomstenverzameling te bepalen, dan die verzameling weer te geven door opsomming. Notatie
# (U)is het aantal elementen van U . # (U1 ) =
# (U2 ) =
# (U3 ) =
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
83
Gebeurtenis Je gooit met een dobbelsteen. De uitkomstenverzameling U bij dit experiment is U = { 1, 2, 3, 4, 5, 6}. Je wint een punt als je minstens 5 ogen gooit. De verzameling A = {5, 6}bevat alle mogelijkheden om minstens 5 ogen te gooien. A is een deelverzameling van U . Je noemt A een gebeurtenis in U. Gebeurtenis
Definitie
Een gebeurtenis is een deelverzameling van de uitkomstenverzameling. Voorbeelden
IN
• Beschouw het experiment E3: ‘twee verschillende dobbelstenen opgooien’. Neem de gebeurtenis A: ‘de som van de ogen is minstens 10’. Dan: A =
• Beschouw het experiment ‘een getal vormen met twee cijfers’.
# (A) =
Neem de gebeurtenis A: ‘het getal bestaat uit twee gelijke cijfers’.
# (U) =
Dan: A =
# (A) =
N
U=
Neem de gebeurtenis B: ‘het getal bestaat uit twee verschillende cijfers’.
Dan: # (B) =
VA
Bijzondere gebeurtenissen Elementaire gebeurtenis
Definitie
Een elementaire gebeurtenis is een gebeurtenis met één element.
Geef alle elementaire gebeurtenissen bij het experiment ‘een cijfer kiezen van 1 tot 5’.
Elke uitkomstenverzameling is deel van zichzelf en is dus ook een gebeurtenis. Zekere gebeurtenis
©
Definitie
De uitkomstenverzameling U is de zekere gebeurtenis.
1
Definitie
2
De lege verzameling ∅is deel van elke uitkomstenverzameling. Onmogelijke gebeurtenis
De lege verzameling ∅is de onmogelijke gebeurtenis.
3
4 5 6
84
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
4.1.3 Relatieve frequentie van een gebeurtenis Definitie
VIDEO
Relatieve frequentie Als een gebeurtenis A, bij n herhaalde experimenten, n A keer voorkomt, nA de relatieve frequentie van de gebeurtenis A. dan is f A = _ n
Voorbeeld 1
Je gooit 50 keer met een dobbelsteen. Het resultaat zie je in de frequentietabel. ni
1
9
2
6
3
11
4
8
5
10
6
6
Bepaal de relatieve frequentie van de volgende gebeurtenissen.
IN
xi
• A : ‘3 ogen gooien’: fA =
• B : ‘een oneven aantal ogen gooien’: fB =
• C : ‘minstens 5 ogen gooien’: fC =
Voorbeeld 2
N
50
In de tabel zie je hoe de leerlingen van een bepaalde school op een dag met normale weersomstandigheden naar school komen. ni
te voet
54
fiets
163
step
41
bromfiets
105
openbaar vervoer
377
auto
66
VA
vervoer
©
Bepaal de relatieve frequentie van de volgende gebeurtenissen. Rond af op 0,01 %. • A: ‘een leerling komt met de fiets naar school’: fA =
• B: ‘een leerling komt met de step of de bromfiets naar school’: fB = • C: ‘een leerling komt niet te voet naar school’: fC =
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
85
4.1.4 Het principe van de statistische stabiliteit Als je met een (onvervalste) dobbelsteen gooit, dan weet je dat je ‘één kans op zes’ hebt om bijvoorbeeld 5 ogen te gooien. Maar wat betekent ‘één kans op zes’? Zul je dan iedere 6 worpen één keer 5 ogen gooien? Zeker niet! Met ICT kun je het experiment ‘gooien met een onvervalste dobbelsteen’ eenvoudig simuleren. Simulatie met Excel
N
IN
In een bepaalde cel kiest Excel zelf random een getal van 1 tot en met 6. Je kunt willekeurig naar onder en naar rechts doorvoeren.
Simulatie met GeoGebra
VA
Je laat het aantal experimenten (n) toenemen en bepaalt telkens, op 0,01 % nauwkeurig, de relatieve frequentie van de gebeurtenis A: ‘5 ogen gooien’. n
50
100
200
300
500
750
1 000
nA
f A (%)
©
Wat merk je op?
Besluit
Naarmate het aantal herhaalde experimenten stijgt, zal de relatieve frequentie van een gebeurtenis steeds meer een bepaalde waarde benaderen.
Deze wetmatigheid is het principe van de statistische stabiliteit of de wet van de grote aantallen.
1
2
In de statistiek bestaat er ook een wet van de kleine aantallen. Als je over weinig gegevens beschikt, dan zal een afwijkend gegeven daar een grote invloed op hebben, waardoor je gemakkelijk verkeerde besluiten trekt.
3
4
Een voorbeeld: je bent een week in Spanje geweest en het regende vijf van de zeven dagen. Daaruit besluiten dat Spanje een land is met veel regen, is een verkeerde statistische methode.
5 6
86
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
4.1.5 Het begrip kans Kans op een gebeurtenis
Definitie
De kans op een gebeurtenis is het getal dat de relatieve frequentie van die gebeurtenis benadert als het aantal herhaalde experimenten steeds groter wordt. Notatie P(A) = de kans dat gebeurtenis A zich voordoet. Gevolgen van de definitie
• 0 ⩽ P (A) ⩽ 1
• P (A) = 0 ⇔ • P (A) = 1
⇔
IN
Als A een gebeurtenis is van de uitkomstenverzameling Uvan een experiment, dan geldt:
A = ∅ (De kans op de onmogelijke gebeurtenis is 0.)
A = U (De kans op de zekere gebeurtenis is 1.)
4.1.6 Schatten van kansen door herhaalde experimenten
N
VIDEO
In vele gevallen kun je bij het berekenen van kansen uitgaan van een gelijke kans van alle elementaire gebeurtenissen van een uitkomstenverzameling. In dat geval spreek je van een uniforme kansverdeling. Je leert met die kansverdeling werken in paragraaf 4.4. In andere gevallen is een theoretisch model niet altijd mogelijk. Een manier om dan kansen te bepalen, is het gebruik van het principe van de statistische stabiliteit.
VA
Iemand krijgt drie enveloppen aangeboden. In één van de enveloppen zit een prijs. De uitkomstenverzameling van dit experiment is U = {l(inks), m(idden), r(echts)} Stel: L = {l}, M = {m}, R = {r}
Het is geweten dat meer mensen geneigd zijn om de middelste enveloppe te kiezen. Van de twee buitenste enveloppen mag je aannemen dat die evenveel kans hebben om uitgekozen te worden. • Om P (M)te bepalen, herhaal je het experiment n keer (met n verschillende personen) en noteer je hoeveel keer de middelste enveloppe is gekozen. Bereken telkens fM en bepaal dan P(M)vanuit het principe
©
van de statistische stabiliteit: P (M) =
• Bereken P(L) en P(R). P(U)= 1
⇔
P(L) + P(R) =
⇒
P(L)+ P(M) + P(R) = 1
P(L) = P(R) =
n
nM
fM
10
3
50
18
100
43
150
58
200
81
300
121
500
199
1 000
401
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
87
Oefeningen REEKS A 1
Neem het experiment ‘een getal raden van 1 tot en met 10’. a) Geef de uitkomstenverzameling: U =
b) Omschrijf de gebeurtenis A = {8, 9, 10}.
IN
c) Bepaal de gebeurtenis B: ‘een veelvoud van drie raden’ door opsomming.
d) Omschrijf de gebeurtenis C = {1, 3, 5}.
Onze kat heeft een nest met 3 kleine kittens gekregen. Neem het experiment ‘het geslacht raden van de 3 kittens’.
VA
2
N
e) Geef het aantal elementen van de gebeurtenis D: ‘een even getal groter dan 5 raden’.
a) Hoeveel elementen telt de uitkomstenverzameling?
b) Bepaal de gebeurtenis B: ‘het nest bevat 2 kattinnen (m) en 1 kater ( j)’ door opsomming.
©
c) Omschrijf de gebeurtenis C = {(m,m,m), ( j,j,j)}. d) Geef het aantal elementen van de gebeurtenis D: ‘het nest bevat hoogstens 1 kattin’.
1
e) Geef het aantal elementen van de gebeurtenis E: ‘het nest bevat minstens 1 kattin’.
2 3
4 5 6
88
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
REEKS B 3
Neem het experiment: ‘3 verschillende dobbelstenen opgooien.’ a) Hoeveel elementen telt de uitkomstenverzameling? b) Toon aan dat de gebeurtenis A: ‘de som van het aantal ogen is 3’ een elementaire gebeurtenis is. c) Omschrijf de gebeurtenis B = { (2,2,1), ( 2,1,2), (1,2,2)}.
IN
d) Bepaal de gebeurtenis C: ‘de som van de ogen is gelijk aan 5’ door opsomming.
e) Hoeveel elementen heeft de gebeurtenis D: ‘de som van de ogen is gelijk aan 7’?
N
VA
Een biefstuk kun je eten zonder saus (‘natuur’), met béarnaisesaus, met pepersaus, met champignonsaus of met Provençaalse saus. De tabel toont de voorkeur van de klanten van een restaurant. Bereken de relatieve frequentie van de volgende gebeurtenissen. Rond af op 0,01 %.
voorkeur
ni
©
4
natuur
105
béarnaise
72
peper
97
champignon
41
Provençaals
35
a) A: ‘een klant kiest steak natuur’. b) B: ‘een klant kiest peper- of champignonsaus’. c) C: ‘een klant kiest niet voor Provençaalse saus’.
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
89
ni
38
20
39
41
40
76
41
103
42
135
43
164
44
128
45
97
46
39
47
16
a) A: ‘een man heeft maat 42’
b) B: ‘een man heeft maat 40 of 41’
c) C: ‘een man heeft minstens maat 45’
IN
maat
d) D: ‘een man heeft niet maat 38’
Anissa en Bram spelen regelmatig een spelletje Rummikub. Anissa heeft al dubbel zo veel spelletjes gewonnen als Bram. Bereken de kans dat Bram het volgende spelletje wint.
VA
6
Een grote schoenenwinkel heeft bijgehouden hoeveel paren herenschoenen van elke maat ze in een jaar tijd hebben verkocht. Bereken de relatieve frequentie van de volgende gebeurtenissen. Rond af op 0,01 %.
N
5
Bij het spel ‘Vier op een rij’ heeft Arend in het verleden 3 keer zo veel gewonnen als Beatrice, die 2 keer zoveel gewonnen heeft als Charlie. Bereken de kans voor elk van de spelers dat ze het volgende spel winnen.
©
7
1
2 3
4 5 6
90
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
REEKS C 8
Een dobbelsteen kun je vervalsen door het zwaartepunt van de kubusvorm te wijzigen. Een bepaalde dobbelsteen is zo vervalst dat er een grotere kans is om 6 ogen te gooien. De kans om 1 te gooien is daardoor kleiner. De andere kansen zijn gelijk. Om de kansverdeling te bepalen gebruik je het principe van de statistische stabiliteit. In de tabel is n het aantal worpen, nZ het aantal keer 6 en nE het aantal keer 1. a) Vul de tabel aan. Rond de percentages af op 0,01 %. nZ
nE
10
2
1
25
7
50
11
75
20
100
24
150
37
200
51
17
101
33
149
50
600
3 5 7
8
13
N
400
IN
n
VA
b) Bepaal de kans op de gebeurtenis Z: ‘6 ogen gooien’. Rond af op 1 %.
c) Bepaal de kans op de gebeurtenis E: ‘1 gooien’?
©
d) Bereken de andere elementaire kansen.
e) Bereken de kans om een even aantal ogen te gooien.
f) Bereken de kans om hoogstens 2 ogen te gooien.
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
91
4.2
Tellen met verzamelingen
4.2.1 Verzamelingen voorstellen met venndiagrammen • Neem de verzameling A van de getallen 0 tot en met 9. 10
A = { 0, 1, 2, ..., 9} #(A) = De getallen 0 tot en met 9 zijn de elementen van verzameling A. Je noteert: 0 ∈ A(0 is element van A), 1 ∈ A ... _ De getallen 10 en √ 2 zijn geen elementen van A. _ √ Dat noteer je als: 10 ∉ A, 2 ∉ A.
A
2
1
3
0 5 7
6 9
8
2
IN
4
• Stel: B is de verzameling van de strikt positieve cijfers die drievouden zijn. 10
2
1
0
5
3
B = { 3, 6, 9}
9
7
2
#(B) =
Alle getallen van B behoren ook tot A. Je zegt dat B een deelverzameling is van A. Notatie: B ⊂ A
6
N
4
A
B
8
VA
• Stel: C is de verzameling van de priemgetallen kleiner dan 20.
A
0
6
8
2
9
5
13
19
©
4
17
7
3
1
11
C
C=
De getallen 2, 3, 7 en 5 behoren tot A en tot C. Je noteert: A C = { 2, 3, 5, 7}, de doorsnede van A en C. #(A C ) =
De getallen 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 13, 17 en 19 behoren tot A of tot C. Je noteert: A C = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 13, 17, 19}, de unie van A en C. #(A C) =
Is #(A C) = #(A) + #(C)?
1
Waarom (niet)?
2
De getallen 11, 13, 17 en 19 behoren wel tot C, maar niet tot A.
3
Je noteert: C \ A = {11, 13, 17, 19}, het verschil van C en A. #(C \ A) =
4
A \ C =
5 6
92
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
#(A \ C) =
#(C ) =
4.2.2 Tellen met behulp van venndiagrammen Voorbeeld 1 VIDEO
Op een school mogen de leerlingen van de derde graad kiezen: ’s middags op school blijven of naar buiten gaan. Er zijn 23 leerlingen die ervoor kiezen om op school te blijven en 95 leerlingen die liever naar buiten willen. Hoeveel leerlingen zitten er in de derde graad? Stel: B
S
S is de verzameling van de schoolblijvers. B is de verzameling van de leerlingen die buiten gaan.
#(S) =
Voorbeeld 2
#(S B) =
IN
Dan: #(S B) =
#(B) =
Hoeveel natuurlijke getallen van 1 tot en met 50 zijn a) deelbaar door 2 of door 3?
Stel: T
#(T ) =
#(D) =
⇒ #(T D) =
N
D
T is de verzameling van de veelvouden van 2. D is de verzameling van de veelvouden van 3.
In de doorsnede zitten de getallen die veelvoud zijn van 2 en van 3. Dit zijn dus veelvouden van 6.
VA
Dan: #(T D) =
b) deelbaar door 2 maar niet door 3? #(T \ D) =
Voorbeeld 3
©
In een klas zitten 21 leerlingen. Ze hebben allemaal een smartphone of een tablet. 17 leerlingen hebben een smartphone en 9 leerlingen hebben een tablet. Hoeveel leerlingen hebben beide toestellen?
S
Stel: T
S is de verzameling van de smartphonebezitters. T is de verzameling van de tabletbezitters.
#(S) =
#(T ) =
Als je het aantal leerlingen met een smartphone en het aantal leerlingen met een tablet optelt, krijg je 26. Dat is 5 meer dan het aantal leerlingen in de klas. #(S) + #(T ) = en #(S T ) = ⇒ #(S T ) =
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
93
4.2.3 Tellen met behulp van het complement van een verzameling Complement van een deelverzameling VIDEO
V
Neem een verzameling V en stel A ⊂ V. _ De verzameling A = V \ Anoem je het complement van A
A
_ Als A ⊂ V, dan is #( A ) = #(V ) − #(A).
Eigenschap
Voorbeeld 1
IN
ten opzichte van de verzameling V. _ A bevat dus alle elementen van V die niet tot A behoren.
Hoeveel natuurlijke getallen van 1 tot en met 50 zijn niet deelbaar door 3?
Stel: Vis de verzameling van alle natuurlijke getallen van 1 tot en met 50.
VA
Voorbeeld 2
N
D is de verzameling van de drievouden tussen 1 en 50. _ Dan is D de verzameling van alle natuurlijke getallen tussen 1 en 50 die geen drievoud zijn. _ #( D ) = #(V) − #(D) =
Hoeveel getallen van twee cijfers bevatten het cijfer 7? methode 1
methode 2
• Je telt het aantal getallen met één 7:
• Er zijn getallen met twee cijfers.
Er zijn getallen waarbij 7 op
• Je telt het aantal daarvan die geen 7
de eerste plaats staat.
bevatten:
©
Er zijn getallen waarbij 7 op de tweede plaats staat.
• Het totaal aantal getallen die 7 bevatten is dus
• Er is getal met twee keer het cijfer 7 en dat heb je dubbel geteld.
1
• Het totaal aantal getallen die 7 bevatten is
2
dus
3
4 5 6
94
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
.
.
Oefeningen REEKS A In een bosje staan 290 bomen, waaronder 124 beuken en 83 eiken. De rest zijn dennen. Hoeveel dennen staan er in het bos?
10
Op een bijeenkomst zijn 42 Belgen en 73 Nederlanders. Er zijn ook Fransen. In totaal zijn er 161 mensen aanwezig. Hoeveel Fransen zijn er?
11
Een school heeft 217 leerlingen in de eerste graad en 198 leerlingen in de tweede graad. Het totaal aantal leerlingen is 584. Hoeveel leerlingen zitten in de derde graad?
VA
N
IN
9
Neem de verzameling G van alle getallen met 3 cijfers. a) Bepaal G door opsomming.
©
12
b) Hoeveel elementen telt G? c) Hoeveel daarvan zijn deelbaar door 5?
d) Hoeveel getallen van G zijn strikt groter dan 150?
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
95
REEKS B 13
Op een vergadering verstaan alle aanwezigen Frans of Engels. Er zijn er 12 die Engels verstaan, 11 die Frans verstaan en 8 mensen die beide talen verstaan. a) Hoeveel mensen zijn er op de vergadering?
14
IN
b) Hoeveel aanwezigen verstaan Engels maar geen Frans?
In de bovenbouw van een scholengemeenschap zijn er 76 leerkrachten die in de tweede graad les geven en 59 die in de derde graad les geven. Er zijn 23 leerkrachten die in beide graden les geven. a) Hoeveel leerkrachten zijn er in de bovenbouw?
b) Hoeveel leerkrachten geven geen les
N
in de derde graad? c) Hoeveel leerkrachten geven enkel les in de derde graad?
Een wijk telt 76 huizen. Alle huizen hebben een garage of een carport. Er zijn 53 huizen met een garage en 38 huizen met een carport.
VA
15
a) Hoeveel huizen hebben zowel een garage als een carport?
b) Hoeveel huizen hebben een carport maar geen garage?
Van alle gezinnen in België heeft 81 % een abonnement voor een vaste telefoonlijn en 93 % een abonnement om mobiel te bellen.
©
16
a) Hoeveel procent heeft beide abonnementen?
1
b) Hoeveel procent heeft geen abonnement
2
voor een vaste lijn?
3
c) Hoeveel procent heeft wel een abonnement om mobiel
4
te bellen, maar niet om met een vaste lijn te bellen?
5 6
96
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
17
Hoeveel getallen van drie cijfers bevatten een 0? • Aantal getallen van drie cijfers: • Aantal getallen van drie cijfers die geen 0 bevatten: • Aantal getallen van drie cijfers die een 0 bevatten:
18
Je gooit met twee dobbelstenen en telt de som van het aantal ogen. In hoeveel gevallen gooi je minder dan 11 ogen? • Totaal aantal mogelijkheden:
IN
• Aantal mogelijkheden om 11 of 12 te gooien: • Aantal mogelijkheden om minder dan 11 te gooien:
19
De 194 leerlingen van de derde graad gaan tijdens de paasvakantie op meerdaagse buitenlandse reis. Bij een enquête in het begin van het schooljaar mochten ze één of twee voorkeursbestemmingen aanduiden. Er waren 82 leerlingen die Barcelona kozen en 67 leerlingen die Rome kozen. 35 leerlingen duidden beide steden aan.
N
a) Hoeveel leerlingen hebben voor Barcelona of Rome gekozen?
b) Hoeveel leerlingen hebben voor Rome gekozen maar niet voor Barcelona?
VA
c) Hoeveel leerlingen hebben niet voor Barcelona gekozen?
d) Hoeveel leerlingen hebben voor
een andere bestemming gekozen?
Bij een enquête wordt aan 150 gezinnen gevraagd welke huisdieren ze hebben. Er zijn 38 gezinnen die minstens één hond hebben en 45 gezinnen hebben één of meerdere katten. 17 gezinnen hebben beide soorten huisdieren.
©
20
a) Hoeveel gezinnen hebben een kat maar geen hond?
b) Hoeveel gezinnen hebben geen hond?
c) Hoeveel gezinnen hebben geen hond en geen kat? d) Hoeveel procent van de gezinnen heeft een hond maar geen kat? STATISTIEK I HOOFDSTUK 4 I KANSREKENING
97
REEKS C 21
Bewegen is, zeker op oudere leeftijd, heel belangrijk. Uit een bevraging blijkt dat 63 % van de 65-plussers regelmatig een wandeling doet en dat 35 % regelmatig fietst. 20 % van de ondervraagden doet geen van beide activiteiten. a) Hoeveel procent van de senioren doet aan wandelen of aan fietsen? b) Hoeveel procent doet zowel aan wandelen
IN
als aan fietsen? c) Hoeveel procent wandelt wel maar fietst niet?
d) Hoeveel procent fietst niet?
Nathan gooit 50 keer met een dobbelsteen. Telkens als hij minstens 4 ogen of een even aantal ogen gooit, krijgt hij 1 punt. Hij gooit 23 keer minstens 4 ogen en 28 keer een even aantal ogen. In totaal heeft hij 35 punten.
N
22
VA
a) Hoeveel keer gooide hij 4 of 6 ogen?
b) Hoeveel keer gooide hij 5 ogen?
©
c) Hoeveel keer gooide hij 2 ogen?
d) Nathan heeft 15 keer geen punt gewonnen. Hoeveel ogen gooide hij dan?
1
2 3
4 5 6
98
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
4.3
De productregel
4.3.1 Tellen met boomdiagrammen
VIDEO
GEOGEBRA
IN
Mynthra wil een nieuwe auto kopen. Het merk en type heeft ze al gekozen. Ze moet wel nog kiezen tussen de benzineversie (B), de hybrideversie (H) en de elektrische versie (E). Bij iedere versie is er nog keuze tussen drie pakketten: de standaarduitvoering (ST), de luxe uitvoering (L) en de sportieve uitvoering (SP). Hoeveel keuzemogelijkheden heeft Mynthra in totaal? Je kunt haar keuzemogelijkheden voorstellen in een boomdiagram. ST B
SP
• Bij de eindpunten van de getekende takken zet je telkens de keuzemogelijkheid.
ST
• Bij elke keuze van de versie volgt een tweede keuze, namelijk van de uitvoering. Elke mogelijke keuze stel je daarbij voor met een tak die vertrekt uit een eindpunt van een tak die hoort bij de eerste keuze.
N
H
L
• Eerst kiest ze de versie. Elke mogelijke keuze stel je voor met een tak die vertrekt uit een beginpunt.
L
SP ST
• Bij elk eindpunt van de nieuwe takken plaats je weer de keuzemogelijkheid. • Het totaal aantal keuzes die Mynthra heeft is gelijk aan het aantal eindpunten van het diagram.
SP
Mynthra heeft dus in totaal
VA L
E
keuzemogelijkheden.
Bereken het product van het aantal keuzemogelijkheden bij elke deelkeuze:
©
Wat merk je op?
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
99
4.3.2 De productregel Sam gaat op restaurant en wil een voorgerecht, een hoofdgerecht en een dessert bestellen. Hij heeft keuze tussen 8 voorgerechten, 9 hoofdgerechten en 6 desserts. Bij zijn eten verkiest hij om bruiswater te drinken. Hij kan daarbij uit 3 merken kiezen. Op hoeveel manieren kan hij zijn menu samenstellen?
V
H
D
B
8
9
6
3
Sam kan op Algemeen
IN
Het totaal aantal keuzemogelijkheden voor Sam voorstellen met een boomdiagram is onbegonnen werk. Je gebruikt de techniek van de ‘cellen’. Sam kiest een voorgerecht (V) én een hoofdgerecht (H) én een dessert (D) én een bruiswater (B). Elke onderdeel van het menu stel je voor door een cel, waaronder je het aantal mogelijke keuzes plaatst. Het totaal aantal mogelijke menu’s is dan het product van het aantal deelkeuzes.
→
manieren zijn menu samenstellen.
Als een beslissing B bestaat uit k deelbeslissingen B 1, B 2, ... B k
N
en #(B 1) = n 1, #(B 2) = n 2, ..., #(B k) = n k dan: #(B) = n 1 n 2 ... n k
VA
4.3.3 Faculteit
Op hoeveel manieren kun je 10 personen op een rijtje zetten? P1
P2
...
P10
10
9
...
1
→
Om op een snelle manier een dergelijk product te berekenen, gebruik je het begrip faculteit. Faculteit
© Definitie
Als n ∈ n \ {0,1}, dan is n ! = n (n – 1) ... 1 0 ! = 1 en 1 ! = 1
Op hoeveel manieren kun je 20 personen op 20 stoelen zetten?
1
2 3
4 5 6
100
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
4.3.4 Toepassingen • De pincode van een bankkaart bestaat uit 4 cijfers. Hoeveel mogelijkheden zijn er? C1
C2
C3
C4 →
C1
C2
C3
IN
• Hoeveel natuurlijke getallen bestaan uit 5 verschillende cijfers? Let op: een natuurlijk getal kan nooit met een 0 beginnen. C4
C5
→
L1
N
• Een anagram is een woord dat je vormt met dezelfde letters als een gegeven woord. Een anagram hoeft niet noodzakelijk zelf een betekenis te hebben. Hoeveel anagrammen heeft het woord ‘TAFEL’? L2
L3
L4
L5
VA
→
• Een code bestaat uit 4 letters en 2 cijfers. Hoeveel codes bevatten minstens 1 letter a?
Totaal aantal codes:
Aantal codes die de letter a niet bevatten:
Aantal codes die minstens één a bevatten:
©
• Uit een klas met 15 leerlingen kies je willekeurig 4 leerlingen. Hoeveel mogelijkheden zijn er?
Aantal mogelijkheden waarbij de volgorde van kiezen belangrijk is:
Aantal mogelijke omwisselingen van de gekozen 4 leerlingen:
Het gevraagde aantal mogelijkheden is
.
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
101
• In de finale van de play-offs van de basketbalcompetitie, moeten de twee finalisten een eindronde spelen. De ploeg die het eerst 3 wedstrijden wint, is kampioen. Hoeveel wedstrijden moeten er maximaal gespeeld worden?
Op hoeveel manieren kan de finale zich ontwikkelen? Teken een boomdiagram.
©
VA
N
IN
1
2 3
4
In hoeveel gevallen zijn er slechts 3 wedstrijden nodig?
In hoeveel gevallen zijn er hoogstens 4 wedstrijden nodig?
5 6
102
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
Oefeningen REEKS A 23
Los de vraagstukken op met de productregel. a) Een inlogcode bestaat uit 4 letters. Hoeveel mogelijkheden zijn er?
IN
b) Een byte bestaat uit 8 bits (een 1 of een 0). Hoeveel bytes zijn er mogelijk?
c) In een bibliotheek krijgen de boeken een code die bestaat uit 2 letters, verschillend van 0 en 3 cijfers, verschillend van 0. Hoeveel boeken kan de bibliotheek bevatten?
N
d) De 12 leerlingen van een klas komen het leslokaal binnen. Hoeveel volgordes van binnenkomen zijn er mogelijk?
VA
e) De 12 leerlingen van een klas doen een loopwedstrijd. Hoeveel mogelijkheden zijn er om de eerste 5 te voorspellen?
f) Hoeveel even natuurlijke getallen zijn er die bestaan uit 5 cijfers?
©
g) Hoeveel oneven natuurlijke getallen zijn er die bestaan uit 5 verschillende cijfers?
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
103
Alexandra gaat naar de bakker. Ze wil een brood, een stuk taart en een meeneemkoffie kopen. Er is keuze tussen 11 soorten broden, 8 soorten taart en 3 soorten koffie. Hoeveel keuzemogelijkheden heeft ze in totaal?
25
Een firma maakt cilindersloten. Elke sleutel bestaat uit 6 gedeelten. Voor elk gedeelte kan gekozen worden tussen de patronen A, B of C. Hoeveel verschillende sleutels kunnen er gemaakt worden?
26
Je wilt 15 boeken op een boekenplank rangschikken. Hoeveel mogelijkheden heb je? Rond af op 1 miljoen.
27
Een code bestaat uit 6 verschillende cijfers. Er komt geen 0 en geen 9 in voor en het eerste cijfer is 1. Hoeveel mogelijkheden zijn er om de juiste code te raden?
VA
N
IN
24
Vier vrienden gaan samen op restaurant. Ze kunnen kiezen tussen 5 menu’s. Op hoeveel verschillende manieren kunnen de 4 vrienden hun keuze maken?
©
28
29
1
2
Er is een verkeersongeval met vluchtmisdrijf gebeurd. Een getuige herinnert zich nog dat de nummerplaat van de weggevluchte auto begon met het cijfer 1, dat daarna de letters C, E en K kwamen en dan de cijfers 6, 8 en 1. De volgorde van de letters en de cijfers herinnert de getuige zich niet meer. Hoeveel mogelijkheden zijn er nog om te achterhalen wie de schuldige is?
3
4 5 6
104
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
REEKS B Sofie en Kim spelen ‘Vier op een rij’. Ze spreken af dat diegene die het eerste 2 spelletjes na elkaar of 3 spelletjes in totaal wint, de eindoverwinnaar is. Op hoeveel manieren kan het spelverloop evolueren? Los op met behulp van een boomdiagram.
Je hebt 10 euro op zak en doet mee aan een gokspel. Je neemt je voor hoogstens 5 spelletjes te spelen. Als je een spel wint, krijg je 10 euro en als je verliest moet je 10 euro afgeven. Je stopt eerder als je geen geld meer hebt of als je 30 euro hebt. Hoeveel mogelijkheden zijn er? Los op met behulp van een boomdiagram.
©
VA
31
N
IN
30
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
105
32
Je gooit 4 keer een muntstuk op. a) Hoeveel mogelijkheden zijn er in totaal?
VA
N
IN
b) In hoeveel gevallen gooi je minstens 2 keer kruis? Los op met een boomdiagram.
33
In de hoogste klasse van het vrouwenvoetbal spelen 14 ploegen. Elke ploeg moet tegen elke andere ploeg een thuismatch en een match op verplaatsing spelen. Hoeveel wedstrijden worden er in totaal gespeeld?
©
34
1
2 3
5 leerlingen van klas A en 6 leerlingen van klas B gaan op een rij staan, zodat de leerlingen van klas A naast elkaar staan en de leerlingen van klas B naast elkaar staan. Hoeveel mogelijkheden zijn er?
4
5
6
106
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
In een boek zijn de bladzijden genummerd van 1 tot en met 285. Hoeveel bladzijden hebben een cijfer 2 in de nummering?
36
In de woonkamer staat een tafel met 6 stoelen.
IN
35
a) Hoeveel manieren zijn er om 6 personen te laten plaatsnemen?
N
b) Hoeveel manieren zijn er om 4 personen te laten plaatsnemen?
Een klas bestaat uit 14 leerlingen. De klassenleraar nodigt hen op het einde van het schooljaar uit voor een barbecuefestijn. Ze zijn niet verplicht om te komen. Op hoeveel manieren kan het feestgezelschap samengesteld worden?
38
Een leerkracht wetenschappen heeft 4 boeken over natuurkunde, 5 boeken over chemie en 3 boeken over biologie.
©
VA
37
a) Op hoeveel manieren kan de leerkracht die boeken op een plank rangschikken?
b) Hoeveel manieren zijn er als de boeken per vak gerangschikt moeten staan?
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
107
REEKS C In een badmintonclub zijn er 24 leden. Elk lid moet één match tegen elk ander lid spelen. Hoeveel matchen worden er in totaal gespeeld?
40
Een bedrijf heeft 4 nieuwe werknemers nodig. Ze hebben 23 sollicitanten.
IN
39
a) Hoeveel keuzemogelijkheden heeft het bedrijf als elk van de 4 werknemers een andere soort job krijgt?
Hoeveel mogelijkheden zijn er om 6 verschillende getallen te kiezen uit de getallen van 1 tot en met 45?
VA
41
N
b) Hoeveel mogelijkheden zijn er als de 4 werknemers dezelfde soort job krijgen?
Op een kantoor werken 10 mensen die vloeiend Engels spreken en 6 mensen die vloeiend Duits spreken. 4 mensen spreken beide talen vloeiend. Er worden 2 mensen afgevaardigd. De ene moet vloeiend Engels spreken, de andere vloeiend Duits. Hoeveel keuzemogelijkheden zijn er?
©
42
1
2 3
4 5 6
108
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
4.4
De uniforme kansverdeling
4.4.1 Definitie Neem het experiment ‘opgooien van een dobbelsteen’. U = {1, 2, 3, 4, 5, 6} en P (U) = 1
Deze uitkomstenverzameling telt 6 elementaire gebeurtenissen. E 1 = {1}, E 2 = {2}, ..., E 6 = {6} ⇒ Definitie
P(E 1) = P(E 2) = ... = P (E 6) =
Uniforme kansverdeling
IN
Elk van deze elementaire gebeurtenissen is even waarschijnlijk.
Een kansverdeling is uniform als de kansen op elk van de elementaire gebeurtenissen van een uitkomstenverzameling U aan elkaar gelijk zijn.
Voorbeelden
N
Als een experiment aanleiding geeft tot een uniforme kansverdeling, dan zegt men dat het experiment op een aselecte (of lukrake) manier is uitgevoerd.
Duid de kansexperimenten die aanleiding geven tot een uniforme kansverdeling aan met een vinkje.
❒
• Kiezen van een leerling uit een klas.
❒
• Nagaan of een bepaald geneesmiddel nevenwerkingen heeft of niet.
❒
• Een balletje uit een trommel met 45 balletjes nemen.
❒
• Een kaart uit een spel trekken.
❒
• Is een gekozen getal een priemgetal of niet?
❒
©
VA
• Opgooien van een muntstuk.
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
109
4.4.2 Eigenschappen Eigenschap 1
Kans op een elementaire gebeurtenis Bij een uniforme kansverdeling in een uitkomstenverzameling U met n elementen, is de kans op elke elementaire gebeurtenis gelijk aan _ 1 . n
VIDEO
Voorbeelden • Je kiest een getal van 1 tot en met 10. De kans dat je 6 kiest is
.
• De kans dat je een bepaalde persoon aanduidt van een groep van 45 personen is
.
Eigenschap 2
IN
Je bekijkt nu de kans op een gebeurtenis met meerdere elementen. Bij het opgooien van een dobbelsteen heb je evenveel kans om een even aantal ogen te gooien dan om een oneven aantal te gooien. #({ 2, 4, 6}) 3 = ___________ 1 = _ ⇒ P ( {2, 4, 6}) = _ 2 6 #(U ) Kansregel van Laplace
Bij een uniforme kansverdeling in een uitkomstenverzameling U
met n elementen, is de kans op een gebeurtenis A met k elementen gelijk aan
Voorbeelden
N
aantal gunstige gevallen k = ______________________ ( A ) = _ P . n aantal mogelijke gevallen
VA
• In een klas van 21 leerlingen dragen 7 leerlingen een bril. Je kiest willekeurig een leerling .
uit de klas. De kans dat die leerling een bril draagt is
• Wat is de kans dat een getal van 3 cijfers deelbaar is door 5 (gebeurtenis A)? n = #(U) =
©
k = #(A ) =
1
2
P(A) =
Pierre Simon de Laplace (1749-1827) was een Franse wiskundige en autodidact. Hij ging maar tot zijn zestiende naar school, maar dat weerhield hem er niet van een mooie carrière uit te bouwen. • In 1769 werd hij wiskundeleraar aan de militaire school van Parijs, waar hij les gaf aan onder andere Napoleon. • In 1794 kreeg hij een leerstoel aan de Polytechnische Hogeschool van Parijs. • In 1799 benoemde Napoleon hem tot minister van Binnenlandse Handel.
3
4 5 6
110
⇒
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
4.4.3 Toepassingen • Op school zijn er ’s middags belegde broodjes te krijgen. Er zijn 5 soorten beleg voorzien: kaas, ham, americain, kip en zalm. 4 leerlingen van een klas bestellen een broodje. Bereken de kans dat ze alle 4 voor een ander soort beleg kiezen (gebeurtenis V). n=
⇒
k=
IN
P (V ) =
• In een hogeschool moeten de 73 studenten van het laatste jaar één of twee keuzevakken kiezen. Er zijn 24 studenten die statistiek kiezen, 31 studenten die marketing kiezen en 9 studenten die beide vakken willen volgen. Bereken, op 0,01 % nauwkeurig, de kans dat een willekeurige student
statistiek of marketing kiest;
N
P ( S M) =
statistiek kiest maar geen marketing;
P ( S \ M) =
andere vakken kiest.
VA
S M ) = P ( ‾
• Je gooit met 2 verschillende dobbelstenen en bepaalt de som van het aantal ogen.
Vul de tabel aan. som ogen
©
kans
2
3
4
5
6
Bereken de kans om 7 of 8 ogen te gooien:
Bereken de kans om minstens 10 ogen te gooien:
Bereken de kans om minstens 4 ogen te gooien:
7
8
9
10
11
12
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
111
Oefeningen REEKS A 43
Je trekt lukraak een kaart uit een spel van 52 kaarten. Wat is de kans dat het een harten is?
44
IN
Een boeket bevat 10 rode rozen, 9 witte rozen en 11 roze rozen. Je neemt willekeurig een roos uit het boeket. Bereken de kans dat het een rode roos is.
45
N
Bereken de kans dat een getal van 3 cijfers geen 7 bevat.
VA
46
In een bokaal zitten 5 witte, 7 blauwe en 4 groene knikkers. Je trekt aselect een knikker uit de bokaal. a) Wat is de kans dat de knikker wit is?
b) Wat is de kans dat de knikker blauw of groen is?
©
c) Bereken de kans dat de knikker niet groen is.
1
2 3
4 5 6
112
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
REEKS B 47
Sara gooit 7 ogen met 2 dobbelstenen. Bereken de kans dat David meer gooit.
48
Wat is de kans dat de pincode van een bankkaart uit 4 verschillende cijfers bestaat?
Je weet van 8 personen dat ze allemaal in juli jarig zijn. Bereken de kans dat ze alle 8 op een verschillende dag jarig zijn. Rond af op 0,01 %.
Je zet 5 Franse boeken en 4 Nederlandse boeken op een boekenplank. Wat is de kans dat de boeken in een bepaalde taal samen staan? Noteer als een onvereenvoudigbare breuk.
VA
50
N
49
IN
©
51
Je plaatst 5 Belgen en 4 Fransen op een rij. Bereken de kans dat er geen 2 Belgen naast elkaar staan. Noteer als een onvereenvoudigbare breuk.
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
113
52
Bereken de kans dat een natuurlijk getal van 2 cijfers a) deelbaar is door 2 en door 5;
b) deelbaar is door 2 of door 5;
c) deelbaar is door 2 maar niet door 5.
53
.
IN
d) niet deelbaar is door 2 en niet door 5.
Een hotel aan zee heeft 146 kamers. Daarvan hebben 42 kamers zicht op zee. 2 24 kamers hebben een oppervlakte die groter is dan 30 m . 2 Het hotel heeft 94 kamers die geen zicht op zee hebben en kleiner zijn dan 30 m .
N
a) Wat is de kans dat een kamer zeezicht heeft 2 en groter is dan 30 m ? Rond af op 0,01 %.
VA
b) Wat is de kans dat een kamer wel zeezicht heeft, 2 maar niet groter is dan 30 m ? Rond af op 0,01 %.
©
c) Je krijgt een kamer die groter is dan 30 m². Wat is de kans dat die kamer zeezicht heeft? Rond af op 0,01 %.
54
Je gooit 4 keer een muntstuk op. Bereken de kans dat je minstens 2 keer kruis gooit. Gebruik het boomdiagram van oefening 32.
1
2 3
4 5 6
114
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
REEKS C Een groep bestaat uit 10 Belgen en 7 Nederlanders. Je kiest lukraak 2 mensen uit de groep. Wat is de kans dat het 2 Belgen zijn? Rond af op 0,01 %.
56
In een bak zitten 5 rode balletjes, 4 gele balletjes en 6 groene balletjes. Je neemt aselect 3 balletjes uit de bak. Bereken, op 0,01 % nauwkeurig, de kans dat
N
a) het 3 groene balletjes zijn;
IN
55
VA
b) er geen rode balletjes bij zijn;
©
c) er minstens 1 geel balletje bij is.
57
Je gooit 8 keer een muntstuk op. Bereken de kans dat je 3 keer munt gooit. Rond af op 0,01 %.
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
115
4.5
Kansbomen
4.5.1 Voorbeeld 1 Bij een spel gooi je 4 keer een dobbelsteen op. Je wint het spel als je minstens 2 keer 5 of 6 ogen gooit. Wat is de kans dat je het spel wint? GEOGEBRA
Om een overzicht te krijgen van alle mogelijkheden, teken je een kansboom. Hierin stelt A de gebeurtenis ‘5 of 6 ogen gooien’ voor.
1/3
A
1/3
2/3
A
A
A
1/3
2/3
2/3
A
1/3
A
1/3
A
A A
2/3
A
A
1/3
N
2/3
2/3
A A
2/3
A
1/3
1/3
A
VA
1/3
2/3
A
A
1/3
2/3
A
A
2/3
A
A
1/3
2/3
A A
2/3
A
1/3
A
©
2/3
1/3
A
2/3
A
1/3
IN
A
1/3
A
2/3
A
Er zijn verschillende mogelijkheden om minstens twee keer 5 of 6 ogen te gooien. Om de kans te bepalen dat je het spel wint, bekijk je de eindpunten die in het rood zijn aangeduid. In die gevallen heb je 2, 3 of 4 keer 5 of 6 ogen gegooid. 4
1 . De kans om 4 keer 5 of 6 ogen te gooien is _ 1 _ 1 _ 1 _ 1 = _ 1 = _ 3 3 3 3 (3) 81 3 8 . 1 ) _ 2 = _ De kans om 3 keer 5 of 6 ogen te gooien is 4 (_ 3 3 81 2 2 8 . 24 = _ 1 ) (_ 2 ) = _ De kans om 2 keer 5 of 6 ogen te gooien is 6 ( _ 3 3 81 27 8 + _ 8 = _ 11 ≈ 0,407 4 = 40,74 %. De kans dat je het spel wint is dus _ 1 + _ 81 81 27 27
1
2 3
4 5 6
116
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
4.5.2 Voorbeeld 2 Je trekt 3 ballen uit een vaas die 3 rode en 2 groene ballen bevat. Na elke trekking leg je de uitgekozen bal niet terug in de vaas. Bereken de kans dat • de 3 ballen rood zijn; • er juist 1 groene bal bij is; • er minstens 1 rode bal bij is.
GEOGEBRA
VIDEO
R2
1/3
R3
2/3
G1
2/4
R1
2/3
R2
2/4
3/5
1/3
G2
2/3
R2
R1
2/5
• De kans dat de 3 ballen rood zijn, is
is
• De kans dat er minstens 1 rode bal bij is, is
3/4
1/3
.
• De kans dat er juist 1 groene bal bij is,
N
G1
IN
Omdat je elke getrokken bal niet terug in de vaas legt, beïnvloedt elke trekking de volgende. Je spreekt in dit geval van afhankelijke experimenten en voorwaardelijke kansen.
. .
G2
VA
G1
1/4
1
G2
R1
Kansbomen
• De som van de kansen bij de takken die vertrekken vanuit eenzelfde punt is altijd gelijk aan 1. • Om de kans van een eindpunt te bepalen, vermenigvuldig je de kansen van de deeltakken die je terugvindt vanaf het beginpunt tot dat eindpunt. • Als verschillende eindpunten in aanmerking komen, tel je de kansen van de eindpunten op.
©
Algemeen
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
117
4.5.3 Afhankelijke en onafhankelijke experimenten Je gebruikt kansbomen om kansen te berekenen bij samengestelde experimenten. De deelexperimenten van een samengesteld experiment zijn onafhankelijk als na het beëindigen van elk deelexperiment de oorspronkelijke situatie opnieuw hersteld wordt. In dat geval moet in een punt van de kansboom geen rekening gehouden worden met de voorafgaande kansen.
Voorbeeld 1
IN
De deelexperimenten van een samengesteld experiment zijn afhankelijk als elk deelexperiment, vanaf het tweede, wordt beïnvloed door de voorgaande experimenten. In dat geval moet in een punt van de kansboom wel rekening gehouden worden met de voorafgaande kansen.
Een kaartspel bestaat uit 13 harten, 13 ruiten, 13 schoppen en 13 klaveren. Je trekt lukraak 3 kaarten uit een spel. Bereken, op 0,01 % nauwkeurig, de kans dat • het 3 harten zijn;
• het 2 harten zijn en een andere kaart.
afhankelijke experimenten
N
onafhankelijke experimenten
Elke kaart wordt na trekking teruggestoken
Getrokken kaarten worden niet teruggestoken
(‘trekkingen met teruglegging’)
(‘trekkingen zonder teruglegging’)
• P (‘3 harten’)
• P (‘3 harten’)
VA
= P(H 1) P(H 2) P(H 3)
©
• P (‘2 harten en 1 andere’) _ 1) = P( H 1) P(H 2) P(H _ 1) P(H 2) + P(H 1) P(H _ 1) P(H 1) P(H 2) + P(H
• P (‘2 harten en 1 andere’) _ 1) = P( H 1) P(H 2) P(H _ 1) P(H 2) + P(H 1) P(H _ 1) P(H 1) P(H 2) + P(H
1
2 3
4 5 6
118
= P(H 1) P(H 2) P(H 3)
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
Voorbeeld 2 In een fabriek ondergaan alle afgewerkte producten een drievoudige kwaliteitstest alvorens de fabriek te verlaten. De tests worden onafhankelijk van elkaar uitgevoerd. 90 % van alle producten voldoet aan de eerste test, 85 % voldoet aan de tweede test en 88 % aan de derde test. Een product dat 3 keer voldoet, krijgt het label ‘eerste keus’. De producten die aan 2 van de 3 testen voldoen, worden als ‘tweede keus’ verkocht. De overige artikels worden niet verkocht en gerecycleerd.
IN
• Bereken de kans dat een product ‘eerste keus’ is.
• Wat is de kans dat een product ‘tweede keus’ is?
N
• Hoeveel procent van de producten wordt niet verkocht?
VA
Voorbeeld 3
©
Het eerste probleem van Chevalier de Méré: A en B spelen een aantal spelletjes waarbij ze telkens evenveel kans hebben om te winnen. Elke speler zet een bepaald bedrag in (bijvoorbeeld elk 10 euro). Wie eerst 5 spelletjes wint, krijgt de volledige inzet. Door omstandigheden moeten ze het spel vroegtijdig stopzetten. A heeft dan al 4 keer gewonnen en B 3 keer. Hoe kan de inzet op een rechtvaardige manier worden verdeeld? • De kans dat A eerst 5 spelletjes zou winnen, is
A5
1/2
• De kans dat B eerst 5 spelletjes zou winnen, is
1/2
1/2
A5
•
B4
1/2
B5
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
119
Oefeningen Rond bij alle oefeningen het berekende percentage af op 0,01 %.
REEKS B 58
Een groep bestaat uit 8 Belgen, 5 Nederlanders en 7 Duitsers. Je kiest willekeurig 2 personen uit de groep. a) Wat is de kans dat het 2 Belgen zijn?
IN
b) Wat is de kans dat het een Nederlander en een Duitser zijn?
Je gooit 24 keer twee verschillende dobbelstenen op en telt telkens de som van het aantal ogen. Bereken de kans dat je minstens 1 keer 12 ogen gooit (het tweede probleem van Chevalier de Méré).
VA
59
N
De kans dat een bepaald geneesmiddel bijwerkingen heeft, is 2 %. 3 personen krijgen van hun huisarts het middel voorgeschreven.
©
60
a) Wat is de kans dat er niemand bijwerkingen heeft?
1
b) Wat is de kans dat er 1 iemand bijwerkingen heeft?
2 3
4
5 6
120
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
61
Zoë gooit 2 dobbelstenen op en telt de som van het aantal ogen. Yann gooit 1 dobbelsteen op. Maak gebruik van een kansboom om de kans te berekenen dat Yann meer ogen gooit dan Zoë.
IN
VA
N
Op een boekenrek staan 15 boeken over wiskunde en 10 boeken over fysica Je kiest lukraak 2 boeken uit het rek. Bereken de kans dat het 2 boeken zijn over hetzelfde vak a) als het eerst gekozen boek niet teruggeplaatst wordt;
©
62
b) als het eerst gekozen boek wel teruggeplaatst wordt.
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
121
63
In een mandje liggen 8 potloden, 12 balpennen en 7 stiften. Je kiest lukraak 2 voorwerpen uit het mandje. Bereken de kans dat er minstens 1 potlood bij zit a) als het eerste gekozen voorwerp niet teruggelegd wordt;
Vier vrienden gaan een ijsje eten en spreken af dat er één iemand zal trakteren. Om te bepalen wie, steken ze 4 briefjes, genummerd van 1 tot 4, in een doosje. Wie het briefje met het cijfer 1 trekt, trakteert. De briefjes worden na trekking niet teruggestoken. Wie heeft er het meeste kans om te moeten trakteren?
©
VA
64
N
IN
b) als het eerste gekozen voorwerp wel teruggelegd wordt.
1
2 3
4 5 6
122
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
65
Uit een onderzoek door Statistiek Vlaanderen van eind 2022 over mediabezit blijkt dat 52 % van de senioren (mensen ouder dan 65 jaar) beschikt over een smartphone, 63 % over een computer en 42 % over een tablet. Bereken de kans dat een willekeurige senior beschikt over a) een smartphone, maar geen computer en geen tablet;
N
c) minstens 1 van de 3 toestellen.
IN
b) 2 van de 3 toestellen;
VA
Licht komt het oog binnen via de pupil. De lens zorgt ervoor dat het inkomende licht geconcentreerd wordt op het netvlies. De kegeltjes en de staafjes zetten het licht om in signalen. Via zenuwen gaan deze signalen naar de hersenen, die zorgen voor de omzetting naar beeld. Als er iets mis is met de kegeltjes en staafjes, dan worden bepaalde kleuren in grijstinten gezien. De meeste kleurenblinde mensen zien niet alles in grijstinten, maar hebben problemen met bepaalde kleurenschema’s, zoals rood-groen of geel-blauw.
Ongeveer 0,5 % van de vrouwen en 8 % van de mannen is kleurenblind. Het lerarenkorps van een school bestaat uit 45 vrouwen en 27 mannen. Bereken de kans dat een leerkracht van de school kleurenblind is.
©
66
67
Van alle volwassen mensen onder 35 jaar leest 52 % regelmatig (minstens één keer per week) een krant. Bij de mensen tussen 35 en 65 jaar is dat 66 %. In een bedrijf werken 126 mensen onder 35 jaar en 217 mensen boven 35 jaar. Bereken de kans dat een willekeurige werknemer regelmatig de krant leest.
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
123
In een school studeren 28 leerlingen van richting A, 21 van richting B en 43 van richting C verder. Uit richting A haalt gemiddeld 61 % van de leerlingen een diploma hoger onderwijs. Uit richting B is dat 47 % en uit richting C 68 %. Bereken de kans dat een willekeurige leerling van die school een diploma hoger onderwijs haalt.
IN
68
REEKS C
Van 6 laptops zijn er 2 defect, maar je weet niet welke. Je test telkens 1 laptop tot je weet welke 2 defect zijn. Bereken de kans dat je meer dan 4 keer moet testen.
©
VA
N
69
1
2 3
4 5 6
124
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
70
In een lokaal zitten 11 leerlingen van klas A, 7 leerlingen van klas B en 12 leerlingen van klas C. Je kiest lukraak 3 leerlingen. Bereken de kans dat het 3 leerlingen zijn van dezelfde klas
IN
a) als er 3 verschillende leerlingen moeten gekozen worden;
In een doos liggen 6 strips van Jommeke, 7 strips van Suske & Wiske en 5 strips van Asterix. Je kiest aselect 3 strips. Bereken de kans dat het 3 strips zijn van verschillende reeksen
VA
71
N
b) als een leerling meermaals kan gekozen worden.
©
a) als de gekozen strips niet teruggelegd worden;
b) als de gekozen strips teruggelegd worden
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
125
STUDIEWIJZER Kansrekening voor de leerling
4.1 Basisbegrippen van de kansrekening KENNEN
voor de leerkracht
– + – +
Een experiment is een handeling, een waarneming, een telling ... met als doel een door het toeval beheerst verschijnsel te onderzoeken. Een experiment moet zo vaak herhaald kunnen worden als wenselijk en dat onder dezelfde omstandigheden. Een uitkomst van een experiment is een resultaat (een getal of hoedanigheid) van dat experiment. De uitkomstenverzameling Uvan een experiment is de verzameling van alle mogelijke uitkomsten van dat experiment.
IN
Een gebeurtenis is een deelverzameling van de uitkomstenverzameling. Een elementaire gebeurtenis is een gebeurtenis met één element. De uitkomstenverzameling Uis de zekere gebeurtenis.
De ledige verzameling ∅ is de onmogelijke gebeurtenis.
Als een gebeurtenis A, bij n herhaalde experimenten, n A n A keer voorkomt, dan is f A = _ de relatieve frequentie van A. n Naarmate het aantal herhaalde experimenten stijgt, zal de relatieve frequentie van een gebeurtenis steeds meer een bepaalde waarde benaderen.
N
De kans op een gebeurtenis is het getal dat de relatieve frequentie van die gebeurtenis benadert als het aantal herhaalde experimenten steeds groter wordt. Notatie: P( A) =de kans dat gebeurtenis A zich voordoet.
KUNNEN
– + – +
De uitkomstenverzameling van een experiment bepalen.
Een gebeurtenis bepalen door opsomming of omschrijving.
VA
De kans op een gebeurtenis bepalen.
4.2 Tellen met verzamelingen
KENNEN
– + – +
De doorsnede van twee verzamelingen A en B is de verzameling van de elementen die tot A en B behoren. Notatie: A B De unie van twee verzamelingen A en B is de verzameling van de elementen die tot A of B behoren. Notatie: A B
©
Het verschil van twee verzamelingen A en B is de verzameling van de elementen die tot A en niet tot B behoren. Notatie: A \ B _ De verzameling A = V \ Anoem je het complement _ van A ten opzichte van de verzameling V. Er geldt: #( A ) = #(V)− #(A).
KUNNEN
Een venndiagram gebruiken bij het oplossen van een telprobleem.
1
Het aantal elementen van de doorsnede, de unie, het verschil of het complement van eindige verzamelingen bepalen bij telproblemen.
2 3
4 5 6
126
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
– + – +
voor de leerling
4.3 De productregel KENNEN
voor de leerkracht
– + – +
Als een beslissing B bestaat uit k deelbeslissingen B 1 , B 2 , ..., B k en #(B 1) = n 1, #(B 2) = n 2 , ..., #(B k) = n k 1 n 2 ... n k dan: #(B) = n
Als n ∈ n \ { 0,1}, dan is n ! = n ( n − 1) ... 1 0 ! = 1 en 1 ! = 1
KUNNEN
– + – +
4.4 De uniforme kansverdeling
IN
Een boomdiagram of de productregel gebruiken bij telproblemen.
KENNEN
– + – +
Een kansverdeling is uniform als de kansen op elk van de elementaire gebeurtenissen van een uitkomstenverzameling Uaan elkaar gelijk zijn. Bij een uniforme kansverdeling in een uitkomstenverzameling U met n elementen, is de kans op een gebeurtenis A met k elementen gelijk aan aantal gunstige gevallen k = ______________________ P( A) = _ . n aantal mogelijke gevallen
N
KUNNEN
– + – +
De kans berekenen van een gebeurtenis bij experimenten waarbij alle uitkomsten even waarschijnlijk zijn.
VA
4.5 Kansbomen
KENNEN
– + – +
De som van de kansen bij de takken die vertrekken vanuit eenzelfde punt is altijd gelijk aan 1. Om de kans van een eindpunt te bepalen, vermenigvuldig je de kansen van de deeltakken die je terugvindt vanaf het beginpunt tot dat eindpunt. Als verschillende eindpunten in aanmerking komen, tel je de kansen van de eindpunten op.
KUNNEN
– + – +
©
Een kansboom gebruiken om kansen te bepalen bij trekkingen met teruglegging en trekkingen zonder teruglegging.
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
127
Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?
❑ filter
❑ schets
❑ patroon
❑ schema/tabel
❑ kennis
❑ vereenvoudig
❑ logisch nadenken
❑ gok verstandig
❑ ...
IN
❑ concreet materiaal
1. Wat is de oppervlakte van de gekleurde vierhoek in de gegeven rechthoek?
12
8
8
14
6
B) 144
C) 152
D) 156
E) 280
N
A) 84
16
VA
JWO, editie 2023, eerste ronde
2. Stel dat het aantal vluchten tussen Brussel en Londen in een bepaalde periode met 10 % is afgenomen en dat het aantal passagiers op dat traject met 25 % is gedaald. Met hoeveel procent is in die periode het gemiddelde aantal passagiers per vlucht gedaald? Rond af op 0,1 %.
3. Twee naast elkaar liggende getallen in deze piramide hebben als som het getal dat erboven staat.
©
91
Vul de piramide verder in. 20
12
1
5
2
7
3
4 5 6
128
STATISTIEK I HOOFDSTUK 4 I KANSREKENING
35
4
HOOFDSTUK 5 I DE NORMALE VERDELING
Kansdichtheidsfunctie
130
5.2
De normale kansdichtheidsfunctie
133
5.3
IN
5.1
Berekeningen met de normale verdeling 136
5.4 De standaardnormale verdeling 5.5
140
Niet alle gegevens zijn normaal verdeeld 147 157
Pienter problemen oplossen
158
©
VA
N
Studiewijzer
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
129
5.1
Kansdichtheidsfunctie
5.1.1 Symmetrische verdeling Als je een bakje aardbeien koopt van 500 g, dan bevat het bakje zelden exact 500 g. Je kunt moeilijk een aardbei in stukken snijden. Een aselecte steekproef bij 500 bakjes aardbeien leverde de volgende frequentietabel op. ni
fi
[478, 482[
3
0,60 %
[482, 486[
12
2,40 %
[486, 490[
28
5,60 %
[490, 494[
59
11,80 %
[494, 498[
92
18,40 %
[498, 502[
108
21,60 %
[502, 506[
95
19,00 %
[506, 510[
62
12,40 %
[510, 514[
29
5,80 %
[514, 518[
10
2,00 %
[518, 522[
2
0,40 %
500
100,00 %
25,00 %
IN
massa (g)
21,60 %
VA _ x=
Me =
19,00 %
18,40 %
15,00 %
12,40 %
11,80 %
10,00 %
5,80 %
5,60 % 5,00 %
N 2,40 %
2,00 %
0,60 %
0,40 %
modale klasse =
massa (g)
De steekproef levert een symmetrische verdeling op. Je ziet dat het gemiddelde en de mediaan aan elkaar gelijk zijn en in de modale klasse liggen. De oppervlakte van het gedeelte van het histogram links van de verticale rechte x = 500 is gelijk aan de oppervlakte rechts ervan. Als gegroepeerde gegevens symmetrisch verdeeld zijn dan zijn het gemiddelde en de mediaan aan elkaar gelijk en liggen ze in het midden van de modale klasse.
©
Algemeen
GeoGebra
1
2 3 4
5 6
130
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
[518, 522[
[514, 518[
[510, 514[
[506, 510[
[502, 506[
[498, 502[
[494, 498[
[486, 490[
[482, 486[
[478, 482[
0,00 %
[490, 494[
relatief aantal bakjes
20,00 %
5.1.2 Frequentiedichtheid en kansdichtheid Definitie
Frequentiedichtheid De frequentiedichtheid van een klasse in een gegroepeerde frequentietabel is het quotiënt van de relatieve frequentie en de klassenbreedte.
VIDEO
De frequentiedichtheid is dus de relatieve frequentie per eenheid. • Bereken de frequentiedichtheid voor elke klasse van de frequentietabel. massa (g)
mi
fi
[478, 482[
480
0,60 %
[482, 486[
484
2,40 %
[486, 490[
488
5,60 %
[490, 494[
492
11,80 %
[494, 498[
496
18,40 %
[498, 502[
500
21,60 %
[502, 506[
504
19,00 %
[506, 510[
508
12,40 %
512
5,80 %
516
2,00 %
[514, 518[
IN
f.d.
0,05
0,04
0,03
0,02
520
0,40 %
0,01
0
m (g)
VA
[518, 522[
0,06
474 476 478 480 482 484 486 488 490 492 494 496 498 500 502 504 506 508 510 512 514 516 518 520 522 524
[510, 514[
fdi
N
GEOGEBRA
Naast de tabel zie je het bijhorende dichtheidshistogram en de frequentiepolygoon. Die frequentiepolygoon is een type lijndiagram die de punten ( m i , fd i)met elkaar verbindt en die aansluit op de horizontale as. • Hoe kun je uit de frequentiedichtheid van een klasse de relatieve frequentie van die klasse berekenen?
Wat is de grafische betekenis van die berekening?
©
• Bereken de standaardafwijking met ICT: s =
Schat hoeveel procent van de gegevens hoogstens één keer de standaardafwijking afwijken van het gemiddelde. Rond af op 1 %. STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
131
Van steekproef naar populatie De 500 gewogen bakjes aardbeien vormen een steekproef die getrokken is uit de volledige populatie van alle bakjes aardbeien die een massa van 500 g op het etiket staan hebben. _ Het gemiddelde x = 500,0 (g)en de standaardafwijking s = 7,30 (g) van de steekproef zijn dan schattingen voor het populatiegemiddelde m en de populatiestandaardafwijking s. Omdat het daarbij gaat om een aselecte steekproef kun je, vanuit het principe van de statistische stabiliteit, bepalen dat de benadering van het gemiddelde en de standaardafwijking voor de volledige populatie zal verbeteren als het aantal elementen van de steekproef toeneemt.
0,06
IN
De relatieve frequentieverdeling wordt dan een kansverdeling en de frequentiedichtheid wordt een kansdichtheid.
Je ziet het histogram dat hoort bij de uitgevoerde streekproef en de grafiek van een vloeiende kromme. Die kromme kun je beschouwen als de idealisering van de frequentiepolygoon van de vorige pagina.
f.d.
0,05
0,04
0,02
0,01
m (g)
474 476 478 480 482 484 486 488 490 492 494 496 498 500 502 504 506 508 510 512 514 516 518 520 522 524
VA
0
De functie waarvan je de grafiek ziet, noem je een kansdichtheidsfunctie. = 500,0en s De waarden m = 7,30 zijn de parameters van de kansdichtheidsfunctie. De waarden op de horizontale as noem je dan waarden van een toevalsveranderlijke X. In ons voorbeeld is X de massa (in g) van een bakje aardbeien.
N
0,03
Overzicht
steekproef
©
relatieve frequentie van een klasse
1
kans dat een toevalsveranderlijke waarden aanneemt tussen twee gegeven getallen
_ gemiddelde x standaardafwijking s
populatiegemiddelde m populatiestandaardafwijking s
frequentiedichtheid histogram en frequentiepolygoon
kansdichtheid grafiek van een kansdichtheidsfunctie
2 3 4
5 6
132
populatie
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
5.2
De normale kansdichtheidsfunctie
5.2.1 Definitie Bij heel wat continue numerieke gegevens verkrijg je een verdeling waarbij de mediaan en het gemiddelde samenvallen in de modale klasse en het histogram bij benadering een klokvormige curve vormt. Dergelijke gegevens noem je ‘normaal verdeeld’. Definitie
Normale kansdichtheidsfunctie 2
1 _ e – 2 ( s ) is de normale kansdichtheidsfunctie De functie met voorschrift f (x) = _ s √ 2p met parameters m en s.
IN
x–m 1 _ _
Opmerkingen
• Het getal e is een constant irrationaal getal en is ongeveer gelijk aan 2,718. • De parameters m en s zijn respectievelijk gelijk aan het populatiegemiddelde en de populatiestandaardafwijking. • Je hoeft de formule voor de normale kansdichtheidsfunctie niet vanbuiten te leren. Berekeningen met de normale verdeling zul je met ICT uitvoeren.
N
5.2.2 Kenmerken van de grafiek
• De grafiek ligt boven de x-as en is klokvormig en symmetrisch ten opzichte van de verticale rechte met vergelijking x = m. • De functie bereikt een maximum als x = m. • De grafiek bezit twee buigpunten, namelijk als x = m – s en als x = m + s. (In een buigpunt maakt een kromme de overgang van hol naar bol of omgekeerd.) • De x-as is een horizontale asymptoot voor de grafiek.
VA
y
x
x=μ-σ
x=μ
x=μ+σ
©
Invloed van de parameters m en s op de vorm van de grafiek
De grafiek van de normale kansdichtheidsfunctie wordt soms ook de Gausscurve genoemd, naar de Duitse wiskundige Carl Friedrich Gauss (1777-1855) die aantoonde dat de verdeling van meetfouten bij waarnemingen ‘normaal’ verdeeld is.
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
133
5.2.3 De normale verdeling met ICT y
f
x b
IN
a
Je kunt niet rechtstreeks kansen berekenen vanuit het voorschrift van de kansdichtheidsfunctie f. Om de kans te bepalen dat X tussen a en b is gelegen (bijvoorbeeld de kans dat iemand tussen 175 cm en 180 cm groot is), bereken je de oppervlakte tussen de grafiek van f, de x-as en de verticalen x = a en x = b. De kans dat een continue toevalsveranderlijke X gelijk is aan een bepaalde waarde (denk bijvoorbeeld aan de kans dat iemand exact 178 cm groot is) is dus 0.
Je gebruikt de schermindeling ‘Kansrekening’.
464 466 468 470 472 474 476 478 480 482 484 486 488 490 492 494 496
Normale verdeling
474 476 478 480 482 484 486 488 490 492 494 496 498 500 502 504 506 508 510 512 514 516 518 520 522 524 526
P ( 498
μ 500
≤ X ≤ 502
σ 7,3
) = 0,2159
N
Vul de volgende tabel aan. Maak voor de linkerkolom gebruik van de normale kansdichtheidsfunctie met m = 500 en s = 7,30 en voor de rechterkolom van de frequentietabel van § 5.1. De stand van de intervalhaken speelt geen rol, omdat de kans op exact een bepaalde waarde gelijk is aan 0.
VA
kans
P(490 ⩽ X ⩽ 494) =
f [490, 494[ =
P(X ⩾ 514) =
1 – c f [510, 514[ =
P(X ⩽ 502) =
relatieve frequentie
c f [498, 502[ =
©
De normale verdeling met Excel
1
2
P(490 ⩽ X ⩽ 494) = NORM.VERD.N(494; 500; 7,30; 1) – NORM.VERD.N(490; 500; 7,30; 1)
3 4
5
De normale verdeling met GeoGebra
6
134
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
Oefeningen REEKS A 1
Je ziet de grafieken van 6 normale kansdichtheidsfuncties. Bepaal telkens de parameters m en s. Kies voor s uit de waarden 1; 1,5; 2; 3 en 4.
y grafiek 3
IN
0,4
0,35
0,3
grafiek 6
0,25
grafiek 1
0,2
0,15
0,1
grafiek 2
grafiek 5
VA
0,05
N
grafiek 4
O
2
4
m
©
grafiek 1
6
8
10
x 12
14
16
18
s
20
22
m
24
s
grafiek 4
grafiek 2
grafiek 5
grafiek 3
grafiek 6
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
135
5.3
Berekeningen met de normale verdeling
5.3.1 Voorbeeld 1
massa (g)
m
s
jongens
3 440
425
meisjes
3 360
410
IN
VIDEO
De tabel bevat gegevens over het geboortegewicht van levend geboren eenlingen in België. De gemiddelden zijn afgerond op 10 g, de standaardafwijkingen op 5 g. Veronderstel dat de gegevens leiden tot een normale verdeling.
• Hoeveel procent van de meisjes weegt tussen 2 800 en 3 200 g?
Normal
σ 410
P ( 2 800 ≤ X ≤ 3 200 ) =
N
2 400 2 600 2 800 3 000 3 200 3 400 3 600 3 800 4 000 4 200
μ 3 360
VA
Excel: NORM.VERD.N(3 200; 3 360; 410; 1) – NORM.VERD.N(2 800; 3 360; 410; 1)
• Wat is de kans dat een jongen meer dan 4 kg weegt?
2 800 3 000 3 200 3 400 3 600 3 800 4 000 4 200 4 400 4 600 4 800
©
Excel: 1 – NORM.VERD.N(4 000; 3 440; 425; 1)
1
2 3 4
5 6
136
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
Normal
μ 3 440
P ( 4 000 ≤ X ) =
σ 425
• Hoeveel moet een jongen wegen om tot de lichtste 10 % te behoren? Rond af op 1 g.
μ 3 440
Normal
P( X ≤
2 200 2 400 2 600 2 800 3 000 3 200 3 400 3 600 3 800 4 000 4 200 4 400
σ 425
) = 0,1
IN
Excel: NORM.INV.N(0,1; 3 440; 425)
• Hoeveel weegt het zwaarste kwart bij de meisjes? Rond af op 1 g.
Normal
2 600 2 800 3 000 3 200 3 400 3 600 3 800 4 000 4 200 4 400 4 600
P(
μ 3 360
σ 410
≤ X ) = 0,25
N
Excel: NORM.INV.N(0,75; 3 360; 410)
VA
5.3.2 Voorbeeld 2
Letse vrouwen zijn gemiddeld de grootste ter wereld. Ze worden gemiddeld 170,3 cm groot. De standaardafwijking is 7,26 cm. De Belgische vrouwen staan op de twintigste plaats. Gemiddeld worden ze 166,1 cm groot, met een standaardafwijking van 7,80 cm.
©
Als een Belgische vrouw bij de 20 % grootsten is, hoeveel procent van de Letse vrouwen is dan groter?
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
137
Oefeningen Bij alle berekeningen rond je het eindresultaat af op twee cijfers na de komma.
REEKS A 2
Niet alle euromunten hebben exact dezelfde diameter. De diameter van de munten van één euro is normaal verdeeld met een gemiddelde van 23,25 mm. De standaardafwijking is 0,085 mm. a) Hoeveel procent heeft een diameter van minstens 23,4 mm?
IN
b) Van hoeveel procent ligt de diameter tussen 23,2 en 23,4 mm?
c) Wat is de diameter van de 25 % grootste munten?
De gemiddelde dagtemperatuur in Oostende voor de maand juli is 16,3 ºC. De standaardafwijking is 3,78 ºC. Je mag uitgaan van een normale verdeling.
N
3
a) Wat is de kans dat er in juli een dagtemperatuur is boven 20 ºC?
VA
b) Bereken de kans dat de dagtemperatuur tussen 15 ºC en 17 ºC ligt.
c) Wat is de dagtemperatuur van de 10 % koudste julimaanden?
De leeftijd waarop een kind voor het eerst alleen kan lopen is normaal verdeeld. Het gemiddelde is 13,5 maanden en de standaardafwijking 1,95 maanden.
©
4
a) Bij hoeveel procent worden de eerste pasjes gezet tussen de 12 en 14 maanden?
b) Wat is de kans dat een kind al loopt als het 11 maanden is?
1
c) Hoeveel procent loopt pas na de leeftijd van 15 maanden?
2
3
d) Een kind is bij de 5 % vroegste lopers. Op welke leeftijd begon het te lopen?
4
5
6
138
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
REEKS B 5
De populairste appelsoorten in België zijn de jonagold en de granny smith. De massa van beide appelsoorten is normaal verdeeld. Een jonagold weegt gemiddeld 194 g met een standaardafwijking van 29,5 g. Een granny smith weegt gemiddeld 155 g met een standaardafwijking van 22,6 g. a) Hoeveel procent van de jonagoldappelen weegt meer dan 250 g? b) De 15 % lichtste jonagoldappelen worden gebruikt voor appelsap. Hoeveel wegen die appelen?
IN
c) Hoeveel procent van de grannysmithappelen weegt minder dan de gemiddelde jonagoldappel?
d) Wat is de kans dat een granny smith meer weegt dan het derde kwartiel van de jonagoldappelen?
De dosis van een product nodig voor een volledige verdoving is normaal verdeeld met gemiddelde 50 mg en standaardafwijking 10 mg. De letale dosis (dat is de dosis die de dood veroorzaakt) van dat product is ook normaal verdeeld. Het gemiddelde is 110 mg en de standaardafwijking 20 mg. Als een anesthesist een dosis zou gebruiken die in 90 % van de gevallen voldoende is om een patiënt te verdoven, hoeveel procent sterfgevallen zouden er dan zijn?
VA
6
N
Een bedrijf maakt bouten en bijpassende moeren. De diameter van de bouten is normaal verdeeld met gemiddelde 2,0 mm en standaardafwijking 0,12 mm. Ook de diameter van de moeren is normaal verdeeld. De gemiddelde moer heeft een diameter van 2,2 mm en een standaardafwijking van 0,09 mm. De 10 % kleinste moeren worden niet in de handel gebracht. Welk deel van de bouten kan daardoor ook niet verkocht worden?
©
7
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
139
5.4
De standaardnormale verdeling
5.4.1 Standaardscore Definitie
Standaardscore De standaardscore of z-score van de waarde x van een toevalsveranderlijke X x–m is gelijk aan z = _ s . Daarbij is m het populatiegemiddelde en s de populatiestandaardafwijking.
IN
De standaardscore is de afwijking van x ten opzichte van het gemiddelde m, uitgedrukt in aantal keer de standaardafwijking s.
Met behulp van de standaardscore kun je op een eenvoudige manier verschillende veranderlijken in verschillende meeteenheden met elkaar vergelijken. De standaardscore is immers onafhankelijk van de meeteenheid. Voorbeeld 1
N
De gemiddelde Belgische man wordt 181,7 cm groot, met een standaardafwijking van 7,05 cm. In de Verenigde Staten werken ze met inches. De gemiddelde Amerikaan wordt 69,1 inch groot, met een standaardafwijking van 2,43 inch.
VA
Een Belgische man is 185 cm groot, zijn Amerikaanse kennis meet 70,9 inch. Wie is relatief het grootst van de twee? zB =
zA =
Voorbeeld 2
©
Het bintje is de meest verkochte frietaardappel. Het gemiddelde bintje dat als frietaardappel aangeboden wordt, heeft een massa van 193,5 g. De standaardafwijking is 27,35 g. Frietbintjes met een z-score boven 1,5 worden als XL-bintjes verkocht. Hoeveel wegen de XL-bintjes?
1
2 3 4
5 6
140
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
5.4.2 De standaardnormale kansdichtheidsfunctie Als je de waarden x van een normaal verdeelde toevalsverandelijke X vervangt door hun standaardscore z, dan krijg je een toevalsveranderlijke Z GEOGEBRA
Definitie
waarvoor geldt: m Z = 0 en s Z = 1
1 2 _
– z 2 De kansdichtheidsfunctie die hoort bij Z heeft als voorschrift f (z) = _ 1_ e . √ 2p
standaardnormale kansdichtheidsfunctie
1 2 _
IN
– z 2 De functie met voorschrift f (z) = _ 1_ e is de standaardnormale kansdichtheidsfunctie √ 2p met parameters m Z = 0 en s Z = 1.
y 0,4
• De grafiek is symmetrisch ten opzichte van de verticale rechte met vergelijking z = 0.
0,3
• De functie bereikt een maximum als z = 0. • De grafiek bezit twee buigpunten,
0,2
namelijk als z = –1 en als z = 1.
N
• De z-as is een horizontale asymptoot
0,1
voor de grafiek.
z
–2
–1
0
1
2
3
VA
–3
5.4.3 De empirische regel
Je gaat na hoeveel procent van de normaal verdeelde gegevens hoogstens één keer, twee keer of drie keer de standaardafwijking afwijkt van het gemiddelde.
VIDEO
©
– 1 ⩽ z ⩽ 1
–3 –2,5 –2 –1,5 –1 –0,5
0
0,5
1
1,5
2
2,5
Normale verdeling
3
P ( −1
≤X≤ 1
μ 0
σ 1
) = 0,6827
68,27 % van de gegevens wijkt hoogstens één keer s af van m.
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
141
– 2 ⩽ z ⩽ 2 μ 0
Normale verdeling
–3 –2,5 –2 –1,5 –1 –0,5
0
0,5
1
1,5
2
2,5
P ( −2
3
≤X≤ 2
σ 1
) = 0,9545
95,45 % van de gegevens wijkt hoogstens twee keer s af van m.
IN
– 3 ⩽ z ⩽ 3
μ 0
Normale verdeling
–3 –2,5 –2 –1,5 –1 –0,5
0
0,5
1
1,5
2
2,5
P ( −3
3
≤X≤ 3
σ 1
) = 0,9973
Opmerking
N
99,73 % van de gegevens wijkt hoogstens drie keer s af van m.
Wie met Excel werkt, gebruikt de functie NORM.S.VERD. Bijvoorbeeld: P( – 1 ⩽ Z ⩽ 1) =NORM.S.VERD(1; 1) – NORM.S.VERD(–1; 1).
VA
Samenvatting
Empirische regel voor normaal verdeelde toevalsveranderlijken
y
y
y
68 %
95 %
99,7 %
©
16 %
–3
–2
–1
2,5 %
16 %
0
1
2
3
z 4
–3
–2
–1
2,5 % 0
1
2
3
0,15 % z 4
0,15 % z
–3
–2
–1
0
• De waarden in [m – s, m + s] horen tot de standaardgroep. • De waarden in [m – 2 s, m – s [ zijn laag; de waarden in [m + s, m + 2 s] zijn hoog.
1
• De waarden buiten [m – 2 s, m + 2 s] zijn uitzonderlijk.
2 3 4
5 6
142
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
1
2
3
4
5.4.4 Gebruik van de standaardnormale verdeling Voorbeeld 1 Intelligentie is een van de meest onderzochte begrippen in de wetenschappelijke psychologie. Het intelligentiequotiënt (IQ) heeft vooral betrekking op aanleg tot goed kunnen redeneren, logisch denken en ruimtelijk inzicht.
VIDEO
De gemiddelde IQ-score is 100 en de standaardafwijking is 15.
standaardscore
IQ
IN
Vul de tabel aan. Gebruik de empirische regel.
–2 ⩽ z < –1 –1 ⩽ z ⩽ 1
laag: onintelligent
standaard begaafd hoog: intelligent
N
1<z⩽2
Voorbeeld 2
procent van de bevolking
uitzonderlijk laag: zwakbegaafd
z < –2
z>2
betekenis
uitzonderlijk hoog: hoogbegaafd
VA
De hoeveelheid koffie die een automaat per keer levert, is normaal verdeeld. De helft van de bekertjes bevat minstens 160 ml, een kwart minstens 165 ml. De bekertjes kunnen hoogstens 180 ml bevatten. Bereken de kans dat er een bekertje overloopt.
• Bij een normale verdeling is het gemiddelde gelijk aan de mediaan • De standaardafwijking bepaal je met behulp van de standaardscore.
©
Voor een kwart van de gegevens geldt dat z ⩾ 0,674 5. x–m 165 – 160 = 0,674 5 _ _ s = 0,674 5 ⇔ s 5 _ 0,674 5 s = 5 ⇔ s = ≈ 7,41 (ml) 0,674 5
⇒ m = 160
Excel: = NORM.S.INV(0,75)
• Bereken, op 0,01 % nauwkeurig, de kans dat er een bekertje overloopt.
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
143
Oefeningen Je rondt berekende kansen altijd af op twee cijfers na de komma.
REEKS A 8
De gemiddelde maandelijkse all-in huurprijs voor een studentenkamer in Gent in het academiejaar 2022-2023 bedroeg 451 euro. De standaardafwijking was 63,50 euro. Los de volgende vragen op zonder ICT.
IN
a) Wat is de kans dat een kamer meer dan 514,50 euro per maand kostte?
Als de dokter je bloeddruk meet, dan geeft hij twee waarden op: de bovendruk en de onderdruk. De bovendruk is de hoogste druk op de vaatwanden, namelijk als het hart samentrekt. De onderdruk wordt gemeten als het hart zich ontspant. De bovendruk bij volwassenen is normaal verdeeld met een gemiddelde van 117 mmHg (kwikdruk) en een standaardafwijking van 18,5 mmHg. Los de volgende vragen op zonder ICT.
VA
9
N
b) Tot welk bedrag was de maandelijkse huurprijs uitzonderlijk laag?
a) Tussen welke waarden ligt de bovendruk bij 68 % van de volwassenen?
©
b) De dokter zegt dat je bloeddruk laag is. Welke bovendruk heb je dan?
c) Vanaf welke waarde is de bovendruk uitzonderlijk hoog?
1
2 3
d) Hoeveel procent van de volwassen heeft een uitzonderlijk hoge bovendruk?
4
5 6
144
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
REEKS B 10
De inhoud van automatisch gevulde melkflessen is normaal verdeeld. Het gemiddelde is de inhoud waarop de machine is ingesteld. De standaardafwijking is 1,50 cl. Het bedrijf wenst dat 75 % van de flessen minstens 100 cl bevat. a) Op welke inhoud moet de vulmachine worden ingesteld? Rond af op 1 ml.
IN
b) De flessen kunnen hoogstens 105 ml melk bevatten. Wat is de kans dat een fles overloopt bij het vullen?
Op pakjes boter staat meestal 250 g ℮. Dat betekent dat, volgens de Europese norm, niet meer dan 5 % van die pakjes minder dan 250 g mag bevatten. De massa van pakjes boter van een bepaald merk is normaal verdeeld met een standaardafwijking van 6,5 g.
N
11
VA
a) Bereken de gemiddelde massa zodat precies voldaan wordt aan de Europese norm. Rond af op 0,1 g.
b) Wat is de kans dat een pakje boter tussen 255 en 260 g weegt?
©
c) Wat is de kans dat een pakje minder weegt dan 245 g?
d) Hoeveel wegen de 20 % zwaarste pakjes? Rond af op 0,1 g.
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
145
12
Een supermarktketen biedt appelmoes aan in bokalen waarvan het etiket een inhoud van 500 ml aangeeft. Uit een voldoende grote aselecte steekproef is gebleken dat de helft van de bokalen appelmoes meer dan 502 ml bevatten. Eén op de tien bokalen bevat meer dan 510 ml. Je mag ervan uitgaan dat de inhoud van de bokalen normaal verdeeld is.
IN
a) Bereken de standaardafwijking op 0,01 ml nauwkeurig.
b) Wat is de kans dat een bokaal appelmoes tussen 495 ml en 505 ml bevat?
De spanwijdte van de vleugels van vlinders is normaal verdeeld. Een bioloog heeft van 2 000 koolwitjes de spanwijdte (in cm) van de vleugels gemeten. Zijn onderzoek leidt tot de volgende boxplot.
VA
13
N
c) Bereken het eerste kwartiel. Rond af op 0,1 ml.
2,50
4,65 5,25 5,85
8,00
©
a) Bepaal het gemiddelde en de standaardafwijking. Rond s af op 0,001 cm.
1
2 3
b) Wat is de kans dat je een koolwitje ziet met een vleugelwijdte van meer dan 7 cm?
4
5 6
146
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
5.5
Niet alle gegevens zijn normaal verdeeld Van sommige gegevens is algemeen geweten dat ze normaal verdeeld zijn. Veel natuurlijke kenmerken (de lengte van een mens, de massa van eieren, de schofthoogte van een hondenras ...) kunnen beschreven worden met de normale verdeling. Ook de theorie van de meetfouten bij laboratoriumonderzoek of automatisering steunt op de normale verdeling.
5.5.1 Rechtsscheve verdelingen
IN
In veel andere gevallen kun je echter de normale verdeling niet toepassen.
In 2021 voerde Statbel een loonenquête uit naar het maandelijkse bruto-inkomen bij 130 000 werknemers van Belgische bedrijven. Je ziet de verdeling in loonklassen. Het gemiddelde is 3 835,6 euro en de standaardafwijking 1 071,76 euro. 25 %
15 %
N
18,18 %
14,46 %
11,52 %
10 %
9,40 %
7,24 %
VA
percentage van de werknemers
21,12 % 20 %
7,58 % 5,61 %
5%
3,66 %
1,23 %
0%
[1 500, 2 000[
[2 500, 3 000[
[2 000, 2 500[
[3 500, 4 000[
[3 000, 3 500[
[4 500, 5 000[ [4 000, 4 500[
[5 500, 6 000[ [5 000, 5 500[
> 6 000
maandelijks bruto inkomen in euro
0,045 % 0,040 %
©
frequentiedichtheid en kansdichtheid (normale verdeling)
Je zet de relatieve frequenties om naar frequentiedichtheden.
0,035 % 0,030 % 0,025 % 0,020 % 0,015 % 0,010 % 0,005 % > 6 000
[5 500, 6 000[
[5 000, 5 500[
[4 500, 5 000[
[4 000, 4 500[
[3 500, 4 000[
[3 000, 3 500[
[2 500, 3 000[
[2 000, 2 500[
[1 500, 2 000[
0,000 %
Over het histogram voor de frequentiedichtheden is (een stuk van) de Gausscurve getekend met m = 3 835,6 en s = 1071,76. Bij de verdeling van de inkomens ligt de modale klasse links van het centrum en is er een ‘staart naar rechts’, waardoor het gemiddelde rechts van de mediaan ligt. _ Er geldt dus: x > Me. Je noemt die verdeling rechtsscheef.
maandelijks bruto inkomen in euro
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
147
5.5.2 Linksscheve verdelingen In 2022 bedroeg de gemiddelde leeftijd waarop een Belgische vrouw stierf 84,0 jaar. De standaardafwijking was 13,55 jaar en de mediaanleeftijd 86 jaar. Het histogram is gemaakt op basis van de sterftetafels. 40 % 36,15 % 35 %
IN
relatief aantal sterfgevallen
31,96 % 30 %
25 %
20 %
16,35 %
15 %
10 %
5% 0%
N
7,36 %
2,88 %
2,85 %
0,35 %
0,11 %
0,24 %
0,51 %
[0, 10[
[10, 20[
[20, 30[
[30, 40[
1,24 %
[40, 50[
[50, 60[
[60, 70[
[70, 80[
[80, 90[
[90, 100[
>100
leeftijd in jaren
VA
Vul de tabel met frequentiedichtheden aan.
leeftijd
[0, 10[ [10, 20[ [20, 30[ [30, 40[ [40, 50[ [50, 60[ [60, 70[ [70, 80[ [80, 90[ [90, 100[
f.d. (%)
4,0 %
3,0 %
©
frequentiedichtheid en normale kansdichtheid
3,5 %
2,5 % 2,0 % 1,5 % 1,0 %
leeftijd in jaren
3 4
Verdelingen met GeoGebra
5 6
148
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
>100
[90, 100[
[80, 90[
[70, 80[
[60, 70[
[50, 60[
[40, 50[
[30, 40[
[20, 30[
2
[10, 20[
0,0 %
[0, 10[
0,5 %
1
>100
Het histogram voor de frequentiedichtheden is helemaal niet goed te benaderen door de Gausscurve met m = 84,0 en s = 13,55. Bij de verdeling van de leeftijden is er een ‘staart naar rechts’, waardoor het gemiddelde links van de mediaan ligt. _ Er geldt dus: x < Me. Je noemt die verdeling linksscheef.
5.5.3 Symmetrische verdelingen die niet normaal verdeeld zijn In het verkeer is de reactietijd de tijd die verloopt tussen het zien van een gevaar en het ogenblik dat het rempedaal wordt ingedrukt. De reactietijd is afhankelijk van verschillende factoren: leeftijd, vermoeidheid, alcoholgebruik, zichtbaarheid van het gevaar ... In een experiment werd de reactietijd (in honderdsten van een seconde) gemeten van 100 mannelijke chauffeurs van 25 jaar, bij een identieke vooropgestelde situatie. 60 % 49 %
40 % 30 % 20 %
IN
aantal chauffeurs in procent
50 %
13 %
12 %
10 % 0%
7% 1%
2%
3%
[72, 74[
[74, 76[
[76, 78[
7%
[78, 80[
[80, 82[
[82, 84[
[84, 86[
[86, 88[
4%
[88, 90[
1%
[90, 92[
1%
[92, 94[
N
reactietijd in honderdsten seconden
De gemiddelde reactietijd en de mediaantijd zijn gelijk, namelijk 83,0 honderdsten seconden. De standaardafwijking is 3,13 honderdsten seconden. Er is dus duidelijk sprake van een symmetrische verdeling. Om na te gaan of hier ook een normale verdeling geldt, gebruik je ICT.
VA
Methode met Excel
©
Stap 1: je vult de frequentietabel aan met de klassenmiddens en de frequentiedichtheden.
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
149
Stap 2: je berekent voor elk klassenmidden de waarde van de normale kansdichtheidsfunctie
IN
Je gebruikt de functie NORM.VERD.N
Stap 3: je tekent het histogram voor de frequentiedichtheden en de Gausscurve.
• Selecteer de kolommen met de waarden van de frequentiedichtheid en de kansdichtheid.
10,0 %
N 1
2
3
de klassen.
• Verplaats de grafiek naar een nieuw blad.
• Rechtermuisklik op het lijndiagram –
©
• Geef gepaste astitels.
Het is duidelijk dat een normale verdeling hier niet past.
3 4
5 6
150
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
11
0,5 %
0,5 %
[90, 92[
[92, 94[
reactietijd in honderdsten seconde frequentiedichtheid
Gegevensreeks opmaken – Opvulling en lijn –Vloeiende lijn.
Methode met GeoGebra
10
2,0 %
1,5 %
0,0 %
[76, 78[
4,0 %
1,0 %
8,0 %
[74, 76[
Reeks 2 → normale kansdichtheid
2
9
[88, 90[
12,0 %
Reeks 1 → frequentiedichtheid
1
8 Reeks 2
16,0 %
0,5 %
frequentiedichtheid en normale kansdichtheid
• Wijzig de legendenamen:
7
24,5 %
[72, 74[
VA naar eigen voorkeur.
6
20,0 %
Gegevensreeks opmaken –
Opvulling en contour doe je
5
24,0 %
• Rechtermuisklik op één van de staven – Breedte tussenruimte: 0 %.
4 Reeks 1
3,5 %
0,0 %
[86, 88[
Aslabelbereik: selecteer de cellen met
6,5 %
5,0 %
[84, 86[
Horizontale aslabels – Bewerken.
[82, 84[
Gegevens selecteren –
15,0 %
6,0 %
• Rechtermuisklik op de horizontale as;
20,0 %
[80, 82[
Gegroepeerde kolom lijn – OK.
25,0 %
3,5 %
Alle grafieken – Combinatie –
30,0 %
[78, 80[
• Invoegen – Aanbevolen Grafieken –
normale kansdichtheid
5.5.4 Toepassen van de empirische regel Voorbeeld 1 Een aardappelverwerkingsbedrijf heeft van 96 willekeurig gekozen aardappelen de massa bepaald in g. Ga na of een normale verdeling geldig is. 73
100
131
95
99
95
112
101
124
114
118
108
56
125
82
93
143
100
113
72
86
128
118
102
94
106
132
92
111
117
69
108
104
111
100
102
96
89
77
108
144
117
93
107
105
46
141
65
100
106
81
81
138
99
56
94
77
105
117
133
98
101
125
133
103
137
71
119
92
77
102
105
109
128
31
96
100
117
119
53
107
130
78
107
141
110
79
98
99
139
116
129
94
98
97
116
_ x ≈ Me
⇒
De verdeling is symmetrisch.
_ x= Me =
IN
VIDEO
percentage gegevens (empirische regel)
interval
aantal gegevens (steekproef)
relatieve frequentie
N
_ _ [x – s , x + s] =
s=
68 %
_ _ [x – 2 s , x + 2 s] =
95 %
VA
Deze percentages voldoen aan de empirische regel. Je kunt een normale verdeling toepassen. Voorbeeld 2
Aan 83 leerkrachten van een school werd gevraagd op hoeveel kilometer ze van school wonen. 7
36
5
10
1
22
2
4
15
3
11
12
25
4
2
13
6
5
31
10
2
12
18
6
1
41
7
4
8
19
12
17
24
9
19
23
12
17
9
32
13
30
1
3
15
5
6
7
20
3
38
44
11
24
14
8
23
12
37
11
13
33
26
8
1
9
39
17
8
18
21
10
29
18
2
25
28
11
21
8
29
6
©
3
_ x= Me =
_ x > Me ⇒ de verdeling is rechtsscheef. Er is geen normale verdeling van toepassing.
GeoGebra STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
151
Oefeningen REEKS A 14
Tot welke soort verdeling (symmetrisch S, rechtsscheef R, linksscheef L) geven de volgende histogrammen aanleiding? MAANDELIJKS KLEDINGBUDGET VAN 2 000 PERSONEN 40,00 %
36,50 %
30,00 %
S
25,00 % 19,00 %
20,00 % 15,00 %
13,00 %
10,00 %
9,50 %
7,50 %
7,00 %
4,00 %
5,00 % 0,00 % [0, 100[
r
IN
relatief aantal personen
35,00 %
2,00 %
1,00 %
R
r
L
r
S
r
R
r
L
r
S
r
R
r
L
r
0,50 %
[100, 200[ [200, 300[ [300, 400[ [400, 500[ [500, 600[ [600, 700[ [700, 800[ [800, 900[ [900, 1 000[
budget in euro
DIAMETER VAN 160 KOGELLAGERS
N
25,00 %
16,25 %
15,00 %
15,63 %
10,63 %
10,00 %
10,00 %
8,13 %
VA
relatief aantal kogellagers
21,25 %
20,00 %
5,00 %
0,00 %
7,50 % 5,63 %
5,00 %
[20,0; 20,1[ [20,1; 20,2[ [20,2; 20,3[ [20,3; 20,4[ [20,4; 20,5[ [20,5; 20,6[ [20,6; 20,7[ [20,7; 20,8[ [20,8; 20,9[
diameter in mm
DUUR VAN DE ZWANGERSCHAP BIJ 10 000 VROUWEN
40,00 %
37,66 %
30,00 %
©
relatief aantal vrouwen
35,00 %
25,00 % 20,00 %
9,83 %
10,00 %
0,00 %
2
16,01 %
15,00 %
5,00 %
1
18,58 %
3,90 % < 37
8,87 %
5,15 %
[37, 38[
[38, 39[
[39, 40[
aantal weken
3 4
5 6
152
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
[40, 41[
[41, 42[
> 42
REEKS B Bij een onderzoek naar de levensduur van ledverlichting, werd bij 80 ledlampen nagegaan hoelang (in h) ze ononderbroken kunnen blijven branden. Het resultaat van het onderzoek zie je in de frequentietabel. Ga grafisch na of een normale verdeling geldig is. De gemiddelde levensduur is 41 450 h en de standaardafwijking is 9 665,56 h.
levensduur (h)
ni
[20 000, 24 000[
5
[24 000, 28 000[
7
[28 000, 32 000[
9
[32 000, 36 000[
12
[36 000, 40 000[
16
[40 000, 44 000[
11
[44 000, 48 000[
12
[48 000, 52 000[
8
[52 000, 56 000[
6
IN
15
N
ICT
©
VA
80
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
153
ICT
16
Van 150 kippeneieren wordt de massa (in g) bepaald. Het gemiddelde is 60,0 g en de standaardafwijking 6,50 g. a) Toon grafisch aan dat de gegevens normaal verdeeld zijn. massa (g)
ni
[42, 46[
2
[46, 50[
7
[50, 54[
17
[54, 58[
30
[58, 62[
37
[62, 66[
31
[66, 70[
16
[70, 74[
8
[74, 78[
2
IN
150
VA
N
©
b) Een ei dat minstens 73 g weegt, krijgt het label XL (extra large). Bepaal zonder ICT hoeveel procent van de eieren daaraan voldoen.
1
c) Eieren tussen 53 g en 63 g krijgen het label M (medium). Hoeveel procent van de eieren krijgt dat label?
2 3
4
d) Hoeveel weegt de 10 % zwaarste eieren? Rond af op 0,1 g.
5
6
154
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
REEKS C 17
De tabel bevat de jaartotalen (in %) voor het vak wiskunde, van de 118 leerlingen die vorig jaar in het zesde jaar van onze school zaten. Ga na of een normale verdeling geldig is. 63
56
82
92
62
65
70
76
52
91
61
67
86
71
66
63
80
56
64
57
71
56
81
47
75
66
64
75
53
72
82
73
63
54
67
61
62
71
70
53
65
46
67
72
75
61
66
62
61
83
61
54
66
73
75
66
75
71
66
65
70
66
68
44
66
65
62
63
52
61
71
82
60
71
65
66
71
67
66
65
66
67
75
71
70
72
71
56
73
70
65
64
63
60
80
66
57
61
65
66
70
72
81
45
70
73
61
62
66
61
65
62
63
69
57
51
87
41
IN
ICT
VA
N
©
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
155
18
Op de etiketten van de flesjes water die door een machine automatisch worden gevuld staat een netto-inhoud van 50 cl. Een bedrijf doet een aselecte steekproef en controleert de inhoud (in ml) van 80 van de band genomen flesjes. Ga na of een normale verdeling geldig is.
508
496
501
499
496
499
502
501
496
504
494
506
499
497
503
501
498
496
500
492
504
500
498
503
497
503
492
502
499
500
497
507
499
490
500
507
499
505
497
501
502
495
507
503
501
497
500
496
509
494
499
504
496
504
494
493
503
501
505
500
505
493
504
498
501
498
502
496
491
499
499
501
494
503
500
495
499
497
503
498
IN
ICT
N
VA
©
1
2 3 4
Carl Friedrich Gauss is geboren in 1777 en groeide uit tot één van de grootste wis- en natuurkundigen aller tijden. Als 3-jarige verbeterde hij al rekenfouten van zijn vader en op 7-jarige leeftijd ontdekte hij een methode om de natuurlijke getallen van 1 tot en met 100 op te tellen. Gauss heeft zo goed als in alle takken van de wiskunde een bepalende rol gespeeld en kreeg dan ook niet voor niets de bijnaam ‘prins van de wiskunde’. Zijn meest tot de verbeelding sprekende wiskundige prestaties waren het ontdekken van een methode om de baan van hemellichamen te beschrijven, de normale verdeling van meetfouten en de ontwikkeling van niet-Euclidische meetkunde (de meetkunde van gekromde oppervlakken).
5 6
156
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
STUDIEWIJZER De normale verdeling voor de leerling
5.1 Kansdichtheidsfunctie KENNEN
voor de leerkracht
– + – +
De frequentiedichtheid van een klasse is het quotiënt van de relatieve frequentie en de klassenbreedte.
5.2 De normale kansdichtheidsfunctie KENNEN
– + – +
IN
De grafiek van de normale kansdichtheidsfunctie is klokvormig en symmetrisch ten opzichte van de rechte met vergelijking x = m. De functie bezit een maximum als x = m. De grafiek bezit twee buigpunten, namelijk als x = m – s en als x = m + s. De x-as is een horizontale asymptoot voor de grafiek.
m is het populatiegemiddelde en s is de populatiestandaardafwijking.
5.3 Berekeningen met de normale verdeling
KUNNEN
– + – +
N
ICT gebruiken om vraagstukken op te lossen met behulp van de normale kansdichtheidsfunctie.
5.4 De standaardnormale kansdichtheidsfunctie
VA
KENNEN
– + – +
De standaardscore of z-score van de waarde x van een toevalsveranderlijke X is gelijk aan x–m z = _.
s
Er geldt: m Z = 0 en s Z = 1.
68 % van de waarden ligt in [m – s, m + s].
95 % van de waarden ligt in [m – 2 s, m + 2 s]
KUNNEN
– + – +
©
De standaardnormale verdeling gebruiken in vraagstukken waarbij de onafhankelijkheid van de meeteenheden noodzakelijk is.
5.5 Niet alle gegevens zijn normaal verdeeld KUNNEN
– + – +
Nagaan of een rij gegevens benaderd kan worden met behulp van een normale kansdichtheidsfunctie.
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
157
Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?
❑ filter
❑ schets
❑ patroon
❑ schema/tabel
❑ kennis
❑ vereenvoudig
❑ logisch nadenken
❑ gok verstandig
❑ ...
IN
❑ concreet materiaal
N
1. Jan liegt altijd op maandag, dinsdag en woensdag, en niet op de andere dagen. Piet liegt altijd op donderdag, vrijdag en zaterdag, en niet op de andere dagen. Op een dag zegt Jan tegen Piet: “Morgen zal ik liegen.” Piet reageert: “Morgen zal ik ook liegen.” Op welke dag vond dat gesprek plaats?
VA
2. Het grootste vierkant van de figuur heeft een zijde 4. Bereken de oppervlakte van het rode driehoekje.
©
3. Een dief steelt een kwart van het fortuin van een kok en geeft daarvan de helft aan zijn vrouw. Die schenkt op haar beurt een derde van wat ze net kreeg aan haar minnaar, die bevriend is met de kok en hem daarvan de helft geeft. De kok is 11 000 florijnen armer geworden. Hoe groot was het fortuin van de kok oorspronkelijk?
1
A) 36 000 florijnen
B) 45 000 florijnen
2
D) 52 000 florijnen
E) 60 000 florijnen
3
JWO, editie 2021, eerste ronde
4
5 6
158
STATISTIEK I HOOFDSTUK 5 I DE NORMALE VERDELING
C) 48 000 florijnen
HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
6.1
Spreidingsdiagrammen en trendlijnen
163
IN
6.2 Correlatie
160 165
Studiewijzer
173
Pienter problemen oplossen
174
©
VA
N
6.3 Correlatie en causaliteit
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
159
6.1
Spreidingsdiagrammen en trendlijnen
6.1.1 Inleiding minder hitte die naar de ruimte ontsnapt 30 biljoen ton CO2 per jaar minder zuurstof in de lucht meer fossiele brandstoffen in de lucht meer hitte die terug naar de aarde gaat
Af en toe online gamen verbetert de schoolresultaten van 15-jarigen. Maar activiteiten op sociale media hebben een averechts effect.
IN
nachten warmen sneller op dan dagen
Regelmatige lichaamsbeweging bevordert het geheugen.
De toename van de gemiddelde temperatuur kan alleen verklaard worden door de menselijke invloed in rekening te brengen.
Tot nu toe heb je in dit leerwerkboek enkel met één statistische veranderlijke gewerkt. In dat geval spreek je van eendimensionale of univariate statistiek.
N
In de tweedimensionale of bivariate statistiek behandel je de mogelijke samenhang tussen twee veranderlijken. De ene veranderlijke kan de andere beïnvloeden en omgekeerd. Ook de sterkte van het verband is belangrijk.
VA
Om een benaderende formule te vinden voor het verband tussen de twee gemeten veranderlijken, gebruik je regressie. Je maakte er al eerder kennis mee. Voorbeeld
Femke is vertegenwoordiger. Ze krijgt een vast maandloon en daarbovenop een percentage op de maandelijkse omzet. In de tabel zie je het maandloon y (in euro) in functie van de omzet x (in euro). Gebruik lineaire regressie om het verband tussen y en x te bepalen. 1 000
5 000
10 000
20 000
30 000
y (euro)
1 740
1 900
2 100
2 500
2 900
©
x (euro)
Met ICT – Excel:
1
2 3 4
Je selecteert de gegevensrijen en voegt een spreidingsdiagram in. Klik met de rechtermuisknop op één van de punten. Kies eerst 'trendlijn toevoegen' en vervolgens 'lineair'. Vink ‘Vergelijking in grafiek weergeven’ aan.
Het maandloon y kun je berekenen met de formule
5
GeoGebra
6
160
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
.
B+S
6.1.2 De best passende trendlijn bepalen Voorbeeld 1 Aan 17 vrouwen werd de lengte en de schoenmaat gevraagd. Gebruik lineaire regressie om het verband te bepalen tussen de schoenmaat y en de lengte x (in cm). x (cm) 176 155 163 153 169 173 152 161 165 163 42
y
36
38
36
40
41
35
38
37
37
171
158 168 167 160 165
171
39
37
40
38
39
36
38
VERBAND TUSSEN LICHAAMSLENGTE EN SCHOENMAAT BIJ 17 VROUWEN 44
IN
In tegenstelling tot het voorbeeld van § 6.1.1 is het niet mogelijk om een rechte te tekenen die perfect bij alle punten past. De regressierechte is de ‘best passende trendlijn’.
42
schoenmaat
40
• De vergelijking van de trendlijn is
38
36
.
• Schat de schoenmaat van een vrouw van 175 cm.
N
34
32 150 152 154 156 158 160 162 164 166 168 170 172 174 176 178
lengte (cm)
VA
Voorbeeld 2
Het risico op een verkeersongeval is, volgens een studie van het Instituut voor Mobiliteit van de universiteit Hasselt, even groot voor mannen als voor vrouwen. De kans op een ongeval met doden of gekwetsten is wel afhankelijk van het geslacht. De tabel toont de kans op een ziekenhuisopname bij een ongeval bij mannen. Bepaal, via machtsregressie, het omgekeerd evenredig verband tussen het risico en de leeftijd. KANS OP EEN ZIEKENHUISOPNAME BIJ EEN VERKEERSONGEVAL BIJ MANNEN
mi
kans in %
2
[15, 25[
20
1,9
1,6
[25, 35[
30
1,1
[35, 45[
40
0,82
[45, 55[
50
0,68
[55, 65[
60
0,52
[65, 75[
70
0,51
1,8
kans in procent
©
leeftijd
1,4 1,2 1 0,8 0,6 0,4 0,2 0
0
10
20
30 40 50 leeftijd in jaren
60
70
80
Als x de leeftijd (in jaren) is en y de kans (in procent) op een ziekenhuisopname bij een ongeval, dan geldt: y ≈ . GeoGebra
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
161
6.1.3 Lineaire regressie In § 6.1.1 lagen alle punten perfect op de regressierechte. Bij een statistische dataset is dat echter niet altijd zo. In dat geval bepaal je de trendlijn die zo goed mogelijk bij de data past.
Covariantie
IN
Een puntenwolk is een grafische voorstelling van puntenkoppels (x, y). Daarbij is x de onafhankelijke veranderlijke en y de afhankelijke veranderlijke.
Als bij een toenemende waarde van x over het algemeen een afnemende waarde van y hoort, dan spreek je van een negatieve covariantie.
N
Als bij een toenemende waarde van x over het algemeen een toenemende waarde van y hoort, dan spreek je van een positieve covariantie.
Lineaire regressie
VA
Bij lineaire regressie zoek je een rechte als trendlijn bij een puntenwolk. Die rechte past zo goed mogelijk bij de puntenkoppels.
sterk verband
©
Het verband tussen y en x noem je sterk als de punten, over het algemeen, vrij dicht bij de regressierechte liggen. Als de punten vrij ver van de regressierechte verwijderd liggen, spreek je van een zwak verband.
GeoGebra
1
2 3 4 5
6
162
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
zwak verband
6.2
Correlatie
6.2.1 De correlatiecoëfficiënt bij lineaire regressie Het woord ‘covariantie’ betekent letterlijk ‘het samen variëren’. Met andere woorden: als de ene veranderlijke verandert, verandert de andere veranderlijke mee. VIDEO
Als je in het woordenboek de betekenis van het woord ‘correlatie’ opzoekt, dan vind je als uitleg: ‘de manier waarop iets samenhangt met iets anders’ (encyclo.nl).
IN
In de statistiek gebruikt men de correlatiecoëfficiënt om de sterkte van die samenhang te bepalen. Er zijn meerdere definities van dit begrip, maar de meest gebruikte is de correlatiecoëfficiënt van Pearson, een Engelse statisticus die leefde van 1857 tot 1936. De formule is nogal complex. Daarom zul je de correlatiecoëfficiënt berekenen met ICT. Berekening van de correlatiecoëfficiënt met Excel
Aan 17 vrouwen werd de lengte x (in cm) en de schoenmaat y gevraagd.
y
176 155 163 153 169 173 152 161 165 163
171
158 168 167 160 165
171
42
39
37
40
36
38
36
40
41
35
38
37
37
N
x (cm)
38
39
36
38
Open het bestand ‘lengte en schoenmaat.xlsx’.
VA
Om de correlatiecoëfficiënt te berekenen gebruik je de functie CORRELATIE(matrix1;matrix2).
Rond de correlatiecoëfficiënt af op 0,01: r =
©
GeoGebra
Betekenis van de waarde van de correlatiecoëfficiënt r<0 r>0 r=0
| r | = 1
0 < |r | < 1
negatieve correlatie: een stijging van de onafhankelijke veranderlijke heeft over het algemeen een daling van de afhankelijke veranderlijke tot gevolg positieve correlatie: een stijging van de onafhankelijke veranderlijke heeft over het algemeen een stijging van de afhankelijke veranderlijke tot gevolg geen correlatie perfecte correlatie hoe dichter |r |bij 1 ligt, hoe sterker de samenhang hoe dichter |r |bij 0 ligt, hoe zwakker de samenhang STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
163
B+S
6.2.2 Betekenis van de correlatiecoëfficiënt |r | = 0
0,7 ⩽ |r | < 0,85
r=0
r = 0,80
sterk verband
IN
geen enkel verband
0 < |r | < 0,3
0,85 ⩽ |r | < 0,95
r = 0,2
N
r = –0,90
zeer sterk verband
0,3 ⩽ |r | < 0,5
0,95 ⩽ |r | < 1
VA
zeer zwak verband
©
r = –0,4
r = 0,98
zwak verband
uitzonderlijk sterk verband
0,5 ⩽ |r | < 0,7
| r | = 1
r = 0,55
r = –1
1
2 3
matig verband
4 5
6
164
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
perfecte correlatie
6.3
Correlatie en causaliteit
6.3.1 Voorbeeld 1 In een landelijke gemeente is er één kledingzaak en één basisschool. De tabel toont het wekelijkse aantal verkochte paren handschoenen x van de winkel en het aantal afwezige leerlingen y in de school in dezelfde week. Je ziet ook het spreidingsdiagram en de bijhorende regressierechte.
3
5
0
3
1
0
y
10
13
4
9
3
3
3
2
2
8
10
13
9
7
5
6
4
8
6
5
17
14
19
21
12
10
11
7
IN
x
Bereken de correlatiecoëfficiënt.
22
y = 1, 3553x + 3,66
20 18 16
Je kunt hier dus spreken van een zeer sterk positief verband. Toch is het duidelijk dat een toename van het aantal verkochte paren handschoenen niet de oorzaak is van een toename van het aantal afwezige leerlingen (of omgekeerd). Je zegt dat er geen oorzakelijk of causaal verband is tussen y en x.
14 12 10 8 6 4 2 0
0
1
2
N
aantal afwezige leerlingen in dezelfde week
VERBAND TUSSEN AANTAL PAREN HANDSCHOENEN EN AFWEZIGE LEERLINGEN 24
3 5 6 8 9 10 11 12 4 7 aantal paren verkochte handschoenen in één week
13
14
VA
Het is duidelijk dat de (koude) temperatuur de toename van beide veranderlijken x en y veroorzaakt. De temperatuur noem je de verborgen (of confounding) veranderlijke z. x
y
©
z
Besluit
Correlatie betekent dat twee veranderlijken een bepaalde samenhang hebben. Causaliteit betekent dat er een oorzaak-gevolgrelatie is. Correlatie betekent niet noodzakelijk dat er een causaal verband is. Er kan een derde (verborgen) veranderlijke een rol spelen.
GeoGebra
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
165
6.3.2 Voorbeeld 2 Een psycholoog beweert een test ontworpen te hebben die de ‘aanleg tot statistiek’ van studenten kan voorspellen. Om de waarde van de test te controleren neemt hij bij 15 studenten, zonder voorkennis statistiek, de psychologische test af. Vervolgens laat hij hen gedurende 5 uur een stukje van de cursus statistiek instuderen, waarna een test volgt. De punten behaald op de psychologische test zijn de punten T1 en de punten van de statistiektest zijn de punten T2.
A
B
C
D
E
T1 (%)
65
90
75
40
85
T2 (%)
70
75
65
50
85
y = 0, 586 6x + 28, 357
80
H
I
J
K
N
O
55
60
50
45
80
55
35
50
65
75
65
75
55
45
75
65
55
50
60
90
punten T1
60
y = 1, 169x − 13, 873
70 60
N
50
40
40
30
40
50
60 70 punten T1
80
90
100
VA
Bereken de correlatiecoëfficiënt waarbij T1 de onafhankelijke veranderlijke is en T2 de afhankelijke veranderlijke.
30 30
40
50
©
Bij het berekenen van de correlatie tussen twee veranderlijken x en y, stel je alleen vast of er een verband is tussen x en y of tussen y en x. Je krijgt geen antwoord op de vraag of er een causaal verband is en zo ja, welke veranderlijke de oorzaak is en welke veranderlijke het gevolg is.
GeoGebra
1
2 3 4 5
6
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
60 punten T2
70
80
90
Bereken de correlatiecoëfficiënt waarbij T2 de onafhankelijke veranderlijke is en T1 de afhankelijke veranderlijke.
De correlatiecoëfficiënt is in beide gevallen dezelfde. De invloed van T1 op T2 is dus even groot als de invloed van T2 op T1.
166
M
70
50
Besluit
L
80
70
30
G
100
90
punten T2
F
IN
student
6.3.3 Observationeel en experimenteel onderzoek Mensen die roken hebben een grotere kans op longziektes. Er is een sterke positieve correlatie tussen roken en longziektes en het is duidelijk dat een toename van de veranderlijke ‘roken’ een toename van de veranderlijke ‘kans op longziektes’ veroorzaakt en niet omgekeerd. Het causaal verband tussen roken en de kans op longziektes is men niet te weten gekomen door experimenten uit te voeren, maar door jarenlang observaties uit te voeren.
observationeel onderzoek
IN
Geef twee redenen waarom het onmogelijk is om hier experimenten over op te zetten.
Voorbeelden
Het verband tussen twee veranderlijken wordt onderzocht door vooraf opgestelde experimenten. Daarbij wordt meestal met een testgroep en een controlegroep gewerkt. De testgroep ondergaat een bepaald experiment, de controlegroep niet.
N
Er wordt onderzoek gedaan naar het verband tussen twee veranderlijken, zonder tussenkomst van de onderzoekers. Er worden geen experimenten, zoals in de betekenis van de kansrekening, uitgevoerd.
experimenteel onderzoek
Voorbeelden
• de invloed van de hoeveelheid medicatie op de kans op nevenwerkingen; • het verband tussen het dagelijks aantal uren schermtijd en de schoolprestaties.
Het voorkomen van een verborgen veranderlijke kan niet worden uitgesloten.
Het experiment kan zo worden opgezet dat verborgen veranderlijken uitgesloten zijn.
VA
• de invloed van het drinken van alcohol op de kans op een ongeval; • het verband tussen de lichaamslengte en de schoenmaat.
©
Complottheorieën willen mensen dingen doen geloven die op onwaarheden zijn gebaseerd. De sociale media staan er bol van. Dergelijke theorieën rekenen op de goedgelovigheid van mensen en zijn meestal niet door wetenschappelijke experimenten ondersteund. Enkele voorbeelden: • Men is nooit echt op de maan geweest; alles in Hollywood is in scène gezet en gefilmd. • Coronavaccins kunnen blindheid veroorzaken. • De wereldwijde opwarming bestaat niet en is verzonnen door de Chinese overheid. • De piramides in Egypte zijn gebouwd door buitenaardse wezens.
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
167
Oefeningen REEKS A 1
Welke veranderlijke heeft het sterkste verband met x? x
10
15
20
25
30
35
40
y
13
78
61
103
157
122
196
z
360
341
193
209
93
99
34
u
89
55
78
47
82
28
22
v
96
123
105
138
205
284
243
w
2
19
28
23
30
26
33
IN
ICT
Je ziet telkens twee veranderlijken x en y waartussen een correlatie bestaat. Geef telkens aan of x een oorzaak kan zijn van y (optie 1), y een oorzaak kan zijn van x (optie 2) of als beide opties mogelijk zijn. x: a) y:
‘de mate van ongezond leven’ ‘de kans op een hartaanval’
b) x : y:
‘de punten voor een toets wiskunde’ ‘het aantal uren studeren’
c) x:
‘de verkeersdrukte op de autosnelweg (het aantal auto’s dat per minuut een bepaald punt passeert)’ ‘de gemiddelde snelheid van de auto’s op de autosnelweg’
d) x : y:
‘de temperatuur van het zeewater’ ‘de temperatuur aan het strand’
e) x: y:
‘het aantal klachten over geluidshinder’ ‘de afstand tot de festivalweide’
f) x: y:
‘het aantal toeschouwers voor een filmvoorstelling’ ‘de opbrengst van de toegangstickets’
VA
2
N
©
y:
1
2 3 4 5
6
168
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
REEKS B 3
Bij de onderstaande beweringen is er telkens een sterke correlatie, maar geen causaal verband. Bepaal telkens een mogelijke verborgen veranderlijke z. a) Als de verkoop van ijsjes stijgt, stijgt ook het aantal mensen met een zonnesteek. b) Het aantal brandweermannen die aanwezig zijn om een brand te blussen, zorgt ervoor dat de schade groter is.
IN
c) Hoe meer pianolessen iemand volgt, hoe slimmer die persoon wordt.
d) Hoe groter de schoenmaat van een kind van de lagere school, hoe beter de leesvaardigheid.
e) Hoe meer gras er wordt gezaaid, hoe minder zwembroeken er worden verkocht.
N
f) Als het aantal dvd-recorders in een huisgezin daalt, stijgt het aantal computers.
Welke soort onderzoek (observationeel of experimenteel) is aangewezen? Leg telkens uit waarom.
VA
4
a) De invloed van de leeftijd op de reactiesnelheid.
b) De invloed van het roken van joints op intellectuele prestaties.
©
c) Het verband tussen goede cijfers op school en het zelfvertrouwen.
d) Het verband tussen de kostprijs van een auto en het aantal verkeersboetes. e) Het verband tussen het eten van chocolade en het krijgen van een migraineaanval. STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
169
B+S
ICT
5
Een kleine steekproef die zocht naar het verband tussen de lichaamslengte y (in cm) van een volwassen zoon en de lichaamslengte x (in cm) van zijn vader, leverde de volgende data op. x (cm)
176
170
167
186
178
175
183
169
172
175
188
175
180
y (cm)
182
177
173
184
178
179
181
176
175
180
186
174
183
a) Bepaal via lineaire regressie het verband tussen y en x. b) Bereken de correlatiecoëfficiënt en geef de betekenis.
IN
c) Schat de lengte van een zoon waarvan de vader 175 cm is. Rond af op 1 cm.
d) Vergelijk die geschatte waarde met de gemeten waarde(n).
N
VA
e) Schat de lengte van een vader waarvan de zoon 190 cm groot is. Rond af op 1 cm.
f) Waarom is dat resultaat verrassend?
©
g) De vader van Ilan is 5 cm groter dan de vader van Millau. Schat hoeveel groter Ilan zal worden dan Millau. Rond af op 0,1 cm.
1
2
3 4 5
6
170
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
6
Hoe hoger de temperatuur, hoe meer dorst je hebt. In de tabel zie je de gemiddelde dagtemperatuur x (in ºC) en het aantal liter water y dat in een warenhuis op die dag werd verkocht.
B+S
ICT
x (ºC)
12
14
15
17
18
20
21
23
25
27
28
30
31
y (l)
651
713
747
805
829
891
924
980
1 036 1 102
1 136
1 198 1 233
a) Bepaal via lineaire regressie het verband tussen y en x.
IN
b) Schat de verkochte hoeveelheid water als het 32 ºC is. Rond af op 1 l.
c) Geef de betekenis van de richtingscoëfficiënt van het lineaire verband.
N
d) Op een kille dag heeft het warenhuis maar 500 l water verkocht. Hoeveel graden was het die dag? Rond af op 0,1 ºC.
VA
e) Bereken de correlatiecoëfficiënt en geef de betekenis.
In Metro kon je lezen dat er een verband is tussen het aantal Nobelprijswinnaars T h e n e w e ng l a n d j o u r na l o f m e dic i n e in een land en de chocoladeconsumptie. 35
Sweden
Switzerland
30
Nobel Laureates per 10 Million Population
r=0.791 P<0.0001
Denmark
25
Austria
20
a) Geef de sterkte van het verband.
Norway
United Kingdom
©
7
b) Het is duidelijk dat het verband niet causaal is. Geef een mogelijke verwarrende veranderlijke.
15
United States
The Netherlands Belgium Canada
Poland Portugal Greece
Germany
France
10
5
Ireland
Finland Australia
Italy Spain
Japan
0
China
Brazil
0
5
10
15
Chocolate Consumption (kg/yr/capita) Figure 1. Correlation between Countries’ Annual Per Capita Chocolate Consumption and the Number of Nobel Laureates per 10 Million Population.
Bron: nl.metrotime.be Discussion
The principal finding of this study is a surprisingly powerful correlation between chocolate intake per capita and the number of Nobel laureates in various countries. Of course, a correlation between X and Y does not prove causation but indicates that either X influences Y, Y influ-
about 14 Nobel laureates, yet we observe 32. Considering that in this instance the observed number exceeds the expected number by a factor of more than 2, one cannot quite escape the notion that either the Nobel Committee in Stockholm has some inherent patriotic bias I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT when assessing the candidatesSTATISTIEK for these awards or, perhaps, that the Swedes are particularly
171
ICT
8
Op een toets moesten de leerlingen invullen hoeveel minuten ze hadden gestudeerd voor de toets. Ze moesten ook een score van 1 (heel eenvoudig) tot 5 (heel moeilijk) geven over de moeilijkheidsgraad van de toets. In de tabel is x het aantal minuten studie, y de moeilijkheidsgraad en z de punten op 20 voor de toets. x (min)
30
90
20
110
40
70
50
60
50
80 100 60
60
70
50
30
90
y (op 5)
5
1
5
1
5
3
3
4
4
2
1
3
3
2
4
4
2
z (op 20)
8
17
6
18
9
15
14
9
12
16
19
12
13
15
11
10
16
IN
B+S
REEKS C
a) Bepaal via lineaire regressie het verband tussen • z en x: • y en x: • z en y:
N
b) Noa heeft drie kwartier gestudeerd voor de toets. Schat hoeveel punten ze zal behalen.
VA
c) Lars gaf een score 2 voor de moeilijkheidsgraad van de toets. Schat hoeveel minuten hij heeft gestudeerd. Rond af op 1 min.
e) Geef de betekenis van de richtingscoëfficiënt van het lineaire verband tussen z en y.
©
f) Tussen welke veranderlijken is het verband het sterkst?
1
2 3
g) Kun je spreken van een zuiver causaal verband tussen de veranderlijken of kan er ook een verwarrende variabele meespelen?
4 5
6
172
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
STUDIEWIJZER Correlatie en causaliteit voor de leerling
6.1 Spreidingsdiagrammen en trendlijnen KENNEN
voor de leerkracht
– + – +
Een puntenwolk is een grafische voorstelling van puntenkoppels (x, y). Daarbij is x de onafhankelijke veranderlijke en y de afhankelijke veranderlijke. Bij lineaire regressie zoek je een rechte als trendlijn bij een puntenwolk. Die rechte past zo goed mogelijk bij de puntenkoppels.
De best passende trendlijn bepalen met ICT.
6.2 Correlatie
– + – +
IN
KUNNEN
KENNEN
– + – +
De correlatiecoëfficiënt geeft de sterkte weer van het verband dat bij een lineaire regressie hoort.
KUNNEN
– + – +
N
De correlatiecoëfficiënt berekenen met ICT en daarmee de sterkte van een lineair verband weergeven.
6.3 Correlatie en causaliteit
KENNEN
– + – +
VA
Correlatie betekent dat twee veranderlijken op een ordelijke manier een bepaalde samenhang hebben. Causaliteit betekent dat er een oorzaak-gevolgrelatie is. Correlatie betekent niet noodzakelijk dat er een causaal verband is. Er kan een derde (verborgen) veranderlijke een rol spelen.
Bij het berekenen van de correlatie tussen twee veranderlijken x en y, stel je alleen vast of er een verband is tussen x en y of tussen y en x. Je krijgt geen antwoord op de vraag welke veranderlijke oorzaak is en welke veranderlijke gevolg is.
KUNNEN
– + – +
©
Bepalen of er, naast een correlatie, ook een causaal verband bestaat en de eventuele verborgen veranderlijke benoemen. In eenvoudige gevallen bepalen wat de onafhankelijke veranderlijke is en wat de afhankelijke veranderlijke is. Het verschil inzien tussen observationeel onderzoek en experimenteel onderzoek.
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
173
Pienter problemen oplossen Welke heuristiek(en) gebruik je om de onderstaande problemen op te lossen?
❑ filter
❑ schets
❑ patroon
❑ schema/tabel
❑ kennis
❑ vereenvoudig
❑ logisch nadenken
❑ gok verstandig
❑ ...
IN
❑ concreet materiaal
1. Van welk natuurlijk getal n is het kwadraat gelijk aan 997 ? 998 ? 999 ? 1 001 ? 1 002 ? 1 003 + 36? (Je mag geen rekenmachine gebruiken.)
N
JWO, editie 2022-2023, finale
VA
2. Een muis legt nevenstaande weg af over een vloer met vierkante tegels van 10 cm bij 10 cm om bij een blokje kaas te komen. Daarna keert ze langs dezelfde weg terug. De gebogen stukken van de weg zijn opgebouwd uit kwartcirkels. Hoeveel centimeter heeft de muis gelopen? A) 40p + 80
B) 50p + 80
D) 40p + 160
E) 50p + 160
C) 25p + 160
©
VWO, editie 2021-2022, eerste ronde
3. Moederdag valt elk jaar op de tweede zondag van mei. Wat is de laatste dag in mei waarop Moederdag kan vallen? A) 7 mei
1
B) 10 mei
JWO, editie 2021-2022, eerste ronde
2 3 4 5
6
174
STATISTIEK I HOOFDSTUK 6 I CORRELATIE EN CAUSALITEIT
C) 13 mei
D) 14 mei
E) 17 mei
VA
© N IN
VA
© N IN