Willem Scholtz
c Kopiereg 2017 Onder redaksie van: Paul JN Steyn, BA (PU vir CHO), THOC (POK), DEd (Unisa) Skrywer: Willem Scholtz Onderwysontwerp, bladuitleg en taalversorging: Dr. Daleen van Niekerk ’n Publikasie van Akademia. Alle regte voorbehou. Adres: Von Willichlaan 284, Die Hoewes, Centurion Posadres: Posbus 11760, Centurion, 0046 Tel: 0861 222 888 E-pos: diens@akademia.ac.za Webtuiste: www.akademia.ac.za
Geen gedeelte van hierdie boek mag sonder die skriftelike toestemming van die uitgewers gereproduseer of in enige vorm of deur enige middel weergegee word nie, hetsy elektronies of deur fotokopiëring, plaat- of bandopnames, vermikrofilming of enige ander stelsel van inligtingsbewaring nie. Enige ongemagtigde weergawe van hierdie werk sal as ’n skending van kopiereg beskou word en die dader sal aanspreeklik gehou word onder siviele asook strafreg.
www.akademia.ac.za
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
INHOUDSOPGAWE
Inleiding .................................................................................................................................. 5 Vakleeruitkomste ................................................................................................................... 8 Woordomskrywing vir evaluering ........................................................................................ 9
Studie-eenheid 1: Basiese beginsels en beskrywende stratitiek ................................... 11 1.1
Studie-eenheid leeruitkomste ................................................................................. 11
1.2
Voorgeskrewe handboek ........................................................................................ 11
1.3
Hoe kan jy jou begrip verbeter? .............................................................................. 12
1.4
Inleiding ................................................................................................................... 16
1.5
Basiese begrippe en beginsels van statistiek ......................................................... 17
1.5.1
Wat is statistiek? .............................................................................................. 17
1.5.2
Statistiese begrippe en notasie ........................................................................ 19
1.5.3
Statistiek en rekenaars .................................................................................... 21
1.5.4
Data ................................................................................................................. 21
1.5.5
Selfevalueringsvrae ......................................................................................... 25
1.6
Steekproefnemingsmetodes ................................................................................... 26
1.6.1
Niewaarskynlikheidsteekproefneming ............................................................. 26
1.6.2
Waarskynlikheidsteekproefneming .................................................................. 28
1.6.3
Onsydigheid ..................................................................................................... 30
1.6.4
Sentrale limietstelling (Central limit theorem) .................................................. 30
1.6.5
Selfevalueringsvrae ......................................................................................... 31
1.7
Beskrywende statistiek ........................................................................................... 31
1.7.1
Grafiese beskrywende statistiek vir kategoriese data ...................................... 31
1.7.2
Grafiese voorstelling van numeriese data: een veranderlike ........................... 35
1.7.3
Grafiese voorstelling van numeriese data: twee veranderlikes ....................... 38
1.7.4
Selfevalueringsvrae ......................................................................................... 41
1.8
Numeriese beskrywende statistiek ......................................................................... 41
Inhoudsopgawe
Bladsy 1
GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.8.1
Maatstawwe van lokaliteit ................................................................................ 41
1.8.2
Nie-sentrale maatstawwe van lokaliteit ............................................................ 51
1.8.3
Maatstawwe van spreiding .............................................................................. 55
1.8.4
Maatstawwe van skeefheid .............................................................................. 64
1.8.5
Keuse van statistiek ......................................................................................... 69
1.8.6
Beskrywende statistiek in MS Excel en die data-analise-invoegsel ................ 70
1.8.7
Selfevalueringsvrae ......................................................................................... 71
1.9
Samevatting ............................................................................................................ 72
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming .......... 73 2.1
Studie-eenheid leeruitkomste ................................................................................. 73
2.2
Voorgeskrewe handboek ........................................................................................ 74
2.3
Hoe kan jy jou begrip verbeter? .............................................................................. 74
2.4
Inleiding ................................................................................................................... 76
2.5
Waarskynlikhede ..................................................................................................... 76
2.5.1
Basiese waarskynlikhede ................................................................................ 76
2.5.2
Waarskynlikheidsreëls ..................................................................................... 78
2.5.3
Belangrike konsepte van waarskynlikhede ...................................................... 80
2.5.4
Berekening van waarskynlikhede .................................................................... 83
2.5.5
Waarskynlikheidsvertakkingdiagram ............................................................... 88
2.5.6
Telreëls ............................................................................................................ 89
2.5.7
Selfevalueringsvrae ......................................................................................... 93
2.6
Waarskynlikheidsverdelings .................................................................................... 93
2.6.1
Stogastiese veranderlikes ................................................................................ 94
2.6.2
Diskrete waarskynlikheidsverdelings ............................................................... 95
2.6.3
Kontinue waarskynlikheidsverdelings ............................................................ 102
2.6.4
Selfevalueringsvrae ....................................................................................... 116
2.7
Beraming ............................................................................................................... 116
2.7.1
Bladsy 2
Puntberamings ............................................................................................... 117
Inhoudsopgawe
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 2.7.2
Vertrouensintervalle ....................................................................................... 118
2.7.3
Selfevalueringsvrae ....................................................................................... 125
2.8
Samevatting .......................................................................................................... 125
Studie-eenheid 3: Hipotesetoetsing ................................................................................ 127 3.1
Studie-eenheid leeruitkomste ............................................................................... 127
3.2
Voorgeskrewe handboek ...................................................................................... 128
3.3
Hoe kan jy jou begrip verbeter? ............................................................................ 128
3.4
Inleiding ................................................................................................................. 129
3.5
Basiese begrippe van hipotesetoetsing ................................................................ 129
3.5.1
Die nul en alternatiewe hipotese .................................................................... 129
3.5.2
Peil van betekenis đ?œś ...................................................................................... 130
3.5.3
Tipe I- en II-foute ........................................................................................... 130
3.5.4
Toetsstatistiek ................................................................................................ 131
3.5.5
Kritieke waarde .............................................................................................. 131
3.5.6
đ?’‘-waarde ........................................................................................................ 131
3.6
Die proses van hipotesetoetsing ........................................................................... 131
3.6.1
Stap 1: Definieer die nulhipotese en die alternatiewe hipotese ..................... 131
3.6.2
Stap 2: Bepaal die aanvaardingsarea vir die nulhipotese .............................. 133
3.6.3
Stap 3: Bereken die toetsstatistiek ................................................................ 135
3.6.4
Stap 4: Vergelyk die steekproef se toetsstatistiek met die aanvaardingsarea vir
die nulhipotese ............................................................................................................. 136 3.6.5 3.7
Stap 5: Maak ʼn gevolgtrekking ...................................................................... 136
Praktiese voorbeelde van hipotesetoetse ............................................................. 136
3.7.1
Hipotesetoets vir ʼn populasiegemiddeld đ?? waar die populasie se
standaardafwyking đ??ˆ bekend is .................................................................................... 136 3.7.2
Hipotesetoets vir ʼn populasiegemiddeld đ?? waar die populasie se
standaardafwyking đ??ˆ onbekend is ................................................................................ 139 3.7.3 3.8
Hipotesetoetsing deur gebruik te maak van die đ?’‘-waarde ............................ 142
Selfevalueringsvrae .............................................................................................. 145
Inhoudsopgawe
Bladsy 3
GQM105 Inleiding tot elementêre kwantitatiewe metodes 3.9
Samevatting .......................................................................................................... 146
Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise ...................... 147 4.1
Studie-eenheid leeruitkomste ............................................................................... 147
4.2
Voorgeskrewe handboek ...................................................................................... 147
4.3
Hoe kan jy jou begrip verbeter? ............................................................................ 148
4.4
Inleiding ................................................................................................................. 150
4.5
Eenvoudige lineêre regressie-analise ................................................................... 150
4.5.1
Spreidingstipping ........................................................................................... 150
4.5.2
Lineêre regressiemodelle .............................................................................. 152
4.5.3
Pearson se korrelasiekoëffisiënt .................................................................... 157
4.5.4
Bepaaldheidskoëffisiënt ................................................................................. 160
4.5.5
Toets om die betekenisvolheid van die regressiemodel te bepaal ................ 161
4.5.6
Selfevalueringsvrae ....................................................................................... 164
4.6
Tydreeksanalise .................................................................................................... 164
4.6.1
Stipping van tydreekse .................................................................................. 165
4.6.2
Elemente van tydreeksanalise ....................................................................... 166
4.6.3
Tendensanalise ............................................................................................. 170
4.6.4
Seisoenale analise ......................................................................................... 181
4.6.5
Selfevalueringsvrae ....................................................................................... 189
4.7
Samevatting .......................................................................................................... 189
Afrikaans/Engelse terme .................................................................................................. 192
Bladsy 4
Inhoudsopgawe
GQM105 Inleiding tot elementêre kwantitatiewe metodes
INLEIDING Elementêre kwantitatiewe metodes behels ʼn aantal statistiese tegnieke wat die interpretasie van ʼn verskeidenheid data vergemaklik. Die tipes en volumes van data wat deur organisasies versamel word, maak dit soms moeilik of onmoontlik om hierdie data deur blote observasies te interpreteer. ʼn Verskeidenheid statistieke en statistiese berekeninge maak hierdie interpretasie moontlik en makliker. Daar is drie verskillende vlakke/komponente, soos aangedui in Figuur 1.1, waarop statistiek toegepas kan word: Die eerste is op die steekproefvlak, waar daar gefokus word op die versamelde data en om ʼn profiel te skep op grond daarvan (grafiese en numeriese beskrywende statistiek). Op die tweede vlak word hierdie beskrywende statistiek gebruik om afleidings te maak oor die groter populasie (afgeleide statistiek). Op die derde vlak word die beskrywende statistiek gebruik om statistiese modelle te ontwikkel wat van toepassing is op die populasie.
Figuur 1.1: Konseptuele oorsig van die statistiese komponente (Wegner, 2016: 7) Hierdie vak word hoofsaaklik in vier afdelings verdeel, naamlik: •
basiese beginsels en beskrywende statistiek (beskrywende statistiek);
Inleiding
Bladsy 5
GQM105 Inleiding tot elementêre kwantitatiewe metodes •
waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle (afgeleide statistiek);
•
hipotesetoetsing (afgeleide statistiek); en
•
eenvoudige lineêre regressie- en korrelasie-analise (statistiese modellering).
Soos wat ons oor en oor hoor en lees, is inligting data wat tot só ʼn mate verwerk is dat dit vir ons waarde het. Die doel van inleiding tot elementêre kwantitatiewe metodes is om jou bloot te stel aan die hulpmiddels en tegnieke om dit te kan doen. Soos hierbo gemeld, sal Studie-eenheid 1 op die basiese beginsels en beskrywende statistiek fokus. Hierdie afdeling behandel begrippe soos stogastiese veranderlikes, populasies, steekproewe, ensovoorts, en hoe hierdie statistieke gebruik kan word om ons te help om die data te verstaan, met ander woorde hoe om die waarde wat daarin opgesluit is te ontgin. Ons gaan dus kyk na die data wat versamel is deur middel van ʼn steekproef en die beskrywende statistiek wat ons meer gaan vertel van daardie groep (verwys na Figuur 1.1). Wanneer ons die basiese beginsels en beskrywende statistiek onder die knie het, sal ons kyk na waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle. Hierdie drie temas gebruik beskrywende statistiek om afleidings te maak van die groter populasie waarvan hulle deel is (verwys na Figuur 1.1). Omdat dit meestal nie moontlik is om data van die hele populasie te versamel nie, is statistieke soos die populasiegemiddeld en standaardafwyking nie bekend nie en moet ons dit kan beraam. Beraamde statistieke is op die einde van die dag ʼn geleerde raaiskoot en as ons dit wil gebruik, is dit belangrik dat ons darem ’n bietjie vertroue daarin moet hê; daarom doen ons hipotesetoetse in Studie-eenheid 3. ʼn Hipotesetoets is ʼn vyfstapproses waardeur ons die betekenisvolheid van ʼn statistiek toets. Die uitslag van so ʼn toets gaan ʼn navorser vertroue gee in ʼn statistiese resultaat of nie, en dit is uiters belangrik om die regte gevolgtrekking te maak op grond van die resultaat wat verkry is. Dit is baie keer noodsaaklik om sakebesluite te neem op grond van vooruitskattings van waardes wat tans onbekend is. Om hierdie tipe vooruitskattings te kan maak is dit belangrik om die data te verstaan en om die verhouding tussen stogastiese veranderlikes te begryp. Hierdie is die derde en laaste been van statistiek waarna gekyk word, naamlik statistiese modellering (verwys na Figuur 1.1). Om hierdie rede word daar in Studie-eenheid 4 gekyk na eenvoudige lineêre regressie, korrelasies en tydreekse. Regressie-analise kyk na ʼn veranderlike en die ander veranderlikes wat daarmee verband hou. Hierdie verhouding staan bekend as ʼn “statistiese model”. Korrelasies sal ook behandel word omdat dit ons help om die krag van ʼn verhouding te bepaal.
Bladsy 6
Inleiding
GQM105 Inleiding tot elementêre kwantitatiewe metodes Voorgeskrewe handboek Vir hierdie vak is die volgende handboek voorgeskryf: Wegner, T. 2016. Applied business statistics. 4de uitgawe. Claremont: Juta. Die gedeeltes wat betrekking het op die inhoud van die studie-eenhede sal telkens aangedui word. Die gids sal jou dan deur die handboek begelei en poog om moeilike gedeeltes toe te lig; om aan te vul waar nodig en om die belangrike gedeeltes uit te wys. Vir eksamendoeleindes moet jy dus die voorgeskrewe gedeeltes in die handboek, asook hierdie begeleidingsgids bestudeer. Aanbevole bronne •
Steyn, F., Smit, C. & Vorster, C., reds. English-Afrikaans Glossary Of Statistical Terms, 2009. Aanlyn beskikbaar by https://www.scribd.com/document/116733802/Eng-Afr-fin
•
http://www.sastat.org.za/sites/default/files/documents/files/Eng_Afr_fin.pdf
•
http://www.sastat.org.za/sites/default/files/documents/files/Afr_Eng_fin.pdf
(Hierdie bronne is aanlyn beskikbaar en verskaf Afrikaanse vertalings vir Engelse statistiese terme en selfs eenvoudige definisies. Dit is ʼn baie handige bron wanneer ʼn mens twyfel oor die korrekte vertaling, konteks en betekenis.)
Inleiding
Bladsy 7
GQM105 Inleiding tot elementêre kwantitatiewe metodes
VAKLEERUITKOMSTE Kennis en begrip Na voltooiing van die vak INLEIDING TOT ELEMENTÊRE KWANTITATIEWE METODES sal jy in staat wees om jou kennis en begrip te demonstreer van: •
Basiese beginsels en beskrywende statistiek
•
Waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle
•
Hipotesetoetsing
•
Eenvoudige lineêre regressie- en korrelasie-analise
Vaardighede Jy sal ook in staat wees om: •
data grafies voor te stel;
•
data deur middel van basiese numeriese beskrywende statistiek voor te stel;
•
basiese waarskynlikheidsberekeninge te doen;
•
vertrouensintervalle op te stel;
•
ʼn verskeidenheid tipes hipoteses te toets;
•
regressie-analise te verduidelik en ʼn eenvoudige lineêre regressiemodel op te stel; en
•
ʼn korrelasiekoëffisiënt te bereken, te interpreteer en ʼn te hipotesetoets kan doen om die betekenisvolheid van die regressiemodel te bepaal.
Bladsy 8
Vakleeruitkomste
GQM105 Inleiding tot elementêre kwantitatiewe metodes
WOORDOMSKRYWING VIR EVALUERING In die afdeling oor selfevaluering, asook in die werkopdragte sal daar van jou verwag word om sekere take te verrig. Dit is belangrik dat jy presies weet wat van jou verwag word. Die woordelys hieronder sal jou hiermee help. Werkwoord
Omskrywing
Lys
Lys die name/items wat bymekaar hoort
Identifiseer
Eien (ken uit) en selekteer die regte antwoorde
Verduidelik
Ondersoek die moontlikhede, oorweeg dit en skryf dan jou antwoord (verklaring/verduideliking) neer
Beskryf
Omskryf die konsep of woorde duidelik
Kategoriseer/klassifiseer
Bepaal tot watter klas, groep of afdeling bepaalde items/voorwerpe behoort
Analiseer
Om iets te ontleed
Evalueer
Bepaal die waarde van ʼn stelling/stelsel/beleid/ens.
Toepas
Pas die teoretiese beginsels toe in ʼn praktiese probleem
Hersien
Evalueer, verbeter en/of wysig ʼn beleid/dokument/stelsel/ens.
Woordomskrywing vir evaluering
Bladsy 9
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Notas
Bladsy 10
Woordomskrywing vir evaluering
GQM105 Inleiding tot elementêre kwantitatiewe metodes
STUDIE-EENHEID 1: BASIESE BEGINSELS EN BESKRYWENDE STRATITIEK 1.1
Studie-eenheid leeruitkomste
Kennis en begrip Na voltooiing van Studie-eenheid 1 sal jy in staat wees om jou kennis en begrip van die volgende te demonstreer: •
Basiese statistiese begrippe
•
Steekproefnemingsmetodes
•
Grafiese beskrywende statistiek
•
Numeriese beskrywende statistiek
Vaardighede Jy sal ook in staat wees om: •
basiese statistiese begrippe te omskryf;
•
ʼn keuse tussen die onderskeie ewekansige en nie-ewekansige steekproefnemingsmetodes te kan maak;
•
ʼn keuse tussen ʼn verskeidenheid grafieke en tabelle te maak om verskillende data grafies voor te stel;
•
om data te versamel en voor te berei vir statistiese verwerking;
•
verskillende numeriese beskrywende statistieke te bereken; en
•
ʼn keuse tussen ʼn verskeidenheid numeriese beskrywende statistieke te maak om data voor te stel.
1.2
Voorgeskrewe handboek
Wegner, T. 2016. Applied business statistics. 4de uitgawe. Claremont: Juta. Vir die doeleindes van hierdie studie-eenheid moet jy die volgende paragrawe bestudeer: Hoofstuk 1 paragrawe 1.1-1.11 Hoofstuk 2 paragrawe 2.1-2.6 Hoofstuk 3 paragrawe 3.1-3.10 Hoofstuk 6 paragrawe 6.1-6.2 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 11
GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.3
Hoe kan jy jou begrip verbeter?
Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord
Omskrywing
Afgeleide statistiek
Statistieke wat gebruik word om gevolgtrekkings ten opsigte van elemente in die populasie te maak.
Beskrywende statistiek
Statistieke wat bereken word met die steekproefdata, soos die gemiddeld, variansie, standaardafwyking ensovoorts.
Data
Die fisiese waardes (getalle) wat aan veranderlikes toegeken word.
Datapunt
Die verteenwoordiging van ʼn spesifieke observasie op ʼn grafiek.
Diskrete data
Data wat slegs uit heelgetalle bestaan. (Daar is dus geen waardes tussen byvoorbeeld 1 en 2 nie.)
Eenvoudige ewekansige
Eenvoudige ewekansige steekproefneming is die algemeenste
steekproefneming
steekproefnemingsmetode wat gebruik word en dit is waar elke steekproefeenheid presies dieselfde waarskynlikheid het om gekies te word.
Ewekansig
Om dieselfde kans/waarskynlikheid te hê.
Frekwensieverdeling
ʼn Opsomming van die observasies van ʼn stogastiese veranderlike en die aantal kere wat dit waargeneem is.
Gemiddeld
Die verwagte waarde van ʼn stogastiese veranderlike.
Geriefsteekproefneming
ʼn Nie-ewekansige steekproefnemingsmetode waar die navorser die data wat beskikbaar is of wat maklik verkry kan word, gebruik.
Gestapelde
ʼn Kolomgrafiek waar die kolomme meer as een kategoriese
kolomgrafiek
veranderlike voorstel wat bo-op mekaar gestapel is.
Gestratifiseerde
ʼn Ewekansige steekproefnemingsmetode waar die populasie in
steekproefneming
twee of meer eksklusiewe groepe (strata) verdeel word. Elke groep/stratum bevat homogene elemente (die elemente is soortgelyk aan mekaar wanneer daar gekyk word na die veranderlike wat bestudeer word. Dan word steekproefeenhede ewekansig uit elke stratum gekies.
Bladsy 12 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Histogram
ʼn Spesiale kolomgrafiek wat die frekwensie van al die waargenome observasies illustreer. Die kolomme se breedte kan verskil, maar die oppervlak van die kolom is proporsioneel tot die frekwensie van die observasies.
Houer-en-punt-
ʼn Grafiek wat die verspreiding van ʼn steekproef se observasies
stippingsgrafiek
voorstel. Dit word saamgestel uit die kleinste waarde, eerste kwartiel, mediaan, derde kwartiel en die grootste waarde.
Kolomgrafiek
ʼn Grafiek waar die kolomme ʼn kategoriese veranderlike voorstel.
Kontinue data
Data wat uit reële getalle bestaan. Daar is dus, byvoorbeeld, ʼn oneindige hoeveelheid waardes tussen 1 en 2 (bv. 1.0001).
Kruisfrekwensietabel
ʼn Kruisfrekwensietabel gee die frekwensies van twee kategoriese stogastiese veranderlikes, waar die een veranderlike die kolomme gee en die ander een die rye.
Kumulatiewe
Vir ʼn steekproef van numeriese data is die kumulatiewe
frekwensie
frekwensie van x die totale aantal observasies wat kleiner of gelyk aan x is.
Kumulatiewe
ʼn Spesiale lyngrafiek wat die kumulatiewe waardes van ʼn
frekwensieveelhoek
stogastiese veranderlike voorstel. Hierdie kurwe word gekenmerk dat die volgende datapunt altyd hoër sal wees as die vorige, waar die laaste datapunt gelyk aan die som van al die observasies is.
Kurtose
Skerpheid van ʼn verdeling se draaipunt.
Kwalitatiewe data
Nie-numeriese data.
Kwantiel
Enigeen van die verdelingspunte wat die frekwensieverdeling van ’n steekproef in gelyke onderdele of intervalle verdeel, bv. desiele, kwartiele of persentiele.
Kwantitatiewe data
Numeriese data.
Kwartiel
Enigeen van die verdelingspunte wat die frekwensieverdeling van ’n steekproef in vier gelyke onderdele of intervalle verdeel.
Kwotasteekproefneming
ʼn Nie-ewekansige steekproefnemingsmetode waar die navorser
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 13
GQM105 Inleiding tot elementêre kwantitatiewe metodes nie al die beskikbare steekproefeenhede wil gebruik nie, maar hulle in kategorieë verdeel. Lyngrafiek
Grafiek verkry deur verskillende punte, wat veranderlikes voorstel, te verbind deur middel van ’n gebroke of reguit lyn.
Mediaan
Die getal wat presies in die middel is van al die observasies.
Meervoudige
ʼn Kolomgrafiek wat twee kategorieë (in plaas van een) se
kolomgrafiek
frekwensies voorstel, bv. ouderdomme vir mans en vroue.
Meetkundige gemiddeld
Die gemiddeld van ʼn stel positiewe waardes tussen 0 en 1.
Modus
Die modus is die observasie wat die meeste kere in die steekproef voorkom.
Nie-ewekansig
Waar die kans/waarskynlikheid van observasies nie dieselfde is nie.
Niewaarskynlikheid-
Enige steekproefnemingsmetode waar die steekproefeenhede
steekproefneming
nie ewekansig gekies word nie.
Observasie
Die resultaat van ʼn eksperiment of toets waarin ʼn veranderlike (numeries of kategories) gemeet is.
Oordeelsteekproef-
ʼn Nie-ewekansige steekproefnemingsmetode waar ʼn navorser
neming
gebruik maak van steekproefeenhede wat met die hand gekies is deur ʼn kenner gebaseer op die bruikbaarheid daarvan.
Opname
Insameling van gegewens, veral deur middel van vraelyste, of resultaat wat op grond daarvan verkry word.
Persentiel
Enigeen van die verdelingspunte wat die frekwensieverdeling van ’n steekproef in honderd gelyke onderdele of intervalle verdeel.
Populasie
Omvattende geheel van eenhede, soos individue, items, of dergelike eenhede waaruit ’n steekproef vir statistiese doeleindes geneem word of geneem kan word.
Reikwydte
Die verskil tussen die maksimum en minimum waardes in ʼn steekproef.
Rekenkundige
Die verwagte waarde van ʼn stogastiese veranderlike.
gemiddeld
Bladsy 14 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Sigblad
ʼn Blad met veelvuldige selle in ’n matriks van rye en kolomme, waarvan die inhoud van enige sel óf onafhanklik, óf in terme van die inhoud van ander selle gespesifiseer kan word, wat veral gebruik word om data te analiseer of om bewerkings mee uit te voer, en waarvan die inligting op die hele blad outomaties aangepas of herbewerk word wanneer ’n verandering in ’n enkele sel aangebring word.
Sirkelgrafiek
ʼn Grafiek wat verskillende proporsies van ʼn geheel (100%) voorstel.
Skeefheid
Die verdeling van ʼn veranderlike wat nie simmetries verdeel is om die gemiddeld of mediaan nie.
Sneeubalsteekproef-
ʼn Nie-ewekansige steekproefnemingsmetode waar ʼn
neming
steekproefeenheid geïdentifiseer word, gebaseer op bepaalde eienskappe, en hy/sy gevra word om ander mense, wat ook aan hierdie kriteria voldoen, aan te beveel om ook deel te neem aan die opname.
Standaardafwyking/
Die vierkantswortel van die variansie.
Standaardfout Steekproef
ʼn Kleiner groep wat vanuit ʼn populasie verkry word. Eienskappe van die steekproef kan gemeet word en word gebruik om gevolgtrekkings van dieselfde eienskappe van die populasie te maak.
Steekproefeenheid
ʼn Persoon of onderwerp wat ingesluit word by die steekproef.
Steekproefmetode
Die wyse waarop ʼn steekproef beplan en die steekproefeenhede uit die populasie gekies word.
Stelselmatige
ʼn Ewekansige steekproefnemingsmetode waar ’n
steekproefneming
steekproefeenheid gekies word en daarna elke soveelste steekproefeenheid.
Stogastiese
Enige eienskap/veranderlike, van ʼn populasie wat van belang
veranderlike
is, wat willekeurig versprei is.
Trossteekproefneming
ʼn Ewekansige steekproefnemingsmetode wat soortgelyk is aan gestratifiseerde steekproefneming. Die groepe/trosse is steeds
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 15
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes eksklusief, met ander woorde ʼn eenheid kan nie in meer as een groep/tros val nie. Die groepe/trosse is homogeen, met ander woorde soortgelyk aan mekaar. Die navorser sal ʼn steekproef (đ?‘˜) uit die groter populasie (đ??ž) van groepe/trosse trek. Uitskieter
ʼn Observasie wat drasties verskil van die ander observasies in ʼn datastel.
Variansie
Die variansie is ʼn maatstaf van hoe ver al die observasies �( , �* , �+ , ‌ , �- verwyder is vanaf die sentrale waarde van die datastel, die steekproefgemiddeld � . Uit hierdie stelling kan ons aanvaar dat die variansie ʼn verwerkte afstand is (dit is die afstand tussen die observasies en die gemiddeld).
Vraelyste
ʼn Lys vrae oor ’n bepaalde onderwerp waarop antwoorde verstrek moet word.
Waarskynlikheidsteek-
Enige waarskynlikheidgebaseerde steekproefnemingsmetode,
proefneming
waar die steekproefeenhede ewekansig gekies word uit die populasie. Met ander woorde elke lid van die populasie het dieselfde waarskynlikheid om gekies te word.
1.4
Inleiding
Wanneer ʼn mens met ʼn nuwe vakgebied begin, is dit altyd belangrik om die taal van die vak te verstaan. Met die eerste oogopslag lyk statistiek na Grieks en in sekere gevalle Ăs dit inderdaad Grieks, maar dit is geen rede om in koue sweet uit te slaan en met jou kop in jou hande te sit nie. In Hoofstuk 1 van die handboek word die basiese beginsels van statistiek behandel en gaan ons bietjie meer in diepte kyk na begrippe soos populasies, steekproewe, data, inligting, ensovoorts. Een van die belangrikste temas van Hoofstuk 1 is data, wat dit is, die kwaliteit daarvan, die bronne waar ons data kan verkry, hoe om dit te versamel en op die einde van die dag voor te berei vir verdere statistiese verwerking. Omdat steekproefnemingsmetodes ʼn groot impak het op die versameling en gebruik van data, sal paragrawe 6.1 en 6.2 van die handboek ook in hierdie studie-eenheid behandel word. Wanneer ons die basiese begrippe van statistiek verstaan en weet hoe ons data versamel en voorberei, kan ons dan oorgaan na die verwerking en aanwending daarvan.
Bladsy 16 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes Statistiek behels die verwerking van data na inligting deur middel van wiskundige berekeninge. Om statistiek moontlik te maak moet data kwantitatief (numeries) wees of gekwantifiseer (na getalle omgeskakel) word. Hierdie studie-eenheid verskaf ʼn inleiding tot statistiek en bespreek die verskillende aspekte van beskrywende statistiek. Ons leef in die era van data. Data word teen ʼn ongekende tempo gegenereer en versamel, en die persoon/onderneming wat weet hoe om hierdie data te benut, is ʼn kortkop voor die res. Om hierdie rede sal ons kyk hoe kategoriese en numeriese data opgesom en grafies voorgestel kan word. Hierdie opsommings en grafiese voorstellings skets ʼn prentjie van die data en is gewoonlik die formaat waarin ʼn sakeverslag opgestel word vir die bestuur. As jy so ʼn verslag moet opstel, is dit belangrik om te verstaan hoe om dit reg te doen en as jy ʼn bestuurder is, is dit belangrik om te verstaan hoe om dit reg te lees en te interpreteer. Om meer betekenis aan die data te gee is daar verskeie numeriese beskrywende statistiek wat daaruit bereken kan word. Hierdie statistieke, soos gemiddeldes, standaardafwykings, reikwydtes en andere, word gebruik om die data te verstaan en kan verder gebruik word om afleidings te maak oor die populasie waaruit dit kom en/of vooruitskattings te maak vir hierdie populasie. As iemand wat statistiek beoefen, is dit belangrik om te verstaan watter statistiek jy moet gebruik en wanneer jy daardie statistiek kan gebruik. 1.5
Basiese begrippe en beginsels van statistiek
Bestudeer die handboek Hoofstuk 1 paragrawe 1.1-1.11. Hoofstuk 1 verduidelik die belangrikste statistiese begrippe en die res van hierdie vak word daarop gebou. Alhoewel hierdie ʼn kort hoofstuk is, vestig dit die grondslag vir die res van die vak en moet dit dus nie afgeskeep word nie. Die doel van hierdie begeleidingsgids is nie om die handboek te herhaal nie. Dus sal daar nie ʼn definisie en beskrywing van elke begrip in die handboek verskaf word nie. Sommige van die begrippe sal egter in meer detail beskryf word. 1.5.1
Wat is statistiek?
Bestudeer die handboek paragrawe 1.1-1.5 Om hierdie te vraag te beantwoord is dit belangrik om eers na die definisies in paragraaf 1.1 in die handboek te kyk: Statistiek kan gedefinieer word as ʼn versameling wiskundige hulpmiddels en tegnieke wat rou (onverwerkte) data omskep in nuttige en bruikbare inligting, wat effektiewe besluitneming ondersteun deur middel van opsommende maatstawwe.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 17
GQM105 Inleiding tot elementêre kwantitatiewe metodes Hierdie maatstawwe word gebruik om dataprofiele te beskryf, beramings te verskaf, verhoudinge tussen datastelle te toets en om tendense oor tyd te identifiseer (Wegner, 2016: 3). Daar word onderskei tussen terme soos “bestuursbesluitneming”, “inligting”, “data” en “statistiek”. Davis, Pecar en Santana (2014: 3) definieer statistiek (die studie van data) as ’n kollektiewe stel tegnieke wat verwant is aan die verkryging, organisering, opsomming, voorstelling, analisering, interpretering en bereiking van gevolgtrekkings gebaseer op data. Data het nie enige waarde indien dit nie na inligting verwerk word nie. Statistiek is een van die stel hulpmiddels wat hier verwerking nodig maak.
Voorbeeld 1.1 Kyk na die volgende vrae. Watter van hierdie vrae versamel statistiese data? •
Hoe voel jy oor die e-tolstelsel?
•
Hoe oud is jy (in jare)?
•
Wat was die punt wat jy vir Statistiek behaal het?
•
Op ʼn skaal van 1 tot 10, dui aan hoe tevrede jy met die dosent is.
Al die bogenoemde vrae, behalwe die eerste een, versamel kwantitatiewe data. Dit is egter moontlik om, deur ʼn verskeidenheid tegnieke, data wat nie kwantitatief is nie in getalle om te skakel. Daar word verwys na die kwantifisering van kwalitatiewe data. Hierdie is ʼn omvattende proses wat nie in hierdie vak bespreek sal word nie. Figuur 1.2 hieronder probeer wys hoe statistiese analise deel kan vorm van effektiewe bestuursbesluitneming. Data word ingesamel vir ʼn bepaalde doel, dan word dit skoon gemaak en voorberei vir verdere verwerking, dan word daar gekyk na die beskrywende statistiek en word dit weer gebruik vir afgeleide statistiek en statistiese modellering. Die afvoer van hierdie proses is inligting en hierdie inligting word deur die bestuur gebruik om effektiewe besluite te neem.
Figuur 1.2: Statistiese analise as deel van bestuursbesluitneming Aangepas uit Wegner (2016: 4)
Bladsy 18 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes Omdat statistiese analise deel vorm van ʼn proses, en nie apart staan nie, moet die hele proses holisties beplan en uitgevoer word. Indien swak data versamel word, sal die inligting wat verkry word ook swak wees. As die verkeerde vrae gevra word, aan die begin van hierdie proses, kan die inligting nie later die nodige antwoord gee nie. Die geloofwaardigheid van inligting is afhanklik daarvan dat elke stap van hierdie proses reg uitgevoer is. 1.5.2
Statistiese begrippe en notasie
Daar is ʼn paar terme wat jy gereeld gaan hoor en lees in hierdie vak. Om hond haaraf te maak is dit belangrik dat jy verstaan wat bedoel word met elke begrip en die notasie (die stelsel van simbole waarmee statistieke en formules weergegee word) wat gebruik word. Paragraaf 1.2 in die handboek beskryf die taal van statistiek. Die tabel hieronder lys die algemeenste konsepte, asook die notasie wat ons vir steekproewe en populasies gebruik.
Statistiese maatstaf
Steekproefstatistiek
Populasie-parameter
Gemiddeld (mean)
đ?‘Ľ
đ?œ‡ (Griekse letter mu)
Standaardafwyking (standard deviation)
đ?‘
đ?œŽ (Griekse letter sigma)
Variansie (variance)
đ?‘ *
đ?œŽ*
Grootte (size)
đ?‘›
đ?‘
Korrelasie (correlation)
đ?‘&#x;
đ?œŒ (Griekse letter rho)
Tabel 1.1: Statistiese notasie (Wegner, 2106: 6) Statisties is daar ʼn groot verskil tussen ʼn steekproef en ʼn populasie, en jy moet duidelik kan onderskei wanneer daar met die steekproefstatistieke of met die populasie-parameters gewerk word. Die berekening van hierdie waardes verskil ook. Daar sal deur die loop van hierdie vak aanvaar word dat jy hierdie terme en simbole ken en weet waarvoor dit gebruik word. Die volgende voorbeeld sal poog om elk van hierdie terme te verduidelik:
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 19
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Voorbeeld 1.2 Daar is 30 000 werknemers by Maatskappy X. Ek wil graag weet hoe gereeld hierdie werknemers by restaurante eet, maar hierdie data is nie beskikbaar nie. Ek besluit om die werknemers hieroor uit te vra. Omdat ek nie die tyd en geld het om al 30 000 werknemers te vra nie, kies ek ʼn kleiner groep van 1 000 werknemers uit die groter groep. Ek kies hierdie groep sodat hulle sover as moontlik verteenwoordigend van die 30 000 is. Ek vra elk van hierdie werknemers hoeveel keer per jaar hy/sy by ʼn restaurant uiteet. Ek kry ʼn gemiddeld van 14.75 keer per jaar. •
Stogastiese veranderlike (random variable): Die hoeveelheid keer wat ʼn werknemer in Maatskappy X per jaar by ʼn restaurant eet, in hierdie geval 14.75.
•
Data: Die 1 000 antwoorde wat ek versamel het.
•
Populasie (population): Die totale hoeveelheid individue waarvoor ek afleidings wil maak, gebaseer op my statistiese analise (die 30 000 werknemers). Belangrik: Die steekproef moet altyd uit die populasie saamgestel word. Ek kon dus nie my 1 000 werknemers vanaf ʼn ander onderneming as Maatskappy X gevind het nie.
•
Populasie parameter (population parameter): Die spesifieke eienskap van die populasie wat ek wil meet, in hierdie geval die gemiddelde hoeveelheid kere wat ʼn werknemer (van die 30 000) in ʼn jaar uiteet.
•
Steekproef (sample): Die 1 000 werknemers (nie hul antwoorde nie) wat verteenwoordigend van die volledige groep werknemers (30 000) behoort te wees.
•
Steekproef-eenheid (sampling unit): Elkeen van hierdie werknemers wat in die steekproef voorkom, is ʼn steekproef-eenheid.
•
Steekproefstatistiek (sample statistic): Omdat ek nie die data vir al die werknemers in die populasie kan meet nie, moet ek ʼn statistiek in die steekproef gebruik om die soortgelyke statistiek in die populasie te skat. Dus is die gemiddelde hoeveelheid kere wat werknemers in die steekproef uiteet my steekproefstatistiek.
•
Grootte (N en n). Die grootte van die steekproef (n) was 1 000. Die grootte van die populasie (N) is 30 000.
•
Proporsie (p). Die steekproef se proporsie van die populasie was 0.033 (1 000/30 000).
Vir nog voorbeelde, verwys gerus na Tabel 1.1 in die handboek.
Bladsy 20 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.5.3
Statistiek en rekenaars
Daar is regtig min mense wat vandag nog statistiek eksklusief met die hand bereken. Die meeste berekeninge word met behulp van rekenaars en gespesialiseerde programmatuur, soos SPSS, SPlus, SYSTAT, ensovoorts, gedoen. Deur die loop van hierdie vak sal daar van Microsoft Excel gebruik gemaak word en is dit ʼn integrale deel van hierdie vak. Daar word van die student verwag om basiese statistiese berekening met die hand te doen en dit met behulp van Microsoft Excel te verifieer. Wanneer dit kom by die skoonmaak en die verwerking van groot volumes data, word daar van die student verwag om dit met Microsoft Excel te doen. Daar sal deurgaans aan studente verduidelik word van watter Microsoft Excel-formule hulle gebruik moet maak en hoe om dit te doen. Studente wat met Microsoft Excel sukkel, word aangemoedig om na artikels en video’s op die internet te gaan soek wat dit in meer detail verduidelik en wys. Microsoft het verder ʼn uitgebreide biblioteek van hul programmatuur se funksionaliteit wat studente gerus kan gebruik. 1.5.4
Data
Bestudeer die handboek paragrawe 1.5-1.10 Statistiek is gebaseer op data. As hierdie data van swak kwaliteit is (byvoorbeeld as gevolg van foute met die versameling), maak dit nie saak hoe goed die kwaliteit van die statistiese ontleding is nie. Die inligting wat verkry word, sal foutief wees. Beskou weer die voorbeeld van Maatskappy X in paragraaf 1.5.2 hierbo genoem. Daar is gevind dat die gemiddelde werknemer 14.75 per jaar by restaurante eet. Gestel nou dat die vraag nie ʼn tydsperiode (in hierdie geval die afgelope jaar) gespesifiseer het nie. Sommige respondente mag antwoord hoeveel keer hulle per week, dag of maand uiteet. Die inligting sal verkeerd wees, ongeag hoe akkuraat die gemiddeld bereken is. ʼn Goeie navorser sal dus twee belangrike aspekte in ag moet neem: •
Hoe kan die kwaliteit van data verseker word?
•
Wat is die beste statistiese metode om gevolgtrekkings oor die populasie te kan maak?
v Eienskappe van data Data kan op ʼn groot verskeidenheid van maniere geklassifiseer word (verwys na Figuur 1.3 hieronder). Op die hoogste vlak is data kwalitatief of kwantitatief.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 21
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Figuur 1.3: Klassifikasie van datatipes (Wegner, 2016: 13) Kwalitatiewe data is data wat nie numeries van aard is nie. ʼn Voorbeeld hiervan is ʼn respondent se geslag wat óf manlik, óf vroulik is. ʼn Ander voorbeeld is ʼn respondent se gunstelingrestaurant, wat Wimpy, Spur, Dros of enigeen van ʼn baie groot verskeidenheid kan wees. Hoe dit ook al sy, nie een van hierdie antwoorde het ʼn numeriese waarde nie – dit is nie ʼn getal nie. Ons kan egter later kom en dit ʼn numeriese waarde gee en dit verder gebruik vir analise, maar dit is nie in wese ʼn getal nie. Kwantitatiewe data is data wat numeries van aard is. Voorbeelde hiervan is ʼn respondent se skoengrootte, ouderdom, inkomste, ensovoorts. In kort is dit enige data wat ʼn getal is. Op die volgende vlak van Figuur 1.3 hierbo kry ons die skaal van meting, naamlik nominale data, ordinale data, intervaldata en ratio data. Die eerste drie van hierdie skale is diskrete skale (waarvan die waarde altyd ʼn heelgetal is, met ander woorde geen desimale nie) en die laaste skaal is kontinu (dit kan enige numeriese waarde hê, byvoorbeeld 28.4, 2.4, 42.38, ensovoorts). Wenk: Baie studente raak deurmekaar met diskrete en kontinue waardes. Kry vir jouself ʼn maklike manier om tussen die twee te onderskei en dit te onthou. Nominale data is kategoriese data waar ʼn numeriese waarde aan elke kategorie toegeken word. Hierdie kategorieë is almal ewe belangrik, met ander woorde geen rang kan daaraan gegee word nie. Wanneer ons nominale data versamel, sal die tipiese vrae soos volg lyk: •
Wat is jou geslag? (1 = manlik; 2 = vroulik)
•
Wat is jou huistaal? (1 = Xhosa; 2 = Zoeloe; 3 = Engels; 4 = Afrikaans)
•
Watter kleur is jou motor? (1 = rooi; 2 = wit; 3 = blou; 4 = geel; 5 = swart)
Bladsy 22 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes •
Het jy gestem gedurende die verkiesing? (1 = ja; 2 = nee)
Ordinale data is kategoriese data waar ʼn numeriese waarde aan elke kategorie toegeken word. Hierdie kategorieë kan van klein tot groot gerangskik word, met ander woorde daar is ʼn rangvolgorde tussen die verskillende kategorieë. Wanneer ons ordinale data versamel, sal die tipiese vrae soos volg lyk: •
Watter grootte hemp dra jy? (1 = S; 2 = M; 3 = L; 4 = XL; 5 = 2XL)
•
Beskou jy jouself as kort, middelmatig of lank? (1 = kort; 2 = middelmatig; 3 = lank)
•
Rangskik jou drie gunstelingrestaurante in jou voorkeurvolgorde. (1 = eerste keuse; 2 = tweede keuse; 3 = derde keuse)
Intervaldata is numeriese kategoriese data. Hierdie kategorieë kan van klein tot groot gerangskik word, met ander woorde daar is ʼn rangvolgorde tussen die verskillende kategorieë. Wanneer ons intervaldata versamel, sal die tipiese vrae soos volg lyk: •
Op ʼn skaal van 1 tot 5, hoe goed was die diens gewees? (waar 1 = uiters swak en 5 = onverbeterlik)
•
Tot watter mate stem jy saam met die stelling dat die uitslag van die verkiesing regverdig was? (waar 1 = geensins en 10 = volkome)
•
Deur ʼn kruisie te trek op die lyn, hoe stresvol het jy die onderhoud ervaar?
Ratio data bestaan nie uit kategorieë nie, maar werklike nommers. Hierdie tipe data is ook die enigste wat kontinu van aard is. Wanneer ons ratio data versamel, sal die tipiese vrae soos volg lyk: •
Wat is jou ouderdom?
•
Hoeveel brandstof verbruik jou motor tydens ’n rit na Upington?
•
Wat is jou huidige gewig?
Nominale data is van die moeilikste om statisties te verwerk, terwyl ratio data die maklikste is. Wanneer jy ʼn vraelys moet saamstel, is dit belangrik dat jy die vrae op die regte manier vra sodat jy die bruikbaarste data kan versamel. v Databronne Daar is ʼn magdom bronne waaruit data versamel kan word. Die tabel hieronder gee ʼn paar ooglopende bronne van binne en buite ʼn onderneming, maar is geensins ’n volledige lys nie.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 23
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Interne databronne
Eksterne databronne
•
Verkope
•
Navorsingsinstitute en universiteite
•
Tydstate
•
Aandelebeurs
•
Bemarkingspandering
•
Die staat en staatsinstansies
•
Beskikbare tyd van stelsels
•
Nuuskanale
•
Werknemerprofiele
•
Interne marknavorsing Tabel 1.2: Databronne
Wanneer data ingewin word, is dit belangrik om te kyk na die bron vanwaar die navorser hierdie data verkry. As die navorser data versamel uit ʼn eksterne databasis waaroor sy/haar onderneming geen beheer het nie en waar die toepassing van datastandaarde twyfelagtig is, moet hierdie data baie versigtig hanteer word. Die waarskynlikheid dat hierdie goeie kwaliteit data is, is baie klein. In die meeste gevalle probeer die navorser so na as moontlik aan die bron van die data kom met so min as moontlik tussengangers. Dus kan ons onderskei tussen primêre databronne en sekondêre databronne. Primêre databronne is databronne waar die data vir die eerste keer in sy rou (onverwerkte) formaat versamel word met ʼn spesifieke doel voor oë. Die voordeel van primêre databronne is dat die navorser volledige beheer het oor die versameling van hierdie data. Die nadeel hieraan verbonde is dat dit baie tyd en energie kos om hierdie rou data te versamel, skoon te maak en te verwerk. Sekondêre databronne is databronne waar die data alreeds versamel, skoongemaak en tot ʼn mate verwerk is. Hierdie data is nie noodwendig met die navorser se doel voor oë versamel nie en soms is dit nie eers bruikbaar nie. Die voordeel hieraan verbonde is dat hierdie data alreeds beskikbaar is en dus nie so baie sal kos om te bekom nie. Die nadeel is dat hierdie data nie noodwendig bruikbaar is vir die betrokke studie nie en dit kan soms moeilik wees om die bruikbaarheid daarvan te bepaal. Hierdie data mag moontlik ook nie die volledige prentjie skets van die werklike populasie nie en kan lei tot onakkurate resultate en verkeerde gevolgtrekkings. Die navorser moet goed gaan nadink oor waar hy sy data gaan bekom en waarvoor hy dit kan gebruik. ʼn Verkeerde aanname op hierdie punt kan later tot katastrofiese nagevolge lei.
Bladsy 24 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes v Versamelingsmetodes Die metode wat gebruik word om die data te versamel kan ʼn groot impak hê op die akkuraatheid van die data. Die oorhoofse metodes om data te versamel is: •
Waarneming: Deur ʼn respondent dop te hou en dan die data vas te lê gebaseer op die respondent se gedrag.
•
Opnames: Deur vrae aan respondente te stel en hul terugvoer vas te lê. Opnames kan per onderhoud, papier, telefoon of elektronies gedoen word. (Verwys na paragraaf 1.9 in die handboek vir ʼn volledige beskrywing van die metodes en die voor- en nadele van elk.)
•
Eksperimentasie: Deur eksperimente te doen en data te versamel van vooraf geïdentifiseerde veranderlikes.
v Datavoorbereiding Data wat versamel is, kan nie noodwendig dadelik geanaliseer word nie. In die meeste gevalle is daar ʼn proses waardeur die navorser moet gaan om die data in ʼn bruikbare formaat te kry. Byvoorbeeld: data wat deur middel van ʼn geskrewe opname versamel is, moet elektronies ingevoer of vasgelê word. Wanneer data vasgelê word, outomaties of andersins, is daar altyd die moontlikheid dat foute kan insluip. Hierdie foute, wat geensins verband hou met die werklike data nie, kan negatiewe gevolge inhou vir die studie en moet dus skoon-/reggemaak word alvorens die navorser dit kan verwerk. Daar moet verder bepaal word of die data relevant is tot die navorsing, al dan nie. Indien die veranderlikes in die datastel nie relevant is tot die studie nie, kan dit uit die aard van die saak nie daarvoor aangewend word nie. Dus moet die regte stel veranderlikes gekies word. Soms is dit nodig om data meer relevant te maak tot die studie en moet die navorser twee of meer veranderlikes kombineer. Hierdie tipe dataverryking vind gewoonlik plaas wanneer daar gewerk word met abstrakte konsepte soos “omset per vierkante meter”, soos die handboek uitwys (Wegner, 2016: 18). 1.5.5
Selfevalueringsvrae
Voltooi al die oefeninge aan die einde van Hoofstuk 1 in die handboek. Die antwoorde op hierdie vrae is aan die einde van die handboek. Dit is belangrik dat jy nie na die antwoorde kyk voordat jy die vrae heeltemal voltooi het nie, selfs al sukkel jy om ʼn vraag te voltooi.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 25
GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.6
Steekproefnemingsmetodes
Bestudeer die handboek Hoofstuk 6 paragrawe 6.1 en 6.2. Om afgeleide statistiek te beoefen of om statistiese modelle te ontwikkel word die statistikus verplig om sekere afleidings te maak oor die steekproef, byvoorbeeld dat die steekproefstatistieke verteenwoordigend is van die groter populasie. As hierdie aanname nie waar is nie, kan hierdie statistiek nie gebruik word vir beramings en vooruitskattings nie. Nou mag jy jouself afvra waarom Hoofstuk 6 nou alreeds behandel word, en die antwoord is eintlik logies: om ʼn verteenwoordigende steekproef te kry moet die beplanning en die versameling van data dit alreeds in ag neem. Daar is twee oorhoofse kategorieë van steekproefneming: niewaarskynlikheidsteekproefneming en waarskynlikheidsteekproefneming. 1.6.1
Niewaarskynlikheidsteekproefneming
Wegner (2016: 161) definieer niewaarskynlikheidsteekproefneming as enige steekproefmetode waar die steekproefeenhede nie ewekansig gekies word nie. Figuur 1.4 hieronder toon dat niewaarskynlikheidsteekproefneming verder verdeel kan word tussen gerief- en doelgerigte steekproefnemingsmetodes. Geriefsteekproefnemingsmetodes kyk na watter steekproefeenhede toeganklik of maklik bruikbaar is, waar doelgerigte steekproefnemingsmetodes vir ʼn spesifieke doel gebruik word. Dit is belangrik om op hierdie punt te noem dat niewaarskynlikheidsteekproefnemingsmetodes wel ʼn plek het in navorsing, maar dat dit reg gebruik moet word: die navorser moet verstaan wat die beperkinge van hierdie metodes is en hoe die data en statistiek gebruik kan word.
Figuur 1.4: Niewaarskynlikheidsteekproefnemingsmetodes (Davis, Pecar & Santana, 2014: 256) v Geriefsteekproefneming (Convenience sampling) Davis, Pecar en Santana (2014: 255-256) meld dat dit nie altyd moontlik is om steekproefeenhede ewekansig te kies vir veral groot steekproewe nie. Die navorser het nie noodwendig toegang tot al die nodige inligting nie. As voorbeeld wil ons kyk na plaaslike
Bladsy 26 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes familiebesighede wat finansieel swaargekry het gedurende die 2007-2009 resessie. In hierdie voorbeeld gaan die navorser dalk nie toegang hê tot ʼn lys van plaaslike familiebesighede nie en is daar geen manier om vooraf te bepaal of hulle swaar gekry het tydens die resessie nie (omdat hul finansiële state nie gepubliseer is nie). Dit is dus onmoontlik om hierdie ondernemings ewekansig te kies. Dus sal ons die data wat beskikbaar is, versamel en gebruik vir die ondersoek. v Oordeelsteekproefneming (Judgement sampling) Wanneer ʼn navorser van oordeelsteekproefneming gebruik maak, word steekproefeenhede met die hand gekies deur ʼn kenner gebaseer op die bruikbaarheid van hierdie steekproefeenhede vir die betrokke ondersoek (Reference: 2016). In sekere velde kan oordeelsteekproefneming beter resultate lewer as waarskynlikheidsteekproefmetodes omdat ʼn kenner sy/haar ondervinding kan inspan; byvoorbeeld as ʼn navorser ʼn studie oor selfoonmaatskappye doen, kan beter resultate verkry word as die kenner ʼn spesifieke maatskappy nader en nie een ewekansig kies nie. Die kenner maak hierdie keuse op grond van sy ondervinding en kennis van die maatskappye. Sou ʼn maatskappy ewekansig gekies word en die maatskappy swak of geen data verskaf nie, sit die navorser in ʼn slegte posisie. Oordeelsteekproefneming is veral handig waar die populasie klein is. v Doelgerigte steekproefneming (Purposive sampling) Wanneer ʼn navorser sy/haar steekproefeenhede kies op grond van ʼn spesifieke doel word daar gebruik gemaak van ʼn doelgerigte steeproefnemingsmetode (Davis, Pecar & Santana, 2014: 256). Hierdie steekproef is steeds nie verteenwoordigend van die groter populasie nie, maar die doel van die ondersoek is ook nie om afleidings te maak van die populasie nie. ʼn Voorbeeld hiervan is wanneer ʼn onderneming ʼn tevredenheidspeiling doen binne ʼn spesifieke departement om te bepaal wat die moraal van daardie departement is. Die twee doelgerigte steekproefnemingsmetodes waarna ons kyk, is kwotasteekproefneming en sneeubalsteekproefneming. v Kwotasteekproefneming (Quota sampling) As ʼn navorser nie al die beskikbare steekproefeenhede wil gebruik nie, maar hulle in kategorieë verdeel, dan word daar gebruik gemaak van kwotasteekproefneming; byvoorbeeld, die bestuur van ʼn onderneming wil bepaal wat die vlak van werksbevrediging is. Hulle doen ʼn opname, maar verdeel die werknemers tussen manlik en vroulik. Uit beskikbare statistiek weet hulle dat 75% van werknemers manlik is en 25% vroulik, en bepaal dat die opname soortgelyk verdeel moet wees. Hulle besluit op ʼn steekproefgrootte van 100 werknemers. Die menslikehulpbronbestuurspan stap deur die gebou en vra werknemers om die betrokke vorms te voltooi. Sodra 25 vroulike werknemers elkeen ʼn vorm Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 27
GQM105 Inleiding tot elementêre kwantitatiewe metodes voltooi het, hou die span op om dames te vra en sodra 75 manlike werknemers elkeen ʼn vorm voltooi het, kom die opname tot ʼn einde. Hierdie is ʼn voorbeeld van proporsionele kwotasteekproefneming. In die geval waar die navorser nie besorg is dat die steekproef proporsioneel korrek verdeel is soos die populasie nie, maar dat die span slegs 30 dames en 70 mans moet vra om die vorm te voltooi, word daar van nie-proporsionele kwotasteekproefneming gebruik gemaak. v Sneeubalsteekproefneming (Snowball sampling) Sneeubalsteekproefneming is wanneer ʼn steekproefeenheid geïdentifiseer word, gebaseer op bepaalde eienskappe, en hy/sy gevra word om ander mense, wat ook aan hierdie kriteria voldoen, aan te beveel om ook deel te neem aan die opname (Davis, Pecar & Santana, 2014: 257). Hierdie metode word veral gebruik by ondersoeke wat handel oor sensitiewe sake, byvoorbeeld huishoudelike geweld, alkoholisme, ensovoorts. Die persone wat aanbeveel word, word ingesluit by die opname en word dan weer om die beurt gevra om ander aan te beveel, en so groei die steekproef net soos ʼn sneeubal wat teen die hang van ʼn berg afrol. 1.6.2
Waarskynlikheidsteekproefneming
Wegner (2016: 162) definieer waarskynlikheidsteekproefneming as: Enige waarskynlikheidsgebaseerde steekproefnemingsmetode waar die steekproefeenhede ewekansig gekies word uit die populasie. Met ander woorde, elke lid van die populasie het dieselfde waarskynlikheid om gekies te word.
Figuur 1.5: Waarskynlikheidsteekproefnemingsmetodes (Davis, Pecar & Santana, 2014: 251) v Eenvoudige ewekansige steekproefneming (Simple random sampling) Eenvoudige ewekansige steekproefneming is die algemeenste steekproefnemingsmetode wat gebruik word en dit is waar elke steekproefeenheid presies dieselfde waarskynlikheid het om gekies te word (Davis, Pecar & Santana, 2014: 251). v Stelselmatige steekproefneming (Systematic sampling) Stelselmatige steekproefneming is ʼn ewekansige metode waar ʼn steekproefeenheid gekies word en daarna elke soveelste steekproefeenheid. Die proses wat gevolg word, is soos volg:
Bladsy 28 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 1. Deel die populasiegrootte (đ?‘ ) deur die steekproefgrootte (đ?‘›). As die populasiegrootte 20 000 en die steekproefgrootte 40 is, is đ?œ? =
7 -
=
*8 888 :8
= 500. Rond đ?œ? altyd af tot die
naaste diskrete waarde (heelgetal). 2. Kies enige nommer (đ?‘˜) tussen, en insluitende, 1 en đ?œ?. As đ?œ? = 500 dan kan ons potensieel enige getal tussen 1 en 500 kies. Vir die doel van hierdie voorbeeld sal ons đ?‘˜ = 54 gebruik. 3. Deur te begin met đ?‘˜ sal ons elke đ?œ?ste steekproefeenheid kies en insluit by die steekproef. Waar đ?‘ = 20 000, đ?‘› = 40, đ?œ? = 500 en đ?‘˜ = 54 sal die volgende steekproefeenhede ingesluit word by die ondersoek: 54, 554, 1 054, 1 554, 2 054,... , 19 554. (Sou die 40ste waarde buite 20 000 lĂŞ, sou ons teruggegaan het na die eerste waarde en van daar af aangegaan het om die 40ste steekproefeenheid te kies.) Nota: Met hierdie metode het al die steekproefeenhede nie presies dieselfde waarskynlikheid om gekies te word nie en sou die gekose eenhede oor ʼn eienskap beskik wat nie dieselfde as die populasie is nie, kan dit vooroordeel insluit by die steekproef. v Gestratifiseerde steekproefneming (Stratified sampling) Davis, Pecar en Santana (2014: 253) beskryf gestratifiseerde steekproefneming as: ʼn Steekproefnemingsmetode waar die populasie in twee of meer eksklusiewe groepe (strata) verdeel word. Elke groep/stratum bevat homogene elemente (die elemente is soortgelyk aan mekaar wanneer daar gekyk word na die veranderlike wat bestudeer word. Dan word steekproefeenhede ewekansig uit elke stratum gekies. Wanneer ʼn navorser slegs van eenvoudige ewekansige steekproefneming gebruik maak, is daar altyd die risiko dat belangrike kenmerke per ongeluk uitgesluit word van die steekproef omdat die steekproefeenhede wat wel gekies is, toevallig nie oor die kenmerk beskik nie. Dit beteken dat die navorser die risiko loop om nie ʼn verteenwoordigende steekproef te kry nie. Gestratifiseerde steekproefneming is een manier om te verseker dat die steekproef verteenwoordigend is ten opsigte van die betrokke kenmerk. Davis, Pecar en Santana (2014: 253) noem die volgende voordele: •
Dit verseker dat die steekproef verteenwoordigend is.
•
Dit verskaf voldoende data om die onderskeie groepe/strata te analiseer.
•
Dit vereis nie ʼn magdom data om verteenwoordigend te wees nie.
•
Dit is meer akkuraat as wat eenvoudige ewekansige steekproefneming is, veral by groter populasies.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 29
GQM105 Inleiding tot elementêre kwantitatiewe metodes Binne gestratifiseerde steekproefneming is daar twee verskillende metodes: •
Proporsionele gestratifiseerde steekproefneming, waar die steekproefgrootte uit die stratum proporsioneel dieselfde is as die stratumgrootte teenoor die populasie; en
•
Nie-proporsionele gestratifiseerde steekproefneming, waar steekproefgrootte uit die stratum nie proporsioneel dieselfde is nie.
v Trossteekproefneming (Cluster sampling) Trossteekproefneming is soortgelyk aan gestratifiseerde steekproefneming. Die groepe/trosse is steeds eksklusief, met ander woorde ʼn eenheid kan nie in meer as een groep/tros val nie. Die groepe/trosse is homogeen, met ander woorde soortgelyk aan mekaar. Die navorser sal ʼn steekproef (đ?‘˜) uit die groter populasie (đ??ž) van groepe/trosse trek. Die navorser het dan die keuse om ʼn eenfase- of tweefaseproses te volg. By die eenfaseproses sal die navorser al die elemente in die gekose groep/tros insluit by die steekproef. By die tweefaseproses sal die navorser dan weer ʼn steekproef ewekansig kies uit die gekose groepe/trosse. Navorsers kan selfs so ver gaan as om ʼn derde en vierde fase van steekproefneming te doen en in hierdie geval sal dit bekend staan as multifasetrossteekproefneming. Met gestratifiseerde steekproefneming word daar steekproefeenhede van al die groepe/strata (wat van mekaar verskil) ingesluit, terwyl trossteekproefneming slegs van gekose groepe/trosse (wat soortgelyk aan mekaar is) gebruik maak. 1.6.3
Onsydigheid
Davis, Pecar en Santana (2014: 259) definieer onsydigheid as: Waar die verwagte waarde van die steekproefverdeling se statistiek dieselfde is as die populasieparameter. Met ander woorde die beraamde waarde is die ware waarde. Omdat die beskrywende statistiek van ʼn steekproef gebruik word om afleidings van die populasie te maak, wil ons graag die sydigheid/bevooroordeling van die data tot ʼn minimum beperk. Hoe groter die sydigheid/bevooroordeling, hoe swakker is die afleidings wat ons kan maak. 1.6.4
Sentrale limietstelling (Central limit theorem)
Een van die belangrikste aannames wat ons met afgeleide statistiek maak, is dat die steekproef normaal versprei is. Wanneer hierdie stelling nie waar is nie, kan ons eenvoudig nie die afleidings van die groter populasie maak en gebruik nie. Bladsy 30 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Die sentrale limietstelling sĂŞ dat wanneer ʼn steekproef uit ʼn populasie gekies word met ʼn gemiddeld đ?œ‡ en ʼn variansie đ?œŽ * , sal die verdeling van die steekproefgemiddeldes benaderd normaal wees wanneer die steekproefgrootte đ?‘› groot is. Dit kom daarop neer dat wanneer ons die steekproefgrootte vergroot, die steekproefverdeling se benadering meer normaal word. As ons hierdie steekproef ewekansig in kleiner groepe verdeel, sal die gemiddeld van hierdie groepe se gemiddelde benaderd normaal wees, as daar genoeg groepe is. Genoeg groepe, in hierdie geval, is volgens algemene literatuur đ?‘› = 30. Deur die sentrale limietstelling te gebruik kan ons ʼn steekproefverdeling normaal benader en die standaard-normaalverdeling se statistieke gebruik om afleidings van die groter populasie te maak. 1.6.5
Selfevalueringsvrae
Doen Vrae 5-14 en 20 op bladsy 175-176 van die handboek. 1.7
Beskrywende statistiek
Bestudeer die handboek Hoofstuk 2 paragrawe 2.1-2.3 en 2.5-2.6. Noudat ons gekyk het na waar data vandaan kom en hoe dit voorberei word, gaan ons in hierdie paragraaf kyk na hoe hierdie data opgesom en voorgestel kan word. Ons gaan dus nou kyk na hoe ons data kan omskakel na verstaanbare en bruikbare inligting. In die sakewêreld kan jy verwag om baie verslae te skryf en te lees deur die loop van jou loopbaan. Wanneer dit kom by sakesyfers word daar van ʼn verskeidenheid tabelle en grafieke gebruik gemaak om ʼn prentjie te skets van die onderneming. Daar gaan van jou verwag word om hierdie tabelle en grafieke te kan opstel en, meer belangrik, om dit te kan lees en die regte gevolgtrekkings daaruit te kan maak. (Verwys na Figuur 1.2 om te sien hoe statistiese analise deel vorm van bestuursbesluitneming.) 1.7.1
Grafiese beskrywende statistiek vir kategoriese data
Bestudeer die handboek paragraaf 2.2. In paragraaf 1.5.3 is die verskillende tipes data beskryf. Nominale data is gewoonlik kategories van aard. Die voorbeeld van die gunstelingrestaurante behels kategoriese data. Kategoriese data kan grafies op die volgende wyses voorgestel word: v Kategoriese frekwensietabel Hierdie tabel dui aan hoeveel keer elke kategorie deur respondente genoem is.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 31
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Gunstelingrestaurant Telling (count)
Persentasie
Spur
370
37%
Dros
250
25%
Bessie se kombuis
380
38%
1 000
100%
Tabel 1.3: Voorbeeld van ʼn frekwensietabel v Kolomgrafiek (bar chart) Hierdie grafiek stel frekwensies (bv. hoeveel keer ʼn restaurant as gunsteling genoem is) grafies voor.
Figuur 1.6: ʼn Kolomgrafiek v Sirkelgrafiek (pie chart) Hierdie grafiek word gebruik om die proporsie van elke kategorie as deel van alle respondente te vertoon. Figuur 1.7 verskaf ʼn voorbeeld.
Bladsy 32 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Figuur 1.7: ʼn Sirkelgrafiek Kyk ook na Voorbeeld 2.1 in die handboek op bladsy 28-30. Soms is daar meer as een veranderlike wat gemeet word. In plaas van ʼn gunstelingrestaurant, kan die respondente ook gevra word om hul geslag (manlik of vroulik) aan te dui. Sodoende kan daar bepaal word of die gunstelingrestaurante van mans en vroue verskil. Die volgende is wyses waarop kategoriese data met meer as een veranderlike voorgestel kan word. Moenie deurmekaar raak nie: kategorie vs. veranderlike Ons onderskei hier tussen veranderlikes en kategorieë. In die restaurant-voorbeeld is daar drie kategorieë (Spur, Dros en Bessie se kombuis), maar slegs een veranderlike (gunstelingrestaurant). In die voorbeelde hieronder is daar twee veranderlikes (gunstelingrestaurant en geslag), wat elk ʼn aantal kategorieë bevat: •
•
Veranderlike 1: Gunstelingrestaurant. 3 kategorieë: o
Kategorie 1: Spur
o
Kategorie 2: Dros
o
Kategorie 3: Bessie se kombuis
Veranderlike 2: Geslag. 2 kategorieë: o
Kategorie 1: Manlik
o
Kategorie 2: Vroulik
Die veranderlike vorm dus die grondslag waarvolgens kategorieë geskep word. v Kruisfrekwensietabel (cross-tabulation table) ʼn Tabel wat die frekwensies gee van elke kategorie van twee veranderlikes. Tabel 1.4 is ʼn voorbeeld van só ʼn kruisfrekwensietabel van die veranderlikes “geslag” en “restaurant”.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 33
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Restaurant
Geslag
Totaal
Manlik
Vroulik
Spur
250
120
370
Dros
180
70
250
Bessie se kombuis
50
330
380
Totaal
480
520
1000
Tabel 1.4: ʼn Kruisfrekwensietabel Uit bogenoemde is dit duidelik: •
dat daar meer vroulike (đ?‘› = 520) respondente as manlike (đ?‘› = 480) respondente was.
•
dat daar meer manlike respondente was wat van Spur en Dros gehou het, as vroulike respondente (250 en 180 vs. 120 en 70).
•
dat die vroulike respondente meer van Bessie se kombuis hou as mans, asook dat vroulike respondente se gunstelingrestaurant oor die algemeen Bessie se kombuis is.
v Stapel-kolomgrafiek (Stacked bar chart) Hierdie grafiek is soortgelyk aan ʼn gewone kolomgrafiek, hoewel die frekwensies van ʼn spesifieke kategorie verdeel word volgens die proporsie van ʼn tweede veranderlike. Kyk na die voorbeeld in Figuur 1.8.
Figuur 1.8: ʼn Stapel-kolomgrafiek
Bladsy 34 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes v Meervoudige kolomgrafiek (multiple bar chart) Hierdie grafiek is soortgelyk aan die stapel-kolomgrafiek, maar die waardes vir beide kategorieë word langs mekaar vertoon (in plaas van binne-in dieselfde kolom). Figuur 1.9 verskaf ʼn voorbeeld:
Figuur 1.9: ʼn Meervoudige kolomgrafiek Sien ook Voorbeeld 2.2 in die handboek op bladsy 32-34. 1.7.2
Grafiese voorstelling van numeriese data: een veranderlike
Bestudeer die handboek paragraaf 2.3. Paragraaf 1.7.1 hierbo het kategoriese data bespreek. Kategoriese data is gewoonlik kwalitatiewe data wat gekwantifiseer word deur dit in kategorieë te plaas. Hierdie paragraaf bespreek nou numeriese data (ordinaal, interval- en ratio) en die wyses waarop dit grafies voorgestel kan word. Hierdie grafiese voorstelling behels grafieke en tabelle. v Een numeriese veranderlike Vir die doel van hierdie paragraaf sal die volgende voorbeeld gebruik word: Die volgende inligting word van Maatskappy X verkry: •
Die ouderdom van 1 000 van hul werknemers uit ʼn ewekansige steekproef.
•
Die hoogste ouderdom is 67 en die jongste is 18.
v Numeriese frekwensieverdeling Hierdie verdeling deel alle data in intervalle op. Dan word bepaal hoeveel van alle waardes in elke interval aangetref word. Hierdie is dus ʼn poging om iets soos ratio data na
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 35
GQM105 Inleiding tot elementêre kwantitatiewe metodes kategoriese data om te skakel. Waarom sal ʼn mens dit wil doen? In hierdie geval is die doel bloot om data beter te vertoon. Om hierdie verdeling te bepaal moet die volgende eers verkry word: •
Reikwydte (range): (hoogste waarde)-(laagste waarde) (dus 67-18 = 49).
•
Intervalwydte. Eerstens, moet op die hoeveelheid intervalle besluit word. Daarna moet die grootte van elke interval bepaal word. Gestel dus ons wil 5 intervalle hê. Die berekening is dan soos volg:
•
o
Reikwydte/hoeveelheid intervalle
o
= 49/5
o
= 9.8 ≈ 10
o
Elke interval sal dus 10 jaar groot wees
Verdeel nou alle data (die 1 000 ouderdomme) in hierdie groepe op. Dit is belangrik dat ʼn enkele respondent se ouderdom slegs in een kategorie ingedeel word. Tabel 1.5 stel hierdie verdeling grafies voor: Interval (10 jaar)
Frekwensies (Hoeveel respondente val in die kategorie?)
18-27
400
28-37
290
38-47
190
48-57
90
58-69
30
Totaal
1 000
Tabel 1.5: Numeriese frekwensieverdeling v Histogram ʼn Histogram is ʼn grafiese voorstelling van bogenoemde numeriese frekwensieverdeling en lyk soos ʼn kolomgrafiek. Figuur 1.10 stel ʼn histogram vir bogenoemde data voor.
Bladsy 36 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Figuur 1.10: ʼn Histogram Interpretasie: Uit hierdie histogram is dit duidelik dat Maatskappy X se menslike hulpbronne uit jonger personeel bestaan. Hoe hoër die ouderdom is, hoe minder personeel val in daardie kategorie. (Hierdie gevolgtrekking kan natuurlik slegs gemaak word indien die 1 000 personeel wat ondersoek is, verteenwoordigend is van die totale personeelkorps van Maatskappy X.) v Kumulatiewe frekwensieverdeling Die kumulatiewe frekwensieverdeling is ʼn tabel wat presies dieselfde is as die gewone numeriese frekwensieverdeling. ʼn Bykomende kolom word egter bygesit om die totale frekwensies vir ʼn kategorie, plus die frekwensies van alle kategorieë wat sodanige kategorie voorafgaan, te vertoon. Kyk na Tabel 1.6 hieronder vir meer duidelikheid (die laaste kolom met beskrywings is nie deel van hierdie tabel nie – dit is slegs in hierdie figuur ingevoeg ter verduideliking): Interval (10 jaar)
Frekwensies (Hoeveel respondente val in die kategorie?)
Kumulatiewe frekwensie
(Notas ter verduideliking)
18-27
400
400
28-37
290
690
400+290
38-47
190
880
400+290+190
48-57
90
970
400+290+190+90
58-69
30
1 000
400+290+190+90+30
Totaal
1 000 Tabel 1.6: Kumulatiewe frekwensieverdeling
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 37
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Die laaste kumulatiewe frekwensie sal altyd đ?’? wees. Met ander woorde, dit sal altyd dieselfde wees as al die frekwensies saamgevoeg. (Onthou, đ?’? stel die grootte van die steekproef voor, met ander woorde, die hoeveelheid mense van Maatskappy X wat ons vraag beantwoord het.) v Kumulatiewe frekwensieveelhoek ʼn Kumulatiewe frekwensieveelhoek (ogive) is die grafiese voorstelling van ʼn kumulatiewe frekwensietabel. Dit is ʼn lyngrafiek. Figuur 1.11 stel hierdie veelhoek vir bogenoemde data voor:
Figuur 1.11: ʼn Kumulatiewe frekwensieveelhoek om kumulatiewe frekwensies grafies voor te stel Verwys ook na Voorbeeld 2.3 (bladsy 36-37), 2.4 (bladsy 37-38) en 2.5 (bladsy 39-42) in die handboek vir meer inligting. v Houer-en-punt-stippingsgrafiek (Box plot) Die houer-en-stippingsgrafiek word in Hoofstuk 3 in die handboek in meer detail behandel. Hierdie grafiek vertoon die minimum- en maksimumwaardes, asook ʼn verskeidenheid waardes wat tussen die minimum en maksimum voorkom. Voorbeelde sluit in die mediaan, gemiddelde en kwartiele (sal later behandel word). 1.7.3
Grafiese voorstelling van numeriese data: twee veranderlikes
Bestudeer die handboek paragraaf 2.3 (vervolg). Vir gevalle waar twee veranderlikes gemeet word, sal die volgende voorbeeld gebruik word:
Bladsy 38 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes Maatskappy A wil ʼn ouderdomsprofiel van hul kliënte opstel. Hulle wil sien wat die ouderdomme van hul kliënte is (veranderlike 1), maar ook hoeveel geld hul kliënte per besoek aan die winkel spandeer (veranderlike 2). Beide hierdie data is ratio data. v Spreidingstipping (Scatter plot) Hierdie grafiek plaas elke respondent se antwoord op beide vrae as ʼn enkele kolletjie op ʼn grafiek. Gestel Maatskappy A het die twee vrae (1. Hou oud is jy? en 2. Hoeveel geld spandeer jy op ʼn keer by die winkel?) vir vyftien respondente gevra. Die antwoorde word in die tabel hieronder opgesom:
Respondentnommer
Ouderdom
Hoeveel geld spandeer
1
18
350
2
70
150
3
24
500
4
29
1 500
5
27
1 000
6
34
1 700
7
43
2 500
8
40
2 000
9
19
400
10
21
450
11
65
130
12
60
170
13
20
410
14
70
50
15
38
3 000
Tabel 1.7: Maatskappy A se datastel Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 39
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Figuur 1.12: ʼn Puntediagram Let daarop dat die hoogste waardes tussen ongeveer 35 en 45 gevind word. v Tendensgrafiek (Trendline) Hierdie grafiek stel tipies verandering oor tyd voor. Die horisontale as stel tyd voor en die vertikale as stel ʼn tweede veranderlike voor. Figuur 1.13 stel die verkope van produkte by Maatskappy A oor ʼn tydperk van 12 maande voor.
Bladsy 40 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 1.13: ʼn Lyngrafiek wat ʼn tendens voorstel 1.7.4
Selfevalueringsvrae
Daar is 24 vrae aan die einde van Hoofstuk 2. Voltooi al hierdie vrae. ʼn Groot hoeveelheid van hierdie vrae moet in Microsoft Excel gedoen word. Die CD met hierdie data word in die agterkant van die handboek verskaf. 1.8
Numeriese beskrywende statistiek
Bestudeer die handboek paragrawe 3.1-3.6, 3.8-3.9. Hoewel grafieke en tabelle ʼn goeie oorsig oor data kan gee, kan statistiese waardes meer spesifieke beskrywings verskaf. Hierdie statistieke fokus veral op die lokaliteit, spreiding en vorm van data. Daar word na ʼn aantal statistieke in elk van hierdie drie kategorieÍ gekyk. 1.8.1
Maatstawwe van lokaliteit
Bestudeer die handboek paragraaf 3.2. Maatstawwe van lokaliteit (measures of central tendency) verskaf ʼn aanduiding van watter waarde in die middel van al die waardes van die datastel is. Die bekendste voorbeeld van ʼn maatstaf van lokaliteit is wat in die algemene taal bekend staan as die “gemiddeldâ€?. In Statistiek word daar verwys na die rekenkundige gemiddeld. v Rekenkundige gemiddeld Hierdie statistiek, vir die steekproef voorgestel deur đ?’™, word bepaal deur al die numeriese waardes bymekaar te tel, en dan te deel deur die hoeveelheid waardes.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 41
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ?’™= Waar:
đ?’…đ?’Šđ?’† đ?’”đ?’?đ?’Ž đ?’—đ?’‚đ?’? đ?’‚đ?’? đ?’…đ?’Šđ?’† đ?’?đ?’ƒđ?’”đ?’†đ?’“đ?’—đ?’‚đ?’”đ?’Šđ?’†đ?’” đ?’™đ?’Š = đ?’…đ?’Šđ?’† đ?’‚đ?’‚đ?’?đ?’•đ?’‚đ?’? đ?’?đ?’ƒđ?’”đ?’†đ?’“đ?’—đ?’‚đ?’”đ?’Šđ?’†đ?’” đ?’?
đ?‘Ľ
= die steekproef se rekenkundige gemiddeld
đ?‘›
= die aantal observasies in die steekproef (steekproefgrootte)
đ?‘ĽO
= die waarde van die đ?‘– ste waarde van die stogastiese veranderlike đ?‘Ľ đ?‘ĽO
= die som van al waardes, met ander woorde đ?‘Ľ( + đ?‘Ľ* + đ?‘Ľ+ + â‹Ż + đ?‘Ľ-
MS Excel-formule:
=AVERAGE(datareeks) Formule 1.1: Rekenkundige gemiddeld
Voorbeeld 1.3 Die ouderdomme van tien werknemers by Maatskappy X is: 18, 20, 32, 26, 70, 55, 34, 43, 53, 31 Die gemiddelde ouderdom is: đ?’™đ?’Š đ?’?
=
đ?&#x;?đ?&#x;– U đ?&#x;?đ?&#x;Ž U đ?&#x;‘đ?&#x;? U đ?&#x;?đ?&#x;” U đ?&#x;•đ?&#x;Ž U đ?&#x;“đ?&#x;“ U đ?&#x;‘đ?&#x;’ U đ?&#x;’đ?&#x;‘ U đ?&#x;“đ?&#x;‘ U đ?&#x;‘đ?&#x;?
=
đ?&#x;‘đ?&#x;–đ?&#x;?
đ?&#x;?đ?&#x;Ž
đ?&#x;?đ?&#x;Ž
= đ?&#x;‘đ?&#x;–, đ?&#x;? jaar Doen Voorbeeld 3.1 in die handboek om te verseker dat jy die rekenkundige gemiddeld verstaan. v Mediaan Die tweede maatstaf van lokaliteit is die mediaan. Om die mediaan te kry moet alle waardes van kleinste na grootste sorteer word. Die getal wat presies in die middel is, word die mediaan genoem. As daar twee getalle in die middel is, word die rekenkundige gemiddeld van die twee getalle in die middel bereken om die mediaan te verkry. Daar is nie ʼn formule in die handboek vir die mediaan nie.
MS Excel-formule:
=MEDIAN(datareeks)
Formule 1.2: MS Excel-formule om die mediaan te vind
Bladsy 42 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 1.4 Die ouderdomme van elf werknemers by Maatskappy A is: 18, 20, 32, 26, 70, 55, 34, 43, 53, 31, 22 Bereken die mediaan: Stap 1: Sorteer die waardes van klein na groot: 18 20 22 26 31 32 34 43 53 55 70 Stap 2: Vind die waarde in die middel 18 20 22 26 31 32 34 43 53 55 70 Die mediaan is dus 32.
Voorbeeld 1.5 Die ouderdomme van tien werknemers by Maatskappy A is: 18, 20, 32, 26, 70, 55, 34, 43, 53, 31 Bereken die mediaan: Stap 1: Sorteer die waardes van klein na groot 18 20 26 31 32 34 43 53 55 70 Stap 2: Vind die middelste waarde Omdat daar tien waardes is, is daar nie ʼn enkele middelste waarde nie. Die middelste waardes is 32 en 34. Die rekenkundige gemiddeld moet dus van hierdie twee waardes bereken word: Mediaan
=
đ?&#x;‘đ?&#x;?Uđ?&#x;‘đ?&#x;’ đ?&#x;?
= đ?&#x;‘đ?&#x;‘ Doen nou Voorbeeld 3.2 (a) en (b) in die handboek.
v Mediaan vir kategorieÍ of gegroepeerde waardes ʼn Mediaan kan ook vir kategorieÍ bereken word.
đ?‘´đ?’† = đ?‘śđ?’Žđ?’† +
đ?’„
đ?’? đ?&#x;?
â&#x2C6;&#x2019;đ?&#x2019;&#x2021; < đ?&#x2019;&#x2021;đ?&#x2019;&#x17D;đ?&#x2019;&#x2020;
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 43
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Waar:
đ?&#x2018;&#x201A;de = die laagste waarde van die interval waarin die mediaan lĂŞ đ?&#x2018;?
= die intervalbreedte
đ?&#x2018;&#x203A;
= steekproefgrootte (aantal observasies)
đ?&#x2018;&#x201C;de
= die aantal observasies wat binne-in die interval van die mediaan lĂŞ
đ?&#x2018;&#x201C;(<) = die kumulatiewe frekwensie van al die observasies voor die mediaan se interval Formule 1.3: Mediaan vir kategorieĂŤ
Voorbeeld 1.6 Interval
Frekwensies
(10 jaar)
Kumulatiewe frekwensie
18-27
400
400
28-37
290
690
38-47
190
880
48-57
90
970
58-69
30
1 000
Totaal
1 000 Tabel 1.8: Datastel
Bereken die mediaan vir bogenoemde waardes. In hierdie geval is dit moeiliker omdat dit baie tyd sal neem om Ĺ&#x2030; duisend waardes van klein na groot te rangskik. Om die mediaan te vind moet die volgende stappe gevolg word: Stap 1: Vind die posisie van die mediaan. Soos reeds gesĂŞ, is die mediaan presies in die middel van alle waardes, indien die waardes gesorteer is. Dus is die mediaan by posisie 1 000 = 500 2 Die posisie van die mediaan is dus 500. Stap 2: Deur na die kumulatiewe frekwensie-kolom te kyk, bepaal in watter kategorie die 500ste waarde sal voorkom. Die eerste kategorie eindig by die 400ste waarde; die tweede kategorie eindig by die 690ste waarde. Die 500ste waarde sal dus ĂŞrens in die tweede
Bladsy 44 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes kategorie (28-37) voorkom. Stap 3: Bepaal die plek van die mediaan. Dus is: đ?&#x2018;&#x20AC;e
= 28 +
(8 l88m:88 *n8
= 31,44 Doen nou Voorbeeld 3.3 in die handboek. v Modus Ĺ&#x2030; Derde maatstaf van lokaliteit is die modus. Die modus is die enkele waarde wat die meeste kere voorkom.
MS Excel-formule:
=MODE.SNGL(datareeks)
Formule 1.4: MS Excel-formule om die modus te vind Hierdie maatstaf is veral nuttig vir kategoriese data. Vir kategoriese data kan die modus bereken word deur eenvoudig die frekwensies van elke kategorie met mekaar te vergelyk. Voorbeeld 1.7 Restaurant
Frekwensie
Spur
370
Dros
250
Bessie se kombuis
380 1 000
Tabel 1.9: Datastel Kry die modus. Deur bloot na die bogenoemde tabel te kyk, is dit duidelik dat Bessie se kombuis die gewildste is. Dus is die modus â&#x20AC;&#x153;Bessie se kombuisâ&#x20AC;?. In hierdie geval is die modus nie Ĺ&#x2030; getal nie, maar Ĺ&#x2030; kategorie. Met ratio data kan dit egter gebeur dat daar uit Ĺ&#x2030; 1 000 waardes nie een waarde is wat twee maal herhaal word nie. Dink byvoorbeeld aan die pryse van kruideniersware. In so Ĺ&#x2030; geval sal Ĺ&#x2030; modus niksseggend wees. (As die bedrag van R25,88 drie keer genoem is, maar die
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 45
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes bedrae R70,55; R70,56; R70,10; R70,80 en R70,00 ook voorkom, is die modus van R25.88 dan werklik akkuraat?) Vir hierdie doel word die modus geskat deur al die data in intervalle in te deel. Daarna word die interval met die voorafgaande en opeenvolgende interval vergelyk om Ĺ&#x2030; modus te bepaal. Om die modus te bereken gebruik ons die volgende formule:
đ?&#x2018;´đ?&#x2019;? = đ?&#x2018;śđ?&#x2019;&#x17D;đ?&#x2019;? + Waar:
đ?&#x2019;&#x201E; đ?&#x2019;&#x2021;đ?&#x2019;&#x17D; â&#x2C6;&#x2019; đ?&#x2019;&#x2021;đ?&#x2019;&#x17D;mđ?&#x;? đ?&#x;?đ?&#x2019;&#x2021;đ?&#x2019;&#x17D; â&#x2C6;&#x2019; đ?&#x2019;&#x2021;đ?&#x2019;&#x17D;mđ?&#x;? â&#x2C6;&#x2019; đ?&#x2019;&#x2021;đ?&#x2019;&#x17D;Uđ?&#x;?
đ?&#x2018;&#x201A;do
= die laagste waarde van die modale interval
đ?&#x2018;?
= die wydte van die modale interval
đ?&#x2018;&#x201C;d
= die frekwensie van die modale interval
đ?&#x2018;&#x201C;dm( = die frekwensie van die interval voor die modale interval đ?&#x2018;&#x201C;dU( = die frekwensie van die interval na die modale interval Formule 1.5: Modus vir kategorieĂŤ
Voorbeeld 1.8 Nota: Hierdie tabel is effens aangepas vir hierdie oefening en is dus nie dieselfde as die tabel wat vir vorige voorbeelde gebruik is nie. Interval
Frekwensies
(10 jaar)
Kumulatiewe frekwensie
18-27
290
290
28-37
400
690
38-47
190
880
48-57
90
970
58-69
30
1 000
Totaal
1 000 Tabel 1.10: Datastel
Bereken die modus. In hierdie geval is die doelwit om te bepaal watter ouderdom die meeste voorkom. Die interval met die meeste frekwensies is 28-37 (met 400 van alle respondente wat in hierdie
Bladsy 46 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes kategorie val). Hierdie is dus die modale interval. Die waardes in die formule kan soos volg vervang word: đ?&#x2018;śđ?&#x2019;&#x17D;đ?&#x2019;?
= đ?&#x;?đ?&#x;&#x2013; jaar
đ?&#x2019;&#x201E;
= đ?&#x;?đ?&#x;&#x17D; jaar
đ?&#x2019;&#x2021;đ?&#x2019;&#x17D;
= đ?&#x;&#x2019;đ?&#x;&#x17D;đ?&#x;&#x17D; respondente
đ?&#x2019;&#x2021;đ?&#x2019;&#x17D;mđ?&#x;?
= đ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x17D; respondente (dit sou nul gewees het indien die modale interval ook die eerste interval was)
đ?&#x2019;&#x2021;đ?&#x2019;&#x17D;Uđ?&#x;?
= đ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x17D; respondente (dit sou nul gewees het indien die modale interval die laaste interval was)
đ?&#x2018;´đ?&#x2019;?
đ?&#x;?đ?&#x;&#x17D; đ?&#x;&#x2019;đ?&#x;&#x17D;đ?&#x;&#x17D;mđ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x17D;
= đ?&#x;?đ?&#x;&#x2013; +
đ?&#x;? đ?&#x;&#x2019;đ?&#x;&#x17D;đ?&#x;&#x17D; mđ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x17D;mđ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x17D; đ?&#x;? đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x17D;
= đ?&#x;?đ?&#x;&#x2013; +
đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x17D;
= đ?&#x;?đ?&#x;&#x2013; + đ?&#x;&#x2018;, đ?&#x;&#x2019;đ?&#x;&#x2019;
= đ?&#x;&#x2018;đ?&#x;?, đ?&#x;&#x2019;đ?&#x;&#x2019; Dus is die modus 31,44 wat beteken dat die meeste respondente se ouderdom benader kan word na 31,44. Hoe toets ek of my antwoord korrek is? Wat ook al die modus is, dit moet steeds in die modale interval wees. As die modus wat bereken is dus minder as 28 of meer as 37 was, was die antwoord verkeerd. Doen nou Voorbeeld 3.4 in die handboek. v Meetkundige gemiddeld Die meetkundige gemiddeld word gebruik om die gemiddelde persentasie verandering in data te bepaal.
đ?&#x2018;Žđ?&#x2018;´ = Waar:
đ?&#x2019;?
đ?&#x2019;&#x2122;đ?&#x;? đ?&#x2019;&#x2122;đ?&#x;? đ?&#x2019;&#x2122;đ?&#x;&#x2018; â&#x20AC;Ś đ?&#x2019;&#x2122;đ?&#x2019;?
đ??şđ?&#x2018;&#x20AC;
= die meetkundige gemiddeld is
đ?&#x2018;&#x203A;
= steekproefgrootte (aantal observasies wat ingesluit is by die steekproef)
đ?&#x2018;Ľ-
= die đ?&#x2018;&#x203A;ste observasie van die stogastiese veranderlike đ?&#x2018;Ľ
MS Excel-formule:
=GEOMEAN(datareeks) Formule 1.6: Meetkundige gemiddeld
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 47
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 1.9 Die prys van motors by Ĺ&#x2030; spesifieke handelaar het vir die laaste vyf jaar jaarliks gestyg. Die tabel hieronder stel die persentasieverhogings per jaar voor. Jaar
Persentasie
2013
5%
2012
4%
2011
8%
2010
3%
2009
2%
2008
1%
Tabel 1.11: Datastel Bereken die meetkundige gemiddeld van die persentasieverhogings. Die formule is reeds in die handboek gegee en die waardes kan soos volg uiteengesit word: đ?&#x2019;? = đ?&#x;&#x201D; jaar đ?&#x2019;&#x2122;đ?&#x;? = đ?&#x;&#x201C;%, đ?&#x2019;&#x2122;đ?&#x;? = đ?&#x;&#x2019;%, đ?&#x2019;&#x2122;đ?&#x;&#x2018; = đ?&#x;&#x2013;%, đ?&#x2019;&#x2122;đ?&#x;&#x2019; = đ?&#x;&#x2018;%, đ?&#x2019;&#x2122;đ?&#x;&#x201C; = đ?&#x;?% en đ?&#x2019;&#x2122;đ?&#x;&#x201D; = đ?&#x;?%. Vir die doel van hierdie formule word die persentasie egter anders uitgedruk. Ĺ&#x2030; 5% verhoging is eintlik 1,05 keer die vorige jaar se bedrag. Dus word 5% as 1,05 uitgedruk. Dus is: đ?&#x2018;Žđ?&#x2018;´
=
đ?&#x;&#x201D;
đ?&#x;?, đ?&#x;&#x17D;đ?&#x;&#x201C;Ă&#x2014;đ?&#x;?, đ?&#x;&#x17D;đ?&#x;&#x2019;Ă&#x2014;đ?&#x;?, đ?&#x;&#x17D;đ?&#x;&#x2013;Ă&#x2014;đ?&#x;?, đ?&#x;&#x17D;đ?&#x;&#x2018;Ă&#x2014;đ?&#x;?, đ?&#x;&#x17D;đ?&#x;?Ă&#x2014;đ?&#x;?, đ?&#x;&#x17D;đ?&#x;? =
đ?&#x;&#x201D;
đ?&#x;&#x2014;đ?&#x;&#x201D;đ?&#x;&#x17D;
= đ?&#x;?, đ?&#x;&#x17D;đ?&#x;&#x2018;đ?&#x;&#x2019; â&#x2030;&#x2C6; đ?&#x;&#x2018;, đ?&#x;&#x2019;% Waarom kan ons nie die rekenkundige gemiddeld gebruik nie? Persentasieverhogings behels Ĺ&#x2030; faktor waarmee Ĺ&#x2030; bedrag (of ander waarde) vermenigvuldig moet word; in die voorbeeld hierbo was dit 1,05 in die eerste jaar. Ons wil dus Ĺ&#x2030; gemiddelde faktor bereken waarmee Ĺ&#x2030; bedrag jaarliks vermenigvuldig moet word om dieselfde verhoging oor die ses-jaar-periode te verkry. Om hierdie rede is die meetkundige gemiddeld meer akkuraat om gemiddelde persentasieverhogings te bepaal. Die rekenkundige gemiddeld sal egter nuttig wees om die gemiddelde randwaarde van die rente/opbrengs te bepaal.
Bladsy 48 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Hierdie stelling kan met die volgende voorbeeld gedemonstreer word: Ĺ&#x2030; Bedrag van R100 word belĂŞ: â&#x20AC;˘
Jaar 1 verdien die bedrag 10% rente. Dus is die rente R10 en die bedrag is R110.
â&#x20AC;˘
Jaar 2 verdien die bedrag (nou R110) 5% rente. Dus is die rente R5,50 en die bedrag is R115,50
â&#x20AC;˘
Jaar 3 verdien die bedrag (nou R115,50) 3% rente. Dus is die rente R3,47 en die bedrag is R118,97.
Die meetkundige gemiddeld van die persentasieverhogings van die bedrag is 1,06 (dus 6%). Die rekenkundige gemiddeld van die rente is
(8ml,lU+,:v +
= đ?&#x2018;&#x2026;6,32.
Dus is die gemiddelde jaarlikse styging 6% (R100 x 1,06) en die gemiddelde jaarlikse rente (in randwaarde) is R6,32. (Nota: In hierdie geval is dit toevallig dat die meetkundige gemiddeld en rekenkundige gemiddeld vir die data dieselfde is. Dit is egter Ĺ&#x2030; uitsondering. Die meetkundige gemiddeld is altyd groter of dieselfde as die rekenkundige gemiddeld) Doen nou Voorbeeld 3.5 in die handboek. v Geweegde rekenkundige gemiddeld Ĺ&#x2030; Rekenkundige gemiddeld neem aan dat al die datawaardes dieselfde gewig dra (met ander woorde die gewig van
( -
in Ĺ&#x2030; steekproef met đ?&#x2018;&#x203A; observasies. Maar dit is egter nie altyd
die geval nie. Daar is gevalle waar sekere datawaardes swaarder of ligter is as ander en dit moet ook so in berekening gebring word. Die stappe om dit te doen is: 1. Elke observasie (đ?&#x2018;ĽO ) word gemaal met die frekwensie (đ?&#x2018;&#x201C;O ) wat daarmee verband hou. 2. Hierdie geweegde observasies word dan bymekaargetel. 3. Die totaal word dan gedeel deur die somtotaal van die gewigte. Die formule wat ons hiervoor gebruik is:
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 49
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ?&#x2018;Žđ?&#x2019;&#x2020;đ?&#x2019;&#x2DC;đ?&#x2019;&#x2020;đ?&#x2019;&#x2020;đ?&#x2019;&#x2C6;đ?&#x2019;&#x2026;đ?&#x2019;&#x2020; đ?&#x2019;&#x2122; = Waar:
đ?&#x2019;&#x2021;đ?&#x2019;&#x160; đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x2021;đ?&#x2019;&#x160;
đ?&#x2018;Ľ
= die geweegde gemiddeld
đ?&#x2018;&#x201C;O
= die frekwensie vir die đ?&#x2018;&#x2013; ste observasie
đ?&#x2018;ĽO
= die đ?&#x2018;&#x2013; ste observasie van die stogastiese veranderlike đ?&#x2018;Ľ Formule 1.7: Geweegde rekenkundige gemiddeld
Voorbeeld 1.10 Ĺ&#x2030; Restaurant-eienaar wil graag weet wat die gemiddelde koste per kilogram meel is. Hy het 80kg meel in die vorige maand gekoop. Die meel is by verskillende verskaffers gekoop. Die strokies dui op die volgende aankope: Koste per kilogram
Kilogram
Week 1
R9,50
10
Week 2
R10,00
4
Week 3
R9,80
6
Week 4
R7,40
60
Totaal
R36,70
80kg
Tabel 1.12: Datastel Wat is gemiddelde koste per kilogram? As die rekenkundige gemiddeld gebruik sou word, sou dit maklik wees om die vier weke se koste per kilogram bymekaar te tel en deur 4 te deel. Die antwoord sal egter nie so akkuraat wees nie. Week 4 se bedrag behoort meer gewig te dra, omdat die eienaar meer meel teen daardie prys gekoop het. In Ĺ&#x2030; geval waar al die waardes nie dieselfde gewig dra nie, word die geweegde rekenkundige gemiddeld gebruik. Elke waarde word met sy gewig vermenigvuldig, bymekaargetel en dan deur die som van die gewigte (in hierdie geval die totale kilogram) gedeel. Vir Ĺ&#x2030; beter illustrasie sal die rekenkundige gemiddeld en geweegde rekenkundige gemiddeld met mekaar vergelyk word: Rekenkundige gemiddeld: đ?&#x2019;&#x2122;
=
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;?
Bladsy 50 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
=
đ?&#x;&#x2014;,đ?&#x;&#x201C;Uđ?&#x;?đ?&#x;&#x17D;Uđ?&#x;&#x2014;,đ?&#x;&#x2013;Uđ?&#x;&#x2022;,đ?&#x;&#x2019; đ?&#x;&#x2019;
= đ?&#x2018;šđ?&#x;&#x2014;, đ?&#x;?đ?&#x;&#x2013; per kilogram Volgens die rekenkundige gemiddeld het die eienaar gemiddeld R9,18 per kilogram meel betaal. Geweegde rekenkundige gemiddeld: đ?&#x2018;Žđ?&#x2019;&#x2020;đ?&#x2019;&#x2DC;đ?&#x2019;&#x2020;đ?&#x2019;&#x2020;đ?&#x2019;&#x2C6;đ?&#x2019;&#x2026;đ?&#x2019;&#x2020; đ?&#x2019;&#x2122; = =
đ?&#x2019;&#x2021;đ?&#x2019;&#x160; đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x2021;đ?&#x2019;&#x160;
đ?&#x;&#x2014;,đ?&#x;&#x201C;Ă&#x2014;đ?&#x;?đ?&#x;&#x17D;Uđ?&#x;?đ?&#x;&#x17D;Ă&#x2014;đ?&#x;&#x2019;Uđ?&#x;&#x2014;,đ?&#x;&#x2013;Ă&#x2014;đ?&#x;&#x201D;Uđ?&#x;&#x2022;,đ?&#x;&#x2019;Ă&#x2014;đ?&#x;&#x201D;đ?&#x;&#x17D; đ?&#x;&#x2013;đ?&#x;&#x17D;
= đ?&#x2018;šđ?&#x;&#x2022;, đ?&#x;&#x2014;đ?&#x;&#x2022; per kilogram Omdat die hoeveelheid kilogram wat teen elke prys aangekoop is, ook nou in ag geneem is, verskil die gemiddelde koste per kilogram drasties. In werklikheid het die eienaar dus gemiddeld R7,97 per kilogram betaal. Doen nou Voorbeeld 3.6 in die handboek. 1.8.2
Nie-sentrale maatstawwe van lokaliteit
Bestudeer die handboek paragraaf 3.3. Die vorige maatstawwe van lokaliteit was gemoeid met een of ander â&#x20AC;&#x153;middelpuntâ&#x20AC;? of sentrale punt. Daar is egter maatstawwe van lokaliteit wat nie met die middelpunt van data te make het nie. Hierdie maatstawwe is kwartiele en persentiele. v Kwartiele Kwartiele is maatstawwe wat geordende data in vier ewe groot dele (kwarte) deel. Die statistikus moet die spesifieke waardes bepaal wat sorg dat daar ewe veel waardes in elke kwartiel is. Daar kan tussen die volgende kwartiele onderskei word: â&#x20AC;˘
đ?&#x2018;¸đ?&#x;? : Hierdie is die spesifieke waarde wat skeiding maak tussen die laagste 25% van alle waarnemings/observasies en die oorblywende 75%.
â&#x20AC;˘
đ?&#x2018;¸đ?&#x;? : Hierdie is die waarde wat presies in die middel van die waardes voorkom en dus die data presies in die helfte deel. (Dit is dus die mediaan van die data.)
â&#x20AC;˘
đ?&#x2018;¸đ?&#x;&#x2018; : Hierdie is die waarde wat die boonste 25% van alle waarnemings skei van die oorblywende 75%.
Om Ĺ&#x2030; kwartiel te bepaal is eintlik eenvoudig. Die stappe is soos volg: 1. Sorteer die waardes van klein na groot. 2. Bepaal hoeveel waarnemings/observasies (getalle) in die datastel voorkom. Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 51
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 3. Tel 1 by hierdie getal en deel dit deur 4. 4. Die antwoord is die posisie van đ?&#x2018;&#x201E;( (afgerond na die naaste heelgetal).
-U( :
Waar:
đ?&#x2018;&#x203A;
OF 0,25 đ?&#x2018;&#x203A; + 1
= die aantal observasies in die datastel Formule 1.8: Posisie van die eerste kwartiel -U( *
Waar:
đ?&#x2018;&#x203A;
OF 0,5 đ?&#x2018;&#x203A; + 1
= die aantal observasies in die datastel Formule 1.9: Posisie van die tweede kwartiel (mediaan) +(-U() :
Waar:
đ?&#x2018;&#x203A;
OF 0,75 đ?&#x2018;&#x203A; + 1
= die aantal observasies in die datastel Formule 1.10: Posisie van die derde kwartiel
As hierdie posisie gevind is (en afgerond is tot die naaste heelgetal), kan die spesifieke waarde wat by elke kwartiel voorkom, bloot afgelees word. Soms wil Ĺ&#x2030; mens egter Ĺ&#x2030; meer akkurate kwartiel bereken. Om dit te doen gebruik ons Formule 1.9 hieronder.
đ??žđ?&#x2018;¤đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;Ąđ?&#x2018;&#x2013;đ?&#x2018;&#x2019;đ?&#x2018;&#x2122;đ?&#x2018;¤đ?&#x2018;&#x17D;đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;&#x2018;đ?&#x2018;&#x2019; = đ?&#x2018;?đ?&#x2018;&#x2019;đ?&#x2018;&#x203A;đ?&#x2018;&#x17D;đ?&#x2018;&#x2018;đ?&#x2018;&#x2019;đ?&#x2018;&#x;đ?&#x2018;&#x2018;đ?&#x2018;&#x2019; đ?&#x2018;&#x2DC;đ?&#x2018;¤đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;Ąđ?&#x2018;&#x2013;đ?&#x2018;&#x2019;đ?&#x2018;&#x2122;đ?&#x2018;¤đ?&#x2018;&#x17D;đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;&#x2018;đ?&#x2018;&#x2019; + đ?&#x2018;?đ?&#x2018;&#x;đ?&#x2018;&#x2019;đ?&#x2018;˘đ?&#x2018;&#x2DC;đ?&#x2018;&#x2018;đ?&#x2018;&#x2019;đ?&#x2018;&#x2019;đ?&#x2018;&#x2122; đ?&#x2018;Łđ?&#x2018;&#x17D;đ?&#x2018;&#x203A; đ?&#x2018;&#x2018;đ?&#x2018;&#x2013;đ?&#x2018;&#x2019; đ?&#x2018;&#x2DC;đ?&#x2018;¤đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;Ąđ?&#x2018;&#x2013;đ?&#x2018;&#x2019;đ?&#x2018;&#x2122; đ?&#x2018; đ?&#x2018;&#x2019; đ?&#x2018;?đ?&#x2018;&#x153;đ?&#x2018; đ?&#x2018;&#x2013;đ?&#x2018; đ?&#x2018;&#x2013;đ?&#x2018;&#x2019; Ă&#x2014; đ?&#x2018;&#x2018;đ?&#x2018;&#x17D;đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;&#x153;đ?&#x2018;? đ?&#x2018;Łđ?&#x2018;&#x153;đ?&#x2018;&#x2122;đ?&#x2018;&#x201D;đ?&#x2018;&#x2019;đ?&#x2018;&#x203A;đ?&#x2018;&#x2018;đ?&#x2018;&#x2019; đ?&#x2018;&#x2DC;đ?&#x2018;¤đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;Ąđ?&#x2018;&#x2013;đ?&#x2018;&#x2019;đ?&#x2018;&#x2122; đ?&#x2018; đ?&#x2018;&#x2019; đ?&#x2018;?đ?&#x2018;&#x153;đ?&#x2018; đ?&#x2018;&#x2013;đ?&#x2018; đ?&#x2018;&#x2013;đ?&#x2018;&#x2019; â&#x2C6;&#x2019; đ?&#x2018;&#x2018;đ?&#x2018;&#x2013;đ?&#x2018;&#x2019; đ?&#x2018;?đ?&#x2018;&#x2019;đ?&#x2018;&#x203A;đ?&#x2018;&#x17D;đ?&#x2018;&#x2018;đ?&#x2018;&#x2019;đ?&#x2018;&#x;đ?&#x2018;&#x2018;đ?&#x2018;&#x2019; đ?&#x2018;&#x2DC;đ?&#x2018;¤đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;Ąđ?&#x2018;&#x2013;đ?&#x2018;&#x2019;đ?&#x2018;&#x2122;đ?&#x2018;¤đ?&#x2018;&#x17D;đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;&#x2018;đ?&#x2018;&#x2019; Formule 1.11: Berekening van die kwartielwaarde Voorbeeld 1.11 Beskou die volgende data. Die onderste ry verteenwoordig die waardes van die data. Die boonste ry dui die plekke van die data aan. 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
10
30
34
39
40
45
50
67
70
78
79
80
90
92
95
96
97
98
99
99
Bladsy 52 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Die eerste kwartiel se posisie is by: đ?&#x2019;? + đ?&#x;? đ?&#x;?đ?&#x;&#x17D; + đ?&#x;? đ?&#x;?đ?&#x;? = = = đ?&#x;&#x201C;, đ?&#x;?đ?&#x;&#x201C; đ?&#x;&#x2019; đ?&#x;&#x2019; đ?&#x;&#x2019; As die antwoord afgerond word na die kleiner diskrete waarde (heelgetal), is die posisie 5. Die waarde wat by posisie 5 voorkom, is 40. Hierdie is dus Ĺ&#x2030; benaderde waarde van die eerste kwartiel. Om Ĺ&#x2030; meer akkurate waarde te bepaal, kan Formule 1.9 gebruik word met die volgende waardes: â&#x20AC;˘
Benaderde kwartielwaarde (hierbo bereken) = 40
â&#x20AC;˘
Breukdeel van kwartielposisie (dus breukdeel van 5,25) = 0,25
â&#x20AC;˘
Waarde na kwartielposisie = waarde by posisie 6 = 45 đ?&#x2018;˛đ?&#x2019;&#x2DC;đ?&#x2019;&#x201A;đ?&#x2019;?đ?&#x2019;&#x2022;đ?&#x2019;&#x160;đ?&#x2019;&#x2020;đ?&#x2019;?đ?&#x2019;&#x2DC;đ?&#x2019;&#x201A;đ?&#x2019;&#x201A;đ?&#x2019;&#x201C;đ?&#x2019;&#x2026;đ?&#x2019;&#x2020; = đ?&#x;&#x2019;đ?&#x;&#x17D; + đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x201C; đ?&#x;&#x2019; â&#x2C6;&#x2019; đ?&#x;&#x2019;đ?&#x;&#x17D; = đ?&#x;&#x2019;đ?&#x;&#x17D; + đ?&#x;?, đ?&#x;?đ?&#x;&#x201C; = đ?&#x;&#x2019;đ?&#x;?, đ?&#x;?đ?&#x;&#x201C;
Dus: 25% van alle waardes is kleiner of gelyk aan 41,25. (Nota: Vir die benaderde posisie in bogenoemde formule word die posisie afgerond na die kleiner diskrete waarde.)
Doen self: â&#x20AC;˘
Bereken nou die derde kwartiel (đ?&#x2018;¸đ?&#x;&#x2018; ) van die data hierbo genoem. (Die antwoord is 95,75.)
â&#x20AC;˘
Doen nou Voorbeeld 3.7 in die handboek.
MS Excel-formule:
=QUARTILE.EXC(datareeks,1)
Formule 1.12: MS Excel-formule om die eerste kwartiel te vind
MS Excel-formule:
=QUARTILE.EXC(datareeks,3)
Formule 1.13: MS Excel-formule om die derde kwartiel te vind
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 53
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Soos met die mediaan, is die volledige data nie altyd beskikbaar nie, maar slegs kategorieĂŤ. Hier is die formules wat ons gebruik:
đ?&#x2018;&#x201E;( = đ?&#x2018;&#x201A;Ĺ&#x2019;( + Waar:
đ?&#x2018;?
:
â&#x2C6;&#x2019; đ?&#x2018;&#x201C;(<) đ?&#x2018;&#x201C;Ĺ&#x2019;(
đ?&#x2018;&#x201E;(
= die waarde van die eerste kwartiel
đ?&#x2018;&#x201A;Ĺ&#x2019;(
= die kleinste waarde van die đ?&#x2018;&#x201E;( interval
đ?&#x2018;&#x203A;
= steekproefgrootte
đ?&#x2018;&#x201C;(<) = die kumulatiewe frekwensie van die interval voor die đ?&#x2018;&#x201E;( interval đ?&#x2018;?
= die intervalwydte
đ?&#x2018;&#x201C;Ĺ&#x2019;(
= die frekwensie van die đ?&#x2018;&#x201E;( interval Formule 1.14: Berekening van die eerste kwartiel vir kategorieĂŤ
đ?&#x2018;&#x201E;+ = đ?&#x2018;&#x201A;Ĺ&#x2019;+ + Waar:
đ?&#x2018;?
:
â&#x2C6;&#x2019; đ?&#x2018;&#x201C;(<) đ?&#x2018;&#x201C;Ĺ&#x2019;+
đ?&#x2018;&#x201E;+
= die waarde van die derde kwartiel
đ?&#x2018;&#x201A;Ĺ&#x2019;+
= die kleinste waarde van die đ?&#x2018;&#x201E;+ interval
đ?&#x2018;&#x203A;
= steekproefgrootte
đ?&#x2018;&#x201C;(<) = die kumulatiewe frekwensie van die interval voor die đ?&#x2018;&#x201E;+ interval đ?&#x2018;?
= die intervalwydte
đ?&#x2018;&#x201C;Ĺ&#x2019;+
= die frekwensie van die đ?&#x2018;&#x201E;+ interval Formule 1.15: Berekening van die derde kwartiel vir kategorieĂŤ
Doen self: Doen nou Voorbeeld 3.8 in die handboek. v Persentiele Ĺ&#x2030; Persentiel is soortgelyk aan Ĺ&#x2030; kwartiel. Waar kwartiele die data in kwarte deel, sal persentiele die data in 100 gelyke dele deel. Die 25ste en 75ste persentiele is dus dieselfde as die eerste en derde kwartiele. Die 50ste persentiel is dan ook dieselfde as die 2de kwartiel, wat gelyk is aan die mediaan. Om die persentiele te bereken is soortgelyk aan die formules vir kwartiele. Om die posisie van die đ?&#x2018;?de persentiel te bereken word die volgende formule gebruik:
Bladsy 54 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ?&#x2018;&#x203A;+1 đ?&#x2018;? Waar:
đ?&#x2018;&#x203A;
= steekproefgrootte
đ?&#x2018;?
= die betrokke persentiel Formule 1.16: Berekening van die đ?&#x2019;&#x2018;de persentiel se posisie
Om die 32ste persentiel te vind is die posisie daarvan 0,32(đ?&#x2018;&#x203A; + 1). Om die 60ste persentiel te vind is die posisie daarvan 0,6(đ?&#x2018;&#x203A; + 1). Die waarde van die persentiel word dan op dieselfde manier bereken as die kwartiele.
MS Excel-formule:
=PERCENTILE.EXC(datareeks,0.32)
MS Excel-formule:
=PERCENTILE.EXC(datareeks,0.60)
Formule 1.17: MS Excel-formule om die 32ste en 60ste persentiel te vind 1.8.3
Maatstawwe van spreiding
Bestudeer die handboek paragraaf 3.4. Verdeling verwys na die mate waarop datawaardes van Ĺ&#x2030; numeriese stogastiese veranderlike versprei is rondom die sentrale waarde (Wegner, 2016: 79). Kyk na die volgende figuur as Ĺ&#x2030; praktiese voorstelling van verdeling:
Figuur 1.14: Voorbeelde van verdeling Alhoewel elkeen van hierdie groepe dieselfde gemiddeld het, is die datawaardes se verdeling rondom hierdie gemiddeld anders. Dus het dit Ĺ&#x2030; impak op die vertroue waarmee die maatstawwe van lokaliteit gebruik kan word.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 55
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes As Ĺ&#x2030; eenvoudige reĂŤl is data wat Ĺ&#x2030; groter verdeling het minder betroubaar en waar die data Ĺ&#x2030; kleiner verdeling het meer betroubaar. Waar ons later hierdie statistieke gaan gebruik om afleidings te maak van die populasie, sal ons sien wat die impak van verdeling is op ons beramings. v Die reikwydte Die reikwydte is reeds vroeĂŤr bespreek. Hierdie statistiek bepaal bloot hoe ver die grootste en kleinste waardes van mekaar is.
đ?&#x2019;&#x201C;đ?&#x2019;&#x2020;đ?&#x2019;&#x160;đ?&#x2019;&#x152;đ?&#x2019;&#x2DC;đ?&#x2019;&#x161;đ?&#x2019;&#x2026;đ?&#x2019;&#x2022;đ?&#x2019;&#x2020; = đ?&#x2019;&#x2122;đ?&#x2019;&#x17D;đ?&#x2019;&#x201A;đ?&#x2019;&#x152;đ?&#x2019;&#x201D; â&#x2C6;&#x2019; đ?&#x2019;&#x2122;đ?&#x2019;&#x17D;đ?&#x2019;&#x160;đ?&#x2019;? Waar:
đ?&#x2018;Ľdâ&#x20AC;˘â&#x20AC;˘â&#x20AC;&#x2DC; = die grootste observasie in die datastel đ?&#x2018;ĽdO- = die kleinste observasie in die datastel
MS Excel-formule:
=MAX(datareeks)-MIN(datareeks) Formule 1.18: Reikwydte
Voorbeeld 1.12 Bereken die reikwydte van die volgende getalle: 14
15
16
13
90
95
Die formule vir die reikwydte word as Formule 3.9 in die handboek weergegee: đ?&#x2019;&#x2122;đ?&#x2019;&#x17D;đ?&#x2019;&#x201A;đ?&#x2019;&#x152;đ?&#x2019;&#x201D; = đ?&#x;&#x2014;đ?&#x;&#x201C; đ?&#x2019;&#x2122;đ?&#x2019;&#x17D;đ?&#x2019;&#x160;đ?&#x2019;?
= đ?&#x;?đ?&#x;&#x2018; đ?&#x2019;&#x201C;đ?&#x2019;&#x2020;đ?&#x2019;&#x160;đ?&#x2019;&#x152;đ?&#x2019;&#x2DC;đ?&#x2019;&#x161;đ?&#x2019;&#x2026;đ?&#x2019;&#x2022;đ?&#x2019;&#x2020;
= đ?&#x2019;&#x2122;đ?&#x2019;&#x17D;đ?&#x2019;&#x201A;đ?&#x2019;&#x152;đ?&#x2019;&#x201D; â&#x2C6;&#x2019; đ?&#x2019;&#x2122;đ?&#x2019;&#x17D;đ?&#x2019;&#x160;đ?&#x2019;? = đ?&#x;&#x2014;đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;?đ?&#x;&#x2018; = đ?&#x;&#x2013;đ?&#x;?
Die reikwydte is dus 82. Hierdie groot reikwydte behoort alreeds Ĺ&#x2030; aanduiding te gee dat die gemiddeld deur groot verskille in die waardes beĂŻnvloed kan word. (As die reikwydte, byvoorbeeld, 2 of 3 was, sou die gemiddeld moontlik baie meer betroubaar gewees het). Die reikwydte word egter deur uitskieters beĂŻnvloed. Daarom word meer akkurate maatstawwe van spreiding benodig. Doen Voorbeeld 3.9 in die handboek.
Bladsy 56 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes v Variansie Die variansie is Ĺ&#x2030; maatstaf van hoe ver al die observasies đ?&#x2018;Ľ( , đ?&#x2018;Ľ* , đ?&#x2018;Ľ+ , â&#x20AC;Ś , đ?&#x2018;Ľ- verwyder is vanaf die sentrale waarde van die datastel, die steekproefgemiddeld đ?&#x2018;Ľ . Uit hierdie stelling kan ons aanvaar dat die variansie Ĺ&#x2030; verwerkte afstand is (dit is die afstand tussen die observasies en die gemiddeld).
Figuur 1.15: Voorstelling van die afstand tussen die observasie en die gemiddeld Dus moet ons die afstand tussen die observasie en die gemiddeld bereken đ?&#x2018;ĽO â&#x2C6;&#x2019; đ?&#x2018;Ľ . Wanneer ons hierdie waardes almal bymekaartel, moet die antwoord altyd nul (0) wees, đ?&#x2018;ĽO â&#x2C6;&#x2019; đ?&#x2018;Ľ = 0; omdat die steekproefgemiddeld presies in die middel van al die observasies val, gaan ons positiewe en negatiewe waardes kry wat mekaar heeltemal uitkanselleer. Om slegs positiewe waardes te kry kwadreer ons hierdie berekening, đ?&#x2018;ĽO â&#x2C6;&#x2019; đ?&#x2018;Ľ * .
đ?&#x2019;&#x201D;đ?&#x;? = Waar:
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; â&#x2C6;&#x2019; đ?&#x2019;&#x2122; đ?&#x2019;?â&#x2C6;&#x2019;đ?&#x;?
đ?&#x;?
đ?&#x2018; *
= variansie van die steekproef
đ?&#x2018;ĽO
= die đ?&#x2018;&#x2013; ste observasie van die stogastiese veranderlike đ?&#x2018;Ľ
đ?&#x2018;Ľ
= die steekproefgemiddeld
đ?&#x2018;&#x203A;
= steekproefgrootte
MS Excel-formule:
=VAR.S(datareeks) Formule 1.19: Variansie
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 57
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Hierdie formule mag intimiderend lyk. Dit is egter heel eenvoudig. Voorbeeld 1.13 Kyk na die volgende datastel: 13
8
9
15
13
9
12
Die gemiddeld van hierdie datastel is 11,3 en die steekproefgrootte is 7 (daar is 7 observasies in die datastel). Die variansie word dus soos volg bereken: đ?&#x2019;&#x201D;đ?&#x;?
đ?&#x;?đ?&#x;&#x2018; â&#x2C6;&#x2019; đ?&#x;?đ?&#x;?, đ?&#x;&#x2018;
= =
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; mđ?&#x2019;&#x2122; đ?&#x;?
=
đ?&#x2019;?mđ?&#x;? đ?&#x;?
+ đ?&#x;&#x2013; â&#x2C6;&#x2019; đ?&#x;?đ?&#x;?, đ?&#x;&#x2018;
đ?&#x;?
+ đ?&#x;&#x2014; â&#x2C6;&#x2019; đ?&#x;?đ?&#x;?, đ?&#x;&#x2018; đ?&#x;? + đ?&#x;?đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;?đ?&#x;?, đ?&#x;&#x2018; đ?&#x;&#x2022;â&#x2C6;&#x2019;đ?&#x;?
đ?&#x;?
+ â&#x2039;Ż + đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?đ?&#x;?, đ?&#x;&#x2018;
đ?&#x;?
đ?&#x;&#x2019;đ?&#x;?, đ?&#x;&#x2019;đ?&#x;&#x2018; đ?&#x;&#x201D;
= đ?&#x;&#x201D;, đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;&#x201C; Een van die eienskappe van Ĺ&#x2030; variansie is dat dit sensitief is vir uitskieters. Ĺ&#x2030; Uitskieter is Ĺ&#x2030; observasie wat buite die algemene groepering van observasies val. Dit kan Ĺ&#x2030; waarde wees wat aansienlik groter of kleiner is as die ander. Wanneer ons met Ĺ&#x2030; variansie werk, kan dit Ĺ&#x2030; drastiese effek op die resultaat hĂŞ. Voorbeeld 1.12 (vervolg) Kyk weer na die verskillende ouderdomme. 14
15
16
13
90
95
Die gemiddeld van hierdie datastel is 40,5 en die steekproefgrootte is 6. Die getalle en die gemiddeld word op die getallelyn hieronder aangedui:
Bereken die variansie: đ?&#x2019;&#x201D;đ?&#x;?
= = =
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; mđ?&#x2019;&#x2122; đ?&#x;? đ?&#x2019;?mđ?&#x;? đ?&#x;?đ?&#x;&#x2019;mđ?&#x;&#x2019;đ?&#x;&#x17D;,đ?&#x;&#x201C; đ?&#x;? U đ?&#x;?đ?&#x;&#x201C;mđ?&#x;&#x2019;đ?&#x;&#x17D;,đ?&#x;&#x201C; đ?&#x;? U đ?&#x;?đ?&#x;&#x201D;mđ?&#x;&#x2019;đ?&#x;&#x17D;,đ?&#x;&#x201C; đ?&#x;? U đ?&#x;?đ?&#x;&#x2018;mđ?&#x;&#x2019;đ?&#x;&#x17D;,đ?&#x;&#x201C; đ?&#x;? U đ?&#x;&#x2014;đ?&#x;&#x17D;mđ?&#x;&#x2019;đ?&#x;&#x17D;,đ?&#x;&#x201C; đ?&#x;? U đ?&#x;&#x2014;đ?&#x;&#x201C;mđ?&#x;&#x2019;đ?&#x;&#x17D;,đ?&#x;&#x201C; đ?&#x;? đ?&#x;&#x201D;mđ?&#x;? đ?&#x;&#x2013; đ?&#x;?đ?&#x;?đ?&#x;&#x2014;,đ?&#x;&#x201C; đ?&#x;&#x201C;
= đ?&#x;? đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C;, đ?&#x;&#x2014;
Bladsy 58 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Wanneer ons die berekening doen op dieselfde datastel, sonder die twee uitskieters, sien ons dat dit Ĺ&#x2030; reuseverskil maak. đ?&#x2019;&#x201D;đ?&#x;?
=
đ?&#x;?đ?&#x;&#x2019;mđ?&#x;?đ?&#x;&#x2019;,đ?&#x;&#x201C; đ?&#x;? U đ?&#x;?đ?&#x;&#x201C;mđ?&#x;?đ?&#x;&#x2019;,đ?&#x;&#x201C; đ?&#x;? U đ?&#x;?đ?&#x;&#x201D;mđ?&#x;?đ?&#x;&#x2019;,đ?&#x;&#x201C; đ?&#x;? U đ?&#x;?đ?&#x;&#x2018;mđ?&#x;?đ?&#x;&#x2019;,đ?&#x;&#x201C; đ?&#x;? đ?&#x;&#x2019;mđ?&#x;?
đ?&#x;&#x201C;
= đ?&#x;&#x2018;
= đ?&#x;?, đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x2022; Doen nou Voorbeeld 3.10 in die handboek. v Standaardafwyking As ons na die variansie kyk, is dit moeilik om die resultaat te interpreteer omdat dit nie in dieselfde eenheid is as wat die data is nie. Om hierdie rede verkies ons om eerder Ĺ&#x2030; standaardafwyking te gebruik.
đ?&#x2018; = Waar:
đ?&#x2018;
= die steekproef se standaardafwyking
đ?&#x2018; *
= die steekproef se variansie
đ?&#x2018; =
Waar:
đ?&#x2018; *
đ?&#x2018;ĽO â&#x2C6;&#x2019; đ?&#x2018;Ľ đ?&#x2018;&#x203A;â&#x2C6;&#x2019;1
*
đ?&#x2018;
= die steekproef se standaardafwyking
đ?&#x2018;ĽO
= die đ?&#x2018;&#x2013; ste observasie van die stogastiese veranderlike đ?&#x2018;Ľ
đ?&#x2018;Ľ
= die steekproefgemiddeld
đ?&#x2018;&#x203A;
= steekproefgrootte
MS Excel-formule:
=STDEV.S(datareeks) Formule 1.20: Standaardafwyking
Voorbeeld 1.12 (vervolg) As ons die twee variansies, wat ons in die vorige voorbeeld bereken het, vat, kan ons nou voortgaan om die betrokke standaardafwykings te bereken: Vir die variansie van 1 625,9: đ?&#x2019;&#x201D;
= đ?&#x2019;&#x201D;đ?&#x;? =
đ?&#x;? đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C;, đ?&#x;&#x2014;
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 59
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;&#x201C; â&#x2030;&#x2C6; đ?&#x;&#x2019;đ?&#x;&#x17D; Vir die variansie van 1,6667: =
đ?&#x;?, đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x2022;
= đ?&#x;?, đ?&#x;?đ?&#x;&#x2014;đ?&#x;? â&#x2030;&#x2C6; đ?&#x;? So, wat beteken Ĺ&#x2030; standaardafwyking van 40 jaar? Dit beteken dat die afstand tussen die gemiddeld en die observasies 40 jaar is, dus is die verdeling van hierdie waardes baie groot. Ĺ&#x2030; Standaardafwyking van 1 jaar, aan die ander hand, is baie kleiner en dus sal die beskrywende statistiek van hierdie steekproef meer betroubaar wees as diĂŠ van die eerste steekproef. Terselfdertyd wys dit ook wat die effek kan wees van twee uitskieters wat drasties anders is as die ander observasies. Wees dus altyd versigtig vir uitskieters, veral met statistieke (soos die standaardafwyking) wat sensitief is vir uitskieters.
Doen nou Voorbeeld 3.10 en 3.11 in die handboek. As jy weet wat die steekproef se gemiddeld en standaardafwyking is, kan jy maklik enige observasie binne daardie konteks interpreteer. Kyk na Figuur 1.16 hieronder:
Bladsy 60 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 1.16: Persentasie (%) van die observasies wat tussen 1, 2 en 3 standaardafwykings vanaf die gemiddeld is Met die eerste oogopslag lyk dit baie intimiderend, maar as jy weet waarvoor om te kyk kan jy baie vinnig en baie maklik Ĺ&#x2030; gevolgtrekking maak oor die betroubaarheid van Ĺ&#x2030; statistiek. Figuur 1.16 hierbo wys die persentasie van die observasies wat tussen 1, 2 en 3 standaardafwykings vanaf die gemiddeld lĂŞ: â&#x20AC;˘
68,3% van al die observasies sal binne een standaardafwyking vanaf die gemiddeld lĂŞ en die limiete kan soos volg bereken word: onderste limiet is (đ?&#x2018;Ľ â&#x2C6;&#x2019; đ?&#x2018; ) en die boonste limiet đ?&#x2018;Ľ + đ?&#x2018; .
â&#x20AC;˘
95,5% van al die observasies sal binne twee standaardafwykings vanaf die gemiddeld lĂŞ en die limiete kan soos volg bereken word: onderste limiet is (đ?&#x2018;Ľ â&#x2C6;&#x2019; 2đ?&#x2018; ) en die boonste limiet đ?&#x2018;Ľ + 2đ?&#x2018; .
â&#x20AC;˘
99,7% van al die observasies sal binne drie standaardafwykings vanaf die gemiddeld lĂŞ en die limiete kan soos volg bereken word: onderste limiet is (đ?&#x2018;Ľ â&#x2C6;&#x2019; 3đ?&#x2018; ) en die boonste limiet đ?&#x2018;Ľ + 3đ?&#x2018; .
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 61
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 1.12 (vervolg) As ons aangaan met die twee voorbeelde van vroeĂŤr kan ons die onderskeie intervalle bereken. Ons het reeds die volgende statistieke bereken: đ?&#x2019;&#x2122; = đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201C; đ?&#x2019;&#x201D; = đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;&#x201C; 1 standaardafwyking interval (đ?&#x2019;&#x2122; â&#x2C6;&#x2019; đ?&#x2019;&#x201D;: đ?&#x2019;&#x2122; + đ?&#x2019;&#x201D;) = (đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;&#x201C;: đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201C; + đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;&#x201C;) = (đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2022;đ?&#x;&#x2022;đ?&#x;&#x201C;: đ?&#x;&#x2013;đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;?đ?&#x;?đ?&#x;&#x201C;) 2 standaardafwyking interval (đ?&#x2019;&#x2122; â&#x2C6;&#x2019; đ?&#x;?đ?&#x2019;&#x201D;: đ?&#x2019;&#x2122; + đ?&#x;?đ?&#x2019;&#x201D;) = (đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;?Ă&#x2014;đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;&#x201C;: đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201C; + đ?&#x;?Ă&#x2014;đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;&#x201C;) = (â&#x2C6;&#x2019;đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2019;đ?&#x;&#x201C;: đ?&#x;?đ?&#x;?đ?&#x;?, đ?&#x;?đ?&#x;&#x2019;đ?&#x;&#x201C;) 3 standaardafwyking interval (đ?&#x2019;&#x2122; â&#x2C6;&#x2019; đ?&#x;&#x2018;đ?&#x2019;&#x201D;: đ?&#x2019;&#x2122; + đ?&#x;&#x2018;đ?&#x2019;&#x201D;) = (đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x2018;Ă&#x2014;đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;&#x201C;: đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201C; + đ?&#x;&#x2018;Ă&#x2014;đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;&#x201C;) = (â&#x2C6;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x201C;: đ?&#x;?đ?&#x;&#x201D;đ?&#x;?, đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x201C;) Ons kan sien dat hierdie intervalle absurd groot is as mens in ag neem dat die natuurlike mens nooit jonger as 0 jaar en baie selde ouer as 120 jaar word. Kom ons kyk nou na die volgende voorbeeld Ons het reeds die volgende statistieke bereken: đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x2019;, đ?&#x;&#x201C; đ?&#x2019;&#x201D; = đ?&#x;?, đ?&#x;?đ?&#x;&#x2014;đ?&#x;? 1 standaardafwyking interval (đ?&#x2019;&#x2122; â&#x2C6;&#x2019; đ?&#x2019;&#x201D;: đ?&#x2019;&#x2122; + đ?&#x2019;&#x201D;) = (đ?&#x;?đ?&#x;&#x2019;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;?đ?&#x;&#x2014;đ?&#x;?: đ?&#x;?đ?&#x;&#x2019;, đ?&#x;&#x201C; + đ?&#x;?, đ?&#x;?đ?&#x;&#x2014;đ?&#x;?) = (đ?&#x;?đ?&#x;&#x2018;, đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2014;: đ?&#x;?đ?&#x;&#x201C;, đ?&#x;&#x2022;đ?&#x;&#x2014;đ?&#x;?) 2 standaardafwyking interval (đ?&#x2019;&#x2122; â&#x2C6;&#x2019; đ?&#x;?đ?&#x2019;&#x201D;: đ?&#x2019;&#x2122; + đ?&#x;?đ?&#x2019;&#x201D;) = (đ?&#x;?đ?&#x;&#x2019;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;?Ă&#x2014;đ?&#x;?, đ?&#x;?đ?&#x;&#x2014;đ?&#x;?: đ?&#x;?đ?&#x;&#x2019;, đ?&#x;&#x201C; + đ?&#x;?Ă&#x2014;đ?&#x;?, đ?&#x;?đ?&#x;&#x2014;đ?&#x;?) = (đ?&#x;?đ?&#x;?, đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x2013;: đ?&#x;?đ?&#x;&#x2022;, đ?&#x;&#x17D;đ?&#x;&#x2013;đ?&#x;?) 3 standaardafwyking interval (đ?&#x2019;&#x2122; â&#x2C6;&#x2019; đ?&#x;&#x2018;đ?&#x2019;&#x201D;: đ?&#x2019;&#x2122; + đ?&#x;&#x2018;đ?&#x2019;&#x201D;) = (đ?&#x;?đ?&#x;&#x2019;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x2018;Ă&#x2014;đ?&#x;?, đ?&#x;?đ?&#x;&#x2014;đ?&#x;?: đ?&#x;?đ?&#x;&#x2019;, đ?&#x;&#x201C; + đ?&#x;&#x2018;Ă&#x2014;đ?&#x;?, đ?&#x;?đ?&#x;&#x2014;đ?&#x;?) = (đ?&#x;?đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x2022;: đ?&#x;?đ?&#x;&#x2013;, đ?&#x;&#x2018;đ?&#x;&#x2022;đ?&#x;&#x2018;) As ons dus Ĺ&#x2030; ouderdom van 14 kry, is dit een van die waardes wat binne die eerste standaardafwyking val. Ĺ&#x2030; Ouderdom van 16 sal binne twee standaardafwykings lĂŞ en Ĺ&#x2030; ouderdom van 18 binne drie standaardafwykings. Waardes van 90 en 95 lĂŞ vĂŞr buite drie afwykings en verskil drasties van 99,7% van hierdie
Bladsy 62 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes steekproef se observasies. Daarom verwys ons na hierdie waardes as uitskieters en omdat die waarskynlikheid daarvan so klein is, is dit weglaatbaar. Om hierdie rede verwyder ons gewoonlik uitskieters uit Ĺ&#x2030; steekproef. v VariansiekoĂŤffisiĂŤnt Ĺ&#x2030; Ander statistiek wat ons kan gebruik om meer te leer oor die verdeling van ons datastel, is die variansiekoĂŤffisiĂŤnt. Dit is eenvoudig die verhouding van die standaardafwyking teenoor die gemiddeld van Ĺ&#x2030; steekproef en dit gee vir ons die relatiewe grootte van die standaardafwyking.
đ?&#x2018;Şđ?&#x2018;˝ = Waar:
đ?&#x2019;&#x201D; đ?&#x2019;&#x2122;
đ??śđ?&#x2018;&#x2030;
= variansiekoĂŤffisiĂŤnt
đ?&#x2018;
= standaardafwyking van die steekproef
đ?&#x2018;Ľ
= gemiddeld van die steekproef
Nota: Hierdie verhouding word as Ĺ&#x2030; persentasie uitgedruk. Formule 1.21: VariansiekoĂŤffisiĂŤnt Die variansiekoĂŤffisiĂŤnt kan nooit kleiner as 0 wees nie, maar daar is geen beperking op sy boonste limiet nie. Voorbeeld 1.12 (vervolg) As ons aangaan met die voorbeeld van die ouderdomme kan die volgende twee variansiekoĂŤffisiĂŤnte bereken word: đ?&#x2018;Şđ?&#x2018;˝ =
đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;&#x201C; = đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2014;đ?&#x;&#x201C;đ?&#x;&#x201D; = đ?&#x;&#x2014;đ?&#x;&#x2014;, đ?&#x;&#x201C;đ?&#x;&#x201D;% đ?&#x;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201C;
đ?&#x2018;Şđ?&#x2018;˝ =
đ?&#x;?, đ?&#x;?đ?&#x;&#x2014;đ?&#x;? = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x2013;đ?&#x;&#x2014;đ?&#x;&#x17D; = đ?&#x;&#x2013;, đ?&#x;&#x2014;% đ?&#x;?đ?&#x;&#x2019;, đ?&#x;&#x201C;
Hoe kleiner die variansiekoĂŤffisiĂŤnt, hoe kleiner is die verdeling van die data om die gemiddeld. Hoe groter die variansiekoĂŤffisiĂŤnt, hoe groter is die verdeling van die data om die gemiddeld. Doen nou Voorbeeld 3.12 in die handboek.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 63
GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.8.4
Maatstawwe van skeefheid
Bestudeer die handboek paragrawe 3.5-3.6. Die wyse waarop data rondom die gemiddeld versprei is, kan grafies en numeries voorgestel word. ʼn Histogram met relatiewe klein intervalle, kan hierdie data grafies voorstel. Daar word onderskei tussen drie wyses waarop data rondom die gemiddeld versprei word: v Simmetrie Die waardes word simmetries rondom die gemiddeld versprei. Dit beteken dat die frekwensies van waardes aan die linkerkant en die frekwensies van waardes aan die regterkant ooreenstem. Figuur 1.17 hieronder is ʼn voorbeeld van ʼn simmetriese verdeling. (Die handboek gebruik ʼn lyngrafiek om hierdie verdelings voor te stel. Vir alle verdere verduidelikings sal lyngrafieke gebruik word).
Figuur 1.17: 'n Simmetriese verdeling van data In bogenoemde grafiek is die gemiddeld, die mediaan en die modus dieselfde getal. v Positiewe skeefheid Die waardes met die grootste frekwensies sal na die linkerkant van die gemiddeld neig. Die "stert" gedeelte is dus aan die regterkant (die positiewe kant). Figuur 1.18 stel ʼn dataverdeling voor wat positief skeef is.
Bladsy 64 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Figuur 1.18: ’n Datastel wat positief skeef is In bogenoemde datastel sal die mediaan kleiner as die gemiddeld wees. Die modus sal egter die kleinste getal wees. v Negatief skeef In hierdie geval sal die grootste frekwensies aan die regterkant van die gemiddeld voorkom. Die waardes wat dus die meeste voorkom, sal almal groter as die gemiddeld wees. Die “stert”-gedeelte is dus aan die linkerkant (die negatiewe kant). Figuur 1.19 stel ʼn datastel voor wat negatief skeef is.
Figuur 1.19: ’n Datastel wat negatief skeef is
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 65
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes In hierdie geval sal die gemiddeld die kleinste wees, gevolg deur die mediaan en dan deur die modus. v Pearson se koĂŤffisiĂŤnt van skeefheid Hoewel data se simmetrie grafies voorgestel kan word, is dit ook moontlik om bereken te word. Hiervoor word Pearson se koĂŤffisiĂŤnt van skeefheid đ?&#x2018;&#x2020;đ?&#x2018;&#x2DC;Ë&#x153; gebruik.
đ?&#x2018;şđ?&#x2019;&#x152;đ?&#x2019;&#x2018; = Waar:
đ?&#x2019;? đ?&#x2019;&#x2122;đ?&#x2019;&#x160; â&#x2C6;&#x2019; đ?&#x2019;&#x2122; đ?&#x;&#x2018; đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x;? đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x;? đ?&#x2019;&#x201D;đ?&#x;&#x2018;
đ?&#x2018;&#x2020;đ?&#x2018;&#x2DC;Ë&#x153;
= Pearson se koĂŤffisiĂŤnt van skeefheid
đ?&#x2018;&#x203A;
= steekproefgrootte
đ?&#x2018;ĽO
= die đ?&#x2018;&#x2013; ste observasie van die stogastiese veranderlike đ?&#x2018;Ľ
đ?&#x2018;Ľ
= die steekproefgemiddeld
đ?&#x2018;
= die steekproef se standaardafwyking
Nota: Let op die magte wat in hierdie formule gebruik word. Formule 1.22: Pearson se koĂŤffisiĂŤnt van skeefheid Hierdie statistiek kan ook soos volg beraam word:
đ?&#x2018;ˇđ?&#x2018;Şđ?&#x2018;ş = Waar:
đ?&#x;&#x2018; đ?&#x2019;&#x2122; â&#x2C6;&#x2019; đ?&#x2018;´đ?&#x2019;&#x2020; đ?&#x2019;&#x201D;
đ?&#x2018;Ľ
= steekproefgemiddeld
đ?&#x2018;&#x20AC;e
= steekproefmediaan
đ?&#x2018;
= steekproefstandaardafwyking Formule 1.23: Beraming van Pearson se koĂŤffisiĂŤnt van skeefheid
Eienskappe van Pearson se koĂŤffisiĂŤnt van skeefheid: â&#x20AC;˘
Vir đ?&#x2018;&#x2020;đ?&#x2018;&#x2DC;Ë&#x153; = 0 is die verdeling van die observasies simmetries.
â&#x20AC;˘
Vir đ?&#x2018;&#x2020;đ?&#x2018;&#x2DC;Ë&#x153; > 0 is die verdeling positief skeef.
â&#x20AC;˘
Vir đ?&#x2018;&#x2020;đ?&#x2018;&#x2DC;Ë&#x153; < 0 is die verdeling negatief skeef.
Bladsy 66 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 1.14 Die volgende punte is verkry uit Ĺ&#x2030; toets wat studente afgelĂŞ het: 24
27
36
48
52
52
53
53
59
60
85
90
95
Bereken nou die volgende statistieke: 1.
Steekproefgemiddeld: đ?&#x2019;&#x2122;
2.
=
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;?
đ?&#x;?đ?&#x;&#x2018;
= đ?&#x;&#x201C;đ?&#x;&#x201D;, đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C;
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; mđ?&#x2019;&#x2122; đ?&#x;?
=
đ?&#x2019;?mđ?&#x;? đ?&#x;?đ?&#x;&#x2019;mđ?&#x;&#x201C;đ?&#x;&#x201D;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C; đ?&#x;? U đ?&#x;?đ?&#x;&#x2022;mđ?&#x;&#x201C;đ?&#x;&#x201D;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C; đ?&#x;? U đ?&#x;&#x2018;đ?&#x;&#x201D;mđ?&#x;&#x201C;đ?&#x;&#x201D;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C; đ?&#x;? Uâ&#x2039;ŻU đ?&#x;&#x2014;đ?&#x;&#x201C;mđ?&#x;&#x201C;đ?&#x;&#x201D;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C; đ?&#x;?
=
đ?&#x;?đ?&#x;&#x2018;mđ?&#x;? đ?&#x;&#x201C; đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x2014;,đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x2013;
=
đ?&#x;?đ?&#x;?
= đ?&#x;?đ?&#x;?, đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2014;đ?&#x;&#x2022;
Steekproefmediaan: đ?&#x2019;&#x2122;
4.
đ?&#x;&#x2022;đ?&#x;&#x2018;đ?&#x;&#x2019;
Steekproefvariansie: đ??Ź
3.
=
= đ?&#x;&#x201C;đ?&#x;&#x2018; (die middelste waarde)
Pearson se koĂŤffisiĂŤnt van skeefheid: đ?&#x2018;şđ?&#x2019;&#x152;đ?&#x2019;&#x2018;
=
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; mđ?&#x2019;&#x2122; đ?&#x;&#x2018;
đ?&#x2019;?
đ?&#x2019;?mđ?&#x;? đ?&#x2019;?mđ?&#x;? đ?&#x2019;&#x201D;đ?&#x;&#x2018;
= =
đ?&#x;?đ?&#x;&#x2018; đ?&#x;?đ?&#x;&#x2019;mđ?&#x;&#x201C;đ?&#x;&#x201D;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C; đ?&#x;&#x2018; U đ?&#x;?đ?&#x;&#x2022;mđ?&#x;&#x201C;đ?&#x;&#x201D;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C; đ?&#x;&#x2018; U đ?&#x;&#x2018;đ?&#x;&#x201D;mđ?&#x;&#x201C;đ?&#x;&#x201D;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C; đ?&#x;&#x2018; Uâ&#x2039;ŻU đ?&#x;&#x2014;đ?&#x;&#x201C;mđ?&#x;&#x201C;đ?&#x;&#x201D;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C; đ?&#x;&#x2018; đ?&#x;?đ?&#x;&#x2018;mđ?&#x;? đ?&#x;?đ?&#x;&#x2018;mđ?&#x;? đ?&#x;?đ?&#x;?,đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2014;đ?&#x;&#x2022; đ?&#x;&#x2018; đ?&#x;?đ?&#x;&#x2018; đ?&#x;&#x2019;đ?&#x;&#x2014; đ?&#x;&#x17D;đ?&#x;&#x201C;đ?&#x;&#x2019;,đ?&#x;&#x2013;đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x2014; đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;&#x17D; đ?&#x;&#x2014;đ?&#x;&#x201C;đ?&#x;&#x201C;,đ?&#x;&#x2018;đ?&#x;&#x2019;đ?&#x;&#x2019;đ?&#x;&#x201C;
=
đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x2022; đ?&#x;&#x2022;đ?&#x;?đ?&#x;&#x2018;,đ?&#x;?đ?&#x;&#x2018;đ?&#x;? đ?&#x;? đ?&#x;&#x2019;đ?&#x;&#x2019;đ?&#x;&#x201D; đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x201C;,đ?&#x;&#x2019;đ?&#x;&#x201C;
= đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x17D;
5. Beraming van Pearson se koĂŤffisiĂŤnt: đ?&#x2018;ˇđ?&#x2018;Şđ?&#x2018;ş = =
đ?&#x;&#x2018; đ?&#x2019;&#x2122;mđ?&#x2018;´đ?&#x2019;&#x2020; đ?&#x2019;&#x201D;
đ?&#x;&#x2018; đ?&#x;&#x201C;đ?&#x;&#x201D;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C;mđ?&#x;&#x201C;đ?&#x;&#x2018; đ?&#x;?đ?&#x;?,đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2014;đ?&#x;&#x2022;
=
đ?&#x;&#x2018; đ?&#x;&#x201C;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x201C; đ?&#x;?đ?&#x;?,đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2014;đ?&#x;&#x2022;
= đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x201D;
As ons die resultate van berekeninge 4 en 5 interpreteer, kan ons sien dat beide waardes groter is as 0, dus is die gegewe punte positief skeef versprei.
Doen Voorbeeld 3.13 in die handboek. v Die houer-en-stippingsgrafiek Die houer-en-stippingsgrafiek is Ĺ&#x2030; basiese opsomming van die maatstawwe van lokaliteit, spreiding en skeefheid, in een. Dit bestaan uit die volgende statistieke:
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 67
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes â&#x20AC;˘
Die laagste waarde đ?&#x2018;ĽdO-
â&#x20AC;˘
Die eerste kwartiel đ?&#x2018;&#x201E;(
â&#x20AC;˘
Die mediaan đ?&#x2018;&#x20AC;e
â&#x20AC;˘
Die derde kwartiel đ?&#x2018;&#x201E;+
â&#x20AC;˘
Die hoogste waarde đ?&#x2018;Ľdâ&#x20AC;˘â&#x20AC;˘â&#x20AC;&#x2DC;
Bestudeer paragraaf 3.6 in die handboek om meer inligting ten opsigte van die houer-enstipping-grafiek te vind. Dit is belangrik dat Ĺ&#x2030; houer-en-stipping-grafiek geĂŻnterpreteer kan word. Voorbeeld 1.15 Beskou die volgende punte van Ĺ&#x2030; klastoets wat studente afgelĂŞ het: 54
41
62
45
61
15
61
58
48
60
3
29
65
53
64
43
70
49
35
77
56
43
66
78
94
24
Die volgende statistieke kan bereken word as: â&#x20AC;˘
Die laagste waarde, đ?&#x2019;&#x2122;đ?&#x2019;&#x17D;đ?&#x2019;&#x160;đ?&#x2019;? = đ?&#x;&#x2018;
â&#x20AC;˘
Die eerste kwartiel, đ?&#x2018;¸đ?&#x;? = đ?&#x;&#x2019;đ?&#x;?, đ?&#x;&#x201C;
â&#x20AC;˘
Die mediaan, đ?&#x2018;´đ?&#x2019;&#x2020; = đ?&#x;&#x201C;đ?&#x;&#x201C;
â&#x20AC;˘
Die derde kwartiel, đ?&#x2018;¸đ?&#x;&#x2018; = đ?&#x;&#x201D;đ?&#x;&#x2019;. đ?&#x;?đ?&#x;&#x201C;
â&#x20AC;˘
Die hoogste waarde, đ?&#x2019;&#x2122;đ?&#x2019;&#x17D;đ?&#x2019;&#x201A;đ?&#x2019;&#x152;đ?&#x2019;&#x201D; = đ?&#x;&#x2014;đ?&#x;&#x2019;
Hierdie statistieke kan gebruik word om die volgende houer-en-stippingsgrafiek te teken:
Bladsy 68 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Figuur 1.20: Houer-en-stippingsgrafiek Uit die berekende statistieke en die houer-en-stippingsgrafiek kan ons die volgende sien: •
Die kleinste waarde, naamlik 3, lê buite die onderste limiet.
•
Die spasie tussen die mediaan en eerste kwartiel is groter as die spasie tussen die mediaan en die derde kwartiel.
Ons kan dus die volgende gevolgtrekkings maak: •
3 is ʼn uitskieter; en
•
die verdeling is negatief skeef.
Nota: http://www.alcula.com/calculators/statistics/box-plot/ is gebruik om die houer-enstippingsgrafiek hierbo te genereer.
Doen nou Voorbeeld 3.14 in die handboek. 1.8.5
Keuse van statistiek
Dit is belangrik om te weet wanneer om watter beskrywende statistiek te gebruik. Werk deur paragraaf 3.8.
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 69
GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.8.6
Beskrywende statistiek in MS Excel en die data-analise-invoegsel
In die wêreld buite die studiesentrum word statistieke feitlik nooit suiwer met die hand bereken nie. In die praktyk gaan jy altyd een of ander programmatuur moet gebruik om die statistieke te bereken. Om hierdie rede word die MS Excel-formules gegee saam met die wiskundige formules. Jy gaan moet weet hoe om beide te kan gebruik. MS Excel het verder ʼn data-analise-invoegsel wat gebruik kan word vir meer komplekse analises. Ongelukkig moet hierdie invoegsel eers geaktiveer word alvorens jy dit kan gebruik: 1. Maak dokument in MS Excel oop. 2. Gaan na File > Options > Add-ins
Figuur 1.21: MS Excel se invoegselskerm
Bladsy 70 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 3. Kies die Analysis ToolPak en kliek op die Go knoppie. Die volgende skerm sal oopmaak:
Figuur 1.22: MS Excel se invoegselskerm 4. Merk die blokkie by Analysis ToolPak en kliek op die OK-knoppie. Jy behoort nou die dataverwerkingsmodule (Analysis ToolPak) op die Data tab te sien:
Figuur 1.23: Data-analise module 1.8.7
Selfevalueringsvrae
Doen al die oefeninge aan die einde van Hoofstuk 3. Daar is 26 oefeninge. As jy hierdie vrae korrek kan beantwoord, het jy numeriese beskrywende statistiek onder die knie!
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
Bladsy 71
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 1.9
Samevatting
Statistiek is Ĺ&#x2030; versameling beginsels en tegnieke wat gebruik kan word om data na inligting om te skakel sodat dit vir besluitneming gebruik kan word. Dit is dus belangrik dat hierdie data van hoĂŤ kwaliteit is. Data kan kwalitatief of kwantitatief wees. Kwalitatiewe data kan in woorde beskryf word, maar kan ook numeries voorgestel word. Data kan ook diskreet of kontinu wees. Die vlakke waarop data gemeet kan word, is (van die laagste na die hoogste vlak) nominaal, ordinaal, interval en ratio. Data kan, onder andere, deur observasies, vraelyste en eksperimente versamel word.
Bladsy 72 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes
STUDIE-EENHEID 2: WAARSKYNLIKHEDE, WAARSKYNLIKHEIDSVERDELINGS EN BERAMING
2.1
Studie-eenheid leeruitkomste
Kennis en begrip Na voltooiing van Studie-eenheid 2 sal jy in staat wees om jou kennis en begrip van die volgende te demonstreer: •
Inleiding tot waarskynlikhede
•
Waarskynlikheidsverdelings
•
Beraming (puntberaming en vertrouensintervalle)
Vaardighede Jy sal ook in staat wees om: •
te verduidelik wat waarskynlikhede behels en te onderskei tussen subjektiewe waarskynlikhede en objektiewe waarskynlikhede;
•
te verduidelik wat die kenmerke van waarskynlikhede is;
•
die basiese konsepte van waarskynlikhede te verduidelik;
•
basiese waarskynlikheidsberekeninge te doen;
•
ʼn waarskynlikheidsvertakkingdiagram te teken;
•
permutasies en kombinasies te bereken;
•
tussen diskrete en kontinue waarskynlikheidsverdelings te onderskei;
•
die eienskappe van die normaalverdeling te identifiseer;
•
waarskynlikhede met die formules van waarskynlikheidsverdelings te bereken;
•
ʼn vertrouensinterval en die faktore wat die grootte daarvan beïnvloed, te bespreek;
•
ʼn vertrouensinterval vir ʼn populasiegemiddeld op te stel, indien die populasiestandaardafwyking bekend is (z-limiete); en
•
ʼn vertrouensinterval vir ʼn populasiegemiddeld op te stel, indien die populasiestandaardafwyking nie bekend is nie (t-limiete).
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 73
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 2.2
Voorgeskrewe handboek
Wegner, T. 2016. Applied Business Statistics. 4de uitgawe. Claremont: Juta. Hoofstuk 4 paragrawe 4.1-4.9 Hoofstuk 5 paragrawe 5.1-5.10 Hoofstuk 6 paragrawe 6.1-6.4, 6.6, 6.8 2.3
Hoe kan jy jou begrip verbeter?
Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord
Omskrywing
Gesamentlik uitputbaar
Wanneer al die gebeurtenisse in die steekproefruimte Ĺ&#x2030; gesamentlike waarskynlikheid van 1 het.
Kombinasie
Enige subversameling van â&#x20AC;&#x2122;n gegewe eindige versameling waarby die volgorde van die rangskikking van die elemente in die subversameling nie belangrik is nie.
Normaalverdeling
Die verdeling van Ĺ&#x2030; ewekansige stogastiese veranderlike (X) met die konstantes đ?&#x153;&#x2021; (die populasiegemiddeld) en đ?&#x153;&#x17D; * (die populasievariansie). Hierdie verdeling word gegee deur đ?&#x2018; (đ?&#x153;&#x2021;, đ?&#x153;&#x17D; * ). Enige stogastiese veranderlike wat neig na đ?&#x2018; (đ?&#x153;&#x2021;, đ?&#x153;&#x17D; * ) word beskou as Ĺ&#x2030; normaal verdeelde veranderlike.
Onderling uitsluitend
Twee eksklusiewe gebeurtenisse, met ander woorde die twee gebeurtenisse kan nie terselfdertyd plaasvind nie. đ?&#x2018;&#x192; đ??´ â&#x2C6;Š đ??ľ = 0
Permutasie
Enige subversameling van â&#x20AC;&#x2122;n gegewe eindige versameling waarby die volgorde van die rangskikking van die elemente in die subversameling belangrik is.
Poisson-verdeling
Ĺ&#x2030; Stogastiese veranderlike (X), wat bestaan uit Ĺ&#x2030; stel diskrete positiewe waardes met die populasiegemiddeld en standaardafwyking van đ?&#x153;&#x2020;. Hierdie verdeling is vernoem na SimĂŠon Denis Poisson wat die eerste weergawe van hierdie verdeling in 1711 gepubliseer het.
Postulaat
Onbewysbare stelling wat aanvaar moet word om bepaalde feite te kan begryp.
Proporsie
Bladsy 74
Die verhouding wat gegee word deur Ĺ&#x2030; bepaalde eienskap
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes teenoor die populasie-/steekproefgrootte. Puntberaming
Ĺ&#x2030; Statistiek wat gebruik word om Ĺ&#x2030; konstante te beraam. Die berekende waarde, van Ĺ&#x2030; beramer, wat verkry is uit Ĺ&#x2030; steekproef word Ĺ&#x2030; â&#x20AC;&#x153;puntberamingâ&#x20AC;? genoem.
Samevoeging/Vereniging
Die waarskynlikheid dat twee of meer waarskynlikhede terselfdertyd of onderskeidelik sal plaasvind.
Snyding
Die waarskynlikheid dat twee of meer waarskynlikhede terselfdertyd sal plaasvind.
Statisties onafhanklik
Wanneer die gebeurtenis van A geen invloed het op die waarskynlikheid dat B sal plaasvind nie. Dan is gebeurtenisse A en B statisties onafhanklik van mekaar.
Steekproefruimte
Ĺ&#x2030; Volledige stel van alle moontlike uitkomste/resultate vir Ĺ&#x2030; eksperiment of waarnemingstudie.
Stelling
Ĺ&#x2030; Waarheid wat met feite bewys kan word.
Vertrouensinterval
Ĺ&#x2030; Interval, met â&#x20AC;&#x2122;n boonste en onderste limiet, waarbinne Ĺ&#x2030; populasie-konstante met đ?&#x203A;ź% sekerheid sal voorkom.
Verwagte waarde
Die waarde wat verwag word van Ĺ&#x2030; stogastiese veranderlike X. Daar word ook na die gemiddeld van X verwys as die verwagte waarde X.
Vlak van sekerheid
Die waarskynlikheid dat die populasie-konstante binne die vertrouensinterval sal voorkom.
Voorwaardelike
Dit is die waarskynlikheid dat Ĺ&#x2030; spesifieke gebeurtenis (đ??´) sal
waarskynlikheid
plaasvind, gegewe dat Ĺ&#x2030; ander gebeurtenis (đ??ľ) wel plaasgevind het. Dit beteken dat die feit dat đ??ľ wel plaasgevind het, die steekproefruimte in so Ĺ&#x2030; mate verminder dat dit đ??´ se waarskynlikheid sal beĂŻnvloed.
Waarskynlikheid
Die kans dat Ĺ&#x2030; spesifieke gebeurtenis binne die steekproefruimte sal plaasvind.
Waarskynlikheidsboom-
Ĺ&#x2030; Diagram wat alle moontlike gebeurtenisse, vir twee of meer
diagram
opeenvolgende gebeurtenisse, visueel voorstel. Die diagram lyk soos Ĺ&#x2030; boom wat vertak by elke gebeurtenis.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 75
GQM105 Inleiding tot elementêre kwantitatiewe metodes 2.4
Inleiding
ʼn Navorser wil dikwels vooruitskattings maak: Wat is die kans dat verkope gaan toeneem? Wat is die waarskynlikheid dat die aandelemark gaan daal? Om hierdie vrae te beantwoord moet waarskynlikhede bereken word. Praktiese vooruitskattings soos hierdie is egter nie die enigste rede waarom waarskynlikhede in die sillabus ingesluit is nie. Dit vorm ook die basis waarop hipotesetoetsing gedoen word, ʼn onderwerp wat ons in Studie-eenheid 3 sal behandel. Hierdie studie-eenheid gaan ʼn agtergrond oor waarskynlikhede bied. Daar gaan gekyk word na verskillende beginsels en reëls van waarskynlikhede. Daarna gaan spesifieke waarskynlikheidsverdelings bespreek word. Ons sal dan waarskynlikhede en die waarskynlikheidsverdelings gebruik as die basis van vertrouensintervalle. 2.5
Waarskynlikhede
Bestudeer die handboek paragrawe 4.1-4.9. As ons statistiese afleidings wil maak van die populasie op grond van die steekproef, is dit belangrik dat ons weet wat die betroubaarheid, akkuraatheid en vlak van sekerheid is. Ons gebruik waarskynlikheidsleer om dit te bepaal. Deur gebruik te maak van waarskynlikheidsleer kan ons die onsekerheid kwantifiseer en meet, veral as dit kom by besluite wat ons in ʼn onderneming moet neem. As ons weet met hoeveel onsekerheid ons te doen het, help dit ons om beter besluite te neem. Wacklerly, Mendenhall en Scheaffer (2008: 20) sê dat die term waarskynlikheid ʼn maatstaf is vir ʼn persoon se geloof/vertroue dat ʼn spesifieke gebeurtenis in die toekoms sal plaasvind. Davis, Pecar en Santana (2016: 132) wys ons daarop dat ʼn waarskynlikheid die manier is waarop ons die moontlikheid van ʼn gebeurtenis uitdruk as ʼn nommer tussen 0 en 1. 2.5.1
Basiese waarskynlikhede
Bestudeer die handboek paragrawe 4.1-4.3. Daar word onderskei tussen subjektiewe en objektiewe waarskynlikhede. Subjektiewe waarskynlikheid kan nie statisties gestaaf word nie en word nie in statistiese berekeninge gebruik nie. Byvoorbeeld, een vriend sê aan ʼn ander “daar is ʼn baie goeie waarskynlikheid dat ek aan die slaap gaan raak as ons daardie film kyk”. Die kanse dat daar statistiese data bestaan vir hierdie stelling is skaars. Vir die doel van hierdie vak word daar na objektiewe waarskynlikheid verwys. Dit is waarskynlikhede wat deur statistiek bereken kan word.
Bladsy 76
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Wanneer ons met waarskynlikhede werk, is daar Ĺ&#x2030; paar terme wat jy moet begryp alvorens ons kan begin: â&#x20AC;˘
Steekproefruimte: Ĺ&#x2030; Volledige stel van alle moontlike uitkomste/resultate vir Ĺ&#x2030; eksperiment of waarnemingstudie. Hierdie ruimte word voorgestel deur die blou agtergrond in Figuur 2.1 hieronder.
â&#x20AC;˘
Gebeurtenis: Ĺ&#x2030; Gebeurtenis is Ĺ&#x2030; subversameling van die steekproefruimte. Hierdie subversamelings word voorgestel deur die sirkels A en B in Figuur 2.1.
Figuur 2.1: Basiese Venn-diagram Die oudste manier om Ĺ&#x2030; waarskynlikheid te definieer is deur die klasieke waarskynlikheidskonsep waar alle uitkomste ewe moontlik is (Miller & Miller, 2014: 21):
đ?&#x2018;ˇ đ?&#x2018;¨ = Waar:
đ?&#x2019;&#x201C; đ?&#x2019;?
đ??´
= Ĺ&#x2030; gebeurtenis van een of ander aard
đ?&#x2018;&#x;
= die aantal uitkomste van gebeurtenis đ??´
đ?&#x2018;&#x203A;
= totale aantal moontlike uitkomste (steekproefruimte)
đ?&#x2018;&#x192;(đ??´) = waarskynlikheid dat gebeurtenis đ??´ plaasvind Formule 2.1: Klasieke waarskynlikheidbereking
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 77
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 2.1 As ek Ĺ&#x2030; gebalanseerde dobbelsteen rol, bereken die waarskynlikheid dat ek Ĺ&#x2030; vier sal rol. Oplossing: Daar is ses moontlike uitkomste: 1, 2, 3, 4, 5 en 6, dus is die steekproefruimte đ?&#x2019;? = đ?&#x;&#x201D;. Omdat ek die dobbelsteen slegs een keer gaan rol, kan daar net een uitslag wees, dus is die aantal uitkomste đ?&#x2019;&#x201C; = đ?&#x;?. Nou kan ons net die berekening doen: đ?&#x2019;&#x201C;
đ?&#x2018;ˇ đ?&#x2019;?đ?&#x2019;&#x17D; â&#x20AC;˛đ?&#x2019;? đ?&#x2019;&#x2014;đ?&#x2019;&#x160;đ?&#x2019;&#x2020;đ?&#x2019;&#x201C; đ?&#x2019;&#x2022;đ?&#x2019;&#x2020; đ?&#x2019;&#x201C;đ?&#x2019;?đ?&#x2019;? = đ?&#x2019;?
=
đ?&#x;? đ?&#x;&#x201D;
= đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x2022;
Daar is dus Ĺ&#x2030; 16,67% kans dat ek met een rol van Ĺ&#x2030; dobbelsteen Ĺ&#x2030; vier sal rol.
Doen nou Voorbeeld 4.1 in die handboek. 2.5.2
WaarskynlikheidsreĂŤls
In waarskynlikheidsleer is daar Ĺ&#x2030; paar eienskappe en reĂŤls van waarskynlikhede wat ons gebruik. Ons sal hierdie eienskappe en reĂŤls aan die hand van postulate en stellings behandel (Ĺ&#x2030; postulaat is Ĺ&#x2030; onbewysbare stelling wat aanvaar moet word om bepaalde feite te kan begryp). Daar word van studente verwag om hierdie postulate en stellings te ken, maar dit is nie nodig om dit te kan bewys nie. Hieronder volg Postulate 1 en 2:
Postulaat 1: Die waarskynlikheid van enige gebeurtenis is Ĺ&#x2030; positiewe reĂŤle getal, met ander woorde đ?&#x2018;&#x192;(đ??´) â&#x2030;Ľ 0 vir enige subversameling in die steekproefruimte. Postulaat 2: Die waarskynlikheid van die steekproefruimte đ?&#x2018;&#x2020; is altyd 1, met ander woorde đ?&#x2018;&#x192; đ?&#x2018;&#x2020; = 1. Dit sal altyd so wees omdat die steekproefruimte uit al die moontlike uitkomste bestaan, dus kan geen ander gebeurtenisse plaasvind nie.
Stelling 1:
As đ??´ Ĺ&#x2030; gebeurtenis is in Ĺ&#x2030; diskrete steekproefruimte đ?&#x2018;&#x2020;, dan is đ?&#x2018;&#x192;(đ??´) gelyk aan die som van al die individuele uitkomste waaruit gebeurtenis đ??´ saamgestel word.
Stelling 2:
As Ĺ&#x2030; eksperiment enige een van đ?&#x2018; verskillende uitkomste kan hĂŞ, wat ewe moontlik is, en as đ?&#x2018;&#x203A; van hierdie uitkomste saam Ĺ&#x2030; gebeurtenis đ??´ vorm, dan is die waarskynlikheid van gebeurtenis đ??´ đ?&#x2018;&#x203A; đ?&#x2018;&#x192; đ??´ = đ?&#x2018;
Bladsy 78
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 2.2 As ons Ĺ&#x2030; gebalanseerde muntstuk twee keer in die lug opskiet, wat sal die waarskynlikheid wees dat hierdie muntstuk ten minste een keer op sy kop sal val? Oplossing: Die steekproefruimte word soos volg saamgestel: đ?&#x2018;ş = đ?&#x2018;˛đ?&#x2018;˛, đ?&#x2018;˛đ?&#x2018;ş, đ?&#x2018;şđ?&#x2018;˛, đ?&#x2018;şđ?&#x2018;ş waar đ?&#x2018;˛ en đ?&#x2018;ş, kop en stert onderskeidelik voorstel. Omdat ons aanvaar dat die muntstuk gebalanseerd is, is al vier đ?&#x;?
hierdie uitkomste ewe moontlik en is elkeen van hierdie se waarskynlikheid . As đ?&#x2018;¨ die đ?&#x;&#x2019;
gebeurtenis hierbo voorstel (dat die muntstuk ten minste een keer op sy kop sal val), word đ?&#x2018;¨ soos volg saamgestel: đ?&#x2018;¨ = đ?&#x2018;˛đ?&#x2018;˛, đ?&#x2018;˛đ?&#x2018;ş, đ?&#x2018;şđ?&#x2018;˛ . Die waarskynlikheid van đ?&#x2018;¨ kan dus soos volg bereken word: đ?&#x2018;ˇ đ?&#x2018;¨
= đ?&#x2018;ˇ đ?&#x2018;˛đ?&#x2018;˛ + đ?&#x2018;ˇ đ?&#x2018;˛đ?&#x2018;ş + đ?&#x2018;ˇ đ?&#x2018;şđ?&#x2018;˛ đ?&#x;?
đ?&#x;?
đ?&#x;?
đ?&#x;&#x2018;
đ?&#x;&#x2019;
đ?&#x;&#x2019;
đ?&#x;&#x2019;
đ?&#x;&#x2019;
= + + =
Stelling 3:
As đ??´ en đ??´â&#x20AC;˛ komplementĂŞre gebeurtenisse in Ĺ&#x2030; steekproefruimte đ?&#x2018;&#x2020; is, dan is đ?&#x2018;&#x192; đ??´â&#x20AC;˛ = 1 â&#x2C6;&#x2019; đ?&#x2018;&#x192;(đ??´).
Voorbeeld 2.2 (vervolg) As ons Ĺ&#x2030; gebalanseerde muntstuk twee keer in die lug opskiet, wat sal die waarskynlikheid wees dat hierdie muntstuk glad nie een keer op sy kop sal val nie? Oplossing: đ?&#x2018;ˇ đ?&#x2018;¨Â§
=đ?&#x;?â&#x2C6;&#x2019;đ?&#x2018;ˇ đ?&#x2018;¨ đ?&#x;&#x2018;
đ?&#x;?
đ?&#x;&#x2019;
đ?&#x;&#x2019;
=đ?&#x;?â&#x2C6;&#x2019; =
Doen nou Voorbeeld 4.2 in die handboek.
Stelling 4:
đ?&#x2018;&#x192; đ?&#x2018;&#x2020; § = 0 vir enige steekproefruimte đ?&#x2018;&#x2020;.
Stelling 5:
0 â&#x2030;¤ đ?&#x2018;&#x192;(đ??´) â&#x2030;¤ 1 vir enige gebeurtenis đ??´.
Stelling 6:
As đ??´ en đ??ľ enige twee gebeurtenisse in die steekproefruimte đ?&#x2018;&#x2020; is, dan is đ?&#x2018;&#x192; đ??´ â&#x2C6;Ş đ??ľ = đ?&#x2018;&#x192; đ??´ + đ?&#x2018;&#x192; đ??ľ â&#x2C6;&#x2019; đ?&#x2018;&#x192;(đ??´ â&#x2C6;Š đ??ľ).
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 79
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Stelling 7:
đ?&#x2018;&#x192; đ??´ â&#x2C6;Š đ??ľ = đ?&#x2018;&#x192;(đ??´|đ??ľ)Ă&#x2014;đ?&#x2018;&#x192;(đ??ľ) vir gebeurtenisse wat statisties afhanklik is van mekaar.
Stelling 8:
đ?&#x2018;&#x192; đ??´ â&#x2C6;Š đ??ľ = đ?&#x2018;&#x192;(đ??´)Ă&#x2014;đ?&#x2018;&#x192;(đ??ľ) vir gebeurtenisse wat statisties onafhanklik is van mekaar.
Stelling 9: 2.5.3
Gebeurtenisse đ??´ en đ??ľ is statisties onafhanklik indien đ?&#x2018;&#x192; đ??´ đ??ľ = đ?&#x2018;&#x192;(đ??´).
Belangrike konsepte van waarskynlikhede
Bestudeer die handboek paragraaf 4.4. Die volgende konsepte ten opsigte van verskillende gebeurtenisse binne Ĺ&#x2030; steekproefruimte is belangrik wanneer ons die waarskynlikhede moet bereken. Daar sal deurlopend, tensy anders vermeld, verwys word na die volgende Venn-diagram:
Figuur 2.2: Venn-diagram v Snyding van gebeurtenisse Ĺ&#x2030; Snyding van gebeurtenisse is waar twee (of meer) gebeurtenisse oorvleuel. Dit staan ook bekend as Ĺ&#x2030; â&#x20AC;&#x153;gesamentlike gebeurtenisâ&#x20AC;? en word deur die area gemerk a voorgestel in Figuur 2.2. Die notasie wat ons hiervoor gebruik is đ?&#x2018;&#x17D; = đ??´ â&#x2C6;Š đ??ľ v Samevoeging Ĺ&#x2030; Samevoeging van gebeurtenisse is waar twee (of meer) gebeurtenisse bymekaargesit word. In Figuur 2.2 sal dit wees waar đ?&#x2018;&#x17D; + đ?&#x2018;? + đ?&#x2018;?.
Bladsy 80
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementêre kwantitatiewe metodes v Onderling uitsluitend Dit is wanneer daar twee gebeurtenisse is, maar ʼn observasie kan nie aan beide behoort nie. Dit is die geval waar ʼn Lego-blokkie (wat ewekansig uit ʼn boks getrek word) nie blou EN geel kan wees nie. Hierdie Lego-blokkie kan slegs blou OF geel wees. Sien Figuur 2.3 hieronder om die Venn-diagram te sien van onderling uitsluitende gebeurtenisse:
Figuur 2.3: Venn-diagram van onderling uitsluitende gebeurtenisse v Subversamelings van ʼn gebeurtenis Sien Figuur 2.4 hieronder. Gebeurtenis B is byvoorbeeld dat die motor (wat ewekansig gekies word) ʼn BMW is en gebeurtenis A is dat ʼn BMW (wat ewekansig gekies word) ʼn rooi BMW sal wees. Dus word gebeurtenis A volledig vervat in gebeurtenis B. In hierdie geval sal die waarskynlikheid van gebeurtenis A altyd kleiner wees as die waarskynlikheid van gebeurtenis B.
Figuur 2.4: Subversameling van ʼn gebeurtenis Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 81
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes v KomplementĂŞre gebeurtenisse KomplementĂŞre gebeurtenisse is twee gebeurtenisse wat Ĺ&#x2030; geheel vorm. Met ander woorde, Ĺ&#x2030; steekproefruimte bestaan uit Ĺ&#x2030; gebeurtenis en â&#x20AC;&#x153;die resâ&#x20AC;?. Hierdie twee gebeurtenisse oorvleuel glad nie. đ?&#x2018;&#x192;(đ??´ â&#x2C6;Š đ??´Â§ ) is altyd 0. Sien Figuur 2.5 hieronder.
Figuur 2.5: KomplementĂŞre gebeurtenisse Werk weer deur Stelling 3 en Voorbeeld 2.2. Voorbeeld 2.3 Ĺ&#x2030; Navorser stel belang in die waarskynlikheid dat Ĺ&#x2030; speler wat Ĺ&#x2030; gebalanseerde dobbelsteen rol, Ĺ&#x2030; drie sal rol. Vind die komplementĂŞre waarskynlikheid, met ander woorde dat Ĺ&#x2030; speler enige ander getal sal rol. Oplossing: đ?&#x;?
đ?&#x2018;ˇ đ?&#x2018;¨
=
đ?&#x2018;ˇ đ?&#x2018;¨Â§
=đ?&#x;?â&#x2C6;&#x2019;đ?&#x2018;ˇ đ?&#x2018;¨
đ?&#x;&#x201D;
đ?&#x;?
đ?&#x;&#x201C;
đ?&#x;&#x201D;
đ?&#x;&#x201D;
=đ?&#x;?â&#x2C6;&#x2019; =
v Statisties onafhanklike gebeurtenisse Gebeurtenis đ??´ en gebeurtenis đ??ľ is statisties onafhanklik as die een gebeurtenis plaasvind en dit geen effek het op die ander gebeurtenis nie (en vice versa). Verwys na Stellings 7-9 in paragraaf 2.5.2 in die gids. Wegner (2016: 113) waarsku ons om nie statisties onafhanklik en onderling uitsluitend met mekaar te verwar nie. Maak seker dat jy weet wat die verskil tussen hierdie twee konsepte is. Bladsy 82
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Doen nou Voorbeeld 4.3 in die handboek. 2.5.4
Berekening van waarskynlikhede
Bestudeer die handboek paragraaf 4.5. v Marginale waarskynlikhede Hierdie is die waarskynlikheid dat Ĺ&#x2030; enkele gebeurtenis sal plaasvind. Verwys na Formule 2.1 wat hierbo genoem is in paragraaf 2.5.1. v Gesamentlike waarskynlikhede In hierdie geval word die waarskynlikheid dat twee gebeurtenisse gelyktydig plaasvind, bereken.
đ?&#x2018;ˇ đ?&#x2018;¨â&#x2C6;Šđ?&#x2018;Š = Waar:
đ?&#x2019;&#x201C; đ?&#x2019;?
đ??´
= Ĺ&#x2030; gebeurtenis van een of ander aard
đ??ľ
= Ĺ&#x2030; gebeurtenis van een of ander aard
đ?&#x2018;&#x;
= die aantal uitkomste van gebeurtenis đ??´ EN gebeurtenis đ??ľ
đ?&#x2018;&#x203A;
= totale aantal moontlike uitkomste (steekproefruimte)
đ?&#x2018;&#x192;(đ??´ â&#x2C6;Š đ??ľ) = waarskynlikheid dat gebeurtenis đ??´ EN gebeurtenis đ??ľ plaasvind Formule 2.2: Gesamentlike waarskynlikheidbereking v Saamgevoegde waarskynlikhede In hierdie geval word die waarskynlikheid bereken dat gebeurtenis đ??´ OF gebeurtenis đ??ľ sal plaasvind. Om die saamgevoegde waarskynlikheid te bereken waar die twee gebeurtenisse onderling uitsluitend is, kan ons die volgende formule gebruik:
đ?&#x2018;ˇ đ?&#x2018;¨ â&#x2C6;Ş đ?&#x2018;Š = đ?&#x2018;ˇ đ?&#x2018;¨ + đ?&#x2018;ˇ(đ?&#x2018;Š) Waar:
đ??´
= Ĺ&#x2030; gebeurtenis van een of ander aard
đ??ľ
= Ĺ&#x2030; gebeurtenis van een of ander aard
đ?&#x2018;&#x192;(đ??´)
= waarskynlikheid dat gebeurtenis đ??´ sal plaasvind
đ?&#x2018;&#x192;(đ??ľ)
= waarskynlikheid dat gebeurtenis đ??ľ sal plaasvind
đ?&#x2018;&#x192;(đ??´ â&#x2C6;Ş đ??ľ) = waarskynlikheid dat gebeurtenis đ??´ OF gebeurtenis đ??ľ plaasvind Formule 2.3: Saamgevoegde waarskynlikheidsberekening waar die gebeurtenisse onderling uitsluitend is
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 83
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes In die geval waar die twee gebeurtenisse nie onderling uitsluitend is nie, kan ons die volgende formule gebruik:
đ?&#x2018;ˇ đ?&#x2018;¨ â&#x2C6;Ş đ?&#x2018;Š = đ?&#x2018;ˇ đ?&#x2018;¨ + đ?&#x2018;ˇ đ?&#x2018;Š â&#x2C6;&#x2019; đ?&#x2018;ˇ(đ?&#x2018;¨ â&#x2C6;Š đ?&#x2018;Š) Waar:
đ??´
= Ĺ&#x2030; gebeurtenis van een of ander aard
đ??ľ
= Ĺ&#x2030; gebeurtenis van een of ander aard
đ?&#x2018;&#x192;(đ??´)
= waarskynlikheid dat gebeurtenis đ??´ sal plaasvind
đ?&#x2018;&#x192;(đ??ľ)
= waarskynlikheid dat gebeurtenis đ??ľ sal plaasvind
đ?&#x2018;&#x192;(đ??´ â&#x2C6;Š đ??ľ) = waarskynlikheid dat gebeurtenis đ??´ EN gebeurtenis đ??ľ plaasvind đ?&#x2018;&#x192;(đ??´ â&#x2C6;Ş đ??ľ) = waarskynlikheid dat gebeurtenis đ??´ OF gebeurtenis đ??ľ plaasvind Formule 2.4: Saamgevoegde waarskynlikheidsberekening waar die gebeurtenisse nie onderling uitsluitend is nie Beskou Stelling 6 en Figuur 2.2 hierbo. Dit mag dalk vreemd lyk om die snyding van gebeurtenis đ??´ en đ??ľ af te trek, maar die rede daarvoor is eintlik baie eenvoudig: đ?&#x2018;&#x192; đ??´ =đ?&#x2018;?+đ?&#x2018;&#x17D; đ?&#x2018;&#x192; đ??ľ =đ?&#x2018;?+đ?&#x2018;&#x17D; đ?&#x2018;&#x192; đ??´â&#x2C6;Šđ??ľ =đ?&#x2018;&#x17D; As ons die waarskynlikheid van đ??´ en die waarskynlikheid van đ??ľ bymekaartel, dan đ?&#x2018;&#x192; đ??´ + đ?&#x2018;&#x192; đ??ľ = đ?&#x2018;? + đ?&#x2018;&#x17D; + đ?&#x2018;? + đ?&#x2018;&#x17D; = đ?&#x2018;? + đ?&#x2018;? + 2đ?&#x2018;&#x17D; đ?&#x2018;&#x17D; word dus twee keer getel. Om dit reg te maak moet ons đ?&#x2018;&#x17D; dus weer aftrek: đ?&#x2018;&#x192; đ??´â&#x2C6;Şđ??ľ = đ?&#x2018;?+đ?&#x2018;&#x17D; + đ?&#x2018;?+đ?&#x2018;&#x17D; â&#x2C6;&#x2019;đ?&#x2018;&#x17D; =đ?&#x2018;&#x17D;+đ?&#x2018;?+đ?&#x2018;? In die geval waar waarskynlikheid van đ??´ en die waarskynlikheid van đ??ľ nie oorvleuel nie (waar hulle onderling uitsluitend is), is đ?&#x2018;&#x192; đ??´ â&#x2C6;Š đ??ľ = 0. Sien Voorbeeld 2.4 hieronder waar die waarskynlikheid van twee gebeurtenisse bereken word. Voorbeeld 2.4 In Ĺ&#x2030; gegoede woonbuurt is die waarskynlikheid dat Ĺ&#x2030; huisgesin (wat ewekansig gekies word) Ĺ&#x2030; rooi motor, â&#x20AC;&#x2122;n BMW of Ĺ&#x2030; rooi BMW besit onderskeidelik 0,43, 0,28 en 0,12. Wat is die waarskynlikheid dat Ĺ&#x2030; huisgesin (wat ewekansig gekies word) Ĺ&#x2030; rooi motor of â&#x20AC;&#x2122;n BMW sal besit?
Bladsy 84
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Oplossing: As đ?&#x2018;¨ die gebeurtenis is dat die familie Ĺ&#x2030; rooi motor besit en đ?&#x2018;Š die gebeurtenis is dat die familie Ĺ&#x2030; BMW besit, dan is đ?&#x2018;ˇ đ?&#x2018;¨ = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x2018;, đ?&#x2018;ˇ đ?&#x2018;Š = đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2013; en đ?&#x2018;ˇ đ?&#x2018;¨ â&#x2C6;Š đ?&#x2018;Š = đ?&#x;&#x17D;, đ?&#x;?đ?&#x;?. Dan kan die waarskynlikheid dat Ĺ&#x2030; huisgesin (wat ewekansig gekies word) Ĺ&#x2030; rooi motor of â&#x20AC;&#x2122;n BMW sal besit, soos volg bereken word: đ?&#x2018;ˇ đ?&#x2018;¨â&#x2C6;Şđ?&#x2018;Š =đ?&#x2018;ˇ đ?&#x2018;¨ +đ?&#x2018;ˇ đ?&#x2018;Š â&#x2C6;&#x2019;đ?&#x2018;ˇ đ?&#x2018;¨â&#x2C6;Šđ?&#x2018;Š = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x2018; + đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2013; â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;?đ?&#x;? = đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014; Dus is die waarskynlikheid dat Ĺ&#x2030; huisgesin (wat ewekansig gekies word) Ĺ&#x2030; rooi motor of BMW sal besit 59%. Jy moet egter seker wees wanneer gebeurtenisse onderling uitsluitend is en wanneer nie, sodat jy die regte formule sal gebruik. v Voorwaardelike waarskynlikhede Dit is die waarskynlikheid dat Ĺ&#x2030; spesifieke gebeurtenis (đ??´) sal plaasvind, gegewe dat Ĺ&#x2030; ander gebeurtenis (đ??ľ) wel plaasgevind het. Dit beteken dat die feit dat đ??ľ wel plaasgevind het, die steekproefruimte in so Ĺ&#x2030; mate verminder dat dit đ??´ se waarskynlikheid sal beĂŻnvloed.
đ?&#x2018;ˇ đ?&#x2018;¨đ?&#x2018;Š = Waar:
đ?&#x2018;ˇ(đ?&#x2018;¨ â&#x2C6;Š đ?&#x2018;Š) đ?&#x2018;ˇ(đ?&#x2018;Š)
đ??´
= Ĺ&#x2030; gebeurtenis van een of ander aard
đ??ľ
= Ĺ&#x2030; gebeurtenis van een of ander aard
đ?&#x2018;&#x192;(đ??ľ) = waarskynlikheid dat gebeurtenis đ??ľ sal plaasvind đ?&#x2018;&#x192;(đ??´ â&#x2C6;Š đ??ľ)
= waarskynlikheid dat gebeurtenis đ??´ EN gebeurtenis đ??ľ plaasvind
đ?&#x2018;&#x192;(đ??´|đ??ľ)
= waarskynlikheid dat gebeurtenis đ??´ gebeur indien gebeurtenis đ??ľ reeds plaasgevind het
Formule 2.5: Voorwaardelike waarskynlikheidsberekening Sien ook Stellings 7-9 omdat dit verband hou met statistiese afhanklikheid. Voorbeeld 2.5 Honderd-en-vyftig (150) studente word ewekansig gekies op Ĺ&#x2030; universiteitskampus. Die kruisfrekwensietabel hieronder bevat die gesamentlike frekwensies vir die twee kategoriese stogastiese veranderlikes â&#x20AC;&#x2DC;geslagâ&#x20AC;&#x2122; en â&#x20AC;&#x2DC;programâ&#x20AC;&#x2122;.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 85
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
GESLAG PROGRAM
Vroulik
Manlik
TOTAAL
BCom Bemarking
19
28
47
BCom Kommunikasiebestuur
25
36
61
BSc Wiskunde
12
16
28
BA Geskiedenis
6
8
14
TOTAAL
62
88
150
Bereken die volgende waarskynlikhede: a) Dat Ĺ&#x2030; ewekansig gekose student vroulik sal wees. b) Dat Ĺ&#x2030; ewekansig gekose student BSc Wiskunde sal studeer. c) Dat Ĺ&#x2030; ewekansig gekose student manlik sal wees en BA Geskiedenis sal studeer. d) Dat Ĺ&#x2030; ewekansig gekose student BCom Kommunikasiebestuur of BCom Bemarking sal studeer. e) Dat Ĺ&#x2030; ewekansig gekose student vroulik sal wees of BCom Bemarking sal studeer. f)
Dat Ĺ&#x2030; ewekansig gekose student nie Ĺ&#x2030; BCom graad sal studeer nie.
g) Dat Ĺ&#x2030; ewekansig gekose student Ĺ&#x2030; BCom Bemarking-graad sal studeer, gegee die feit dat ons weet dit Ĺ&#x2030; vroulike student is. Oplossing: a) Daar is 62 vroulike studente in die steekproefruimte wat bestaan uit Ĺ&#x2030; totaal van 150 studente, dus: đ?&#x2018;ˇ đ?&#x2019;&#x2014;đ?&#x2019;&#x201C;đ?&#x2019;?đ?&#x2019;&#x2013;đ?&#x2019;?đ?&#x2019;&#x160;đ?&#x2019;&#x152;
đ?&#x2019;&#x201C;
= đ?&#x2019;?
=
đ?&#x;&#x201D;đ?&#x;? đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
= đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2018;
Daar is dus Ĺ&#x2030; 41,33% kans dat Ĺ&#x2030; student wat ewekansig gekies word vroulik sal wees. b) Daar is 28 studente wat BSc Wiskunde studeer in die steekproefruimte, wat bestaan uit 150 studente, dus: đ?&#x2019;&#x201C;
đ?&#x2018;ˇ đ?&#x2018;Šđ?&#x2018;şđ?&#x2019;&#x201E; đ?&#x2018;žđ?&#x2019;&#x160;đ?&#x2019;&#x201D;đ?&#x2019;&#x152;đ?&#x2019;&#x2013;đ?&#x2019;?đ?&#x2019;&#x2026;đ?&#x2019;&#x2020; = đ?&#x2019;?
=
Bladsy 86
đ?&#x;?đ?&#x;&#x2013; đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
= đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2013;đ?&#x;&#x201D;đ?&#x;&#x2022;
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Daar is dus Ĺ&#x2030; 18,67% kans dat Ĺ&#x2030; student wat ewekansig gekies word BSc Wiskunde sal studeer. c) Daar is 88 manlike studente (đ?&#x2018;¨) en 14 studente wat BA Geskiedenis (đ?&#x2018;Š) studeer, maar daar is slegs 8 manlike studente wat BA Geskiedenis studeer, dus: đ?&#x2019;&#x201C;
đ?&#x2018;ˇ đ?&#x2018;¨â&#x2C6;Šđ?&#x2018;Š = đ?&#x2019;?
=
đ?&#x;&#x2013;
= đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x201C;đ?&#x;&#x2018;đ?&#x;&#x2018;
đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
Daar is dus Ĺ&#x2030; 5,33% kans dat Ĺ&#x2030; student wat ewekansig gekies word Ĺ&#x2030; manlike BA Geskiedenisstudent sal wees. d) Daar is 61 studente wat BCom Kommunikasiebestuur (đ?&#x2018;¨) en 47 studente wat BCom Bemarking (đ?&#x2018;Š) studeer in die steekproefruimte, wat bestaan uit Ĺ&#x2030; totaal van 150 studente. Daar is geen studente wat beide BCom Kommunikasiebestuur en BCom Bemarking studeer nie. đ?&#x2018;ˇ đ?&#x2018;¨â&#x2C6;Şđ?&#x2018;Š =đ?&#x2018;ˇ đ?&#x2018;¨ +đ?&#x2018;ˇ đ?&#x2018;Š â&#x2C6;&#x2019;đ?&#x2018;ˇ đ?&#x2018;¨â&#x2C6;Šđ?&#x2018;Š =
đ?&#x;&#x201D;đ?&#x;? đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
+
đ?&#x;&#x2019;đ?&#x;&#x2022; đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
â&#x2C6;&#x2019;
đ?&#x;&#x17D; đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
=
đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2013; đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
= đ?&#x;&#x17D;, đ?&#x;&#x2022;đ?&#x;?
Daar is dus Ĺ&#x2030; 72% kans dat Ĺ&#x2030; student wat ewekansig gekies word Ĺ&#x2030; BCom Kommunikasiebestuur- of BCom Bemarking-graad sal studeer. e) Daar is 62 vroulike studente (đ?&#x2018;¨) en 47 studente wat BCom Bemarking (đ?&#x2018;Š) studeer in die steekproefruimte van 150 studente. Daar is 19 vroulike BCom Bemarkingstudente. đ?&#x2018;ˇ đ?&#x2018;¨ â&#x2C6;Ş đ?&#x2018;Š = đ?&#x2018;ˇ(đ?&#x2018;¨) + đ?&#x2018;ˇ(đ?&#x2018;Š) â&#x2C6;&#x2019; đ?&#x2018;ˇ đ?&#x2018;¨ â&#x2C6;Š đ?&#x2018;Š =
đ?&#x;&#x201D;đ?&#x;? đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
+
đ?&#x;&#x2019;đ?&#x;&#x2022; đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
â&#x2C6;&#x2019;
đ?&#x;?đ?&#x;&#x2014; đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
=
đ?&#x;&#x2014;đ?&#x;&#x17D; đ?&#x;?đ?&#x;&#x201C;đ?&#x;&#x17D;
= đ?&#x;&#x17D;, đ?&#x;&#x201D;
Daar is dus Ĺ&#x2030; 60% kans dat Ĺ&#x2030; student Ĺ&#x2030; BCom Kommunikasie- of BCom Bemarkinggraad sal studeer. f)
In Vraag (e) het ons die waarskynlikheid van bereken dat Ĺ&#x2030; student wat ewekansig gekies word Ĺ&#x2030; BCom graad (đ?&#x2018;Ş) sal studeer. Nou moet ons die komplement daarvan bereken. Om dit te kan doen gebruik ons Stelling 3 wat hierbo behandel is in paragraaf 2.5.2: đ?&#x2018;ˇ đ?&#x2018;ŞÂ§
=đ?&#x;?â&#x2C6;&#x2019;đ?&#x2018;ˇ đ?&#x2018;Ş = đ?&#x;? â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x201D; = đ?&#x;&#x17D;, đ?&#x;&#x2019;
Daar is dus Ĺ&#x2030; 40% kans dat Ĺ&#x2030; student nie Ĺ&#x2030; BCom-graad sal studeer nie. g) Daar is 19 dames wat Ĺ&#x2030; BCom Bemarking-graad studeer (đ?&#x2018;¨ â&#x2C6;Š đ?&#x2018;Š) in die steekproefruimte van 62 vroulike studente (đ?&#x2018;Š). Omdat ons weet dat die student Ĺ&#x2030; vroulike student gaan wees, verminder dit die steekproefruimte.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 87
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ?&#x2018;ˇ đ?&#x2018;¨đ?&#x2018;Š
=
đ?&#x2018;ˇ đ?&#x2018;¨â&#x2C6;Šđ?&#x2018;Š
=
đ?&#x;?đ?&#x;&#x2014;
đ?&#x2018;ˇ đ?&#x2018;Š đ?&#x;&#x201D;đ?&#x;?
= đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x201D;đ?&#x;&#x201C;
Daar is dus Ĺ&#x2030; 30,65% kans dat Ĺ&#x2030; student wat ewekansig gekies word Ĺ&#x2030; BCom Bemarking-graad sal studeer, gegee dat ons weet dit Ĺ&#x2030; vroulike student is. Doen nou Voorbeeld 4.4 en 4.5 in die handboek. 2.5.5
Waarskynlikheidsvertakkingdiagram
Dit is Ĺ&#x2030; grafiese metode om die uitkomste van twee of meer gebeurtenisse, wat in volgorde gebeur, voor te stel. Voorbeeld 2.6 Ĺ&#x2030; Eksperiment word gedoen onder kleuters. In die eerste rondte moet elke kleuter kies tussen Ĺ&#x2030; rooi en Ĺ&#x2030; groen bal. Die eksperiment het getoon dat 3 uit elke 4 kleuters die groen bal sal kies. In die tweede rondte moet hulle kies tussen Ĺ&#x2030; blou, geel en oranje bal. Die eksperiment het getoon dat slegs 1 uit 10 kleuters die blou bal kies, 1 uit 2 die geel bal en 2 uit 5 die oranje bal. Stel die resultate van hierdie eksperiment voor deur middel van Ĺ&#x2030; waarskynlikheidsvertakkingdiagram. Oplossing: A = rooi bal, B = groen bal, X = blou bal, Y = geel bal, X = oranje bal
Figuur 2.6: Waarskynlikheidsvertakkingdiagram
Bladsy 88
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Let daarop dat: đ?&#x2018;ˇ đ?&#x2018;¨ = đ?&#x2018;ˇ đ?&#x2018;¨ â&#x2C6;Š đ?&#x2018;ż + đ?&#x2018;ˇ đ?&#x2018;¨ â&#x2C6;Š đ?&#x2019;&#x20AC; + đ?&#x2018;ˇ đ?&#x2018;¨ â&#x2C6;Š đ?&#x2019; = đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x201C; đ?&#x2018;ˇ đ?&#x2018;Š = đ?&#x2018;ˇ đ?&#x2018;Š â&#x2C6;Š đ?&#x2018;ż + đ?&#x2018;ˇ đ?&#x2018;Š â&#x2C6;Š đ?&#x2019;&#x20AC; + đ?&#x2018;ˇ đ?&#x2018;Š â&#x2C6;Š đ?&#x2019; = đ?&#x;&#x17D;, đ?&#x;&#x2022;đ?&#x;&#x201C; đ?&#x2018;ˇ đ?&#x2018;¨ +đ?&#x2018;ˇ đ?&#x2018;Š =đ?&#x;? Doen nou Voorbeeld 4.6 in die handboek. 2.5.6
TelreĂŤls
Bestudeer die handboek paragraaf 4.8. Om waarskynlikhede te kan bereken moet ons gebeurtenisse en moontlike uitkomste tel. Ons kan waarskynlikheidsvertakkingdiagramme teken en die moontlike uitkomste en die gebeurtenisse tel, maar dit kan lank vat om te doen en ons sal heel waarskynlik Ĺ&#x2030; fout of twee langs die pad maak. As ons weet hoe om kombinasies en permutasies te bereken, is dit baie makliker. v VermenigvuldigingsreĂŤl Die eerste reĂŤl waarmee ons te doen kry, is die reĂŤl van vermenigvuldiging.
ReĂŤl 1:
Die totale aantal unieke maniere waarop đ?&#x2018;&#x203A; voorwerpe gerangskik kan word, is gelyk aan đ?&#x2018;&#x203A;-fakulteit.
Fakulteite kan soos volg bereken word: đ?&#x2019;?! = đ?&#x2019;?-fakulteit = đ?&#x2019;?Ă&#x2014; đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x;? Ă&#x2014; đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x;? Ă&#x2014; đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x;&#x2018; â&#x20AC;ŚĂ&#x2014;đ?&#x;&#x2018;Ă&#x2014;đ?&#x;?Ă&#x2014;đ?&#x;? Let daarop dat 0! = 1 MS Excel-formule:
=FACT(đ?&#x2019;?) Formule 2.6: Berekening van đ?&#x2019;?-fakulteit (đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x;?) Voorbeeld 2.7
Bereken die waarde van 4!. Oplossing: đ?&#x;&#x2019;! = đ?&#x;&#x2019;Ă&#x2014;đ?&#x;&#x2018;Ă&#x2014;đ?&#x;?Ă&#x2014;đ?&#x;? = đ?&#x;?đ?&#x;&#x2019;
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 89
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 2.8 Jy het vyf verskillende gekleurde balle, naamlik rooi, groen, blou, geel en oranje. Op hoeveel verskillende maniere kan hierdie vyf balle gerangskik word? Oplossing: Dit is vir Ĺ&#x2030; enkele gebeurtenis: om die balle te rangskik. Die aantal verskillende (unieke) maniere waarop die balle gerangskik kan word, word gegee deur: đ?&#x;&#x201C;! = đ?&#x;&#x201C;Ă&#x2014;đ?&#x;&#x2019;Ă&#x2014;đ?&#x;&#x2018;Ă&#x2014;đ?&#x;?Ă&#x2014;đ?&#x;? = đ?&#x;?đ?&#x;?đ?&#x;&#x17D; Die vyf balle kan dus op 120 verskillende maniere gerangskik word. Doen nou Voorbeeld 4.8 in die handboek. ReĂŤl 2:
As Ĺ&#x2030; ewekansige prosedure đ?&#x2018;&#x203A;( moontlike uitkomste het vir gebeurtenis 1, đ?&#x2018;&#x203A;* moontlike uitkomste vir gebeurtenis 2, ..., đ?&#x2018;&#x203A;² moontlike uitkomste het vir gebeurtenis đ?&#x2018;&#x2014;, dan is die totale aantal moontlike uitkomste gelyk aan: đ?&#x2018;&#x203A;( Ă&#x2014;đ?&#x2018;&#x203A;* Ă&#x2014;đ?&#x2018;&#x203A;+ Ă&#x2014; â&#x20AC;ŚĂ&#x2014;đ?&#x2018;&#x203A;²
Voorbeeld 2.9 Wanneer jy Ĺ&#x2030; motor koop, kan jy kies tussen Ĺ&#x2030; gesinsmotor, bakkie en sportmotor. Hierdie motors kom in ses kleure, naamlik rooi, groen, geel, wit, blou en swart. Jy kan verder kies tussen sitplekoortreksels van plastiek, lap, kunsleer en egte leer. Op hoeveel verskillende/unieke wyses kan jy Ĺ&#x2030; motor bestel? Oplossing: Daar is drie verskillende gebeurtenisse: die tipe (đ?&#x2019;?đ?&#x;? = đ?&#x;&#x2018;), die kleur (đ?&#x2019;?đ?&#x;? = đ?&#x;&#x201D;) en die sitplekoortreksel (đ?&#x2019;?đ?&#x;&#x2018; = đ?&#x;&#x2019;). Die aantal moontlike (unieke) permutasies van Ĺ&#x2030; bestelling is: đ?&#x2019;?đ?&#x;? Ă&#x2014;đ?&#x2019;?đ?&#x;? Ă&#x2014;đ?&#x2019;?đ?&#x;&#x2018; = đ?&#x;&#x2018;Ă&#x2014;đ?&#x;&#x201D;Ă&#x2014;đ?&#x;&#x2019; = đ?&#x;&#x2022;đ?&#x;? Daar is dus 72 unieke bestellings wat jy kan maak vir Ĺ&#x2030; motor wat in jou smaak gaan val.
Doen nou Voorbeeld 4.9 in die handboek. Wanneer ons Ĺ&#x2030; subversameling van objekte (đ?&#x2018;&#x;) trek uit al die moontlike uitkomste (đ?&#x2018;&#x203A;), dan kan ons die permutasie- of kombinasiereĂŤl gebruik om te bepaal op hoeveel verskillende maniere hierdie subversamelings saamgestel kan word. Bladsy 90
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes v PermutasiereĂŤl Ĺ&#x2030; Permutasie is die aantal unieke maniere waarop Ĺ&#x2030; subversameling van đ?&#x2018;&#x;
ReĂŤl 3:
objekte getrek kan word uit Ĺ&#x2030; groter steekproefruimte en die volgorde waarin hierdie objekte getrek word belangrik is.
đ?&#x2019;?đ?&#x2018;ˇ đ?&#x2019;&#x201C;
Waar:
=
đ?&#x2019;?! đ?&#x2019;?â&#x2C6;&#x2019;đ?&#x2019;&#x201C; !
đ?&#x2018;&#x;
= die aantal objekte wat op Ĺ&#x2030; slag getrek word
đ?&#x2018;&#x203A;
= die totale aantal objekte waaruit daar getrek kan word =PURMUT(đ?&#x2019;?, đ?&#x2019;&#x201C;)
MS Excel-formule:
Formule 2.7: Berekening van Ĺ&#x2030; permutasie Voorbeeld 2.10 Julle is Ĺ&#x2030; vriendekring van vyf vriende, naamlik Jan, Koos, Piet, Johan en jy. Julle hou elke maand Ĺ&#x2030; loting. Die eerste plek wen R500, tweede plek R200 en derde plek R100. Bereken: a) Op hoeveel verskillende maniere Ĺ&#x2030; eerste, tweede en derde plek uit julle vriendekring getrek kan word. b) Die waarskynlikheid dat Piet eerste plek, Jan tweede plek en Koos derde plek sal kry. Oplossing: Dit is belangrik in watter volgorde die pryse getrek word omdat elke plek Ĺ&#x2030; ander prys het. đ?&#x2019;?đ?&#x2018;ˇ đ?&#x2019;&#x201C;
= =
đ?&#x2019;?! đ?&#x2019;?mđ?&#x2019;&#x201C; ! đ?&#x;&#x201C;! đ?&#x;&#x201C;mđ?&#x;&#x2018; !
=
đ?&#x;&#x201C;! đ?&#x;?!
=
đ?&#x;?đ?&#x;?đ?&#x;&#x17D; đ?&#x;?
= đ?&#x;&#x201D;đ?&#x;&#x17D; Daar is dus 60 verskillende maniere waarop die eerste, tweede en derde plekke getrek kan word uit hierdie vyf vriende. Die waarskynlikheid dat Piet eerste plek, Jan tweede plek en Koos derde plek sal kry, is een manier uit die 60 unieke maniere waarop eerste, tweede en derde plekke getrek kan word
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 91
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes en daarom kan ons die waarskynlikheid soos volg bereken: đ?&#x2019;&#x201C;
đ?&#x2018;ˇ đ?&#x2018;¨
= đ?&#x2019;?
=
đ?&#x;? đ?&#x;&#x201D;đ?&#x;&#x17D;
= đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2022;
Die kans dat Piet eerste plek, Jan tweede plek en Koos derde plek sal kry, is dus 1,67%. Doen nou Voorbeeld 4.10 in die handboek. v KombinasiereĂŤl Ĺ&#x2030; Kombinasie is die aantal unieke maniere waarop Ĺ&#x2030; subversameling van đ?&#x2018;&#x;
ReĂŤl 4:
objekte getrek kan word uit Ĺ&#x2030; groter steekproefruimte en die volgorde waarin hierdie objekte getrek word nie belangrik is nie.
đ?&#x2019;?đ?&#x2018;Ş đ?&#x2019;&#x201C;
Waar:
=
đ?&#x2019;?! đ?&#x2019;&#x201C;! đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x2019;&#x201C; !
đ?&#x2018;&#x;
= die aantal objekte wat op Ĺ&#x2030; slag getrek word
đ?&#x2018;&#x203A;
= die totale aantal objekte waaruit daar getrek kan word =COMBIN(đ?&#x2019;?, đ?&#x2019;&#x201C;)
MS Excel-formule:
Formule 2.8: Berekening van Ĺ&#x2030; kombinasie Voorbeeld 2.11 Julle is Ĺ&#x2030; vriendekring van vyf vriende, naamlik Jan, Koos, Piet, Johan en jy. Julle hou elke maand Ĺ&#x2030; loting. Daar is drie pryse van 250 elk op die spel. Bereken: a) Op hoeveel verskillende maniere die drie pryse uit julle vriendekring getrek kan word. b) Die waarskynlikheid dat Piet, Jan en Koos elkeen Ĺ&#x2030; prys sal kry. Oplossing: Dit is nie belangrik in watter volgorde die pryse getrek word nie omdat elkeen Ĺ&#x2030; R250-prys kan wen. đ?&#x2019;?đ?&#x2018;Ş đ?&#x2019;&#x201C;
Bladsy 92
=
đ?&#x2019;?! đ?&#x2019;&#x201C;! đ?&#x2019;?mđ?&#x2019;&#x201C; !
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes =
đ?&#x;&#x201C;! đ?&#x;&#x2018;! đ?&#x;&#x201C;mđ?&#x;&#x2018; !
=
đ?&#x;&#x201C;! đ?&#x;&#x2018;!đ?&#x;?!
=
đ?&#x;?đ?&#x;?đ?&#x;&#x17D; đ?&#x;&#x201D;Ă&#x2014;đ?&#x;?
= đ?&#x;?đ?&#x;&#x17D; Daar is dus tien verskillende maniere waarop die drie pryse getrek kan word uit hierdie vyf vriende. Die waarskynlikheid Piet, Jan en Koos elkeen Ĺ&#x2030; prys sal kry, is een manier uit die tien unieke maniere waarop drie pryse getrek kan word en daarom kan ons die waarskynlikheid soos volg bereken: đ?&#x2018;ˇ đ?&#x2018;¨
đ?&#x2019;&#x201C;
= đ?&#x2019;?
=
đ?&#x;? đ?&#x;?đ?&#x;&#x17D;
= đ?&#x;&#x17D;, đ?&#x;?
Die kans dat Piet, Jan en Koos elkeen Ĺ&#x2030; prys sal kry, is dus 10%. Vergelyk Voorbeeld 2.10 en 2.11 met mekaar en maak seker dat jy verstaan wanneer die volgorde belangrik is en wanneer nie. Verseker verder dat jy weet watter formule om te gebruik in ieder geval. Doen nou Voorbeeld 4.11 in die handboek. 2.5.7
Selfevalueringsvrae
Daar is 21 vrae aan die einde van Hoofstuk 4. Beantwoord al hierdie vrae. Dit is baie werk en gaan heelwat tyd in beslag neem, maar dit sal jou help om te verseker dat jy die werk onder die knie het. 2.6
Waarskynlikheidsverdelings
Bestudeer die handboek Hoofstuk 5. In Hoofstuk 4 van die handboek is waarskynlikhede bereken deur data te versamel. Waarskynlikhede kan ook wiskundig bereken word deur sogenaamde waarskynlikheidsverdelings. Hoofstuk 5 bespreek drie verskillende waarskynlikheidsverdelings. Die normaalverdeling is veral belangrik. Ĺ&#x2030; Waarskynlikheidsverdeling is Ĺ&#x2030; lys van alle moontlike uitkomste van Ĺ&#x2030; stogastiese veranderlike met elk se waarskynlikhede. Waarskynlikheidsverdelings word in twee kategorieĂŤ verdeel. Hierdie kategorieĂŤ, asook die verskillende verdelings wat in elk voorkom, word grafies voorgestel in Figuur 2.7.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 93
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Figuur 2.7: Waarskynlikheidsverdelings 2.6.1
Stogastiese veranderlikes
Davis, Pecar en Santana (2016: 161) definieer ʼn stogastiese veranderlike as ʼn veranderlike met ʼn numeriese waarde, wat geassosieer kan word met die uitkoms of ʼn gebeurtenis van ʼn eksperiment (waar elke uitkoms/gebeurtenis ʼn bepaalde waarskynlikheid het dat dit sal plaasvind). Stogastiese veranderlikes kan verdeel word in diskrete stogastiese veranderlikes (ʼn veranderlike met ʼn telbare aantal waardes, elk met ʼn spesifieke waarskynlikheid) en kontinue stogastiese veranderlikes (ʼn veranderlike wat potensieel ʼn oneindige/ontelbare aantal waardes het binne ʼn spesifieke reeks van waardes) (Davis, Pecar & Santana, 2016: 161). Wanneer ons praat van diskrete waardes, bedoel ons dat die waardes afsonderlik/geskei/in onderskeie dele opgebreek kan word, met ander woorde heelgetalle. Voorbeelde van hierdie waardes sluit 1, 10, 256, 1 024, ensovoorts in. Kontinue waardes, aan die ander kant, is waardes wat onafgebroke/aaneen/voortdurend is. Daar is teoreties ʼn oneindige/ontelbare aantal waardes slegs tussen 1 en 2. Voorbeelde van hierdie waardes sluit 0,99999999999999999, 0.0000000001, ensovoorts in. Hierdie stogastiese veranderlike se waardes bepaal aan watter tipe waarskynlikheidsverdeling die veranderlike behoort.
Bladsy 94
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 2.6.2
Diskrete waarskynlikheidsverdelings
Bestudeer die handboek paragraaf 5.3. Ĺ&#x2030; Diskrete stogastiese veranderlike sal â&#x20AC;&#x2122;n diskrete waarskynlikheidsverdeling hĂŞ. Hier is Ĺ&#x2030; paar voorbeelde van diskrete veranderlikes: â&#x20AC;˘
As jy Ĺ&#x2030; muntstuk in die lug opskiet, kan dit Ăłf op sy kop, Ăłf op sy stert val.
â&#x20AC;˘
As Ĺ&#x2030; dobbelsteen gerol word, kan die uitkoms 1, 2, 3, 4, 5 of 6 wees.
â&#x20AC;˘
Jy kan 0, 1, 2, 3 of enige ander heelgetal huise besit.
â&#x20AC;˘
Jy kan 0, 1, 2, 3 of enige ander heelgetal kinders hĂŞ.
Twee van die algemeenste diskrete waarskynlikheidsverdelings wat ons gebruik, is die binomiale en die Poisson-verdelings. v Binominale waarskynlikheidsverdeling Volgens Davis, Pecar en Santana (2016: 183) is die binomiale stogastiese veranderlike Ĺ&#x2030; veranderlike wat die aantal suksesvolle uitkomste van đ?&#x2018;&#x203A; aantal toetse beskryf. Ĺ&#x2030; Toets se uitslag kan Ăłf Ĺ&#x2030; sukses, Ăłf Ĺ&#x2030; mislukking wees. Die binomiale waarskynlikheidsverdeling beskryf die waarskynlikheid dat Ĺ&#x2030; binomiale gebeurtenis sal plaasvind. Die binomiale waarskynlikheidsverdeling het die volgende kenmerke: â&#x20AC;˘
Die eksperiment bestaan uit đ?&#x2018;&#x203A; aantal toetse.
â&#x20AC;˘
Elke toets het een van twee onderling uitsluitlike uitkomste, naamlik Ĺ&#x2030; sukses of Ĺ&#x2030; mislukking.
â&#x20AC;˘
Al die uitkomste is statisties onafhanklik van een toets tot die volgende.
â&#x20AC;˘
Die waarskynlikheid van Ĺ&#x2030; sukses (đ?&#x2018;?) is dieselfde vir elke toets. (Die waarskynlikheid van Ĺ&#x2030; mislukking is dus 1 â&#x2C6;&#x2019; đ?&#x2018;?.)
Ons gebruik die volgende formule om die waarskynlikheid van Ĺ&#x2030; binomiale stogastiese gebeurtenis te bereken:
đ?&#x2018;ˇ đ?&#x2019;&#x2122; =
đ?&#x2019;?đ?&#x2018;Ş đ?&#x2019;&#x2122; đ?&#x2019;&#x2018;
đ?&#x2019;&#x2122;
đ?&#x;?â&#x2C6;&#x2019;đ?&#x2019;&#x2018;
đ?&#x2019;?mđ?&#x2019;&#x2122;
Vir
đ?&#x2018;Ľ
= 0, 1, 2, 3, . . . , đ?&#x2018;&#x203A;
Waar:
đ?&#x2018;&#x203A;
= die steekproefgrootte, met ander woorde die aantal onafhanklike toetse
đ?&#x2018;Ľ
= die aantal suksesvolle toetse in die đ?&#x2018;&#x203A; aantal ewekansig gekose toetse
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 95
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ?&#x2018;?
= die waarskynlikheid op Ĺ&#x2030; suksesvolle uitkoms van Ĺ&#x2030; toets
(1 â&#x2C6;&#x2019; đ?&#x2018;?) = die waarskynlikheid op Ĺ&#x2030; onsuksesvolle uitkoms van Ĺ&#x2030; toets MS Excel-formule:
=BINOM.DIST(đ?&#x2019;&#x2122;, đ?&#x2019;?, đ?&#x2019;&#x2018;, đ?&#x2018;đ?&#x2018;¨đ?&#x2018;łđ?&#x2018;şđ?&#x2018;Ź)
enkel waarskynlikheid
MS Excel-formule:
=BINOM.DIST(đ?&#x2019;&#x2122;, đ?&#x2019;?, đ?&#x2019;&#x2018;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź)
kumulatiewe waarskynlikheid
Formule 2.9: Berekening van â&#x20AC;&#x2122;n binominale stogastiese gebeurtenis se waarskynlikheid Doen Voorbeeld 5.1 in die handboek met die hand en verifieer jou resultaat deur dieselfde waarskynlikheid in MS Excel te bereken. Voorbeeld 2.12 Die vervaardiger van â&#x20AC;&#x2122;n sekere miergif beweer dat die gif 80% van alle miere sal doodmaak. Ĺ&#x2030; Wetenskaplike het die miergif op die toets gestel. Hy het 15 miere gevat wat feitlik identies is en hulle blootgestel aan die miergif. Na Ĺ&#x2030; sekere tyd het hy getel hoeveel miere nog lewe en hoeveel gesterf het. Die resultaat van die eksperiment is dat die mier gesterf het van die gif, of nog lewendig is. Hierdie resultate is statisties onafhanklik van mekaar omdat die miere nie Ĺ&#x2030; invloed het op mekaar se kanse om te oorleef nie. Bereken die volgende waarskynlikhede: a) Dat 13 van die 15 miere gesterf het. b) Dat 13 of meer van die miere gesterf het. c) Dat ten minste 12 van die miere gesterf het. Oplossing: Die stogastiese veranderlike â&#x20AC;&#x153;aantal miere wat gesterf hetâ&#x20AC;? is diskreet omdat daar slegs 0, 1, 2, 3, ..., 15 miere kon gesterf het, uit die 15 miere wat ewekansig gekies is. Hierdie stogastiese veranderlike pas die binomiale waarskynlikheidsverdeling vir die volgende redes: â&#x20AC;˘
Die stogastiese veranderlike is 15 keer waargeneem (15 miere is blootgestel aan die miergif). Daarom is đ?&#x2019;? = đ?&#x;?đ?&#x;&#x201C;.
â&#x20AC;˘
Daar is twee moontlike uitkomste:
Bladsy 96
o
Die mier kon gesterf het; of
o
die mier kan steeds lewe.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
â&#x20AC;˘
â&#x20AC;˘
Ĺ&#x2030; Waarskynlikheid kan toegeken word aan elke uitkoms van die eksperiment: o
đ?&#x2019;&#x2018; = đ?&#x;&#x17D;, đ?&#x;&#x2013; (waar đ?&#x2019;&#x2018; die waarskynlikheid is dat die mier sou gesterf het)
o
đ?&#x;? â&#x2C6;&#x2019; đ?&#x2019;&#x2018; = đ?&#x;? â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x2013; = đ?&#x;&#x17D;, đ?&#x;? (die waarskynlikheid dat die mier steeds lewe)
Die uitkoms is statisties onafhanklik vanaf een mier tot die volgende.
Noudat daar voldoen is aan die vereistes van die binomiale waarskynlikheidsverdeling, kan ons dit gebruik om die betrokke waarskynlikhede te bereken. <blokkie bo n hieronder â&#x20AC;&#x201C; dit reg?><Willem: dit is ongelukkig hoe die funksie lyk â&#x20AC;&#x201C; wanneer die dokument omgeskakel word in Ĺ&#x2030; PDF formaat lyk dit egter reg.> a) Vind đ?&#x2018;ˇ(đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x2018;) waar đ?&#x2019;? = đ?&#x;?đ?&#x;&#x201C; en đ?&#x2019;&#x2018; = đ?&#x;&#x17D;, đ?&#x;&#x2013; đ?&#x2018;ˇ đ?&#x2019;&#x2122;
= =
đ?&#x2019;?đ?&#x2018;Şđ?&#x2019;&#x2122; đ?&#x2019;&#x2018;
đ?&#x2019;&#x2122;
đ?&#x;?â&#x2C6;&#x2019;đ?&#x2019;&#x2018;
đ?&#x;?đ?&#x;&#x201C;! đ?&#x;?đ?&#x;&#x2018;! đ?&#x;?đ?&#x;&#x201C;mđ?&#x;?đ?&#x;&#x2018; !
= đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x201C; đ?&#x;&#x17D;, đ?&#x;&#x2013;
đ?&#x;&#x17D;, đ?&#x;&#x2013; đ?&#x;?đ?&#x;&#x2018;
đ?&#x2019;?mđ?&#x2019;&#x2122; đ?&#x;?đ?&#x;&#x2018;
đ?&#x;&#x17D;, đ?&#x;?
đ?&#x;?
=
đ?&#x2019;?! đ?&#x2019;&#x201C;! đ?&#x2019;?mđ?&#x2019;&#x201C; !
đ?&#x;? â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x2013;
đ?&#x2019;&#x2018;đ?&#x2019;&#x2122; đ?&#x;? â&#x2C6;&#x2019; đ?&#x2019;&#x2018;
đ?&#x2019;?mđ?&#x2019;&#x2122;
đ?&#x;?đ?&#x;&#x201C;mđ?&#x;?đ?&#x;&#x2018;
= đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x2014;
Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =BINOM.DIST(13,15,0.8,FALSE) Daar is dus Ĺ&#x2030; 23,09% kans dat presies 13 van die 15 miere in die eksperiment sal sterf. b) Let daarop dat daar gevra word wat die waarskynlikheid is dat 13 of meer van die
miere gesterf het. Dit beteken dat ons moet uitwerk wat die waarskynlikheid is dat 13, 14 en 15 miere gesterf het. Vind đ?&#x2018;ˇ đ?&#x2019;&#x2122; â&#x2030;Ľ đ?&#x;?đ?&#x;&#x2018; ; dit is Ĺ&#x2030; kumulatiewe waarskynlikheid, waar đ?&#x2019;? = đ?&#x;?đ?&#x;&#x201C; en đ?&#x2019;&#x2018; = đ?&#x;&#x17D;, đ?&#x;&#x2013;. Om die kumulatiewe waarskynlikheid te bereken moet ons die waarskynlikhede van hierdie onderling uitsluitende waarskynlikhede bymekaartel: đ?&#x2018;ˇ đ?&#x2019;&#x2122; â&#x2030;Ľ đ?&#x;?đ?&#x;&#x2018; = đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x2018; â&#x2C6;Ş đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x2019; â&#x2C6;Ş đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x201C; = đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x2018; + đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x2019; + đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x201C; Die drie binomiale waarskynlikhede moet nou bereken word en dan bymekaargetel word: đ?&#x2018;ˇ(đ??ą = đ?&#x;?đ?&#x;&#x2018;) = đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x201C; đ?&#x;&#x17D;, đ?&#x;&#x2013;
đ?&#x;?đ?&#x;&#x2018;
đ?&#x;&#x17D;, đ?&#x;?
đ?&#x;?
= đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x2014;
đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x2019; = đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x201C; đ?&#x;&#x17D;, đ?&#x;&#x2013;
đ?&#x;?đ?&#x;&#x2019;
đ?&#x;&#x17D;, đ?&#x;?
đ?&#x;?
= đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014;
đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x201C; = đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x201C; đ?&#x;&#x17D;, đ?&#x;&#x2013;
đ?&#x;?đ?&#x;&#x201C;
đ?&#x;&#x17D;, đ?&#x;?
đ?&#x;&#x17D;
= đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x2018;đ?&#x;&#x201C;đ?&#x;?
Dan is: đ?&#x2018;ˇ đ?&#x2019;&#x2122; â&#x2030;Ľ đ?&#x;?đ?&#x;&#x2018; = đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x2014; + đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x2018;đ?&#x;&#x201C;đ?&#x;? = đ?&#x;&#x17D;. đ?&#x;&#x2018;đ?&#x;&#x2014;đ?&#x;&#x2013;đ?&#x;&#x17D; Om dieselfde waarde in MS Excel te bereken sal soos volg lyk:
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 97
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = 1 - BINOM.DIST(12,15,0.8,TRUE) Let daarop dat die berekening hierbo đ?&#x2018;ˇ đ?&#x2019;&#x2122; â&#x2030;Ľ đ?&#x;?đ?&#x;&#x2018; = đ?&#x;? â&#x2C6;&#x2019; đ?&#x2018;ˇ(đ?&#x2019;&#x2122; â&#x2030;¤ đ?&#x;?đ?&#x;?) bereken. Daar is dus Ĺ&#x2030; 39,8% kans dat meer as 13 van die 15 miere sou gesterf het tydens die eksperiment. c) Let daarop dat daar gevra word wat die waarskynlikheid is dat ten minste 12 van die
miere gesterf het. Dit impliseer dat 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 en 11 miere moes gesterf het alvorens 12 kon gesterf het. Vind đ?&#x2018;ˇ đ?&#x2019;&#x2122; â&#x2030;¤ đ?&#x;?đ?&#x;? ; dit is ook Ĺ&#x2030; kumulatiewe waarskynlikheid, waar đ?&#x2019;? = đ?&#x;?đ?&#x;&#x201C; en đ?&#x2019;&#x2018; = đ?&#x;&#x17D;, đ?&#x;&#x2013;. đ?&#x2018;ˇ đ?&#x2019;&#x2122; â&#x2030;¤ đ?&#x;?đ?&#x;? = đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;&#x17D; + đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;? + đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;? + â&#x2039;Ż + đ?&#x2018;ˇ(đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;?) Hierdie waarskynlikhede kan afsonderlik bereken en gebruik word, maar dit kan baie moeite verg, of ons kan gebruik maak van komplementĂŞre waarskynlikhede, waar đ?&#x2018;ˇ đ?&#x2018;¨Â§ = đ?&#x;? â&#x2C6;&#x2019; đ?&#x2018;ˇ đ?&#x2018;¨ Dus volg dit dat: đ?&#x2018;ˇ đ?&#x2019;&#x2122; â&#x2030;¤ đ?&#x;?đ?&#x;&#x2018; = đ?&#x;? â&#x2C6;&#x2019; đ?&#x2018;ˇ đ?&#x2019;&#x2122; â&#x2030;Ľ đ?&#x;?đ?&#x;? = đ?&#x;? â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x2014;đ?&#x;&#x2013;đ?&#x;&#x17D; = đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x17D; Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =BINOM.DIST(12,15,0.8,TRUE) Daar is dus Ĺ&#x2030; 60,2% kans dat ten minste 12 van die 15 miere sou gesterf het tydens die eksperiment. Doen nou Voorbeeld 5.2 in die handboek met die hand en verifieer jou resultaat deur dieselfde waarskynlikheid in MS Excel te bereken. Let op Vraag (b) en (c). Wenk: Kyk uit vir die volgende woorde; hulle is altyd Ĺ&#x2030; aanduiding dat jy Ĺ&#x2030; kumulatiewe waarskynlikheid moet bereken: â&#x20AC;˘
ten minste
â&#x20AC;˘
nie meer as
â&#x20AC;˘
op die meeste
â&#x20AC;˘
nie minder as
â&#x20AC;˘
minder/kleiner as
â&#x20AC;˘
meer/groter as
Wanneer dit prakties meer sin maak, maak gebruik van komplementĂŞre waarskynlikhede om waarskynlikheidsberekeninge vinniger te doen. Moenie in Ĺ&#x2030; toets of eksamen kosbare tyd mors om 13 waarskynlikhede te bereken as jy net 3 moet bereken nie â&#x20AC;&#x201C; werk slimmer, nie harder nie!
Bladsy 98
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes v Poisson-verdeling Davis, Pecar en Santana (2016: 200) beskryf Ĺ&#x2030; Poisson stogastiese veranderlike as Ĺ&#x2030; diskrete stogastiese veranderlike wat die aantal gebeurtenisse oor Ĺ&#x2030; bepaalde interval (byvoorbeeld tyd, afstand, area, volume, ensovoorts) aandui. Die Poissonwaarskynlikheidsverdeling is die verdeling wat die waarskynlikheid beskryf dat Ĺ&#x2030; Poisson stogastiese veranderlike sal plaasvind. Wegner (2016: 137) definieer die Poisson stogastiese waarskynlikheidsverdeling as die maatstaf wat die aantal kere wat Ĺ&#x2030; spesifieke diskrete stogastiese veranderlike in Ĺ&#x2030; voorafbepaalde interval tyd, spasie of volume sal plaasvind, beskryf, waarvan die gemiddelde aantal gebeurtenisse bekend is of bereken kan word. Voorbeelde van Ĺ&#x2030; Poisson stogastiese veranderlike is: â&#x20AC;˘
Die aantal kere wat Ĺ&#x2030; rivier oor sy walle gebreek het gedurende die laaste 100 jaar.
â&#x20AC;˘
Die aantal seldsame siektes wat oor die laaste kwartaal aangemeld is.
â&#x20AC;˘
Die aantal padsterftes gedurende die Desember-skoolvakansie.
â&#x20AC;˘
Die aantal hare wat in Ĺ&#x2030; hamburger gevind is.
â&#x20AC;˘
Die verdeling van renosters in die Kruger Nasionale Wildtuin.
Ons gebruik die volgende formule om die waarskynlikheid van Ĺ&#x2030; Poisson stogastiese gebeurtenis te bereken:
đ?&#x2018;ˇ đ?&#x2019;&#x2122; =
đ?&#x2019;&#x2020;mđ??&#x20AC; đ??&#x20AC;đ?&#x2019;&#x2122; đ?&#x2019;&#x2122;!
Vir:
đ?&#x2019;&#x2122;
= đ?&#x;&#x17D;, đ?&#x;?, đ?&#x;?, đ?&#x;&#x2018;, â&#x20AC;Ś
Waar:
đ??&#x20AC;
= die gemiddelde aantal kere wat die gegewe uitkoms van Ĺ&#x2030; stogastiese veranderlike sal plaasvind binne die betrokke interval (tyd, spasie of volume)
đ?&#x2019;&#x2020;
= die wiskundige konstante wat as 2.71828 beraam word
đ?&#x2019;&#x2122;
= aantal kere wat die gegewe uitkoms sal plaasvind waarvoor die waarskynlikheid benodig word (đ?&#x2019;&#x2122; is die domein wat enige diskrete waarde kan aanneem van 0 tot oneindig)
MS Excel-formule:
=POISSON.DIST(đ?&#x2019;&#x2122;, đ??&#x20AC;, đ?&#x2018;đ?&#x2018;¨đ?&#x2018;łđ?&#x2018;şđ?&#x2018;Ź)
enkel waarskynlikheid
MS Excel-formule:
=POISSON.DIST(đ?&#x2019;&#x2122;, đ??&#x20AC;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź)
kumulatiewe waarskynlikheid
Formule 2.10: Berekening van â&#x20AC;&#x2122;n Poisson stogastiese gebeurtenis se waarskynlikheid
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 99
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 2.13 OUTA (The Organisation Undoing Tax Abuse) het Ĺ&#x2030; ondersoek geloods om te bepaal hoeveel voertuie deur e-tolhekke ry. Hulle het gevind dat 600 voertuie binne Ĺ&#x2030; uur deur die Mossie e-tolhek by Rigellaan in Pretoria gery het. Bereken die volgende waarskynlikhede: a) Dat slegs 7 voertuie per minuut deur die Mossie e-tolhek sal ry. b) Dat daar op die meeste 11 voertuie per minuut deur die Mossie e-tolhek sal ry. c) Dat daar meer as 9 voertuie per minuut deur die Mossie e-tolhek sal ry. d) Dat daar minder as 21 voertuie in 3 minute deur die Mossie e-tolhek sal ry. Oplossing: Die stogastiese veranderlike is diskreet omdat daar 0, 1, 2, 3, ... voertuie deur die Mossie etolhek kan ry. Die stogastiese veranderlike vind plaas in Ĺ&#x2030; gegewe interval, in hierdie geval per uur/minuut. Die gemiddelde aantal voertuie wat deur die Mossie e-tolhek ry, is bekend. Laat đ?&#x2019;&#x2122; die aantal voertuie wat per minuut deur die Mossie e-tolhek ry, voorstel. Die gemiddeld van đ?&#x2019;&#x2122; word bereken as đ??&#x20AC; =
đ?&#x;&#x201D;đ?&#x;&#x17D;đ?&#x;&#x17D; đ?&#x;&#x201D;đ?&#x;&#x17D;
= đ?&#x;?đ?&#x;&#x17D; voertuie per minuut. Baie belangrik: đ?&#x2019;&#x2122; en đ??&#x20AC;
word albei uitgedruk in terme van â&#x20AC;&#x153;per minuutâ&#x20AC;? â&#x20AC;&#x201C; maak seker dat die eenhede (minuut, meter, liter, ensovoorts) dieselfde is voordat jy begin met jou berekeninge. a) Vind đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;&#x2022; waar đ??&#x20AC; = đ?&#x;?đ?&#x;&#x17D; voertuie per minuut. đ?&#x2018;ˇ đ?&#x2019;&#x2122;=đ?&#x;&#x2022;
= =
đ?&#x2019;&#x2020;½đ??&#x20AC; đ??&#x20AC;đ?&#x2019;&#x2122; đ?&#x2019;&#x2122;!
đ?&#x;?.đ?&#x;&#x2022;đ?&#x;?đ?&#x;&#x2013;đ?&#x;?đ?&#x;&#x2013; ½đ?&#x;?đ?&#x;&#x17D; đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2022; đ?&#x;&#x2022;!
=
đ?&#x;&#x2019;đ?&#x;&#x201C;đ?&#x;&#x2019;,đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2019; đ?&#x;&#x201C;đ?&#x;&#x17D;đ?&#x;&#x2019;đ?&#x;&#x17D;
= đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;? Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =POISSON.DIST(7,10,FALSE) Daar is dus Ĺ&#x2030; 9,01% kans dat daar slegs 7 voertuie in Ĺ&#x2030; minuut deur die Mossie etolhek sal ry. b) In terme van die vraag impliseer â&#x20AC;&#x153;op die meeste 11 voertuieâ&#x20AC;? dat daar 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 of 11 voertuie deur die Mossie e-tolhek kon gery het. Hierdie 12 waarskynlikhede is onderliggend uitsluitlik en statisties onafhanklik en kan dus bymekaargetel word om die kumulatiewe waarskynlikheid te bereken:
Bladsy 100
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementêre kwantitatiewe metodes
𝑷 𝒙 ≤ 𝟏𝟏
= 𝑷 𝒙 = 𝟎 ∪ 𝑷 𝒙 = 𝟏 ∪ 𝑷 𝒙 = 𝟐 ∪ … ∪ 𝑷 𝒙 = 𝟏𝟏 = 𝑷 𝒙 = 𝟎 + 𝑷 𝒙 = 𝟏 + 𝑷 𝒙 = 𝟐 + ⋯ + 𝑷 𝒙 = 𝟏𝟏
𝑷 𝒙=𝟎
=
𝑷 𝒙=𝟏
=
𝑷 𝒙=𝟐
=
𝑷 𝒙=𝟑
=
𝑷 𝒙=𝟒
=
𝑷 𝒙=𝟓
=
𝑷 𝒙=𝟔
=
𝑷 𝒙=𝟕
=
𝑷 𝒙=𝟖
=
𝑷 𝒙=𝟗
=
𝑷 𝒙 = 𝟏𝟎
=
𝑷 𝒙 = 𝟏𝟏
=
𝒆½𝟏𝟎 𝟏𝟎𝟎 𝟎! 𝒆½𝟏𝟎 𝟏𝟎𝟏 𝟏! 𝒆½𝟏𝟎 𝟏𝟎𝟐 𝟐! 𝒆½𝟏𝟎 𝟏𝟎𝟑 𝟑! 𝒆½𝟏𝟎 𝟏𝟎𝟒 𝟒! 𝒆½𝟏𝟎 𝟏𝟎𝟓 𝟓! 𝒆½𝟏𝟎 𝟏𝟎𝟔 𝟔! 𝒆½𝟏𝟎 𝟏𝟎𝟕 𝟕! 𝒆½𝟏𝟎 𝟏𝟎𝟖 𝟖! 𝒆½𝟏𝟎 𝟏𝟎𝟗 𝟗!
= 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏 = 𝟎, 𝟎𝟎𝟎𝟎
onthou 𝟎! = 𝟏
= 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏𝟎 = 𝟎, 𝟎𝟎𝟎𝟓 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟓𝟎 = 𝟎, 𝟎𝟎𝟐𝟑 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏𝟔𝟔, 𝟔𝟔𝟔𝟕 = 𝟎, 𝟎𝟏𝟖𝟗 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟒𝟏𝟔, 𝟔𝟔𝟔𝟕 = 𝟎, 𝟎𝟑𝟕𝟖 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟖𝟑𝟑, 𝟑𝟑𝟑𝟑 = 𝟎, 𝟎𝟔𝟑𝟏 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏 𝟑𝟖𝟖, 𝟖𝟖𝟖𝟗 = 𝟎, 𝟎𝟗𝟎𝟏 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏 𝟗𝟖𝟒, 𝟏𝟐𝟕 = 𝟎, 𝟏𝟏𝟐𝟔 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟐 𝟒𝟖𝟎, 𝟏𝟓𝟖𝟕 = 𝟎, 𝟏𝟐𝟓𝟏 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟐 𝟕𝟓𝟓, 𝟕𝟑𝟏𝟗 = 𝟎, 𝟏𝟐𝟓𝟏
𝒆½𝟏𝟎 𝟏𝟎𝟏𝟎 𝟏𝟎! 𝒆½𝟏𝟎 𝟏𝟎𝟏𝟏 𝟏𝟏!
= 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟐 𝟕𝟓𝟓, 𝟕𝟑𝟏𝟗 = 𝟎, 𝟏𝟏𝟑𝟕 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟐 𝟓𝟎𝟓, 𝟐𝟏𝟎𝟖, 𝟏𝟐𝟕 = 𝟎, 𝟎𝟗𝟒𝟖
Dan is: 𝑷 𝒙 ≤ 𝟏𝟏
= 𝟎 + 𝟎, 𝟎𝟎𝟎𝟓 + 𝟎, 𝟎𝟎𝟐𝟑 + 𝟎, 𝟎𝟏𝟖𝟗 + 𝟎, 𝟎𝟑𝟕𝟖 + 𝟎, 𝟎𝟔𝟑𝟏 + 𝟎, 𝟎𝟗𝟎𝟏 +𝟎, 𝟏𝟏𝟐𝟔 + 𝟎, 𝟏𝟐𝟓𝟏 + 𝟎, 𝟏𝟐𝟓𝟏 + 𝟎, 𝟏𝟏𝟑𝟕 + 𝟎, 𝟎𝟗𝟒𝟖 = 𝟎, 𝟔𝟗𝟔𝟖
Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =POISSON.DIST(11,10,TRUE) Daar is dus ʼn 69,68% kans dat daar ten minste 11 voertuie in ʼn minuut deur die Mossie e-tolhek sal ry. c) Die vraag vra dat ons 𝒑 𝒙 > 𝟗 moet vind waar 𝝀 = 𝟏𝟎. Omdat 𝒙 ʼn diskrete stogastiese veranderlike is, is die eerste heelgetal van 𝒙 wat groter as nege is 𝒙 = 𝟏𝟎. Dus moet ons die volgende probleem oplos: 𝑷 𝒙 ≥ 𝟏𝟎
= 𝑷 𝒙 = 𝟏𝟎 + 𝑷 𝒙 = 𝟏𝟏 + 𝑷 𝒙 = 𝟏𝟐 + ⋯
Omdat die waardes van 𝒙 oneindig is, kan dit ʼn probleem wees. Daarom gebruik ons komplementêre waarskynlikhede om hierdie probleem op te los: 𝑷 𝒙 ≥ 𝟏𝟎
=𝟏−𝑷 𝒙≤𝟗
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 101
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = đ?&#x;? â&#x2C6;&#x2019; đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;&#x17D; + đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;? + đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;? + â&#x2039;Ż đ?&#x2018;ˇ(đ?&#x2019;&#x2122; = đ?&#x;&#x2014;) = đ?&#x;? â&#x2C6;&#x2019; (đ?&#x;&#x17D; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2018; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2013;đ?&#x;&#x2014; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x2018;đ?&#x;&#x2022;đ?&#x;&#x2013; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;? + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;? +đ?&#x;&#x17D;, đ?&#x;?đ?&#x;?đ?&#x;?đ?&#x;&#x201D; + đ?&#x;&#x17D;, đ?&#x;?đ?&#x;?đ?&#x;&#x201C;đ?&#x;? + đ?&#x;&#x17D;, đ?&#x;?đ?&#x;?đ?&#x;&#x201C;đ?&#x;?) = đ?&#x;? â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x201C;đ?&#x;&#x2022;đ?&#x;&#x2014; = đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2019;đ?&#x;?đ?&#x;? Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = 1 â&#x20AC;&#x201C; POISSON.DIST(9,10,TRUE) Daar is dus Ĺ&#x2030; 54,21% kans dat daar meer as 9 voertuie in Ĺ&#x2030; minuut deur die Mossie e-tolhek sal ry. d) Die eerste ding wat jy by hierdie vraag moet raaksien, is dat die tydskaal verander
het van 1 minuut na 3 minute. Daarom moet ons die gemiddeld aanpas sodat dit ook in Ĺ&#x2030; 3-minute-skaal is: đ?&#x;&#x2018;đ??&#x20AC; = đ?&#x;&#x2018;Ă&#x2014;đ?&#x;?đ?&#x;&#x17D; = đ?&#x;&#x2018;đ?&#x;&#x17D; Nou kan ons die berekening doen van đ?&#x2018;ˇ đ?&#x2019;&#x2122; < đ?&#x;?đ?&#x;? waar đ??&#x20AC; = đ?&#x;&#x2018;đ?&#x;&#x17D; đ?&#x2018;ˇ đ?&#x2019;&#x2122; < đ?&#x;?đ?&#x;?
= đ?&#x2018;ˇ đ?&#x2019;&#x2122; â&#x2030;¤ đ?&#x;?đ?&#x;&#x17D; = đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;&#x17D; + đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;? + đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;? + â&#x2039;Ż + đ?&#x2018;ˇ đ?&#x2019;&#x2122; = đ?&#x;?đ?&#x;&#x17D; = đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;? + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;? +đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x17D; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2014; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x2018;đ?&#x;&#x2019; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x201C;đ?&#x;&#x2022; + đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x2013;đ?&#x;&#x2014; +
đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2019; = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x2018;đ?&#x;&#x201C;đ?&#x;&#x2018; Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =POISSON.DIST(21,30,TRUE) Daar is dus Ĺ&#x2030; 3,53% kans dat daar minder as 21 voertuie in Ĺ&#x2030; 3 minute interval deur die Mossie e-tolhek sal ry. Doen nou Voorbeeld 5.3 in die handboek met die hand en verifieer jou resultaat deur dieselfde waarskynlikheid in MS Excel te bereken. Let op Vraag (d). 2.6.3
Kontinue waarskynlikheidsverdelings
Bestudeer die handboek paragraaf 5.6. Ĺ&#x2030; Kontinue stogastiese veranderlike sal Ĺ&#x2030; kontinue waarskynlikheidsverdeling hĂŞ. Hier is Ĺ&#x2030; paar voorbeelde van kontinue veranderlikes: â&#x20AC;˘
Die lengte van Ĺ&#x2030; persoon.
â&#x20AC;˘
Die getal reĂŤnval.
â&#x20AC;˘
Die duur van Ĺ&#x2030; telefoonoproep.
â&#x20AC;˘
Die opbrengs van Ĺ&#x2030; belegging.
â&#x20AC;˘
Die verkope van Ĺ&#x2030; winkel.
Bladsy 102
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes â&#x20AC;˘
Die elektrisiteitsverbruik van Ĺ&#x2030; fabriek.
Die algemeenste kontinue waarskynlikheidsverdeling wat ons gebruik, is die normaalverdeling. v Standaard-normaalwaarskynlikheidsverdeling Bestudeer die handboek paragrawe 5.7 en 5.8.
Figuur 2.8: Die normaalwaarskynlikheidsverdeling Wegner (2016: 141) gee die volgende eienskappe van die normaalwaarskynlikheidsverdeling (verwys na Figuur 2.8 hierbo): â&#x20AC;˘
Die kurwe is klokvormig.
â&#x20AC;˘
Dit is simmetries versprei rondom Ĺ&#x2030; gemiddelde waarde đ?&#x153;&#x2021;.
â&#x20AC;˘
Die punte van die kurwe raak nooit die X-as nie, wat beteken dat elke waarde Ĺ&#x2030; waarskynlikheid groter as 0 het.
â&#x20AC;˘
â&#x20AC;˘
Die verdeling word altyd beskryf deur die twee konstantes: o
Ĺ&#x2030; gemiddeld đ?&#x153;&#x2021;; en
o
Ĺ&#x2030; standaardafwyking đ?&#x153;&#x17D;.
Die totale area onder die kurwe is altyd 1 omdat dit die totale steekproefruimte đ?&#x2018;&#x203A; verteenwoordig. Omdat die kurwe simmetries versprei is, is die area links van die gemiddeld đ?&#x153;&#x2021; gelyk aan 0,5. Net so is die area regs van die gemiddeld đ?&#x153;&#x2021; gelyk aan 0,5.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 103
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes â&#x20AC;˘
Die waarskynlikheid van Ĺ&#x2030; spesifieke interval van đ?&#x2018;Ľ waardes word gedefinieer deur die area onder die normaalkurwe tussen đ?&#x2018;Ľ( en đ?&#x2018;Ľ* .
Om die fondasies te lĂŞ vir die berekening van waarskynlikhede met behulp van die normaalverdeling, gaan ons eers kyk na Ĺ&#x2030; spesiale geval: die standaard-normaalverdeling. Hierdie verdeling het Ĺ&#x2030; gemiddeld van nul (đ?&#x153;&#x2021; = 0) en Ĺ&#x2030; standaardafwyking van een (đ?&#x153;&#x17D; = 1). Omdat die waarskynlikheid Ĺ&#x2030; area onder die normaalkurwe is, moet ons hierdie area elke keer bereken om die waarskynlikheid te kry, maar dit is nie so maklik om te doen nie... Gelukkig is dit reeds bereken en word die standaard-normaalverdelingstabel aan die einde van die handboek en as deel van die formuleblad gegee. Dit is baie belangrik dat jy verstaan hoe om die regte waardes uit hierdie tabel te lees. Om Ĺ&#x2030; waarde uit die tabel af te lees is eenvoudig (gebruik đ?&#x2018;§ = 2,56 as voorbeeld): 1. Kry die betrokke ry, in die geval van 2,56 sal dit die ry wees wat 2,5 gemerk is. 2. Kry die betrokke kolom, in die geval van 2,56 sal dit die kolom wees wat 0,06 gemerk is. 3. Lees die waarde af waar ry 2,5 en kolom 0,06 kruis, in diĂŠ geval 0,49477. So wat presies het ons nou gedoen? Ons het die waarskynlikheid dat z tussen 0 en 2,56 val, gaan afgelees uit die tabel en gevind dat daar â&#x20AC;&#x2122;n 49,477% kans is hiervoor: đ?&#x2018;&#x192; 0 < đ?&#x2018;§ < 2,56 = 0,49477
MS Excel-formule: Waar:
đ?&#x2018;&#x2DC;
=NORM.S.DIST(đ?&#x2019;&#x152;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź)
= die gespesifiseerde waarde van đ?&#x2018;§
Formule 2.11: Berekening van die kumulatiewe waarskynlikheid van đ?&#x2018;ˇ(â&#x2C6;&#x2019;â&#x2C6;&#x17E; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152;) Baie belangrik: Die berekening van hierdie waarskynlikheid (area) werk anders as die tabel. Die tabel bereken die waarskynlikheid (area) vir đ?&#x2018;&#x192;(0 < đ?&#x2018;§ < đ?&#x2018;&#x2DC;) en MS Excel bereken dit vir đ?&#x2018;&#x192;(â&#x2C6;&#x2019;â&#x2C6;&#x17E; < đ?&#x2018;§ < đ?&#x2018;&#x2DC;). As jy MS Excel wil gebruik om die z-tabel se waardes te bereken, sal die formule soos volg lyk: =NORM.S.DIST(đ?&#x2018;&#x2DC;, đ?&#x2018;&#x2021;đ?&#x2018;&#x2026;đ?&#x2018;&#x2C6;đ??¸) - NORM.S.DIST(0, đ?&#x2018;&#x2021;đ?&#x2018;&#x2026;đ?&#x2018;&#x2C6;đ??¸) Met ander woorde: = đ?&#x2018;&#x192; â&#x2C6;&#x2019;â&#x2C6;&#x17E; < đ?&#x2018;§ < đ?&#x2018;&#x2DC; â&#x2C6;&#x2019; đ?&#x2018;&#x192;(â&#x2C6;&#x2019;â&#x2C6;&#x17E; < đ?&#x2018;§ < 0) = đ?&#x2018;&#x17D; â&#x2C6;&#x2019; đ?&#x2018;? (verwys na Figuur 2.9 hieronder)
Bladsy 104
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 2.9: Areas wat deur die MS Excel-formule bereken word. Ĺ&#x2030; Verdere nota: MS Excel bereken die waarskynlikheid (area) onder die normaalkurwe vir enige z-waarde. Die tabel werk slegs vir z-waardes wat afgerond is tot die tweede desimaal. Voorbeeld 2.14 Vind die volgende waarskynlikhede deur gebruik te maak van die standaardnormaalverdelingstabel: a) đ?&#x2018;ˇ(đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x2018;đ?&#x;&#x201C;) b) đ?&#x2018;ˇ(â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2019; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;) c) đ?&#x2018;ˇ đ?&#x2019;&#x203A; > đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x2013; d) đ?&#x2019;&#x2018;(â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2022;đ?&#x;&#x201D; < đ?&#x2019;&#x203A;) e) đ?&#x2018;ˇ(â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2019;đ?&#x;? < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x2022;) f)
đ?&#x2018;ˇ(đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2018; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x201C;đ?&#x;&#x2022;)
Oplossing: Dit help altyd om dit wat van jou gevra word op Ĺ&#x2030; stukkie papier te teken. As jy kan sien watter area jy moet bereken, is dit klaar makliker. Vir die doel van hierdie voorbeeld (en om plek te spaar) is al die waardes op een kurwe aangedui:
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 105
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 2.10: Voorbeeld 2.14 a) Om đ?&#x2018;ˇ(đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x2018;đ?&#x;&#x201C;) te vind soek ons die area tussen 0 en 1,35. Soek ry 1,3 in die tabel, soek kolom 0,05 en kyk waar hulle kruis. Lees die betrokke waarde af: 0,4115. Dus is đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x2018;đ?&#x;&#x201C; = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;?đ?&#x;?đ?&#x;&#x201C;. Daar is Ĺ&#x2030; 41,15% kans dat z tussen 0 en 1,35 sal lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =NORM.S.DIST(đ?&#x;?. đ?&#x;&#x2018;đ?&#x;&#x201C;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) â&#x20AC;&#x201C; NORM.S.DIST(đ?&#x;&#x17D;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) b) Om đ?&#x2018;ˇ(â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2019; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;) te vind soek ons die area tussen -0,94 en 0. Ongelukkig gee die tabel nie negatiewe z-waardes nie. Gelukkig weet ons dat hierdie verdeling simmetries versprei is om Ĺ&#x2030; sentrale gemiddeld, en daarom is: đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2019; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; = đ?&#x2018;ˇ(đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2019;) Nou kan ons eenvoudig die waarde gaan aflees uit die tabel waar ry 0,9 en kolom 0,04 kruis: 0,3264. Dus is đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2019; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; = đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2019; en is daar Ĺ&#x2030; 32,64% kans dat z tussen -0,94 en 0 sal lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(đ?&#x;&#x17D;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) â&#x20AC;&#x201C; NORM.S.DIST(â&#x2C6;&#x2019;đ?&#x;&#x17D;. đ?&#x;&#x2014;đ?&#x;&#x2019;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) c) Om đ?&#x2018;ˇ đ?&#x2019;&#x203A; > đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x2013; te vind stel ons belang in die area regs van 1,98. Die tabel gee ons nie hierdie area nie, dus moet ons dit eers verwerk na Ĺ&#x2030; waarde wat ons kan aflees. Ons weet dat đ?&#x2018;ˇ đ?&#x2019;&#x203A; > đ?&#x;&#x17D; = đ?&#x;&#x17D;, đ?&#x;&#x201C; (verwys na die eienskappe van die normaalverdeling). As ons dan gebruik maak van komplementĂŞre waarskynlikhede, dan is: đ?&#x2018;ˇ đ?&#x2019;&#x203A; > đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x2013;
= đ?&#x;&#x17D;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x2018;ˇ đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x2013;
Gaan lees nou 1,98 uit die tabel af: 0,4761. đ?&#x2018;ˇ đ?&#x2019;&#x203A; > đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x2013;
Bladsy 106
= đ?&#x;&#x17D;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x2018;ˇ đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x2013;
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = đ?&#x;&#x17D;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x2022;đ?&#x;&#x201D;đ?&#x;? = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2014; Daar is dus Ĺ&#x2030; 2,39% kans dat z groter sal wees as 1,98. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =1 â&#x20AC;&#x201C; NORM.S.DIST(đ?&#x;?. đ?&#x;&#x2014;đ?&#x;&#x2013;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) d) Om đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2022;đ?&#x;&#x201D; < đ?&#x2019;&#x203A; te vind stel ons belang in die area regs van -1,76. Om die area tussen -1,76 en 0 te kry lees ons die waarde uit die tabel: 0,4608. Maar die area groter as 0 kort nog: đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2022;đ?&#x;&#x201D; < đ?&#x2019;&#x203A; = đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2022;đ?&#x;&#x201D; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; + đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;&#x17D;đ?&#x;&#x2013; + đ?&#x;&#x17D;, đ?&#x;&#x201C; = đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x201D;đ?&#x;&#x17D;đ?&#x;&#x2013; Daar is dus Ĺ&#x2030; 96,08% kans dat z se waarde groter as -1,76 sal wees. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(đ?&#x;?. đ?&#x;&#x2022;đ?&#x;&#x201D;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) e) Om đ?&#x2018;ˇ(â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2019;đ?&#x;? < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x2022;) te vind stel ons belang in die area tussen -2,41 en 0,37. Hierdie waarskynlikheid word nie vir ons gegee in die tabel nie, so ons moet dit verwerk tot in Ĺ&#x2030; formaat wat ons net kan aflees: Omdat đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2019;đ?&#x;? < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; = đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x2019;đ?&#x;? as gevolg van simmetrie, is đ?&#x2018;ˇ(â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2019;đ?&#x;? < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x2022;)
= đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2019;đ?&#x;? < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; + đ?&#x2018;ˇ(đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x2022;) = đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x2019;đ?&#x;? + đ?&#x2018;ˇ(đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x2022;) = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x17D;đ?&#x;? + đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2019;đ?&#x;&#x2019;đ?&#x;&#x2018; = đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;?
Daar is dus Ĺ&#x2030; 63,632% kans dat z tussen -2,41 en 0,37 sal lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(đ?&#x;&#x17D;. đ?&#x;&#x2018;đ?&#x;&#x2022;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) â&#x20AC;&#x201C; NORM.S.DIST(â&#x2C6;&#x2019;đ?&#x;?. đ?&#x;&#x2019;đ?&#x;?, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) f)
Om đ?&#x2018;ˇ đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2018; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x201C;đ?&#x;&#x2022; te vind stel ons belang in die area tussen 0,53 en 2,57. Let daarop dat die gemiddeld nie in hierdie interval lĂŞ nie. Moet egter nie hiervoor skrik nie; ons moet eenvoudig hierdie interval net op so Ĺ&#x2030; manier verwerk dat ons die nodige waardes kan aflees uit die tabel: đ?&#x2018;ˇ đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2018; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x201C;đ?&#x;&#x2022;
= đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x201C;đ?&#x;&#x2022; â&#x2C6;&#x2019; đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2018; = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x2014;đ?&#x;&#x2019;đ?&#x;&#x2014;đ?&#x;? â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2014; = đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;?
Daar is dus Ĺ&#x2030; 29,302% kans dat z tussen 0,53 en 2,57 sal lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(đ?&#x;?. đ?&#x;&#x201C;đ?&#x;&#x2022;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) â&#x20AC;&#x201C; NORM.S.DIST(đ?&#x;&#x17D;. đ?&#x;&#x201C;đ?&#x;&#x2018;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź)
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 107
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Doen nou Voorbeeld 5.4 in die handboek. v Normaalwaarskynlikheidsverdeling Ongelukkig is die standaard-normaalverdeling Ĺ&#x2030; baie spesiale geval van die normaalverdeling en is dit gewoonlik die uitsondering en nie die reĂŤl nie. Die gemiddeld is feitlik nooit 0 en die standaardafwyking 1 nie. Gestel die gemiddeld van Ĺ&#x2030; verdeling getalle is 20 en die standaardafwyking is 4. Gestel ons wil weet wat die waarskynlikheid is dat Ĺ&#x2030; waarde tussen 20 en 22 sal voorkom. Daar is nie Ĺ&#x2030; 20 of 22 in die z-tabel nie! Hoewel daar nie Ĺ&#x2030; z-waarde gegee word nie, is dit moontlik om die z-waarde te bereken. Wanneer Ĺ&#x2030; z-waarde bereken is, is dit maklik om die area, en dus die waarskynlikheid, te bereken. đ?&#x2019;&#x203A;= Waar:
đ?&#x2019;&#x2122;â&#x2C6;&#x2019;đ?? đ??&#x2C6;
đ?&#x2018;Ľ
= die waarde wat verwerk word na die standaard-normaalverdeling
đ?&#x153;&#x2021;
= die gemiddeld van die stogastiese veranderlike đ?&#x2018;Ľ
đ?&#x153;&#x17D;
= die standaardafwyking van die stogastiese veranderlike đ?&#x2018;Ľ Formule 2.12: Standaardisering van x-waardes na z-waardes
Die z-waarde is Ĺ&#x2030; maatstaf van relatiewe afstand tussen die statistiek en sy gemiddeld en word bereken in terme van sy standaardafwyking.
MS Excel-formule: Waar:
=NORM.DIST(đ?&#x2019;&#x152;, đ?? , đ??&#x2C6;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź)
đ?&#x2018;Ľ
= die spesifieke x-waarde
đ?&#x153;&#x2021;
= die gemiddeld van die stogastiese veranderlike đ?&#x2018;Ľ
đ?&#x153;&#x17D;
= die standaardafwyking van die stogastiese veranderlike đ?&#x2018;Ľ
Formule 2.13: Berekening van die kumulatiewe waarskynlikheid van đ?&#x2018;ˇ(â&#x2C6;&#x2019;â&#x2C6;&#x17E; < đ?&#x2018;ż < đ?&#x2019;&#x2122;) Baie belangrik: Die berekening van hierdie waarskynlikheid (area) werk anders as die tabel. Die tabel bereken die waarskynlikheid (area) vir đ?&#x2018;&#x192;(0 < đ?&#x2018;§ < đ?&#x2018;&#x2DC;) en MS Excel bereken dit vir đ?&#x2018;&#x192;(â&#x2C6;&#x2019;â&#x2C6;&#x17E; < đ?&#x2018;&#x2039; < đ?&#x2018;Ľ). Verder bereken hierdie formule die ware waarskynlikheid (area onder die normaalkurwe). Ons moet baie keer die berekende z-waarde afrond tot die tweede desimaal, sodat ons die z-tabel kan gebruik. Hierdie afronding mag daartoe lei dat ons antwoord nie 100% akkuraat is nie. So, as jy Ĺ&#x2030; waarskynlikheid bereken met behulp van die z-tabel en dit dan verifieer met MS Excel, en dit is nie dieselfde nie, is dit nie MS Excel wat dit verkeerd bereken het of
Bladsy 108
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Ĺ&#x2030; fout in die z-tabel nie â&#x20AC;&#x201C; dit is Ĺ&#x2030; afrondingsfout wat noodgedwonge gemaak is tydens ons berekening. Voorbeeld 2.15 Ĺ&#x2030; Afrikaanse onderwyser vind dat sy klas se gemiddeld 64% đ?? = đ?&#x;&#x201D;đ?&#x;&#x2019; is, met Ĺ&#x2030; standaardafwyking van 12% (đ??&#x2C6; = đ?&#x;?đ?&#x;?). Bereken die waarskynlikheid dat: a) Ĺ&#x2030; leerling tussen 64% en 75% sal kry vir Afrikaans. b) Ĺ&#x2030; leerling minder as 30% sal kry vir Afrikaans. Oplossing: a) Vind đ?&#x2018;ˇ(đ?&#x;&#x201D;đ?&#x;&#x2019; < đ?&#x2019;&#x2122; < đ?&#x;&#x2022;đ?&#x;&#x201C;) Stap 1: Teken die normaalverdeling en dui die area aan waarin ons belangstel (verwys na Figuur 2.10)
Figuur 2.11: Area onder die normaalkurwe tussen đ?&#x2019;&#x2122; = đ?&#x;&#x201D;đ?&#x;&#x2019; en đ?&#x2019;&#x2122; = đ?&#x;&#x2022;đ?&#x;&#x201C; Stap 2: Verwerk die x-waardes na z-waardes. Waar đ?&#x2019;&#x2122; = đ?&#x;&#x201D;đ?&#x;&#x2019;: đ?&#x2019;&#x203A; = =
đ?&#x2019;&#x2122;mđ?? đ??&#x2C6;
đ?&#x;&#x201D;đ?&#x;&#x2019;mđ?&#x;&#x201D;đ?&#x;&#x2019; đ?&#x;?đ?&#x;?
=đ?&#x;&#x17D;
Waar đ?&#x2019;&#x2122; = đ?&#x;&#x2022;đ?&#x;&#x201C;: đ?&#x2019;&#x203A; = =
đ?&#x2019;&#x2122;mđ?? đ??&#x2C6;
đ?&#x;&#x2022;đ?&#x;&#x201C;mđ?&#x;&#x201D;đ?&#x;&#x2019; đ?&#x;?đ?&#x;?
=
đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;?
= đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;? Dus is đ?&#x2018;ˇ đ?&#x;&#x201D;đ?&#x;&#x2019; < đ?&#x2019;&#x2122; < đ?&#x;&#x2022;đ?&#x;&#x201C; = đ?&#x2018;ˇ(đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;?)
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 109
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Stap 3: Bereken die waarskynlikheid đ?&#x2018;ˇ(đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;?) met behulp van die ztabel. đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;? = đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;?đ?&#x;?đ?&#x;? Daar is dus Ĺ&#x2030; 32,12% kans dat Ĺ&#x2030; leerling tussen 64% en 75% vir Afrikaans sal kry. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.DIST(đ?&#x;&#x17D;. đ?&#x;&#x2022;đ?&#x;&#x201C;, đ?&#x;&#x17D;. đ?&#x;&#x201D;đ?&#x;&#x2019;, đ?&#x;&#x17D;. đ?&#x;?đ?&#x;?, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) â&#x20AC;&#x201C; NORM.DIST(đ?&#x;&#x17D;. đ?&#x;&#x201D;đ?&#x;&#x2019;, đ?&#x;&#x17D;. đ?&#x;&#x201D;đ?&#x;&#x2019;, đ?&#x;&#x17D;. đ?&#x;?đ?&#x;?, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) b) Vind đ?&#x2018;ˇ đ?&#x2019;&#x203A; < đ?&#x;&#x2018;đ?&#x;&#x17D; Stap 1: Teken die normaalverdeling en dui die area aan waarin ons belangstel (verwys na Figuur 2.11)
Figuur 2.12: Area onder die normaalkurwe tussen đ?&#x2018;Ľ = 30 en đ?&#x2018;Ľ = 64 Stap 2: Verwerk die x-waardes na z-waardes. Waar đ?&#x2019;&#x2122; = đ?&#x;&#x2018;đ?&#x;&#x17D;: đ?&#x2019;&#x203A; = =
đ?&#x2019;&#x2122;mđ?? đ??&#x2C6;
đ?&#x;&#x2018;đ?&#x;&#x17D;mđ?&#x;&#x201D;đ?&#x;&#x2019; đ?&#x;?đ?&#x;?
=
mđ?&#x;&#x2018;đ?&#x;&#x2019; đ?&#x;?đ?&#x;?
= â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2013;đ?&#x;&#x2018; Dus is đ?&#x2018;ˇ đ?&#x2019;&#x2122; < đ?&#x;&#x2018;đ?&#x;&#x17D; = đ?&#x2018;ˇ đ?&#x2019;&#x203A; < â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2013;đ?&#x;&#x2018; Stap 3: Bereken die waarskynlikheid đ?&#x2018;ˇ đ?&#x2019;&#x203A; < â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2013;đ?&#x;&#x2018; met behulp van die z-tabel. đ?&#x2018;ˇ đ?&#x2019;&#x203A; < â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2013;đ?&#x;&#x2018; = đ?&#x;&#x17D;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x2014;đ?&#x;&#x2022;đ?&#x;&#x201D;đ?&#x;&#x2022; = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2018; Daar is dus Ĺ&#x2030; 0,233% kans dat Ĺ&#x2030; leerling minder as 30% vir Afrikaans sal kry. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.DIST(đ?&#x;&#x17D;. đ?&#x;&#x2018;, đ?&#x;&#x17D;. đ?&#x;&#x201D;đ?&#x;&#x2019;, đ?&#x;&#x17D;. đ?&#x;?đ?&#x;?, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź)
Bladsy 110
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Doen nou Voorbeeld 5.5 in die handboek. Ons het nou die waarskynlikheid (area) bereken met behulp van die z-tabel, z-en x-waardes. Wat gemaak as ons Ĺ&#x2030; x-waarde wil kry vanaf Ĺ&#x2030; persentasie? Gestel ons wil weet watter xwaarde die boonste 20% van Afrikaanse leerlinge aandui (vanuit Voorbeeld 2.15 hierbo). Daar is weereens drie stappe wat Wegner (2016:147) voorstel: 1. Teken die normaalkurwe en vind die posisie van die x-waarde waarna ons soek. Hierdie waarde is die boonste of onderste limiet van die interval waarvoor die waarskynlikheid (area) gegee word. 2. Gebruik die z-tabel om die betrokke z-waarde vir die area onder die normaalkurwe te kry. In hierdie geval soek ons die area in die z-tabel en kyk ons in watter ry en kolom dit val. Presies die teenoorgestelde as wat ons hierbo (in Voorbeeld 2.15) gedoen het. 3. Gebruik Formule 2.11 om die z-waarde te verwerk na die x-waarde waarna ons soek.
MS Excel-formule: Waar:
đ?&#x2018;&#x192;
=NORM.S.INV(đ?&#x2018;ˇ)
= die kumulatiewe waarskynlikheid (area onder die normaalkurwe)
Formule 2.14: Berekening van die z-limiet vir die gegewe kumulatiewe waarskynlikheid Hierdie formule bereken die ware z-limiet vir die gegewe waarskynlikheid. Die kans dat jy presies die waarde wat jy uit die z-tabel afgelees het, gaan kry, is baie klein omdat MS Excel dit presies bereken. Onthou dat hierdie verskil toegeskryf word aan afronding omdat die ztabel slegs tot die tweede desimaal afgerond is. Voorbeeld 2.16 a) Vind đ?&#x2019;&#x152; vir đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2022; b) Vind đ?&#x2019;&#x152; vir đ?&#x2018;ˇ đ?&#x2019;&#x152; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; = đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x2018; c) Vind đ?&#x2019;&#x152; vir đ?&#x2018;ˇ đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x2022;đ?&#x;&#x2018;đ?&#x;&#x201C;đ?&#x;&#x2022; Oplossing: a) Vind đ?&#x2019;&#x152; vir đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;?đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2014; Stap 1: Die waarskynlikheid (area) word gegee in Figuur 2.13.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 111
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 2.13: z-verdeling waar đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2022; Stap 2: Lees die betrokke z-waarde uit die z-tabel. đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2022; waar đ?&#x2019;&#x152; = đ?&#x;?. đ?&#x;&#x2019;đ?&#x;? Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.INV(đ?&#x;&#x17D;. đ?&#x;&#x201C; + đ?&#x;&#x17D;. đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x2022;) onthou MS Excel gebruik die kumulatiewe waarskynlikheid vanaf â&#x2C6;&#x2019;â&#x2C6;&#x17E; tot đ?&#x2019;&#x152;, daarom tel ons 0,5 by ons waarskynlikheid. b) Vind đ?&#x2019;&#x152; vir đ?&#x2018;ˇ đ?&#x2019;&#x152; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; = đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2013;đ?&#x;&#x17D;đ?&#x;&#x2018; Stap 1: Die waarskynlikheid (area) word gegee in Figuur 2.14.
Figuur 2.14: z-verdeling waar đ?&#x2018;ˇ đ?&#x2019;&#x152; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; = đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x2018; Stap 2: Lees die betrokke z-waarde uit die z-tabel. đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x2018;đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x2018; waar đ?&#x2019;&#x152; = â&#x2C6;&#x2019;đ?&#x;?. đ?&#x;&#x17D;đ?&#x;&#x17D; Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.INV(đ?&#x;&#x17D;. đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x17D;. đ?&#x;&#x2018;đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x2018;) onthou MS Excel gebruik die kumulatiewe waarskynlikheid vanaf â&#x2C6;&#x2019;â&#x2C6;&#x17E; tot đ?&#x2019;&#x152;, daarom trek ons 0,3413 van 0,5 om die area tussen 0,3413 en 0 te kry.
Bladsy 112
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
c) Vind đ?&#x2019;&#x152; vir đ?&#x2018;ˇ đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x2022;đ?&#x;&#x2018;đ?&#x;&#x2022;đ?&#x;&#x2014; Stap 1: Die waarskynlikheid (area) word gegee in Figuur 2.15.
Figuur 2.15: z-verdeling waar đ?&#x2018;ˇ đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x2022;đ?&#x;&#x2018;đ?&#x;&#x201C;đ?&#x;&#x2022; Stap 2: Lees die betrokke z-waarde uit die z-tabel. đ?&#x2018;ˇ đ?&#x2019;&#x203A;<đ?&#x2019;&#x152;
= đ?&#x;&#x17D;, đ?&#x;&#x201C; + đ?&#x2018;ˇ(đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152;) = đ?&#x;&#x17D;, đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x201C;đ?&#x;&#x2022;
đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; waar đ?&#x2019;&#x152; = â&#x2C6;&#x2019;đ?&#x;?. đ?&#x;&#x17D;đ?&#x;&#x17D; Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.INV(đ?&#x;&#x17D;. đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x17D;. đ?&#x;&#x2018;đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x2018;) onthou MS Excel gebruik die kumulatiewe waarskynlikheid vanaf â&#x2C6;&#x2019;â&#x2C6;&#x17E; tot đ?&#x2019;&#x152;, daarom trek ons 0,3413 van 0,5 om die area tussen 0,3413 en 0 te kry. Doen nou Voorbeeld 5.6 in die handboek. MS Excel-formule: Waar:
=NORM.INV(đ?&#x2018;ˇ, đ?? , đ??&#x2C6;)
đ?&#x2018;&#x192;
= die kumulatiewe waarskynlikheid (area onder die normaalkurwe)
đ?&#x153;&#x2021;
= die gemiddeld van die stogastiese veranderlike đ?&#x2018;Ľ
đ?&#x153;&#x17D;
= die standaardafwyking van die stogastiese veranderlike đ?&#x2018;Ľ
Formule 2.15: Berekening van die x-limiet vir die gegewe kumulatiewe waarskynlikheid Hierdie formule bereken die ware x-limiet vir die gegewe waarskynlikheid. Die kans dat jy die x-waarde presies gaan bereken, is baie klein omdat MS Excel dit presies bereken. As jy die z-tabel gebruik, moet jy noodgedwonge afrond en dit het Ĺ&#x2030; impak op jou finale antwoord. Onthou dat hierdie verskil egter toegeskryf word aan afronding.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 113
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 2.17 Ĺ&#x2030; Afrikaanse onderwyser vind dat sy klas se gemiddeld 64% đ?? = đ?&#x;&#x201D;đ?&#x;&#x2019; is, met Ĺ&#x2030; standaardafwyking van 12% (đ??&#x2C6; = đ?&#x;?đ?&#x;?). Bereken die volgende x-waardes: a) Watter persentasie skei die top 20% van hierdie Afrikaanse klas van die res? b) Tussen watter persentasies sal die middelste 50% van hierdie Afrikaanse klas se punte val? Oplossing: a) Die oplossing verg dat ons die x-waarde moet vind. As Ĺ&#x2030; leerling meer as hierdie xwaarde gekry het, is hy/sy een van die top 20% in die klas. Stap 1: Teken die normaalkurwe wat die area aandui waar die top 20% van die Afrikaanse klas sal lĂŞ:
Figuur 2.16: Top 20% van Afrikaanse leerlinge Stap 2: Gebruik die z-tabel om die z-waarde te vind met betrekking tot waar hierdie area onder die normaalkurwe sal begin. Ons kan nie net 0,2 gaan soek in die z-tabel nie omdat die tabel die waardes vanaf 0 tot by die z-waarde gee en daarom: đ?&#x;&#x17D;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;? = đ?&#x;&#x17D;, đ?&#x;&#x2018; Nou gaan soek ons die area 0,3 in die z-tabel. Die waarde of die naaste waarde daaraan, val in ry 0,8 en kolom 0,04. Dus is die z-waarde waarna ons soek 0,84. Stap 3: Vind die x-waarde vir đ?&#x2019;&#x203A; = đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;&#x2019;: Ons het die volgende waardes: đ?? = đ?&#x;&#x201D;đ?&#x;&#x2019;, đ??&#x2C6; = đ?&#x;?đ?&#x;? en đ?&#x2019;&#x203A; = đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;&#x2019; en dus is
Bladsy 114
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes đ?&#x2019;&#x203A; =
đ?&#x2019;&#x2122;mđ?? đ??&#x2C6;
As ons hierdie formule herskryf om đ?&#x2019;&#x2122; te bereken is: đ?&#x2019;&#x2122; = đ?? + đ?&#x2019;&#x203A;đ??&#x2C6; = đ?&#x;&#x201D;đ?&#x;&#x2019; + đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;&#x2019; đ?&#x;?đ?&#x;? = đ?&#x;&#x2022;đ?&#x;&#x2019;, đ?&#x;&#x17D;đ?&#x;&#x2013; Dus sal jy in die top 20% van hierdie Afrikaanse klas val indien jy 74,08% of meer gekry het. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.INV(đ?&#x;? â&#x2C6;&#x2019; đ?&#x;&#x17D;. đ?&#x;?, đ?&#x;&#x17D;. đ?&#x;&#x201D;đ?&#x;&#x2019;, đ?&#x;&#x17D;. đ?&#x;?đ?&#x;?) b) Om hierdie vraag te beantwoord soek ons die area wat die middelste 50% van die Afrikaanse klas verteenwoordig. Gelukkig weet ons dat die normaalverdeling simmetries versprei is om die gemiddeld. Daarom stel ons belang in die 25% bo en onder die gemiddeld: đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x2019;&#x152; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x201C; Stap 1: Teken die normaalkurwe wat die area aandui waar die middelste 50% van die Afrikaanse klas sal lĂŞ:
Figuur 2.17: Middelste 50% van Afrikaanse leerlinge Stap 2: Gebruik die z-tabel om die z-waarde te vind met betrekking tot waar hierdie area onder die normaalkurwe sal eindig: đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x2019;&#x152; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x2019;&#x152; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; + đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x201C; dus is: đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x201C; Nou gaan soek ons die area 0,25 in die z-tabel. Die waarde of die naaste waarde daaraan, val in ry 0,6 en amper presies tussen kolom 0,07 en 0,08 (omdat die area feitlik presies tussen kolom 0,07 en 0,08 lĂŞ, gebruik ons 0,075). Dus is die z-waarde waarna ons soek 0,675.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 115
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Stap 3: Vind die x-waarde vir đ?&#x2019;&#x203A; = â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x201C; en đ?&#x2019;&#x203A; = đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x201C;: Ons het die volgende waardes: đ?? = đ?&#x;&#x201D;đ?&#x;&#x2019;, đ??&#x2C6; = đ?&#x;?đ?&#x;?, đ?&#x2019;&#x203A; = â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x201C; en đ?&#x2019;&#x203A; = đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x201C; dus is: đ?&#x2019;&#x203A; =
đ?&#x2019;&#x2122;mđ?? đ??&#x2C6;
as ons hierdie formule herskryf om đ?&#x2019;&#x2122; te bereken, is:
đ?&#x2019;&#x2122; = đ?? + đ?&#x2019;&#x203A;đ??&#x2C6; = đ?&#x;&#x201D;đ?&#x;&#x2019; â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x201C; đ?&#x;?đ?&#x;? = đ?&#x;&#x201C;đ?&#x;&#x201C;, đ?&#x;&#x2014; đ?&#x2019;&#x2122; = đ?? + đ?&#x2019;&#x203A;đ??&#x2C6; = đ?&#x;&#x201D;đ?&#x;&#x2019; + đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x201C; đ?&#x;?đ?&#x;? = đ?&#x;&#x2022;đ?&#x;?, đ?&#x;? Dus sal 50% van hierdie Afrikaanse klas se punte tussen 55,9% en 72,1% lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.INV(đ?&#x;&#x17D;. đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x17D;. đ?&#x;?đ?&#x;&#x201C;, đ?&#x;&#x17D;. đ?&#x;&#x201D;đ?&#x;&#x2019;, đ?&#x;&#x17D;. đ?&#x;?đ?&#x;?) en = NORM.INV(đ?&#x;&#x17D;. đ?&#x;&#x201C; + đ?&#x;&#x17D;. đ?&#x;?đ?&#x;&#x201C;, đ?&#x;&#x17D;. đ?&#x;&#x201D;đ?&#x;&#x2019;, đ?&#x;&#x17D;. đ?&#x;?đ?&#x;?) Doen nou Voorbeeld 5.7 in die handboek. Maak seker dat jy weet hoe om die waarskynlikheid (area onder die normaalkurwe) te kry vanaf die x-waarde EN hoe om die x-waarde te bereken vanaf Ĺ&#x2030; waarskynlikheid. Jy moet ook weet hoe om MS Excel te gebruik om jou resultate te verifieer. 2.6.4
Selfevalueringsvrae
Daar is 26 vrae aan die einde van Hoofstuk 5 in die handboek. Doen al hierdie vrae om te verseker dat jy Ĺ&#x2030; behoorlike grondslag het vir verdere werk wat behandel gaan word. 2.7
Beraming
Bestudeer die handboek paragrawe 7.1-7.8. In hierdie paragraaf gaan ons kyk na die beraming van populasie-konstantes, soos die populasiegemiddeld đ?&#x153;&#x2021;. Daar is twee metodes waarna ons gaan kyk, naamlik puntberaming (dit is waar ons đ?&#x153;&#x2021; as Ĺ&#x2030; spesifieke waarde beraam) en vertrouensintervalle (dit is waar ons đ?&#x153;&#x2021; tussen twee limiete beraam). Davis, Pecar en Santana (2016: 285) definieer Ĺ&#x2030; beraming as Ĺ&#x2030; aanduiding van Ĺ&#x2030; onbekende populasie-konstante wat gebaseer is op die steekproef se statistieke.
Bladsy 116
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 2.18: Grafiese voorstelling van â&#x20AC;&#x2122;n puntberaming (đ?&#x2018;ż) en â&#x20AC;&#x2122;n intervalberaming vir die populasiegemiddeld đ?? (Davis, Pecar & Santana 2016: 285) In die praktyk is die populasie-konstantes, soos die gemiddeld en standaardafwyking, nie altyd beskikbaar nie. Dit kan Ĺ&#x2030; probleem wees wanneer ons afleidings wil maak van hierdie populasie. Gelukkig het ons die steekproef se statistieke, naamlik die gemiddeld đ?&#x2018;Ľ en die standaardafwyking đ?&#x2018; , wat ons kan gebruik om die populasie se konstantes te beraam. Neem kennis dat daar Ĺ&#x2030; groot verskeidenheid van metodes is om te bepaal of Ĺ&#x2030; beraming Ĺ&#x2030; onsydige beraming is en hoe om dit te bepaal, maar dit vorm nie deel van hierdie vak nie. 2.7.1
Puntberamings
Bestudeer die handboek paragraaf 7.2. Davis, Pecar en Santana (2016: 285) definieer Ĺ&#x2030; puntberaming as Ĺ&#x2030; enkelwaarde wat bereken is met behulp van die steekproef se data om meer inligting te gee oor die populasiekonstante. Wegner (2016: 179), aan die ander hand, definieer puntberaming as daar aanvaar word dat die steekproefstatistiek die ware waarde van die populasie-konstante is. Ongeag van watter definisie jy verkies, gaan dit daaroor dat Ĺ&#x2030; puntberaming Ĺ&#x2030; waarde is, byvoorbeeld 10, 250 of 12,45. Alvorens ons kan aanvaar dat die steekproef se statistiek gelyk is aan die populasiekonstante, moet ons seker maak dat ons voldoen aan een van die volgende twee voorwaardes: â&#x20AC;˘
dat die steekproef getrek is uit Ĺ&#x2030; populasie wat normaal versprei is; of
â&#x20AC;˘
as die populasie nie normaal versprei is nie, dat die steekproef groot genoeg is dat dit na Ĺ&#x2030; normaalverdeling neig. (Ons maak hier gebruik van die sentrale limietstelling, soos behandel in paragraaf 1.6.4 in die gids.)
Die nadeel van Ĺ&#x2030; puntberaming is dat die kans dat die steekproefstatistiek en die populasiekonstante presies dieselfde is, feitlik nul is. Die rede hiervoor is dat daar altyd, in Ĺ&#x2030; kleinere
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 117
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes of grotere mate, Ĺ&#x2030; steekproeffout is. Om dit erger te maak weet ons nie hoe groot hierdie fout is nie en kan ons dit ook nie beraam nie. 2.7.2
Vertrouensintervalle
Bestudeer die handboek paragraaf 7.3. Davis, Pecar en Santana (2016: 285) definieer Ĺ&#x2030; vertrouensinterval as die beraamde reeks van waardes, wat die onbekende populasie-konstante insluit, met Ĺ&#x2030; waarskynlikheid van 1 â&#x2C6;&#x2019; đ?&#x203A;ź. Wegner (2016: 179) definieer Ĺ&#x2030; vertrouensinterval as die reeks waardes rondom die steekproefstatistiek en dat daar verwag word dat die populasie-konstante binne hierdie interval, met Ĺ&#x2030; gespesifiseerde vlak van sekerheid (of waarskynlikheid), sal lĂŞ. Baie belangrik: Wanneer ons Ĺ&#x2030; vertrouensinterval skep vir die populasie se standaardafwyking, aanvaar ons dat die populasie normaal versprei is (of as die populasie nie normaal versprei is nie, dat die steekproef groot genoeg is dat dit na Ĺ&#x2030; normaalverdeling neig). In hierdie paragraaf sal ons twee scenarioâ&#x20AC;&#x2122;s bespreek: â&#x20AC;˘
Waar die populasie se standaardafwyking đ?&#x153;&#x17D; bekend is.
â&#x20AC;˘
Waar die populasie se standaardafwyking đ?&#x153;&#x17D; onbekend is.
v Vertrouensinterval vir die steekproefgemiddeld đ?? waar die populasie se standaardafwyking đ?&#x203A;&#x201D; bekend is Bestudeer die handboek paragraaf 7.4. Ons gebruik Formule 2.16 hieronder om die vertrouensintervalle te bereken:
đ?&#x2019;&#x2122;â&#x2C6;&#x2019;đ?&#x2019;&#x203A; Waar:
đ??&#x2C6; đ?&#x2019;?
â&#x2030;¤đ?? â&#x2030;¤đ?&#x2019;&#x2122;+đ?&#x2019;&#x203A;
đ??&#x2C6; đ?&#x2019;?
đ?&#x2018;Ľ
= gemiddeld van die steekproef
đ?&#x2018;§
= die z-waarde vir die waarskynlikheid van 1 â&#x2C6;&#x2019; đ?&#x203A;ź onder die normaalkurwe
đ?&#x153;&#x17D;
= standaardafwyking van die populasie
đ?&#x2018;&#x203A;
= steekproefgrootte
Formule 2.16: Berekening van die vertrouensinterval vir die steekproefgemiddeld đ?? waar die populasie se standaardafwyking đ?&#x203A;&#x201D; bekend is.
Bladsy 118
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Let daarop dat: đ?&#x2018;&#x192; â&#x2C6;&#x2019;đ?&#x2018;§Ă&#x2C6;
*
< đ?&#x2018;§ < đ?&#x2018;§Ă&#x2C6;
*
=1â&#x2C6;&#x2019;đ?&#x203A;ź
As ons dus die z-waarde wil kry vir Ĺ&#x2030; vertrouensinterval met Ĺ&#x2030; waarskynlikheid van 95% (of 95% sekerheid), dan is: đ?&#x2018;&#x192; â&#x2C6;&#x2019;đ?&#x2018;§8,8l
*
< đ?&#x2018;§ < đ?&#x2018;§8,8l
*
= 1 â&#x2C6;&#x2019; 0,05
đ?&#x2018;&#x192; â&#x2C6;&#x2019;1,96 < đ?&#x2018;§ < 1,96 = 0,95 Die z-waarde 1,96 is uit die z-tabel gelees waar die area onder die normaalkurwe gelyk aan đ?&#x2018;&#x192;(0 < đ?&#x2018;§ < 0,475) is (verwys na Figuur 2.16).
Figuur 2.20: Grafiese voorstelling van die waarskynlikheid waar đ?&#x153;ś = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x201C; vir â&#x20AC;&#x2122;n vertrouensinterval wat met behulp van z-waardes bereken word (Davis, Pecar & Santana 2016: 293) Tabel 2.1 gee die z-limiete vir die vlak van vertroue vir die algemeenste waarskynlikhede.
Vlak van vertroue
đ?&#x153;ś-waarde
z-limiete
90%
0,10
Âą1,645
95%
0,05
Âą1,96
99%
0,01
Âą2,58
Tabel 2.1: z-limiete vir die algemeenste vlakke van vertroue Onthou om die waarde van 1 â&#x2C6;&#x2019; đ?&#x203A;ź met twee te deel voordat jy die waarskynlikheid soek in die z-tabel omdat hierdie tabel slegs đ?&#x2018;&#x192;(0 < đ?&#x2018;§ < đ?&#x2018;§Ă&#x2C6; * ) gee. Maak seker dat jy die waardes in Tabel 2.1 kan aflees uit die z-tabel. Daar kan selfs van jou verwag word om die z-limiete te Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 119
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes vind vir Ĺ&#x2030; vertrouensinterval met Ĺ&#x2030; 95,44% vlak van vertroue (đ?&#x2018;§ = Âą2). As jy hiermee sukkel, werk weer deur paragraaf 2.6.3, die standaard-normaalwaarskynlikheidsverdeling. Doen Voorbeeld 7.1 in die handboek. Voorbeeld 2.18 Die kwaliteitsbestuurder van Ĺ&#x2030; koeldrankfabriek trek tien 500ml botteltjies koeldrank ewekansig van die produksielyn. Hy meet die inhoud van elke botteltjie presies om te probeer vasstel of die masjien wat die koeldrank in die botteltjies spuit, steeds binne die aanvaarbare limiete is. Aanvaar dat die inhoud van hierdie botteltjies koeldrank normaal versprei is en dat die populasie se standaardafwyking bekend is đ??&#x2C6; = đ?&#x;?đ?&#x;&#x17D; . Hy vind die volgende: Bottel:
1
2
3
4
5
6
7
8
9
10
Inhoud (ml):
485,3 477,2 488,2 476,1 494,1 485,2 491,9 503,6 488,0 493,2
Bereken Ĺ&#x2030; vertrouensinterval, met 95% vlak van vertroue, vir die populasie se gemiddeld (đ?? ) gebaseer op die data hierbo. Oplossing: Die steekproefgemiddeld kan bereken word as 488,28ml đ?&#x153;ś = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x201C;, dus is die z-limiet Âą1,96 Dan bereken ons die vertrouensinterval as: đ?&#x2019;&#x2122;â&#x2C6;&#x2019;đ?&#x2019;&#x203A;
đ??&#x2C6; đ?&#x2019;?
â&#x2030;¤đ?? â&#x2030;¤đ?&#x2019;&#x2122;+đ?&#x2019;&#x203A;
đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2013;, đ?&#x;?đ?&#x;&#x2013; â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D;
đ?&#x;?đ?&#x;&#x17D; đ?&#x;?đ?&#x;&#x17D;
đ??&#x2C6; đ?&#x2019;?
< đ?? < đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2013;, đ?&#x;?đ?&#x;&#x2013; + đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D;
đ?&#x;?đ?&#x;&#x17D; đ?&#x;?đ?&#x;&#x17D;
đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2013;, đ?&#x;?đ?&#x;&#x2013; â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D; đ?&#x;&#x2018;, đ?&#x;?đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x2018; < đ?? < đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2013;, đ?&#x;?đ?&#x;&#x2013; + đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D; đ?&#x;&#x2018;, đ?&#x;?đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x2018; đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2013;, đ?&#x;?đ?&#x;&#x2013; â&#x2C6;&#x2019; đ?&#x;&#x201D;, đ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x2013;đ?&#x;? < đ?? < đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2013;, đ?&#x;?đ?&#x;&#x2013; + đ?&#x;&#x201D;, đ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x2013;đ?&#x;? đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;?, đ?&#x;&#x17D;đ?&#x;&#x2013;đ?&#x;?đ?&#x;&#x2014; < đ?? < đ?&#x;&#x2019;đ?&#x;&#x2014;đ?&#x;&#x2019;, đ?&#x;&#x2019;đ?&#x;&#x2022;đ?&#x;&#x2013;đ?&#x;? Daar is dus Ĺ&#x2030; 95% kans dat die werklike gemiddelde volume van al die 500ml koeldrankbotteltjies tussen 482,1ml en 494,5ml is. Dus sal die kwaliteitsbestuurder die betrokke masjien wil kalibreer om te verseker dat die botteltjies met Ĺ&#x2030; aanvaarbare volume gevul word.
Bladsy 120
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes v Akkuraatheid van vertrouensintervalle Bestudeer die handboek paragraaf 7.5. Wegner (2016: 181-185) bespreek die invloed wat die volgende maatstawwe op die akkuraatheid van Ĺ&#x2030; vertrouensinterval het: â&#x20AC;˘
vlak van sekerheid;
â&#x20AC;˘
steekproefgrootte; en
â&#x20AC;˘
die populasie se standaardafwyking.
Dit kan in kort soos volg opgesom word: Maatstaf Vlak van sekerheid
Invloed Kleiner
Hoe kleiner die vlak van sekerheid, hoe kleiner is die vertrouensinterval.
Groter
Hoe groter die vlak van sekerheid, hoe groter is die vertrouensinterval.
Steekproefgrootte
Kleiner
Hoe kleiner die steekproefgrootte, hoe kleiner is die vertrouensinterval.
Groter
Hoe groter die steekproefgrootte, hoe groter is die vertrouensinterval.
Populasie se
Kleiner
standaardafwyking
Hoe kleiner die populasie se standaardafwyking, hoe kleiner is die vertrouensinterval.
Groter
Hoe groter die populasie se standaardafwyking, hoe groter is die vertrouensinterval.
Tabel 2.2: Invloed van maatstawwe op die grootte van vertrouensintervalle As ons Voorbeeld 2.18 vat en ons gaan doen dieselfde berekeninge as in die handboek, sien ons wat die invloed van hierdie drie maatstawwe is op die grootte van Ĺ&#x2030; vertrouensinterval.
Vlak van sekerheid 90%
Formule đ?&#x153;&#x2021; = đ?&#x2018;Ľ Âą 1,645
Gevolg đ?&#x153;&#x17D; đ?&#x2018;&#x203A;
đ?&#x153;&#x2021; = 488,28 Âą 1,645 5,2019 483,1 < đ?&#x153;&#x2021; < 493,5
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 121
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
95%
đ?&#x153;&#x2021; = đ?&#x2018;Ľ Âą 1,96
99%
đ?&#x153;&#x2021; = đ?&#x2018;Ľ Âą 2,58
đ?&#x153;&#x17D; đ?&#x2018;&#x203A;
đ?&#x153;&#x17D; đ?&#x2018;&#x203A;
đ?&#x153;&#x2021; = 488,28 Âą 1,96 6,1981 482,1 < đ?&#x153;&#x2021; < 494,5 đ?&#x153;&#x2021; = 488,28 Âą 2,58 8,1587 480,1 < đ?&#x153;&#x2021; < 496,4
Tabel 2.3: Invloed van die vlak van sekerheid op die grootte van vertrouensintervalle Steekproefgrootte
Formule đ?&#x153;&#x17D;
10
đ?&#x2018;&#x203A;
đ?&#x153;&#x17D;
50
đ?&#x2018;&#x203A;
đ?&#x153;&#x17D;
150
đ?&#x2018;&#x203A;
= 3,1623
Gevolg đ?&#x153;&#x2021; = 488,28 Âą 1,96 3,1623 482,1 < đ?&#x153;&#x2021; < 494,5
= 1,4142
đ?&#x153;&#x2021; = 488,28 Âą 1,96 1,4142 485,5 < đ?&#x153;&#x2021; < 491,1
= 0,8165
đ?&#x153;&#x2021; = 488,28 Âą 1,96 0,8165 486,7 < đ?&#x153;&#x2021; < 489,9
Tabel 2.4: Invloed van die steekproefgrootte op die grootte van vertrouensintervalle Standaardafwyking
Formule
Gevolg
van die populasie 10
đ?&#x153;&#x17D; đ?&#x2018;&#x203A;
50
đ?&#x153;&#x17D; đ?&#x2018;&#x203A;
150
đ?&#x153;&#x17D; đ?&#x2018;&#x203A;
= 3,1623
đ?&#x153;&#x2021; = 488,28 Âą 1,96 3,1623 482,1 < đ?&#x153;&#x2021; < 494,5
= 15,8114
đ?&#x153;&#x2021; = 488,28 Âą 1,96 15,8114 457,3 < đ?&#x153;&#x2021; < 519,3
= 47,4342
đ?&#x153;&#x2021; = 488,28 Âą 1,96 47,4342 395,3 < đ?&#x153;&#x2021; < 581,3
Tabel 2.5: Invloed van die populasie se standaardafwyking op die grootte van vertrouensintervalle
Bladsy 122
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Daar word van jou verwag om Ĺ&#x2030; volledige beskrywing te kan gee van die invloed wat die vlak van sekerheid, steekproefgrootte en die populasie se standaardafwyking op Ĺ&#x2030; vertrouensinterval het. Maak dus seker jy is vertroud hiermee. Doen nou Voorbeeld 7.3 en 7.4 in die handboek. Paragraaf 7.6 in die handboek verduidelik die rasionaal waarop vertrouensintervalle gebaseer is. Lees deur hierdie paragraaf om Ĺ&#x2030; beter oorsig oor die gebruik van vertrouensintervalle te verkry. v Vertrouensinterval vir die steekproefgemiddeld đ?? waar die populasie se standaardafwyking đ?&#x203A;&#x201D; onbekend is Bestudeer die handboek paragraaf 7.7-7.8. Dit gebeur dikwels in praktyk dat geen statistieke van die populasie bekend is nie; dus is die populasie-standaardafwyking đ?&#x153;&#x17D; nie beskikbaar nie. In so Ĺ&#x2030; geval moet die steekproef se standaardafwyking đ?&#x2018; gebruik word. In so Ĺ&#x2030; geval, gebruik Formule 2.17 hieronder om die vertrouensintervalle te bereken:
đ?&#x2019;&#x2122;â&#x2C6;&#x2019;đ?&#x2019;&#x2022; Waar:
đ?&#x2019;&#x201D; đ?&#x2019;?
â&#x2030;¤đ?? â&#x2030;¤đ?&#x2019;&#x2122;+đ?&#x2019;&#x2022;
đ?&#x2019;&#x201D; đ?&#x2019;?
đ?&#x2018;Ľ
= gemiddeld van die steekproef
đ?&#x2018;Ą
= die t-waarde wat afgelees word uit die t-tabel
đ?&#x2018;
= standaardafwyking van die steekproef
đ?&#x2018;&#x203A;
= steekproefgrootte
Formule 2.17: Berekening van die vertrouensinterval vir die steekproefgemiddeld đ?? waar die populasie se standaardafwyking đ?&#x203A;&#x201D; onbekend is. Daar is twee statistieke in Formule 2.17 wat jou moet opval: â&#x20AC;˘
ons gebruik die steekproef se standaardafwyking in plaas van die populasie se standaardafwyking omdat die laasgenoemde nie beskikbaar is nie; en
â&#x20AC;˘
ons gebruik t-waardes in die plek van z-waardes.
Die naam van hierdie waarskynlikheidsverdeling is die â&#x20AC;&#x153;student-t-verdelingâ&#x20AC;? en dit word hoofsaaklik gebruik waar die steekproefgrootte klein is en die populasie normaal versprei is. As jy na die t-tabel in die agterkant van die handboek gaan kyk, sal jy sien hoe groter die grade van vryheid (df) word, hoe nader kom die t-waardes aan die z-waardes. Om die regte waardes uit die t-tabel af te lees het ons twee waardes nodig:
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 123
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes â&#x20AC;˘
vlak van sekerheid (1 â&#x2C6;&#x2019; đ?&#x203A;ź); en
â&#x20AC;˘
die steekproefgrootte (đ?&#x2018;&#x203A;), wat in hierdie geval gebruik word om die grade van vryheid (đ?&#x2018;&#x2018;đ?&#x2018;&#x201C;) af te lei: đ?&#x2018;&#x2018;đ?&#x2018;&#x201C; = đ?&#x2018;&#x203A; â&#x2C6;&#x2019; 1.
Gestel dat ons die t-waarde aflees vir Ĺ&#x2030; vertrouensinterval van 99% waar die steekproefgrootte gelyk is aan 16. Dan is: đ?&#x203A;ź = 1 â&#x2C6;&#x2019; 0,99 = 0,01 Om dieselfde rede as met die z-limiete deel ons đ?&#x203A;ź deur 2 (ons het Ĺ&#x2030; boonste en onderste tlimiet waarin ons belangstel): Ă&#x2C6; *
= 0,005
đ?&#x2018;&#x2018;đ?&#x2018;&#x201C; = đ?&#x2018;&#x203A; â&#x2C6;&#x2019; 1 = 16 â&#x2C6;&#x2019; 1 = 15 Nou gaan soek ons die ry wat đ?&#x2018;&#x2018;đ?&#x2018;&#x201C; = 15 verteenwoordig en die 0,005 kolom. Die waarde waar die twee kruis, is gelyk aan 2,947. Dit is baie belangrik dat jy weet hoe en waar om hierdie t-waardes uit die tabel af te lees. Voorbeeld 2.19 â&#x20AC;&#x2122;n Onderneming wat beleggingsdienste oor die telefoon bied, probeer bepaal hoe lank die gemiddelde oproep duur. Hulle trek elf oproepe ewekansig uit hul opname-basis. Aanvaar dat die duur van hierdie oproepe normaal versprei is en dat die populasie se standaardafwyking onbekend is. Die volgende tye (in sekondes) is verkry: Oproep:
1
2
3
4
5
6
7
8
9
10
11
Duur (s):
469
848
499
534
539
582
570
636
560
575
456
Bereken Ĺ&#x2030; vertrouensinterval, met 90% vlak van vertroue, vir die populasie se gemiddeld (đ?? ) gebaseer op die data hierbo. Oplossing: Die steekproefgemiddeld kan bereken word as 536,7 sekondes Die steekproef se standaardafwyking kan bereken word as 55.1 sekondes Die volgende is gegee: đ?&#x153;ś = đ?&#x;&#x17D;, đ?&#x;? en đ?&#x2019;? = đ?&#x;?đ?&#x;? Bereken die grade van vryheid: đ?&#x2019;&#x2026;đ?&#x2019;&#x2021; = đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x;? = đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;? = đ?&#x;?đ?&#x;&#x17D;
Bladsy 124
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Lees die korrekte waarde uit die tabel: df
đ?&#x203A;ź
0.1000
0.0500
0.0250
0.0100
0.0050
0.0025
1
3.078
6.314
12.706
31.821
63.657
127.321
2
1.886
2.920
4.303
6.965
9.925
14.089
3
1.638
2.353
3.182
4.541
5.841
7.453
4
1.533
2.132
2.776
3.747
4.604
5.598
5
1.476
2.015
2.571
3.365
4.032
4.773
6
1.440
1.943
2.447
3.143
3.707
4.317
7
1.415
1.895
2.365
2.998
3.499
4.029
8
1.397
1.860
2.306
2.896
3.355
3.833
9
1.383
1.833
2.262
2.821
3.250
3.690
10
1.372
1.812
2.228
2.764
3.169
3.581
11
1.363
1.796
2.201
2.718
3.106
3.497
12
1.356
1.782
2.179
2.681
3.055
3.428
Tabel 2.6: Uittreksel van die t-tabel waar đ?&#x2019;&#x2022;(đ?&#x;?đ?&#x;&#x17D;)(đ?&#x;&#x17D;,đ?&#x;?
đ?&#x;?)
đ?&#x2019;&#x2022;(đ?&#x;?đ?&#x;&#x17D;)(đ?&#x;&#x17D;,đ?&#x;&#x17D;đ?&#x;&#x201C;) = đ?&#x;?, đ?&#x;?đ?&#x;&#x2013;đ?&#x;?đ?&#x;? Dan bereken ons die vertrouensinterval as: đ?&#x2019;&#x2122;â&#x2C6;&#x2019;đ?&#x2019;&#x2022;
đ?&#x2019;&#x201D; đ?&#x2019;?
â&#x2030;¤đ?? â&#x2030;¤đ?&#x2019;&#x2122;+đ?&#x2019;&#x2022;
đ?&#x;&#x201C;đ?&#x;&#x2018;đ?&#x;&#x201D;, đ?&#x;&#x2022; â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x2013;đ?&#x;?đ?&#x;?
đ?&#x;&#x201C;đ?&#x;&#x201C;, đ?&#x;? đ?&#x;?đ?&#x;?
đ?&#x2019;&#x201D; đ?&#x2019;?
< đ?? < đ?&#x;&#x201C;đ?&#x;&#x2018;đ?&#x;&#x201D;, đ?&#x;&#x2022; + đ?&#x;?, đ?&#x;&#x2013;đ?&#x;?đ?&#x;?
đ?&#x;&#x201C;đ?&#x;&#x201C;, đ?&#x;? đ?&#x;?đ?&#x;?
đ?&#x;&#x201C;đ?&#x;&#x2018;đ?&#x;&#x201D;, đ?&#x;&#x2022; â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x2013;đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;&#x201D;, đ?&#x;&#x201D; < đ?? < đ?&#x;&#x201C;đ?&#x;&#x2018;đ?&#x;&#x201D;, đ?&#x;&#x2022; + đ?&#x;?, đ?&#x;&#x2013;đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;&#x201D;, đ?&#x;&#x201D; đ?&#x;&#x201C;đ?&#x;&#x2018;đ?&#x;&#x201D;, đ?&#x;&#x2022; â&#x2C6;&#x2019; đ?&#x;&#x2018;đ?&#x;&#x17D;, đ?&#x;? < đ?? < đ?&#x;&#x201C;đ?&#x;&#x2018;đ?&#x;&#x201D;, đ?&#x;&#x2022; + đ?&#x;&#x2018;đ?&#x;&#x17D;, đ?&#x;? đ?&#x;&#x201C;đ?&#x;&#x17D;đ?&#x;&#x201D;, đ?&#x;&#x201D; < đ?? < đ?&#x;&#x201C;đ?&#x;&#x201D;đ?&#x;&#x201D;, đ?&#x;&#x2013; Daar is dus Ĺ&#x2030; 90% kans dat die werklike gemiddelde duur van Ĺ&#x2030; oproep tussen 506,6 en 566,8 sekondes lank sal wees. Doen nou Voorbeeld 7.5 in die handboek. 2.7.3
Selfevalueringsvrae
Doen Vraag 1-13 aan die einde van Hoofstuk 7 in die handboek. 2.8
Samevatting
In hierdie studie-eenheid het ons begin om te kyk na waarskynlikhede en hoe dit gebruik kan word om afleidings en beramings te maak van die populasie.
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
Bladsy 125
GQM105 Inleiding tot elementêre kwantitatiewe metodes Ons het gekyk na die belangrikste begrippe wat die fondamente is van waarskynlikheidsleer, insluitende snyding van gebeurtenisse, onderling uitsluitlike gebeurtenisse, subversamelings van gebeurtenisse, komplementêre gebeurtenisse en statisties onafhanklike gebeurtenisse. Toe het ons die marginale, gesamentlike, saamgevoegde en voorwaardelike waarskynlikhede van hierdie gebeurtenisse bereken. Om ons te help met hierdie berekeninge het ons permutasies en kombinasies uitgewerk met behulp van die telreëls. Nadat ons die basiese beginsels van waarskynlikhede onder die knie gekry het, het ons gaan kyk na die verskillende kategorieë van waarskynlikheidsverdelings: ons het die binominale (waarskynlikheid op ʼn sukses) en die Poisson (die waarskynlikheid van ʼn gebeurtenis binne ʼn bepaalde interval) diskrete waarskynlikheidsverdelings behandel. Daarna het ons oorgegaan na die kontinue waarskynlikheidsverdelings, waar ons die standaard-normaalverdeling en die normaalverdeling gedoen het. Hierdie beginsels en berekening het ons gebruik om puntberamings en intervalberamings te doen. Ons het gewys wat die invloed van die vlak van sekerheid, steekproefgrootte en die grootte van die standaardafwyking op ʼn vertrouensinterval is. Ons het vertrouensintervalle bereken waar die populasie se standaardafwyking bekend (z-limiete) en onbekend (t-limiete) was. Ons gaan hierdie basis nou verder gebruik in hipotesetoetsing (die volgende studieeenheid), waar ons gevolgtrekkings gaan maak wat gebaseer is op waarskynlikhede en waarskynlikheidsverdelings. Hier sal ons ook gebruik maak van z-waardes en t-waardes.
Bladsy 126
Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
STUDIE-EENHEID 3: HIPOTESETOETSING
3.1
Studie-eenheid leeruitkomste
Kennis en begrip Na voltooiing van Studie-eenheid 3 sal jy in staat wees om jou kennis en begrip van die volgende te demonstreer: â&#x20AC;˘
Basiese begrippe wat gebruik word vir hipotesetoetsing
â&#x20AC;˘
Die proses wat ons gebruik om Ĺ&#x2030; hipotesetoets te doen
â&#x20AC;˘
Hipotesetoetsing van Ĺ&#x2030; enkele populasie se gemiddeld waar die populasie se standaardafwyking bekend is
â&#x20AC;˘
Hipotesetoetsing van Ĺ&#x2030; enkele populasie se gemiddeld waar die populasie se standaardafwyking onbekend is
â&#x20AC;˘
Hipotesetoetsing van Ĺ&#x2030; enkele populasie se gemiddeld met behulp van die đ?&#x2019;&#x2018;-waarde
Vaardighede Jy sal ook in staat wees om: â&#x20AC;˘
te verduidelik wat die volgende begrippe beteken: o
nulhipotese en Ĺ&#x2030; alternatiewe hipotese
o
peil van betekenis
o
Tipe I- en II-foute
o
toetsstatistiek
o
kritieke waarde
o
đ?&#x2019;&#x2018;-waarde
â&#x20AC;˘
die vyf stappe van hipotesetoetsing te identifiseer en toe te pas;
â&#x20AC;˘
hipotesetoetsing vir Ĺ&#x2030; populasiegemiddeld te doen as die populasie se standaardafwyking bekend is (z-toets);
â&#x20AC;˘
hipotesetoetsing vir Ĺ&#x2030; populasiegemiddeld te doen as die populasie se standaardafwyking onbekend is (t-toets); en
â&#x20AC;˘
Ĺ&#x2030; p-waarde te interpreteer en vir hipotesetoetsing te gebruik.
Studie-eenheid 3: Hipotesetoetsing
Bladsy 127
GQM105 Inleiding tot elementêre kwantitatiewe metodes 3.2
Voorgeskrewe handboek
Wegner, T. 2016. Applied business statistics. 4de uitgawe. Claremont: Juta. Vir die doeleindes van hierdie studie-eenheid moet jy die volgende paragrawe bestudeer: Hoofstuk 8 paragrawe 8.1-8.4 en 8.6-8.8 3.3
Hoe kan jy jou begrip verbeter?
Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord
Omskrywing
Aanvaardingsarea
Die area/oppervlak onder ʼn kurwe waar die nulhipotese as waarskynlik waar aanvaar word.
Alternatiewe hipotese
Die hipotese wat die komplementêre stelling van die nulhipotese is; dit is, met ander woorde, die teenoorgestelde van die nulhipotese.
Hipotese
ʼn Hipotese is ʼn stelling wat gemaak word.
Hipotesetoets
ʼn Prosedure wat die nulhipotese op die proef stel.
Kritieke waarde
Die waarde waarteen die toetsstatistiek oorweeg word ten einde ʼn gevolgtrekking te kan maak.
Kumulatiewe
Die gesamentlike waarskynlikheid vir alle onderling
waarskynlikheid
uitsluitlike gebeurtenisse van ʼn stogastiese veranderlike, tussen twee bepaalde limiete.
Limiete
ʼn Numeriese grens waarbo/waaronder ʼn hipotese getoets word.
Nulhipotese
’n Teorie oor of ʼn stelling wat gemaak word aangaande ’n populasiestatistiek wat nog bewys moet word.
Peil van
Die peil van betekenis is die waarskynlikheid dat ons die
betekenis/sekerheid/vertroue
nulhipotese (as waarskynlik waar) verwerp, terwyl die nulhipotese eintlik waar is.
Statisties betekenisvol
ʼn Beslissende uitkoms/resultaat na afloop van ʼn hipotesetoets.
Toetsstatistiek
Die waarde wat met die kritieke waarde vergelyk word ten
Bladsy 128 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes einde Ĺ&#x2030; gevolgtrekking te kan maak. Verwerpingsarea
Die area/oppervlak onder Ĺ&#x2030; kurwe waar die nulhipotese as waarskynlik waar verwerp word.
3.4
Inleiding
Alles wat ons tot op hede behandel het, het opgebou na hipotesetoetsing. Nou mag jy vra waarom hipotesetoetsing sĂł belangrik is. Hipotesetoetsing is so belangrik omdat ons dit gebruik om Ĺ&#x2030; stelling te aanvaar of te verwerp. Hierdie stellings is gewoonlik gebaseer op Ĺ&#x2030; navorsingsvraag wat iemand probeer beantwoord, byvoorbeeld of die inkomste van Ĺ&#x2030; winkel meer as Ĺ&#x2030; sekere bedrag is, of die tydperk wat Ĺ&#x2030; aflewering minder is as Ĺ&#x2030; bepaalde tyd, ensovoorts. Ons gebruik dus hipotesetoetsing in enige kwantitatiewe navorsing wat gedoen word. Dit is Ĺ&#x2030; vyfstapproses wat ons gebruik om te wys dat Ĺ&#x2030; stelling (hipotese) waarskynlik reg of waarskynlik verkeerd is. Tydens die stap waar ons die toetsstatistiek bereken, gebruik ons die steekproefdata en statistieke wat ons daarmee bereken het om Ĺ&#x2030; gevolgtrekking te maak oor Ĺ&#x2030; populasie-konstante. Daar is Ĺ&#x2030; baie groot verskeidenheid van hipotesetoetsing, maar ons gaan slegs kyk na: â&#x20AC;˘
die populasiegemiddeld waar die populasie se standaardafwyking bekend is; en
â&#x20AC;˘
die populasiegemiddeld waar die populasie se standaardafwyking onbekend is.
3.5
Basiese begrippe van hipotesetoetsing
Alvorens ons verder kan aangaan, is dit nodig dat ons gou kyk na die basiese begrippe wat ons gaan gebruik om Ĺ&#x2030; hipotesetoets te doen. 3.5.1
Die nul en alternatiewe hipotese
Soos vroeĂŤr genoem, gaan hipotesetoetsing daaroor dat ons die waarskynlikheid van Ĺ&#x2030; stelling wil toets. Hierdie stelling is eintlik twee komplementĂŞre stellings (die nul- en alternatiewe hipotese), met ander woorde as die een aanvaar word, word die ander verwerp. Beide hierdie hipoteses kan nie op dieselfde tyd van toepassing wees nie. Daarom moet ons baie versigtig wees dat ons die nul- en die alternatiewe hipotese korrek formuleer. v Nulhipotese đ?&#x2018;Żđ?&#x;&#x17D; Davis, Pecar en Santana (2016: 317) wys ons daarop dat die nulhipotese â&#x20AC;&#x2122;n teorie aangaande die populasie se konstantes verteenwoordig en dat hierdie teorie nog bewys moet word. Wegner (2016: 200) meld dat die nulhipotese sĂŞ dat die populasie-konstante
Studie-eenheid 3: Hipotesetoetsing
Bladsy 129
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes gelyk aan, kleiner as of groter as Ĺ&#x2030; spesifieke waarde is en dat dit gewoonlik die status quo verteenwoordig. Die manier waarop die nulhipotese geformuleer word, bepaal of dit Ĺ&#x2030; eenkantige of tweekantige hipotesetoets gaan wees. Tabel 3.1 hieronder gee vir ons die trefwoorde en wiskundige simbole wat ons help om Ĺ&#x2030; eenkantige of tweekantige hipotese te herken en te definieer.
Trefwoorde
Wiskundige simbole
Gelyk aan, dieselfde as Kleiner as, groter as, nie minder as,
= <, >, â&#x2030;¤, â&#x2030;Ľ
Tipe hipotesetoets Tweekantige hipotesetoets Eenkantige hipotesetoets
nie meer as, ten minste, op die meeste, ensovoorts Tabel 3.1: Woorde en simbole wat gebruik word vir die definiĂŤring van â&#x20AC;&#x2122;n hipotese v Alternatiewe hipotese đ?&#x2018;Żđ?&#x;? Davis, Pecar en Santana (2016: 317) stel dit dat hierdie hipotese alternatiewe waardes vir die populasie-konstante bevat as in die nulhipotese en dus as Ĺ&#x2030; kontrasterende stelling vir die nulhipotese dien. Wegner (2016: 200) sĂŞ dat die alternatiewe hipotese die teenoorgestelde is as die nulhipotese. Die nulhipotese en alternatiewe hipotese het komplementĂŞre waarskynlikhede in die steekproefruimte van die hipotesetoets. Dus moet die alternatiewe hipotese aanvaar word (as waarskynlik waar) waar ons die nulhipotese (as waarskynlik waar) verwerp. 3.5.2
Peil van betekenis đ?&#x153;ś
Die peil van betekenis is die waarskynlikheid dat ons die nulhipotese (as waarskynlik waar) verwerp, terwyl die nulhipotese eintlik waar is. Dus, as ons sĂŞ dat ons Ĺ&#x2030; nulhipotese toets teen Ĺ&#x2030; 0,05 peil van betekenis, sĂŞ ons eintlik dat die waarskynlikheid dat ons die nulhipotese verwerp, terwyl ons dit eintlik moet aanvaar, nie groter as 5% is nie. 3.5.3
Tipe I- en II-foute
Die waarskynlikheid dat ons die nulhipotese verwerp, terwyl dit eintlik waar is, staan bekend as Ĺ&#x2030; Tipe I-fout (of die peil van betekenis). Die waarskynlikheid dat ons die nulhipotese aanvaar, terwyl dit eintlik nie waar is nie, staan bekend as Ĺ&#x2030; Tipe II-fout.
Bladsy 130 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Hoe kleiner die kans op Ĺ&#x2030; Tipe I-fout is, hoe groter die kans dat Ĺ&#x2030; Tipe II-fout sal plaasvind. Om die waarskynlikheid van Ĺ&#x2030; Tipe II-fout te beperk pas ons die peil van betekenis aan, omdat ons bepaal wat die kans van Ĺ&#x2030; Tipe I-fout is. 3.5.4
Toetsstatistiek
Die toetsstatistiek is die waarde wat ons bereken met behulp van die data wat ons tydens die steekproef versamel het. Deur die toetsstatistiek te vergelyk met die kritieke waarde, kan ons bepaal of die nulhipotese aanvaar of verwerp word. 3.5.5
Kritieke waarde
Dit is die kwantiel, in verband met die waarskynlikheid dat Ĺ&#x2030; Tipe I-fout sal plaasvind (peil van betekenis), wat afgelei is van die steekproefverdeling van die toetsstatistiek. Ĺ&#x2030; Kritieke waarde is die limiet vir die toetsstatistiek, wat bepaal of die nulhipotese aanvaar of verwerp word. Met ander woorde, die kritieke waarde definieer die verwerpingsarea vir die nulhipotese. 3.5.6
đ?&#x2019;&#x2018;-waarde
Die đ?&#x2018;?-waarde is die waarskynlikheid om die toetsstatistiek ewekansig te verkry, onder die nulhipotese. As đ?&#x2019;&#x2018;-waarde < đ?&#x153;ś sal ons die nulhipotese verwerp. Met ander woorde, as die waarskynlikheid om die toetsstatistiek te kry kleiner is as om die nulhipotese verkeerdelik te verwerp, is die kans dat die alternatiewe hipotese waar is baie groter. 3.6
Die proses van hipotesetoetsing
Hipotesetoetsing is Ĺ&#x2030; vyfstapproses. Hierdie vyf stappe is presies dieselfde vir al die hipotesetoetse wat jy in hierdie vak moet kan doen. Indien jy hierdie stappe ken, is jy al halfpad daar! In hierdie studie-eenheid gaan ons net kyk na hipotesetoetse wat betrekking het op die populasiegemiddeld đ?&#x153;&#x2021;. 3.6.1
Stap 1: Definieer die nulhipotese en die alternatiewe hipotese
Kyk na die vraag wat vir jou gevra word om te bepaal hoe jy die nulhipotese en die alternatiewe hipotese moet definieer. Soos vroeĂŤr genoem, is daar drie basiese maniere om Ĺ&#x2030; hipotese te formuleer: v Tweekantige hipotesetoets: đ??ť8 : populasie-konstante = Ĺ&#x2030; spesifieke waarde đ??ť( : populasie-konstante â&#x2030; Ĺ&#x2030; spesifieke waarde
Studie-eenheid 3: Hipotesetoetsing
Bladsy 131
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Voorbeeld: As Ĺ&#x2030; skoolhoof beweer dat die gemiddelde IK van sy leerlinge gelyk is aan 105. Dus sal: đ??ť8 : die gemiddelde IK van die leerlinge is gelyk aan 105. đ??ť( : die gemiddelde IK van die leerlinge is nie gelyk aan 105 nie. Maar dit kan ook soos volg geskryf word: đ??ť8 : đ?&#x153;&#x2021; = 105 đ??ť( : đ?&#x153;&#x2021; â&#x2030; 105
Figuur 3.1: Aanvaardings- en verwerpingsarea van â&#x20AC;&#x2122;n tweekantige hipotesetoets v Eenkantige hipotesetoets na onder (links): đ??ť8 : populasie-konstante â&#x2030;Ľ Ĺ&#x2030; spesifieke waarde đ??ť( : populasie-konstante < Ĺ&#x2030; spesifieke waarde Voorbeeld: As Ĺ&#x2030; skoolhoof beweer dat die gemiddelde IK van sy leerlinge groter of gelyk aan 105 is. Dus sal: đ??ť8 : die gemiddelde IK van die leerlinge is groter of gelyk aan 105. đ??ť( : die gemiddelde IK van die leerlinge is kleiner as 105. Maar dit kan ook soos volg geskryf word: đ??ť8 : đ?&#x153;&#x2021; â&#x2030;Ľ 105 đ??ť( : đ?&#x153;&#x2021; < 105
Bladsy 132 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 3.2: Aanvaardings- en verwerpingsarea van â&#x20AC;&#x2122;n eenkantige hipotesetoets na onder (links) v Eenkantige hipotesetoets na bo (regs): đ??ť8 : populasie-konstante â&#x2030;¤ Ĺ&#x2030; spesifieke waarde đ??ť( : populasie-konstante > Ĺ&#x2030; spesifieke waarde Voorbeeld: As Ĺ&#x2030; skoolhoof beweer dat die gemiddelde IK van sy leerlinge kleiner of gelyk aan 105 is. Dus sal: đ??ť8 : die gemiddelde IK van die leerlinge is kleiner of gelyk aan 105. đ??ť( : die gemiddelde IK van die leerlinge is groter as 105. Maar dit kan ook soos volg geskryf word: đ??ť8 : đ?&#x153;&#x2021; â&#x2030;¤ 105 đ??ť( : đ?&#x153;&#x2021; > 105
Figuur 3.3: Aanvaardings- en verwerpingsarea van â&#x20AC;&#x2122;n eenkantige hipotesetoets na bo (regs) 3.6.2
Stap 2: Bepaal die aanvaardingsarea vir die nulhipotese
Verwys na Figure 3.1-3.3 hierbo â&#x20AC;&#x201C; dit dui die verwerpingsarea aan vir die drie verskillende hipotesetoetse. Deel van hierdie stap is om te bepaal hoe groot hierdie areas moet wees, maar vir die doel van hierdie vak sal dit vir jou gegee word in die vraag, byvoorbeeld bepaal met Ĺ&#x2030; 1%, 5% of 10% peil van betekenis dat...
Studie-eenheid 3: Hipotesetoetsing
Bladsy 133
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Onthou dat hierdie peil van betekenis die waarskynlikheid van Ĺ&#x2030; Tipe I-fout voorstel (met ander woorde die kans dat die nulhipotese verkeerdelik verwerp word). Let daarop dat die verwerpingsarea vir Ĺ&#x2030; tweekantige hipotesetoets (verwys na Figuur 3.1) verdeel is in Ĺ&#x2030; onderste (linkerkantse) en boonste (regterkantse) area. Omdat daar twee Ă&#x2C6;
verwerpingsareas is, moet ons vir elkeen . Vir Ĺ&#x2030; eenkantige hipotesetoets (verwys na *
Figuur 3.2 en 3.3) is daar slegs een verwerpingsarea wat đ?&#x203A;ź volledig verteenwoordig. Ons moet die inligting wat in die vraag aan ons gegee is, gebruik om die betrokke verdeling te bepaal. In die geval waar die populasie se standaardafwyking bekend is, sal ons die standaard-normaalverdeling (z-waardes) gebruik. Indien die populasie se standaardafwyking nie aan ons bekend is nie, sal ons die student-t-verdeling (t-waardes) gebruik. Dit is baie belangrik dat jy onderskeid tussen hierdie twee gevalle kan tref en weet wanneer om watter verdeling te gebruik. In die geval van die standaard-normaalverdeling gebruik ons die z-tabel om die kritieke waardes af te lees vir đ?&#x203A;ź: Peil van
Verwerpingsarea
Tipe
betekenis (đ?&#x153;ś)
z-limiete
hipotesetoets
0,01 (1%)
đ?&#x2018;&#x192; â&#x2C6;&#x2019;đ?&#x2018;§-krit > đ?&#x2018;§) + đ?&#x2018;&#x192;(đ?&#x2018;§ > đ?&#x2018;§-krit = 0,01
Tweekantig
Âą2,58
0,05 (5%)
đ?&#x2018;&#x192; â&#x2C6;&#x2019;đ?&#x2018;§-krit > đ?&#x2018;§) + đ?&#x2018;&#x192;(đ?&#x2018;§ > đ?&#x2018;§-krit = 0,05
Tweekantig
Âą1,96
0,10 (10%)
đ?&#x2018;&#x192; â&#x2C6;&#x2019;đ?&#x2018;§-krit > đ?&#x2018;§) + đ?&#x2018;&#x192;(đ?&#x2018;§ > đ?&#x2018;§-krit = 0,10
Tweekantig
Âą1,645
0,01 (1%)
đ?&#x2018;&#x192;(â&#x2C6;&#x2019;đ?&#x2018;§-krit > đ?&#x2018;§) = 0,01
Eenkantig na onder
â&#x2C6;&#x2019;2,33
0,05 (5%)
đ?&#x2018;&#x192;(â&#x2C6;&#x2019;đ?&#x2018;§-krit > đ?&#x2018;§) = 0,05
Eenkantig na onder
â&#x2C6;&#x2019;1,645
0,10 (10%)
đ?&#x2018;&#x192;(â&#x2C6;&#x2019;đ?&#x2018;§-krit > đ?&#x2018;§) = 0,10
Eenkantig na onder
â&#x2C6;&#x2019;1,28
0,01 (1%)
đ?&#x2018;&#x192;(đ?&#x2018;§ > đ?&#x2018;§-krit) = 0,01
Eenkantig na bo
+2,33
0,05 (5%)
đ?&#x2018;&#x192;(đ?&#x2018;§ > đ?&#x2018;§-krit) = 0,05
Eenkantig na bo
+1,645
0,10 (10%)
đ?&#x2018;&#x192;(đ?&#x2018;§ > đ?&#x2018;§-krit) = 0,10
Eenkantig na bo
+1,28
Tabel 3.2: z-limiete vir die verskillende peile van betekenis vir tweekantige en eenkantige hipotesetoetse (Wegner, 2016: 204) Vir die t-limiete sal ons uit, die aard van die saak, die t-tabel gebruik. Omdat hierdie tabel afhanklik is van spesifieke grade van vryheid, is daar nie Ĺ&#x2030; standaard tabel (soos hierbo) vir
Bladsy 134 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes die t-limiete nie. Jy moet dus weet hoe om die kritieke waarde af te lees uit die t-tabel (maar dit sal later in hierdie studie-eenheid in meer detail behandel word). 3.6.3
Stap 3: Bereken die toetsstatistiek
Op hierdie punt het ons die nulhipotese en die alternatiewe hipotese, wat ons self gedefinieer het na aanleiding van die vraag. Uit die hipoteses kon ons bepaal of dit Ĺ&#x2030; eenkantige of tweekantige toets moet wees. Die vraag spesifiseer of die standaardafwyking van die populasie đ?&#x153;&#x17D; bekend of onbekend is en dit bepaal watter verdeling ons moet gebruik: standaard-normaal- of die student-t-verdeling. Nou kan ons voortgaan om die toetsstatistiek te bereken. v Standaard-normaalverdeling In die geval waar die populasie se standaardafwyking bekend is, gebruik ons die standaard-normaalverdeling om die toetsstatistiek vir die populasiegemiddeld te bereken.
đ?&#x2019;&#x203A;-stat =
đ?&#x2019;&#x2122;â&#x2C6;&#x2019;đ?? đ??&#x2C6; đ?&#x2019;?
Waar:
đ?&#x2018;Ľ
= gemiddeld van die steekproef
đ?&#x153;&#x2021;
= die waarde aan wat die populasie se gemiddeld gelyk is (volgens đ??ť8 )
đ?&#x153;&#x17D;
= die standaardafwyking van die populasie
đ?&#x2018;&#x203A;
= steekproefgrootte Formule 3.1: Berekening van die đ?&#x2019;&#x203A;-stat toetsstatistiek
v Student-t-verdeling In die geval waar die populasie se standaardafwyking onbekend is, gebruik ons die student-t-verdeling om die toetsstatistiek vir die populasiegemiddeld te bereken.
đ?&#x2019;&#x2022;-stat =
đ?&#x2019;&#x2122;â&#x2C6;&#x2019;đ?? đ?&#x2019;&#x201D; đ?&#x2019;?
Waar:
đ?&#x2018;Ľ
= gemiddeld van die steekproef
đ?&#x153;&#x2021;
= die waarde waaraan die populasie se gemiddeld gelyk is (volgens đ??ť8 )
đ?&#x2018;
= die standaardafwyking van die steekproef
đ?&#x2018;&#x203A;
= steekproefgrootte Formule 3.2: Berekening van die đ?&#x2019;&#x2022;-stat toetsstatistiek
Studie-eenheid 3: Hipotesetoetsing
Bladsy 135
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 3.6.4
Stap 4: Vergelyk die steekproef se toetsstatistiek met die aanvaardingsarea vir die nulhipotese
Nou word daar gekyk of die toetsstatistiek in die aanvaardings- of die verwerpingsarea val. 3.6.5
Stap 5: Maak Ĺ&#x2030; gevolgtrekking
Indien die toetsstatistiek in die aanvaardingsarea val, word die nulhipotese aanvaar. Indien die toetsstatistiek in die verwerpingsarea val, word die nulhipotese verwerp. Verwys na Tabel 3.2 hieronder. Geval
Tipe hipotesetoets
Resultaat
â&#x2C6;&#x2019;đ?&#x2018;§-krit > đ?&#x2018;§-stat
Een- of tweekantig
Verwerp đ??ť8
â&#x2C6;&#x2019;đ?&#x2018;§-krit < đ?&#x2018;§-stat
Eenkantig
Aanvaar đ??ť8
â&#x2C6;&#x2019;đ?&#x2018;§-krit < đ?&#x2018;§-stat < đ?&#x2018;§-krit
Tweekantig
Aanvaar đ??ť8
đ?&#x2018;§-stat < đ?&#x2018;§-krit
Eenkantig
Aanvaar đ??ť8
đ?&#x2018;§-stat > đ?&#x2018;§-krit
Een- of tweekantig
Verwerp đ??ť8
Tabel 3.3: Waar die nulhipotese aanvaar en verwerp word Dit is belangrik om op hierdie stadium te meld dat Ĺ&#x2030; hipotese nooit bewys word nie. Tydens Ĺ&#x2030; hipotesetoetse aanvaar of verwerp ons Ĺ&#x2030; nulhipotese as â&#x20AC;&#x153;waarskynlik waarâ&#x20AC;?. As ons dus Ĺ&#x2030; nulhipotese (as waarskynlik waar) verwerp, sĂŞ ons eintlik dat die alternatiewe hipotese waarskynlik waar is. Ĺ&#x2030; Alternatiewe hipotese word nooit as Ĺ&#x2030; resultaat aanvaar nie: Ons aanvaar of verwerp die nulhipotese. Moenie hier stop nie! Nou moet jy Ĺ&#x2030; gevolgtrekking maak ten opsigte van die stelling wat gemaak is. Jy moet die resultaat (of die đ??ť8 aanvaar of verwerp word) toepas op die vraag wat gestel is, met ander woorde die stelling wat gemaak is, is waarskynlik waar of vals. 3.7 3.7.1
Praktiese voorbeelde van hipotesetoetse Hipotesetoets vir Ĺ&#x2030; populasiegemiddeld đ?? waar die populasie se standaardafwyking đ??&#x2C6; bekend is
Bestudeer die handboek paragraaf 8.3.
Bladsy 136 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 3.1 Ĺ&#x2030; Vervaardiger van kunsmis beweer dat koringlande wat met sy kunsmis behandel word, Ĺ&#x2030; gemiddelde 4,5 ton per hektaar koring sal lewer. Om hierdie stelling te toets is 30 hektaar koringlande wat met sy kunsmis behandel is, ewekansig getrek regoor Suid-Afrika en is die opbrengs daarvan opgeskryf per hektaar: 5,33
4,36
5,35
4,40
4,39
4,55
4,03
3,52
4,03
4,28
2,46
4,51
4,56
4,35
5,63
4,73
3,12
4,44
5,23
4,61
4,51
4,87
4,72
4,95
5,49
2,44
2,33
4,31
4,79
4,56
Aanvaar dat hierdie populasie waaruit hierdie steekproef getrek is, normaal versprei is, met Ĺ&#x2030; populasie-standaardafwyking van 0,645. Die steekproef se gemiddeld kan bereken word as đ?&#x2019;&#x2122; = đ?&#x;&#x2019;, đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x2022;. Doen Ĺ&#x2030; hipotesetoets, met Ĺ&#x2030; 5% peil van betekenis, om die vervaardiger se bewering op die proef te stel. Oplossing: Stap 1: Definieer die hipoteses đ?&#x2018;Żđ?&#x;&#x17D;
: Dat die gemiddelde opbrengs van koringlande wat met die vervaardiger se kunsmis behandel is, gelyk is aan 4,5 ton per hektaar. (Die stelling wat ons wil toets.)
đ?&#x2018;Żđ?&#x;?
: Dat die gemiddelde opbrengs van koringlande wat met die vervaardiger se kunsmis behandel is, nie gelyk is aan 4,5 ton per hektaar nie. (Die komplementĂŞre stelling.)
Hierdie hipoteses kan ook soos volg uitgedruk word: đ?&#x2018;Żđ?&#x;&#x17D;
: đ?? = đ?&#x;&#x2019;, đ?&#x;&#x201C;
đ?&#x2018;Żđ?&#x;?
: đ?? â&#x2030; đ?&#x;&#x2019;, đ?&#x;&#x201C;
Stap 2: Bepaal die aanvaardingsarea Ons het die volgende: â&#x20AC;˘
Die populasie se standaardafwyking is vir ons bekend, đ??&#x2C6; = đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2019;đ?&#x;&#x201C;, dus moet ons van die standaard-normaalverdeling gebruik maak.
â&#x20AC;˘
Die peil van betekenis wat ons moet gebruik, word gegee as đ?&#x153;ś = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x201C;.
â&#x20AC;˘
Dit is Ĺ&#x2030; tweekantige hipotesetoets omdat đ?&#x2018;Żđ?&#x;&#x17D; : đ?? = đ?&#x;&#x2019;, đ?&#x;&#x201C; (daar sal Ĺ&#x2030; onderste en boonste verwerpingsarea wees waar die populasie se gemiddeld minder of meer as 4,5 is).
Studie-eenheid 3: Hipotesetoetsing
Bladsy 137
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Die onderste en boonste z-limiete vir hierdie hipotesetoets word uit die z-tabel afgelees vir: đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x2019;&#x152; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x2019;&#x152; < đ?&#x2019;&#x203A; < đ?&#x;&#x17D; + đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;?Ă&#x2014; đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x201C; dus is đ?&#x2018;ˇ đ?&#x;&#x17D; < đ?&#x2019;&#x203A; < đ?&#x2019;&#x152; = đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x2022;đ?&#x;&#x201C; waar đ?&#x2019;&#x152; = đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D; daarom is die z-limiete vir hierdie toets đ?&#x2018;ˇ â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D; = đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x201C; Figuur 3.4 gee die aanvaardings- en verwerpingsareas vir hierdie hipotesetoets.
Figuur 3.4: Aanvaardings- en verwerpingsareas vir â&#x20AC;&#x2122;n tweekantige hipotesetoets vir đ?&#x2018;ˇ(â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D; < đ?&#x2019;&#x203A; < đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D;)
Stap 3: Bereken die toetsstatistiek đ?&#x2019;&#x203A;-stat = =
đ?&#x2019;&#x2122;mđ?? đ??&#x2C6; đ?&#x2019;?
đ?&#x;&#x2019;, đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x2022; â&#x2C6;&#x2019; đ?&#x;&#x2019;, đ?&#x;&#x201C; đ?&#x;&#x17D;,đ?&#x;&#x201D;đ?&#x;&#x2019;đ?&#x;&#x201C; đ?&#x;&#x2018;đ?&#x;&#x17D;
=
â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2013;đ?&#x;&#x2018; đ?&#x;&#x17D;,đ?&#x;&#x201D;đ?&#x;&#x2019;đ?&#x;&#x201C; đ?&#x;&#x201C;,đ?&#x;&#x2019;đ?&#x;&#x2022;đ?&#x;&#x2022;đ?&#x;?
=â&#x2C6;&#x2019;
đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2013;đ?&#x;&#x2018; đ?&#x;&#x17D;, đ?&#x;?đ?&#x;?đ?&#x;&#x2022;đ?&#x;&#x2013;
= â&#x2C6;&#x2019;đ?&#x;?. đ?&#x;?đ?&#x;&#x2022;đ?&#x;&#x2019;đ?&#x;&#x2019; Stap 4: Vergelyk die toetsstatistiek met die aanvaardingsarea Aanvaardingsarea: â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D; < đ?&#x2019;&#x203A;-stat < đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D;
Bladsy 138 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ?&#x2019;&#x203A;-stat = â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;?đ?&#x;&#x2022;đ?&#x;&#x2019;đ?&#x;&#x2019; Die toetsstatistiek val dus binne die aanvaardingsarea: (â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D; < đ?&#x2019;&#x203A;-stat = â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;?đ?&#x;&#x2022;đ?&#x;&#x2019;đ?&#x;&#x2019; < đ?&#x;?, đ?&#x;&#x2014;đ?&#x;&#x201D;)
Figuur 3.5: Aanduiding van waar die toetsstatistiek val Stap 5: Maak Ĺ&#x2030; gevolgtrekking Omdat die toetsstatistiek binne die aanvaardingsarea val, word die nulhipotese as waarskynlik waar aanvaar. Daar is nie genoeg statistiese bewyse om die nulhipotese op Ĺ&#x2030; 5% peil van betekenis te verwerp nie. Ons kan dus die gevolgtrekking maak dat die vervaardiger van die kunsmis se bewering waarskynlik waar is: dat koringlande wat met sy kunsmis behandel is, Ĺ&#x2030; gemiddelde 4,5 ton per hektaar sal lewer.
Doen nou Voorbeeld 8.1 en 8.2 in die handboek. 3.7.2
Hipotesetoets vir Ĺ&#x2030; populasiegemiddeld đ?? waar die populasie se standaardafwyking đ??&#x2C6; onbekend is
Bestudeer die handboek paragraaf 8.4. Voorbeeld 3.2 Ĺ&#x2030; Klimatoloog beweer dat die gemiddelde reĂŤnval van Suid-Afrika minder as 412mm per jaar is. Om hierdie stelling te toets is die laaste 30 jaar se gemiddelde reĂŤnval per jaar verkry:
Studie-eenheid 3: Hipotesetoetsing
Bladsy 139
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
471,4 415,4 478,3 539,6 330,4 400,9 278,9 270,4 714,4 637,4 532,5 709,7 456,5 371,5 315,6 531,8 616,0 427,5 306,1 474,2 170,9 468,4 467,3 494,7 458,4 722,6 450,1 565,0 435,7 341,1 Aanvaar dat die gemiddelde reĂŤnval per jaar normaal versprei is. Die steekproef se gemiddeld kan bereken word as đ?&#x2019;&#x2122; = đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?, đ?&#x;&#x2022;đ?&#x;&#x201D; met Ĺ&#x2030; steekproefstandaardafwyking van đ?&#x2019;&#x201D; = đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2019;, đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x2014;. Doen Ĺ&#x2030; hipotesetoets, met Ĺ&#x2030; 5% peil van betekenis, om die klimatoloog se bewering op die proef te stel. Oplossing: Stap 1: Definieer die hipoteses đ?&#x2018;Żđ?&#x;&#x17D;
: Dat die gemiddelde reĂŤnval van Suid-Afrika minder of gelyk aan 412mm per jaar is. (Die stelling wat ons wil toets.)
đ?&#x2018;Żđ?&#x;?
: Dat die gemiddelde reĂŤnval van Suid-Afrika meer as 412mm per jaar is.
Hierdie hipoteses kan ook soos volg uitgedruk word: đ?&#x2018;Żđ?&#x;&#x17D;
: đ?? â&#x2030;¤ đ?&#x;&#x2019;đ?&#x;?đ?&#x;?
đ?&#x2018;Żđ?&#x;?
: đ?? > đ?&#x;&#x2019;đ?&#x;?đ?&#x;?
Stap 2: Bepaal die aanvaardingsarea Ons het die volgende: â&#x20AC;˘
Die populasie se standaardafwyking is vir ons onbekend, dus moet ons van die student-t-verdeling gebruik maak.
â&#x20AC;˘
Die peil van betekenis wat ons moet gebruik, word gegee as đ?&#x153;ś = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x201C;.
â&#x20AC;˘
Dit is Ĺ&#x2030; eenkantige hipotesetoets omdat đ?&#x2018;Żđ?&#x;&#x17D; : đ?? â&#x2030;¤ đ?&#x;&#x2019;đ?&#x;?đ?&#x;?. Daar sal Ĺ&#x2030; boonste verwerpingsarea wees waar die populasie se gemiddeld meer as 412 is.
Die boonste z-limiete vir hierdie hipotesetoets word uit die t-tabel afgelees vir: đ?&#x2019;&#x2026;đ?&#x2019;&#x2021; = đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x;? = đ?&#x;&#x2018;đ?&#x;&#x17D; â&#x2C6;&#x2019; đ?&#x;? = đ?&#x;?đ?&#x;&#x2014; waar đ?&#x2019;&#x2022;(đ?&#x;?đ?&#x;&#x2014;)(đ?&#x;&#x17D;,đ?&#x;&#x17D;đ?&#x;&#x201C;) = đ?&#x;?, đ?&#x;&#x201D;đ?&#x;&#x2014;đ?&#x;&#x2014;
Bladsy 140 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
daarom is die t-limiet vir hierdie toets đ?&#x2018;ˇ đ?&#x2019;&#x2022; < đ?&#x;?, đ?&#x;&#x201D;đ?&#x;&#x2014;đ?&#x;&#x2014; = đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x201C; Figuur 3.6 gee die aanvaardings- en verwerpingsareas vir hierdie hipotesetoets.
Figuur 3.6: Aanvaardings- en verwerpingsareas vir â&#x20AC;&#x2122;n eenkantige hipotesetoets vir đ?&#x2018;ˇ(đ?&#x2019;&#x2022; < đ?&#x;?, đ?&#x;&#x201D;đ?&#x;&#x2014;đ?&#x;&#x2014;) Stap 3: Bereken die toetsstatistiek đ?&#x2019;&#x2022;-stat = =
đ?&#x2019;&#x2122;mđ?? đ?&#x2019;&#x201D; đ?&#x2019;?
đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;?, đ?&#x;&#x2022;đ?&#x;&#x201D; â&#x2C6;&#x2019; đ?&#x;&#x2019;đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2019;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x2013;
=
đ?&#x;&#x2018;đ?&#x;&#x17D;
đ?&#x;&#x2019;đ?&#x;&#x2014;, đ?&#x;&#x2022;đ?&#x;&#x201D; đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2019;,đ?&#x;&#x2019;đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x2013; đ?&#x;&#x201C;,đ?&#x;&#x2019;đ?&#x;&#x2022;đ?&#x;&#x2022;đ?&#x;?
=
đ?&#x;&#x2019;đ?&#x;&#x2014;, đ?&#x;&#x2022;đ?&#x;&#x201D; đ?&#x;?đ?&#x;&#x2019;, đ?&#x;&#x201C;đ?&#x;&#x201C;đ?&#x;&#x17D;đ?&#x;?
= đ?&#x;?, đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2014; Stap 4: Vergelyk die toetsstatistiek met die aanvaardingsarea Aanvaardingsarea: đ?&#x2019;&#x2022;-stat < đ?&#x;?, đ?&#x;&#x201D;đ?&#x;&#x2014;đ?&#x;&#x2014; đ?&#x2019;&#x2022;-stat = đ?&#x;?, đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2014; Die toetsstatistiek val dus binne die aanvaardingsarea: đ?&#x2019;&#x2022;-stat = đ?&#x;?, đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2014; > đ?&#x;?, đ?&#x;&#x201D;đ?&#x;&#x2014;đ?&#x;&#x2014;)
Studie-eenheid 3: Hipotesetoetsing
Bladsy 141
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 3.7: Aanduiding van waar die toetsstatistiek val Stap 5: Maak Ĺ&#x2030; gevolgtrekking Omdat die toetsstatistiek buite die aanvaardingsarea val, word die nulhipotese as waarskynlik waar verwerp. Daar is genoeg statistiese bewyse om die nulhipotese op Ĺ&#x2030; 5% peil van betekenis te verwerp. Ons kan dus die gevolgtrekking maak dat die klimatoloog se bewering waarskynlik vals is: dat die gemiddelde reĂŤnval van Suid-Afrika minder as 412mm per jaar is. Doen nou Voorbeeld 8.3 in die handboek. 3.7.3
Hipotesetoetsing deur gebruik te maak van die đ?&#x2019;&#x2018;-waarde
Bestudeer die handboek paragraaf 8.6. Hierdie benadering gebruik dieselfde proses, maar in plaas daarvan dat Ĺ&#x2030; kritieke waarde tydens Stap 3 bereken word, word die betrokke đ?&#x2018;?-waarde bereken. Die verwerpingsarea, weet ons, is waar die đ?&#x2018;?-waarde kleiner is as đ?&#x203A;ź, soos bespreek in paragraaf 3.5.6 in die gids. Onthou dat die waarskynlikheid van Ĺ&#x2030; gebeurtenis voorgestel word deur die oppervlak/area onder die kurwe. In plaas daarvan om Ĺ&#x2030; z-waarde of Ĺ&#x2030; t-waarde te bereken, bereken ons die waarskynlikheid van hierdie toetsstatistiek en vergelyk dit met die waarde van đ?&#x203A;ź. As daar van jou verwag word om die waarskynlikheid te vind waar đ?&#x2018;§ > 1,29 dan gaan soek jy eenvoudig die waarde in die z-tabel:
Bladsy 142 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.0000
0.0040
0.0080
0.0120
0.0160
0.0199
0.0239
0.0279
0.0319
0.0359
0.1
0.0398
0.0438
0.0478
0.0517
0.0557
0.0596
0.0636
0.0675
0.0714
0.0753
0.2
0.0793
0.0832
0.0871
0.0910
0.0948
0.0987
0.1026
0.1064
0.1103
0.1141
0.3
0.1179
0.1217
0.1255
0.1293
0.1331
0.1368
0.1406
0.1443
0.1480
0.1517
0.4
0.1554
0.1591
0.1628
0.1664
0.1700
0.1736
0.1772
0.1808
0.1844
0.1879
0.5
0.1915
0.1950
0.1985
0.2019
0.2054
0.2088
0.2123
0.2157
0.2190
0.2224
0.6
0.2257
0.2291
0.2324
0.2357
0.2389
0.2422
0.2454
0.2486
0.2517
0.2549
0.7
0.2580
0.2611
0.2642
0.2673
0.2704
0.2734
0.2764
0.2794
0.2823
0.2852
0.8
0.2881
0.2910
0.2939
0.2967
0.2995
0.3023
0.3051
0.3078
0.3106
0.3133
0.9
0.3159
0.3186
0.3212
0.3238
0.3264
0.3289
0.3315
0.3340
0.3365
0.3389
1.0
0.3413
0.3438
0.3461
0.3485
0.3508
0.3531
0.3554
0.3577
0.3599
0.3621
1.1
0.3643
0.3665
0.3686
0.3708
0.3729
0.3749
0.3770
0.3790
0.3810
0.3830
1.2
0.3849
0.3869
0.3888
0.3907
0.3925
0.3944
0.3962
0.3980
0.3997
0.4015
1.3
0.4032
0.4049
0.4066
0.4082
0.4099
0.4115
0.4131
0.4147
0.4162
0.4177
1.4
0.4192
0.4207
0.4222
0.4236
0.4251
0.4265
0.4279
0.4292
0.4306
0.4319
1.5
0.4332
0.4345
0.4357
0.4370
0.4382
0.4394
0.4406
0.4418
0.4429
0.4441
Tabel 3.4: Uittreksel uit die z-tabel vir die waarskynlikheid waar đ?&#x2019;&#x203A; = đ?&#x;?, đ?&#x;?đ?&#x;&#x2014; is Onthou dat die tabel die waarskynlikhede gee vir: đ?&#x2018;&#x192;(0 < đ?&#x2018;§ < đ?&#x2018;&#x2DC;) Die vraag vra egter: đ?&#x2018;&#x192; đ?&#x2018;§ > 1,29
= 0,5 â&#x2C6;&#x2019; đ?&#x2018;&#x192; 0 < đ?&#x2018;§ < 1,29
= 0,5 â&#x2C6;&#x2019; 0.4015 = 0,0985 So die đ?&#x2018;?-waarde vir đ?&#x2018;§ > 1,29 is 0,0985. As hierdie Ĺ&#x2030; hipotesetoets was en ons het dit vergelyk met â&#x20AC;&#x2122;n 10% peil van betekenis, het ons die nulhipotese verwerp omdat die đ?&#x2018;?-waarde < 0,10. As ons dit egter met Ĺ&#x2030; 5% peil van betekenis gedoen het, sou ons nie die nulhipotese verwerp het nie.
Studie-eenheid 3: Hipotesetoetsing
Bladsy 143
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
MS Excel-formule:
=NORM.S.DIST(đ?&#x2019;&#x152;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź)
(vir z-waardes)
MS Excel-formule:
=NORM. DIST(đ?&#x2019;&#x152;, đ?&#x2019;&#x2026;đ?&#x2019;&#x2021;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź)
(vir t-waardes)
Formule 3.3: Berekening van die kumulatiewe waarskynlikheid van đ?&#x2018;ˇ(â&#x2C6;&#x2019;â&#x2C6;&#x17E; < đ?&#x2019; < đ?&#x2019;&#x203A;) en đ?&#x2018;ˇ(â&#x2C6;&#x2019;â&#x2C6;&#x17E; < đ?&#x2018;ť < đ?&#x2019;&#x2022;) As ons die formule gebruik, is: đ?&#x2018;&#x192; đ?&#x2018;§ > 1,29 = 1 â&#x2C6;&#x2019; NORM.S.DIST(1.29,TRUE) = 0,0985 Hierdie benadering is belangrik omdat baie van die statistiese programmatuur wat vandag op die mark is, die toetsstatistiek en die đ?&#x2018;?-waarde bereken, en dit is baie makliker om sommer die đ?&#x2018;?-waarde af te lees en Ĺ&#x2030; gevolgtrekking te maak as om deur die hele berekening van kritieke waardes te gaan en dan eers Ĺ&#x2030; gevolgtrekking te maak. Maar vir die doel van hierdie vak moet jy weet hoe om beide die benaderinge te gebruik met betrekking tot hipotesetoetsing. Voorbeeld 3.3 Ĺ&#x2030; Motormaatskappy beweer dat die gesinsmotor wat hulle vervaardig meer as 800km kan ry op 100 liter petrol. Om hierdie stelling te toets is 40 van hierdie motors ewekansig gekies en is die volgende data verkry: 803,2 767,9 789,4 764,1 735,1 805,7 795,2 821,8 785,3 777,7 789,8 753,3 792,5 826,0 692,3 756,0 801,8 776,7 743,6 788,9 738,2 815,8 798,9 769,5 724,3 775,7 775,8 739,2 805,4 801,1 801,2 796,0 767,4 735,7 794,2 830,4 759,0 800,6 776,2 769,9 Aanvaar dat die gemiddelde brandstofverbruik per motor normaal versprei is, met Ĺ&#x2030; populasie-standaardafwyking van đ??&#x2C6; = đ?&#x;&#x2018;đ?&#x;&#x2014;. Die steekproef se gemiddeld kan bereken word as đ?&#x2019;&#x2122; = đ?&#x;&#x2022;đ?&#x;&#x2022;đ?&#x;&#x2013;, đ?&#x;&#x201C;. Doen Ĺ&#x2030; hipotesetoets, met Ĺ&#x2030; 5% peil van betekenis, om die motormaatskappy se bewering op die proef te stel. Oplossing: Stap 1: Definieer die hipoteses đ?&#x2018;Żđ?&#x;&#x17D;
: Dat die gemiddelde brandstofverbruik van hierdie motor meer of gelyk aan 800km per 100 liter petrol is. (Die stelling wat ons wil toets.)
đ?&#x2018;Żđ?&#x;?
: Dat die gemiddelde brandstofverbruik van hierdie motor minder as 800km per 100
Bladsy 144 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes liter petrol is. Hierdie hipoteses kan ook soos volg uitgedruk word: đ?&#x2018;Żđ?&#x;&#x17D;
: đ?? â&#x2030;Ľ đ?&#x;&#x2013;đ?&#x;&#x17D;đ?&#x;&#x17D;
đ?&#x2018;Żđ?&#x;?
: đ?? < đ?&#x;&#x2013;đ?&#x;&#x17D;đ?&#x;&#x17D;
Stap 2: Bepaal die aanvaardingsarea Waar die đ?&#x2019;&#x2018;-waarde < đ?&#x153;ś is en đ?&#x153;ś = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x201C;. Stap 3: Bereken die toetsstatistiek đ?&#x2019;&#x203A;-stat = =
đ?&#x2019;&#x2122;mđ?? đ??&#x2C6; đ?&#x2019;?
đ?&#x;&#x2022;đ?&#x;&#x2022;đ?&#x;&#x2013;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x2013;đ?&#x;&#x17D;đ?&#x;&#x17D; đ?&#x;&#x2018;đ?&#x;&#x2014;
=
đ?&#x;&#x2019;đ?&#x;&#x17D;
â&#x2C6;&#x2019;đ?&#x;?đ?&#x;?, đ?&#x;&#x201C; đ?&#x;&#x2018;đ?&#x;&#x2014;
=â&#x2C6;&#x2019;
đ?&#x;&#x201D;,đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2019;đ?&#x;&#x201D;
đ?&#x;?đ?&#x;?, đ?&#x;&#x201C; đ?&#x;&#x201D;, đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x2019;
= â&#x2C6;&#x2019;đ?&#x;&#x2018;, đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2018;đ?&#x;&#x2019; đ?&#x2018;ˇ đ?&#x2019;&#x203A; < â&#x2C6;&#x2019;đ?&#x;&#x2018;, đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2018;đ?&#x;&#x2019;
= đ?&#x;&#x17D;, đ?&#x;&#x201C; â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x2019;đ?&#x;&#x2014;đ?&#x;&#x2014;đ?&#x;&#x2022;đ?&#x;&#x201C; = đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x201C;
Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(â&#x2C6;&#x2019;đ?&#x;&#x2018;. đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2018;đ?&#x;&#x2019;, đ?&#x2018;ťđ?&#x2018;šđ?&#x2018;źđ?&#x2018;Ź) Stap 4: Vergelyk die toetsstatistiek met die aanvaardingsarea đ?&#x2018;ˇ đ?&#x2019;&#x203A; < â&#x2C6;&#x2019;đ?&#x;&#x2018;, đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x2018;đ?&#x;&#x2019; < đ?&#x153;ś đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x201C; < đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x201C; Stap 5: Maak Ĺ&#x2030; gevolgtrekking Omdat die đ?&#x2019;&#x2018;-waarde kleiner as đ?&#x153;ś is, word die nulhipotese as waarskynlik waar verwerp. Daar is genoeg statistiese bewyse om die nulhipotese op Ĺ&#x2030; 5% peil van betekenis te verwerp. Ons kan dus die gevolgtrekking maak dat die motormaatskappy se bewering waarskynlik vals is: dat die gemiddelde brandstofverbruik van hierdie motor meer of gelyk aan 800km per 100 liter petrol is. Doen nou Voorbeeld 8.5 van die handboek. 3.8
Selfevalueringsvrae
Doen Vraag 5-14 aan die einde van Hoofstuk 8 in die handboek.
Studie-eenheid 3: Hipotesetoetsing
Bladsy 145
GQM105 Inleiding tot elementêre kwantitatiewe metodes 3.9
Samevatting
Ons het in hierdie studie-eenheid gekyk na hipotesetoetsing. Hipotesetoetsing is ʼn vyfstapproses waardeur ons gaan om te bepaal of ʼn stelling wat gemaak is, waarskynlik waar of vals is. Die eerste stap is om hierdie stelling, of hipotese, te formuleer. Hierdie stelling bestaan uit twee komplementêre hipoteses: die nulhipotese (die stelling wat ons op die proef stel) en die alternatiewe hipotese (wat die teenoorgestelde van die nulhipotese is). Dit is baie belangrik om hierdie stap reg te doen, want dit het ʼn groot invloed op die gevolgtrekking wat gemaak word in die laaste stap. Die tweede stap is om te bepaal wanneer ons die nulhipotese gaan aanvaar of verwerp. Dit is in hierdie stap waar ons die kriteria definieer wat ons gaan gebruik, of dit nou ʼn interval tussen (of buite) kritieke waardes is of eenvoudig ʼn peil van betekenis. In Stap drie bereken ons die toetsstatistiek vir die steekproef waarmee ons werk. Ons het gekyk na die z-waardes (van die standaard-normaalverdeling), t-waardes (van die student-tverdeling) en p-waardes (wat in hierdie geval die waarskynlikheid van ʼn z-waarde is). Wanneer ons weet wanneer die nulhipotese aanvaar/verwerp word en wat die betrokke toetsstatistiek is, word hierdie twee met mekaar vergelyk in Stap vier. Al wat oorbly, in die vyfde stap, is om ʼn gevolgtrekking te maak oor die vergelyking van die toetsstatistiek met die aanvaardingsarea. Indien die toetsstatistiek in die aanvaardingsarea val, word die nulhipotese aanvaar. Waar die toetsstatistiek buite die aanvaardingsarea val, word die nulhipotese verwerp. Hierdie resultaat word dan gebruik om ʼn gevolgtrekking te maak ten opsigte van die betrokke stelling wat op die proef gestel is. Dit wat in hierdie studie-eenheid behandel is, is werklik ʼn inleiding tot hipotesetoetsing. Daar bestaan baie ander toetse vir ʼn verskeidenheid van populasie-konstantes. Van die ander hipotesetoetse in die handboek bespreek die vergelyking van verskeie populasiegemiddeldes met mekaar. Indien jy belangstel om meer te leer van die onderskeie hipotesetoetse, is jy welkom om ook deur hierdie paragrawe in die handboek te werk. Hipotesetoetsing is werklik ʼn handige stukkie statistiek wat in alle velde gebruik kan word vir kwantitatiewe navorsing.
Bladsy 146 Studie-eenheid 3: Hipotesetoetsing
GQM105 Inleiding tot elementêre kwantitatiewe metodes
STUDIE-EENHEID 4: EENVOUDIGE LINEÊRE REGRESSIE- EN KORRELASIE-ANALISE
4.1
Studie-eenheid leeruitkomste
Kennis en begrip Na voltooiing van Studie-eenheid 4 sal jy in staat wees om jou kennis en begrip van die volgende te demonstreer: •
Eenvoudige lineêre regressie-analise
•
Tydreeksanalise
Vaardighede Jy sal ook in staat wees om: •
die snyding en helling van lineêre regressieformule te bereken en te interpreteer;
•
die korrelasiekoëffisiënt te bereken en te interpreteer;
•
die bepaaldheidskoëffisiënt te bereken en te interpreteer;
•
ʼn hipotesetoets te doen om te bepaal of ʼn regressiemodel statisties betekenisvol is;
•
onderskeid te tref tussen tendense, siklusse, seisoenaliteit en onreëlmatige invloede;
•
ʼn bewegende gemiddeld vir periodes te bereken, dit te analiseer en te interpreteer; en
• 4.2
dit te gebruik om eenvoudige vooruitskattings te maak. Voorgeskrewe handboek
Wegner, T. 2016. Applied business statistics. 4de uitgawe. Claremont: Juta. •
Hoofstuk 12 paragrawe 12.1-12.7
•
Hoofstuk 15 paragrawe 15.1-15.8
Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
Bladsy 147
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 4.3
Hoe kan jy jou begrip verbeter?
Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord
Omskrywing
Additiewe tydreeksmodel
Ĺ&#x2030; Model wat uit veranderlikes (en hul interaksie met mekaar) saamgestel word, wat gelyk is aan die som (+) van hul afsonderlike invloede.
Afhanklike veranderlike
Ĺ&#x2030; Veranderlike (gewoonlik đ?&#x2018;Ś) waarvan die waarde bepaal word deur Ĺ&#x2030; ander veranderlike (gewoonlik đ?&#x2018;Ľ) se waarde.
BepaaldheidskoĂŤffisiĂŤnt
Die bepaaldheidskoĂŤffisiĂŤnt is Ĺ&#x2030; maatstaf wat ons gebruik om te bepaal watter proporsie van variasie in die afhanklike veranderlike (đ?&#x2018;Ś), deur die onafhanklike veranderinge (đ?&#x2018;Ľ), verklaar word.
Bewegende gemiddeld
Ĺ&#x2030; Metode wat gebruik word om Ĺ&#x2030; tydreeks gladder te maak deur die invloed van sikliese variasie, seisoenale variasie en onreĂŤlmatige invloede te verwyder.
Gesentraliseerde
Die gladgemaakte waarde van Ĺ&#x2030; tydreeks wat geassosieer
bewegende gemiddeld
word met die ooreenstemmende periode.
Helling
Die hoek van Ĺ&#x2030; lineĂŞre funksie; word gegee deur die konstante đ?&#x2018;?( .
LineĂŞre funksie
Die eenvoudigste en algemeenste statistiese regressiemodel. Dit beskryf die verhouding van die afhanklike veranderlike (đ?&#x2018;Ś) met die onafhanklike veranderlike (đ?&#x2018;Ľ).
Metode van die kleinste
Die beraming van onbekende konstantes van Ĺ&#x2030; model, deur
kwadrate
die som van die kwadrate (van die verskil tussen die waargenome waardes en die verwagte waardes van hierdie model) te minimaliseer.
Multiplikatiewe
Ĺ&#x2030; Model wat uit veranderlikes (en hul interaksie met mekaar)
tydreeksmodel
saamgestel word, wat gelyk is aan die produk (Ă&#x2014;) van hul afsonderlike invloede.
Onafhanklike
Ĺ&#x2030; Veranderlike (gewoonlik đ?&#x2018;Ľ) wat gebruik word om Ĺ&#x2030; ander
veranderlike
veranderlike se waarde (gewoonlik đ?&#x2018;Ś) te bepaal.
Bladsy 148 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
OnreĂŤlmatige variasies
Onverklaarbare variasies in tydreeksdata. OnreĂŤlmatige invloede is enkele ewekansige gebeurtenisse wat heeltemal onvoorspelbaar is, met geen patroon of ritme nie.
Pearson se
Pearson se korrelasiekoĂŤffisiĂŤnt is een van die algemeenste
korrelasiekoĂŤffisiĂŤnt
maatstawwe wat gebruik word om die sterkte van Ĺ&#x2030; lineĂŞre verhouding tussen twee kontinue veranderlikes te bepaal.
Seisoenale indeks
Die gemiddelde seisoenale variasie wat waargeneem word in Ĺ&#x2030; tydreeks.
Seisoenaliteit/Seisoenale
Ĺ&#x2030; Patroon in Ĺ&#x2030; tydreeks wat gereeld met konstante intervalle
variasie
voorkom. Hierdie patroon word gewoonlik veroorsaak deur herhaalde omgewingsgebeurtenisse, soos die seisoene van die jaar.
Sikliese variasie
Sikliese variasie is Ĺ&#x2030; langtermynpatroon wat rondom die tendens van Ĺ&#x2030; tydreeks voorkom, wat onreĂŤlmatig plaasvind oor lang onvoorspelbare periodes.
Snypunt
Die punt waar die lineĂŞre funksie die Y-as sny waar đ?&#x2018;Ľ = 0 is; word gegee deur die konstante đ?&#x2018;?8 .
Spreidingstippingsgrafiek
Die eenvoudigste voorstelling van datapunte op Ĺ&#x2030; grafiek wat bestaan uit twee veranderlikes. Punte word gestip deur gebruik te maak van die X- en Y-koĂśrdinate.
Tendens
Die helling van Ĺ&#x2030; tendenslyn.
Tendenslyn
Ĺ&#x2030; Lyn wat die bewegende gemiddelde van Ĺ&#x2030; tydreeks die beste pas.
Tydreeks
Ĺ&#x2030; Reeks waardes wat oor tyd waargeneem is, gewoonlik met gereelde intervalle, van Ĺ&#x2030; stogastiese veranderlike.
Vensterperiode
Die reikwydte van die aantal periodes wat gebruik word om Ĺ&#x2030; bewegende gemiddeld te bereken. Indien vier periodes gebruik word sal die vensterperiode gelyk aan vier wees.
Vooruitskatting
Die beraming van Ĺ&#x2030; toekomswaarde in Ĺ&#x2030; tydreeks.
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 149
GQM105 Inleiding tot elementêre kwantitatiewe metodes 4.4
Inleiding
In hierdie studie-eenheid gaan ons kyk na die verhouding van ʼn afhanklike veranderlike (y) teenoor die onafhanklike veranderlike (x). In de sakewêreld is ons geneig om besluite te neem oor ʼn bepaalde saak gebaseer op ʼn verandering in een of ander aanwyser. Ons dink sommer aan ekonomiese verhoudings byvoorbeeld vraag en aanbod. Baie keer wil ons kyk na die verandering van ʼn stogastiese veranderlike oor die loop tyd. In ons soeke om hierdie verhoudings te verstaan gaan ons eenvoudige lineêre regressieanalise (wat korrelasies insluit) as ook tydreeksanalise. 4.5
Eenvoudige lineêre regressie-analise
Bestudeer die handboek paragrawe 12.1-12.2. Wegner (2016: 329) sê dat regressie- en korrelasie-analise twee statistiese metodes is om die verhouding tussen veranderlikes te kwantifiseer. Hierdie twee koëffisiënte dui verder die krag van hierdie verhouding aan. Om hierdie verhoudings te verken gaan ons kyk na spreidingstippings (scatter plots), lineêre regressiemodelle en Pearson se korrelasiekoëffisiënt. 4.5.1
Spreidingstipping
Davis, Pecar en Santana (2016: 394) definieer ʼn spreidingstipping as ʼn tweedimensionele stipping van een veranderlike teenoor ʼn ander (waar elkeen van hierdie veranderlikes op ʼn as van hul eie aangedui word). Elke observasie in die steekproef word verteenwoordig deur ʼn datapunt in die grafiek. Die verhouding tussen twee veranderlikes kan ʼn magdom vorms aanneem, maar vir die doel van hierdie vak gaan ons slegs fokus op veranderlikes wat ʼn lineêre verhouding het. Ten einde ʼn spreidingstippingsgrafiek saam te stel het ons die koördinate (die x- en ywaardes) van elke observasie nodig. Dan gaan bring jy die datapunt op die grafiek aan, waar dit ooreenstem met die koördinate van die observasie. As die datastel groot is, kan hierdie nogal ʼn redelike tydjie neem om te doen en om hierdie rede gebruik ons sommer MS Excel om hierdie grafiek vir ons te skep. Voorbeeld 4.1 ʼn Tweedehandse motorhandelaar wil vasstel watter effek die kilometers op die odometer het op die prys waarteen tweedehandse bakkies verkoop word. Hy trek 21 bakkies wat hy deur die loop van die jaar verkoop het ewekansig en lê die volgende datastel vas:
Bladsy 150 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Kilometers
Prys (R)
1
160 199
70 369
2
143 473
96 717
3
132 891
131 923
4
183 158
46 463
5
141 511
101 773
6
144 612
108 164
7
153 756
98 465
8
149 416
95 815
9
154 985
80 748
10
143 060
101 445
11
127 358
117 657
12
138 971
113 037
13
170 985
48 029
14
123 025
136 994
15
144 298
107 204
16
157 058
79 238
17
138 250
113 604
18
166 446
79 893
19
153 746
102 280
20
159 018
97 211
21
117 083
65 024
Skep ʼn spreidingstippingsgrafiek om aan te dui waar hierdie observasies lê tussen die kilometers en prys.
Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
Bladsy 151
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Oplossing:
Prys van 'n tweedehandse bakkie 150000 140000 130000
Prys (R)
120000 110000 100000 90000 80000 70000 60000 50000 100000
110000
120000
130000
140000
150000
160000
170000
180000
190000
Kilometers op die odometer
Figuur 4.1: Spreidingstippingsgrafiek van kilometers teenoor die prys van tweedehandse bakkies Uit Figuur 4.1 kan ons die volgende afleidings maak: â&#x20AC;˘
Die verhouding tussen die prys en kilometers van Ĺ&#x2030; tweedehandse bakkie blyk lineĂŞr te wees.
â&#x20AC;˘
Dit blyk dat hierdie Ĺ&#x2030; negatiewe verhouding is (met ander woorde, waar die kilometers toeneem, neem die prys af).
â&#x20AC;˘
Die datastel het Ĺ&#x2030; uitskieter: observasie 21, waar Ĺ&#x2030; bakkie met 117 083kms op die odometer verkoop is vir slegs R65 024. (Hierdie uitskieter word uit die datastel verwyder vir die volgende gedeeltes van hierdie voorbeeld.)
Voorbeeld 4.1 wys dat ons spreidingstippingsgrafieke kan gebruik om uitskieters te identifiseer. 4.5.2
LineĂŞre regressiemodelle
Ĺ&#x2030; LineĂŞre regressiemodel vind die reguitlyn wat die gegewe data op die heel beste moontlike manier pas en die metode wat ons gebruik om dit te bepaal word die â&#x20AC;&#x153;metode van die kleinste kwadrateâ&#x20AC;? genoem. Dit bereken die waardes van die snypunt, đ?&#x2018;?8 , en die helling, đ?&#x2018;?( van Formule 4.1.
Bladsy 152 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ?&#x2019;&#x161; = đ?&#x2019;&#x192;đ?&#x;&#x17D; + đ?&#x2019;&#x192;đ?&#x;? đ?&#x2019;&#x2122; Waar:
đ?&#x2018;Ľ
= die waardes van die onafhanklike veranderlike
đ?&#x2018;Ś
= die beraamde waarde van die afhanklike veranderlike
đ?&#x2018;?8
= die snypunt van die Y-as (waar đ?&#x2018;Ľ = 0)
đ?&#x2018;?(
= die helling van die regressielyn Formule 4.1: Die lineĂŞre regressiefunksie
Om die helling en snypunt te bereken kan ons Formule 4.2 en 4.3 onderskeidelik gebruik.
đ?&#x2019;&#x192;đ?&#x;? = Waar:
đ?&#x2019;?
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x2019;&#x160; â&#x2C6;&#x2019; đ?&#x2019;?
đ?&#x2019;&#x2122;đ?&#x;?đ?&#x2019;&#x160;
â&#x2C6;&#x2019;
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x2122;đ?&#x2019;&#x160;
đ?&#x2019;&#x161;đ?&#x2019;&#x160; đ?&#x;?
đ?&#x2018;&#x203A;
= steekproefgrootte
đ?&#x2018;ĽO đ?&#x2018;ŚO
= die vermenigvuldiging van die x- en y-waarde van die đ?&#x2018;&#x2013; ste observasie
đ?&#x2018;ĽO
= die x-waarde van die đ?&#x2018;&#x2013; ste observasie
đ?&#x2018;ŚO
= die y-waarde van die đ?&#x2018;&#x2013; ste observasie
đ?&#x2018;?(
= die helling van die regressielyn Formule 4.2: Berekening van die helling, đ?&#x2019;&#x192;đ?&#x;?
đ?&#x2019;&#x192;đ?&#x;&#x17D; = Waar:
đ?&#x2019;&#x161;đ?&#x2019;&#x160; â&#x2C6;&#x2019; đ?&#x2019;&#x192;đ?&#x;? đ?&#x2019;?
đ?&#x2019;&#x2122;đ?&#x2019;&#x160;
đ?&#x2018;&#x203A;
= steekproefgrootte
đ?&#x2018;?(
= die helling van die regressielyn
đ?&#x2018;ĽO
= die x-waarde van die đ?&#x2018;&#x2013; ste observasie
đ?&#x2018;ŚO
= die y-waarde van die đ?&#x2018;&#x2013; ste observasie
đ?&#x2018;?8
= die snypunt van die regressielyn Formule 4.3: Berekening van die snypunt, đ?&#x2019;&#x192;đ?&#x;&#x17D; Voorbeeld 4.1 (vervolg)
Bereken die helling en die snypunt vir die lineĂŞre regressiemodel wat gebruik kan word om die prys van Ĺ&#x2030; tweedehandse bakkie te beraam. Oplossing: Bereken
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; ,
đ?&#x2019;&#x161;đ?&#x2019;&#x160; ,
đ?&#x2019;&#x2122;đ?&#x;?đ?&#x2019;&#x160; en
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x2019;&#x160; :
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 153
GQM105 Inleiding tot elementêre kwantitatiewe metodes
𝒊
𝒙
𝒙𝟐
𝒚
𝒙𝒚
1
160 199
70 369
25 663 719 601
11 273 043 431
2
143 473
96 717
20 584 501 729
13 876 278 141
3
132 891
131 923
17 660 017 881
17 531 379 393
4
183 158
46 463
33 546 852 964
8 510 070 154
5
141 511
101 773
20 025 363 121
14 401 999 003
6
144 612
108 164
20 912 630 544
15 641 812 368
7
153 756
98 465
23 640 907 536
15 139 584 540
8
149 416
95 815
22 325 141 056
14 316 294 040
9
154 985
80 748
24 020 350 225
12 514 728 780
10
143 060
101 445
20 466 163 600
14 512 721 700
11
127 358
117 657
16 220 060 164
14 984 560 206
12
138 971
113 037
19 312 938 841
15 708 864 927
13
170 985
48 029
29 235 870 225
8 212 238 565
14
123 025
136 994
15 135 150 625
16 853 686 850
15
144 298
107 204
20 821 912 804
15 469 322 792
16
157 058
79 238
24 667 215 364
12 444 961 804
17
138 250
113 604
19 113 062 500
15 705 753 000
18
166 446
79 893
27 704 270 916
13 297 870 278
19
153 746
102 280
23 637 832 516
15 725 140 880
20
159 018
97 211
25 286 724 324
15 458 298 798
2 986 216
1 927 029
449 980 686 536
281 578 609 650
TOTALE
Tabel 4.1: Bereken
𝒙𝒊 ,
𝒚𝒊 ,
𝒙𝟐𝒊 en
𝒙𝒊 𝒚𝒊
Nou kan ons hierdie waardes gebruik om die helling en snyding te bereken: 𝒃𝟏
=
𝒏
𝒙𝒊 𝒚𝒊 m 𝒙𝒊 𝒏
𝒙𝟐𝒊 m
𝒚𝒊 𝒙𝒊 𝟐
=
𝟐𝟎 𝟐𝟖𝟏 𝟓𝟕𝟖 𝟔𝟎𝟗 𝟔𝟓𝟎 − 𝟐 𝟗𝟖𝟔 𝟐𝟏𝟔 𝟏 𝟗𝟐𝟕 𝟎𝟐𝟗 𝟐𝟎 𝟒𝟒𝟗 𝟗𝟖𝟎 𝟔𝟖𝟔 𝟓𝟑𝟔 − 𝟐 𝟗𝟖𝟔 𝟐𝟏𝟔 𝟐
=
𝟓 𝟔𝟑𝟏 𝟓𝟕𝟐 𝟏𝟗𝟑 𝟎𝟎𝟎 − 𝟓 𝟕𝟓𝟒 𝟓𝟐𝟒 𝟖𝟑𝟐 𝟐𝟔𝟒 −𝟏𝟐𝟐 𝟗𝟓𝟐 𝟔𝟑𝟗 𝟐𝟔𝟒 = 𝟖 𝟗𝟗𝟗 𝟔𝟏𝟑 𝟕𝟑𝟎 𝟕𝟐𝟎 − 𝟖 𝟗𝟏𝟕 𝟒𝟖𝟓 𝟗𝟗𝟖 𝟔𝟓𝟔 𝟖𝟐 𝟏𝟐𝟕 𝟕𝟑𝟐 𝟎𝟔𝟒
= −𝟏, 𝟓 En
Bladsy 154 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ?&#x2019;&#x192;đ?&#x;&#x17D;
=
đ?&#x2019;&#x161;đ?&#x2019;&#x160; mđ?&#x2019;&#x192;đ?&#x;? đ?&#x2019;?
đ?&#x2019;&#x2122;đ?&#x2019;&#x160;
đ?&#x;? đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x2022; đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2014; â&#x2C6;&#x2019; â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;&#x201C; đ?&#x;? đ?&#x;&#x2013;đ?&#x;&#x2014;đ?&#x;&#x201D; đ?&#x;?đ?&#x;?đ?&#x;&#x201D; đ?&#x;? đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x2022; đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2014; + đ?&#x;? đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2019; đ?&#x;&#x2014;đ?&#x;&#x2018;đ?&#x;&#x201D;, đ?&#x;&#x201D;đ?&#x;? = đ?&#x;?đ?&#x;&#x17D; đ?&#x;?đ?&#x;&#x17D; đ?&#x;&#x201D; đ?&#x;&#x2018;đ?&#x;&#x2014;đ?&#x;&#x2022; đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x2019;, đ?&#x;&#x2018;đ?&#x;? = đ?&#x;?đ?&#x;&#x17D; =
= đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? Om dieselfde waardes in MS Excel te kry, kan ons die dataverwerkingsmodule (data analysis toolkit) se Regression-funksie gebruik. Baie belangrik: indien jy nie die dataverwerkingsmodule sien in MS Excel nie, moet jy dit gaan byvoeg. (Sien die instruksies in die eerste studie-eenheid.)
Figuur 4.2: MS Excel se dataverwerkingsmodule (data analysis toolkit)
Figuur 4.3: MS Excel se dataverwerkingsmodule se grafiese koppelvlak vir regressieanalise Sit jou Y-waardes in die eerste blokke en die X-waardes in die tweede blokkie. Baie belangrik: as jy die opskrifte ook ingesluit het by jou datastel, moet jy die Labels-blokkie
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 155
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes merk, anders gaan die berekeninge verkeerd gedoen word. In hierdie geval het ek gekies om die resultate uit te voer na Ĺ&#x2030; nuwe sigblad. Die volgende uitvoer is verkry (let daarop dat hierdie slegs Ĺ&#x2030; uittreksel is en dat MS Excel baie meer uitvoer lewer):
Figuur 4.4: â&#x20AC;&#x2122;n Uittreksel van MS Excel se regressie-uitvoer van die dataverwerkingsmodule vir Voorbeeld 4.1 Die Intercept is ons snypunt, đ?&#x2019;&#x192;đ?&#x;&#x17D; en x is ons helling, đ?&#x2019;&#x192;đ?&#x;? . Jy mag dalk op hierdie stadium oplet dat die helling wat ons met die hand bereken het en die helling wat MS Excel gee, van mekaar verskil. Die rede hiervoor is dat ons Ĺ&#x2030; afrondingsfout gemaak het gedurende ons berekeninge. Die twee waardes is egter naby genoeg aan mekaar dat ons -1,5 kan gebruik vir verdere berekeninge. As ons nou hierdie waardes in Formule 4.1 vervang, kry ons die volgende lineĂŞre regressiemodel vir tweedehandse bakkies: đ?&#x2019;&#x161; = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x201C;đ?&#x2019;&#x2122; Op die ou einde van die dag wil ons regressiemodelle gebruik om die waarde van ons afhanklike te beraam, gegee Ĺ&#x2030; bepaalde waarde van die onafhanklike veranderlike. Wegner (2016: 335) waarsku ons egter om versigtig te werk wanneer ons waardes ekstrapoleer (beraam), wat buite die steekproefruimte val. Die rede hiervoor is dat ons nie weet wat die aard van die veranderlikes se verhouding, buite hierdie grense, is nie en daar is altyd die kans dat dit nie dieselfde is nie. Dus sal enige beraminge wat ons maak, nie reg wees nie. Voorbeeld 4.1 (vervolg) Beraam die prys van Ĺ&#x2030; tweedehandse bakkie, met die volgende odometerlesings: a) 120 000km b) 145 000km c) 180 000km Oplossing: a) đ?&#x2019;&#x161; = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x201C;đ?&#x2019;&#x2122;
Bladsy 156 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x201C; đ?&#x;?đ?&#x;?đ?&#x;&#x17D; đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D; = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?đ?&#x;&#x2022;đ?&#x;&#x2014; đ?&#x;&#x201D;đ?&#x;&#x201C;đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;&#x201C; = đ?&#x;?đ?&#x;&#x2019;đ?&#x;&#x17D; đ?&#x;?đ?&#x;&#x2018;đ?&#x;?, đ?&#x;&#x2018;đ?&#x;&#x2022; Dus word die prys van Ĺ&#x2030; tweedehandse bakkie, met 120 000km op die odometer, beraam teen R140 232,37. b) đ?&#x2019;&#x161; = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x201C;đ?&#x2019;&#x2122; = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x201C; đ?&#x;?đ?&#x;&#x2019;đ?&#x;&#x201C; đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D; = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?đ?&#x;?đ?&#x;&#x2022; đ?&#x;&#x17D;đ?&#x;&#x2022;đ?&#x;&#x2013;, đ?&#x;?đ?&#x;? = đ?&#x;?đ?&#x;&#x17D;đ?&#x;? đ?&#x;&#x2013;đ?&#x;&#x17D;đ?&#x;&#x201C;, đ?&#x;?đ?&#x;? Dus word die prys van Ĺ&#x2030; tweedehandse bakkie, met 145 000km op die odometer, beraam teen R102 805,11. c) đ?&#x2019;&#x161; = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x201C;đ?&#x2019;&#x2122; = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?, đ?&#x;&#x201C; đ?&#x;?đ?&#x;&#x2013;đ?&#x;&#x17D; đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D; = đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x2013;đ?&#x;&#x2018;, đ?&#x;?đ?&#x;? â&#x2C6;&#x2019; đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2014; đ?&#x;&#x2019;đ?&#x;&#x2022;đ?&#x;&#x201D;, đ?&#x;?đ?&#x;&#x2022; = đ?&#x;&#x201C;đ?&#x;&#x17D; đ?&#x;&#x2019;đ?&#x;&#x17D;đ?&#x;&#x201D;, đ?&#x;&#x2014;đ?&#x;&#x2019; Dus word die prys van Ĺ&#x2030; tweedehandse bakkie, met 180 000km op die odometer, beraam teen R50 406,94.
Doen nou Voorbeeld 12.1 in die handboek. 4.5.3
Pearson se korrelasiekoĂŤffisiĂŤnt
Bestudeer die handboek paragraaf 12.3. Pearson se korrelasiekoĂŤffisiĂŤnt is een van die algemeenste maatstawwe wat gebruik word om die sterkte van Ĺ&#x2030; lineĂŞre verhouding tussen twee kontinue veranderlikes te bepaal (Davis, Pecar & Santana, 2016: 401).
đ?&#x2019;?
đ?&#x2019;&#x201C;= đ?&#x2019;? Waar:
đ?&#x2019;&#x2122;đ?&#x;?đ?&#x2019;&#x160; â&#x2C6;&#x2019;
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x2019;&#x160; â&#x2C6;&#x2019; đ?&#x2019;&#x2122;đ?&#x2019;&#x160;
đ?&#x;?
đ?&#x2019;&#x2122;đ?&#x2019;&#x160;
Ă&#x2014;đ?&#x2019;?
đ?&#x2018;&#x;
= Pearson se korrelasiekoĂŤffisiĂŤnt
đ?&#x2018;&#x203A;
= steekproefgrootte
đ?&#x2019;&#x161;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x;?đ?&#x2019;&#x160; â&#x2C6;&#x2019;
đ?&#x2019;&#x161;đ?&#x2019;&#x160;
đ?&#x;?
đ?&#x2018;ĽO đ?&#x2018;ŚO = die vermenigvuldiging van die x- en y-waarde van die đ?&#x2018;&#x2013; ste observasie đ?&#x2018;ĽO
= die x-waarde van die đ?&#x2018;&#x2013; ste observasie
đ?&#x2018;ŚO
= die y-waarde van die đ?&#x2018;&#x2013; ste observasie
MS Excel-formule:
=CORREL(x-waardes, y-waardes)
Formule 4.4: Berekening van Pearson se korrelasiekoĂŤffisiĂŤnt
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 157
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Korrelasies het die volgende eienskappe: â&#x20AC;˘
Korrelasies is altyd tussen -1 en 1 (â&#x2C6;&#x2019;1 â&#x2030;¤ đ?&#x2018;&#x; â&#x2030;¤ 1).
â&#x20AC;˘
As đ?&#x2018;&#x; â&#x2030;Ľ 0 beteken dit dat daar Ĺ&#x2030; positiewe verhouding tussen die twee veranderlikes is.
â&#x20AC;˘
As đ?&#x2018;&#x; â&#x2030;¤ 0 beteken dit dat daar Ĺ&#x2030; negatiewe verhouding tussen die twee veranderlikes is.
â&#x20AC;˘
As â&#x2C6;&#x2019;1 â&#x2030;¤ đ?&#x2018;&#x; â&#x2030;¤ â&#x2C6;&#x2019;0,5 of 0,5 â&#x2030;¤ đ?&#x2018;&#x; â&#x2030;¤ 1 is dit Ĺ&#x2030; aanduiding van Ĺ&#x2030; sterk lineĂŞre verhouding tussen die twee veranderlikes.
â&#x20AC;˘
As â&#x2C6;&#x2019;0,5 â&#x2030;¤ đ?&#x2018;&#x; â&#x2030;¤ â&#x2C6;&#x2019;0,3 of 0,3 â&#x2030;¤ đ?&#x2018;&#x; â&#x2030;¤ 0,5 is dit Ĺ&#x2030; aanduiding van Ĺ&#x2030; matige lineĂŞre verhouding tussen die twee veranderlikes.
â&#x20AC;˘
As â&#x2C6;&#x2019;0,3 â&#x2030;¤ đ?&#x2018;&#x; â&#x2030;¤ 0,3 is dit Ĺ&#x2030; aanduiding van Ĺ&#x2030; swak lineĂŞre verhouding tussen die twee veranderlikes.
â&#x20AC;˘
Die korrelasie word geensins beĂŻnvloed deur die eenhede waarin die veranderlikes gemeet word nie. Om die eenheid te verander van een of beide die veranderlikes behoort geen invloed te hĂŞ op die waarde đ?&#x2018;&#x; nie.
Die handboek gee gedetailleerde illustrasies van hoe Ĺ&#x2030; spreidingstippingsgrafiek sal lyk in ieder geval. Wegner (2016: 339) en Davis, Pecar en Santana (2016: 405) waarsku ons: â&#x20AC;˘
Ĺ&#x2030; Lae korrelasie nie beteken dat daar nie Ĺ&#x2030; verhouding is tussen die twee veranderlikes nie. Ĺ&#x2030; Lae korrelasie beteken net dat daar Ĺ&#x2030; swak verhouding bestaan. Dit mag ook wees dat die verhouding tussen die twee veranderlikes nie lineĂŞr is nie.
â&#x20AC;˘
Ĺ&#x2030; Korrelasie bewys nie dat daar Ĺ&#x2030; oorsaak-en-gevolg-verhouding tussen die twee veranderlikes bestaan nie. Ĺ&#x2030; Sterk korrelasie kan egter Ĺ&#x2030; goeie aanduiding wees dat daar moontlik so Ĺ&#x2030; verhouding is.
As ons kyk na die voorbeeld wat Davis, Pecar en Santana (2016: 405) gee, is dit duidelik hoe maklik ons tot die verkeerde gevolgtrekking kan kom: Ĺ&#x2030; Steekproef is gedoen waar 50 dorpies ewekansig gekies is. Tydens hierdie steekproef is daar gevind dat die verhouding tussen die aantal kinders wat gebore is (y) en die alkohol-verkope (x) vir hierdie 50 dorpies đ?&#x2018;&#x; = 0,97 is (Ĺ&#x2030; baie sterk positiewe verhouding). Dit lei die navorsers om verkeerdelik tot die gevolg te kom dat alkohol Ĺ&#x2030; direkte oorsaak was dat meer kinders gebore is.
Bladsy 158 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Dit kom egter aan die lig dat daar Ĺ&#x2030; derde veranderlike was wat Ĺ&#x2030; rol gespeel het in hierdie verhouding, naamlik die aantal mense wat in die dorpie woon. Hierdie veranderlike veroorsaak beide dat daar meer kinders gebore word en dat die alkoholverkope styg. Dus het hierdie indirekte korrelasie veroorsaak dat die navorsers Ĺ&#x2030; verkeerde gevolgtrekking gemaak het: dat alkohol die oorsaak was dat meer kinders gebore word. Ons moet dus baie versigtig wees met die interpretasie van die korrelasie en die gevolgtrekkings wat ons maak. Voorbeeld 4.1 (vervolg) Bereken wat die korrelasie, đ?&#x2019;&#x201C;, tussen die odometerlesing en die prys van Ĺ&#x2030; tweedehandse bakkie is. Oplossing: Die volgende is gegee of reeds bereken: đ?&#x2019;?
= 20 đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x2019;&#x160; = 281 578 609 650 đ?&#x2019;&#x2122;đ?&#x2019;&#x160;
= 2 986 216
đ?&#x2019;&#x161;đ?&#x2019;&#x160;
= 1 927 029
đ?&#x2019;&#x2122;đ?&#x;?đ?&#x2019;&#x160;
= 449 980 686 536
đ?&#x2019;&#x161;đ?&#x;?đ?&#x2019;&#x160;
= 196 278 824 293
(word op dieselfde wyse as
đ?&#x2019;&#x2122;đ?&#x;?đ?&#x2019;&#x160; bereken)
Dan kan ons nou die korrelasie bereken: đ?&#x2019;&#x201C;
đ?&#x2019;?
= đ?&#x2019;?
= = = =â&#x2C6;&#x2019;
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x2019;&#x160; m đ?&#x2019;&#x2122;đ?&#x2019;&#x160;
đ?&#x2019;&#x2122;đ?&#x;?đ?&#x2019;&#x160; m
đ?&#x2019;&#x2122;đ?&#x2019;&#x160;
đ?&#x;?
Ă&#x2014;đ?&#x2019;?
đ?&#x2019;&#x161;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x;?đ?&#x2019;&#x160; m
đ?&#x2019;&#x161;đ?&#x2019;&#x160; đ?&#x;?
đ?&#x;?đ?&#x;&#x17D; đ?&#x;?đ?&#x;&#x2013;đ?&#x;? đ?&#x;&#x201C;đ?&#x;&#x2022;đ?&#x;&#x2013; đ?&#x;&#x201D;đ?&#x;&#x17D;đ?&#x;&#x2014; đ?&#x;&#x201D;đ?&#x;&#x201C;đ?&#x;&#x17D; m đ?&#x;? đ?&#x;&#x2014;đ?&#x;&#x2013;đ?&#x;&#x201D; đ?&#x;?đ?&#x;?đ?&#x;&#x201D; đ?&#x;? đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x2022; đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2014; đ?&#x;?đ?&#x;&#x17D; đ?&#x;&#x2019;đ?&#x;&#x2019;đ?&#x;&#x2014; đ?&#x;&#x2014;đ?&#x;&#x2013;đ?&#x;&#x17D; đ?&#x;&#x201D;đ?&#x;&#x2013;đ?&#x;&#x201D; đ?&#x;&#x201C;đ?&#x;&#x2018;đ?&#x;&#x201D; m đ?&#x;? đ?&#x;&#x2014;đ?&#x;&#x2013;đ?&#x;&#x201D; đ?&#x;?đ?&#x;?đ?&#x;&#x201D; đ?&#x;? Ă&#x2014; đ?&#x;?đ?&#x;&#x17D; đ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x201D; đ?&#x;?đ?&#x;&#x2022;đ?&#x;&#x2013; đ?&#x;&#x2013;đ?&#x;?đ?&#x;&#x2019; đ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x2018; m đ?&#x;? đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x2022; đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2014; đ?&#x;? đ?&#x;&#x201C; đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;? đ?&#x;&#x201C;đ?&#x;&#x2022;đ?&#x;? đ?&#x;?đ?&#x;&#x2014;đ?&#x;&#x2018; đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D;mđ?&#x;&#x201C; đ?&#x;&#x2022;đ?&#x;&#x201C;đ?&#x;&#x2019; đ?&#x;&#x201C;đ?&#x;?đ?&#x;&#x2019; đ?&#x;&#x2013;đ?&#x;&#x2018;đ?&#x;? đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2019; đ?&#x;&#x2013; đ?&#x;&#x2014;đ?&#x;&#x2014;đ?&#x;&#x2014; đ?&#x;&#x201D;đ?&#x;?đ?&#x;&#x2018; đ?&#x;&#x2022;đ?&#x;&#x2018;đ?&#x;&#x17D; đ?&#x;&#x2022;đ?&#x;?đ?&#x;&#x17D;mđ?&#x;&#x2013; đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x2022; đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x201C; đ?&#x;&#x2014;đ?&#x;&#x2014;đ?&#x;&#x2013; đ?&#x;&#x201D;đ?&#x;&#x201C;đ?&#x;&#x201D; Ă&#x2014; đ?&#x;&#x2018; đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x201C; đ?&#x;&#x201C;đ?&#x;&#x2022;đ?&#x;&#x201D; đ?&#x;&#x2019;đ?&#x;&#x2013;đ?&#x;&#x201C; đ?&#x;&#x2013;đ?&#x;&#x201D;đ?&#x;&#x17D;mđ?&#x;&#x2018; đ?&#x;&#x2022;đ?&#x;?đ?&#x;&#x2018; đ?&#x;&#x2019;đ?&#x;&#x2019;đ?&#x;&#x17D; đ?&#x;&#x2022;đ?&#x;&#x201D;đ?&#x;&#x201D; đ?&#x;&#x2013;đ?&#x;&#x2019;đ?&#x;? mđ?&#x;?đ?&#x;?đ?&#x;? đ?&#x;&#x2014;đ?&#x;&#x201C;đ?&#x;? đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x2014; đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2019; đ?&#x;&#x2013;đ?&#x;? đ?&#x;?đ?&#x;?đ?&#x;&#x2022; đ?&#x;&#x2022;đ?&#x;&#x2018;đ?&#x;? đ?&#x;&#x17D;đ?&#x;&#x201D;đ?&#x;&#x2019; Ă&#x2014; đ?&#x;?đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x201C; đ?&#x;&#x2022;đ?&#x;?đ?&#x;&#x2014; đ?&#x;&#x17D;đ?&#x;?đ?&#x;&#x2014; đ?&#x;?đ?&#x;?đ?&#x;? đ?&#x;&#x2014;đ?&#x;&#x201C;đ?&#x;? đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x2014; đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2019; đ?&#x;?đ?&#x;&#x2018;đ?&#x;? đ?&#x;&#x2014;đ?&#x;&#x2014;đ?&#x;&#x2018; đ?&#x;?đ?&#x;&#x2022;đ?&#x;&#x2013; đ?&#x;?đ?&#x;?đ?&#x;?
=â&#x2C6;&#x2019;
đ?&#x;?đ?&#x;?đ?&#x;? đ?&#x;&#x2014;đ?&#x;&#x201C;đ?&#x;? đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x2014; đ?&#x;?đ?&#x;&#x201D;đ?&#x;&#x2019; đ?&#x;?đ?&#x;&#x2022; đ?&#x;&#x2019;đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;?đ?&#x;&#x201C; đ?&#x;&#x2019;đ?&#x;&#x2014;đ?&#x;? đ?&#x;&#x2022;đ?&#x;&#x2014;đ?&#x;&#x201D; đ?&#x;&#x2019;đ?&#x;&#x17D;đ?&#x;&#x17D; đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D; đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D;
= â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x201C;
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 159
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = CORREL(A1:A20, B1:B20) waar die x-waardes in kolom A, ry 1-20 is en die y-waardes in kolom B, ry 1-20 kruis. Hierdie resultaat kan soos volg geĂŻnterpreteer word: daar bestaan Ĺ&#x2030; sterk negatiewe verhouding tussen die odometerlesing en die prys van Ĺ&#x2030; tweedehandse bakkie; met ander woorde hoe meer kilometers Ĺ&#x2030; bakkie op die odometer het, hoe laer is die prys van hierdie bakkie. Doen nou Voorbeeld 12.2 in die handboek. 4.5.4
BepaaldheidskoĂŤffisiĂŤnt
Bestudeer die handboek paragraaf 12.4. Die bepaaldheidskoĂŤffisiĂŤnt is Ĺ&#x2030; maatstaf wat ons gebruik om te bepaal watter proporsie van variasie in die afhanklike veranderlike y, deur die onafhanklike veranderinge verklaar word. Dus sĂŞ hierdie maatstaf vir ons hoe goed ons lineĂŞre regressiemodel is. Die bepaaldheidskoĂŤffisiĂŤnt se waarde is altyd tussen 0 en 1, oftewel 0% en 100%. Hoe groter die bepaaldheidskoĂŤffisiĂŤnt, hoe beter.
đ?&#x2019;&#x201C;đ?&#x;? = đ?&#x2019;&#x201C;Ă&#x2014;đ?&#x2019;&#x201C; Waar:
đ?&#x2018;&#x;
= korrelasie tussen die twee veranderlikes Formule 4.5: Berekening van die bepaaldheidskoĂŤffisiĂŤnt Voorbeeld 4.1 (vervolg)
Bereken die bepaaldheidskoĂŤffisiĂŤnt, đ?&#x2019;&#x201C;đ?&#x;? , vir die lineĂŞre regressiemodel wat die odometerlesing en die prys van Ĺ&#x2030; tweedehandse bakkie voorstel. Oplossing: đ?&#x2019;&#x201C; = â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x201C; dus is: đ?&#x2019;&#x201C;đ?&#x;? = â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x201C; đ?&#x;? = đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x2022; Dit beteken dat die aantal kilometers op die odometer van Ĺ&#x2030; tweedehandse bakkie, x, 86,77% van die variasie in die prys van Ĺ&#x2030; tweedehandse bakkie, y, verduidelik. Dus het die aantal kilometers Ĺ&#x2030; groot invloed op die prys van Ĺ&#x2030; tweedehandse bakkie.
Bladsy 160 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Doen nou Voorbeeld 12.3 in die handboek. 4.5.5
Toets om die betekenisvolheid van die regressiemodel te bepaal
Bestudeer die handboek paragraaf 12.5. As ons die korrelasie wil gebruik, moet ons bepaal of daar Ĺ&#x2030; werklike verhouding tussen die twee veranderlikes bestaan en of die korrelasie blote toeval is. In Studie-eenheid 3 het ons gekyk na Ĺ&#x2030; metode om stellings te toets soos â&#x20AC;&#x153;daar bestaan Ĺ&#x2030; betekenisvolle verhouding tussen die twee veranderlikes x en yâ&#x20AC;?. Hierdie metode is natuurlik Ĺ&#x2030; hipotesetoets. Omdat ons nou kyk na die verhouding tussen die veranderlikes x en y (en nie meer die populasie se gemiddeld đ?&#x153;&#x2021; nie), gebruik ons Ĺ&#x2030; ander toetsstatistiek.
đ?&#x2019;&#x2022;-stat = đ?&#x2019;&#x201C; Waar:
đ?&#x2019;?â&#x2C6;&#x2019;đ?&#x;? đ?&#x;? â&#x2C6;&#x2019; đ?&#x2019;&#x201C;đ?&#x;?
đ?&#x2018;&#x;
= die korrelasie tussen die veranderlikes x en y
đ?&#x2018;&#x;*
= die bepaaldheidskoĂŤffisiĂŤnt vir die veranderlikes x en y
đ?&#x2018;&#x203A;
= steekproefgrootte
Die grade van vryheid vir hierdie toetsstatistiek is: đ?&#x2018;&#x2018;đ?&#x2018;&#x201C; = đ?&#x2018;&#x203A; â&#x2C6;&#x2019; 1 Formule 4.6: Berekening van die đ?&#x2019;&#x2022;-stat toetsstatistiek vir die toets vir betekenisvolheid van Ĺ&#x2030; regressiemodel Voorbeeld 4.1 (vervolg) Bepaal of die verhouding đ??&#x2020; (die Griekse simbool rho wat die korrelasiekoĂŤffisiĂŤnt verteenwoordig), tussen die aantal kilometers op die odometer x en die prys van Ĺ&#x2030; tweedehandse bakkie y betekenisvol is op Ĺ&#x2030; 5% peil van betekenis. Oplossing: Let daarop dat die stappe wat gevolg word, presies dieselfde is as in Studie-eenheid 3. Stap 1: Definieer die hipoteses đ?&#x2018;Żđ?&#x;&#x17D; : đ??&#x2020; = đ?&#x;&#x17D; (dat die verhouding tussen die odometerlesing en die prys van Ĺ&#x2030; tweedehandse bakkie nie betekenisvol is nie) đ?&#x2018;Żđ?&#x;? : đ??&#x2020; â&#x2030; đ?&#x;&#x17D; (dat die verhouding tussen die odometerlesing en die prys van Ĺ&#x2030; tweedehandse bakkie betekenisvol is)
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 161
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Uit die staanspoor kan ons sien dat hierdie Ĺ&#x2030; tweekantige toets gaan wees (omdat ons kyk of đ??&#x2020; = đ?&#x;&#x17D;) Hoe nader đ?&#x2019;&#x201C; aan 0 is, hoe groter is die kans dat die nulhipotese aanvaar gaan word. Stap 2: Bepaal die aanvaardingsarea Hierdie toets is gebaseer op die student-t-verdeling (met Ĺ&#x2030; t-toetsstatistiek) met die volgende gegewens: đ?&#x153;ś
= đ?&#x;&#x17D;, đ?&#x;&#x17D;đ?&#x;&#x201C;
đ?&#x2019;&#x2026;đ?&#x2019;&#x2021; = đ?&#x2019;? â&#x2C6;&#x2019; đ?&#x;? = đ?&#x;?đ?&#x;&#x17D; â&#x2C6;&#x2019; đ?&#x;? = đ?&#x;?đ?&#x;&#x2013; Nou gaan lees ons die betrokke kritieke waarde uit die t-tabel af: df
đ?&#x203A;ź
0.1000
0.0500
0.0250
0.0100
0.0050
0.0025
1
3.078
6.314
12.706
31.821
63.657
127.321
2
1.886
2.920
4.303
6.965
9.925
14.089
3
1.638
2.353
3.182
4.541
5.841
7.453
4
1.533
2.132
2.776
3.747
4.604
5.598
5
1.476
2.015
2.571
3.365
4.032
4.773
6
1.440
1.943
2.447
3.143
3.707
4.317
7
1.415
1.895
2.365
2.998
3.499
4.029
8
1.397
1.860
2.306
2.896
3.355
3.833
9
1.383
1.833
2.262
2.821
3.250
3.690
10
1.372
1.812
2.228
2.764
3.169
3.581
11
1.363
1.796
2.201
2.718
3.106
3.497
12
1.356
1.782
2.179
2.681
3.055
3.428
13
1.350
1.771
2.160
2.650
3.012
3.372
14
1.345
1.761
2.145
2.624
2.977
3.326
15
1.341
1.753
2.131
2.602
2.947
3.286
16
1.337
1.746
2.120
2.583
2.921
3.252
17
1.333
1.740
2.110
2.567
2.898
3.222
18
1.330
1.734
2.101
2.552
2.878
3.197
19
1.328
1.729
2.093
2.539
2.861
3.174
20
1.325
1.725
2.086
2.528
2.845
3.153
Tabel 4.2: Uittreksel uit die t-tabel vir die limiete waar đ?&#x2019;&#x2022;(đ?&#x;?đ?&#x;&#x2013;)(đ?&#x;&#x17D;,đ?&#x;&#x17D;đ?&#x;&#x201C;
đ?&#x;?)
is
Dus sal ons die nulhipotese verwerp as: đ?&#x2019;&#x2022;-stat < â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;?đ?&#x;&#x17D;đ?&#x;? of đ?&#x2019;&#x2022;-stat < đ?&#x;?, đ?&#x;?đ?&#x;&#x17D;đ?&#x;?
Bladsy 162 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 4.5: Aanvaardingsarea vir hierdie hipotesetoets Sou ons die đ?&#x2019;&#x2018;-waarde gebruik het vir hierdie toets, sou ons die nulhipotese verwerp sodra die đ?&#x2019;&#x2018;-waarde < đ?&#x153;ś. Stap 3: Bereken die toetsstatistiek đ?&#x2019;&#x2022;-stat = đ?&#x2019;&#x201C;
đ?&#x2019;?mđ?&#x;? đ?&#x;?mđ?&#x2019;&#x201C;đ?&#x;?
= â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x201C;
đ?&#x;?đ?&#x;&#x17D; â&#x2C6;&#x2019; đ?&#x;? đ?&#x;?đ?&#x;&#x2013; = â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x201C; đ?&#x;? â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;&#x201D;đ?&#x;&#x2022;đ?&#x;&#x2022; đ?&#x;&#x17D;, đ?&#x;?đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2018;
= â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x201C; đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x201D;, đ?&#x;&#x17D;đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x201C; = â&#x2C6;&#x2019;đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x201C; đ?&#x;?đ?&#x;?, đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x2019;đ?&#x;&#x201C; = â&#x2C6;&#x2019;đ?&#x;?đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;&#x201D;đ?&#x;&#x201C;đ?&#x;&#x201C; As ons kyk na die MS Excel-uitvoer wat ons vroeĂŤr gegenereer het:
Figuur 4.6: Ĺ&#x2030; Uittreksel van MS Excel se regressie-uitvoer van die dataverwerkingsmodule vir Voorbeeld 4.1 Ons kan sien dat die đ?&#x2019;&#x2022;-stat se waarde -10,8655 (afgerond) is, met Ĺ&#x2030; đ?&#x2019;&#x2018;-waarde = đ?&#x;&#x17D;. Stap 4: Vergelyk die toetsstatistiek met die aanvaardingsarea Aanvaardingsarea: đ?&#x2019;&#x2022;-stat < â&#x2C6;&#x2019;đ?&#x;?, đ?&#x;?đ?&#x;&#x17D;đ?&#x;? of đ?&#x2019;&#x2022;-stat < đ?&#x;?, đ?&#x;?đ?&#x;&#x17D;đ?&#x;? đ?&#x2019;&#x2022;-stat = â&#x2C6;&#x2019;đ?&#x;?đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;&#x201D;đ?&#x;&#x201C;đ?&#x;&#x201C;
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 163
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Die toetsstatistiek val dus binne die aanvaardingsarea: đ?&#x2019;&#x2022;-stat = â&#x2C6;&#x2019;đ?&#x;?đ?&#x;&#x17D;, đ?&#x;&#x2013;đ?&#x;&#x201D;đ?&#x;&#x201C;đ?&#x;&#x201C; < đ?&#x;?, đ?&#x;?đ?&#x;&#x17D;đ?&#x;?) Die toetsstatistiek is sĂł klein dat dit nie eers sinvol is om dit op Ĺ&#x2030; grafiek voor te stel nie. Die đ?&#x2019;&#x2018;-waarde = đ?&#x;&#x17D; is kleiner as 0,05. Stap 5: Maak Ĺ&#x2030; gevolgtrekking Omdat die toetsstatistiek buite die aanvaardingsarea val, word die nulhipotese as waarskynlik waar verwerp. Daar is genoeg statistiese bewyse om die nulhipotese op Ĺ&#x2030; 5% peil van betekenis te verwerp. Dus is die verhouding đ??&#x2020; tussen die aantal kilometers op die odometer x en die prys van Ĺ&#x2030; tweedehandse bakkie y statisties betekenisvol is op Ĺ&#x2030; 5% peil van betekenis. Doen nou Voorbeeld 12.4 in die handboek. Bestudeer ook paragrawe 12.6 en 12.7 in die handboek. Maak seker dat jy die dataverwerking in MS Excel kan doen. 4.5.6
Selfevalueringsvrae
Jy kan al die vrae aan die einde van Hoofstuk 12 in die handboek doen. Bereken dit met die hand en verifieer dit met MS Excel. Gebruik beide die aanvaardingsarea- en die đ?&#x2018;?-waardemetode (jy moet gemaklik met beide wees). 4.6
Tydreeksanalise
Bestudeer die handboek paragraaf 15.1. Ons gaan nou bietjie kyk na tydreekse. Hierdie is Ĺ&#x2030; spesiale geval waar die verhouding tussen Ĺ&#x2030; afhanklike veranderlike (y) en die onafhanklike veranderlike tyd (x) is. Tot op hede het ons gekyk na steekproewe wat op Ĺ&#x2030; bepaalde punt in tyd gedoen is; nou gaan ons werk met data wat oor Ĺ&#x2030; periode van tyd versamel is. Davis, Pecar en Santana (2016: 449) definieer Ĺ&#x2030; tydreeks as Ĺ&#x2030; veranderlike wat gemeet en voorgestel word vir bepaalde eenhede van tyd. Hierdie eenhede kan onderskeidelik ure, dae, weke, maande, ensovoorts wees. Tydreeksanalise is vir ons belangrik, want dit laat ons toe om vooruitskattings te maak vir die toekoms en dit help ons om te verstaan hoe die veranderlike oor tyd gaan reageer. Om hierdie dinge te weet help ons om met meer sekerheid te beplan vir die toekoms. Dit is veral nuttig in die volgende gevalle waar:
Bladsy 164 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementêre kwantitatiewe metodes •
Eskom die elektrisiteit wat hulle moet voorsien, moet beplan vir die volgende kwartaal;
•
die munisipaliteit moet bepaal hoeveel water ʼn bepaalde woonbuurt gaan gebruik vir die volgende maand; of
•
waar ʼn maatskappy moet bepaal wat hulle omset vir die volgende vyf jaar gaan wees.
4.6.1
Stipping van tydreekse
Soos met eenvoudige lineêre regressie skop ons af met die vaslê van tydreeksdata en hoe om dit deur middel van ʼn grafiek voor te stel. Voorbeeld 4.2 ʼn Huiseienaar het oor die laaste drie jaar sy huis se kragverbruik gemoniteer. Die volgende tabel gee sy kragverbruik, per maand, in kilowatt: 2014
2015
2016
Januarie
1 285
1 299
1 308
Februarie
1 288
1 304
1 306
Maart
1 292
1 300
1 309
April
1 297
1 317
1 322
Mei
1 309
1 315
1 324
Junie
1 315
1 320
1 321
Julie
1 323
1 322
1 326
Augustus
1 319
1 324
1 325
September
1 315
1 323
1 318
Oktober
1 306
1 311
1 317
November
1 303
1 316
1 316
Desember
1 302
1 310
1 309
Tabel 4.3: ’n Huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 Skets ʼn lyngrafiek van die huiseienaar se maandelikse kragverbruik vir 2014-2016.
Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
Bladsy 165
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Oplossing: Die volgende grafiek is getrek met behulp van MS Excel se lyngrafiek (met merkers).
Huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1330
Kragverbruik (kW.)
1325 1320 1315 1310 1305 1300 1295 1290 1285
2014
2015
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
1280
2016
Jaar/Maand
Figuur 4.7: Lyngrafiek van die huiseienaar se maandelikse kragverbruik (kW) vir 20142016 Doen nou Voorbeeld 15.1 in die handboek. 4.6.2
Elemente van tydreeksanalise
Bestudeer die handboek paragrawe 15.2 en 15.3. Klassieke tydreeksanalise aanvaar dat elke tydreeks uit die volgende vier elemente bestaan: â&#x20AC;˘
Ĺ&#x2030; onderliggende tendens (T);
â&#x20AC;˘
sikliese variasies (C);
â&#x20AC;˘
seisoenale variasies (S); en
â&#x20AC;˘
onreĂŤlmatige variasies (I).
Daar is verskillende modelle wat ons kan gebruik om hierdie elemente bymekaar te voeg. Die model waarna ons gaan kyk, staan bekend as die â&#x20AC;&#x153;multiplikatiewe modelâ&#x20AC;?:
đ?&#x2019;&#x161; = đ?&#x2018;ťĂ&#x2014;đ?&#x2018;ŞĂ&#x2014;đ?&#x2018;şĂ&#x2014;đ?&#x2018;° Waar:
đ?&#x2018;Ś
= afhanklike veranderlike
đ?&#x2018;&#x2021;
= tendens
Bladsy 166 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ??ś
= sikliese variasies
đ?&#x2018;&#x2020;
= seisoenale variasies
đ??ź
= onreĂŤlmatige variasies Formule 4.7: Multiplikatiewe tydreeksmodel
v Tendense Die tendens is die gladde onderliggende beweging van die tydreeks in Ĺ&#x2030; bepaalde rigting, naamlik op (positief) of af (negatief). Dit word op Ĺ&#x2030; lyngrafiek van Ĺ&#x2030; tydreeks voorgestel deur Ĺ&#x2030; reguit lyn. Indien ons die tendens van Voorbeeld 4.2 isoleer, sal die lyngrafiek soos volg lyk.
Die tendens van 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016
Kragverbruik (kW.)
1310 1305 1300 1295 1290 1285
Desember
Oktober
November
September
Jullie
Augustus
Mei
2015
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
2014
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
1280
2016
Jaar/Maand
Figuur 4.8: Lyngrafiek van die tendens van â&#x20AC;&#x2122;n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 (uit voorbeeld 4.2) Wanneer ons die tendens wil analiseer, isoleer ons die onderliggende langtermynbeweging van die reeks. v Siklusse Sikliese variasie is langtermynvariasies om die tendens, wat onreĂŤlmatig plaasvind oor lang periodes. Met ander woorde, die een siklus is nie so lank soos die ander nie en die grootte van die variasie is anders, van die een siklus tot die volgende. Dit maak dit moeilik om siklusse te identifiseer en te verduidelik. Ons kan indekse bereken wat die data beskryf, maar hierdie indekse is nie baie werd wanneer dit kom by vooruitskatting nie omdat ons dit nie kan voorspel nie. Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 167
GQM105 Inleiding tot elementêre kwantitatiewe metodes Indien ons die sikliese variasie van Voorbeeld 4.2 isoleer, sal die lyngrafiek soos volg lyk:
Sikliese variasie van 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1320
Kragverbruik (kW.)
1315 1310 1305 1300 1295 1290 1285
Desember
Oktober
November
September
Jullie
Augustus
Mei
2015
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
2014
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
1280
2016
Jaar/Maand
Figuur 4.9: Lyngrafiek van die sikliese variasie van ’n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 (uit Voorbeeld 4.2) v Seisoenaliteit ʼn Seisoenale variasie is die afwisseling van ʼn gereelde voorspelbare afwisseling oor kort gereelde periodes wat ewe groot is, byvoorbeeld dae, weke, maande, kwartale, jare, ensovoorts. Hierdie afwisselings word gewoonlik veroorsaak deur herhaalde omgewingsgebeurtenisse, soos die seisoene van die jaar. Seisoenale variasie word bereken as ʼn indeks wat gebruik kan word vir vooruitskattings omdat ons kan bepaal wanneer dit gaan gebeur en hoe groot hierdie variasie is. Indien ons die seisoenale variasie van Voorbeeld 4.2 isoleer, sal die lyngrafiek soos volg lyk:
Bladsy 168 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Seisoenale variasie van 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1320
Kragverbruik (kW.)
1315 1310 1305 1300 1295 1290 1285
Desember
Oktober
November
September
Jullie
Augustus
Mei
2015
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
2014
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
1280
2016
Jaar/Maand
Figuur 4.10: Lyngrafiek van die seisoenale variasie van ’n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 (uit Voorbeeld 4.2) v Onreëlmatige invloede Indien ons die onreëlmatige invloede Van voorbeeld 4.2 isoleer, sal die lyngrafiek soos volg lyk:
Onreëlmatige invloede van 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1315
Kragverbruik (kW.)
1310 1305 1300 1295 1290 1285
2015
Desember
November
Oktober
September
Jullie
Augustus
Junie
Mei
April
Maart
Februarie
Januarie
Desember
November
Oktober
September
Jullie
Augustus
Junie
Mei
April
Maart
Februarie
Januarie
Desember
November
Oktober
September
Jullie
2014
Augustus
Junie
Mei
April
Maart
Januarie
Februarie
1280
2016
Jaar/Maand
Figuur 4.11: Lyngrafiek van die onreëlmatige invloede van ’n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 (uit Voorbeeld 4.2)
Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
Bladsy 169
GQM105 Inleiding tot elementêre kwantitatiewe metodes Onreëlmatige invloede is enkel- ewekansige gebeurtenisse wat heeltemal onvoorspelbaar is, met geen patroon of ritme nie. Dit kan glad nie gebruik word vir vooruitskatting nie en verskaf geen bruikbare insig met betrekking tot die afhanklike veranderlike nie. 4.6.3
Tendensanalise
Bestudeer die handboek paragraaf 15.4. Om die onderliggende langtermynbeweging van die tydreeks waar te neem wil ons die korten mediumtermynvariasies (siklusse, seisoenaliteit en onreëlmatige invloede) uit die data haal. v Metode 1: Bewegende gemiddelde Hierdie metode lig vir ons die tendens en sikliese variasie (TC) uit die tydreeks. Dit vat ʼn vensterperiode en werk die sentrale gemiddeld uit vir hierdie periode. Indien die vensterperiode drie periodes is, is die resultaat die sentrale gemiddeld vir periode 2. Indien die vensterperiode vyf is, is die resultaat die sentrale gemiddeld vir periode 3. Wanneer die vensterperiode ʼn onewe getal is, is dit die sentrale gemiddeld vir die middelste periode.
Figuur 4.12: Illustrasie van sentrale gemiddeldes vir ’n drie-periode bewegende gemiddeld Voorbeeld 4.3 Bereken ʼn drie-periode bewegende gemiddeld vir die volgende data: Periode
Waarde
1
13
2
19
3
18
4
14
5
15
Tabel 4.4: Datastel vir Voorbeeld 4.3
Bladsy 170 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Oplossing: Periode
Waarde
Berekening
1
13
-
2
19
13 + 19 + 18 = 15,8 3
3
18
19 + 18 + 14 = 16,5 3
4
14
18 + 14 + 15 = 15,7 3
5
15
-
Tabel 4.5: Berekening van ’n drie-periode bewegende gemiddeld
Wanneer ons werk met ʼn vensterperiode van vier periodes, val die sentrale gemiddeld tussen periode 2 en 3 (soos aangedui in Figuur 4.13).
Figuur 4.13: Illustrasie van sentrale gemiddeldes vir ’n vier-periode bewegende gemiddeld Voorbeeld 4.4 Bereken ʼn vier-periode bewegende gemiddeld vir die volgende data: Periode
Waarde
1
13
2
19
3
18
4
14
5
15
Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
Bladsy 171
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
6
20
7
19
8
16
9
11
Tabel 4.6: Datastel vir Voorbeeld 4.3 Oplossing: Periode
Waarde
1
13
Berekening
2
19 13 + 19 + 18 + 14 = 16 4
3
18 19 + 18 + 14 + 15 = 16,5 4
4
14 18 + 14 + 15 + 20 = 16,75 4
5
15 14 + 15 + 20 + 19 = 17 4
6
20 15 + 20 + 19 + 16 = 17,5 4
7
19 20 + 19 + 16 + 11 = 16,6 4
8
16 -
9
11
Tabel 4.7: Berekening van â&#x20AC;&#x2122;n vier-periode bewegende gemiddeld Om die sentrale gemiddeld per periode te kry word die gemiddeld van die twee sentrale gemiddeldes bo en onder die periode bereken:
Bladsy 172 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Figuur 4.14: Illustrasie van hoe om bewegende gemiddeldes te sentraliseer Voorbeeld 4.4 (vervolg) Sentraliseer die vier-periode bewegende gemiddeld: Periode
Waarde
1
13
Berekening
2
19 13 + 19 + 18 + 14 = 16 4
3
18 19 + 18 + 14 + 15 = 16,5 4
4
14 18 + 14 + 15 + 20 = 16,75 4
5
15 14 + 15 + 20 + 19 = 17 4
6
20 15 + 20 + 19 + 16 = 17,5 4
7
19 20 + 19 + 16 + 11 = 16,5 4
8
16 -
9
11
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 173
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Tabel 4.8: ’n Vier-periode bewegende gemiddeld Oplossing: Periode
Waarde
1
13
Berekening
Gesentraliseerde waarde
2
19
13 + 19 + 18 + 14 = 16 4
3
16 + 16,5 = 16,25 2
18 19 + 18 + 14 + 15 = 16,5 4
4
16,5 + 16,75 = 16,625 2
14 18 + 14 + 15 + 20 = 16,75 4
5
16,75 + 17 = 16,875 2
15 14 + 15 + 20 + 19 = 17 4
6
17 + 17,5 = 17,25 2
20 15 + 20 + 19 + 16 = 17,5 4
7
17,5 + 16,5 = 17 2
19 20 + 19 + 16 + 11 = 16,5 4
8
16
-
9
11 Tabel 4.9: Gesentraliseerde vier-periode bewegende gemiddeld
Bladsy 174 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
GQM105 Inleiding tot elementêre kwantitatiewe metodes Baie belangrik: onthou om die bewegende gemiddeld vir ʼn ewe getal (byvoorbeeld 4, 6, 12, 24, ensovoorts) altyd te sentraliseer! Doen nou Voorbeeld 15.2-15.4 in die handboek. Voorbeeld 4.2 (vervolg) 2014
2015
2016
Januarie
1 285
1 299
1 308
Februarie
1 288
1 304
1 306
Maart
1 292
1 300
1 309
April
1 297
1 317
1 322
Mei
1 309
1 315
1 324
Junie
1 315
1 320
1 321
Julie
1 323
1 322
1 326
Augustus
1 319
1 324
1 325
September
1 315
1 323
1 318
Oktober
1 306
1 311
1 317
November
1 303
1 316
1 316
Desember
1 302
1 310
1 309
Tabel 4.3: ’n Huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 Bereken ʼn twaalf-periode bewegende gemiddeld vir die maandelikse kragverbruik en teken ʼn lyngrafiek wat die periodes en die twaalf-periode bewegende gemiddeld aandui. Oplossing: Herrangskik die tabel om die waardes onder mekaar te gee: Jaar 2014
Maand
Waarde
Januarie
1 285
Februarie
1 288
Maart
1 292
April
1 297
Mei
1 309
Bereken
Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
Gesentraliseer
Bladsy 175
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Junie
1 315 1 304, 5
Julie
1 323
1 305,1 1 305,7
Augustus
1 319
1 306,3 1 307,0
September
1 315
1 307,3 1 307,7
Oktober
1 306
1 308,5 1 309,3
November
1 303
1 309,6 1 309,8
Desember
1 302
1 310,0 1 310,3
2015
Januarie
1 299
1 310,2 1 310,2
Februarie
1 304
1 310,4 1 310,6
Maart
1 300
1 310,9 1 311,3
April
1 317
1 311,5 1 311,7
Mei
1 315
1 312,2 1 312, 8
Junie
1 320
1 313,1 1 313,4
Julie
1 322
1 313,8 1 314,2
Augustus
1 324
1 314,3 1 314,3
September
1 323
1 314,7 1 315,1
Oktober
1 311
1 315,3
Bladsy 176 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementêre kwantitatiewe metodes
1 315,5 November
1 316
1 315,9 1 316,3
Desember
1 310
1 316,3 1 316,3
2016
Januarie
1 308
1 316,5 1 316,7
Februarie
1 306
1 316,7 1 316,8
Maart
1 309
1 316,5 1 316,3
April
1 322
1 316,6 1 316,8
Mei
1 324
1 316,8 1 316,8
Junie
1 321
1 316,8 1 316,8
Julie
1 326
Augustus
1 325
September
1 318
Oktober
1 317
November
1 316
Desember
1 309
Tabel 4.10: Twaalf-periode bewegende gemiddelde vir ’n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016
Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
Bladsy 177
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
12 periode bewegende gemiddele vir 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1330
Kragverbruik (kW.)
1325 1320 1315 1310 1305 1300 1295 1290 1285
2014
Desember
Oktober
November
September
Jullie
Augustus
Mei
2015
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
1280
2016
Jaar/Maand
Figuur 4.15: Lyngrafiek van Ĺ&#x2030; twaalf-periode bewegende gemiddelde vir â&#x20AC;&#x2122;n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 Ĺ&#x2030; Nadeel van bewegende gemiddelde is dat ons data aan die begin en einde van ons tydreeks verloor. Uit Voorbeeld 4.4 kan ons duidelik sien dat ons ses periodes se data aan die begin en einde van die tydreeks verloor het. Hoe groter jou vensterperiode, hoe meer data verloor ons. v Metode 2: LineĂŞre regressie-analise As ons die tendens wil analiseer deur middel van lineĂŞre regressie, bereken ons dit op dieselfde wyse as in paragraaf 4.5.2, met die uitsondering dat ons x-waardes 1, 2, ..., n is, waar n die laaste periode van ons tydreeks verteenwoordig. Voorbeeld 4.4 (vervolg) Gebruik die gegewe data en skep Ĺ&#x2030; lineĂŞre regressiemodel daarvoor. Gebruik hierdie regressiemodel om die kragverbruik (in kW) te beraam vir Januarie 2017. Oplossing: Bereken
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; ,
Jaar 2014
đ?&#x2019;&#x161;đ?&#x2019;&#x160; ,
đ?&#x2019;&#x2122;đ?&#x;?đ?&#x2019;&#x160; en
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x2019;&#x160; :
Maand
đ?&#x2019;&#x2122;
đ?&#x2019;&#x161;
đ?&#x2019;&#x2122;đ?&#x;?
đ?&#x2019;&#x2122;đ?&#x2019;&#x161;
Januarie
1
1285
1
1285
Februarie
2
1288
4
2576
Bladsy 178 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
2015
2016
Maart
3
1292
9
3876
April
4
1297
16
5188
Mei
5
1309
25
6545
Junie
6
1315
36
7890
Julie
7
1323
49
9261
Augustus
8
1319
64
10552
September
9
1315
81
11835
Oktober
10
1306
100
13060
November
11
1303
121
14333
Desember
12
1302
144
15624
Januarie
13
1299
169
16887
Februarie
14
1304
196
18256
Maart
15
1300
225
19500
April
16
1317
256
21072
Mei
17
1315
289
22355
Junie
18
1320
324
23760
Julie
19
1322
361
25118
Augustus
20
1324
400
26480
September
21
1323
441
27783
Oktober
22
1311
484
28842
November
23
1316
529
30268
Desember
24
1310
576
31440
Januarie
25
1308
625
32700
Februarie
26
1306
676
33956
Maart
27
1309
729
35343
April
28
1322
784
37016
Mei
29
1324
841
38396
Junie
30
1321
900
39630
Julie
31
1326
961
41106
Augustus
32
1325
1024
42400
September
33
1318
1089
43494
Oktober
34
1317
1156
44778
November
35
1316
1225
46060
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 179
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Desember TOTALE
36
1309
1296
47124
666
47216
16206
875789
Tabel 4.11: Berekening van đ?&#x2019;&#x2122;đ?&#x2019;&#x160; ,
đ?&#x2019;&#x161;đ?&#x2019;&#x160; ,
đ?&#x2019;&#x2122;đ?&#x;?đ?&#x2019;&#x160; en
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x2019;&#x160;
Bereken nou die waardes van đ?&#x2019;&#x192;đ?&#x;? en đ?&#x2019;&#x192;đ?&#x;&#x17D; : đ?&#x2019;&#x192;đ?&#x;?
=
đ?&#x2019;? đ?&#x2019;?
đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x2019;&#x160; m đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x2019;&#x161;đ?&#x2019;&#x160; đ?&#x2019;&#x2122;đ?&#x;?đ?&#x2019;&#x160; m đ?&#x2019;&#x2122;đ?&#x2019;&#x160; đ?&#x;?
=
đ?&#x;&#x2018;đ?&#x;&#x201D; đ?&#x;&#x2013;đ?&#x;&#x2022;đ?&#x;&#x201C; đ?&#x;&#x2022;đ?&#x;&#x2013;đ?&#x;&#x2014; â&#x2C6;&#x2019; đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x201D; đ?&#x;&#x2019;đ?&#x;&#x2022; đ?&#x;?đ?&#x;?đ?&#x;&#x201D; đ?&#x;&#x2018;đ?&#x;&#x201D; đ?&#x;?đ?&#x;&#x201D; đ?&#x;?đ?&#x;&#x17D;đ?&#x;&#x201D; â&#x2C6;&#x2019; đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x201D; đ?&#x;?
=
đ?&#x;&#x2018;đ?&#x;? đ?&#x;&#x201C;đ?&#x;?đ?&#x;&#x2013; đ?&#x;&#x2019;đ?&#x;&#x17D;đ?&#x;&#x2019; â&#x2C6;&#x2019; đ?&#x;&#x2018;đ?&#x;? đ?&#x;&#x2019;đ?&#x;&#x2019;đ?&#x;&#x201C; đ?&#x;&#x2013;đ?&#x;&#x201C;đ?&#x;&#x201D; đ?&#x;&#x2013;đ?&#x;? đ?&#x;&#x201C;đ?&#x;&#x2019;đ?&#x;&#x2013; = đ?&#x;&#x201C;đ?&#x;&#x2013;đ?&#x;&#x2018; đ?&#x;&#x2019;đ?&#x;?đ?&#x;&#x201D; â&#x2C6;&#x2019; đ?&#x;&#x2019;đ?&#x;&#x2019;đ?&#x;&#x2018; đ?&#x;&#x201C;đ?&#x;&#x201C;đ?&#x;&#x201D; đ?&#x;?đ?&#x;&#x2018;đ?&#x;&#x2014; đ?&#x;&#x2013;đ?&#x;&#x201D;đ?&#x;&#x17D;
= đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;? en đ?&#x2019;&#x192;đ?&#x;&#x17D;
=
đ?&#x2019;&#x161;đ?&#x2019;&#x160; mđ?&#x2019;&#x192;đ?&#x;? đ?&#x2019;?
đ?&#x2019;&#x2122;đ?&#x2019;&#x160;
đ?&#x;&#x2019;đ?&#x;&#x2022; đ?&#x;?đ?&#x;?đ?&#x;&#x201D; â&#x2C6;&#x2019; đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;? đ?&#x;&#x201D;đ?&#x;&#x201D;đ?&#x;&#x201D; đ?&#x;&#x2019;đ?&#x;&#x2022; đ?&#x;?đ?&#x;?đ?&#x;&#x201D; â&#x2C6;&#x2019; đ?&#x;&#x2018;đ?&#x;&#x2014;đ?&#x;&#x2018;, đ?&#x;&#x17D;đ?&#x;&#x2013;đ?&#x;&#x201C;đ?&#x;&#x2022; = đ?&#x;&#x2018;đ?&#x;&#x201D; đ?&#x;&#x2018;đ?&#x;&#x201D; đ?&#x;&#x2019;đ?&#x;&#x201D; đ?&#x;&#x2013;đ?&#x;?đ?&#x;?, đ?&#x;&#x2014;đ?&#x;?đ?&#x;&#x2019;đ?&#x;&#x2018; = đ?&#x;&#x2018;đ?&#x;&#x201D; =
= đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;&#x201C; Verifieer jou resultaat met MS Excel:
Figuur 4.16: MS Excel-uitvoer vir Voorbeeld 4.4
Bladsy 180 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
LineĂŞre funksie vir 'n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 y = 0.5902x + 1300.6
1330
Kragverbruik (kW)
1325 1320 1315 1310 1305 1300 1295 1290 1285
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
2015
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
2014
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
1280
2016
Jaar/Maand
Figuur 4.17: Lyngrafiek vir die lineĂŞre funksie vir â&#x20AC;&#x2122;n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 As ons die kragverbruik vir Januarie 2017 wil beraam, gebruik ons die formule: đ?&#x2019;&#x161;
= đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;?đ?&#x2019;&#x2122; = đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x2022; = đ?&#x;? đ?&#x;&#x2018;đ?&#x;?đ?&#x;?, đ?&#x;&#x2019;đ?&#x;&#x2022;đ?&#x;&#x2018;đ?&#x;&#x2014;
Dus het die huiseienaar, met behulp van tendensanalise, die kragverbruik vir Januarie 2017 beraam as 1 322kW. Doen nou Voorbeeld 15.5 in die handboek. Uit Voorbeeld 4.4 kan ons sien dat daar Ĺ&#x2030; baie groot seisoenale variasie in die data is. Januarie 2017 se kragverbruik is beraam teen 1 322kW, maar as ons net na die lyngrafiek kyk, sien ons dat dit beslis nie die geval gaan wees nie. Om hierdie stelling verder te staaf kan ons đ?&#x2018;&#x; * = 0,3354 bereken vir hierdie regressielyn. Onthou dat dit beteken dat hierdie model slegs 33,54% van die variasie in die kragverbruik verklaar. Om Ĺ&#x2030; beraming te kry wat meer akkuraat is, sal ons die seisoenale variasie ook in berekening moet bring. 4.6.4
Seisoenale analise
Bestudeer die handboek paragrawe 15.5-15.8. In hierdie paragraaf sal ons bespreek hoe om die seisoenale variasie (S) uit ons tydreeksdata te haal. Dit help ons om: â&#x20AC;˘
die seisoenale variasie apart te analiseer;
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 181
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes â&#x20AC;˘
die seisoenale variasie uit die data te haal, want dit help ons om die langtermyntendens beter te beraam; en
â&#x20AC;˘
vooruitskattings meer akkuraat te beraam omdat ons die seisoenale indeks in berekening kan neem.
Stap 1: Identifiseer die tendens/siklusse beweging (TC), soos wat ons in paragraaf 4.6.3 gedoen het, met behulp van die bewegende gemiddelde. Stap 2: Vind die seisoenale verhouding (SI).
đ?&#x2018;şđ?&#x2018;° = Waar:
đ?&#x2019;&#x20AC; đ?&#x2018;ťđ?&#x2018;Şđ?&#x2018;şđ?&#x2018;° = đ?&#x2018;ťđ?&#x2018;Ş đ?&#x2018;ťđ?&#x2018;Ş
đ?&#x2018;&#x152;
= die observasies in die tydreeks
đ?&#x2018;&#x2021;
= tendens
đ??ś
= sikliese variasies
đ?&#x2018;&#x2020;
= seisoenale variasies
đ??ź
= onreĂŤlmatige variasies
đ?&#x2018;&#x2021;Ă&#x2014;đ??ś = bewegende gemiddeld đ?&#x2018;&#x2020;Ă&#x2014;đ??ź
= seisoenale variasie
Formule 4.8: Berekening van die seisoenale variasie van die tydreeks Stap 3: Vind die gemiddeld van die seisoenale variasies. Kry die seisoenale variasies vir al die ooreenstemmende periodes (byvoorbeeld die seisoenale variasies vir al die Januaries, Maandae, ensovoorts) en bereken die gemiddeld (seisoenale indeks). Let daarop dat Wegner (2016: 425) die mediaan van die seisoenale variasies gebruik omdat dit minder beĂŻnvloedbaar is deur uitskieters. Ons gebruik egter die gemiddeld om dat dit meer algemeen in die praktyk is. Stap 4: Pas die seisoenale indekse aan sodat die totaal daarvan gelyk is aan die aantal periodes wat gebruik is om die bewegende gemiddelde te bereken.
Aanpassingsfaktor =
Waar:
đ?&#x2019;&#x152; đ?&#x2018;şđ?&#x2018;°đ?&#x2019;&#x160;
đ?&#x2018;&#x2DC;
= aantal periodes wat gebruik is om die bewegende gemiddelde te bereken
đ?&#x2018;&#x2020;đ??źO
= seisoenale variasie vir periode đ?&#x2018;&#x2013; Formule 4.9: Berekening van die aanpassingsfaktor
Bladsy 182 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Voorbeeld 4.4 (vervolg) Bereken die seisoenale indekse vir die huiseienaar se kragverbruik (in kW) per maand vir 2014-2016. Oplossing: Bereken eers die seisoenale variasies: Jaar 2014
2015
đ?&#x2018;&#x152; = đ?&#x2018;&#x2021;đ??śđ??źđ?&#x2018;&#x2020;
đ?&#x2018;&#x2021;đ??ś
đ?&#x2018;&#x2021;đ??śđ??źđ?&#x2018;&#x2020; = đ?&#x2018;&#x2020;đ??ź đ?&#x2018;&#x2021;đ??ś
Januarie
1 285
-
-
Februarie
1 288
-
-
Maart
1 292
-
-
April
1 297
-
-
Mei
1 309
-
-
Junie
1 315
-
-
Julie
1 323
1 305,1
1 323 = 1,0137 1 305,1
Augustus
1 319
1 306,3
1 3193 = 1,0097 1 306,3
September
1 315
1 307,3
1 315 = 1,0059 1 307,3
Oktober
1 306
1 308,5
0,9981
November
1 303
1 309,6
0,9950
Desember
1 302
1 310,0
0,9939
Januarie
1 299
1 310,2
0,9915
Februarie
1 304
1 310,4
0,9951
Maart
1 300
1 310,9
0,9917
April
1 317
1 311,5
1,0042
Mei
1 315
1 312,2
1,0021
Junie
1 320
1 313,1
1,0053
Julie
1 322
1 313,8
1,0062
Maand
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 183
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
2016
Augustus
1 324
1 314,3
1,0074
September
1 323
1 314,7
1,0063
Oktober
1 311
1 315,3
0,9967
November
1 316
1 315,9
1,0001
Desember
1 310
1 316,3
0,9952
Januarie
1 308
1 316,5
0,9935
Februarie
1 306
1 316,7
0,9919
Maart
1 309
1 316,5
0,9943
April
1 322
1 316,6
1,0041
Mei
1 324
1 316,8
1,0055
Junie
1 321
1 316,8
1,0032
Julie
1 326
-
-
Augustus
1 325
-
-
September
1 318
-
-
Oktober
1 317
-
-
November
1 316
-
-
Desember
1 309
-
-
Tabel 4.12: Berekening van die seisoenale indekse vir â&#x20AC;&#x2122;n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 Tabuleer die seisoenale variasies soos volg: Maand
2014
2015
2016
Gemiddeld
Januarie
-
0,9914
0,9935
0,9925
Februarie
-
0,9951
0,9919
0,9935
Maart
-
0,9917
0,9943
0,9930
April
-
1,0042
1,0041
1,0042
Mei
-
1,0021
1,0054
1,0038
Junie
-
1,0053
1,0032
1,0043
Bladsy 184 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Julie
1,0137
1,0062
-
1,0100
Augustus
1,0097
1,0074
-
1,0086
September
1,0059
1,0063
-
1,0061
Oktober
0,9981
0,9967
-
0,9974
November
0,9950
1,0001
-
0,9976
Desember
0,9939
0,9952
-
0,9946
Totaal:
12,0056
Tabel 4.13: Berekening van die seisoenale indekse Die seisoenale indekse moet nou eers aangepas word. Bereken die aanpassingsfaktor: Aanpassingsfaktor = =
đ?&#x2019;&#x152; đ?&#x2018;şđ?&#x2018;°đ?&#x2019;&#x160;
đ?&#x;?đ?&#x;?, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x17D; đ?&#x;?đ?&#x;?, đ?&#x;&#x17D;đ?&#x;&#x17D;đ?&#x;&#x201C;đ?&#x;&#x201D;
= đ?&#x;&#x17D;, đ?&#x;&#x2014;đ?&#x;&#x2014;đ?&#x;&#x2014;đ?&#x;&#x201C; Pas nou die seisoenale indekse aan: Maand
Seisoenale Indeks
Aanpassing Aangepaste seisoenale indeks
Januarie
0,9925
Ă&#x2014;0,9995
0,99204
Februarie
0,9935
Ă&#x2014;0,9995
0,99304
Maart
0,9930
Ă&#x2014;0,9995
0,99254
April
1,0042
Ă&#x2014;0,9995
1,00373
Mei
1,0038
Ă&#x2014;0,9995
1,00333
Junie
1,0043
Ă&#x2014;0,9995
1,00383
Julie
1,0100
Ă&#x2014;0,9995
1,00953
Augustus
1,0086
Ă&#x2014;0,9995
1,00813
September
1,0061
Ă&#x2014;0,9995
1,00563
Oktober
0,9974
Ă&#x2014;0,9995
0,99693
November
0,9976
Ă&#x2014;0,9995
0,99713
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 185
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Desember
0,9946
Totaal
12,0056
Ă&#x2014;0,9995
0,99414 12,00000
Tabel 4.14: Aanpassing van die seisoenale indekse
Ons kan nou hierdie indekse gebruik om die seisoenale variasie uit die tydreeks te haal.
đ?&#x2018;ťđ?&#x2018;Şđ?&#x2018;° = Waar:
đ?&#x2019;&#x20AC; đ?&#x2018;ťđ?&#x2018;Şđ?&#x2018;şđ?&#x2018;° = đ?&#x2018;ş đ?&#x2018;ş
đ?&#x2018;&#x152;
= die observasies in die tydreeks
đ?&#x2018;&#x2021;
= tendens
đ??ś
= sikliese variasies
đ?&#x2018;&#x2020;
= seisoenale variasies
đ??ź
= onreĂŤlmatige variasies
đ?&#x2018;&#x2021;Ă&#x2014;đ??ś = bewegende gemiddeld đ?&#x2018;&#x2020;Ă&#x2014;đ??ź
= seisoenale variasie
Formule 4.10: Berekening van die tendens/sikliese variasie deur die seisoenale variasie uit te haal Voorbeeld 4.4 (vervolg) Bereken die tendens/sikliese variasie, van die huiseienaar se kragverbruik (in kW) per maand vir 2014-2016, deur die seisoenale variasie uit te haal. Toon hierdie waardes, saam met die oorspronklike tydreeks, op Ĺ&#x2030; lyngrafiek. Oplossing: Jaar
Maand
đ?&#x2018;&#x152; = đ?&#x2018;&#x2021;đ??śđ??źđ?&#x2018;&#x2020;
Seisoenale indeks
2014
đ?&#x2018;&#x2021;đ??śđ??źđ?&#x2018;&#x2020; = đ?&#x2018;&#x2021;đ??śđ??ź đ?&#x2018;&#x2020;
Januarie
1 285
0,99204
1 285 = 1 295,4 0,99204
Februarie
1 288
0,99304
1 288 = 1 297,1 0,99304
Maart
1 292
0,99254
1 292 = 1 301,3 0,99254
April
1 297
1,00373
1 292,3
Bladsy 186 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
2015
2016
Mei
1 309
1,00333
1 304,5
Junie
1 315
1,00383
1 309,6
Julie
1 323
1,00953
1 310,4
Augustus
1 319
1,00813
1 308,7
September
1 315
1,00563
1 308,0
Oktober
1 306
0,99693
1 309,7
November
1 303
0,99713
1 306,6
Desember
1 302
0,99414
1 309,7
Januarie
1 299
0,99204
1 309,1
Februarie
1 304
0,99304
1 313,6
Maart
1 300
0,99254
1 309,7
April
1 317
1,00373
1 311,9
Mei
1 315
1,00333
1 310,2
Junie
1 320
1,00383
1 315,3
Julie
1 322
1,00953
1 309,9
Augustus
1 324
1,00813
1 313,6
September
1 323
1,00563
1 315,6
Oktober
1 311
0,99693
1 315,5
November
1 316
0,99713
1 319,5
Desember
1 310
0,99414
1 317,5
Januarie
1 308
0,99204
1 318,3
Februarie
1 306
0,99304
1 315,6
Maart
1 309
0,99254
1 318,6
April
1 322
1,00373
1 317,0
Mei
1 324
1,00333
1 319,3
Junie
1 321
1,00383
1 315,6
Julie
1 326
1,00953
1 313,6
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 187
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Augustus
1 325
1,00813
1 314,2
September
1 318
1,00563
1 311,0
Oktober
1 317
0,99693
1 321,1
November
1 316
0,99713
1 320,3
Desember
1 309
0,99414
1 317,1
Tabel 4.15: Berekening van die tendens vir â&#x20AC;&#x2122;n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016, deur die seisoenale variasie uit te haal
Tendens vir 'n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 waar die seisoenale variasie uitgehaal is 1330
Kragverbruik (kW)
1325 1320 1315 1310 1305 1300 1295 1290 1285
Desember
Oktober
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
2015
November
September
Jullie
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
Desember
Oktober
November
September
Jullie
2014
Augustus
Mei
Junie
April
Maart
Januarie
Februarie
1280
2016
Jaar/Maand
Figuur 4.16: Lyngrafiek van die tendens vir â&#x20AC;&#x2122;n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016, waar die seisoenale variasie uitgehaal is Noudat ons weet wat die tendens en seisoenale indeks van ons tydreeks is, kan ons dit gebruik om vooruitskattings te maak. Om hierdie beraming te maak gebruik ons die lineĂŞre funksie đ?&#x2018;Ś = đ?&#x2018;?8 + đ?&#x2018;?( đ?&#x2018;Ľ en deel ons die waarde hiervan met die seisoenale indeks. Voorbeeld 4.4 (vervolg) Beraam die huiseienaar se kragverbruik (in kW) vir Januarie, Februarie, Maart en April van 2017 en neem die seisoenale indekse in berekening. Oplossing: Ons het hierbo đ?&#x2019;&#x161; = đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;?đ?&#x2019;&#x2122; gekry. Bereken nou die waardes waar đ?&#x2019;&#x2122; = đ?&#x;&#x2018;đ?&#x;&#x2022;, 38, 39 en 40:
Bladsy 188 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
đ?&#x2019;&#x161;đ?&#x;&#x2018;đ?&#x;&#x2022;
= đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x2022; = đ?&#x;? đ?&#x;&#x2018;đ?&#x;?đ?&#x;?, đ?&#x;&#x2019;đ?&#x;&#x2022;đ?&#x;&#x2018;đ?&#x;&#x2014;
đ?&#x2019;&#x161;đ?&#x;&#x2018;đ?&#x;&#x2013;
= đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x2013; = đ?&#x;? đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2018;, đ?&#x;&#x17D;đ?&#x;&#x201D;đ?&#x;&#x2019;đ?&#x;?
đ?&#x2019;&#x161;đ?&#x;&#x2018;đ?&#x;&#x2014;
= đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x2014; = đ?&#x;? đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2018;, đ?&#x;&#x201D;đ?&#x;&#x201C;đ?&#x;&#x2019;đ?&#x;&#x2018;
đ?&#x2019;&#x161;đ?&#x;&#x2019;đ?&#x;&#x17D;
= đ?&#x;? đ?&#x;&#x2018;đ?&#x;&#x17D;đ?&#x;&#x17D;, đ?&#x;&#x201D;đ?&#x;&#x2018;đ?&#x;&#x201D;đ?&#x;&#x201C; + đ?&#x;&#x17D;, đ?&#x;&#x201C;đ?&#x;&#x2014;đ?&#x;&#x17D;đ?&#x;? đ?&#x;&#x2019;đ?&#x;&#x17D; = đ?&#x;? đ?&#x;&#x2018;đ?&#x;?đ?&#x;&#x2019;, đ?&#x;?đ?&#x;&#x2019;đ?&#x;&#x2019;đ?&#x;&#x201C;
Pas nou hierdie waardes aan met die seisoenale indekse: đ?&#x2018;Ľ
đ?&#x2018;Ś
đ?&#x2018;&#x2020;
đ?&#x2018;ŚĂ&#x2014;đ?&#x2018;&#x2020;
37
1 322,4739
0,99204 1 322,4739Ă&#x2014;0,99204 = 1 311,9470
38
1 323,0641
0,99304 1 323,0641Ă&#x2014;0,99304 = 1 313,8556
39
1 323,6543
0,99254 1 323,6543Ă&#x2014;0,99254 = 1 313,7798
40
1 324,2445
1,00373 1 324,2445Ă&#x2014;1,00373 = 1 329,1839
Tabel 4.12: Beraming van Januarie, Februarie, Maart en April 2017 se kragverbruik (in kW), met seisoenale aanpassings
Let daarop dat hierdie vooruitskattings nie sikliese variasies en onreĂŤlmatige invloede insluit nie en ons maak die aanname dat die invloed hiervan minimaal is. Solank hierdie aanname waar is, kan hierdie vooruitskattings gebruik word. Verder maak ons staat daarop dat die tendens en seisoenale patroon aangaan soos in die verlede. Sodra een van hierdie elemente drasties verander, kan hierdie model nie verder gebruik word vir vooruitskattings nie. Hoe verder in die toekoms ons vooruitskattings maak, hoe groter is die onsekerheid waarmee ons dit doen. 4.6.5
Selfevalueringsvrae
Jy kan al die vrae aan die einde van Hoofstuk 15 in die handboek doen. Let net daarop dat ons die gemiddeld gebruik om die seisoenale indeks te bereken en nie die mediaan nie. 4.7
Samevatting
In hierdie studie-eenheid het ons gekyk na die verhouding van Ĺ&#x2030; afhanklike veranderlike (y) met die onafhanklike veranderlike (x). Hierdie verhouding is vir ons belangrik omdat die eienskappe daarvan gebruik word om besluite te neem.
Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
Bladsy 189
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Ons het begin deur die datareeks grafies voor te stel deur spreidingstippings- en lyngrafieke. Hierdie prentjie het ons gehelp om te sien of daar Ĺ&#x2030; moontlike verhouding bestaan tussen die twee veranderlikes. Ons kon selfs uit hierdie voorstellings aflei of dit Ĺ&#x2030; positiewe of negatiewe verhouding is en hoe sterk dit is. Om ons vermoedens te bevestig het ons die lineĂŞre funksie bereken vir die verhouding. Die funksie gee vir ons die snypunt (die waarde van đ?&#x2018;Ś waar đ?&#x2018;Ľ = 0), asook die helling van die regressielyn. Die volgende stap in hierdie proses was om te bepaal hoe sterk die verhouding tussen die veranderlikes is en ons het Pearson se korrelasiekoĂŤffisiĂŤnt gebruik om dit te bereken. Die kwadraat van die korrelasiekoĂŤffisiĂŤnt gee vir ons die bepaaldheidskoĂŤffisiĂŤnt. Die bepaaldheidskoĂŤffisiĂŤnt wys hoeveel van die variasie in die afhanklike veranderlike (y) deur die onafhanklike veranderlike (x) beskryf word. Al wat nou oorbly, is om te kyk of die verhouding tussen hierdie twee veranderlikes statisties betekenisvol is. Ons gebruik hipotesetoetsing om dit te doen. Die toetsstatistiek vir hierdie hipotesetoets maak gebruik van die student-t-verdeling. Die resultate van al die bogenoemde berekeninge stel ons in staat om die verhouding tussen die twee veranderlikes te beskryf en, meer belangrik, afleidings te maak op grond daarvan. Ons het toe vandaar oorgegaan na Ĺ&#x2030; spesiale verhouding tussen die afhanklike veranderlike (y) en die onafhanklike veranderlike tyd (x). Om hierdie verhouding beter te beskryf het ons na die elemente van Ĺ&#x2030; tydreeks gekyk, naamlik die tendens (T), sikliese variasie (C), seisoenale variasie (S) en die onreĂŤlmatige invloede (I). Met tendensanalise het ons die tendens bereken deur middel van bewegende gemiddelde, maar ook met Ĺ&#x2030; lineĂŞre regressiemodel. Daarna het ons seisoenale analise gedoen waar ons die seisoenale variasie bereken het en toe Ĺ&#x2030; indeks vir die seisoenale effek. Dit het ons gehelp om die seisoenale variasie uit die tydreeksdata te haal om die langtermyntendens te beraam en om vooruitskattings te maak vir toekomstige periodes. Hierdie vak se doel is om jou Ĺ&#x2030; breĂŤ blootstelling te gee aan Ĺ&#x2030; verskeidenheid velde binne statistiek, as Ĺ&#x2030; wetenskap. Dit vind sy oorsprong in die wiskundige opsomming en verwerking van data, maar het gepoog om dit prakties toepasbaar te maak in die interpretering van resultate en afleidings ten opsigte van die groter populasie. Aan die einde van hierdie vak behoort Ĺ&#x2030; gemiddeld nie net bloot meer Ĺ&#x2030; waarde te wees nie, maar eerder een deeltjie van Ĺ&#x2030; groter prentjie. Dit is soos Ĺ&#x2030; legkaart: hoe meer legkaartstukkies jy het, hoe meer sin maak die prentjie, maar dan moet jy weet waar elke legkaartstukkie kom...
Bladsy 190 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise
GQM105 Inleiding tot elementêre kwantitatiewe metodes Gebruik wat jy in hierdie vak geleer het om seker te maak dat al die syfertjies en statistieke wat die wêreld na jou kant toe gooi, jou nie mislei nie, maar dat jy weet wat hulle beteken. Gebruik hierdie kennis om kwantitatiewe data op te som en te verwerk sodat jy betroubare afleidings kan maak op grond daarvan. Dit is heel moontlik dat jy oorweldig voel deur al die onderwerpe wat tydens die vak behandel is, maar dit begin eers werklik waarde kry wanneer jy dit by jou huis, in jou werk en ander areas van jou lewe gebruik. Beskou hierdie materiaal as ʼn paar stukkies gereedskap, in jou gereedskapkas wat jy kan gebruik: hoe meer jy dit gebruik, hoe vaardiger raak jy daarmee. Moenie dat dit net lê en stof opgaar nie, gebruik dit!
Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise
Bladsy 191
GQM105 Inleiding tot elementêre kwantitatiewe metodes
AFRIKAANS/ENGELSE TERME Afrikaans
Engels
Aanvaardingsarea
Region of acceptance
Additiewe tydreeksmodel
Additive time series model
Afgeleide statistiek
Inferential statistics
Afhanklike veranderlike
Dependent variable
Alternatiewe hipotese
Alternative hypothesis
Analise van variansie
Analysis of variance (ANOVA)
Bepaaldheidskoëffisiënt
Coefficient of determination
Beskrywende statistiek
Descriptive statistics
Bewegende gemiddeld
Moving average
Binominale waarskynlikheidsverdeling
Binominal probability distribution
Data
Data
Datapunt
Data point
Dataverwerkingsmodule
Data Analysis Tool/Toolkit
Diskrete data
Discrete data
Eenvoudige ewekansige steekproefneming
Simple random sampling
Ewekansig
Random
Frekwensieverdeling
Frequency distribution
Gemiddeld
Mean
Gepaarde t-toets
Match pair t-test
Geriefsteekproefneming
Convenience sampling
Gesamentlik uitputbaar
Collectively exhaustive
Gesamentlike waarskynlikhede
Joint probabilities
Gesentraliseerde bewegende gemiddeld
Centralised moving average
Gestapelde kolomgrafiek
Stacked bar chart
Bladsy 192
Afrikaans/Engelse terme
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Gestratifiseerde steekproefneming
Stratified sampling
Helling
Grade/Slope
Hipotese
Hypothesis
Hipotesetoets
Hypothesis test
Histogram
Histogram
Houer-en-punt-stippingsgrafiek
Box plot
Koëffisiënt van determinasie
Coefficient of determination
Kolomgrafiek
Bar chart
Kombinasie
Combination
Kontinue data
Continuous data
Korrelasiekoëffisiënt
Correlation coefficient
Kritieke waarde
Critical value
Kruisfrekwensietabel
Cross frequency table
Kumulatiewe frekwensie
Cumulative frequency
Kumulatiewe frekwensieveelhoek
Cumulative frequency polygon
Kumulatiewe waarskynlikheid
Cumulative probability
Kurtose
Kurtosis
Kwalitatiewe data
Qualitative data
Kwantiel
Quantile
Kwantitatiewe data
Quantitative data
Kwartiel
Quartile
Kwotasteekproefneming
Quota sampling
Limiete
Limits
Lineêre funksie
Linear function
Lyngrafiek
Line graph
Mediaan
Median
Afrikaans/Engelse terme
Bladsy 193
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Meervoudige kolomgrafiek
Multiple bar chart
Meetkundige gemiddeld
Geometric mean
Metode van die kleinste kwadrate
Method of the least squares
Modus
Mode
Multiplikatiewe tydreeksmodel
Multiplicative time series model
Nie-ewekansig
Non random
Niewaarskynlikheidsteekproefneming
Non-probability sampling
Normaalverdeling
Normal distribution
Observasie
Observation
Nulhipotese
Null hypothesis
Onafhanklike veranderlike
Independent variable
Onderling uitsluitend
Mutually exclusive
Onreëlmatige variasies
Random effects/Irregular fluctuations
Oordeelsteekproefneming
Judgement sampling
Opname
Survey
Pearson se korrelasiekoëffisiënt
Pearson’s Correlation Coefficient
Peil van betekenis
Level of significance
Permutasie
Permutation
Persentiel
Percentile
Poisson-verdeling
Poisson probability distribution
Populasie
Population
Postulaat
Postulate
Proporsie
Proportion
Puntberaming
Point estimation
Reikwydte
Range
Rekenkundige gemiddeld
Mean
Bladsy 194
Afrikaans/Engelse terme
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Samevoeging
Union
Seisoenale indeks
Seasonal index
Seisoenaliteit/Seisoenale variasie
Seasonality/Seasonal variations
Sigblad
Spreadsheet
Sikliese variasies
Cyclical variations
Sirkelgrafiek
Pie chart
Skeefheid
Skewness
Sneeubalsteekproefneming
Snowball sampling
Snyding/Snypunt
Intersection
Spreidingstippingsgrafiek
Scatter plot diagram
Standaardafwyking/Standaardfout
Standard deviation
Statisties betekenisvol
Statistically significant
Statisties onafhanklik
Statistically independent
Steekproef
Sample
Steekproefeenheid
Sampling unit
Steekproefmetode
Sampling technique
Steekproefruimte
Sample space
Stelling
Theorem
Stelselmatige steekproefneming
Systematic sampling
Stogastiese veranderlike
Random variable
Tendens
Trend
Tendenslyn
Trend line
Toetsstatistiek
Test statistic
Trossteekproefneming
Cluster sampling
Tydreeks
Time series
Uitskieters
Outliers
Afrikaans/Engelse terme
Bladsy 195
GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes
Variansie
Variance
Vensterperiode
Window period
Verhouding
Ratio
Verhouding
Relationship
Vertrouensinterval
Confidence interval
Verwagte waarde
Expected value
Verwerpingsarea
Region of rejection
Vlak van vertroue/sekerheid
Confidence level
Vooruitskatting
Forecasting
Voorwaardelike waarskynlikheid
Conditional probabilities
Vraelys
Questionnaire
Waarskynlikheid
Probability
Waarskynlikheidsboomdiagram
Probability tree
Waarskynlikheidsteekproefneming
Probability sampling
Bladsy 196
Afrikaans/Engelse terme
Elementêre Kwantitatiewe Metodes Handboek • Wegner, T. 2016. Applied business statistics. 4th Ed. Claremont: Juta.
E
lementêre kwantitatiewe metodes behels ʼn aantal statistiese tegnieke wat die interpretasie van ʼn verskeidenheid data vergemaklik. Die tipes en volumes data wat deur organisasies versamel word, maak dit soms moeilik of onmoontlik om hierdie data deur blote observasies te interpreteer. ʼn Verskeidenheid statistieke en statistiese berekeninge maak hierdie interpretasie moontlik en makliker.
om die data te verstaan.
Hierdie vak word hoofsaaklik in vier afdelings verdeel, naamlik: • basiese beginsels en beskrywende statistiek (beskrywende statistiek); • waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle (afgeleide statistiek); • hipotesetoetsing (afgeleide statistiek); en • eenvoudige lineêre regressie en korrelasieanalise (statistiese modellering).
Beraamde statistieke is in werklikheid ʼn geleerde raaiskoot en as ons dit wil gebruik, is dit belangrik dat ons darem bietjie vertroue daarin moet hê, daarom doen ons hipotesetoetse in studie-eenheid 3. ʼn Hipotesetoets is ʼn vyfstapproses waardeur ons die betekenisvolheid van ʼn statistiek toets. Die uitslag van so ʼn toets gaan ʼn navorser vertroue gee in ʼn statistiese resultaat of nie en dit is uiters belangrik om die regte gevolgtrekking te maak op grond van die resultaat wat verkry is.
Inleiding tot elementêre kwantitatiewe metodes se doel is om jou bloot te stel aan die hulpmiddels en tegnieke om data te verwerk tot bruikbare inligting.
Dit is baie keer noodsaaklik om sakebesluite te neem op grond van vooruitskattings van waardes wat tans onbekend is. Om hierdie tipe vooruitskattings te kan maak, is dit belangrik om die data te verstaan en om die verhouding tussen stogastiese veranderlikes te begryp. Hierdie is die derde en laaste been van statistiek waarna gekyk word, naamlik statistiese modellering. In studie-eenheid 4 kyk ons na eenvoudige lineêre regressie, korrelasies en tydreekse.
Studie-eenheid 1 fokus op die basiese beginsels en beskrywende statistiek. Hierdie afdeling behandel begrippe soos stogastiese veranderlikes, populasies, steekproewe ensovoorts en hoe hierdie statistieke gebruik kan word om ons te help
Wanneer ons die basiese beginsels en beskrywende statistiek onder die knie het, sal ons in studie-eenheid 2 kyk na waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle. Hierdie drie temas gebruik beskrywende statistiek om afleidings te maak van die groter populasie waarvan hulle deel is.
www.akademia.ac.za