GQM105 - Elementêre Kwantitatiewe Metodes

Page 1

Willem Scholtz


c Kopiereg 2017 Onder redaksie van: Paul JN Steyn, BA (PU vir CHO), THOC (POK), DEd (Unisa) Skrywer: Willem Scholtz Onderwysontwerp, bladuitleg en taalversorging: Dr. Daleen van Niekerk ’n Publikasie van Akademia. Alle regte voorbehou. Adres: Von Willichlaan 284, Die Hoewes, Centurion Posadres: Posbus 11760, Centurion, 0046 Tel: 0861 222 888 E-pos: diens@akademia.ac.za Webtuiste: www.akademia.ac.za

Geen gedeelte van hierdie boek mag sonder die skriftelike toestemming van die uitgewers gereproduseer of in enige vorm of deur enige middel weergegee word nie, hetsy elektronies of deur fotokopiëring, plaat- of bandopnames, vermikrofilming of enige ander stelsel van inligtingsbewaring nie. Enige ongemagtigde weergawe van hierdie werk sal as ’n skending van kopiereg beskou word en die dader sal aanspreeklik gehou word onder siviele asook strafreg.

www.akademia.ac.za


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

INHOUDSOPGAWE

Inleiding .................................................................................................................................. 5 Vakleeruitkomste ................................................................................................................... 8 Woordomskrywing vir evaluering ........................................................................................ 9

Studie-eenheid 1: Basiese beginsels en beskrywende stratitiek ................................... 11 1.1

Studie-eenheid leeruitkomste ................................................................................. 11

1.2

Voorgeskrewe handboek ........................................................................................ 11

1.3

Hoe kan jy jou begrip verbeter? .............................................................................. 12

1.4

Inleiding ................................................................................................................... 16

1.5

Basiese begrippe en beginsels van statistiek ......................................................... 17

1.5.1

Wat is statistiek? .............................................................................................. 17

1.5.2

Statistiese begrippe en notasie ........................................................................ 19

1.5.3

Statistiek en rekenaars .................................................................................... 21

1.5.4

Data ................................................................................................................. 21

1.5.5

Selfevalueringsvrae ......................................................................................... 25

1.6

Steekproefnemingsmetodes ................................................................................... 26

1.6.1

Niewaarskynlikheidsteekproefneming ............................................................. 26

1.6.2

Waarskynlikheidsteekproefneming .................................................................. 28

1.6.3

Onsydigheid ..................................................................................................... 30

1.6.4

Sentrale limietstelling (Central limit theorem) .................................................. 30

1.6.5

Selfevalueringsvrae ......................................................................................... 31

1.7

Beskrywende statistiek ........................................................................................... 31

1.7.1

Grafiese beskrywende statistiek vir kategoriese data ...................................... 31

1.7.2

Grafiese voorstelling van numeriese data: een veranderlike ........................... 35

1.7.3

Grafiese voorstelling van numeriese data: twee veranderlikes ....................... 38

1.7.4

Selfevalueringsvrae ......................................................................................... 41

1.8

Numeriese beskrywende statistiek ......................................................................... 41

Inhoudsopgawe

Bladsy 1


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.8.1

Maatstawwe van lokaliteit ................................................................................ 41

1.8.2

Nie-sentrale maatstawwe van lokaliteit ............................................................ 51

1.8.3

Maatstawwe van spreiding .............................................................................. 55

1.8.4

Maatstawwe van skeefheid .............................................................................. 64

1.8.5

Keuse van statistiek ......................................................................................... 69

1.8.6

Beskrywende statistiek in MS Excel en die data-analise-invoegsel ................ 70

1.8.7

Selfevalueringsvrae ......................................................................................... 71

1.9

Samevatting ............................................................................................................ 72

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming .......... 73 2.1

Studie-eenheid leeruitkomste ................................................................................. 73

2.2

Voorgeskrewe handboek ........................................................................................ 74

2.3

Hoe kan jy jou begrip verbeter? .............................................................................. 74

2.4

Inleiding ................................................................................................................... 76

2.5

Waarskynlikhede ..................................................................................................... 76

2.5.1

Basiese waarskynlikhede ................................................................................ 76

2.5.2

Waarskynlikheidsreëls ..................................................................................... 78

2.5.3

Belangrike konsepte van waarskynlikhede ...................................................... 80

2.5.4

Berekening van waarskynlikhede .................................................................... 83

2.5.5

Waarskynlikheidsvertakkingdiagram ............................................................... 88

2.5.6

Telreëls ............................................................................................................ 89

2.5.7

Selfevalueringsvrae ......................................................................................... 93

2.6

Waarskynlikheidsverdelings .................................................................................... 93

2.6.1

Stogastiese veranderlikes ................................................................................ 94

2.6.2

Diskrete waarskynlikheidsverdelings ............................................................... 95

2.6.3

Kontinue waarskynlikheidsverdelings ............................................................ 102

2.6.4

Selfevalueringsvrae ....................................................................................... 116

2.7

Beraming ............................................................................................................... 116

2.7.1

Bladsy 2

Puntberamings ............................................................................................... 117

Inhoudsopgawe


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 2.7.2

Vertrouensintervalle ....................................................................................... 118

2.7.3

Selfevalueringsvrae ....................................................................................... 125

2.8

Samevatting .......................................................................................................... 125

Studie-eenheid 3: Hipotesetoetsing ................................................................................ 127 3.1

Studie-eenheid leeruitkomste ............................................................................... 127

3.2

Voorgeskrewe handboek ...................................................................................... 128

3.3

Hoe kan jy jou begrip verbeter? ............................................................................ 128

3.4

Inleiding ................................................................................................................. 129

3.5

Basiese begrippe van hipotesetoetsing ................................................................ 129

3.5.1

Die nul en alternatiewe hipotese .................................................................... 129

3.5.2

Peil van betekenis đ?œś ...................................................................................... 130

3.5.3

Tipe I- en II-foute ........................................................................................... 130

3.5.4

Toetsstatistiek ................................................................................................ 131

3.5.5

Kritieke waarde .............................................................................................. 131

3.5.6

đ?’‘-waarde ........................................................................................................ 131

3.6

Die proses van hipotesetoetsing ........................................................................... 131

3.6.1

Stap 1: Definieer die nulhipotese en die alternatiewe hipotese ..................... 131

3.6.2

Stap 2: Bepaal die aanvaardingsarea vir die nulhipotese .............................. 133

3.6.3

Stap 3: Bereken die toetsstatistiek ................................................................ 135

3.6.4

Stap 4: Vergelyk die steekproef se toetsstatistiek met die aanvaardingsarea vir

die nulhipotese ............................................................................................................. 136 3.6.5 3.7

Stap 5: Maak ʼn gevolgtrekking ...................................................................... 136

Praktiese voorbeelde van hipotesetoetse ............................................................. 136

3.7.1

Hipotesetoets vir ʼn populasiegemiddeld đ?? waar die populasie se

standaardafwyking đ??ˆ bekend is .................................................................................... 136 3.7.2

Hipotesetoets vir ʼn populasiegemiddeld đ?? waar die populasie se

standaardafwyking đ??ˆ onbekend is ................................................................................ 139 3.7.3 3.8

Hipotesetoetsing deur gebruik te maak van die đ?’‘-waarde ............................ 142

Selfevalueringsvrae .............................................................................................. 145

Inhoudsopgawe

Bladsy 3


GQM105 Inleiding tot elementêre kwantitatiewe metodes 3.9

Samevatting .......................................................................................................... 146

Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise ...................... 147 4.1

Studie-eenheid leeruitkomste ............................................................................... 147

4.2

Voorgeskrewe handboek ...................................................................................... 147

4.3

Hoe kan jy jou begrip verbeter? ............................................................................ 148

4.4

Inleiding ................................................................................................................. 150

4.5

Eenvoudige lineêre regressie-analise ................................................................... 150

4.5.1

Spreidingstipping ........................................................................................... 150

4.5.2

Lineêre regressiemodelle .............................................................................. 152

4.5.3

Pearson se korrelasiekoëffisiënt .................................................................... 157

4.5.4

Bepaaldheidskoëffisiënt ................................................................................. 160

4.5.5

Toets om die betekenisvolheid van die regressiemodel te bepaal ................ 161

4.5.6

Selfevalueringsvrae ....................................................................................... 164

4.6

Tydreeksanalise .................................................................................................... 164

4.6.1

Stipping van tydreekse .................................................................................. 165

4.6.2

Elemente van tydreeksanalise ....................................................................... 166

4.6.3

Tendensanalise ............................................................................................. 170

4.6.4

Seisoenale analise ......................................................................................... 181

4.6.5

Selfevalueringsvrae ....................................................................................... 189

4.7

Samevatting .......................................................................................................... 189

Afrikaans/Engelse terme .................................................................................................. 192

Bladsy 4

Inhoudsopgawe


GQM105 Inleiding tot elementêre kwantitatiewe metodes

INLEIDING Elementêre kwantitatiewe metodes behels ʼn aantal statistiese tegnieke wat die interpretasie van ʼn verskeidenheid data vergemaklik. Die tipes en volumes van data wat deur organisasies versamel word, maak dit soms moeilik of onmoontlik om hierdie data deur blote observasies te interpreteer. ʼn Verskeidenheid statistieke en statistiese berekeninge maak hierdie interpretasie moontlik en makliker. Daar is drie verskillende vlakke/komponente, soos aangedui in Figuur 1.1, waarop statistiek toegepas kan word: Die eerste is op die steekproefvlak, waar daar gefokus word op die versamelde data en om ʼn profiel te skep op grond daarvan (grafiese en numeriese beskrywende statistiek). Op die tweede vlak word hierdie beskrywende statistiek gebruik om afleidings te maak oor die groter populasie (afgeleide statistiek). Op die derde vlak word die beskrywende statistiek gebruik om statistiese modelle te ontwikkel wat van toepassing is op die populasie.

Figuur 1.1: Konseptuele oorsig van die statistiese komponente (Wegner, 2016: 7) Hierdie vak word hoofsaaklik in vier afdelings verdeel, naamlik: •

basiese beginsels en beskrywende statistiek (beskrywende statistiek);

Inleiding

Bladsy 5


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle (afgeleide statistiek);

hipotesetoetsing (afgeleide statistiek); en

eenvoudige lineêre regressie- en korrelasie-analise (statistiese modellering).

Soos wat ons oor en oor hoor en lees, is inligting data wat tot só ʼn mate verwerk is dat dit vir ons waarde het. Die doel van inleiding tot elementêre kwantitatiewe metodes is om jou bloot te stel aan die hulpmiddels en tegnieke om dit te kan doen. Soos hierbo gemeld, sal Studie-eenheid 1 op die basiese beginsels en beskrywende statistiek fokus. Hierdie afdeling behandel begrippe soos stogastiese veranderlikes, populasies, steekproewe, ensovoorts, en hoe hierdie statistieke gebruik kan word om ons te help om die data te verstaan, met ander woorde hoe om die waarde wat daarin opgesluit is te ontgin. Ons gaan dus kyk na die data wat versamel is deur middel van ʼn steekproef en die beskrywende statistiek wat ons meer gaan vertel van daardie groep (verwys na Figuur 1.1). Wanneer ons die basiese beginsels en beskrywende statistiek onder die knie het, sal ons kyk na waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle. Hierdie drie temas gebruik beskrywende statistiek om afleidings te maak van die groter populasie waarvan hulle deel is (verwys na Figuur 1.1). Omdat dit meestal nie moontlik is om data van die hele populasie te versamel nie, is statistieke soos die populasiegemiddeld en standaardafwyking nie bekend nie en moet ons dit kan beraam. Beraamde statistieke is op die einde van die dag ʼn geleerde raaiskoot en as ons dit wil gebruik, is dit belangrik dat ons darem ’n bietjie vertroue daarin moet hê; daarom doen ons hipotesetoetse in Studie-eenheid 3. ʼn Hipotesetoets is ʼn vyfstapproses waardeur ons die betekenisvolheid van ʼn statistiek toets. Die uitslag van so ʼn toets gaan ʼn navorser vertroue gee in ʼn statistiese resultaat of nie, en dit is uiters belangrik om die regte gevolgtrekking te maak op grond van die resultaat wat verkry is. Dit is baie keer noodsaaklik om sakebesluite te neem op grond van vooruitskattings van waardes wat tans onbekend is. Om hierdie tipe vooruitskattings te kan maak is dit belangrik om die data te verstaan en om die verhouding tussen stogastiese veranderlikes te begryp. Hierdie is die derde en laaste been van statistiek waarna gekyk word, naamlik statistiese modellering (verwys na Figuur 1.1). Om hierdie rede word daar in Studie-eenheid 4 gekyk na eenvoudige lineêre regressie, korrelasies en tydreekse. Regressie-analise kyk na ʼn veranderlike en die ander veranderlikes wat daarmee verband hou. Hierdie verhouding staan bekend as ʼn “statistiese model”. Korrelasies sal ook behandel word omdat dit ons help om die krag van ʼn verhouding te bepaal.

Bladsy 6

Inleiding


GQM105 Inleiding tot elementêre kwantitatiewe metodes Voorgeskrewe handboek Vir hierdie vak is die volgende handboek voorgeskryf: Wegner, T. 2016. Applied business statistics. 4de uitgawe. Claremont: Juta. Die gedeeltes wat betrekking het op die inhoud van die studie-eenhede sal telkens aangedui word. Die gids sal jou dan deur die handboek begelei en poog om moeilike gedeeltes toe te lig; om aan te vul waar nodig en om die belangrike gedeeltes uit te wys. Vir eksamendoeleindes moet jy dus die voorgeskrewe gedeeltes in die handboek, asook hierdie begeleidingsgids bestudeer. Aanbevole bronne •

Steyn, F., Smit, C. & Vorster, C., reds. English-Afrikaans Glossary Of Statistical Terms, 2009. Aanlyn beskikbaar by https://www.scribd.com/document/116733802/Eng-Afr-fin

http://www.sastat.org.za/sites/default/files/documents/files/Eng_Afr_fin.pdf

http://www.sastat.org.za/sites/default/files/documents/files/Afr_Eng_fin.pdf

(Hierdie bronne is aanlyn beskikbaar en verskaf Afrikaanse vertalings vir Engelse statistiese terme en selfs eenvoudige definisies. Dit is ʼn baie handige bron wanneer ʼn mens twyfel oor die korrekte vertaling, konteks en betekenis.)

Inleiding

Bladsy 7


GQM105 Inleiding tot elementêre kwantitatiewe metodes

VAKLEERUITKOMSTE Kennis en begrip Na voltooiing van die vak INLEIDING TOT ELEMENTÊRE KWANTITATIEWE METODES sal jy in staat wees om jou kennis en begrip te demonstreer van: •

Basiese beginsels en beskrywende statistiek

Waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle

Hipotesetoetsing

Eenvoudige lineêre regressie- en korrelasie-analise

Vaardighede Jy sal ook in staat wees om: •

data grafies voor te stel;

data deur middel van basiese numeriese beskrywende statistiek voor te stel;

basiese waarskynlikheidsberekeninge te doen;

vertrouensintervalle op te stel;

ʼn verskeidenheid tipes hipoteses te toets;

regressie-analise te verduidelik en ʼn eenvoudige lineêre regressiemodel op te stel; en

ʼn korrelasiekoëffisiënt te bereken, te interpreteer en ʼn te hipotesetoets kan doen om die betekenisvolheid van die regressiemodel te bepaal.

Bladsy 8

Vakleeruitkomste


GQM105 Inleiding tot elementêre kwantitatiewe metodes

WOORDOMSKRYWING VIR EVALUERING In die afdeling oor selfevaluering, asook in die werkopdragte sal daar van jou verwag word om sekere take te verrig. Dit is belangrik dat jy presies weet wat van jou verwag word. Die woordelys hieronder sal jou hiermee help. Werkwoord

Omskrywing

Lys

Lys die name/items wat bymekaar hoort

Identifiseer

Eien (ken uit) en selekteer die regte antwoorde

Verduidelik

Ondersoek die moontlikhede, oorweeg dit en skryf dan jou antwoord (verklaring/verduideliking) neer

Beskryf

Omskryf die konsep of woorde duidelik

Kategoriseer/klassifiseer

Bepaal tot watter klas, groep of afdeling bepaalde items/voorwerpe behoort

Analiseer

Om iets te ontleed

Evalueer

Bepaal die waarde van ʼn stelling/stelsel/beleid/ens.

Toepas

Pas die teoretiese beginsels toe in ʼn praktiese probleem

Hersien

Evalueer, verbeter en/of wysig ʼn beleid/dokument/stelsel/ens.

Woordomskrywing vir evaluering

Bladsy 9


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Notas

Bladsy 10

Woordomskrywing vir evaluering


GQM105 Inleiding tot elementêre kwantitatiewe metodes

STUDIE-EENHEID 1: BASIESE BEGINSELS EN BESKRYWENDE STRATITIEK 1.1

Studie-eenheid leeruitkomste

Kennis en begrip Na voltooiing van Studie-eenheid 1 sal jy in staat wees om jou kennis en begrip van die volgende te demonstreer: •

Basiese statistiese begrippe

Steekproefnemingsmetodes

Grafiese beskrywende statistiek

Numeriese beskrywende statistiek

Vaardighede Jy sal ook in staat wees om: •

basiese statistiese begrippe te omskryf;

ʼn keuse tussen die onderskeie ewekansige en nie-ewekansige steekproefnemingsmetodes te kan maak;

ʼn keuse tussen ʼn verskeidenheid grafieke en tabelle te maak om verskillende data grafies voor te stel;

om data te versamel en voor te berei vir statistiese verwerking;

verskillende numeriese beskrywende statistieke te bereken; en

ʼn keuse tussen ʼn verskeidenheid numeriese beskrywende statistieke te maak om data voor te stel.

1.2

Voorgeskrewe handboek

Wegner, T. 2016. Applied business statistics. 4de uitgawe. Claremont: Juta. Vir die doeleindes van hierdie studie-eenheid moet jy die volgende paragrawe bestudeer: Hoofstuk 1 paragrawe 1.1-1.11 Hoofstuk 2 paragrawe 2.1-2.6 Hoofstuk 3 paragrawe 3.1-3.10 Hoofstuk 6 paragrawe 6.1-6.2 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 11


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.3

Hoe kan jy jou begrip verbeter?

Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord

Omskrywing

Afgeleide statistiek

Statistieke wat gebruik word om gevolgtrekkings ten opsigte van elemente in die populasie te maak.

Beskrywende statistiek

Statistieke wat bereken word met die steekproefdata, soos die gemiddeld, variansie, standaardafwyking ensovoorts.

Data

Die fisiese waardes (getalle) wat aan veranderlikes toegeken word.

Datapunt

Die verteenwoordiging van ʼn spesifieke observasie op ʼn grafiek.

Diskrete data

Data wat slegs uit heelgetalle bestaan. (Daar is dus geen waardes tussen byvoorbeeld 1 en 2 nie.)

Eenvoudige ewekansige

Eenvoudige ewekansige steekproefneming is die algemeenste

steekproefneming

steekproefnemingsmetode wat gebruik word en dit is waar elke steekproefeenheid presies dieselfde waarskynlikheid het om gekies te word.

Ewekansig

Om dieselfde kans/waarskynlikheid te hê.

Frekwensieverdeling

ʼn Opsomming van die observasies van ʼn stogastiese veranderlike en die aantal kere wat dit waargeneem is.

Gemiddeld

Die verwagte waarde van ʼn stogastiese veranderlike.

Geriefsteekproefneming

ʼn Nie-ewekansige steekproefnemingsmetode waar die navorser die data wat beskikbaar is of wat maklik verkry kan word, gebruik.

Gestapelde

ʼn Kolomgrafiek waar die kolomme meer as een kategoriese

kolomgrafiek

veranderlike voorstel wat bo-op mekaar gestapel is.

Gestratifiseerde

ʼn Ewekansige steekproefnemingsmetode waar die populasie in

steekproefneming

twee of meer eksklusiewe groepe (strata) verdeel word. Elke groep/stratum bevat homogene elemente (die elemente is soortgelyk aan mekaar wanneer daar gekyk word na die veranderlike wat bestudeer word. Dan word steekproefeenhede ewekansig uit elke stratum gekies.

Bladsy 12 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Histogram

ʼn Spesiale kolomgrafiek wat die frekwensie van al die waargenome observasies illustreer. Die kolomme se breedte kan verskil, maar die oppervlak van die kolom is proporsioneel tot die frekwensie van die observasies.

Houer-en-punt-

ʼn Grafiek wat die verspreiding van ʼn steekproef se observasies

stippingsgrafiek

voorstel. Dit word saamgestel uit die kleinste waarde, eerste kwartiel, mediaan, derde kwartiel en die grootste waarde.

Kolomgrafiek

ʼn Grafiek waar die kolomme ʼn kategoriese veranderlike voorstel.

Kontinue data

Data wat uit reële getalle bestaan. Daar is dus, byvoorbeeld, ʼn oneindige hoeveelheid waardes tussen 1 en 2 (bv. 1.0001).

Kruisfrekwensietabel

ʼn Kruisfrekwensietabel gee die frekwensies van twee kategoriese stogastiese veranderlikes, waar die een veranderlike die kolomme gee en die ander een die rye.

Kumulatiewe

Vir ʼn steekproef van numeriese data is die kumulatiewe

frekwensie

frekwensie van x die totale aantal observasies wat kleiner of gelyk aan x is.

Kumulatiewe

ʼn Spesiale lyngrafiek wat die kumulatiewe waardes van ʼn

frekwensieveelhoek

stogastiese veranderlike voorstel. Hierdie kurwe word gekenmerk dat die volgende datapunt altyd hoër sal wees as die vorige, waar die laaste datapunt gelyk aan die som van al die observasies is.

Kurtose

Skerpheid van ʼn verdeling se draaipunt.

Kwalitatiewe data

Nie-numeriese data.

Kwantiel

Enigeen van die verdelingspunte wat die frekwensieverdeling van ’n steekproef in gelyke onderdele of intervalle verdeel, bv. desiele, kwartiele of persentiele.

Kwantitatiewe data

Numeriese data.

Kwartiel

Enigeen van die verdelingspunte wat die frekwensieverdeling van ’n steekproef in vier gelyke onderdele of intervalle verdeel.

Kwotasteekproefneming

ʼn Nie-ewekansige steekproefnemingsmetode waar die navorser

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 13


GQM105 Inleiding tot elementêre kwantitatiewe metodes nie al die beskikbare steekproefeenhede wil gebruik nie, maar hulle in kategorieë verdeel. Lyngrafiek

Grafiek verkry deur verskillende punte, wat veranderlikes voorstel, te verbind deur middel van ’n gebroke of reguit lyn.

Mediaan

Die getal wat presies in die middel is van al die observasies.

Meervoudige

ʼn Kolomgrafiek wat twee kategorieë (in plaas van een) se

kolomgrafiek

frekwensies voorstel, bv. ouderdomme vir mans en vroue.

Meetkundige gemiddeld

Die gemiddeld van ʼn stel positiewe waardes tussen 0 en 1.

Modus

Die modus is die observasie wat die meeste kere in die steekproef voorkom.

Nie-ewekansig

Waar die kans/waarskynlikheid van observasies nie dieselfde is nie.

Niewaarskynlikheid-

Enige steekproefnemingsmetode waar die steekproefeenhede

steekproefneming

nie ewekansig gekies word nie.

Observasie

Die resultaat van ʼn eksperiment of toets waarin ʼn veranderlike (numeries of kategories) gemeet is.

Oordeelsteekproef-

ʼn Nie-ewekansige steekproefnemingsmetode waar ʼn navorser

neming

gebruik maak van steekproefeenhede wat met die hand gekies is deur ʼn kenner gebaseer op die bruikbaarheid daarvan.

Opname

Insameling van gegewens, veral deur middel van vraelyste, of resultaat wat op grond daarvan verkry word.

Persentiel

Enigeen van die verdelingspunte wat die frekwensieverdeling van ’n steekproef in honderd gelyke onderdele of intervalle verdeel.

Populasie

Omvattende geheel van eenhede, soos individue, items, of dergelike eenhede waaruit ’n steekproef vir statistiese doeleindes geneem word of geneem kan word.

Reikwydte

Die verskil tussen die maksimum en minimum waardes in ʼn steekproef.

Rekenkundige

Die verwagte waarde van ʼn stogastiese veranderlike.

gemiddeld

Bladsy 14 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Sigblad

ʼn Blad met veelvuldige selle in ’n matriks van rye en kolomme, waarvan die inhoud van enige sel óf onafhanklik, óf in terme van die inhoud van ander selle gespesifiseer kan word, wat veral gebruik word om data te analiseer of om bewerkings mee uit te voer, en waarvan die inligting op die hele blad outomaties aangepas of herbewerk word wanneer ’n verandering in ’n enkele sel aangebring word.

Sirkelgrafiek

ʼn Grafiek wat verskillende proporsies van ʼn geheel (100%) voorstel.

Skeefheid

Die verdeling van ʼn veranderlike wat nie simmetries verdeel is om die gemiddeld of mediaan nie.

Sneeubalsteekproef-

ʼn Nie-ewekansige steekproefnemingsmetode waar ʼn

neming

steekproefeenheid geïdentifiseer word, gebaseer op bepaalde eienskappe, en hy/sy gevra word om ander mense, wat ook aan hierdie kriteria voldoen, aan te beveel om ook deel te neem aan die opname.

Standaardafwyking/

Die vierkantswortel van die variansie.

Standaardfout Steekproef

ʼn Kleiner groep wat vanuit ʼn populasie verkry word. Eienskappe van die steekproef kan gemeet word en word gebruik om gevolgtrekkings van dieselfde eienskappe van die populasie te maak.

Steekproefeenheid

ʼn Persoon of onderwerp wat ingesluit word by die steekproef.

Steekproefmetode

Die wyse waarop ʼn steekproef beplan en die steekproefeenhede uit die populasie gekies word.

Stelselmatige

ʼn Ewekansige steekproefnemingsmetode waar ’n

steekproefneming

steekproefeenheid gekies word en daarna elke soveelste steekproefeenheid.

Stogastiese

Enige eienskap/veranderlike, van ʼn populasie wat van belang

veranderlike

is, wat willekeurig versprei is.

Trossteekproefneming

ʼn Ewekansige steekproefnemingsmetode wat soortgelyk is aan gestratifiseerde steekproefneming. Die groepe/trosse is steeds

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 15


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes eksklusief, met ander woorde ʼn eenheid kan nie in meer as een groep/tros val nie. Die groepe/trosse is homogeen, met ander woorde soortgelyk aan mekaar. Die navorser sal ʼn steekproef (đ?‘˜) uit die groter populasie (đ??ž) van groepe/trosse trek. Uitskieter

ʼn Observasie wat drasties verskil van die ander observasies in ʼn datastel.

Variansie

Die variansie is ʼn maatstaf van hoe ver al die observasies �( , �* , �+ , ‌ , �- verwyder is vanaf die sentrale waarde van die datastel, die steekproefgemiddeld � . Uit hierdie stelling kan ons aanvaar dat die variansie ʼn verwerkte afstand is (dit is die afstand tussen die observasies en die gemiddeld).

Vraelyste

ʼn Lys vrae oor ’n bepaalde onderwerp waarop antwoorde verstrek moet word.

Waarskynlikheidsteek-

Enige waarskynlikheidgebaseerde steekproefnemingsmetode,

proefneming

waar die steekproefeenhede ewekansig gekies word uit die populasie. Met ander woorde elke lid van die populasie het dieselfde waarskynlikheid om gekies te word.

1.4

Inleiding

Wanneer ʼn mens met ʼn nuwe vakgebied begin, is dit altyd belangrik om die taal van die vak te verstaan. Met die eerste oogopslag lyk statistiek na Grieks en in sekere gevalle ís dit inderdaad Grieks, maar dit is geen rede om in koue sweet uit te slaan en met jou kop in jou hande te sit nie. In Hoofstuk 1 van die handboek word die basiese beginsels van statistiek behandel en gaan ons bietjie meer in diepte kyk na begrippe soos populasies, steekproewe, data, inligting, ensovoorts. Een van die belangrikste temas van Hoofstuk 1 is data, wat dit is, die kwaliteit daarvan, die bronne waar ons data kan verkry, hoe om dit te versamel en op die einde van die dag voor te berei vir verdere statistiese verwerking. Omdat steekproefnemingsmetodes ʼn groot impak het op die versameling en gebruik van data, sal paragrawe 6.1 en 6.2 van die handboek ook in hierdie studie-eenheid behandel word. Wanneer ons die basiese begrippe van statistiek verstaan en weet hoe ons data versamel en voorberei, kan ons dan oorgaan na die verwerking en aanwending daarvan.

Bladsy 16 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes Statistiek behels die verwerking van data na inligting deur middel van wiskundige berekeninge. Om statistiek moontlik te maak moet data kwantitatief (numeries) wees of gekwantifiseer (na getalle omgeskakel) word. Hierdie studie-eenheid verskaf ʼn inleiding tot statistiek en bespreek die verskillende aspekte van beskrywende statistiek. Ons leef in die era van data. Data word teen ʼn ongekende tempo gegenereer en versamel, en die persoon/onderneming wat weet hoe om hierdie data te benut, is ʼn kortkop voor die res. Om hierdie rede sal ons kyk hoe kategoriese en numeriese data opgesom en grafies voorgestel kan word. Hierdie opsommings en grafiese voorstellings skets ʼn prentjie van die data en is gewoonlik die formaat waarin ʼn sakeverslag opgestel word vir die bestuur. As jy so ʼn verslag moet opstel, is dit belangrik om te verstaan hoe om dit reg te doen en as jy ʼn bestuurder is, is dit belangrik om te verstaan hoe om dit reg te lees en te interpreteer. Om meer betekenis aan die data te gee is daar verskeie numeriese beskrywende statistiek wat daaruit bereken kan word. Hierdie statistieke, soos gemiddeldes, standaardafwykings, reikwydtes en andere, word gebruik om die data te verstaan en kan verder gebruik word om afleidings te maak oor die populasie waaruit dit kom en/of vooruitskattings te maak vir hierdie populasie. As iemand wat statistiek beoefen, is dit belangrik om te verstaan watter statistiek jy moet gebruik en wanneer jy daardie statistiek kan gebruik. 1.5

Basiese begrippe en beginsels van statistiek

Bestudeer die handboek Hoofstuk 1 paragrawe 1.1-1.11. Hoofstuk 1 verduidelik die belangrikste statistiese begrippe en die res van hierdie vak word daarop gebou. Alhoewel hierdie ʼn kort hoofstuk is, vestig dit die grondslag vir die res van die vak en moet dit dus nie afgeskeep word nie. Die doel van hierdie begeleidingsgids is nie om die handboek te herhaal nie. Dus sal daar nie ʼn definisie en beskrywing van elke begrip in die handboek verskaf word nie. Sommige van die begrippe sal egter in meer detail beskryf word. 1.5.1

Wat is statistiek?

Bestudeer die handboek paragrawe 1.1-1.5 Om hierdie te vraag te beantwoord is dit belangrik om eers na die definisies in paragraaf 1.1 in die handboek te kyk: Statistiek kan gedefinieer word as ʼn versameling wiskundige hulpmiddels en tegnieke wat rou (onverwerkte) data omskep in nuttige en bruikbare inligting, wat effektiewe besluitneming ondersteun deur middel van opsommende maatstawwe.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 17


GQM105 Inleiding tot elementêre kwantitatiewe metodes Hierdie maatstawwe word gebruik om dataprofiele te beskryf, beramings te verskaf, verhoudinge tussen datastelle te toets en om tendense oor tyd te identifiseer (Wegner, 2016: 3). Daar word onderskei tussen terme soos “bestuursbesluitneming”, “inligting”, “data” en “statistiek”. Davis, Pecar en Santana (2014: 3) definieer statistiek (die studie van data) as ’n kollektiewe stel tegnieke wat verwant is aan die verkryging, organisering, opsomming, voorstelling, analisering, interpretering en bereiking van gevolgtrekkings gebaseer op data. Data het nie enige waarde indien dit nie na inligting verwerk word nie. Statistiek is een van die stel hulpmiddels wat hier verwerking nodig maak.

Voorbeeld 1.1 Kyk na die volgende vrae. Watter van hierdie vrae versamel statistiese data? •

Hoe voel jy oor die e-tolstelsel?

Hoe oud is jy (in jare)?

Wat was die punt wat jy vir Statistiek behaal het?

Op ʼn skaal van 1 tot 10, dui aan hoe tevrede jy met die dosent is.

Al die bogenoemde vrae, behalwe die eerste een, versamel kwantitatiewe data. Dit is egter moontlik om, deur ʼn verskeidenheid tegnieke, data wat nie kwantitatief is nie in getalle om te skakel. Daar word verwys na die kwantifisering van kwalitatiewe data. Hierdie is ʼn omvattende proses wat nie in hierdie vak bespreek sal word nie. Figuur 1.2 hieronder probeer wys hoe statistiese analise deel kan vorm van effektiewe bestuursbesluitneming. Data word ingesamel vir ʼn bepaalde doel, dan word dit skoon gemaak en voorberei vir verdere verwerking, dan word daar gekyk na die beskrywende statistiek en word dit weer gebruik vir afgeleide statistiek en statistiese modellering. Die afvoer van hierdie proses is inligting en hierdie inligting word deur die bestuur gebruik om effektiewe besluite te neem.

Figuur 1.2: Statistiese analise as deel van bestuursbesluitneming Aangepas uit Wegner (2016: 4)

Bladsy 18 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes Omdat statistiese analise deel vorm van ʼn proses, en nie apart staan nie, moet die hele proses holisties beplan en uitgevoer word. Indien swak data versamel word, sal die inligting wat verkry word ook swak wees. As die verkeerde vrae gevra word, aan die begin van hierdie proses, kan die inligting nie later die nodige antwoord gee nie. Die geloofwaardigheid van inligting is afhanklik daarvan dat elke stap van hierdie proses reg uitgevoer is. 1.5.2

Statistiese begrippe en notasie

Daar is ʼn paar terme wat jy gereeld gaan hoor en lees in hierdie vak. Om hond haaraf te maak is dit belangrik dat jy verstaan wat bedoel word met elke begrip en die notasie (die stelsel van simbole waarmee statistieke en formules weergegee word) wat gebruik word. Paragraaf 1.2 in die handboek beskryf die taal van statistiek. Die tabel hieronder lys die algemeenste konsepte, asook die notasie wat ons vir steekproewe en populasies gebruik.

Statistiese maatstaf

Steekproefstatistiek

Populasie-parameter

Gemiddeld (mean)

đ?‘Ľ

đ?œ‡ (Griekse letter mu)

Standaardafwyking (standard deviation)

đ?‘

đ?œŽ (Griekse letter sigma)

Variansie (variance)

đ?‘ *

đ?œŽ*

Grootte (size)

đ?‘›

đ?‘

Korrelasie (correlation)

đ?‘&#x;

đ?œŒ (Griekse letter rho)

Tabel 1.1: Statistiese notasie (Wegner, 2106: 6) Statisties is daar ʼn groot verskil tussen ʼn steekproef en ʼn populasie, en jy moet duidelik kan onderskei wanneer daar met die steekproefstatistieke of met die populasie-parameters gewerk word. Die berekening van hierdie waardes verskil ook. Daar sal deur die loop van hierdie vak aanvaar word dat jy hierdie terme en simbole ken en weet waarvoor dit gebruik word. Die volgende voorbeeld sal poog om elk van hierdie terme te verduidelik:

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 19


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Voorbeeld 1.2 Daar is 30 000 werknemers by Maatskappy X. Ek wil graag weet hoe gereeld hierdie werknemers by restaurante eet, maar hierdie data is nie beskikbaar nie. Ek besluit om die werknemers hieroor uit te vra. Omdat ek nie die tyd en geld het om al 30 000 werknemers te vra nie, kies ek ʼn kleiner groep van 1 000 werknemers uit die groter groep. Ek kies hierdie groep sodat hulle sover as moontlik verteenwoordigend van die 30 000 is. Ek vra elk van hierdie werknemers hoeveel keer per jaar hy/sy by ʼn restaurant uiteet. Ek kry ʼn gemiddeld van 14.75 keer per jaar. •

Stogastiese veranderlike (random variable): Die hoeveelheid keer wat ʼn werknemer in Maatskappy X per jaar by ʼn restaurant eet, in hierdie geval 14.75.

Data: Die 1 000 antwoorde wat ek versamel het.

Populasie (population): Die totale hoeveelheid individue waarvoor ek afleidings wil maak, gebaseer op my statistiese analise (die 30 000 werknemers). Belangrik: Die steekproef moet altyd uit die populasie saamgestel word. Ek kon dus nie my 1 000 werknemers vanaf ʼn ander onderneming as Maatskappy X gevind het nie.

Populasie parameter (population parameter): Die spesifieke eienskap van die populasie wat ek wil meet, in hierdie geval die gemiddelde hoeveelheid kere wat ʼn werknemer (van die 30 000) in ʼn jaar uiteet.

Steekproef (sample): Die 1 000 werknemers (nie hul antwoorde nie) wat verteenwoordigend van die volledige groep werknemers (30 000) behoort te wees.

Steekproef-eenheid (sampling unit): Elkeen van hierdie werknemers wat in die steekproef voorkom, is ʼn steekproef-eenheid.

Steekproefstatistiek (sample statistic): Omdat ek nie die data vir al die werknemers in die populasie kan meet nie, moet ek ʼn statistiek in die steekproef gebruik om die soortgelyke statistiek in die populasie te skat. Dus is die gemiddelde hoeveelheid kere wat werknemers in die steekproef uiteet my steekproefstatistiek.

Grootte (N en n). Die grootte van die steekproef (n) was 1 000. Die grootte van die populasie (N) is 30 000.

Proporsie (p). Die steekproef se proporsie van die populasie was 0.033 (1 000/30 000).

Vir nog voorbeelde, verwys gerus na Tabel 1.1 in die handboek.

Bladsy 20 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.5.3

Statistiek en rekenaars

Daar is regtig min mense wat vandag nog statistiek eksklusief met die hand bereken. Die meeste berekeninge word met behulp van rekenaars en gespesialiseerde programmatuur, soos SPSS, SPlus, SYSTAT, ensovoorts, gedoen. Deur die loop van hierdie vak sal daar van Microsoft Excel gebruik gemaak word en is dit ʼn integrale deel van hierdie vak. Daar word van die student verwag om basiese statistiese berekening met die hand te doen en dit met behulp van Microsoft Excel te verifieer. Wanneer dit kom by die skoonmaak en die verwerking van groot volumes data, word daar van die student verwag om dit met Microsoft Excel te doen. Daar sal deurgaans aan studente verduidelik word van watter Microsoft Excel-formule hulle gebruik moet maak en hoe om dit te doen. Studente wat met Microsoft Excel sukkel, word aangemoedig om na artikels en video’s op die internet te gaan soek wat dit in meer detail verduidelik en wys. Microsoft het verder ʼn uitgebreide biblioteek van hul programmatuur se funksionaliteit wat studente gerus kan gebruik. 1.5.4

Data

Bestudeer die handboek paragrawe 1.5-1.10 Statistiek is gebaseer op data. As hierdie data van swak kwaliteit is (byvoorbeeld as gevolg van foute met die versameling), maak dit nie saak hoe goed die kwaliteit van die statistiese ontleding is nie. Die inligting wat verkry word, sal foutief wees. Beskou weer die voorbeeld van Maatskappy X in paragraaf 1.5.2 hierbo genoem. Daar is gevind dat die gemiddelde werknemer 14.75 per jaar by restaurante eet. Gestel nou dat die vraag nie ʼn tydsperiode (in hierdie geval die afgelope jaar) gespesifiseer het nie. Sommige respondente mag antwoord hoeveel keer hulle per week, dag of maand uiteet. Die inligting sal verkeerd wees, ongeag hoe akkuraat die gemiddeld bereken is. ʼn Goeie navorser sal dus twee belangrike aspekte in ag moet neem: •

Hoe kan die kwaliteit van data verseker word?

Wat is die beste statistiese metode om gevolgtrekkings oor die populasie te kan maak?

v Eienskappe van data Data kan op ʼn groot verskeidenheid van maniere geklassifiseer word (verwys na Figuur 1.3 hieronder). Op die hoogste vlak is data kwalitatief of kwantitatief.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 21


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1.3: Klassifikasie van datatipes (Wegner, 2016: 13) Kwalitatiewe data is data wat nie numeries van aard is nie. ʼn Voorbeeld hiervan is ʼn respondent se geslag wat óf manlik, óf vroulik is. ʼn Ander voorbeeld is ʼn respondent se gunstelingrestaurant, wat Wimpy, Spur, Dros of enigeen van ʼn baie groot verskeidenheid kan wees. Hoe dit ook al sy, nie een van hierdie antwoorde het ʼn numeriese waarde nie – dit is nie ʼn getal nie. Ons kan egter later kom en dit ʼn numeriese waarde gee en dit verder gebruik vir analise, maar dit is nie in wese ʼn getal nie. Kwantitatiewe data is data wat numeries van aard is. Voorbeelde hiervan is ʼn respondent se skoengrootte, ouderdom, inkomste, ensovoorts. In kort is dit enige data wat ʼn getal is. Op die volgende vlak van Figuur 1.3 hierbo kry ons die skaal van meting, naamlik nominale data, ordinale data, intervaldata en ratio data. Die eerste drie van hierdie skale is diskrete skale (waarvan die waarde altyd ʼn heelgetal is, met ander woorde geen desimale nie) en die laaste skaal is kontinu (dit kan enige numeriese waarde hê, byvoorbeeld 28.4, 2.4, 42.38, ensovoorts). Wenk: Baie studente raak deurmekaar met diskrete en kontinue waardes. Kry vir jouself ʼn maklike manier om tussen die twee te onderskei en dit te onthou. Nominale data is kategoriese data waar ʼn numeriese waarde aan elke kategorie toegeken word. Hierdie kategorieë is almal ewe belangrik, met ander woorde geen rang kan daaraan gegee word nie. Wanneer ons nominale data versamel, sal die tipiese vrae soos volg lyk: •

Wat is jou geslag? (1 = manlik; 2 = vroulik)

Wat is jou huistaal? (1 = Xhosa; 2 = Zoeloe; 3 = Engels; 4 = Afrikaans)

Watter kleur is jou motor? (1 = rooi; 2 = wit; 3 = blou; 4 = geel; 5 = swart)

Bladsy 22 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

Het jy gestem gedurende die verkiesing? (1 = ja; 2 = nee)

Ordinale data is kategoriese data waar ʼn numeriese waarde aan elke kategorie toegeken word. Hierdie kategorieë kan van klein tot groot gerangskik word, met ander woorde daar is ʼn rangvolgorde tussen die verskillende kategorieë. Wanneer ons ordinale data versamel, sal die tipiese vrae soos volg lyk: •

Watter grootte hemp dra jy? (1 = S; 2 = M; 3 = L; 4 = XL; 5 = 2XL)

Beskou jy jouself as kort, middelmatig of lank? (1 = kort; 2 = middelmatig; 3 = lank)

Rangskik jou drie gunstelingrestaurante in jou voorkeurvolgorde. (1 = eerste keuse; 2 = tweede keuse; 3 = derde keuse)

Intervaldata is numeriese kategoriese data. Hierdie kategorieë kan van klein tot groot gerangskik word, met ander woorde daar is ʼn rangvolgorde tussen die verskillende kategorieë. Wanneer ons intervaldata versamel, sal die tipiese vrae soos volg lyk: •

Op ʼn skaal van 1 tot 5, hoe goed was die diens gewees? (waar 1 = uiters swak en 5 = onverbeterlik)

Tot watter mate stem jy saam met die stelling dat die uitslag van die verkiesing regverdig was? (waar 1 = geensins en 10 = volkome)

Deur ʼn kruisie te trek op die lyn, hoe stresvol het jy die onderhoud ervaar?

Ratio data bestaan nie uit kategorieë nie, maar werklike nommers. Hierdie tipe data is ook die enigste wat kontinu van aard is. Wanneer ons ratio data versamel, sal die tipiese vrae soos volg lyk: •

Wat is jou ouderdom?

Hoeveel brandstof verbruik jou motor tydens ’n rit na Upington?

Wat is jou huidige gewig?

Nominale data is van die moeilikste om statisties te verwerk, terwyl ratio data die maklikste is. Wanneer jy ʼn vraelys moet saamstel, is dit belangrik dat jy die vrae op die regte manier vra sodat jy die bruikbaarste data kan versamel. v Databronne Daar is ʼn magdom bronne waaruit data versamel kan word. Die tabel hieronder gee ʼn paar ooglopende bronne van binne en buite ʼn onderneming, maar is geensins ’n volledige lys nie.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 23


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Interne databronne

Eksterne databronne

Verkope

Navorsingsinstitute en universiteite

Tydstate

Aandelebeurs

Bemarkingspandering

Die staat en staatsinstansies

Beskikbare tyd van stelsels

Nuuskanale

Werknemerprofiele

Interne marknavorsing Tabel 1.2: Databronne

Wanneer data ingewin word, is dit belangrik om te kyk na die bron vanwaar die navorser hierdie data verkry. As die navorser data versamel uit ʼn eksterne databasis waaroor sy/haar onderneming geen beheer het nie en waar die toepassing van datastandaarde twyfelagtig is, moet hierdie data baie versigtig hanteer word. Die waarskynlikheid dat hierdie goeie kwaliteit data is, is baie klein. In die meeste gevalle probeer die navorser so na as moontlik aan die bron van die data kom met so min as moontlik tussengangers. Dus kan ons onderskei tussen primêre databronne en sekondêre databronne. Primêre databronne is databronne waar die data vir die eerste keer in sy rou (onverwerkte) formaat versamel word met ʼn spesifieke doel voor oë. Die voordeel van primêre databronne is dat die navorser volledige beheer het oor die versameling van hierdie data. Die nadeel hieraan verbonde is dat dit baie tyd en energie kos om hierdie rou data te versamel, skoon te maak en te verwerk. Sekondêre databronne is databronne waar die data alreeds versamel, skoongemaak en tot ʼn mate verwerk is. Hierdie data is nie noodwendig met die navorser se doel voor oë versamel nie en soms is dit nie eers bruikbaar nie. Die voordeel hieraan verbonde is dat hierdie data alreeds beskikbaar is en dus nie so baie sal kos om te bekom nie. Die nadeel is dat hierdie data nie noodwendig bruikbaar is vir die betrokke studie nie en dit kan soms moeilik wees om die bruikbaarheid daarvan te bepaal. Hierdie data mag moontlik ook nie die volledige prentjie skets van die werklike populasie nie en kan lei tot onakkurate resultate en verkeerde gevolgtrekkings. Die navorser moet goed gaan nadink oor waar hy sy data gaan bekom en waarvoor hy dit kan gebruik. ʼn Verkeerde aanname op hierdie punt kan later tot katastrofiese nagevolge lei.

Bladsy 24 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes v Versamelingsmetodes Die metode wat gebruik word om die data te versamel kan ʼn groot impak hê op die akkuraatheid van die data. Die oorhoofse metodes om data te versamel is: •

Waarneming: Deur ʼn respondent dop te hou en dan die data vas te lê gebaseer op die respondent se gedrag.

Opnames: Deur vrae aan respondente te stel en hul terugvoer vas te lê. Opnames kan per onderhoud, papier, telefoon of elektronies gedoen word. (Verwys na paragraaf 1.9 in die handboek vir ʼn volledige beskrywing van die metodes en die voor- en nadele van elk.)

Eksperimentasie: Deur eksperimente te doen en data te versamel van vooraf geïdentifiseerde veranderlikes.

v Datavoorbereiding Data wat versamel is, kan nie noodwendig dadelik geanaliseer word nie. In die meeste gevalle is daar ʼn proses waardeur die navorser moet gaan om die data in ʼn bruikbare formaat te kry. Byvoorbeeld: data wat deur middel van ʼn geskrewe opname versamel is, moet elektronies ingevoer of vasgelê word. Wanneer data vasgelê word, outomaties of andersins, is daar altyd die moontlikheid dat foute kan insluip. Hierdie foute, wat geensins verband hou met die werklike data nie, kan negatiewe gevolge inhou vir die studie en moet dus skoon-/reggemaak word alvorens die navorser dit kan verwerk. Daar moet verder bepaal word of die data relevant is tot die navorsing, al dan nie. Indien die veranderlikes in die datastel nie relevant is tot die studie nie, kan dit uit die aard van die saak nie daarvoor aangewend word nie. Dus moet die regte stel veranderlikes gekies word. Soms is dit nodig om data meer relevant te maak tot die studie en moet die navorser twee of meer veranderlikes kombineer. Hierdie tipe dataverryking vind gewoonlik plaas wanneer daar gewerk word met abstrakte konsepte soos “omset per vierkante meter”, soos die handboek uitwys (Wegner, 2016: 18). 1.5.5

Selfevalueringsvrae

Voltooi al die oefeninge aan die einde van Hoofstuk 1 in die handboek. Die antwoorde op hierdie vrae is aan die einde van die handboek. Dit is belangrik dat jy nie na die antwoorde kyk voordat jy die vrae heeltemal voltooi het nie, selfs al sukkel jy om ʼn vraag te voltooi.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 25


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.6

Steekproefnemingsmetodes

Bestudeer die handboek Hoofstuk 6 paragrawe 6.1 en 6.2. Om afgeleide statistiek te beoefen of om statistiese modelle te ontwikkel word die statistikus verplig om sekere afleidings te maak oor die steekproef, byvoorbeeld dat die steekproefstatistieke verteenwoordigend is van die groter populasie. As hierdie aanname nie waar is nie, kan hierdie statistiek nie gebruik word vir beramings en vooruitskattings nie. Nou mag jy jouself afvra waarom Hoofstuk 6 nou alreeds behandel word, en die antwoord is eintlik logies: om ʼn verteenwoordigende steekproef te kry moet die beplanning en die versameling van data dit alreeds in ag neem. Daar is twee oorhoofse kategorieë van steekproefneming: niewaarskynlikheidsteekproefneming en waarskynlikheidsteekproefneming. 1.6.1

Niewaarskynlikheidsteekproefneming

Wegner (2016: 161) definieer niewaarskynlikheidsteekproefneming as enige steekproefmetode waar die steekproefeenhede nie ewekansig gekies word nie. Figuur 1.4 hieronder toon dat niewaarskynlikheidsteekproefneming verder verdeel kan word tussen gerief- en doelgerigte steekproefnemingsmetodes. Geriefsteekproefnemingsmetodes kyk na watter steekproefeenhede toeganklik of maklik bruikbaar is, waar doelgerigte steekproefnemingsmetodes vir ʼn spesifieke doel gebruik word. Dit is belangrik om op hierdie punt te noem dat niewaarskynlikheidsteekproefnemingsmetodes wel ʼn plek het in navorsing, maar dat dit reg gebruik moet word: die navorser moet verstaan wat die beperkinge van hierdie metodes is en hoe die data en statistiek gebruik kan word.

Figuur 1.4: Niewaarskynlikheidsteekproefnemingsmetodes (Davis, Pecar & Santana, 2014: 256) v Geriefsteekproefneming (Convenience sampling) Davis, Pecar en Santana (2014: 255-256) meld dat dit nie altyd moontlik is om steekproefeenhede ewekansig te kies vir veral groot steekproewe nie. Die navorser het nie noodwendig toegang tot al die nodige inligting nie. As voorbeeld wil ons kyk na plaaslike

Bladsy 26 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes familiebesighede wat finansieel swaargekry het gedurende die 2007-2009 resessie. In hierdie voorbeeld gaan die navorser dalk nie toegang hê tot ʼn lys van plaaslike familiebesighede nie en is daar geen manier om vooraf te bepaal of hulle swaar gekry het tydens die resessie nie (omdat hul finansiële state nie gepubliseer is nie). Dit is dus onmoontlik om hierdie ondernemings ewekansig te kies. Dus sal ons die data wat beskikbaar is, versamel en gebruik vir die ondersoek. v Oordeelsteekproefneming (Judgement sampling) Wanneer ʼn navorser van oordeelsteekproefneming gebruik maak, word steekproefeenhede met die hand gekies deur ʼn kenner gebaseer op die bruikbaarheid van hierdie steekproefeenhede vir die betrokke ondersoek (Reference: 2016). In sekere velde kan oordeelsteekproefneming beter resultate lewer as waarskynlikheidsteekproefmetodes omdat ʼn kenner sy/haar ondervinding kan inspan; byvoorbeeld as ʼn navorser ʼn studie oor selfoonmaatskappye doen, kan beter resultate verkry word as die kenner ʼn spesifieke maatskappy nader en nie een ewekansig kies nie. Die kenner maak hierdie keuse op grond van sy ondervinding en kennis van die maatskappye. Sou ʼn maatskappy ewekansig gekies word en die maatskappy swak of geen data verskaf nie, sit die navorser in ʼn slegte posisie. Oordeelsteekproefneming is veral handig waar die populasie klein is. v Doelgerigte steekproefneming (Purposive sampling) Wanneer ʼn navorser sy/haar steekproefeenhede kies op grond van ʼn spesifieke doel word daar gebruik gemaak van ʼn doelgerigte steeproefnemingsmetode (Davis, Pecar & Santana, 2014: 256). Hierdie steekproef is steeds nie verteenwoordigend van die groter populasie nie, maar die doel van die ondersoek is ook nie om afleidings te maak van die populasie nie. ʼn Voorbeeld hiervan is wanneer ʼn onderneming ʼn tevredenheidspeiling doen binne ʼn spesifieke departement om te bepaal wat die moraal van daardie departement is. Die twee doelgerigte steekproefnemingsmetodes waarna ons kyk, is kwotasteekproefneming en sneeubalsteekproefneming. v Kwotasteekproefneming (Quota sampling) As ʼn navorser nie al die beskikbare steekproefeenhede wil gebruik nie, maar hulle in kategorieë verdeel, dan word daar gebruik gemaak van kwotasteekproefneming; byvoorbeeld, die bestuur van ʼn onderneming wil bepaal wat die vlak van werksbevrediging is. Hulle doen ʼn opname, maar verdeel die werknemers tussen manlik en vroulik. Uit beskikbare statistiek weet hulle dat 75% van werknemers manlik is en 25% vroulik, en bepaal dat die opname soortgelyk verdeel moet wees. Hulle besluit op ʼn steekproefgrootte van 100 werknemers. Die menslikehulpbronbestuurspan stap deur die gebou en vra werknemers om die betrokke vorms te voltooi. Sodra 25 vroulike werknemers elkeen ʼn vorm Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 27


GQM105 Inleiding tot elementêre kwantitatiewe metodes voltooi het, hou die span op om dames te vra en sodra 75 manlike werknemers elkeen ʼn vorm voltooi het, kom die opname tot ʼn einde. Hierdie is ʼn voorbeeld van proporsionele kwotasteekproefneming. In die geval waar die navorser nie besorg is dat die steekproef proporsioneel korrek verdeel is soos die populasie nie, maar dat die span slegs 30 dames en 70 mans moet vra om die vorm te voltooi, word daar van nie-proporsionele kwotasteekproefneming gebruik gemaak. v Sneeubalsteekproefneming (Snowball sampling) Sneeubalsteekproefneming is wanneer ʼn steekproefeenheid geïdentifiseer word, gebaseer op bepaalde eienskappe, en hy/sy gevra word om ander mense, wat ook aan hierdie kriteria voldoen, aan te beveel om ook deel te neem aan die opname (Davis, Pecar & Santana, 2014: 257). Hierdie metode word veral gebruik by ondersoeke wat handel oor sensitiewe sake, byvoorbeeld huishoudelike geweld, alkoholisme, ensovoorts. Die persone wat aanbeveel word, word ingesluit by die opname en word dan weer om die beurt gevra om ander aan te beveel, en so groei die steekproef net soos ʼn sneeubal wat teen die hang van ʼn berg afrol. 1.6.2

Waarskynlikheidsteekproefneming

Wegner (2016: 162) definieer waarskynlikheidsteekproefneming as: Enige waarskynlikheidsgebaseerde steekproefnemingsmetode waar die steekproefeenhede ewekansig gekies word uit die populasie. Met ander woorde, elke lid van die populasie het dieselfde waarskynlikheid om gekies te word.

Figuur 1.5: Waarskynlikheidsteekproefnemingsmetodes (Davis, Pecar & Santana, 2014: 251) v Eenvoudige ewekansige steekproefneming (Simple random sampling) Eenvoudige ewekansige steekproefneming is die algemeenste steekproefnemingsmetode wat gebruik word en dit is waar elke steekproefeenheid presies dieselfde waarskynlikheid het om gekies te word (Davis, Pecar & Santana, 2014: 251). v Stelselmatige steekproefneming (Systematic sampling) Stelselmatige steekproefneming is ʼn ewekansige metode waar ʼn steekproefeenheid gekies word en daarna elke soveelste steekproefeenheid. Die proses wat gevolg word, is soos volg:

Bladsy 28 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 1. Deel die populasiegrootte (đ?‘ ) deur die steekproefgrootte (đ?‘›). As die populasiegrootte 20 000 en die steekproefgrootte 40 is, is đ?œ? =

7 -

=

*8 888 :8

= 500. Rond đ?œ? altyd af tot die

naaste diskrete waarde (heelgetal). 2. Kies enige nommer (đ?‘˜) tussen, en insluitende, 1 en đ?œ?. As đ?œ? = 500 dan kan ons potensieel enige getal tussen 1 en 500 kies. Vir die doel van hierdie voorbeeld sal ons đ?‘˜ = 54 gebruik. 3. Deur te begin met đ?‘˜ sal ons elke đ?œ?ste steekproefeenheid kies en insluit by die steekproef. Waar đ?‘ = 20 000, đ?‘› = 40, đ?œ? = 500 en đ?‘˜ = 54 sal die volgende steekproefeenhede ingesluit word by die ondersoek: 54, 554, 1 054, 1 554, 2 054,... , 19 554. (Sou die 40ste waarde buite 20 000 lĂŞ, sou ons teruggegaan het na die eerste waarde en van daar af aangegaan het om die 40ste steekproefeenheid te kies.) Nota: Met hierdie metode het al die steekproefeenhede nie presies dieselfde waarskynlikheid om gekies te word nie en sou die gekose eenhede oor ʼn eienskap beskik wat nie dieselfde as die populasie is nie, kan dit vooroordeel insluit by die steekproef. v Gestratifiseerde steekproefneming (Stratified sampling) Davis, Pecar en Santana (2014: 253) beskryf gestratifiseerde steekproefneming as: ʼn Steekproefnemingsmetode waar die populasie in twee of meer eksklusiewe groepe (strata) verdeel word. Elke groep/stratum bevat homogene elemente (die elemente is soortgelyk aan mekaar wanneer daar gekyk word na die veranderlike wat bestudeer word. Dan word steekproefeenhede ewekansig uit elke stratum gekies. Wanneer ʼn navorser slegs van eenvoudige ewekansige steekproefneming gebruik maak, is daar altyd die risiko dat belangrike kenmerke per ongeluk uitgesluit word van die steekproef omdat die steekproefeenhede wat wel gekies is, toevallig nie oor die kenmerk beskik nie. Dit beteken dat die navorser die risiko loop om nie ʼn verteenwoordigende steekproef te kry nie. Gestratifiseerde steekproefneming is een manier om te verseker dat die steekproef verteenwoordigend is ten opsigte van die betrokke kenmerk. Davis, Pecar en Santana (2014: 253) noem die volgende voordele: •

Dit verseker dat die steekproef verteenwoordigend is.

•

Dit verskaf voldoende data om die onderskeie groepe/strata te analiseer.

•

Dit vereis nie ʼn magdom data om verteenwoordigend te wees nie.

•

Dit is meer akkuraat as wat eenvoudige ewekansige steekproefneming is, veral by groter populasies.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 29


GQM105 Inleiding tot elementêre kwantitatiewe metodes Binne gestratifiseerde steekproefneming is daar twee verskillende metodes: •

Proporsionele gestratifiseerde steekproefneming, waar die steekproefgrootte uit die stratum proporsioneel dieselfde is as die stratumgrootte teenoor die populasie; en

•

Nie-proporsionele gestratifiseerde steekproefneming, waar steekproefgrootte uit die stratum nie proporsioneel dieselfde is nie.

v Trossteekproefneming (Cluster sampling) Trossteekproefneming is soortgelyk aan gestratifiseerde steekproefneming. Die groepe/trosse is steeds eksklusief, met ander woorde ʼn eenheid kan nie in meer as een groep/tros val nie. Die groepe/trosse is homogeen, met ander woorde soortgelyk aan mekaar. Die navorser sal ʼn steekproef (đ?‘˜) uit die groter populasie (đ??ž) van groepe/trosse trek. Die navorser het dan die keuse om ʼn eenfase- of tweefaseproses te volg. By die eenfaseproses sal die navorser al die elemente in die gekose groep/tros insluit by die steekproef. By die tweefaseproses sal die navorser dan weer ʼn steekproef ewekansig kies uit die gekose groepe/trosse. Navorsers kan selfs so ver gaan as om ʼn derde en vierde fase van steekproefneming te doen en in hierdie geval sal dit bekend staan as multifasetrossteekproefneming. Met gestratifiseerde steekproefneming word daar steekproefeenhede van al die groepe/strata (wat van mekaar verskil) ingesluit, terwyl trossteekproefneming slegs van gekose groepe/trosse (wat soortgelyk aan mekaar is) gebruik maak. 1.6.3

Onsydigheid

Davis, Pecar en Santana (2014: 259) definieer onsydigheid as: Waar die verwagte waarde van die steekproefverdeling se statistiek dieselfde is as die populasieparameter. Met ander woorde die beraamde waarde is die ware waarde. Omdat die beskrywende statistiek van ʼn steekproef gebruik word om afleidings van die populasie te maak, wil ons graag die sydigheid/bevooroordeling van die data tot ʼn minimum beperk. Hoe groter die sydigheid/bevooroordeling, hoe swakker is die afleidings wat ons kan maak. 1.6.4

Sentrale limietstelling (Central limit theorem)

Een van die belangrikste aannames wat ons met afgeleide statistiek maak, is dat die steekproef normaal versprei is. Wanneer hierdie stelling nie waar is nie, kan ons eenvoudig nie die afleidings van die groter populasie maak en gebruik nie. Bladsy 30 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Die sentrale limietstelling sĂŞ dat wanneer ʼn steekproef uit ʼn populasie gekies word met ʼn gemiddeld đ?œ‡ en ʼn variansie đ?œŽ * , sal die verdeling van die steekproefgemiddeldes benaderd normaal wees wanneer die steekproefgrootte đ?‘› groot is. Dit kom daarop neer dat wanneer ons die steekproefgrootte vergroot, die steekproefverdeling se benadering meer normaal word. As ons hierdie steekproef ewekansig in kleiner groepe verdeel, sal die gemiddeld van hierdie groepe se gemiddelde benaderd normaal wees, as daar genoeg groepe is. Genoeg groepe, in hierdie geval, is volgens algemene literatuur đ?‘› = 30. Deur die sentrale limietstelling te gebruik kan ons ʼn steekproefverdeling normaal benader en die standaard-normaalverdeling se statistieke gebruik om afleidings van die groter populasie te maak. 1.6.5

Selfevalueringsvrae

Doen Vrae 5-14 en 20 op bladsy 175-176 van die handboek. 1.7

Beskrywende statistiek

Bestudeer die handboek Hoofstuk 2 paragrawe 2.1-2.3 en 2.5-2.6. Noudat ons gekyk het na waar data vandaan kom en hoe dit voorberei word, gaan ons in hierdie paragraaf kyk na hoe hierdie data opgesom en voorgestel kan word. Ons gaan dus nou kyk na hoe ons data kan omskakel na verstaanbare en bruikbare inligting. In die sakewêreld kan jy verwag om baie verslae te skryf en te lees deur die loop van jou loopbaan. Wanneer dit kom by sakesyfers word daar van ʼn verskeidenheid tabelle en grafieke gebruik gemaak om ʼn prentjie te skets van die onderneming. Daar gaan van jou verwag word om hierdie tabelle en grafieke te kan opstel en, meer belangrik, om dit te kan lees en die regte gevolgtrekkings daaruit te kan maak. (Verwys na Figuur 1.2 om te sien hoe statistiese analise deel vorm van bestuursbesluitneming.) 1.7.1

Grafiese beskrywende statistiek vir kategoriese data

Bestudeer die handboek paragraaf 2.2. In paragraaf 1.5.3 is die verskillende tipes data beskryf. Nominale data is gewoonlik kategories van aard. Die voorbeeld van die gunstelingrestaurante behels kategoriese data. Kategoriese data kan grafies op die volgende wyses voorgestel word: v Kategoriese frekwensietabel Hierdie tabel dui aan hoeveel keer elke kategorie deur respondente genoem is.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 31


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Gunstelingrestaurant Telling (count)

Persentasie

Spur

370

37%

Dros

250

25%

Bessie se kombuis

380

38%

1 000

100%

Tabel 1.3: Voorbeeld van ʼn frekwensietabel v Kolomgrafiek (bar chart) Hierdie grafiek stel frekwensies (bv. hoeveel keer ʼn restaurant as gunsteling genoem is) grafies voor.

Figuur 1.6: ʼn Kolomgrafiek v Sirkelgrafiek (pie chart) Hierdie grafiek word gebruik om die proporsie van elke kategorie as deel van alle respondente te vertoon. Figuur 1.7 verskaf ʼn voorbeeld.

Bladsy 32 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1.7: ʼn Sirkelgrafiek Kyk ook na Voorbeeld 2.1 in die handboek op bladsy 28-30. Soms is daar meer as een veranderlike wat gemeet word. In plaas van ʼn gunstelingrestaurant, kan die respondente ook gevra word om hul geslag (manlik of vroulik) aan te dui. Sodoende kan daar bepaal word of die gunstelingrestaurante van mans en vroue verskil. Die volgende is wyses waarop kategoriese data met meer as een veranderlike voorgestel kan word. Moenie deurmekaar raak nie: kategorie vs. veranderlike Ons onderskei hier tussen veranderlikes en kategorieë. In die restaurant-voorbeeld is daar drie kategorieë (Spur, Dros en Bessie se kombuis), maar slegs een veranderlike (gunstelingrestaurant). In die voorbeelde hieronder is daar twee veranderlikes (gunstelingrestaurant en geslag), wat elk ʼn aantal kategorieë bevat: •

Veranderlike 1: Gunstelingrestaurant. 3 kategorieë: o

Kategorie 1: Spur

o

Kategorie 2: Dros

o

Kategorie 3: Bessie se kombuis

Veranderlike 2: Geslag. 2 kategorieë: o

Kategorie 1: Manlik

o

Kategorie 2: Vroulik

Die veranderlike vorm dus die grondslag waarvolgens kategorieë geskep word. v Kruisfrekwensietabel (cross-tabulation table) ʼn Tabel wat die frekwensies gee van elke kategorie van twee veranderlikes. Tabel 1.4 is ʼn voorbeeld van só ʼn kruisfrekwensietabel van die veranderlikes “geslag” en “restaurant”.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 33


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Restaurant

Geslag

Totaal

Manlik

Vroulik

Spur

250

120

370

Dros

180

70

250

Bessie se kombuis

50

330

380

Totaal

480

520

1000

Tabel 1.4: ʼn Kruisfrekwensietabel Uit bogenoemde is dit duidelik: •

dat daar meer vroulike (đ?‘› = 520) respondente as manlike (đ?‘› = 480) respondente was.

•

dat daar meer manlike respondente was wat van Spur en Dros gehou het, as vroulike respondente (250 en 180 vs. 120 en 70).

•

dat die vroulike respondente meer van Bessie se kombuis hou as mans, asook dat vroulike respondente se gunstelingrestaurant oor die algemeen Bessie se kombuis is.

v Stapel-kolomgrafiek (Stacked bar chart) Hierdie grafiek is soortgelyk aan ʼn gewone kolomgrafiek, hoewel die frekwensies van ʼn spesifieke kategorie verdeel word volgens die proporsie van ʼn tweede veranderlike. Kyk na die voorbeeld in Figuur 1.8.

Figuur 1.8: ʼn Stapel-kolomgrafiek

Bladsy 34 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes v Meervoudige kolomgrafiek (multiple bar chart) Hierdie grafiek is soortgelyk aan die stapel-kolomgrafiek, maar die waardes vir beide kategorieë word langs mekaar vertoon (in plaas van binne-in dieselfde kolom). Figuur 1.9 verskaf ʼn voorbeeld:

Figuur 1.9: ʼn Meervoudige kolomgrafiek Sien ook Voorbeeld 2.2 in die handboek op bladsy 32-34. 1.7.2

Grafiese voorstelling van numeriese data: een veranderlike

Bestudeer die handboek paragraaf 2.3. Paragraaf 1.7.1 hierbo het kategoriese data bespreek. Kategoriese data is gewoonlik kwalitatiewe data wat gekwantifiseer word deur dit in kategorieë te plaas. Hierdie paragraaf bespreek nou numeriese data (ordinaal, interval- en ratio) en die wyses waarop dit grafies voorgestel kan word. Hierdie grafiese voorstelling behels grafieke en tabelle. v Een numeriese veranderlike Vir die doel van hierdie paragraaf sal die volgende voorbeeld gebruik word: Die volgende inligting word van Maatskappy X verkry: •

Die ouderdom van 1 000 van hul werknemers uit ʼn ewekansige steekproef.

Die hoogste ouderdom is 67 en die jongste is 18.

v Numeriese frekwensieverdeling Hierdie verdeling deel alle data in intervalle op. Dan word bepaal hoeveel van alle waardes in elke interval aangetref word. Hierdie is dus ʼn poging om iets soos ratio data na

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 35


GQM105 Inleiding tot elementêre kwantitatiewe metodes kategoriese data om te skakel. Waarom sal ʼn mens dit wil doen? In hierdie geval is die doel bloot om data beter te vertoon. Om hierdie verdeling te bepaal moet die volgende eers verkry word: •

Reikwydte (range): (hoogste waarde)-(laagste waarde) (dus 67-18 = 49).

Intervalwydte. Eerstens, moet op die hoeveelheid intervalle besluit word. Daarna moet die grootte van elke interval bepaal word. Gestel dus ons wil 5 intervalle hê. Die berekening is dan soos volg:

o

Reikwydte/hoeveelheid intervalle

o

= 49/5

o

= 9.8 ≈ 10

o

Elke interval sal dus 10 jaar groot wees

Verdeel nou alle data (die 1 000 ouderdomme) in hierdie groepe op. Dit is belangrik dat ʼn enkele respondent se ouderdom slegs in een kategorie ingedeel word. Tabel 1.5 stel hierdie verdeling grafies voor: Interval (10 jaar)

Frekwensies (Hoeveel respondente val in die kategorie?)

18-27

400

28-37

290

38-47

190

48-57

90

58-69

30

Totaal

1 000

Tabel 1.5: Numeriese frekwensieverdeling v Histogram ʼn Histogram is ʼn grafiese voorstelling van bogenoemde numeriese frekwensieverdeling en lyk soos ʼn kolomgrafiek. Figuur 1.10 stel ʼn histogram vir bogenoemde data voor.

Bladsy 36 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1.10: ʼn Histogram Interpretasie: Uit hierdie histogram is dit duidelik dat Maatskappy X se menslike hulpbronne uit jonger personeel bestaan. Hoe hoër die ouderdom is, hoe minder personeel val in daardie kategorie. (Hierdie gevolgtrekking kan natuurlik slegs gemaak word indien die 1 000 personeel wat ondersoek is, verteenwoordigend is van die totale personeelkorps van Maatskappy X.) v Kumulatiewe frekwensieverdeling Die kumulatiewe frekwensieverdeling is ʼn tabel wat presies dieselfde is as die gewone numeriese frekwensieverdeling. ʼn Bykomende kolom word egter bygesit om die totale frekwensies vir ʼn kategorie, plus die frekwensies van alle kategorieë wat sodanige kategorie voorafgaan, te vertoon. Kyk na Tabel 1.6 hieronder vir meer duidelikheid (die laaste kolom met beskrywings is nie deel van hierdie tabel nie – dit is slegs in hierdie figuur ingevoeg ter verduideliking): Interval (10 jaar)

Frekwensies (Hoeveel respondente val in die kategorie?)

Kumulatiewe frekwensie

(Notas ter verduideliking)

18-27

400

400

28-37

290

690

400+290

38-47

190

880

400+290+190

48-57

90

970

400+290+190+90

58-69

30

1 000

400+290+190+90+30

Totaal

1 000 Tabel 1.6: Kumulatiewe frekwensieverdeling

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 37


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Die laaste kumulatiewe frekwensie sal altyd đ?’? wees. Met ander woorde, dit sal altyd dieselfde wees as al die frekwensies saamgevoeg. (Onthou, đ?’? stel die grootte van die steekproef voor, met ander woorde, die hoeveelheid mense van Maatskappy X wat ons vraag beantwoord het.) v Kumulatiewe frekwensieveelhoek ʼn Kumulatiewe frekwensieveelhoek (ogive) is die grafiese voorstelling van ʼn kumulatiewe frekwensietabel. Dit is ʼn lyngrafiek. Figuur 1.11 stel hierdie veelhoek vir bogenoemde data voor:

Figuur 1.11: ʼn Kumulatiewe frekwensieveelhoek om kumulatiewe frekwensies grafies voor te stel Verwys ook na Voorbeeld 2.3 (bladsy 36-37), 2.4 (bladsy 37-38) en 2.5 (bladsy 39-42) in die handboek vir meer inligting. v Houer-en-punt-stippingsgrafiek (Box plot) Die houer-en-stippingsgrafiek word in Hoofstuk 3 in die handboek in meer detail behandel. Hierdie grafiek vertoon die minimum- en maksimumwaardes, asook ʼn verskeidenheid waardes wat tussen die minimum en maksimum voorkom. Voorbeelde sluit in die mediaan, gemiddelde en kwartiele (sal later behandel word). 1.7.3

Grafiese voorstelling van numeriese data: twee veranderlikes

Bestudeer die handboek paragraaf 2.3 (vervolg). Vir gevalle waar twee veranderlikes gemeet word, sal die volgende voorbeeld gebruik word:

Bladsy 38 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes Maatskappy A wil ʼn ouderdomsprofiel van hul kliënte opstel. Hulle wil sien wat die ouderdomme van hul kliënte is (veranderlike 1), maar ook hoeveel geld hul kliënte per besoek aan die winkel spandeer (veranderlike 2). Beide hierdie data is ratio data. v Spreidingstipping (Scatter plot) Hierdie grafiek plaas elke respondent se antwoord op beide vrae as ʼn enkele kolletjie op ʼn grafiek. Gestel Maatskappy A het die twee vrae (1. Hou oud is jy? en 2. Hoeveel geld spandeer jy op ʼn keer by die winkel?) vir vyftien respondente gevra. Die antwoorde word in die tabel hieronder opgesom:

Respondentnommer

Ouderdom

Hoeveel geld spandeer

1

18

350

2

70

150

3

24

500

4

29

1 500

5

27

1 000

6

34

1 700

7

43

2 500

8

40

2 000

9

19

400

10

21

450

11

65

130

12

60

170

13

20

410

14

70

50

15

38

3 000

Tabel 1.7: Maatskappy A se datastel Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 39


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1.12: ʼn Puntediagram Let daarop dat die hoogste waardes tussen ongeveer 35 en 45 gevind word. v Tendensgrafiek (Trendline) Hierdie grafiek stel tipies verandering oor tyd voor. Die horisontale as stel tyd voor en die vertikale as stel ʼn tweede veranderlike voor. Figuur 1.13 stel die verkope van produkte by Maatskappy A oor ʼn tydperk van 12 maande voor.

Bladsy 40 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 1.13: ʼn Lyngrafiek wat ʼn tendens voorstel 1.7.4

Selfevalueringsvrae

Daar is 24 vrae aan die einde van Hoofstuk 2. Voltooi al hierdie vrae. ʼn Groot hoeveelheid van hierdie vrae moet in Microsoft Excel gedoen word. Die CD met hierdie data word in die agterkant van die handboek verskaf. 1.8

Numeriese beskrywende statistiek

Bestudeer die handboek paragrawe 3.1-3.6, 3.8-3.9. Hoewel grafieke en tabelle ʼn goeie oorsig oor data kan gee, kan statistiese waardes meer spesifieke beskrywings verskaf. Hierdie statistieke fokus veral op die lokaliteit, spreiding en vorm van data. Daar word na ʼn aantal statistieke in elk van hierdie drie kategorieÍ gekyk. 1.8.1

Maatstawwe van lokaliteit

Bestudeer die handboek paragraaf 3.2. Maatstawwe van lokaliteit (measures of central tendency) verskaf ʼn aanduiding van watter waarde in die middel van al die waardes van die datastel is. Die bekendste voorbeeld van ʼn maatstaf van lokaliteit is wat in die algemene taal bekend staan as die “gemiddeldâ€?. In Statistiek word daar verwys na die rekenkundige gemiddeld. v Rekenkundige gemiddeld Hierdie statistiek, vir die steekproef voorgestel deur đ?’™, word bepaal deur al die numeriese waardes bymekaar te tel, en dan te deel deur die hoeveelheid waardes.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 41


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

đ?’™= Waar:

đ?’…đ?’Šđ?’† đ?’”đ?’?đ?’Ž đ?’—đ?’‚đ?’? đ?’‚đ?’? đ?’…đ?’Šđ?’† đ?’?đ?’ƒđ?’”đ?’†đ?’“đ?’—đ?’‚đ?’”đ?’Šđ?’†đ?’” đ?’™đ?’Š = đ?’…đ?’Šđ?’† đ?’‚đ?’‚đ?’?đ?’•đ?’‚đ?’? đ?’?đ?’ƒđ?’”đ?’†đ?’“đ?’—đ?’‚đ?’”đ?’Šđ?’†đ?’” đ?’?

đ?‘Ľ

= die steekproef se rekenkundige gemiddeld

đ?‘›

= die aantal observasies in die steekproef (steekproefgrootte)

đ?‘ĽO

= die waarde van die đ?‘– ste waarde van die stogastiese veranderlike đ?‘Ľ đ?‘ĽO

= die som van al waardes, met ander woorde đ?‘Ľ( + đ?‘Ľ* + đ?‘Ľ+ + â‹Ż + đ?‘Ľ-

MS Excel-formule:

=AVERAGE(datareeks) Formule 1.1: Rekenkundige gemiddeld

Voorbeeld 1.3 Die ouderdomme van tien werknemers by Maatskappy X is: 18, 20, 32, 26, 70, 55, 34, 43, 53, 31 Die gemiddelde ouderdom is: đ?’™đ?’Š đ?’?

=

đ?&#x;?đ?&#x;– U đ?&#x;?đ?&#x;Ž U đ?&#x;‘đ?&#x;? U đ?&#x;?đ?&#x;” U đ?&#x;•đ?&#x;Ž U đ?&#x;“đ?&#x;“ U đ?&#x;‘đ?&#x;’ U đ?&#x;’đ?&#x;‘ U đ?&#x;“đ?&#x;‘ U đ?&#x;‘đ?&#x;?

=

đ?&#x;‘đ?&#x;–đ?&#x;?

đ?&#x;?đ?&#x;Ž

đ?&#x;?đ?&#x;Ž

= đ?&#x;‘đ?&#x;–, đ?&#x;? jaar Doen Voorbeeld 3.1 in die handboek om te verseker dat jy die rekenkundige gemiddeld verstaan. v Mediaan Die tweede maatstaf van lokaliteit is die mediaan. Om die mediaan te kry moet alle waardes van kleinste na grootste sorteer word. Die getal wat presies in die middel is, word die mediaan genoem. As daar twee getalle in die middel is, word die rekenkundige gemiddeld van die twee getalle in die middel bereken om die mediaan te verkry. Daar is nie ʼn formule in die handboek vir die mediaan nie.

MS Excel-formule:

=MEDIAN(datareeks)

Formule 1.2: MS Excel-formule om die mediaan te vind

Bladsy 42 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 1.4 Die ouderdomme van elf werknemers by Maatskappy A is: 18, 20, 32, 26, 70, 55, 34, 43, 53, 31, 22 Bereken die mediaan: Stap 1: Sorteer die waardes van klein na groot: 18 20 22 26 31 32 34 43 53 55 70 Stap 2: Vind die waarde in die middel 18 20 22 26 31 32 34 43 53 55 70 Die mediaan is dus 32.

Voorbeeld 1.5 Die ouderdomme van tien werknemers by Maatskappy A is: 18, 20, 32, 26, 70, 55, 34, 43, 53, 31 Bereken die mediaan: Stap 1: Sorteer die waardes van klein na groot 18 20 26 31 32 34 43 53 55 70 Stap 2: Vind die middelste waarde Omdat daar tien waardes is, is daar nie ʼn enkele middelste waarde nie. Die middelste waardes is 32 en 34. Die rekenkundige gemiddeld moet dus van hierdie twee waardes bereken word: Mediaan

=

đ?&#x;‘đ?&#x;?Uđ?&#x;‘đ?&#x;’ đ?&#x;?

= đ?&#x;‘đ?&#x;‘ Doen nou Voorbeeld 3.2 (a) en (b) in die handboek.

v Mediaan vir kategorieÍ of gegroepeerde waardes ʼn Mediaan kan ook vir kategorieÍ bereken word.

đ?‘´đ?’† = đ?‘śđ?’Žđ?’† +

đ?’„

đ?’? đ?&#x;?

−đ?’‡ < đ?’‡đ?’Žđ?’†

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 43


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Waar:

đ?‘‚de = die laagste waarde van die interval waarin die mediaan lĂŞ đ?‘?

= die intervalbreedte

đ?‘›

= steekproefgrootte (aantal observasies)

đ?‘“de

= die aantal observasies wat binne-in die interval van die mediaan lĂŞ

đ?‘“(<) = die kumulatiewe frekwensie van al die observasies voor die mediaan se interval Formule 1.3: Mediaan vir kategorieĂŤ

Voorbeeld 1.6 Interval

Frekwensies

(10 jaar)

Kumulatiewe frekwensie

18-27

400

400

28-37

290

690

38-47

190

880

48-57

90

970

58-69

30

1 000

Totaal

1 000 Tabel 1.8: Datastel

Bereken die mediaan vir bogenoemde waardes. In hierdie geval is dit moeiliker omdat dit baie tyd sal neem om ʼn duisend waardes van klein na groot te rangskik. Om die mediaan te vind moet die volgende stappe gevolg word: Stap 1: Vind die posisie van die mediaan. Soos reeds gesê, is die mediaan presies in die middel van alle waardes, indien die waardes gesorteer is. Dus is die mediaan by posisie 1 000 = 500 2 Die posisie van die mediaan is dus 500. Stap 2: Deur na die kumulatiewe frekwensie-kolom te kyk, bepaal in watter kategorie die 500ste waarde sal voorkom. Die eerste kategorie eindig by die 400ste waarde; die tweede kategorie eindig by die 690ste waarde. Die 500ste waarde sal dus êrens in die tweede

Bladsy 44 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes kategorie (28-37) voorkom. Stap 3: Bepaal die plek van die mediaan. Dus is: đ?‘€e

= 28 +

(8 l88m:88 *n8

= 31,44 Doen nou Voorbeeld 3.3 in die handboek. v Modus ʼn Derde maatstaf van lokaliteit is die modus. Die modus is die enkele waarde wat die meeste kere voorkom.

MS Excel-formule:

=MODE.SNGL(datareeks)

Formule 1.4: MS Excel-formule om die modus te vind Hierdie maatstaf is veral nuttig vir kategoriese data. Vir kategoriese data kan die modus bereken word deur eenvoudig die frekwensies van elke kategorie met mekaar te vergelyk. Voorbeeld 1.7 Restaurant

Frekwensie

Spur

370

Dros

250

Bessie se kombuis

380 1 000

Tabel 1.9: Datastel Kry die modus. Deur bloot na die bogenoemde tabel te kyk, is dit duidelik dat Bessie se kombuis die gewildste is. Dus is die modus “Bessie se kombuisâ€?. In hierdie geval is die modus nie ʼn getal nie, maar ʼn kategorie. Met ratio data kan dit egter gebeur dat daar uit ʼn 1 000 waardes nie een waarde is wat twee maal herhaal word nie. Dink byvoorbeeld aan die pryse van kruideniersware. In so ʼn geval sal ʼn modus niksseggend wees. (As die bedrag van R25,88 drie keer genoem is, maar die

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 45


GQM105 Inleiding tot elementêre kwantitatiewe metodes bedrae R70,55; R70,56; R70,10; R70,80 en R70,00 ook voorkom, is die modus van R25.88 dan werklik akkuraat?) Vir hierdie doel word die modus geskat deur al die data in intervalle in te deel. Daarna word die interval met die voorafgaande en opeenvolgende interval vergelyk om ʼn modus te bepaal. Om die modus te bereken gebruik ons die volgende formule:

đ?‘´đ?’? = đ?‘śđ?’Žđ?’? + Waar:

đ?’„ đ?’‡đ?’Ž − đ?’‡đ?’Žmđ?&#x;? đ?&#x;?đ?’‡đ?’Ž − đ?’‡đ?’Žmđ?&#x;? − đ?’‡đ?’ŽUđ?&#x;?

đ?‘‚do

= die laagste waarde van die modale interval

đ?‘?

= die wydte van die modale interval

đ?‘“d

= die frekwensie van die modale interval

đ?‘“dm( = die frekwensie van die interval voor die modale interval đ?‘“dU( = die frekwensie van die interval na die modale interval Formule 1.5: Modus vir kategorieĂŤ

Voorbeeld 1.8 Nota: Hierdie tabel is effens aangepas vir hierdie oefening en is dus nie dieselfde as die tabel wat vir vorige voorbeelde gebruik is nie. Interval

Frekwensies

(10 jaar)

Kumulatiewe frekwensie

18-27

290

290

28-37

400

690

38-47

190

880

48-57

90

970

58-69

30

1 000

Totaal

1 000 Tabel 1.10: Datastel

Bereken die modus. In hierdie geval is die doelwit om te bepaal watter ouderdom die meeste voorkom. Die interval met die meeste frekwensies is 28-37 (met 400 van alle respondente wat in hierdie

Bladsy 46 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes kategorie val). Hierdie is dus die modale interval. Die waardes in die formule kan soos volg vervang word: đ?‘śđ?’Žđ?’?

= đ?&#x;?đ?&#x;– jaar

đ?’„

= đ?&#x;?đ?&#x;Ž jaar

��

= đ?&#x;’đ?&#x;Žđ?&#x;Ž respondente

đ?’‡đ?’Žmđ?&#x;?

= đ?&#x;?đ?&#x;—đ?&#x;Ž respondente (dit sou nul gewees het indien die modale interval ook die eerste interval was)

đ?’‡đ?’ŽUđ?&#x;?

= đ?&#x;?đ?&#x;—đ?&#x;Ž respondente (dit sou nul gewees het indien die modale interval die laaste interval was)

đ?‘´đ?’?

đ?&#x;?đ?&#x;Ž đ?&#x;’đ?&#x;Žđ?&#x;Žmđ?&#x;?đ?&#x;—đ?&#x;Ž

= đ?&#x;?đ?&#x;– +

đ?&#x;? đ?&#x;’đ?&#x;Žđ?&#x;Ž mđ?&#x;?đ?&#x;—đ?&#x;Žmđ?&#x;?đ?&#x;—đ?&#x;Ž đ?&#x;? đ?&#x;?đ?&#x;Žđ?&#x;Ž

= đ?&#x;?đ?&#x;– +

đ?&#x;‘đ?&#x;?đ?&#x;Ž

= đ?&#x;?đ?&#x;– + đ?&#x;‘, đ?&#x;’đ?&#x;’

= đ?&#x;‘đ?&#x;?, đ?&#x;’đ?&#x;’ Dus is die modus 31,44 wat beteken dat die meeste respondente se ouderdom benader kan word na 31,44. Hoe toets ek of my antwoord korrek is? Wat ook al die modus is, dit moet steeds in die modale interval wees. As die modus wat bereken is dus minder as 28 of meer as 37 was, was die antwoord verkeerd. Doen nou Voorbeeld 3.4 in die handboek. v Meetkundige gemiddeld Die meetkundige gemiddeld word gebruik om die gemiddelde persentasie verandering in data te bepaal.

đ?‘Žđ?‘´ = Waar:

đ?’?

đ?’™đ?&#x;? đ?’™đ?&#x;? đ?’™đ?&#x;‘ ‌ đ?’™đ?’?

đ??şđ?‘€

= die meetkundige gemiddeld is

đ?‘›

= steekproefgrootte (aantal observasies wat ingesluit is by die steekproef)

đ?‘Ľ-

= die đ?‘›ste observasie van die stogastiese veranderlike đ?‘Ľ

MS Excel-formule:

=GEOMEAN(datareeks) Formule 1.6: Meetkundige gemiddeld

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 47


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 1.9 Die prys van motors by ʼn spesifieke handelaar het vir die laaste vyf jaar jaarliks gestyg. Die tabel hieronder stel die persentasieverhogings per jaar voor. Jaar

Persentasie

2013

5%

2012

4%

2011

8%

2010

3%

2009

2%

2008

1%

Tabel 1.11: Datastel Bereken die meetkundige gemiddeld van die persentasieverhogings. Die formule is reeds in die handboek gegee en die waardes kan soos volg uiteengesit word: đ?’? = đ?&#x;” jaar đ?’™đ?&#x;? = đ?&#x;“%, đ?’™đ?&#x;? = đ?&#x;’%, đ?’™đ?&#x;‘ = đ?&#x;–%, đ?’™đ?&#x;’ = đ?&#x;‘%, đ?’™đ?&#x;“ = đ?&#x;?% en đ?’™đ?&#x;” = đ?&#x;?%. Vir die doel van hierdie formule word die persentasie egter anders uitgedruk. ʼn 5% verhoging is eintlik 1,05 keer die vorige jaar se bedrag. Dus word 5% as 1,05 uitgedruk. Dus is: đ?‘Žđ?‘´

=

đ?&#x;”

đ?&#x;?, đ?&#x;Žđ?&#x;“Ă—đ?&#x;?, đ?&#x;Žđ?&#x;’Ă—đ?&#x;?, đ?&#x;Žđ?&#x;–Ă—đ?&#x;?, đ?&#x;Žđ?&#x;‘Ă—đ?&#x;?, đ?&#x;Žđ?&#x;?Ă—đ?&#x;?, đ?&#x;Žđ?&#x;? =

đ?&#x;”

đ?&#x;—đ?&#x;”đ?&#x;Ž

= đ?&#x;?, đ?&#x;Žđ?&#x;‘đ?&#x;’ ≈ đ?&#x;‘, đ?&#x;’% Waarom kan ons nie die rekenkundige gemiddeld gebruik nie? Persentasieverhogings behels ʼn faktor waarmee ʼn bedrag (of ander waarde) vermenigvuldig moet word; in die voorbeeld hierbo was dit 1,05 in die eerste jaar. Ons wil dus ʼn gemiddelde faktor bereken waarmee ʼn bedrag jaarliks vermenigvuldig moet word om dieselfde verhoging oor die ses-jaar-periode te verkry. Om hierdie rede is die meetkundige gemiddeld meer akkuraat om gemiddelde persentasieverhogings te bepaal. Die rekenkundige gemiddeld sal egter nuttig wees om die gemiddelde randwaarde van die rente/opbrengs te bepaal.

Bladsy 48 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes Hierdie stelling kan met die volgende voorbeeld gedemonstreer word: ʼn Bedrag van R100 word belê: •

Jaar 1 verdien die bedrag 10% rente. Dus is die rente R10 en die bedrag is R110.

•

Jaar 2 verdien die bedrag (nou R110) 5% rente. Dus is die rente R5,50 en die bedrag is R115,50

•

Jaar 3 verdien die bedrag (nou R115,50) 3% rente. Dus is die rente R3,47 en die bedrag is R118,97.

Die meetkundige gemiddeld van die persentasieverhogings van die bedrag is 1,06 (dus 6%). Die rekenkundige gemiddeld van die rente is

(8ml,lU+,:v +

= đ?‘…6,32.

Dus is die gemiddelde jaarlikse styging 6% (R100 x 1,06) en die gemiddelde jaarlikse rente (in randwaarde) is R6,32. (Nota: In hierdie geval is dit toevallig dat die meetkundige gemiddeld en rekenkundige gemiddeld vir die data dieselfde is. Dit is egter ʼn uitsondering. Die meetkundige gemiddeld is altyd groter of dieselfde as die rekenkundige gemiddeld) Doen nou Voorbeeld 3.5 in die handboek. v Geweegde rekenkundige gemiddeld ʼn Rekenkundige gemiddeld neem aan dat al die datawaardes dieselfde gewig dra (met ander woorde die gewig van

( -

in ʼn steekproef met � observasies. Maar dit is egter nie altyd

die geval nie. Daar is gevalle waar sekere datawaardes swaarder of ligter is as ander en dit moet ook so in berekening gebring word. Die stappe om dit te doen is: 1. Elke observasie (đ?‘ĽO ) word gemaal met die frekwensie (đ?‘“O ) wat daarmee verband hou. 2. Hierdie geweegde observasies word dan bymekaargetel. 3. Die totaal word dan gedeel deur die somtotaal van die gewigte. Die formule wat ons hiervoor gebruik is:

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 49


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

đ?‘Žđ?’†đ?’˜đ?’†đ?’†đ?’ˆđ?’…đ?’† đ?’™ = Waar:

�� �� ��

đ?‘Ľ

= die geweegde gemiddeld

đ?‘“O

= die frekwensie vir die đ?‘– ste observasie

đ?‘ĽO

= die đ?‘– ste observasie van die stogastiese veranderlike đ?‘Ľ Formule 1.7: Geweegde rekenkundige gemiddeld

Voorbeeld 1.10 ʼn Restaurant-eienaar wil graag weet wat die gemiddelde koste per kilogram meel is. Hy het 80kg meel in die vorige maand gekoop. Die meel is by verskillende verskaffers gekoop. Die strokies dui op die volgende aankope: Koste per kilogram

Kilogram

Week 1

R9,50

10

Week 2

R10,00

4

Week 3

R9,80

6

Week 4

R7,40

60

Totaal

R36,70

80kg

Tabel 1.12: Datastel Wat is gemiddelde koste per kilogram? As die rekenkundige gemiddeld gebruik sou word, sou dit maklik wees om die vier weke se koste per kilogram bymekaar te tel en deur 4 te deel. Die antwoord sal egter nie so akkuraat wees nie. Week 4 se bedrag behoort meer gewig te dra, omdat die eienaar meer meel teen daardie prys gekoop het. In ʼn geval waar al die waardes nie dieselfde gewig dra nie, word die geweegde rekenkundige gemiddeld gebruik. Elke waarde word met sy gewig vermenigvuldig, bymekaargetel en dan deur die som van die gewigte (in hierdie geval die totale kilogram) gedeel. Vir ʼn beter illustrasie sal die rekenkundige gemiddeld en geweegde rekenkundige gemiddeld met mekaar vergelyk word: Rekenkundige gemiddeld: �

=

đ?’™đ?’Š đ?’?

Bladsy 50 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

=

đ?&#x;—,đ?&#x;“Uđ?&#x;?đ?&#x;ŽUđ?&#x;—,đ?&#x;–Uđ?&#x;•,đ?&#x;’ đ?&#x;’

= đ?‘šđ?&#x;—, đ?&#x;?đ?&#x;– per kilogram Volgens die rekenkundige gemiddeld het die eienaar gemiddeld R9,18 per kilogram meel betaal. Geweegde rekenkundige gemiddeld: đ?‘Žđ?’†đ?’˜đ?’†đ?’†đ?’ˆđ?’…đ?’† đ?’™ = =

�� �� ��

đ?&#x;—,đ?&#x;“Ă—đ?&#x;?đ?&#x;ŽUđ?&#x;?đ?&#x;ŽĂ—đ?&#x;’Uđ?&#x;—,đ?&#x;–Ă—đ?&#x;”Uđ?&#x;•,đ?&#x;’Ă—đ?&#x;”đ?&#x;Ž đ?&#x;–đ?&#x;Ž

= đ?‘šđ?&#x;•, đ?&#x;—đ?&#x;• per kilogram Omdat die hoeveelheid kilogram wat teen elke prys aangekoop is, ook nou in ag geneem is, verskil die gemiddelde koste per kilogram drasties. In werklikheid het die eienaar dus gemiddeld R7,97 per kilogram betaal. Doen nou Voorbeeld 3.6 in die handboek. 1.8.2

Nie-sentrale maatstawwe van lokaliteit

Bestudeer die handboek paragraaf 3.3. Die vorige maatstawwe van lokaliteit was gemoeid met een of ander “middelpuntâ€? of sentrale punt. Daar is egter maatstawwe van lokaliteit wat nie met die middelpunt van data te make het nie. Hierdie maatstawwe is kwartiele en persentiele. v Kwartiele Kwartiele is maatstawwe wat geordende data in vier ewe groot dele (kwarte) deel. Die statistikus moet die spesifieke waardes bepaal wat sorg dat daar ewe veel waardes in elke kwartiel is. Daar kan tussen die volgende kwartiele onderskei word: •

đ?‘¸đ?&#x;? : Hierdie is die spesifieke waarde wat skeiding maak tussen die laagste 25% van alle waarnemings/observasies en die oorblywende 75%.

•

đ?‘¸đ?&#x;? : Hierdie is die waarde wat presies in die middel van die waardes voorkom en dus die data presies in die helfte deel. (Dit is dus die mediaan van die data.)

•

đ?‘¸đ?&#x;‘ : Hierdie is die waarde wat die boonste 25% van alle waarnemings skei van die oorblywende 75%.

Om ʼn kwartiel te bepaal is eintlik eenvoudig. Die stappe is soos volg: 1. Sorteer die waardes van klein na groot. 2. Bepaal hoeveel waarnemings/observasies (getalle) in die datastel voorkom. Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 51


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 3. Tel 1 by hierdie getal en deel dit deur 4. 4. Die antwoord is die posisie van đ?‘„( (afgerond na die naaste heelgetal).

-U( :

Waar:

đ?‘›

OF 0,25 đ?‘› + 1

= die aantal observasies in die datastel Formule 1.8: Posisie van die eerste kwartiel -U( *

Waar:

đ?‘›

OF 0,5 đ?‘› + 1

= die aantal observasies in die datastel Formule 1.9: Posisie van die tweede kwartiel (mediaan) +(-U() :

Waar:

đ?‘›

OF 0,75 đ?‘› + 1

= die aantal observasies in die datastel Formule 1.10: Posisie van die derde kwartiel

As hierdie posisie gevind is (en afgerond is tot die naaste heelgetal), kan die spesifieke waarde wat by elke kwartiel voorkom, bloot afgelees word. Soms wil ʼn mens egter ʼn meer akkurate kwartiel bereken. Om dit te doen gebruik ons Formule 1.9 hieronder.

đ??žđ?‘¤đ?‘Žđ?‘&#x;đ?‘Ąđ?‘–đ?‘’đ?‘™đ?‘¤đ?‘Žđ?‘Žđ?‘&#x;đ?‘‘đ?‘’ = đ?‘?đ?‘’đ?‘›đ?‘Žđ?‘‘đ?‘’đ?‘&#x;đ?‘‘đ?‘’ đ?‘˜đ?‘¤đ?‘Žđ?‘&#x;đ?‘Ąđ?‘–đ?‘’đ?‘™đ?‘¤đ?‘Žđ?‘Žđ?‘&#x;đ?‘‘đ?‘’ + đ?‘?đ?‘&#x;đ?‘’đ?‘˘đ?‘˜đ?‘‘đ?‘’đ?‘’đ?‘™ đ?‘Łđ?‘Žđ?‘› đ?‘‘đ?‘–đ?‘’ đ?‘˜đ?‘¤đ?‘Žđ?‘&#x;đ?‘Ąđ?‘–đ?‘’đ?‘™ đ?‘ đ?‘’ đ?‘?đ?‘œđ?‘ đ?‘–đ?‘ đ?‘–đ?‘’ Ă— đ?‘‘đ?‘Žđ?‘Žđ?‘&#x;đ?‘œđ?‘? đ?‘Łđ?‘œđ?‘™đ?‘”đ?‘’đ?‘›đ?‘‘đ?‘’ đ?‘˜đ?‘¤đ?‘Žđ?‘&#x;đ?‘Ąđ?‘–đ?‘’đ?‘™ đ?‘ đ?‘’ đ?‘?đ?‘œđ?‘ đ?‘–đ?‘ đ?‘–đ?‘’ − đ?‘‘đ?‘–đ?‘’ đ?‘?đ?‘’đ?‘›đ?‘Žđ?‘‘đ?‘’đ?‘&#x;đ?‘‘đ?‘’ đ?‘˜đ?‘¤đ?‘Žđ?‘&#x;đ?‘Ąđ?‘–đ?‘’đ?‘™đ?‘¤đ?‘Žđ?‘Žđ?‘&#x;đ?‘‘đ?‘’ Formule 1.11: Berekening van die kwartielwaarde Voorbeeld 1.11 Beskou die volgende data. Die onderste ry verteenwoordig die waardes van die data. Die boonste ry dui die plekke van die data aan. 1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

10

30

34

39

40

45

50

67

70

78

79

80

90

92

95

96

97

98

99

99

Bladsy 52 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Die eerste kwartiel se posisie is by: đ?’? + đ?&#x;? đ?&#x;?đ?&#x;Ž + đ?&#x;? đ?&#x;?đ?&#x;? = = = đ?&#x;“, đ?&#x;?đ?&#x;“ đ?&#x;’ đ?&#x;’ đ?&#x;’ As die antwoord afgerond word na die kleiner diskrete waarde (heelgetal), is die posisie 5. Die waarde wat by posisie 5 voorkom, is 40. Hierdie is dus ʼn benaderde waarde van die eerste kwartiel. Om ʼn meer akkurate waarde te bepaal, kan Formule 1.9 gebruik word met die volgende waardes: •

Benaderde kwartielwaarde (hierbo bereken) = 40

•

Breukdeel van kwartielposisie (dus breukdeel van 5,25) = 0,25

•

Waarde na kwartielposisie = waarde by posisie 6 = 45 đ?‘˛đ?’˜đ?’‚đ?’?đ?’•đ?’Šđ?’†đ?’?đ?’˜đ?’‚đ?’‚đ?’“đ?’…đ?’† = đ?&#x;’đ?&#x;Ž + đ?&#x;Ž, đ?&#x;?đ?&#x;“ đ?&#x;’ − đ?&#x;’đ?&#x;Ž = đ?&#x;’đ?&#x;Ž + đ?&#x;?, đ?&#x;?đ?&#x;“ = đ?&#x;’đ?&#x;?, đ?&#x;?đ?&#x;“

Dus: 25% van alle waardes is kleiner of gelyk aan 41,25. (Nota: Vir die benaderde posisie in bogenoemde formule word die posisie afgerond na die kleiner diskrete waarde.)

Doen self: •

Bereken nou die derde kwartiel (đ?‘¸đ?&#x;‘ ) van die data hierbo genoem. (Die antwoord is 95,75.)

•

Doen nou Voorbeeld 3.7 in die handboek.

MS Excel-formule:

=QUARTILE.EXC(datareeks,1)

Formule 1.12: MS Excel-formule om die eerste kwartiel te vind

MS Excel-formule:

=QUARTILE.EXC(datareeks,3)

Formule 1.13: MS Excel-formule om die derde kwartiel te vind

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 53


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Soos met die mediaan, is die volledige data nie altyd beskikbaar nie, maar slegs kategorieĂŤ. Hier is die formules wat ons gebruik:

đ?‘„( = đ?‘‚Ĺ’( + Waar:

đ?‘?

:

− đ?‘“(<) đ?‘“Ĺ’(

đ?‘„(

= die waarde van die eerste kwartiel

đ?‘‚Ĺ’(

= die kleinste waarde van die đ?‘„( interval

đ?‘›

= steekproefgrootte

đ?‘“(<) = die kumulatiewe frekwensie van die interval voor die đ?‘„( interval đ?‘?

= die intervalwydte

đ?‘“Ĺ’(

= die frekwensie van die đ?‘„( interval Formule 1.14: Berekening van die eerste kwartiel vir kategorieĂŤ

đ?‘„+ = đ?‘‚Ĺ’+ + Waar:

đ?‘?

:

− đ?‘“(<) đ?‘“Ĺ’+

đ?‘„+

= die waarde van die derde kwartiel

đ?‘‚Ĺ’+

= die kleinste waarde van die đ?‘„+ interval

đ?‘›

= steekproefgrootte

đ?‘“(<) = die kumulatiewe frekwensie van die interval voor die đ?‘„+ interval đ?‘?

= die intervalwydte

đ?‘“Ĺ’+

= die frekwensie van die đ?‘„+ interval Formule 1.15: Berekening van die derde kwartiel vir kategorieĂŤ

Doen self: Doen nou Voorbeeld 3.8 in die handboek. v Persentiele ʼn Persentiel is soortgelyk aan ʼn kwartiel. Waar kwartiele die data in kwarte deel, sal persentiele die data in 100 gelyke dele deel. Die 25ste en 75ste persentiele is dus dieselfde as die eerste en derde kwartiele. Die 50ste persentiel is dan ook dieselfde as die 2de kwartiel, wat gelyk is aan die mediaan. Om die persentiele te bereken is soortgelyk aan die formules vir kwartiele. Om die posisie van die đ?‘?de persentiel te bereken word die volgende formule gebruik:

Bladsy 54 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

đ?‘›+1 đ?‘? Waar:

đ?‘›

= steekproefgrootte

đ?‘?

= die betrokke persentiel Formule 1.16: Berekening van die đ?’‘de persentiel se posisie

Om die 32ste persentiel te vind is die posisie daarvan 0,32(đ?‘› + 1). Om die 60ste persentiel te vind is die posisie daarvan 0,6(đ?‘› + 1). Die waarde van die persentiel word dan op dieselfde manier bereken as die kwartiele.

MS Excel-formule:

=PERCENTILE.EXC(datareeks,0.32)

MS Excel-formule:

=PERCENTILE.EXC(datareeks,0.60)

Formule 1.17: MS Excel-formule om die 32ste en 60ste persentiel te vind 1.8.3

Maatstawwe van spreiding

Bestudeer die handboek paragraaf 3.4. Verdeling verwys na die mate waarop datawaardes van ʼn numeriese stogastiese veranderlike versprei is rondom die sentrale waarde (Wegner, 2016: 79). Kyk na die volgende figuur as ʼn praktiese voorstelling van verdeling:

Figuur 1.14: Voorbeelde van verdeling Alhoewel elkeen van hierdie groepe dieselfde gemiddeld het, is die datawaardes se verdeling rondom hierdie gemiddeld anders. Dus het dit ʼn impak op die vertroue waarmee die maatstawwe van lokaliteit gebruik kan word.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 55


GQM105 Inleiding tot elementêre kwantitatiewe metodes As ʼn eenvoudige reÍl is data wat ʼn groter verdeling het minder betroubaar en waar die data ʼn kleiner verdeling het meer betroubaar. Waar ons later hierdie statistieke gaan gebruik om afleidings te maak van die populasie, sal ons sien wat die impak van verdeling is op ons beramings. v Die reikwydte Die reikwydte is reeds vroeÍr bespreek. Hierdie statistiek bepaal bloot hoe ver die grootste en kleinste waardes van mekaar is.

đ?’“đ?’†đ?’Šđ?’Œđ?’˜đ?’šđ?’…đ?’•đ?’† = đ?’™đ?’Žđ?’‚đ?’Œđ?’” − đ?’™đ?’Žđ?’Šđ?’? Waar:

đ?‘Ľdâ€˘â€˘â€˜ = die grootste observasie in die datastel đ?‘ĽdO- = die kleinste observasie in die datastel

MS Excel-formule:

=MAX(datareeks)-MIN(datareeks) Formule 1.18: Reikwydte

Voorbeeld 1.12 Bereken die reikwydte van die volgende getalle: 14

15

16

13

90

95

Die formule vir die reikwydte word as Formule 3.9 in die handboek weergegee: đ?’™đ?’Žđ?’‚đ?’Œđ?’” = đ?&#x;—đ?&#x;“ đ?’™đ?’Žđ?’Šđ?’?

= đ?&#x;?đ?&#x;‘ đ?’“đ?’†đ?’Šđ?’Œđ?’˜đ?’šđ?’…đ?’•đ?’†

= đ?’™đ?’Žđ?’‚đ?’Œđ?’” − đ?’™đ?’Žđ?’Šđ?’? = đ?&#x;—đ?&#x;“ − đ?&#x;?đ?&#x;‘ = đ?&#x;–đ?&#x;?

Die reikwydte is dus 82. Hierdie groot reikwydte behoort alreeds ʼn aanduiding te gee dat die gemiddeld deur groot verskille in die waardes beïnvloed kan word. (As die reikwydte, byvoorbeeld, 2 of 3 was, sou die gemiddeld moontlik baie meer betroubaar gewees het). Die reikwydte word egter deur uitskieters beïnvloed. Daarom word meer akkurate maatstawwe van spreiding benodig. Doen Voorbeeld 3.9 in die handboek.

Bladsy 56 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes v Variansie Die variansie is ʼn maatstaf van hoe ver al die observasies �( , �* , �+ , ‌ , �- verwyder is vanaf die sentrale waarde van die datastel, die steekproefgemiddeld � . Uit hierdie stelling kan ons aanvaar dat die variansie ʼn verwerkte afstand is (dit is die afstand tussen die observasies en die gemiddeld).

Figuur 1.15: Voorstelling van die afstand tussen die observasie en die gemiddeld Dus moet ons die afstand tussen die observasie en die gemiddeld bereken đ?‘ĽO − đ?‘Ľ . Wanneer ons hierdie waardes almal bymekaartel, moet die antwoord altyd nul (0) wees, đ?‘ĽO − đ?‘Ľ = 0; omdat die steekproefgemiddeld presies in die middel van al die observasies val, gaan ons positiewe en negatiewe waardes kry wat mekaar heeltemal uitkanselleer. Om slegs positiewe waardes te kry kwadreer ons hierdie berekening, đ?‘ĽO − đ?‘Ľ * .

đ?’”đ?&#x;? = Waar:

đ?’™đ?’Š − đ?’™ đ?’?−đ?&#x;?

đ?&#x;?

đ?‘ *

= variansie van die steekproef

đ?‘ĽO

= die đ?‘– ste observasie van die stogastiese veranderlike đ?‘Ľ

đ?‘Ľ

= die steekproefgemiddeld

đ?‘›

= steekproefgrootte

MS Excel-formule:

=VAR.S(datareeks) Formule 1.19: Variansie

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 57


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Hierdie formule mag intimiderend lyk. Dit is egter heel eenvoudig. Voorbeeld 1.13 Kyk na die volgende datastel: 13

8

9

15

13

9

12

Die gemiddeld van hierdie datastel is 11,3 en die steekproefgrootte is 7 (daar is 7 observasies in die datastel). Die variansie word dus soos volg bereken: đ?’”đ?&#x;?

đ?&#x;?đ?&#x;‘ − đ?&#x;?đ?&#x;?, đ?&#x;‘

= =

đ?’™đ?’Š mđ?’™ đ?&#x;?

=

đ?’?mđ?&#x;? đ?&#x;?

+ đ?&#x;– − đ?&#x;?đ?&#x;?, đ?&#x;‘

đ?&#x;?

+ đ?&#x;— − đ?&#x;?đ?&#x;?, đ?&#x;‘ đ?&#x;? + đ?&#x;?đ?&#x;“ − đ?&#x;?đ?&#x;?, đ?&#x;‘ đ?&#x;•âˆ’đ?&#x;?

đ?&#x;?

+ â‹Ż + đ?&#x;?đ?&#x;? − đ?&#x;?đ?&#x;?, đ?&#x;‘

đ?&#x;?

đ?&#x;’đ?&#x;?, đ?&#x;’đ?&#x;‘ đ?&#x;”

= đ?&#x;”, đ?&#x;—đ?&#x;Žđ?&#x;“ Een van die eienskappe van ʼn variansie is dat dit sensitief is vir uitskieters. ʼn Uitskieter is ʼn observasie wat buite die algemene groepering van observasies val. Dit kan ʼn waarde wees wat aansienlik groter of kleiner is as die ander. Wanneer ons met ʼn variansie werk, kan dit ʼn drastiese effek op die resultaat hĂŞ. Voorbeeld 1.12 (vervolg) Kyk weer na die verskillende ouderdomme. 14

15

16

13

90

95

Die gemiddeld van hierdie datastel is 40,5 en die steekproefgrootte is 6. Die getalle en die gemiddeld word op die getallelyn hieronder aangedui:

Bereken die variansie: đ?’”đ?&#x;?

= = =

đ?’™đ?’Š mđ?’™ đ?&#x;? đ?’?mđ?&#x;? đ?&#x;?đ?&#x;’mđ?&#x;’đ?&#x;Ž,đ?&#x;“ đ?&#x;? U đ?&#x;?đ?&#x;“mđ?&#x;’đ?&#x;Ž,đ?&#x;“ đ?&#x;? U đ?&#x;?đ?&#x;”mđ?&#x;’đ?&#x;Ž,đ?&#x;“ đ?&#x;? U đ?&#x;?đ?&#x;‘mđ?&#x;’đ?&#x;Ž,đ?&#x;“ đ?&#x;? U đ?&#x;—đ?&#x;Žmđ?&#x;’đ?&#x;Ž,đ?&#x;“ đ?&#x;? U đ?&#x;—đ?&#x;“mđ?&#x;’đ?&#x;Ž,đ?&#x;“ đ?&#x;? đ?&#x;”mđ?&#x;? đ?&#x;– đ?&#x;?đ?&#x;?đ?&#x;—,đ?&#x;“ đ?&#x;“

= đ?&#x;? đ?&#x;”đ?&#x;?đ?&#x;“, đ?&#x;—

Bladsy 58 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Wanneer ons die berekening doen op dieselfde datastel, sonder die twee uitskieters, sien ons dat dit ʼn reuseverskil maak. đ?’”đ?&#x;?

=

đ?&#x;?đ?&#x;’mđ?&#x;?đ?&#x;’,đ?&#x;“ đ?&#x;? U đ?&#x;?đ?&#x;“mđ?&#x;?đ?&#x;’,đ?&#x;“ đ?&#x;? U đ?&#x;?đ?&#x;”mđ?&#x;?đ?&#x;’,đ?&#x;“ đ?&#x;? U đ?&#x;?đ?&#x;‘mđ?&#x;?đ?&#x;’,đ?&#x;“ đ?&#x;? đ?&#x;’mđ?&#x;?

đ?&#x;“

= đ?&#x;‘

= đ?&#x;?, đ?&#x;”đ?&#x;”đ?&#x;”đ?&#x;• Doen nou Voorbeeld 3.10 in die handboek. v Standaardafwyking As ons na die variansie kyk, is dit moeilik om die resultaat te interpreteer omdat dit nie in dieselfde eenheid is as wat die data is nie. Om hierdie rede verkies ons om eerder ʼn standaardafwyking te gebruik.

đ?‘ = Waar:

đ?‘

= die steekproef se standaardafwyking

đ?‘ *

= die steekproef se variansie

đ?‘ =

Waar:

đ?‘ *

đ?‘ĽO − đ?‘Ľ đ?‘›âˆ’1

*

đ?‘

= die steekproef se standaardafwyking

đ?‘ĽO

= die đ?‘– ste observasie van die stogastiese veranderlike đ?‘Ľ

đ?‘Ľ

= die steekproefgemiddeld

đ?‘›

= steekproefgrootte

MS Excel-formule:

=STDEV.S(datareeks) Formule 1.20: Standaardafwyking

Voorbeeld 1.12 (vervolg) As ons die twee variansies, wat ons in die vorige voorbeeld bereken het, vat, kan ons nou voortgaan om die betrokke standaardafwykings te bereken: Vir die variansie van 1 625,9: đ?’”

= đ?’”đ?&#x;? =

đ?&#x;? đ?&#x;”đ?&#x;?đ?&#x;“, đ?&#x;—

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 59


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = đ?&#x;’đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;“ ≈ đ?&#x;’đ?&#x;Ž Vir die variansie van 1,6667: =

đ?&#x;?, đ?&#x;”đ?&#x;”đ?&#x;”đ?&#x;•

= đ?&#x;?, đ?&#x;?đ?&#x;—đ?&#x;? ≈ đ?&#x;? So, wat beteken ʼn standaardafwyking van 40 jaar? Dit beteken dat die afstand tussen die gemiddeld en die observasies 40 jaar is, dus is die verdeling van hierdie waardes baie groot. ʼn Standaardafwyking van 1 jaar, aan die ander hand, is baie kleiner en dus sal die beskrywende statistiek van hierdie steekproef meer betroubaar wees as diĂŠ van die eerste steekproef. Terselfdertyd wys dit ook wat die effek kan wees van twee uitskieters wat drasties anders is as die ander observasies. Wees dus altyd versigtig vir uitskieters, veral met statistieke (soos die standaardafwyking) wat sensitief is vir uitskieters.

Doen nou Voorbeeld 3.10 en 3.11 in die handboek. As jy weet wat die steekproef se gemiddeld en standaardafwyking is, kan jy maklik enige observasie binne daardie konteks interpreteer. Kyk na Figuur 1.16 hieronder:

Bladsy 60 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 1.16: Persentasie (%) van die observasies wat tussen 1, 2 en 3 standaardafwykings vanaf die gemiddeld is Met die eerste oogopslag lyk dit baie intimiderend, maar as jy weet waarvoor om te kyk kan jy baie vinnig en baie maklik ʼn gevolgtrekking maak oor die betroubaarheid van ʼn statistiek. Figuur 1.16 hierbo wys die persentasie van die observasies wat tussen 1, 2 en 3 standaardafwykings vanaf die gemiddeld lê: •

68,3% van al die observasies sal binne een standaardafwyking vanaf die gemiddeld lĂŞ en die limiete kan soos volg bereken word: onderste limiet is (đ?‘Ľ − đ?‘ ) en die boonste limiet đ?‘Ľ + đ?‘ .

•

95,5% van al die observasies sal binne twee standaardafwykings vanaf die gemiddeld lĂŞ en die limiete kan soos volg bereken word: onderste limiet is (đ?‘Ľ − 2đ?‘ ) en die boonste limiet đ?‘Ľ + 2đ?‘ .

•

99,7% van al die observasies sal binne drie standaardafwykings vanaf die gemiddeld lĂŞ en die limiete kan soos volg bereken word: onderste limiet is (đ?‘Ľ − 3đ?‘ ) en die boonste limiet đ?‘Ľ + 3đ?‘ .

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 61


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 1.12 (vervolg) As ons aangaan met die twee voorbeelde van vroeĂŤr kan ons die onderskeie intervalle bereken. Ons het reeds die volgende statistieke bereken: đ?’™ = đ?&#x;’đ?&#x;Ž, đ?&#x;“ đ?’” = đ?&#x;’đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;“ 1 standaardafwyking interval (đ?’™ − đ?’”: đ?’™ + đ?’”) = (đ?&#x;’đ?&#x;Ž, đ?&#x;“ − đ?&#x;’đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;“: đ?&#x;’đ?&#x;Ž, đ?&#x;“ + đ?&#x;’đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;“) = (đ?&#x;Ž, đ?&#x;?đ?&#x;•đ?&#x;•đ?&#x;“: đ?&#x;–đ?&#x;Ž, đ?&#x;–đ?&#x;?đ?&#x;?đ?&#x;“) 2 standaardafwyking interval (đ?’™ − đ?&#x;?đ?’”: đ?’™ + đ?&#x;?đ?’”) = (đ?&#x;’đ?&#x;Ž, đ?&#x;“ − đ?&#x;?Ă—đ?&#x;’đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;“: đ?&#x;’đ?&#x;Ž, đ?&#x;“ + đ?&#x;?Ă—đ?&#x;’đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;“) = (−đ?&#x;’đ?&#x;Ž, đ?&#x;?đ?&#x;’đ?&#x;“: đ?&#x;?đ?&#x;?đ?&#x;?, đ?&#x;?đ?&#x;’đ?&#x;“) 3 standaardafwyking interval (đ?’™ − đ?&#x;‘đ?’”: đ?’™ + đ?&#x;‘đ?’”) = (đ?&#x;’đ?&#x;Ž, đ?&#x;“ − đ?&#x;‘Ă—đ?&#x;’đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;“: đ?&#x;’đ?&#x;Ž, đ?&#x;“ + đ?&#x;‘Ă—đ?&#x;’đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;“) = (−đ?&#x;–đ?&#x;Ž, đ?&#x;’đ?&#x;”đ?&#x;•đ?&#x;“: đ?&#x;?đ?&#x;”đ?&#x;?, đ?&#x;’đ?&#x;”đ?&#x;•đ?&#x;“) Ons kan sien dat hierdie intervalle absurd groot is as mens in ag neem dat die natuurlike mens nooit jonger as 0 jaar en baie selde ouer as 120 jaar word. Kom ons kyk nou na die volgende voorbeeld Ons het reeds die volgende statistieke bereken: đ?’™ = đ?&#x;?đ?&#x;’, đ?&#x;“ đ?’” = đ?&#x;?, đ?&#x;?đ?&#x;—đ?&#x;? 1 standaardafwyking interval (đ?’™ − đ?’”: đ?’™ + đ?’”) = (đ?&#x;?đ?&#x;’, đ?&#x;“ − đ?&#x;?, đ?&#x;?đ?&#x;—đ?&#x;?: đ?&#x;?đ?&#x;’, đ?&#x;“ + đ?&#x;?, đ?&#x;?đ?&#x;—đ?&#x;?) = (đ?&#x;?đ?&#x;‘, đ?&#x;?đ?&#x;Žđ?&#x;—: đ?&#x;?đ?&#x;“, đ?&#x;•đ?&#x;—đ?&#x;?) 2 standaardafwyking interval (đ?’™ − đ?&#x;?đ?’”: đ?’™ + đ?&#x;?đ?’”) = (đ?&#x;?đ?&#x;’, đ?&#x;“ − đ?&#x;?Ă—đ?&#x;?, đ?&#x;?đ?&#x;—đ?&#x;?: đ?&#x;?đ?&#x;’, đ?&#x;“ + đ?&#x;?Ă—đ?&#x;?, đ?&#x;?đ?&#x;—đ?&#x;?) = (đ?&#x;?đ?&#x;?, đ?&#x;—đ?&#x;?đ?&#x;–: đ?&#x;?đ?&#x;•, đ?&#x;Žđ?&#x;–đ?&#x;?) 3 standaardafwyking interval (đ?’™ − đ?&#x;‘đ?’”: đ?’™ + đ?&#x;‘đ?’”) = (đ?&#x;?đ?&#x;’, đ?&#x;“ − đ?&#x;‘Ă—đ?&#x;?, đ?&#x;?đ?&#x;—đ?&#x;?: đ?&#x;?đ?&#x;’, đ?&#x;“ + đ?&#x;‘Ă—đ?&#x;?, đ?&#x;?đ?&#x;—đ?&#x;?) = (đ?&#x;?đ?&#x;Ž, đ?&#x;”đ?&#x;?đ?&#x;•: đ?&#x;?đ?&#x;–, đ?&#x;‘đ?&#x;•đ?&#x;‘) As ons dus ʼn ouderdom van 14 kry, is dit een van die waardes wat binne die eerste standaardafwyking val. ʼn Ouderdom van 16 sal binne twee standaardafwykings lĂŞ en ʼn ouderdom van 18 binne drie standaardafwykings. Waardes van 90 en 95 lĂŞ vĂŞr buite drie afwykings en verskil drasties van 99,7% van hierdie

Bladsy 62 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes steekproef se observasies. Daarom verwys ons na hierdie waardes as uitskieters en omdat die waarskynlikheid daarvan so klein is, is dit weglaatbaar. Om hierdie rede verwyder ons gewoonlik uitskieters uit ʼn steekproef. v VariansiekoÍffisiÍnt ʼn Ander statistiek wat ons kan gebruik om meer te leer oor die verdeling van ons datastel, is die variansiekoÍffisiÍnt. Dit is eenvoudig die verhouding van die standaardafwyking teenoor die gemiddeld van ʼn steekproef en dit gee vir ons die relatiewe grootte van die standaardafwyking.

đ?‘Şđ?‘˝ = Waar:

đ?’” đ?’™

đ??śđ?‘‰

= variansiekoĂŤffisiĂŤnt

đ?‘

= standaardafwyking van die steekproef

đ?‘Ľ

= gemiddeld van die steekproef

Nota: Hierdie verhouding word as ʼn persentasie uitgedruk. Formule 1.21: VariansiekoÍffisiÍnt Die variansiekoÍffisiÍnt kan nooit kleiner as 0 wees nie, maar daar is geen beperking op sy boonste limiet nie. Voorbeeld 1.12 (vervolg) As ons aangaan met die voorbeeld van die ouderdomme kan die volgende twee variansiekoÍffisiÍnte bereken word: �� =

đ?&#x;’đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;“ = đ?&#x;Ž, đ?&#x;—đ?&#x;—đ?&#x;“đ?&#x;” = đ?&#x;—đ?&#x;—, đ?&#x;“đ?&#x;”% đ?&#x;’đ?&#x;Ž, đ?&#x;“

đ?‘Şđ?‘˝ =

đ?&#x;?, đ?&#x;?đ?&#x;—đ?&#x;? = đ?&#x;Ž, đ?&#x;Žđ?&#x;–đ?&#x;—đ?&#x;Ž = đ?&#x;–, đ?&#x;—% đ?&#x;?đ?&#x;’, đ?&#x;“

Hoe kleiner die variansiekoĂŤffisiĂŤnt, hoe kleiner is die verdeling van die data om die gemiddeld. Hoe groter die variansiekoĂŤffisiĂŤnt, hoe groter is die verdeling van die data om die gemiddeld. Doen nou Voorbeeld 3.12 in die handboek.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 63


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.8.4

Maatstawwe van skeefheid

Bestudeer die handboek paragrawe 3.5-3.6. Die wyse waarop data rondom die gemiddeld versprei is, kan grafies en numeries voorgestel word. ʼn Histogram met relatiewe klein intervalle, kan hierdie data grafies voorstel. Daar word onderskei tussen drie wyses waarop data rondom die gemiddeld versprei word: v Simmetrie Die waardes word simmetries rondom die gemiddeld versprei. Dit beteken dat die frekwensies van waardes aan die linkerkant en die frekwensies van waardes aan die regterkant ooreenstem. Figuur 1.17 hieronder is ʼn voorbeeld van ʼn simmetriese verdeling. (Die handboek gebruik ʼn lyngrafiek om hierdie verdelings voor te stel. Vir alle verdere verduidelikings sal lyngrafieke gebruik word).

Figuur 1.17: 'n Simmetriese verdeling van data In bogenoemde grafiek is die gemiddeld, die mediaan en die modus dieselfde getal. v Positiewe skeefheid Die waardes met die grootste frekwensies sal na die linkerkant van die gemiddeld neig. Die "stert" gedeelte is dus aan die regterkant (die positiewe kant). Figuur 1.18 stel ʼn dataverdeling voor wat positief skeef is.

Bladsy 64 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1.18: ’n Datastel wat positief skeef is In bogenoemde datastel sal die mediaan kleiner as die gemiddeld wees. Die modus sal egter die kleinste getal wees. v Negatief skeef In hierdie geval sal die grootste frekwensies aan die regterkant van die gemiddeld voorkom. Die waardes wat dus die meeste voorkom, sal almal groter as die gemiddeld wees. Die “stert”-gedeelte is dus aan die linkerkant (die negatiewe kant). Figuur 1.19 stel ʼn datastel voor wat negatief skeef is.

Figuur 1.19: ’n Datastel wat negatief skeef is

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 65


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes In hierdie geval sal die gemiddeld die kleinste wees, gevolg deur die mediaan en dan deur die modus. v Pearson se koĂŤffisiĂŤnt van skeefheid Hoewel data se simmetrie grafies voorgestel kan word, is dit ook moontlik om bereken te word. Hiervoor word Pearson se koĂŤffisiĂŤnt van skeefheid đ?‘†đ?‘˜Ëœ gebruik.

đ?‘şđ?’Œđ?’‘ = Waar:

đ?’? đ?’™đ?’Š − đ?’™ đ?&#x;‘ đ?’? − đ?&#x;? đ?’? − đ?&#x;? đ?’”đ?&#x;‘

đ?‘†đ?‘˜Ëœ

= Pearson se koĂŤffisiĂŤnt van skeefheid

đ?‘›

= steekproefgrootte

đ?‘ĽO

= die đ?‘– ste observasie van die stogastiese veranderlike đ?‘Ľ

đ?‘Ľ

= die steekproefgemiddeld

đ?‘

= die steekproef se standaardafwyking

Nota: Let op die magte wat in hierdie formule gebruik word. Formule 1.22: Pearson se koĂŤffisiĂŤnt van skeefheid Hierdie statistiek kan ook soos volg beraam word:

��� = Waar:

đ?&#x;‘ đ?’™ − đ?‘´đ?’† đ?’”

đ?‘Ľ

= steekproefgemiddeld

đ?‘€e

= steekproefmediaan

đ?‘

= steekproefstandaardafwyking Formule 1.23: Beraming van Pearson se koĂŤffisiĂŤnt van skeefheid

Eienskappe van Pearson se koÍffisiÍnt van skeefheid: •

Vir đ?‘†đ?‘˜Ëœ = 0 is die verdeling van die observasies simmetries.

•

Vir đ?‘†đ?‘˜Ëœ > 0 is die verdeling positief skeef.

•

Vir đ?‘†đ?‘˜Ëœ < 0 is die verdeling negatief skeef.

Bladsy 66 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 1.14 Die volgende punte is verkry uit ʼn toets wat studente afgelê het: 24

27

36

48

52

52

53

53

59

60

85

90

95

Bereken nou die volgende statistieke: 1.

Steekproefgemiddeld: đ?’™

2.

=

đ?’™đ?’Š đ?’?

đ?&#x;?đ?&#x;‘

= đ?&#x;“đ?&#x;”, đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“

đ?’™đ?’Š mđ?’™ đ?&#x;?

=

đ?’?mđ?&#x;? đ?&#x;?đ?&#x;’mđ?&#x;“đ?&#x;”,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“ đ?&#x;? U đ?&#x;?đ?&#x;•mđ?&#x;“đ?&#x;”,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“ đ?&#x;? U đ?&#x;‘đ?&#x;”mđ?&#x;“đ?&#x;”,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“ đ?&#x;? Uâ‹ŻU đ?&#x;—đ?&#x;“mđ?&#x;“đ?&#x;”,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“ đ?&#x;?

=

đ?&#x;?đ?&#x;‘mđ?&#x;? đ?&#x;“ đ?&#x;—đ?&#x;?đ?&#x;—,đ?&#x;?đ?&#x;‘đ?&#x;Žđ?&#x;–

=

đ?&#x;?đ?&#x;?

= đ?&#x;?đ?&#x;?, đ?&#x;?đ?&#x;Žđ?&#x;—đ?&#x;•

Steekproefmediaan: đ?’™

4.

đ?&#x;•đ?&#x;‘đ?&#x;’

Steekproefvariansie: đ??Ź

3.

=

= đ?&#x;“đ?&#x;‘ (die middelste waarde)

Pearson se koĂŤffisiĂŤnt van skeefheid: đ?‘şđ?’Œđ?’‘

=

đ?’™đ?’Š mđ?’™ đ?&#x;‘

đ?’?

đ?’?mđ?&#x;? đ?’?mđ?&#x;? đ?’”đ?&#x;‘

= =

đ?&#x;?đ?&#x;‘ đ?&#x;?đ?&#x;’mđ?&#x;“đ?&#x;”,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“ đ?&#x;‘ U đ?&#x;?đ?&#x;•mđ?&#x;“đ?&#x;”,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“ đ?&#x;‘ U đ?&#x;‘đ?&#x;”mđ?&#x;“đ?&#x;”,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“ đ?&#x;‘ Uâ‹ŻU đ?&#x;—đ?&#x;“mđ?&#x;“đ?&#x;”,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“ đ?&#x;‘ đ?&#x;?đ?&#x;‘mđ?&#x;? đ?&#x;?đ?&#x;‘mđ?&#x;? đ?&#x;?đ?&#x;?,đ?&#x;?đ?&#x;Žđ?&#x;—đ?&#x;• đ?&#x;‘ đ?&#x;?đ?&#x;‘ đ?&#x;’đ?&#x;— đ?&#x;Žđ?&#x;“đ?&#x;’,đ?&#x;–đ?&#x;”đ?&#x;‘đ?&#x;— đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;Ž đ?&#x;—đ?&#x;“đ?&#x;“,đ?&#x;‘đ?&#x;’đ?&#x;’đ?&#x;“

=

đ?&#x;”đ?&#x;‘đ?&#x;• đ?&#x;•đ?&#x;?đ?&#x;‘,đ?&#x;?đ?&#x;‘đ?&#x;? đ?&#x;? đ?&#x;’đ?&#x;’đ?&#x;” đ?&#x;?đ?&#x;Žđ?&#x;“,đ?&#x;’đ?&#x;“

= đ?&#x;Ž, đ?&#x;’đ?&#x;’đ?&#x;?đ?&#x;Ž

5. Beraming van Pearson se koÍffisiÍnt: ��� = =

đ?&#x;‘ đ?’™mđ?‘´đ?’† đ?’”

đ?&#x;‘ đ?&#x;“đ?&#x;”,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“mđ?&#x;“đ?&#x;‘ đ?&#x;?đ?&#x;?,đ?&#x;?đ?&#x;Žđ?&#x;—đ?&#x;•

=

đ?&#x;‘ đ?&#x;“,đ?&#x;’đ?&#x;”đ?&#x;?đ?&#x;“ đ?&#x;?đ?&#x;?,đ?&#x;?đ?&#x;Žđ?&#x;—đ?&#x;•

= đ?&#x;Ž, đ?&#x;’đ?&#x;”đ?&#x;•đ?&#x;”

As ons die resultate van berekeninge 4 en 5 interpreteer, kan ons sien dat beide waardes groter is as 0, dus is die gegewe punte positief skeef versprei.

Doen Voorbeeld 3.13 in die handboek. v Die houer-en-stippingsgrafiek Die houer-en-stippingsgrafiek is ʼn basiese opsomming van die maatstawwe van lokaliteit, spreiding en skeefheid, in een. Dit bestaan uit die volgende statistieke:

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 67


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

Die laagste waarde đ?‘ĽdO-

•

Die eerste kwartiel đ?‘„(

•

Die mediaan đ?‘€e

•

Die derde kwartiel đ?‘„+

•

Die hoogste waarde đ?‘Ľdâ€˘â€˘â€˜

Bestudeer paragraaf 3.6 in die handboek om meer inligting ten opsigte van die houer-enstipping-grafiek te vind. Dit is belangrik dat ʼn houer-en-stipping-grafiek geïnterpreteer kan word. Voorbeeld 1.15 Beskou die volgende punte van ʼn klastoets wat studente afgelê het: 54

41

62

45

61

15

61

58

48

60

3

29

65

53

64

43

70

49

35

77

56

43

66

78

94

24

Die volgende statistieke kan bereken word as: •

Die laagste waarde, đ?’™đ?’Žđ?’Šđ?’? = đ?&#x;‘

•

Die eerste kwartiel, đ?‘¸đ?&#x;? = đ?&#x;’đ?&#x;?, đ?&#x;“

•

Die mediaan, đ?‘´đ?’† = đ?&#x;“đ?&#x;“

•

Die derde kwartiel, đ?‘¸đ?&#x;‘ = đ?&#x;”đ?&#x;’. đ?&#x;?đ?&#x;“

•

Die hoogste waarde, đ?’™đ?’Žđ?’‚đ?’Œđ?’” = đ?&#x;—đ?&#x;’

Hierdie statistieke kan gebruik word om die volgende houer-en-stippingsgrafiek te teken:

Bladsy 68 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1.20: Houer-en-stippingsgrafiek Uit die berekende statistieke en die houer-en-stippingsgrafiek kan ons die volgende sien: •

Die kleinste waarde, naamlik 3, lê buite die onderste limiet.

Die spasie tussen die mediaan en eerste kwartiel is groter as die spasie tussen die mediaan en die derde kwartiel.

Ons kan dus die volgende gevolgtrekkings maak: •

3 is ʼn uitskieter; en

die verdeling is negatief skeef.

Nota: http://www.alcula.com/calculators/statistics/box-plot/ is gebruik om die houer-enstippingsgrafiek hierbo te genereer.

Doen nou Voorbeeld 3.14 in die handboek. 1.8.5

Keuse van statistiek

Dit is belangrik om te weet wanneer om watter beskrywende statistiek te gebruik. Werk deur paragraaf 3.8.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 69


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.8.6

Beskrywende statistiek in MS Excel en die data-analise-invoegsel

In die wêreld buite die studiesentrum word statistieke feitlik nooit suiwer met die hand bereken nie. In die praktyk gaan jy altyd een of ander programmatuur moet gebruik om die statistieke te bereken. Om hierdie rede word die MS Excel-formules gegee saam met die wiskundige formules. Jy gaan moet weet hoe om beide te kan gebruik. MS Excel het verder ʼn data-analise-invoegsel wat gebruik kan word vir meer komplekse analises. Ongelukkig moet hierdie invoegsel eers geaktiveer word alvorens jy dit kan gebruik: 1. Maak dokument in MS Excel oop. 2. Gaan na File > Options > Add-ins

Figuur 1.21: MS Excel se invoegselskerm

Bladsy 70 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 3. Kies die Analysis ToolPak en kliek op die Go knoppie. Die volgende skerm sal oopmaak:

Figuur 1.22: MS Excel se invoegselskerm 4. Merk die blokkie by Analysis ToolPak en kliek op die OK-knoppie. Jy behoort nou die dataverwerkingsmodule (Analysis ToolPak) op die Data tab te sien:

Figuur 1.23: Data-analise module 1.8.7

Selfevalueringsvrae

Doen al die oefeninge aan die einde van Hoofstuk 3. Daar is 26 oefeninge. As jy hierdie vrae korrek kan beantwoord, het jy numeriese beskrywende statistiek onder die knie!

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 71


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 1.9

Samevatting

Statistiek is ʼn versameling beginsels en tegnieke wat gebruik kan word om data na inligting om te skakel sodat dit vir besluitneming gebruik kan word. Dit is dus belangrik dat hierdie data van hoÍ kwaliteit is. Data kan kwalitatief of kwantitatief wees. Kwalitatiewe data kan in woorde beskryf word, maar kan ook numeries voorgestel word. Data kan ook diskreet of kontinu wees. Die vlakke waarop data gemeet kan word, is (van die laagste na die hoogste vlak) nominaal, ordinaal, interval en ratio. Data kan, onder andere, deur observasies, vraelyste en eksperimente versamel word.

Bladsy 72 Studie-eenheid 1: Basiese beginsels en beskrywende statistiek


GQM105 Inleiding tot elementêre kwantitatiewe metodes

STUDIE-EENHEID 2: WAARSKYNLIKHEDE, WAARSKYNLIKHEIDSVERDELINGS EN BERAMING

2.1

Studie-eenheid leeruitkomste

Kennis en begrip Na voltooiing van Studie-eenheid 2 sal jy in staat wees om jou kennis en begrip van die volgende te demonstreer: •

Inleiding tot waarskynlikhede

Waarskynlikheidsverdelings

Beraming (puntberaming en vertrouensintervalle)

Vaardighede Jy sal ook in staat wees om: •

te verduidelik wat waarskynlikhede behels en te onderskei tussen subjektiewe waarskynlikhede en objektiewe waarskynlikhede;

te verduidelik wat die kenmerke van waarskynlikhede is;

die basiese konsepte van waarskynlikhede te verduidelik;

basiese waarskynlikheidsberekeninge te doen;

ʼn waarskynlikheidsvertakkingdiagram te teken;

permutasies en kombinasies te bereken;

tussen diskrete en kontinue waarskynlikheidsverdelings te onderskei;

die eienskappe van die normaalverdeling te identifiseer;

waarskynlikhede met die formules van waarskynlikheidsverdelings te bereken;

ʼn vertrouensinterval en die faktore wat die grootte daarvan beïnvloed, te bespreek;

ʼn vertrouensinterval vir ʼn populasiegemiddeld op te stel, indien die populasiestandaardafwyking bekend is (z-limiete); en

ʼn vertrouensinterval vir ʼn populasiegemiddeld op te stel, indien die populasiestandaardafwyking nie bekend is nie (t-limiete).

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 73


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 2.2

Voorgeskrewe handboek

Wegner, T. 2016. Applied Business Statistics. 4de uitgawe. Claremont: Juta. Hoofstuk 4 paragrawe 4.1-4.9 Hoofstuk 5 paragrawe 5.1-5.10 Hoofstuk 6 paragrawe 6.1-6.4, 6.6, 6.8 2.3

Hoe kan jy jou begrip verbeter?

Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord

Omskrywing

Gesamentlik uitputbaar

Wanneer al die gebeurtenisse in die steekproefruimte ʼn gesamentlike waarskynlikheid van 1 het.

Kombinasie

Enige subversameling van ’n gegewe eindige versameling waarby die volgorde van die rangskikking van die elemente in die subversameling nie belangrik is nie.

Normaalverdeling

Die verdeling van ʼn ewekansige stogastiese veranderlike (X) met die konstantes đ?œ‡ (die populasiegemiddeld) en đ?œŽ * (die populasievariansie). Hierdie verdeling word gegee deur đ?‘ (đ?œ‡, đ?œŽ * ). Enige stogastiese veranderlike wat neig na đ?‘ (đ?œ‡, đ?œŽ * ) word beskou as ʼn normaal verdeelde veranderlike.

Onderling uitsluitend

Twee eksklusiewe gebeurtenisse, met ander woorde die twee gebeurtenisse kan nie terselfdertyd plaasvind nie. đ?‘ƒ đ??´ ∊ đ??ľ = 0

Permutasie

Enige subversameling van ’n gegewe eindige versameling waarby die volgorde van die rangskikking van die elemente in die subversameling belangrik is.

Poisson-verdeling

ʼn Stogastiese veranderlike (X), wat bestaan uit ʼn stel diskrete positiewe waardes met die populasiegemiddeld en standaardafwyking van đ?œ†. Hierdie verdeling is vernoem na SimĂŠon Denis Poisson wat die eerste weergawe van hierdie verdeling in 1711 gepubliseer het.

Postulaat

Onbewysbare stelling wat aanvaar moet word om bepaalde feite te kan begryp.

Proporsie

Bladsy 74

Die verhouding wat gegee word deur ʼn bepaalde eienskap

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes teenoor die populasie-/steekproefgrootte. Puntberaming

ʼn Statistiek wat gebruik word om ʼn konstante te beraam. Die berekende waarde, van ʼn beramer, wat verkry is uit ʼn steekproef word ʼn “puntberamingâ€? genoem.

Samevoeging/Vereniging

Die waarskynlikheid dat twee of meer waarskynlikhede terselfdertyd of onderskeidelik sal plaasvind.

Snyding

Die waarskynlikheid dat twee of meer waarskynlikhede terselfdertyd sal plaasvind.

Statisties onafhanklik

Wanneer die gebeurtenis van A geen invloed het op die waarskynlikheid dat B sal plaasvind nie. Dan is gebeurtenisse A en B statisties onafhanklik van mekaar.

Steekproefruimte

ʼn Volledige stel van alle moontlike uitkomste/resultate vir ʼn eksperiment of waarnemingstudie.

Stelling

ʼn Waarheid wat met feite bewys kan word.

Vertrouensinterval

ʼn Interval, met ’n boonste en onderste limiet, waarbinne ʼn populasie-konstante met �% sekerheid sal voorkom.

Verwagte waarde

Die waarde wat verwag word van ʼn stogastiese veranderlike X. Daar word ook na die gemiddeld van X verwys as die verwagte waarde X.

Vlak van sekerheid

Die waarskynlikheid dat die populasie-konstante binne die vertrouensinterval sal voorkom.

Voorwaardelike

Dit is die waarskynlikheid dat ʼn spesifieke gebeurtenis (đ??´) sal

waarskynlikheid

plaasvind, gegewe dat ʼn ander gebeurtenis (đ??ľ) wel plaasgevind het. Dit beteken dat die feit dat đ??ľ wel plaasgevind het, die steekproefruimte in so ʼn mate verminder dat dit đ??´ se waarskynlikheid sal beĂŻnvloed.

Waarskynlikheid

Die kans dat ʼn spesifieke gebeurtenis binne die steekproefruimte sal plaasvind.

Waarskynlikheidsboom-

ʼn Diagram wat alle moontlike gebeurtenisse, vir twee of meer

diagram

opeenvolgende gebeurtenisse, visueel voorstel. Die diagram lyk soos ʼn boom wat vertak by elke gebeurtenis.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 75


GQM105 Inleiding tot elementêre kwantitatiewe metodes 2.4

Inleiding

ʼn Navorser wil dikwels vooruitskattings maak: Wat is die kans dat verkope gaan toeneem? Wat is die waarskynlikheid dat die aandelemark gaan daal? Om hierdie vrae te beantwoord moet waarskynlikhede bereken word. Praktiese vooruitskattings soos hierdie is egter nie die enigste rede waarom waarskynlikhede in die sillabus ingesluit is nie. Dit vorm ook die basis waarop hipotesetoetsing gedoen word, ʼn onderwerp wat ons in Studie-eenheid 3 sal behandel. Hierdie studie-eenheid gaan ʼn agtergrond oor waarskynlikhede bied. Daar gaan gekyk word na verskillende beginsels en reëls van waarskynlikhede. Daarna gaan spesifieke waarskynlikheidsverdelings bespreek word. Ons sal dan waarskynlikhede en die waarskynlikheidsverdelings gebruik as die basis van vertrouensintervalle. 2.5

Waarskynlikhede

Bestudeer die handboek paragrawe 4.1-4.9. As ons statistiese afleidings wil maak van die populasie op grond van die steekproef, is dit belangrik dat ons weet wat die betroubaarheid, akkuraatheid en vlak van sekerheid is. Ons gebruik waarskynlikheidsleer om dit te bepaal. Deur gebruik te maak van waarskynlikheidsleer kan ons die onsekerheid kwantifiseer en meet, veral as dit kom by besluite wat ons in ʼn onderneming moet neem. As ons weet met hoeveel onsekerheid ons te doen het, help dit ons om beter besluite te neem. Wacklerly, Mendenhall en Scheaffer (2008: 20) sê dat die term waarskynlikheid ʼn maatstaf is vir ʼn persoon se geloof/vertroue dat ʼn spesifieke gebeurtenis in die toekoms sal plaasvind. Davis, Pecar en Santana (2016: 132) wys ons daarop dat ʼn waarskynlikheid die manier is waarop ons die moontlikheid van ʼn gebeurtenis uitdruk as ʼn nommer tussen 0 en 1. 2.5.1

Basiese waarskynlikhede

Bestudeer die handboek paragrawe 4.1-4.3. Daar word onderskei tussen subjektiewe en objektiewe waarskynlikhede. Subjektiewe waarskynlikheid kan nie statisties gestaaf word nie en word nie in statistiese berekeninge gebruik nie. Byvoorbeeld, een vriend sê aan ʼn ander “daar is ʼn baie goeie waarskynlikheid dat ek aan die slaap gaan raak as ons daardie film kyk”. Die kanse dat daar statistiese data bestaan vir hierdie stelling is skaars. Vir die doel van hierdie vak word daar na objektiewe waarskynlikheid verwys. Dit is waarskynlikhede wat deur statistiek bereken kan word.

Bladsy 76

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementêre kwantitatiewe metodes Wanneer ons met waarskynlikhede werk, is daar ʼn paar terme wat jy moet begryp alvorens ons kan begin: •

Steekproefruimte: ʼn Volledige stel van alle moontlike uitkomste/resultate vir ʼn eksperiment of waarnemingstudie. Hierdie ruimte word voorgestel deur die blou agtergrond in Figuur 2.1 hieronder.

•

Gebeurtenis: ʼn Gebeurtenis is ʼn subversameling van die steekproefruimte. Hierdie subversamelings word voorgestel deur die sirkels A en B in Figuur 2.1.

Figuur 2.1: Basiese Venn-diagram Die oudste manier om ʼn waarskynlikheid te definieer is deur die klasieke waarskynlikheidskonsep waar alle uitkomste ewe moontlik is (Miller & Miller, 2014: 21):

� � = Waar:

đ?’“ đ?’?

đ??´

= ʼn gebeurtenis van een of ander aard

đ?‘&#x;

= die aantal uitkomste van gebeurtenis đ??´

đ?‘›

= totale aantal moontlike uitkomste (steekproefruimte)

đ?‘ƒ(đ??´) = waarskynlikheid dat gebeurtenis đ??´ plaasvind Formule 2.1: Klasieke waarskynlikheidbereking

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 77


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 2.1 As ek ʼn gebalanseerde dobbelsteen rol, bereken die waarskynlikheid dat ek ʼn vier sal rol. Oplossing: Daar is ses moontlike uitkomste: 1, 2, 3, 4, 5 en 6, dus is die steekproefruimte đ?’? = đ?&#x;”. Omdat ek die dobbelsteen slegs een keer gaan rol, kan daar net een uitslag wees, dus is die aantal uitkomste đ?’“ = đ?&#x;?. Nou kan ons net die berekening doen: đ?’“

đ?‘ˇ đ?’?đ?’Ž ′đ?’? đ?’—đ?’Šđ?’†đ?’“ đ?’•đ?’† đ?’“đ?’?đ?’? = đ?’?

=

đ?&#x;? đ?&#x;”

= đ?&#x;Ž, đ?&#x;?đ?&#x;”đ?&#x;”đ?&#x;•

Daar is dus ʼn 16,67% kans dat ek met een rol van ʼn dobbelsteen ʼn vier sal rol.

Doen nou Voorbeeld 4.1 in die handboek. 2.5.2

WaarskynlikheidsreĂŤls

In waarskynlikheidsleer is daar ʼn paar eienskappe en reÍls van waarskynlikhede wat ons gebruik. Ons sal hierdie eienskappe en reÍls aan die hand van postulate en stellings behandel (ʼn postulaat is ʼn onbewysbare stelling wat aanvaar moet word om bepaalde feite te kan begryp). Daar word van studente verwag om hierdie postulate en stellings te ken, maar dit is nie nodig om dit te kan bewys nie. Hieronder volg Postulate 1 en 2:

Postulaat 1: Die waarskynlikheid van enige gebeurtenis is ʼn positiewe reĂŤle getal, met ander woorde đ?‘ƒ(đ??´) ≼ 0 vir enige subversameling in die steekproefruimte. Postulaat 2: Die waarskynlikheid van die steekproefruimte đ?‘† is altyd 1, met ander woorde đ?‘ƒ đ?‘† = 1. Dit sal altyd so wees omdat die steekproefruimte uit al die moontlike uitkomste bestaan, dus kan geen ander gebeurtenisse plaasvind nie.

Stelling 1:

As đ??´ ʼn gebeurtenis is in ʼn diskrete steekproefruimte đ?‘†, dan is đ?‘ƒ(đ??´) gelyk aan die som van al die individuele uitkomste waaruit gebeurtenis đ??´ saamgestel word.

Stelling 2:

As ʼn eksperiment enige een van đ?‘ verskillende uitkomste kan hĂŞ, wat ewe moontlik is, en as đ?‘› van hierdie uitkomste saam ʼn gebeurtenis đ??´ vorm, dan is die waarskynlikheid van gebeurtenis đ??´ đ?‘› đ?‘ƒ đ??´ = đ?‘

Bladsy 78

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 2.2 As ons ʼn gebalanseerde muntstuk twee keer in die lug opskiet, wat sal die waarskynlikheid wees dat hierdie muntstuk ten minste een keer op sy kop sal val? Oplossing: Die steekproefruimte word soos volg saamgestel: đ?‘ş = đ?‘˛đ?‘˛, đ?‘˛đ?‘ş, đ?‘şđ?‘˛, đ?‘şđ?‘ş waar đ?‘˛ en đ?‘ş, kop en stert onderskeidelik voorstel. Omdat ons aanvaar dat die muntstuk gebalanseerd is, is al vier đ?&#x;?

hierdie uitkomste ewe moontlik en is elkeen van hierdie se waarskynlikheid . As đ?‘¨ die đ?&#x;’

gebeurtenis hierbo voorstel (dat die muntstuk ten minste een keer op sy kop sal val), word � soos volg saamgestel: � = ��, ��, �� . Die waarskynlikheid van � kan dus soos volg bereken word: � �

= đ?‘ˇ đ?‘˛đ?‘˛ + đ?‘ˇ đ?‘˛đ?‘ş + đ?‘ˇ đ?‘şđ?‘˛ đ?&#x;?

đ?&#x;?

đ?&#x;?

đ?&#x;‘

đ?&#x;’

đ?&#x;’

đ?&#x;’

đ?&#x;’

= + + =

Stelling 3:

As đ??´ en đ??´â€˛ komplementĂŞre gebeurtenisse in ʼn steekproefruimte đ?‘† is, dan is đ?‘ƒ đ??´â€˛ = 1 − đ?‘ƒ(đ??´).

Voorbeeld 2.2 (vervolg) As ons ʼn gebalanseerde muntstuk twee keer in die lug opskiet, wat sal die waarskynlikheid wees dat hierdie muntstuk glad nie een keer op sy kop sal val nie? Oplossing: � �§

=đ?&#x;?−đ?‘ˇ đ?‘¨ đ?&#x;‘

đ?&#x;?

đ?&#x;’

đ?&#x;’

=đ?&#x;?− =

Doen nou Voorbeeld 4.2 in die handboek.

Stelling 4:

đ?‘ƒ đ?‘† § = 0 vir enige steekproefruimte đ?‘†.

Stelling 5:

0 ≤ đ?‘ƒ(đ??´) ≤ 1 vir enige gebeurtenis đ??´.

Stelling 6:

As đ??´ en đ??ľ enige twee gebeurtenisse in die steekproefruimte đ?‘† is, dan is đ?‘ƒ đ??´ âˆŞ đ??ľ = đ?‘ƒ đ??´ + đ?‘ƒ đ??ľ − đ?‘ƒ(đ??´ ∊ đ??ľ).

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 79


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Stelling 7:

đ?‘ƒ đ??´ ∊ đ??ľ = đ?‘ƒ(đ??´|đ??ľ)Ă—đ?‘ƒ(đ??ľ) vir gebeurtenisse wat statisties afhanklik is van mekaar.

Stelling 8:

đ?‘ƒ đ??´ ∊ đ??ľ = đ?‘ƒ(đ??´)Ă—đ?‘ƒ(đ??ľ) vir gebeurtenisse wat statisties onafhanklik is van mekaar.

Stelling 9: 2.5.3

Gebeurtenisse đ??´ en đ??ľ is statisties onafhanklik indien đ?‘ƒ đ??´ đ??ľ = đ?‘ƒ(đ??´).

Belangrike konsepte van waarskynlikhede

Bestudeer die handboek paragraaf 4.4. Die volgende konsepte ten opsigte van verskillende gebeurtenisse binne ʼn steekproefruimte is belangrik wanneer ons die waarskynlikhede moet bereken. Daar sal deurlopend, tensy anders vermeld, verwys word na die volgende Venn-diagram:

Figuur 2.2: Venn-diagram v Snyding van gebeurtenisse ʼn Snyding van gebeurtenisse is waar twee (of meer) gebeurtenisse oorvleuel. Dit staan ook bekend as ʼn “gesamentlike gebeurtenisâ€? en word deur die area gemerk a voorgestel in Figuur 2.2. Die notasie wat ons hiervoor gebruik is đ?‘Ž = đ??´ ∊ đ??ľ v Samevoeging ʼn Samevoeging van gebeurtenisse is waar twee (of meer) gebeurtenisse bymekaargesit word. In Figuur 2.2 sal dit wees waar đ?‘Ž + đ?‘? + đ?‘?.

Bladsy 80

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementêre kwantitatiewe metodes v Onderling uitsluitend Dit is wanneer daar twee gebeurtenisse is, maar ʼn observasie kan nie aan beide behoort nie. Dit is die geval waar ʼn Lego-blokkie (wat ewekansig uit ʼn boks getrek word) nie blou EN geel kan wees nie. Hierdie Lego-blokkie kan slegs blou OF geel wees. Sien Figuur 2.3 hieronder om die Venn-diagram te sien van onderling uitsluitende gebeurtenisse:

Figuur 2.3: Venn-diagram van onderling uitsluitende gebeurtenisse v Subversamelings van ʼn gebeurtenis Sien Figuur 2.4 hieronder. Gebeurtenis B is byvoorbeeld dat die motor (wat ewekansig gekies word) ʼn BMW is en gebeurtenis A is dat ʼn BMW (wat ewekansig gekies word) ʼn rooi BMW sal wees. Dus word gebeurtenis A volledig vervat in gebeurtenis B. In hierdie geval sal die waarskynlikheid van gebeurtenis A altyd kleiner wees as die waarskynlikheid van gebeurtenis B.

Figuur 2.4: Subversameling van ʼn gebeurtenis Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 81


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes v KomplementĂŞre gebeurtenisse KomplementĂŞre gebeurtenisse is twee gebeurtenisse wat ʼn geheel vorm. Met ander woorde, ʼn steekproefruimte bestaan uit ʼn gebeurtenis en “die resâ€?. Hierdie twee gebeurtenisse oorvleuel glad nie. đ?‘ƒ(đ??´ ∊ đ??´Â§ ) is altyd 0. Sien Figuur 2.5 hieronder.

Figuur 2.5: KomplementĂŞre gebeurtenisse Werk weer deur Stelling 3 en Voorbeeld 2.2. Voorbeeld 2.3 ʼn Navorser stel belang in die waarskynlikheid dat ʼn speler wat ʼn gebalanseerde dobbelsteen rol, ʼn drie sal rol. Vind die komplementĂŞre waarskynlikheid, met ander woorde dat ʼn speler enige ander getal sal rol. Oplossing: đ?&#x;?

� �

=

� �§

=đ?&#x;?−đ?‘ˇ đ?‘¨

đ?&#x;”

đ?&#x;?

đ?&#x;“

đ?&#x;”

đ?&#x;”

=đ?&#x;?− =

v Statisties onafhanklike gebeurtenisse Gebeurtenis đ??´ en gebeurtenis đ??ľ is statisties onafhanklik as die een gebeurtenis plaasvind en dit geen effek het op die ander gebeurtenis nie (en vice versa). Verwys na Stellings 7-9 in paragraaf 2.5.2 in die gids. Wegner (2016: 113) waarsku ons om nie statisties onafhanklik en onderling uitsluitend met mekaar te verwar nie. Maak seker dat jy weet wat die verskil tussen hierdie twee konsepte is. Bladsy 82

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Doen nou Voorbeeld 4.3 in die handboek. 2.5.4

Berekening van waarskynlikhede

Bestudeer die handboek paragraaf 4.5. v Marginale waarskynlikhede Hierdie is die waarskynlikheid dat ʼn enkele gebeurtenis sal plaasvind. Verwys na Formule 2.1 wat hierbo genoem is in paragraaf 2.5.1. v Gesamentlike waarskynlikhede In hierdie geval word die waarskynlikheid dat twee gebeurtenisse gelyktydig plaasvind, bereken.

đ?‘ˇ đ?‘¨âˆŠđ?‘Š = Waar:

đ?’“ đ?’?

đ??´

= ʼn gebeurtenis van een of ander aard

đ??ľ

= ʼn gebeurtenis van een of ander aard

đ?‘&#x;

= die aantal uitkomste van gebeurtenis đ??´ EN gebeurtenis đ??ľ

đ?‘›

= totale aantal moontlike uitkomste (steekproefruimte)

đ?‘ƒ(đ??´ ∊ đ??ľ) = waarskynlikheid dat gebeurtenis đ??´ EN gebeurtenis đ??ľ plaasvind Formule 2.2: Gesamentlike waarskynlikheidbereking v Saamgevoegde waarskynlikhede In hierdie geval word die waarskynlikheid bereken dat gebeurtenis đ??´ OF gebeurtenis đ??ľ sal plaasvind. Om die saamgevoegde waarskynlikheid te bereken waar die twee gebeurtenisse onderling uitsluitend is, kan ons die volgende formule gebruik:

đ?‘ˇ đ?‘¨ âˆŞ đ?‘Š = đ?‘ˇ đ?‘¨ + đ?‘ˇ(đ?‘Š) Waar:

đ??´

= ʼn gebeurtenis van een of ander aard

đ??ľ

= ʼn gebeurtenis van een of ander aard

đ?‘ƒ(đ??´)

= waarskynlikheid dat gebeurtenis đ??´ sal plaasvind

đ?‘ƒ(đ??ľ)

= waarskynlikheid dat gebeurtenis đ??ľ sal plaasvind

đ?‘ƒ(đ??´ âˆŞ đ??ľ) = waarskynlikheid dat gebeurtenis đ??´ OF gebeurtenis đ??ľ plaasvind Formule 2.3: Saamgevoegde waarskynlikheidsberekening waar die gebeurtenisse onderling uitsluitend is

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 83


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes In die geval waar die twee gebeurtenisse nie onderling uitsluitend is nie, kan ons die volgende formule gebruik:

đ?‘ˇ đ?‘¨ âˆŞ đ?‘Š = đ?‘ˇ đ?‘¨ + đ?‘ˇ đ?‘Š − đ?‘ˇ(đ?‘¨ ∊ đ?‘Š) Waar:

đ??´

= ʼn gebeurtenis van een of ander aard

đ??ľ

= ʼn gebeurtenis van een of ander aard

đ?‘ƒ(đ??´)

= waarskynlikheid dat gebeurtenis đ??´ sal plaasvind

đ?‘ƒ(đ??ľ)

= waarskynlikheid dat gebeurtenis đ??ľ sal plaasvind

đ?‘ƒ(đ??´ ∊ đ??ľ) = waarskynlikheid dat gebeurtenis đ??´ EN gebeurtenis đ??ľ plaasvind đ?‘ƒ(đ??´ âˆŞ đ??ľ) = waarskynlikheid dat gebeurtenis đ??´ OF gebeurtenis đ??ľ plaasvind Formule 2.4: Saamgevoegde waarskynlikheidsberekening waar die gebeurtenisse nie onderling uitsluitend is nie Beskou Stelling 6 en Figuur 2.2 hierbo. Dit mag dalk vreemd lyk om die snyding van gebeurtenis đ??´ en đ??ľ af te trek, maar die rede daarvoor is eintlik baie eenvoudig: đ?‘ƒ đ??´ =đ?‘?+đ?‘Ž đ?‘ƒ đ??ľ =đ?‘?+đ?‘Ž đ?‘ƒ đ??´âˆŠđ??ľ =đ?‘Ž As ons die waarskynlikheid van đ??´ en die waarskynlikheid van đ??ľ bymekaartel, dan đ?‘ƒ đ??´ + đ?‘ƒ đ??ľ = đ?‘? + đ?‘Ž + đ?‘? + đ?‘Ž = đ?‘? + đ?‘? + 2đ?‘Ž đ?‘Ž word dus twee keer getel. Om dit reg te maak moet ons đ?‘Ž dus weer aftrek: đ?‘ƒ đ??´âˆŞđ??ľ = đ?‘?+đ?‘Ž + đ?‘?+đ?‘Ž −đ?‘Ž =đ?‘Ž+đ?‘?+đ?‘? In die geval waar waarskynlikheid van đ??´ en die waarskynlikheid van đ??ľ nie oorvleuel nie (waar hulle onderling uitsluitend is), is đ?‘ƒ đ??´ ∊ đ??ľ = 0. Sien Voorbeeld 2.4 hieronder waar die waarskynlikheid van twee gebeurtenisse bereken word. Voorbeeld 2.4 In ʼn gegoede woonbuurt is die waarskynlikheid dat ʼn huisgesin (wat ewekansig gekies word) ʼn rooi motor, ’n BMW of ʼn rooi BMW besit onderskeidelik 0,43, 0,28 en 0,12. Wat is die waarskynlikheid dat ʼn huisgesin (wat ewekansig gekies word) ʼn rooi motor of ’n BMW sal besit?

Bladsy 84

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Oplossing: As đ?‘¨ die gebeurtenis is dat die familie ʼn rooi motor besit en đ?‘Š die gebeurtenis is dat die familie ʼn BMW besit, dan is đ?‘ˇ đ?‘¨ = đ?&#x;Ž, đ?&#x;’đ?&#x;‘, đ?‘ˇ đ?‘Š = đ?&#x;Ž, đ?&#x;?đ?&#x;– en đ?‘ˇ đ?‘¨ ∊ đ?‘Š = đ?&#x;Ž, đ?&#x;?đ?&#x;?. Dan kan die waarskynlikheid dat ʼn huisgesin (wat ewekansig gekies word) ʼn rooi motor of ’n BMW sal besit, soos volg bereken word: đ?‘ˇ đ?‘¨âˆŞđ?‘Š =đ?‘ˇ đ?‘¨ +đ?‘ˇ đ?‘Š −đ?‘ˇ đ?‘¨âˆŠđ?‘Š = đ?&#x;Ž, đ?&#x;’đ?&#x;‘ + đ?&#x;Ž, đ?&#x;?đ?&#x;– − đ?&#x;Ž, đ?&#x;?đ?&#x;? = đ?&#x;Ž, đ?&#x;“đ?&#x;— Dus is die waarskynlikheid dat ʼn huisgesin (wat ewekansig gekies word) ʼn rooi motor of BMW sal besit 59%. Jy moet egter seker wees wanneer gebeurtenisse onderling uitsluitend is en wanneer nie, sodat jy die regte formule sal gebruik. v Voorwaardelike waarskynlikhede Dit is die waarskynlikheid dat ʼn spesifieke gebeurtenis (đ??´) sal plaasvind, gegewe dat ʼn ander gebeurtenis (đ??ľ) wel plaasgevind het. Dit beteken dat die feit dat đ??ľ wel plaasgevind het, die steekproefruimte in so ʼn mate verminder dat dit đ??´ se waarskynlikheid sal beĂŻnvloed.

� �� = Waar:

đ?‘ˇ(đ?‘¨ ∊ đ?‘Š) đ?‘ˇ(đ?‘Š)

đ??´

= ʼn gebeurtenis van een of ander aard

đ??ľ

= ʼn gebeurtenis van een of ander aard

đ?‘ƒ(đ??ľ) = waarskynlikheid dat gebeurtenis đ??ľ sal plaasvind đ?‘ƒ(đ??´ ∊ đ??ľ)

= waarskynlikheid dat gebeurtenis đ??´ EN gebeurtenis đ??ľ plaasvind

đ?‘ƒ(đ??´|đ??ľ)

= waarskynlikheid dat gebeurtenis đ??´ gebeur indien gebeurtenis đ??ľ reeds plaasgevind het

Formule 2.5: Voorwaardelike waarskynlikheidsberekening Sien ook Stellings 7-9 omdat dit verband hou met statistiese afhanklikheid. Voorbeeld 2.5 Honderd-en-vyftig (150) studente word ewekansig gekies op ʼn universiteitskampus. Die kruisfrekwensietabel hieronder bevat die gesamentlike frekwensies vir die twee kategoriese stogastiese veranderlikes ‘geslag’ en ‘program’.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 85


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

GESLAG PROGRAM

Vroulik

Manlik

TOTAAL

BCom Bemarking

19

28

47

BCom Kommunikasiebestuur

25

36

61

BSc Wiskunde

12

16

28

BA Geskiedenis

6

8

14

TOTAAL

62

88

150

Bereken die volgende waarskynlikhede: a) Dat ʼn ewekansig gekose student vroulik sal wees. b) Dat ʼn ewekansig gekose student BSc Wiskunde sal studeer. c) Dat ʼn ewekansig gekose student manlik sal wees en BA Geskiedenis sal studeer. d) Dat ʼn ewekansig gekose student BCom Kommunikasiebestuur of BCom Bemarking sal studeer. e) Dat ʼn ewekansig gekose student vroulik sal wees of BCom Bemarking sal studeer. f)

Dat ʼn ewekansig gekose student nie ʼn BCom graad sal studeer nie.

g) Dat ʼn ewekansig gekose student ʼn BCom Bemarking-graad sal studeer, gegee die feit dat ons weet dit ʼn vroulike student is. Oplossing: a) Daar is 62 vroulike studente in die steekproefruimte wat bestaan uit ʼn totaal van 150 studente, dus: đ?‘ˇ đ?’—đ?’“đ?’?đ?’–đ?’?đ?’Šđ?’Œ

đ?’“

= đ?’?

=

đ?&#x;”đ?&#x;? đ?&#x;?đ?&#x;“đ?&#x;Ž

= đ?&#x;Ž, đ?&#x;’đ?&#x;?đ?&#x;‘đ?&#x;‘

Daar is dus ʼn 41,33% kans dat ʼn student wat ewekansig gekies word vroulik sal wees. b) Daar is 28 studente wat BSc Wiskunde studeer in die steekproefruimte, wat bestaan uit 150 studente, dus: �

đ?‘ˇ đ?‘Šđ?‘şđ?’„ đ?‘žđ?’Šđ?’”đ?’Œđ?’–đ?’?đ?’…đ?’† = đ?’?

=

Bladsy 86

đ?&#x;?đ?&#x;– đ?&#x;?đ?&#x;“đ?&#x;Ž

= đ?&#x;Ž, đ?&#x;?đ?&#x;–đ?&#x;”đ?&#x;•

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Daar is dus ʼn 18,67% kans dat ʼn student wat ewekansig gekies word BSc Wiskunde sal studeer. c) Daar is 88 manlike studente (�) en 14 studente wat BA Geskiedenis (�) studeer, maar daar is slegs 8 manlike studente wat BA Geskiedenis studeer, dus: �

đ?‘ˇ đ?‘¨âˆŠđ?‘Š = đ?’?

=

đ?&#x;–

= đ?&#x;Ž, đ?&#x;Žđ?&#x;“đ?&#x;‘đ?&#x;‘

đ?&#x;?đ?&#x;“đ?&#x;Ž

Daar is dus ʼn 5,33% kans dat ʼn student wat ewekansig gekies word ʼn manlike BA Geskiedenisstudent sal wees. d) Daar is 61 studente wat BCom Kommunikasiebestuur (đ?‘¨) en 47 studente wat BCom Bemarking (đ?‘Š) studeer in die steekproefruimte, wat bestaan uit ʼn totaal van 150 studente. Daar is geen studente wat beide BCom Kommunikasiebestuur en BCom Bemarking studeer nie. đ?‘ˇ đ?‘¨âˆŞđ?‘Š =đ?‘ˇ đ?‘¨ +đ?‘ˇ đ?‘Š −đ?‘ˇ đ?‘¨âˆŠđ?‘Š =

đ?&#x;”đ?&#x;? đ?&#x;?đ?&#x;“đ?&#x;Ž

+

đ?&#x;’đ?&#x;• đ?&#x;?đ?&#x;“đ?&#x;Ž

−

đ?&#x;Ž đ?&#x;?đ?&#x;“đ?&#x;Ž

=

đ?&#x;?đ?&#x;Žđ?&#x;– đ?&#x;?đ?&#x;“đ?&#x;Ž

= đ?&#x;Ž, đ?&#x;•đ?&#x;?

Daar is dus ʼn 72% kans dat ʼn student wat ewekansig gekies word ʼn BCom Kommunikasiebestuur- of BCom Bemarking-graad sal studeer. e) Daar is 62 vroulike studente (đ?‘¨) en 47 studente wat BCom Bemarking (đ?‘Š) studeer in die steekproefruimte van 150 studente. Daar is 19 vroulike BCom Bemarkingstudente. đ?‘ˇ đ?‘¨ âˆŞ đ?‘Š = đ?‘ˇ(đ?‘¨) + đ?‘ˇ(đ?‘Š) − đ?‘ˇ đ?‘¨ ∊ đ?‘Š =

đ?&#x;”đ?&#x;? đ?&#x;?đ?&#x;“đ?&#x;Ž

+

đ?&#x;’đ?&#x;• đ?&#x;?đ?&#x;“đ?&#x;Ž

−

đ?&#x;?đ?&#x;— đ?&#x;?đ?&#x;“đ?&#x;Ž

=

đ?&#x;—đ?&#x;Ž đ?&#x;?đ?&#x;“đ?&#x;Ž

= đ?&#x;Ž, đ?&#x;”

Daar is dus ʼn 60% kans dat ʼn student ʼn BCom Kommunikasie- of BCom Bemarkinggraad sal studeer. f)

In Vraag (e) het ons die waarskynlikheid van bereken dat ʼn student wat ewekansig gekies word ʼn BCom graad (�) sal studeer. Nou moet ons die komplement daarvan bereken. Om dit te kan doen gebruik ons Stelling 3 wat hierbo behandel is in paragraaf 2.5.2: � �§

=đ?&#x;?−đ?‘ˇ đ?‘Ş = đ?&#x;? − đ?&#x;Ž, đ?&#x;” = đ?&#x;Ž, đ?&#x;’

Daar is dus ʼn 40% kans dat ʼn student nie ʼn BCom-graad sal studeer nie. g) Daar is 19 dames wat ʼn BCom Bemarking-graad studeer (đ?‘¨ ∊ đ?‘Š) in die steekproefruimte van 62 vroulike studente (đ?‘Š). Omdat ons weet dat die student ʼn vroulike student gaan wees, verminder dit die steekproefruimte.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 87


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

� ��

=

đ?‘ˇ đ?‘¨âˆŠđ?‘Š

=

đ?&#x;?đ?&#x;—

đ?‘ˇ đ?‘Š đ?&#x;”đ?&#x;?

= đ?&#x;Ž, đ?&#x;‘đ?&#x;Žđ?&#x;”đ?&#x;“

Daar is dus ʼn 30,65% kans dat ʼn student wat ewekansig gekies word ʼn BCom Bemarking-graad sal studeer, gegee dat ons weet dit ʼn vroulike student is. Doen nou Voorbeeld 4.4 en 4.5 in die handboek. 2.5.5

Waarskynlikheidsvertakkingdiagram

Dit is ʼn grafiese metode om die uitkomste van twee of meer gebeurtenisse, wat in volgorde gebeur, voor te stel. Voorbeeld 2.6 ʼn Eksperiment word gedoen onder kleuters. In die eerste rondte moet elke kleuter kies tussen ʼn rooi en ʼn groen bal. Die eksperiment het getoon dat 3 uit elke 4 kleuters die groen bal sal kies. In die tweede rondte moet hulle kies tussen ʼn blou, geel en oranje bal. Die eksperiment het getoon dat slegs 1 uit 10 kleuters die blou bal kies, 1 uit 2 die geel bal en 2 uit 5 die oranje bal. Stel die resultate van hierdie eksperiment voor deur middel van ʼn waarskynlikheidsvertakkingdiagram. Oplossing: A = rooi bal, B = groen bal, X = blou bal, Y = geel bal, X = oranje bal

Figuur 2.6: Waarskynlikheidsvertakkingdiagram

Bladsy 88

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Let daarop dat: đ?‘ˇ đ?‘¨ = đ?‘ˇ đ?‘¨ ∊ đ?‘ż + đ?‘ˇ đ?‘¨ ∊ đ?’€ + đ?‘ˇ đ?‘¨ ∊ đ?’ = đ?&#x;Ž, đ?&#x;?đ?&#x;“ đ?‘ˇ đ?‘Š = đ?‘ˇ đ?‘Š ∊ đ?‘ż + đ?‘ˇ đ?‘Š ∊ đ?’€ + đ?‘ˇ đ?‘Š ∊ đ?’ = đ?&#x;Ž, đ?&#x;•đ?&#x;“ đ?‘ˇ đ?‘¨ +đ?‘ˇ đ?‘Š =đ?&#x;? Doen nou Voorbeeld 4.6 in die handboek. 2.5.6

TelreĂŤls

Bestudeer die handboek paragraaf 4.8. Om waarskynlikhede te kan bereken moet ons gebeurtenisse en moontlike uitkomste tel. Ons kan waarskynlikheidsvertakkingdiagramme teken en die moontlike uitkomste en die gebeurtenisse tel, maar dit kan lank vat om te doen en ons sal heel waarskynlik ʼn fout of twee langs die pad maak. As ons weet hoe om kombinasies en permutasies te bereken, is dit baie makliker. v VermenigvuldigingsreÍl Die eerste reÍl waarmee ons te doen kry, is die reÍl van vermenigvuldiging.

ReĂŤl 1:

Die totale aantal unieke maniere waarop đ?‘› voorwerpe gerangskik kan word, is gelyk aan đ?‘›-fakulteit.

Fakulteite kan soos volg bereken word: đ?’?! = đ?’?-fakulteit = đ?’?Ă— đ?’? − đ?&#x;? Ă— đ?’? − đ?&#x;? Ă— đ?’? − đ?&#x;‘ ‌×đ?&#x;‘Ă—đ?&#x;?Ă—đ?&#x;? Let daarop dat 0! = 1 MS Excel-formule:

=FACT(đ?’?) Formule 2.6: Berekening van đ?’?-fakulteit (đ?’? − đ?&#x;?) Voorbeeld 2.7

Bereken die waarde van 4!. Oplossing: đ?&#x;’! = đ?&#x;’Ă—đ?&#x;‘Ă—đ?&#x;?Ă—đ?&#x;? = đ?&#x;?đ?&#x;’

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 89


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 2.8 Jy het vyf verskillende gekleurde balle, naamlik rooi, groen, blou, geel en oranje. Op hoeveel verskillende maniere kan hierdie vyf balle gerangskik word? Oplossing: Dit is vir ʼn enkele gebeurtenis: om die balle te rangskik. Die aantal verskillende (unieke) maniere waarop die balle gerangskik kan word, word gegee deur: đ?&#x;“! = đ?&#x;“Ă—đ?&#x;’Ă—đ?&#x;‘Ă—đ?&#x;?Ă—đ?&#x;? = đ?&#x;?đ?&#x;?đ?&#x;Ž Die vyf balle kan dus op 120 verskillende maniere gerangskik word. Doen nou Voorbeeld 4.8 in die handboek. ReĂŤl 2:

As ʼn ewekansige prosedure đ?‘›( moontlike uitkomste het vir gebeurtenis 1, đ?‘›* moontlike uitkomste vir gebeurtenis 2, ..., đ?‘›² moontlike uitkomste het vir gebeurtenis đ?‘—, dan is die totale aantal moontlike uitkomste gelyk aan: đ?‘›( Ă—đ?‘›* Ă—đ?‘›+ Ă— ‌×đ?‘›²

Voorbeeld 2.9 Wanneer jy ʼn motor koop, kan jy kies tussen ʼn gesinsmotor, bakkie en sportmotor. Hierdie motors kom in ses kleure, naamlik rooi, groen, geel, wit, blou en swart. Jy kan verder kies tussen sitplekoortreksels van plastiek, lap, kunsleer en egte leer. Op hoeveel verskillende/unieke wyses kan jy ʼn motor bestel? Oplossing: Daar is drie verskillende gebeurtenisse: die tipe (đ?’?đ?&#x;? = đ?&#x;‘), die kleur (đ?’?đ?&#x;? = đ?&#x;”) en die sitplekoortreksel (đ?’?đ?&#x;‘ = đ?&#x;’). Die aantal moontlike (unieke) permutasies van ʼn bestelling is: đ?’?đ?&#x;? Ă—đ?’?đ?&#x;? Ă—đ?’?đ?&#x;‘ = đ?&#x;‘Ă—đ?&#x;”Ă—đ?&#x;’ = đ?&#x;•đ?&#x;? Daar is dus 72 unieke bestellings wat jy kan maak vir ʼn motor wat in jou smaak gaan val.

Doen nou Voorbeeld 4.9 in die handboek. Wanneer ons ʼn subversameling van objekte (đ?‘&#x;) trek uit al die moontlike uitkomste (đ?‘›), dan kan ons die permutasie- of kombinasiereĂŤl gebruik om te bepaal op hoeveel verskillende maniere hierdie subversamelings saamgestel kan word. Bladsy 90

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes v PermutasiereĂŤl ʼn Permutasie is die aantal unieke maniere waarop ʼn subversameling van đ?‘&#x;

ReĂŤl 3:

objekte getrek kan word uit ʼn groter steekproefruimte en die volgorde waarin hierdie objekte getrek word belangrik is.

đ?’?đ?‘ˇ đ?’“

Waar:

=

đ?’?! đ?’?−đ?’“ !

đ?‘&#x;

= die aantal objekte wat op ʼn slag getrek word

đ?‘›

= die totale aantal objekte waaruit daar getrek kan word =PURMUT(đ?’?, đ?’“)

MS Excel-formule:

Formule 2.7: Berekening van ʼn permutasie Voorbeeld 2.10 Julle is ʼn vriendekring van vyf vriende, naamlik Jan, Koos, Piet, Johan en jy. Julle hou elke maand ʼn loting. Die eerste plek wen R500, tweede plek R200 en derde plek R100. Bereken: a) Op hoeveel verskillende maniere ʼn eerste, tweede en derde plek uit julle vriendekring getrek kan word. b) Die waarskynlikheid dat Piet eerste plek, Jan tweede plek en Koos derde plek sal kry. Oplossing: Dit is belangrik in watter volgorde die pryse getrek word omdat elke plek ʼn ander prys het. đ?’?đ?‘ˇ đ?’“

= =

đ?’?! đ?’?mđ?’“ ! đ?&#x;“! đ?&#x;“mđ?&#x;‘ !

=

đ?&#x;“! đ?&#x;?!

=

đ?&#x;?đ?&#x;?đ?&#x;Ž đ?&#x;?

= đ?&#x;”đ?&#x;Ž Daar is dus 60 verskillende maniere waarop die eerste, tweede en derde plekke getrek kan word uit hierdie vyf vriende. Die waarskynlikheid dat Piet eerste plek, Jan tweede plek en Koos derde plek sal kry, is een manier uit die 60 unieke maniere waarop eerste, tweede en derde plekke getrek kan word

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 91


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes en daarom kan ons die waarskynlikheid soos volg bereken: đ?’“

� �

= đ?’?

=

đ?&#x;? đ?&#x;”đ?&#x;Ž

= đ?&#x;Ž, đ?&#x;Žđ?&#x;?đ?&#x;”đ?&#x;•

Die kans dat Piet eerste plek, Jan tweede plek en Koos derde plek sal kry, is dus 1,67%. Doen nou Voorbeeld 4.10 in die handboek. v KombinasiereĂŤl ʼn Kombinasie is die aantal unieke maniere waarop ʼn subversameling van đ?‘&#x;

ReĂŤl 4:

objekte getrek kan word uit ʼn groter steekproefruimte en die volgorde waarin hierdie objekte getrek word nie belangrik is nie.

đ?’?đ?‘Ş đ?’“

Waar:

=

đ?’?! đ?’“! đ?’? − đ?’“ !

đ?‘&#x;

= die aantal objekte wat op ʼn slag getrek word

đ?‘›

= die totale aantal objekte waaruit daar getrek kan word =COMBIN(đ?’?, đ?’“)

MS Excel-formule:

Formule 2.8: Berekening van ʼn kombinasie Voorbeeld 2.11 Julle is ʼn vriendekring van vyf vriende, naamlik Jan, Koos, Piet, Johan en jy. Julle hou elke maand ʼn loting. Daar is drie pryse van 250 elk op die spel. Bereken: a) Op hoeveel verskillende maniere die drie pryse uit julle vriendekring getrek kan word. b) Die waarskynlikheid dat Piet, Jan en Koos elkeen ʼn prys sal kry. Oplossing: Dit is nie belangrik in watter volgorde die pryse getrek word nie omdat elkeen ʼn R250-prys kan wen. đ?’?đ?‘Ş đ?’“

Bladsy 92

=

đ?’?! đ?’“! đ?’?mđ?’“ !

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes =

đ?&#x;“! đ?&#x;‘! đ?&#x;“mđ?&#x;‘ !

=

đ?&#x;“! đ?&#x;‘!đ?&#x;?!

=

đ?&#x;?đ?&#x;?đ?&#x;Ž đ?&#x;”Ă—đ?&#x;?

= đ?&#x;?đ?&#x;Ž Daar is dus tien verskillende maniere waarop die drie pryse getrek kan word uit hierdie vyf vriende. Die waarskynlikheid Piet, Jan en Koos elkeen ʼn prys sal kry, is een manier uit die tien unieke maniere waarop drie pryse getrek kan word en daarom kan ons die waarskynlikheid soos volg bereken: đ?‘ˇ đ?‘¨

đ?’“

= đ?’?

=

đ?&#x;? đ?&#x;?đ?&#x;Ž

= đ?&#x;Ž, đ?&#x;?

Die kans dat Piet, Jan en Koos elkeen ʼn prys sal kry, is dus 10%. Vergelyk Voorbeeld 2.10 en 2.11 met mekaar en maak seker dat jy verstaan wanneer die volgorde belangrik is en wanneer nie. Verseker verder dat jy weet watter formule om te gebruik in ieder geval. Doen nou Voorbeeld 4.11 in die handboek. 2.5.7

Selfevalueringsvrae

Daar is 21 vrae aan die einde van Hoofstuk 4. Beantwoord al hierdie vrae. Dit is baie werk en gaan heelwat tyd in beslag neem, maar dit sal jou help om te verseker dat jy die werk onder die knie het. 2.6

Waarskynlikheidsverdelings

Bestudeer die handboek Hoofstuk 5. In Hoofstuk 4 van die handboek is waarskynlikhede bereken deur data te versamel. Waarskynlikhede kan ook wiskundig bereken word deur sogenaamde waarskynlikheidsverdelings. Hoofstuk 5 bespreek drie verskillende waarskynlikheidsverdelings. Die normaalverdeling is veral belangrik. ʼn Waarskynlikheidsverdeling is ʼn lys van alle moontlike uitkomste van ʼn stogastiese veranderlike met elk se waarskynlikhede. Waarskynlikheidsverdelings word in twee kategorieÍ verdeel. Hierdie kategorieÍ, asook die verskillende verdelings wat in elk voorkom, word grafies voorgestel in Figuur 2.7.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 93


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 2.7: Waarskynlikheidsverdelings 2.6.1

Stogastiese veranderlikes

Davis, Pecar en Santana (2016: 161) definieer ʼn stogastiese veranderlike as ʼn veranderlike met ʼn numeriese waarde, wat geassosieer kan word met die uitkoms of ʼn gebeurtenis van ʼn eksperiment (waar elke uitkoms/gebeurtenis ʼn bepaalde waarskynlikheid het dat dit sal plaasvind). Stogastiese veranderlikes kan verdeel word in diskrete stogastiese veranderlikes (ʼn veranderlike met ʼn telbare aantal waardes, elk met ʼn spesifieke waarskynlikheid) en kontinue stogastiese veranderlikes (ʼn veranderlike wat potensieel ʼn oneindige/ontelbare aantal waardes het binne ʼn spesifieke reeks van waardes) (Davis, Pecar & Santana, 2016: 161). Wanneer ons praat van diskrete waardes, bedoel ons dat die waardes afsonderlik/geskei/in onderskeie dele opgebreek kan word, met ander woorde heelgetalle. Voorbeelde van hierdie waardes sluit 1, 10, 256, 1 024, ensovoorts in. Kontinue waardes, aan die ander kant, is waardes wat onafgebroke/aaneen/voortdurend is. Daar is teoreties ʼn oneindige/ontelbare aantal waardes slegs tussen 1 en 2. Voorbeelde van hierdie waardes sluit 0,99999999999999999, 0.0000000001, ensovoorts in. Hierdie stogastiese veranderlike se waardes bepaal aan watter tipe waarskynlikheidsverdeling die veranderlike behoort.

Bladsy 94

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 2.6.2

Diskrete waarskynlikheidsverdelings

Bestudeer die handboek paragraaf 5.3. ʼn Diskrete stogastiese veranderlike sal ’n diskrete waarskynlikheidsverdeling hê. Hier is ʼn paar voorbeelde van diskrete veranderlikes: •

As jy ʼn muntstuk in die lug opskiet, kan dit óf op sy kop, óf op sy stert val.

•

As ʼn dobbelsteen gerol word, kan die uitkoms 1, 2, 3, 4, 5 of 6 wees.

•

Jy kan 0, 1, 2, 3 of enige ander heelgetal huise besit.

•

Jy kan 0, 1, 2, 3 of enige ander heelgetal kinders hĂŞ.

Twee van die algemeenste diskrete waarskynlikheidsverdelings wat ons gebruik, is die binomiale en die Poisson-verdelings. v Binominale waarskynlikheidsverdeling Volgens Davis, Pecar en Santana (2016: 183) is die binomiale stogastiese veranderlike ʼn veranderlike wat die aantal suksesvolle uitkomste van � aantal toetse beskryf. ʼn Toets se uitslag kan óf ʼn sukses, óf ʼn mislukking wees. Die binomiale waarskynlikheidsverdeling beskryf die waarskynlikheid dat ʼn binomiale gebeurtenis sal plaasvind. Die binomiale waarskynlikheidsverdeling het die volgende kenmerke: •

Die eksperiment bestaan uit đ?‘› aantal toetse.

•

Elke toets het een van twee onderling uitsluitlike uitkomste, naamlik ʼn sukses of ʼn mislukking.

•

Al die uitkomste is statisties onafhanklik van een toets tot die volgende.

•

Die waarskynlikheid van ʼn sukses (đ?‘?) is dieselfde vir elke toets. (Die waarskynlikheid van ʼn mislukking is dus 1 − đ?‘?.)

Ons gebruik die volgende formule om die waarskynlikheid van ʼn binomiale stogastiese gebeurtenis te bereken:

� � =

đ?’?đ?‘Ş đ?’™ đ?’‘

đ?’™

đ?&#x;?−đ?’‘

đ?’?mđ?’™

Vir

đ?‘Ľ

= 0, 1, 2, 3, . . . , đ?‘›

Waar:

đ?‘›

= die steekproefgrootte, met ander woorde die aantal onafhanklike toetse

đ?‘Ľ

= die aantal suksesvolle toetse in die đ?‘› aantal ewekansig gekose toetse

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 95


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

đ?‘?

= die waarskynlikheid op ʼn suksesvolle uitkoms van ʼn toets

(1 − đ?‘?) = die waarskynlikheid op ʼn onsuksesvolle uitkoms van ʼn toets MS Excel-formule:

=BINOM.DIST(đ?’™, đ?’?, đ?’‘, đ?‘­đ?‘¨đ?‘łđ?‘şđ?‘Ź)

enkel waarskynlikheid

MS Excel-formule:

=BINOM.DIST(đ?’™, đ?’?, đ?’‘, đ?‘ťđ?‘šđ?‘źđ?‘Ź)

kumulatiewe waarskynlikheid

Formule 2.9: Berekening van ’n binominale stogastiese gebeurtenis se waarskynlikheid Doen Voorbeeld 5.1 in die handboek met die hand en verifieer jou resultaat deur dieselfde waarskynlikheid in MS Excel te bereken. Voorbeeld 2.12 Die vervaardiger van ’n sekere miergif beweer dat die gif 80% van alle miere sal doodmaak. ʼn Wetenskaplike het die miergif op die toets gestel. Hy het 15 miere gevat wat feitlik identies is en hulle blootgestel aan die miergif. Na ʼn sekere tyd het hy getel hoeveel miere nog lewe en hoeveel gesterf het. Die resultaat van die eksperiment is dat die mier gesterf het van die gif, of nog lewendig is. Hierdie resultate is statisties onafhanklik van mekaar omdat die miere nie ʼn invloed het op mekaar se kanse om te oorleef nie. Bereken die volgende waarskynlikhede: a) Dat 13 van die 15 miere gesterf het. b) Dat 13 of meer van die miere gesterf het. c) Dat ten minste 12 van die miere gesterf het. Oplossing: Die stogastiese veranderlike “aantal miere wat gesterf hetâ€? is diskreet omdat daar slegs 0, 1, 2, 3, ..., 15 miere kon gesterf het, uit die 15 miere wat ewekansig gekies is. Hierdie stogastiese veranderlike pas die binomiale waarskynlikheidsverdeling vir die volgende redes: •

Die stogastiese veranderlike is 15 keer waargeneem (15 miere is blootgestel aan die miergif). Daarom is đ?’? = đ?&#x;?đ?&#x;“.

•

Daar is twee moontlike uitkomste:

Bladsy 96

o

Die mier kon gesterf het; of

o

die mier kan steeds lewe.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

•

•

ʼn Waarskynlikheid kan toegeken word aan elke uitkoms van die eksperiment: o

đ?’‘ = đ?&#x;Ž, đ?&#x;– (waar đ?’‘ die waarskynlikheid is dat die mier sou gesterf het)

o

đ?&#x;? − đ?’‘ = đ?&#x;? − đ?&#x;Ž, đ?&#x;– = đ?&#x;Ž, đ?&#x;? (die waarskynlikheid dat die mier steeds lewe)

Die uitkoms is statisties onafhanklik vanaf een mier tot die volgende.

Noudat daar voldoen is aan die vereistes van die binomiale waarskynlikheidsverdeling, kan ons dit gebruik om die betrokke waarskynlikhede te bereken. <blokkie bo n hieronder – dit reg?><Willem: dit is ongelukkig hoe die funksie lyk – wanneer die dokument omgeskakel word in ʼn PDF formaat lyk dit egter reg.> a) Vind đ?‘ˇ(đ?’™ = đ?&#x;?đ?&#x;‘) waar đ?’? = đ?&#x;?đ?&#x;“ en đ?’‘ = đ?&#x;Ž, đ?&#x;– đ?‘ˇ đ?’™

= =

đ?’?đ?‘Şđ?’™ đ?’‘

đ?’™

đ?&#x;?−đ?’‘

đ?&#x;?đ?&#x;“! đ?&#x;?đ?&#x;‘! đ?&#x;?đ?&#x;“mđ?&#x;?đ?&#x;‘ !

= đ?&#x;?đ?&#x;Žđ?&#x;“ đ?&#x;Ž, đ?&#x;–

đ?&#x;Ž, đ?&#x;– đ?&#x;?đ?&#x;‘

đ?’?mđ?’™ đ?&#x;?đ?&#x;‘

đ?&#x;Ž, đ?&#x;?

đ?&#x;?

=

đ?’?! đ?’“! đ?’?mđ?’“ !

đ?&#x;? − đ?&#x;Ž, đ?&#x;–

đ?’‘đ?’™ đ?&#x;? − đ?’‘

đ?’?mđ?’™

đ?&#x;?đ?&#x;“mđ?&#x;?đ?&#x;‘

= đ?&#x;Ž, đ?&#x;?đ?&#x;‘đ?&#x;Žđ?&#x;—

Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =BINOM.DIST(13,15,0.8,FALSE) Daar is dus ʼn 23,09% kans dat presies 13 van die 15 miere in die eksperiment sal sterf. b) Let daarop dat daar gevra word wat die waarskynlikheid is dat 13 of meer van die

miere gesterf het. Dit beteken dat ons moet uitwerk wat die waarskynlikheid is dat 13, 14 en 15 miere gesterf het. Vind đ?‘ˇ đ?’™ ≼ đ?&#x;?đ?&#x;‘ ; dit is ʼn kumulatiewe waarskynlikheid, waar đ?’? = đ?&#x;?đ?&#x;“ en đ?’‘ = đ?&#x;Ž, đ?&#x;–. Om die kumulatiewe waarskynlikheid te bereken moet ons die waarskynlikhede van hierdie onderling uitsluitende waarskynlikhede bymekaartel: đ?‘ˇ đ?’™ ≼ đ?&#x;?đ?&#x;‘ = đ?‘ˇ đ?’™ = đ?&#x;?đ?&#x;‘ âˆŞ đ?‘ˇ đ?’™ = đ?&#x;?đ?&#x;’ âˆŞ đ?‘ˇ đ?’™ = đ?&#x;?đ?&#x;“ = đ?‘ˇ đ?’™ = đ?&#x;?đ?&#x;‘ + đ?‘ˇ đ?’™ = đ?&#x;?đ?&#x;’ + đ?‘ˇ đ?’™ = đ?&#x;?đ?&#x;“ Die drie binomiale waarskynlikhede moet nou bereken word en dan bymekaargetel word: đ?‘ˇ(đ??ą = đ?&#x;?đ?&#x;‘) = đ?&#x;?đ?&#x;Žđ?&#x;“ đ?&#x;Ž, đ?&#x;–

đ?&#x;?đ?&#x;‘

đ?&#x;Ž, đ?&#x;?

đ?&#x;?

= đ?&#x;Ž, đ?&#x;?đ?&#x;‘đ?&#x;Žđ?&#x;—

đ?‘ˇ đ?’™ = đ?&#x;?đ?&#x;’ = đ?&#x;?đ?&#x;Žđ?&#x;“ đ?&#x;Ž, đ?&#x;–

đ?&#x;?đ?&#x;’

đ?&#x;Ž, đ?&#x;?

đ?&#x;?

= đ?&#x;Ž, đ?&#x;?đ?&#x;‘đ?&#x;?đ?&#x;—

đ?‘ˇ đ?’™ = đ?&#x;?đ?&#x;“ = đ?&#x;?đ?&#x;Žđ?&#x;“ đ?&#x;Ž, đ?&#x;–

đ?&#x;?đ?&#x;“

đ?&#x;Ž, đ?&#x;?

đ?&#x;Ž

= đ?&#x;Ž, đ?&#x;Žđ?&#x;‘đ?&#x;“đ?&#x;?

Dan is: đ?‘ˇ đ?’™ ≼ đ?&#x;?đ?&#x;‘ = đ?&#x;Ž, đ?&#x;?đ?&#x;‘đ?&#x;Žđ?&#x;— + đ?&#x;Ž, đ?&#x;?đ?&#x;‘đ?&#x;?đ?&#x;— + đ?&#x;Ž, đ?&#x;Žđ?&#x;‘đ?&#x;“đ?&#x;? = đ?&#x;Ž. đ?&#x;‘đ?&#x;—đ?&#x;–đ?&#x;Ž Om dieselfde waarde in MS Excel te bereken sal soos volg lyk:

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 97


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = 1 - BINOM.DIST(12,15,0.8,TRUE) Let daarop dat die berekening hierbo đ?‘ˇ đ?’™ ≼ đ?&#x;?đ?&#x;‘ = đ?&#x;? − đ?‘ˇ(đ?’™ ≤ đ?&#x;?đ?&#x;?) bereken. Daar is dus ʼn 39,8% kans dat meer as 13 van die 15 miere sou gesterf het tydens die eksperiment. c) Let daarop dat daar gevra word wat die waarskynlikheid is dat ten minste 12 van die

miere gesterf het. Dit impliseer dat 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 en 11 miere moes gesterf het alvorens 12 kon gesterf het. Vind đ?‘ˇ đ?’™ ≤ đ?&#x;?đ?&#x;? ; dit is ook ʼn kumulatiewe waarskynlikheid, waar đ?’? = đ?&#x;?đ?&#x;“ en đ?’‘ = đ?&#x;Ž, đ?&#x;–. đ?‘ˇ đ?’™ ≤ đ?&#x;?đ?&#x;? = đ?‘ˇ đ?’™ = đ?&#x;Ž + đ?‘ˇ đ?’™ = đ?&#x;? + đ?‘ˇ đ?’™ = đ?&#x;? + â‹Ż + đ?‘ˇ(đ?’™ = đ?&#x;?đ?&#x;?) Hierdie waarskynlikhede kan afsonderlik bereken en gebruik word, maar dit kan baie moeite verg, of ons kan gebruik maak van komplementĂŞre waarskynlikhede, waar đ?‘ˇ đ?‘¨Â§ = đ?&#x;? − đ?‘ˇ đ?‘¨ Dus volg dit dat: đ?‘ˇ đ?’™ ≤ đ?&#x;?đ?&#x;‘ = đ?&#x;? − đ?‘ˇ đ?’™ ≼ đ?&#x;?đ?&#x;? = đ?&#x;? − đ?&#x;Ž, đ?&#x;‘đ?&#x;—đ?&#x;–đ?&#x;Ž = đ?&#x;Ž, đ?&#x;”đ?&#x;Žđ?&#x;?đ?&#x;Ž Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =BINOM.DIST(12,15,0.8,TRUE) Daar is dus ʼn 60,2% kans dat ten minste 12 van die 15 miere sou gesterf het tydens die eksperiment. Doen nou Voorbeeld 5.2 in die handboek met die hand en verifieer jou resultaat deur dieselfde waarskynlikheid in MS Excel te bereken. Let op Vraag (b) en (c). Wenk: Kyk uit vir die volgende woorde; hulle is altyd ʼn aanduiding dat jy ʼn kumulatiewe waarskynlikheid moet bereken: •

ten minste

•

nie meer as

•

op die meeste

•

nie minder as

•

minder/kleiner as

•

meer/groter as

Wanneer dit prakties meer sin maak, maak gebruik van komplementêre waarskynlikhede om waarskynlikheidsberekeninge vinniger te doen. Moenie in ʼn toets of eksamen kosbare tyd mors om 13 waarskynlikhede te bereken as jy net 3 moet bereken nie – werk slimmer, nie harder nie!

Bladsy 98

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementêre kwantitatiewe metodes v Poisson-verdeling Davis, Pecar en Santana (2016: 200) beskryf ʼn Poisson stogastiese veranderlike as ʼn diskrete stogastiese veranderlike wat die aantal gebeurtenisse oor ʼn bepaalde interval (byvoorbeeld tyd, afstand, area, volume, ensovoorts) aandui. Die Poissonwaarskynlikheidsverdeling is die verdeling wat die waarskynlikheid beskryf dat ʼn Poisson stogastiese veranderlike sal plaasvind. Wegner (2016: 137) definieer die Poisson stogastiese waarskynlikheidsverdeling as die maatstaf wat die aantal kere wat ʼn spesifieke diskrete stogastiese veranderlike in ʼn voorafbepaalde interval tyd, spasie of volume sal plaasvind, beskryf, waarvan die gemiddelde aantal gebeurtenisse bekend is of bereken kan word. Voorbeelde van ʼn Poisson stogastiese veranderlike is: •

Die aantal kere wat ʼn rivier oor sy walle gebreek het gedurende die laaste 100 jaar.

•

Die aantal seldsame siektes wat oor die laaste kwartaal aangemeld is.

•

Die aantal padsterftes gedurende die Desember-skoolvakansie.

•

Die aantal hare wat in ʼn hamburger gevind is.

•

Die verdeling van renosters in die Kruger Nasionale Wildtuin.

Ons gebruik die volgende formule om die waarskynlikheid van ʼn Poisson stogastiese gebeurtenis te bereken:

� � =

đ?’†mđ??€ đ??€đ?’™ đ?’™!

Vir:

đ?’™

= đ?&#x;Ž, đ?&#x;?, đ?&#x;?, đ?&#x;‘, ‌

Waar:

đ??€

= die gemiddelde aantal kere wat die gegewe uitkoms van ʼn stogastiese veranderlike sal plaasvind binne die betrokke interval (tyd, spasie of volume)

đ?’†

= die wiskundige konstante wat as 2.71828 beraam word

đ?’™

= aantal kere wat die gegewe uitkoms sal plaasvind waarvoor die waarskynlikheid benodig word (đ?’™ is die domein wat enige diskrete waarde kan aanneem van 0 tot oneindig)

MS Excel-formule:

=POISSON.DIST(đ?’™, đ??€, đ?‘­đ?‘¨đ?‘łđ?‘şđ?‘Ź)

enkel waarskynlikheid

MS Excel-formule:

=POISSON.DIST(đ?’™, đ??€, đ?‘ťđ?‘šđ?‘źđ?‘Ź)

kumulatiewe waarskynlikheid

Formule 2.10: Berekening van ’n Poisson stogastiese gebeurtenis se waarskynlikheid

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 99


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 2.13 OUTA (The Organisation Undoing Tax Abuse) het ʼn ondersoek geloods om te bepaal hoeveel voertuie deur e-tolhekke ry. Hulle het gevind dat 600 voertuie binne ʼn uur deur die Mossie e-tolhek by Rigellaan in Pretoria gery het. Bereken die volgende waarskynlikhede: a) Dat slegs 7 voertuie per minuut deur die Mossie e-tolhek sal ry. b) Dat daar op die meeste 11 voertuie per minuut deur die Mossie e-tolhek sal ry. c) Dat daar meer as 9 voertuie per minuut deur die Mossie e-tolhek sal ry. d) Dat daar minder as 21 voertuie in 3 minute deur die Mossie e-tolhek sal ry. Oplossing: Die stogastiese veranderlike is diskreet omdat daar 0, 1, 2, 3, ... voertuie deur die Mossie etolhek kan ry. Die stogastiese veranderlike vind plaas in ʼn gegewe interval, in hierdie geval per uur/minuut. Die gemiddelde aantal voertuie wat deur die Mossie e-tolhek ry, is bekend. Laat đ?’™ die aantal voertuie wat per minuut deur die Mossie e-tolhek ry, voorstel. Die gemiddeld van đ?’™ word bereken as đ??€ =

đ?&#x;”đ?&#x;Žđ?&#x;Ž đ?&#x;”đ?&#x;Ž

= đ?&#x;?đ?&#x;Ž voertuie per minuut. Baie belangrik: đ?’™ en đ??€

word albei uitgedruk in terme van “per minuutâ€? – maak seker dat die eenhede (minuut, meter, liter, ensovoorts) dieselfde is voordat jy begin met jou berekeninge. a) Vind đ?‘ˇ đ?’™ = đ?&#x;• waar đ??€ = đ?&#x;?đ?&#x;Ž voertuie per minuut. đ?‘ˇ đ?’™=đ?&#x;•

= =

đ?’†½đ??€ đ??€đ?’™ đ?’™!

đ?&#x;?.đ?&#x;•đ?&#x;?đ?&#x;–đ?&#x;?đ?&#x;– ½đ?&#x;?đ?&#x;Ž đ?&#x;?đ?&#x;Žđ?&#x;• đ?&#x;•!

=

đ?&#x;’đ?&#x;“đ?&#x;’,đ?&#x;Žđ?&#x;Žđ?&#x;?đ?&#x;’ đ?&#x;“đ?&#x;Žđ?&#x;’đ?&#x;Ž

= đ?&#x;Ž, đ?&#x;Žđ?&#x;—đ?&#x;Žđ?&#x;? Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =POISSON.DIST(7,10,FALSE) Daar is dus ʼn 9,01% kans dat daar slegs 7 voertuie in ʼn minuut deur die Mossie etolhek sal ry. b) In terme van die vraag impliseer “op die meeste 11 voertuieâ€? dat daar 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 of 11 voertuie deur die Mossie e-tolhek kon gery het. Hierdie 12 waarskynlikhede is onderliggend uitsluitlik en statisties onafhanklik en kan dus bymekaargetel word om die kumulatiewe waarskynlikheid te bereken:

Bladsy 100

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementêre kwantitatiewe metodes

𝑷 𝒙 ≤ 𝟏𝟏

= 𝑷 𝒙 = 𝟎 ∪ 𝑷 𝒙 = 𝟏 ∪ 𝑷 𝒙 = 𝟐 ∪ … ∪ 𝑷 𝒙 = 𝟏𝟏 = 𝑷 𝒙 = 𝟎 + 𝑷 𝒙 = 𝟏 + 𝑷 𝒙 = 𝟐 + ⋯ + 𝑷 𝒙 = 𝟏𝟏

𝑷 𝒙=𝟎

=

𝑷 𝒙=𝟏

=

𝑷 𝒙=𝟐

=

𝑷 𝒙=𝟑

=

𝑷 𝒙=𝟒

=

𝑷 𝒙=𝟓

=

𝑷 𝒙=𝟔

=

𝑷 𝒙=𝟕

=

𝑷 𝒙=𝟖

=

𝑷 𝒙=𝟗

=

𝑷 𝒙 = 𝟏𝟎

=

𝑷 𝒙 = 𝟏𝟏

=

𝒆½𝟏𝟎 𝟏𝟎𝟎 𝟎! 𝒆½𝟏𝟎 𝟏𝟎𝟏 𝟏! 𝒆½𝟏𝟎 𝟏𝟎𝟐 𝟐! 𝒆½𝟏𝟎 𝟏𝟎𝟑 𝟑! 𝒆½𝟏𝟎 𝟏𝟎𝟒 𝟒! 𝒆½𝟏𝟎 𝟏𝟎𝟓 𝟓! 𝒆½𝟏𝟎 𝟏𝟎𝟔 𝟔! 𝒆½𝟏𝟎 𝟏𝟎𝟕 𝟕! 𝒆½𝟏𝟎 𝟏𝟎𝟖 𝟖! 𝒆½𝟏𝟎 𝟏𝟎𝟗 𝟗!

= 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏 = 𝟎, 𝟎𝟎𝟎𝟎

onthou 𝟎! = 𝟏

= 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏𝟎 = 𝟎, 𝟎𝟎𝟎𝟓 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟓𝟎 = 𝟎, 𝟎𝟎𝟐𝟑 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏𝟔𝟔, 𝟔𝟔𝟔𝟕 = 𝟎, 𝟎𝟏𝟖𝟗 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟒𝟏𝟔, 𝟔𝟔𝟔𝟕 = 𝟎, 𝟎𝟑𝟕𝟖 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟖𝟑𝟑, 𝟑𝟑𝟑𝟑 = 𝟎, 𝟎𝟔𝟑𝟏 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏 𝟑𝟖𝟖, 𝟖𝟖𝟖𝟗 = 𝟎, 𝟎𝟗𝟎𝟏 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟏 𝟗𝟖𝟒, 𝟏𝟐𝟕 = 𝟎, 𝟏𝟏𝟐𝟔 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟐 𝟒𝟖𝟎, 𝟏𝟓𝟖𝟕 = 𝟎, 𝟏𝟐𝟓𝟏 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟐 𝟕𝟓𝟓, 𝟕𝟑𝟏𝟗 = 𝟎, 𝟏𝟐𝟓𝟏

𝒆½𝟏𝟎 𝟏𝟎𝟏𝟎 𝟏𝟎! 𝒆½𝟏𝟎 𝟏𝟎𝟏𝟏 𝟏𝟏!

= 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟐 𝟕𝟓𝟓, 𝟕𝟑𝟏𝟗 = 𝟎, 𝟏𝟏𝟑𝟕 = 𝟎, 𝟎𝟎𝟎𝟎𝟒𝟓𝟒 𝟐 𝟓𝟎𝟓, 𝟐𝟏𝟎𝟖, 𝟏𝟐𝟕 = 𝟎, 𝟎𝟗𝟒𝟖

Dan is: 𝑷 𝒙 ≤ 𝟏𝟏

= 𝟎 + 𝟎, 𝟎𝟎𝟎𝟓 + 𝟎, 𝟎𝟎𝟐𝟑 + 𝟎, 𝟎𝟏𝟖𝟗 + 𝟎, 𝟎𝟑𝟕𝟖 + 𝟎, 𝟎𝟔𝟑𝟏 + 𝟎, 𝟎𝟗𝟎𝟏 +𝟎, 𝟏𝟏𝟐𝟔 + 𝟎, 𝟏𝟐𝟓𝟏 + 𝟎, 𝟏𝟐𝟓𝟏 + 𝟎, 𝟏𝟏𝟑𝟕 + 𝟎, 𝟎𝟗𝟒𝟖 = 𝟎, 𝟔𝟗𝟔𝟖

Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =POISSON.DIST(11,10,TRUE) Daar is dus ʼn 69,68% kans dat daar ten minste 11 voertuie in ʼn minuut deur die Mossie e-tolhek sal ry. c) Die vraag vra dat ons 𝒑 𝒙 > 𝟗 moet vind waar 𝝀 = 𝟏𝟎. Omdat 𝒙 ʼn diskrete stogastiese veranderlike is, is die eerste heelgetal van 𝒙 wat groter as nege is 𝒙 = 𝟏𝟎. Dus moet ons die volgende probleem oplos: 𝑷 𝒙 ≥ 𝟏𝟎

= 𝑷 𝒙 = 𝟏𝟎 + 𝑷 𝒙 = 𝟏𝟏 + 𝑷 𝒙 = 𝟏𝟐 + ⋯

Omdat die waardes van 𝒙 oneindig is, kan dit ʼn probleem wees. Daarom gebruik ons komplementêre waarskynlikhede om hierdie probleem op te los: 𝑷 𝒙 ≥ 𝟏𝟎

=𝟏−𝑷 𝒙≤𝟗

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 101


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = đ?&#x;? − đ?‘ˇ đ?’™ = đ?&#x;Ž + đ?‘ˇ đ?’™ = đ?&#x;? + đ?‘ˇ đ?’™ = đ?&#x;? + â‹Ż đ?‘ˇ(đ?’™ = đ?&#x;—) = đ?&#x;? − (đ?&#x;Ž + đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;Žđ?&#x;“ + đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;?đ?&#x;‘ + đ?&#x;Ž, đ?&#x;Žđ?&#x;?đ?&#x;–đ?&#x;— + đ?&#x;Ž, đ?&#x;Žđ?&#x;‘đ?&#x;•đ?&#x;– + đ?&#x;Ž, đ?&#x;Žđ?&#x;”đ?&#x;‘đ?&#x;? + đ?&#x;Ž, đ?&#x;Žđ?&#x;—đ?&#x;Žđ?&#x;? +đ?&#x;Ž, đ?&#x;?đ?&#x;?đ?&#x;?đ?&#x;” + đ?&#x;Ž, đ?&#x;?đ?&#x;?đ?&#x;“đ?&#x;? + đ?&#x;Ž, đ?&#x;?đ?&#x;?đ?&#x;“đ?&#x;?) = đ?&#x;? − đ?&#x;Ž, đ?&#x;’đ?&#x;“đ?&#x;•đ?&#x;— = đ?&#x;Ž, đ?&#x;“đ?&#x;’đ?&#x;?đ?&#x;? Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = 1 – POISSON.DIST(9,10,TRUE) Daar is dus ʼn 54,21% kans dat daar meer as 9 voertuie in ʼn minuut deur die Mossie e-tolhek sal ry. d) Die eerste ding wat jy by hierdie vraag moet raaksien, is dat die tydskaal verander

het van 1 minuut na 3 minute. Daarom moet ons die gemiddeld aanpas sodat dit ook in ʼn 3-minute-skaal is: đ?&#x;‘đ??€ = đ?&#x;‘Ă—đ?&#x;?đ?&#x;Ž = đ?&#x;‘đ?&#x;Ž Nou kan ons die berekening doen van đ?‘ˇ đ?’™ < đ?&#x;?đ?&#x;? waar đ??€ = đ?&#x;‘đ?&#x;Ž đ?‘ˇ đ?’™ < đ?&#x;?đ?&#x;?

= đ?‘ˇ đ?’™ ≤ đ?&#x;?đ?&#x;Ž = đ?‘ˇ đ?’™ = đ?&#x;Ž + đ?‘ˇ đ?’™ = đ?&#x;? + đ?‘ˇ đ?’™ = đ?&#x;? + â‹Ż + đ?‘ˇ đ?’™ = đ?&#x;?đ?&#x;Ž = đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž + đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;Žđ?&#x;? + đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;Žđ?&#x;? +đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;Žđ?&#x;“ + đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;?đ?&#x;Ž + đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;?đ?&#x;— + đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;‘đ?&#x;’ + đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;“đ?&#x;• + đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;–đ?&#x;— +

đ?&#x;Ž, đ?&#x;Žđ?&#x;?đ?&#x;‘đ?&#x;’ = đ?&#x;Ž, đ?&#x;Žđ?&#x;‘đ?&#x;“đ?&#x;‘ Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =POISSON.DIST(21,30,TRUE) Daar is dus ʼn 3,53% kans dat daar minder as 21 voertuie in ʼn 3 minute interval deur die Mossie e-tolhek sal ry. Doen nou Voorbeeld 5.3 in die handboek met die hand en verifieer jou resultaat deur dieselfde waarskynlikheid in MS Excel te bereken. Let op Vraag (d). 2.6.3

Kontinue waarskynlikheidsverdelings

Bestudeer die handboek paragraaf 5.6. ʼn Kontinue stogastiese veranderlike sal ʼn kontinue waarskynlikheidsverdeling hê. Hier is ʼn paar voorbeelde van kontinue veranderlikes: •

Die lengte van ʼn persoon.

•

Die getal reĂŤnval.

•

Die duur van ʼn telefoonoproep.

•

Die opbrengs van ʼn belegging.

•

Die verkope van ʼn winkel.

Bladsy 102

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

Die elektrisiteitsverbruik van ʼn fabriek.

Die algemeenste kontinue waarskynlikheidsverdeling wat ons gebruik, is die normaalverdeling. v Standaard-normaalwaarskynlikheidsverdeling Bestudeer die handboek paragrawe 5.7 en 5.8.

Figuur 2.8: Die normaalwaarskynlikheidsverdeling Wegner (2016: 141) gee die volgende eienskappe van die normaalwaarskynlikheidsverdeling (verwys na Figuur 2.8 hierbo): •

Die kurwe is klokvormig.

•

Dit is simmetries versprei rondom ʼn gemiddelde waarde đ?œ‡.

•

Die punte van die kurwe raak nooit die X-as nie, wat beteken dat elke waarde ʼn waarskynlikheid groter as 0 het.

•

•

Die verdeling word altyd beskryf deur die twee konstantes: o

ʼn gemiddeld đ?œ‡; en

o

ʼn standaardafwyking đ?œŽ.

Die totale area onder die kurwe is altyd 1 omdat dit die totale steekproefruimte đ?‘› verteenwoordig. Omdat die kurwe simmetries versprei is, is die area links van die gemiddeld đ?œ‡ gelyk aan 0,5. Net so is die area regs van die gemiddeld đ?œ‡ gelyk aan 0,5.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 103


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

Die waarskynlikheid van ʼn spesifieke interval van � waardes word gedefinieer deur die area onder die normaalkurwe tussen �( en �* .

Om die fondasies te lĂŞ vir die berekening van waarskynlikhede met behulp van die normaalverdeling, gaan ons eers kyk na ʼn spesiale geval: die standaard-normaalverdeling. Hierdie verdeling het ʼn gemiddeld van nul (đ?œ‡ = 0) en ʼn standaardafwyking van een (đ?œŽ = 1). Omdat die waarskynlikheid ʼn area onder die normaalkurwe is, moet ons hierdie area elke keer bereken om die waarskynlikheid te kry, maar dit is nie so maklik om te doen nie... Gelukkig is dit reeds bereken en word die standaard-normaalverdelingstabel aan die einde van die handboek en as deel van die formuleblad gegee. Dit is baie belangrik dat jy verstaan hoe om die regte waardes uit hierdie tabel te lees. Om ʼn waarde uit die tabel af te lees is eenvoudig (gebruik đ?‘§ = 2,56 as voorbeeld): 1. Kry die betrokke ry, in die geval van 2,56 sal dit die ry wees wat 2,5 gemerk is. 2. Kry die betrokke kolom, in die geval van 2,56 sal dit die kolom wees wat 0,06 gemerk is. 3. Lees die waarde af waar ry 2,5 en kolom 0,06 kruis, in diĂŠ geval 0,49477. So wat presies het ons nou gedoen? Ons het die waarskynlikheid dat z tussen 0 en 2,56 val, gaan afgelees uit die tabel en gevind dat daar ’n 49,477% kans is hiervoor: đ?‘ƒ 0 < đ?‘§ < 2,56 = 0,49477

MS Excel-formule: Waar:

đ?‘˜

=NORM.S.DIST(đ?’Œ, đ?‘ťđ?‘šđ?‘źđ?‘Ź)

= die gespesifiseerde waarde van �

Formule 2.11: Berekening van die kumulatiewe waarskynlikheid van đ?‘ˇ(−∞ < đ?’› < đ?’Œ) Baie belangrik: Die berekening van hierdie waarskynlikheid (area) werk anders as die tabel. Die tabel bereken die waarskynlikheid (area) vir đ?‘ƒ(0 < đ?‘§ < đ?‘˜) en MS Excel bereken dit vir đ?‘ƒ(−∞ < đ?‘§ < đ?‘˜). As jy MS Excel wil gebruik om die z-tabel se waardes te bereken, sal die formule soos volg lyk: =NORM.S.DIST(đ?‘˜, đ?‘‡đ?‘…đ?‘ˆđ??¸) - NORM.S.DIST(0, đ?‘‡đ?‘…đ?‘ˆđ??¸) Met ander woorde: = đ?‘ƒ −∞ < đ?‘§ < đ?‘˜ − đ?‘ƒ(−∞ < đ?‘§ < 0) = đ?‘Ž − đ?‘? (verwys na Figuur 2.9 hieronder)

Bladsy 104

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 2.9: Areas wat deur die MS Excel-formule bereken word. ʼn Verdere nota: MS Excel bereken die waarskynlikheid (area) onder die normaalkurwe vir enige z-waarde. Die tabel werk slegs vir z-waardes wat afgerond is tot die tweede desimaal. Voorbeeld 2.14 Vind die volgende waarskynlikhede deur gebruik te maak van die standaardnormaalverdelingstabel: a) đ?‘ˇ(đ?&#x;Ž < đ?’› < đ?&#x;?, đ?&#x;‘đ?&#x;“) b) đ?‘ˇ(−đ?&#x;Ž, đ?&#x;—đ?&#x;’ < đ?’› < đ?&#x;Ž) c) đ?‘ˇ đ?’› > đ?&#x;?, đ?&#x;—đ?&#x;– d) đ?’‘(−đ?&#x;?, đ?&#x;•đ?&#x;” < đ?’›) e) đ?‘ˇ(−đ?&#x;?, đ?&#x;’đ?&#x;? < đ?’› < đ?&#x;Ž, đ?&#x;‘đ?&#x;•) f)

đ?‘ˇ(đ?&#x;Ž, đ?&#x;“đ?&#x;‘ < đ?’› < đ?&#x;?, đ?&#x;“đ?&#x;•)

Oplossing: Dit help altyd om dit wat van jou gevra word op ʼn stukkie papier te teken. As jy kan sien watter area jy moet bereken, is dit klaar makliker. Vir die doel van hierdie voorbeeld (en om plek te spaar) is al die waardes op een kurwe aangedui:

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 105


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 2.10: Voorbeeld 2.14 a) Om đ?‘ˇ(đ?&#x;Ž < đ?’› < đ?&#x;?, đ?&#x;‘đ?&#x;“) te vind soek ons die area tussen 0 en 1,35. Soek ry 1,3 in die tabel, soek kolom 0,05 en kyk waar hulle kruis. Lees die betrokke waarde af: 0,4115. Dus is đ?‘ˇ đ?&#x;Ž < đ?’› < đ?&#x;?, đ?&#x;‘đ?&#x;“ = đ?&#x;Ž, đ?&#x;’đ?&#x;?đ?&#x;?đ?&#x;“. Daar is ʼn 41,15% kans dat z tussen 0 en 1,35 sal lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =NORM.S.DIST(đ?&#x;?. đ?&#x;‘đ?&#x;“, đ?‘ťđ?‘šđ?‘źđ?‘Ź) – NORM.S.DIST(đ?&#x;Ž, đ?‘ťđ?‘šđ?‘źđ?‘Ź) b) Om đ?‘ˇ(−đ?&#x;Ž, đ?&#x;—đ?&#x;’ < đ?’› < đ?&#x;Ž) te vind soek ons die area tussen -0,94 en 0. Ongelukkig gee die tabel nie negatiewe z-waardes nie. Gelukkig weet ons dat hierdie verdeling simmetries versprei is om ʼn sentrale gemiddeld, en daarom is: đ?‘ˇ −đ?&#x;Ž, đ?&#x;—đ?&#x;’ < đ?’› < đ?&#x;Ž = đ?‘ˇ(đ?&#x;Ž < đ?’› < đ?&#x;Ž, đ?&#x;—đ?&#x;’) Nou kan ons eenvoudig die waarde gaan aflees uit die tabel waar ry 0,9 en kolom 0,04 kruis: 0,3264. Dus is đ?‘ˇ −đ?&#x;Ž, đ?&#x;—đ?&#x;’ < đ?’› < đ?&#x;Ž = đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;”đ?&#x;’ en is daar ʼn 32,64% kans dat z tussen -0,94 en 0 sal lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(đ?&#x;Ž, đ?‘ťđ?‘šđ?‘źđ?‘Ź) – NORM.S.DIST(−đ?&#x;Ž. đ?&#x;—đ?&#x;’, đ?‘ťđ?‘šđ?‘źđ?‘Ź) c) Om đ?‘ˇ đ?’› > đ?&#x;?, đ?&#x;—đ?&#x;– te vind stel ons belang in die area regs van 1,98. Die tabel gee ons nie hierdie area nie, dus moet ons dit eers verwerk na ʼn waarde wat ons kan aflees. Ons weet dat đ?‘ˇ đ?’› > đ?&#x;Ž = đ?&#x;Ž, đ?&#x;“ (verwys na die eienskappe van die normaalverdeling). As ons dan gebruik maak van komplementĂŞre waarskynlikhede, dan is: đ?‘ˇ đ?’› > đ?&#x;?, đ?&#x;—đ?&#x;–

= đ?&#x;Ž, đ?&#x;“ − đ?‘ˇ đ?’› < đ?&#x;?, đ?&#x;—đ?&#x;–

Gaan lees nou 1,98 uit die tabel af: 0,4761. đ?‘ˇ đ?’› > đ?&#x;?, đ?&#x;—đ?&#x;–

Bladsy 106

= đ?&#x;Ž, đ?&#x;“ − đ?‘ˇ đ?’› < đ?&#x;?, đ?&#x;—đ?&#x;–

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = đ?&#x;Ž, đ?&#x;“ − đ?&#x;Ž, đ?&#x;’đ?&#x;•đ?&#x;”đ?&#x;? = đ?&#x;Ž, đ?&#x;Žđ?&#x;?đ?&#x;‘đ?&#x;— Daar is dus ʼn 2,39% kans dat z groter sal wees as 1,98. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: =1 – NORM.S.DIST(đ?&#x;?. đ?&#x;—đ?&#x;–, đ?‘ťđ?‘šđ?‘źđ?‘Ź) d) Om đ?‘ˇ −đ?&#x;?, đ?&#x;•đ?&#x;” < đ?’› te vind stel ons belang in die area regs van -1,76. Om die area tussen -1,76 en 0 te kry lees ons die waarde uit die tabel: 0,4608. Maar die area groter as 0 kort nog: đ?‘ˇ −đ?&#x;?, đ?&#x;•đ?&#x;” < đ?’› = đ?‘ˇ −đ?&#x;?, đ?&#x;•đ?&#x;” < đ?’› < đ?&#x;Ž + đ?‘ˇ đ?&#x;Ž < đ?’› = đ?&#x;Ž, đ?&#x;’đ?&#x;”đ?&#x;Žđ?&#x;– + đ?&#x;Ž, đ?&#x;“ = đ?&#x;Ž, đ?&#x;—đ?&#x;”đ?&#x;Žđ?&#x;– Daar is dus ʼn 96,08% kans dat z se waarde groter as -1,76 sal wees. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(đ?&#x;?. đ?&#x;•đ?&#x;”, đ?‘ťđ?‘šđ?‘źđ?‘Ź) e) Om đ?‘ˇ(−đ?&#x;?, đ?&#x;’đ?&#x;? < đ?’› < đ?&#x;Ž, đ?&#x;‘đ?&#x;•) te vind stel ons belang in die area tussen -2,41 en 0,37. Hierdie waarskynlikheid word nie vir ons gegee in die tabel nie, so ons moet dit verwerk tot in ʼn formaat wat ons net kan aflees: Omdat đ?‘ˇ −đ?&#x;?, đ?&#x;’đ?&#x;? < đ?’› < đ?&#x;Ž = đ?‘ˇ đ?&#x;Ž < đ?’› < đ?&#x;?, đ?&#x;’đ?&#x;? as gevolg van simmetrie, is đ?‘ˇ(−đ?&#x;?, đ?&#x;’đ?&#x;? < đ?’› < đ?&#x;Ž, đ?&#x;‘đ?&#x;•)

= đ?‘ˇ −đ?&#x;?, đ?&#x;’đ?&#x;? < đ?’› < đ?&#x;Ž + đ?‘ˇ(đ?&#x;Ž < đ?’› < đ?&#x;Ž, đ?&#x;‘đ?&#x;•) = đ?‘ˇ đ?&#x;Ž < đ?’› < đ?&#x;?, đ?&#x;’đ?&#x;? + đ?‘ˇ(đ?&#x;Ž < đ?’› < đ?&#x;Ž, đ?&#x;‘đ?&#x;•) = đ?&#x;Ž, đ?&#x;’đ?&#x;—đ?&#x;?đ?&#x;Žđ?&#x;? + đ?&#x;Ž, đ?&#x;?đ?&#x;’đ?&#x;’đ?&#x;‘ = đ?&#x;Ž, đ?&#x;”đ?&#x;‘đ?&#x;”đ?&#x;‘đ?&#x;?

Daar is dus ʼn 63,632% kans dat z tussen -2,41 en 0,37 sal lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(đ?&#x;Ž. đ?&#x;‘đ?&#x;•, đ?‘ťđ?‘šđ?‘źđ?‘Ź) – NORM.S.DIST(−đ?&#x;?. đ?&#x;’đ?&#x;?, đ?‘ťđ?‘šđ?‘źđ?‘Ź) f)

Om đ?‘ˇ đ?&#x;Ž, đ?&#x;“đ?&#x;‘ < đ?’› < đ?&#x;?, đ?&#x;“đ?&#x;• te vind stel ons belang in die area tussen 0,53 en 2,57. Let daarop dat die gemiddeld nie in hierdie interval lĂŞ nie. Moet egter nie hiervoor skrik nie; ons moet eenvoudig hierdie interval net op so ʼn manier verwerk dat ons die nodige waardes kan aflees uit die tabel: đ?‘ˇ đ?&#x;Ž, đ?&#x;“đ?&#x;‘ < đ?’› < đ?&#x;?, đ?&#x;“đ?&#x;•

= đ?‘ˇ đ?&#x;Ž < đ?’› < đ?&#x;?, đ?&#x;“đ?&#x;• − đ?‘ˇ đ?&#x;Ž < đ?’› < đ?&#x;Ž, đ?&#x;“đ?&#x;‘ = đ?&#x;Ž, đ?&#x;’đ?&#x;—đ?&#x;’đ?&#x;—đ?&#x;? − đ?&#x;Ž, đ?&#x;?đ?&#x;Žđ?&#x;?đ?&#x;— = đ?&#x;Ž, đ?&#x;?đ?&#x;—đ?&#x;‘đ?&#x;Žđ?&#x;?

Daar is dus ʼn 29,302% kans dat z tussen 0,53 en 2,57 sal lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(đ?&#x;?. đ?&#x;“đ?&#x;•, đ?‘ťđ?‘šđ?‘źđ?‘Ź) – NORM.S.DIST(đ?&#x;Ž. đ?&#x;“đ?&#x;‘, đ?‘ťđ?‘šđ?‘źđ?‘Ź)

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 107


GQM105 Inleiding tot elementêre kwantitatiewe metodes Doen nou Voorbeeld 5.4 in die handboek. v Normaalwaarskynlikheidsverdeling Ongelukkig is die standaard-normaalverdeling ʼn baie spesiale geval van die normaalverdeling en is dit gewoonlik die uitsondering en nie die reÍl nie. Die gemiddeld is feitlik nooit 0 en die standaardafwyking 1 nie. Gestel die gemiddeld van ʼn verdeling getalle is 20 en die standaardafwyking is 4. Gestel ons wil weet wat die waarskynlikheid is dat ʼn waarde tussen 20 en 22 sal voorkom. Daar is nie ʼn 20 of 22 in die z-tabel nie! Hoewel daar nie ʼn z-waarde gegee word nie, is dit moontlik om die z-waarde te bereken. Wanneer ʼn z-waarde bereken is, is dit maklik om die area, en dus die waarskynlikheid, te bereken. �= Waar:

đ?’™âˆ’đ?? đ??ˆ

đ?‘Ľ

= die waarde wat verwerk word na die standaard-normaalverdeling

đ?œ‡

= die gemiddeld van die stogastiese veranderlike đ?‘Ľ

đ?œŽ

= die standaardafwyking van die stogastiese veranderlike đ?‘Ľ Formule 2.12: Standaardisering van x-waardes na z-waardes

Die z-waarde is ʼn maatstaf van relatiewe afstand tussen die statistiek en sy gemiddeld en word bereken in terme van sy standaardafwyking.

MS Excel-formule: Waar:

=NORM.DIST(đ?’Œ, đ?? , đ??ˆ, đ?‘ťđ?‘šđ?‘źđ?‘Ź)

đ?‘Ľ

= die spesifieke x-waarde

đ?œ‡

= die gemiddeld van die stogastiese veranderlike đ?‘Ľ

đ?œŽ

= die standaardafwyking van die stogastiese veranderlike đ?‘Ľ

Formule 2.13: Berekening van die kumulatiewe waarskynlikheid van đ?‘ˇ(−∞ < đ?‘ż < đ?’™) Baie belangrik: Die berekening van hierdie waarskynlikheid (area) werk anders as die tabel. Die tabel bereken die waarskynlikheid (area) vir đ?‘ƒ(0 < đ?‘§ < đ?‘˜) en MS Excel bereken dit vir đ?‘ƒ(−∞ < đ?‘‹ < đ?‘Ľ). Verder bereken hierdie formule die ware waarskynlikheid (area onder die normaalkurwe). Ons moet baie keer die berekende z-waarde afrond tot die tweede desimaal, sodat ons die z-tabel kan gebruik. Hierdie afronding mag daartoe lei dat ons antwoord nie 100% akkuraat is nie. So, as jy ʼn waarskynlikheid bereken met behulp van die z-tabel en dit dan verifieer met MS Excel, en dit is nie dieselfde nie, is dit nie MS Excel wat dit verkeerd bereken het of

Bladsy 108

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes ʼn fout in die z-tabel nie – dit is ʼn afrondingsfout wat noodgedwonge gemaak is tydens ons berekening. Voorbeeld 2.15 ʼn Afrikaanse onderwyser vind dat sy klas se gemiddeld 64% đ?? = đ?&#x;”đ?&#x;’ is, met ʼn standaardafwyking van 12% (đ??ˆ = đ?&#x;?đ?&#x;?). Bereken die waarskynlikheid dat: a) ʼn leerling tussen 64% en 75% sal kry vir Afrikaans. b) ʼn leerling minder as 30% sal kry vir Afrikaans. Oplossing: a) Vind đ?‘ˇ(đ?&#x;”đ?&#x;’ < đ?’™ < đ?&#x;•đ?&#x;“) Stap 1: Teken die normaalverdeling en dui die area aan waarin ons belangstel (verwys na Figuur 2.10)

Figuur 2.11: Area onder die normaalkurwe tussen đ?’™ = đ?&#x;”đ?&#x;’ en đ?’™ = đ?&#x;•đ?&#x;“ Stap 2: Verwerk die x-waardes na z-waardes. Waar đ?’™ = đ?&#x;”đ?&#x;’: đ?’› = =

đ?’™mđ?? đ??ˆ

đ?&#x;”đ?&#x;’mđ?&#x;”đ?&#x;’ đ?&#x;?đ?&#x;?

=đ?&#x;Ž

Waar đ?’™ = đ?&#x;•đ?&#x;“: đ?’› = =

đ?’™mđ?? đ??ˆ

đ?&#x;•đ?&#x;“mđ?&#x;”đ?&#x;’ đ?&#x;?đ?&#x;?

=

đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;?

= đ?&#x;Ž, đ?&#x;—đ?&#x;? Dus is đ?‘ˇ đ?&#x;”đ?&#x;’ < đ?’™ < đ?&#x;•đ?&#x;“ = đ?‘ˇ(đ?&#x;Ž < đ?’› < đ?&#x;Ž, đ?&#x;—đ?&#x;?)

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 109


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Stap 3: Bereken die waarskynlikheid đ?‘ˇ(đ?&#x;Ž < đ?’› < đ?&#x;Ž, đ?&#x;—đ?&#x;?) met behulp van die ztabel. đ?‘ˇ đ?&#x;Ž < đ?’› < đ?&#x;Ž, đ?&#x;—đ?&#x;? = đ?&#x;Ž, đ?&#x;‘đ?&#x;?đ?&#x;?đ?&#x;? Daar is dus ʼn 32,12% kans dat ʼn leerling tussen 64% en 75% vir Afrikaans sal kry. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.DIST(đ?&#x;Ž. đ?&#x;•đ?&#x;“, đ?&#x;Ž. đ?&#x;”đ?&#x;’, đ?&#x;Ž. đ?&#x;?đ?&#x;?, đ?‘ťđ?‘šđ?‘źđ?‘Ź) – NORM.DIST(đ?&#x;Ž. đ?&#x;”đ?&#x;’, đ?&#x;Ž. đ?&#x;”đ?&#x;’, đ?&#x;Ž. đ?&#x;?đ?&#x;?, đ?‘ťđ?‘šđ?‘źđ?‘Ź) b) Vind đ?‘ˇ đ?’› < đ?&#x;‘đ?&#x;Ž Stap 1: Teken die normaalverdeling en dui die area aan waarin ons belangstel (verwys na Figuur 2.11)

Figuur 2.12: Area onder die normaalkurwe tussen đ?‘Ľ = 30 en đ?‘Ľ = 64 Stap 2: Verwerk die x-waardes na z-waardes. Waar đ?’™ = đ?&#x;‘đ?&#x;Ž: đ?’› = =

đ?’™mđ?? đ??ˆ

đ?&#x;‘đ?&#x;Žmđ?&#x;”đ?&#x;’ đ?&#x;?đ?&#x;?

=

mđ?&#x;‘đ?&#x;’ đ?&#x;?đ?&#x;?

= −đ?&#x;?, đ?&#x;–đ?&#x;‘ Dus is đ?‘ˇ đ?’™ < đ?&#x;‘đ?&#x;Ž = đ?‘ˇ đ?’› < −đ?&#x;?, đ?&#x;–đ?&#x;‘ Stap 3: Bereken die waarskynlikheid đ?‘ˇ đ?’› < −đ?&#x;?, đ?&#x;–đ?&#x;‘ met behulp van die z-tabel. đ?‘ˇ đ?’› < −đ?&#x;?, đ?&#x;–đ?&#x;‘ = đ?&#x;Ž, đ?&#x;“ − đ?&#x;Ž, đ?&#x;’đ?&#x;—đ?&#x;•đ?&#x;”đ?&#x;• = đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;?đ?&#x;‘đ?&#x;‘ Daar is dus ʼn 0,233% kans dat ʼn leerling minder as 30% vir Afrikaans sal kry. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.DIST(đ?&#x;Ž. đ?&#x;‘, đ?&#x;Ž. đ?&#x;”đ?&#x;’, đ?&#x;Ž. đ?&#x;?đ?&#x;?, đ?‘ťđ?‘šđ?‘źđ?‘Ź)

Bladsy 110

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementêre kwantitatiewe metodes Doen nou Voorbeeld 5.5 in die handboek. Ons het nou die waarskynlikheid (area) bereken met behulp van die z-tabel, z-en x-waardes. Wat gemaak as ons ʼn x-waarde wil kry vanaf ʼn persentasie? Gestel ons wil weet watter xwaarde die boonste 20% van Afrikaanse leerlinge aandui (vanuit Voorbeeld 2.15 hierbo). Daar is weereens drie stappe wat Wegner (2016:147) voorstel: 1. Teken die normaalkurwe en vind die posisie van die x-waarde waarna ons soek. Hierdie waarde is die boonste of onderste limiet van die interval waarvoor die waarskynlikheid (area) gegee word. 2. Gebruik die z-tabel om die betrokke z-waarde vir die area onder die normaalkurwe te kry. In hierdie geval soek ons die area in die z-tabel en kyk ons in watter ry en kolom dit val. Presies die teenoorgestelde as wat ons hierbo (in Voorbeeld 2.15) gedoen het. 3. Gebruik Formule 2.11 om die z-waarde te verwerk na die x-waarde waarna ons soek.

MS Excel-formule: Waar:

đ?‘ƒ

=NORM.S.INV(�)

= die kumulatiewe waarskynlikheid (area onder die normaalkurwe)

Formule 2.14: Berekening van die z-limiet vir die gegewe kumulatiewe waarskynlikheid Hierdie formule bereken die ware z-limiet vir die gegewe waarskynlikheid. Die kans dat jy presies die waarde wat jy uit die z-tabel afgelees het, gaan kry, is baie klein omdat MS Excel dit presies bereken. Onthou dat hierdie verskil toegeskryf word aan afronding omdat die ztabel slegs tot die tweede desimaal afgerond is. Voorbeeld 2.16 a) Vind đ?’Œ vir đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;’đ?&#x;?đ?&#x;Žđ?&#x;• b) Vind đ?’Œ vir đ?‘ˇ đ?’Œ < đ?’› < đ?&#x;Ž = đ?&#x;Ž, đ?&#x;‘đ?&#x;’đ?&#x;?đ?&#x;‘ c) Vind đ?’Œ vir đ?‘ˇ đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;•đ?&#x;‘đ?&#x;“đ?&#x;• Oplossing: a) Vind đ?’Œ vir đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;?đ?&#x;?đ?&#x;‘đ?&#x;— Stap 1: Die waarskynlikheid (area) word gegee in Figuur 2.13.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 111


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 2.13: z-verdeling waar đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;’đ?&#x;?đ?&#x;Žđ?&#x;• Stap 2: Lees die betrokke z-waarde uit die z-tabel. đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;’đ?&#x;?đ?&#x;Žđ?&#x;• waar đ?’Œ = đ?&#x;?. đ?&#x;’đ?&#x;? Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.INV(đ?&#x;Ž. đ?&#x;“ + đ?&#x;Ž. đ?&#x;’đ?&#x;?đ?&#x;Žđ?&#x;•) onthou MS Excel gebruik die kumulatiewe waarskynlikheid vanaf −∞ tot đ?’Œ, daarom tel ons 0,5 by ons waarskynlikheid. b) Vind đ?’Œ vir đ?‘ˇ đ?’Œ < đ?’› < đ?&#x;Ž = đ?&#x;Ž, đ?&#x;?đ?&#x;–đ?&#x;Žđ?&#x;‘ Stap 1: Die waarskynlikheid (area) word gegee in Figuur 2.14.

Figuur 2.14: z-verdeling waar đ?‘ˇ đ?’Œ < đ?’› < đ?&#x;Ž = đ?&#x;Ž, đ?&#x;‘đ?&#x;’đ?&#x;?đ?&#x;‘ Stap 2: Lees die betrokke z-waarde uit die z-tabel. đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;‘đ?&#x;’đ?&#x;?đ?&#x;‘ waar đ?’Œ = −đ?&#x;?. đ?&#x;Žđ?&#x;Ž Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.INV(đ?&#x;Ž. đ?&#x;“ − đ?&#x;Ž. đ?&#x;‘đ?&#x;’đ?&#x;?đ?&#x;‘) onthou MS Excel gebruik die kumulatiewe waarskynlikheid vanaf −∞ tot đ?’Œ, daarom trek ons 0,3413 van 0,5 om die area tussen 0,3413 en 0 te kry.

Bladsy 112

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

c) Vind đ?’Œ vir đ?‘ˇ đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;•đ?&#x;‘đ?&#x;•đ?&#x;— Stap 1: Die waarskynlikheid (area) word gegee in Figuur 2.15.

Figuur 2.15: z-verdeling waar đ?‘ˇ đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;•đ?&#x;‘đ?&#x;“đ?&#x;• Stap 2: Lees die betrokke z-waarde uit die z-tabel. đ?‘ˇ đ?’›<đ?’Œ

= đ?&#x;Ž, đ?&#x;“ + đ?‘ˇ(đ?&#x;Ž < đ?’› < đ?’Œ) = đ?&#x;Ž, đ?&#x;“ + đ?&#x;Ž, đ?&#x;?đ?&#x;‘đ?&#x;“đ?&#x;•

đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ waar đ?’Œ = −đ?&#x;?. đ?&#x;Žđ?&#x;Ž Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.INV(đ?&#x;Ž. đ?&#x;“ − đ?&#x;Ž. đ?&#x;‘đ?&#x;’đ?&#x;?đ?&#x;‘) onthou MS Excel gebruik die kumulatiewe waarskynlikheid vanaf −∞ tot đ?’Œ, daarom trek ons 0,3413 van 0,5 om die area tussen 0,3413 en 0 te kry. Doen nou Voorbeeld 5.6 in die handboek. MS Excel-formule: Waar:

=NORM.INV(đ?‘ˇ, đ?? , đ??ˆ)

đ?‘ƒ

= die kumulatiewe waarskynlikheid (area onder die normaalkurwe)

đ?œ‡

= die gemiddeld van die stogastiese veranderlike đ?‘Ľ

đ?œŽ

= die standaardafwyking van die stogastiese veranderlike đ?‘Ľ

Formule 2.15: Berekening van die x-limiet vir die gegewe kumulatiewe waarskynlikheid Hierdie formule bereken die ware x-limiet vir die gegewe waarskynlikheid. Die kans dat jy die x-waarde presies gaan bereken, is baie klein omdat MS Excel dit presies bereken. As jy die z-tabel gebruik, moet jy noodgedwonge afrond en dit het ʼn impak op jou finale antwoord. Onthou dat hierdie verskil egter toegeskryf word aan afronding.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 113


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 2.17 ʼn Afrikaanse onderwyser vind dat sy klas se gemiddeld 64% đ?? = đ?&#x;”đ?&#x;’ is, met ʼn standaardafwyking van 12% (đ??ˆ = đ?&#x;?đ?&#x;?). Bereken die volgende x-waardes: a) Watter persentasie skei die top 20% van hierdie Afrikaanse klas van die res? b) Tussen watter persentasies sal die middelste 50% van hierdie Afrikaanse klas se punte val? Oplossing: a) Die oplossing verg dat ons die x-waarde moet vind. As ʼn leerling meer as hierdie xwaarde gekry het, is hy/sy een van die top 20% in die klas. Stap 1: Teken die normaalkurwe wat die area aandui waar die top 20% van die Afrikaanse klas sal lĂŞ:

Figuur 2.16: Top 20% van Afrikaanse leerlinge Stap 2: Gebruik die z-tabel om die z-waarde te vind met betrekking tot waar hierdie area onder die normaalkurwe sal begin. Ons kan nie net 0,2 gaan soek in die z-tabel nie omdat die tabel die waardes vanaf 0 tot by die z-waarde gee en daarom: đ?&#x;Ž, đ?&#x;“ − đ?&#x;Ž, đ?&#x;? = đ?&#x;Ž, đ?&#x;‘ Nou gaan soek ons die area 0,3 in die z-tabel. Die waarde of die naaste waarde daaraan, val in ry 0,8 en kolom 0,04. Dus is die z-waarde waarna ons soek 0,84. Stap 3: Vind die x-waarde vir đ?’› = đ?&#x;Ž, đ?&#x;–đ?&#x;’: Ons het die volgende waardes: đ?? = đ?&#x;”đ?&#x;’, đ??ˆ = đ?&#x;?đ?&#x;? en đ?’› = đ?&#x;Ž, đ?&#x;–đ?&#x;’ en dus is

Bladsy 114

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes đ?’› =

đ?’™mđ?? đ??ˆ

As ons hierdie formule herskryf om đ?’™ te bereken is: đ?’™ = đ?? + đ?’›đ??ˆ = đ?&#x;”đ?&#x;’ + đ?&#x;Ž, đ?&#x;–đ?&#x;’ đ?&#x;?đ?&#x;? = đ?&#x;•đ?&#x;’, đ?&#x;Žđ?&#x;– Dus sal jy in die top 20% van hierdie Afrikaanse klas val indien jy 74,08% of meer gekry het. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.INV(đ?&#x;? − đ?&#x;Ž. đ?&#x;?, đ?&#x;Ž. đ?&#x;”đ?&#x;’, đ?&#x;Ž. đ?&#x;?đ?&#x;?) b) Om hierdie vraag te beantwoord soek ons die area wat die middelste 50% van die Afrikaanse klas verteenwoordig. Gelukkig weet ons dat die normaalverdeling simmetries versprei is om die gemiddeld. Daarom stel ons belang in die 25% bo en onder die gemiddeld: đ?‘ˇ −đ?’Œ < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;“ Stap 1: Teken die normaalkurwe wat die area aandui waar die middelste 50% van die Afrikaanse klas sal lĂŞ:

Figuur 2.17: Middelste 50% van Afrikaanse leerlinge Stap 2: Gebruik die z-tabel om die z-waarde te vind met betrekking tot waar hierdie area onder die normaalkurwe sal eindig: đ?‘ˇ −đ?’Œ < đ?’› < đ?’Œ = đ?‘ˇ −đ?’Œ < đ?’› < đ?&#x;Ž + đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;“ dus is: đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;?đ?&#x;“ Nou gaan soek ons die area 0,25 in die z-tabel. Die waarde of die naaste waarde daaraan, val in ry 0,6 en amper presies tussen kolom 0,07 en 0,08 (omdat die area feitlik presies tussen kolom 0,07 en 0,08 lĂŞ, gebruik ons 0,075). Dus is die z-waarde waarna ons soek 0,675.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 115


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Stap 3: Vind die x-waarde vir đ?’› = −đ?&#x;Ž, đ?&#x;”đ?&#x;•đ?&#x;“ en đ?’› = đ?&#x;Ž, đ?&#x;”đ?&#x;•đ?&#x;“: Ons het die volgende waardes: đ?? = đ?&#x;”đ?&#x;’, đ??ˆ = đ?&#x;?đ?&#x;?, đ?’› = −đ?&#x;Ž, đ?&#x;”đ?&#x;•đ?&#x;“ en đ?’› = đ?&#x;Ž, đ?&#x;”đ?&#x;•đ?&#x;“ dus is: đ?’› =

đ?’™mđ?? đ??ˆ

as ons hierdie formule herskryf om đ?’™ te bereken, is:

đ?’™ = đ?? + đ?’›đ??ˆ = đ?&#x;”đ?&#x;’ − đ?&#x;Ž, đ?&#x;”đ?&#x;•đ?&#x;“ đ?&#x;?đ?&#x;? = đ?&#x;“đ?&#x;“, đ?&#x;— đ?’™ = đ?? + đ?’›đ??ˆ = đ?&#x;”đ?&#x;’ + đ?&#x;Ž, đ?&#x;”đ?&#x;•đ?&#x;“ đ?&#x;?đ?&#x;? = đ?&#x;•đ?&#x;?, đ?&#x;? Dus sal 50% van hierdie Afrikaanse klas se punte tussen 55,9% en 72,1% lĂŞ. Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.INV(đ?&#x;Ž. đ?&#x;“ − đ?&#x;Ž. đ?&#x;?đ?&#x;“, đ?&#x;Ž. đ?&#x;”đ?&#x;’, đ?&#x;Ž. đ?&#x;?đ?&#x;?) en = NORM.INV(đ?&#x;Ž. đ?&#x;“ + đ?&#x;Ž. đ?&#x;?đ?&#x;“, đ?&#x;Ž. đ?&#x;”đ?&#x;’, đ?&#x;Ž. đ?&#x;?đ?&#x;?) Doen nou Voorbeeld 5.7 in die handboek. Maak seker dat jy weet hoe om die waarskynlikheid (area onder die normaalkurwe) te kry vanaf die x-waarde EN hoe om die x-waarde te bereken vanaf ʼn waarskynlikheid. Jy moet ook weet hoe om MS Excel te gebruik om jou resultate te verifieer. 2.6.4

Selfevalueringsvrae

Daar is 26 vrae aan die einde van Hoofstuk 5 in die handboek. Doen al hierdie vrae om te verseker dat jy ʼn behoorlike grondslag het vir verdere werk wat behandel gaan word. 2.7

Beraming

Bestudeer die handboek paragrawe 7.1-7.8. In hierdie paragraaf gaan ons kyk na die beraming van populasie-konstantes, soos die populasiegemiddeld đ?œ‡. Daar is twee metodes waarna ons gaan kyk, naamlik puntberaming (dit is waar ons đ?œ‡ as ʼn spesifieke waarde beraam) en vertrouensintervalle (dit is waar ons đ?œ‡ tussen twee limiete beraam). Davis, Pecar en Santana (2016: 285) definieer ʼn beraming as ʼn aanduiding van ʼn onbekende populasie-konstante wat gebaseer is op die steekproef se statistieke.

Bladsy 116

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 2.18: Grafiese voorstelling van ’n puntberaming (đ?‘ż) en ’n intervalberaming vir die populasiegemiddeld đ?? (Davis, Pecar & Santana 2016: 285) In die praktyk is die populasie-konstantes, soos die gemiddeld en standaardafwyking, nie altyd beskikbaar nie. Dit kan ʼn probleem wees wanneer ons afleidings wil maak van hierdie populasie. Gelukkig het ons die steekproef se statistieke, naamlik die gemiddeld đ?‘Ľ en die standaardafwyking đ?‘ , wat ons kan gebruik om die populasie se konstantes te beraam. Neem kennis dat daar ʼn groot verskeidenheid van metodes is om te bepaal of ʼn beraming ʼn onsydige beraming is en hoe om dit te bepaal, maar dit vorm nie deel van hierdie vak nie. 2.7.1

Puntberamings

Bestudeer die handboek paragraaf 7.2. Davis, Pecar en Santana (2016: 285) definieer ʼn puntberaming as ʼn enkelwaarde wat bereken is met behulp van die steekproef se data om meer inligting te gee oor die populasiekonstante. Wegner (2016: 179), aan die ander hand, definieer puntberaming as daar aanvaar word dat die steekproefstatistiek die ware waarde van die populasie-konstante is. Ongeag van watter definisie jy verkies, gaan dit daaroor dat ʼn puntberaming ʼn waarde is, byvoorbeeld 10, 250 of 12,45. Alvorens ons kan aanvaar dat die steekproef se statistiek gelyk is aan die populasiekonstante, moet ons seker maak dat ons voldoen aan een van die volgende twee voorwaardes: •

dat die steekproef getrek is uit ʼn populasie wat normaal versprei is; of

•

as die populasie nie normaal versprei is nie, dat die steekproef groot genoeg is dat dit na ʼn normaalverdeling neig. (Ons maak hier gebruik van die sentrale limietstelling, soos behandel in paragraaf 1.6.4 in die gids.)

Die nadeel van ʼn puntberaming is dat die kans dat die steekproefstatistiek en die populasiekonstante presies dieselfde is, feitlik nul is. Die rede hiervoor is dat daar altyd, in ʼn kleinere

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 117


GQM105 Inleiding tot elementêre kwantitatiewe metodes of grotere mate, ʼn steekproeffout is. Om dit erger te maak weet ons nie hoe groot hierdie fout is nie en kan ons dit ook nie beraam nie. 2.7.2

Vertrouensintervalle

Bestudeer die handboek paragraaf 7.3. Davis, Pecar en Santana (2016: 285) definieer ʼn vertrouensinterval as die beraamde reeks van waardes, wat die onbekende populasie-konstante insluit, met ʼn waarskynlikheid van 1 − đ?›ź. Wegner (2016: 179) definieer ʼn vertrouensinterval as die reeks waardes rondom die steekproefstatistiek en dat daar verwag word dat die populasie-konstante binne hierdie interval, met ʼn gespesifiseerde vlak van sekerheid (of waarskynlikheid), sal lĂŞ. Baie belangrik: Wanneer ons ʼn vertrouensinterval skep vir die populasie se standaardafwyking, aanvaar ons dat die populasie normaal versprei is (of as die populasie nie normaal versprei is nie, dat die steekproef groot genoeg is dat dit na ʼn normaalverdeling neig). In hierdie paragraaf sal ons twee scenario’s bespreek: •

Waar die populasie se standaardafwyking đ?œŽ bekend is.

•

Waar die populasie se standaardafwyking đ?œŽ onbekend is.

v Vertrouensinterval vir die steekproefgemiddeld đ?? waar die populasie se standaardafwyking đ?›” bekend is Bestudeer die handboek paragraaf 7.4. Ons gebruik Formule 2.16 hieronder om die vertrouensintervalle te bereken:

đ?’™âˆ’đ?’› Waar:

đ??ˆ đ?’?

≤đ?? ≤đ?’™+đ?’›

đ??ˆ đ?’?

đ?‘Ľ

= gemiddeld van die steekproef

�

= die z-waarde vir die waarskynlikheid van 1 − đ?›ź onder die normaalkurwe

đ?œŽ

= standaardafwyking van die populasie

đ?‘›

= steekproefgrootte

Formule 2.16: Berekening van die vertrouensinterval vir die steekproefgemiddeld đ?? waar die populasie se standaardafwyking đ?›” bekend is.

Bladsy 118

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Let daarop dat: đ?‘ƒ −đ?‘§Ăˆ

*

< đ?‘§ < đ?‘§Ăˆ

*

=1−đ?›ź

As ons dus die z-waarde wil kry vir ʼn vertrouensinterval met ʼn waarskynlikheid van 95% (of 95% sekerheid), dan is: đ?‘ƒ −đ?‘§8,8l

*

< � < �8,8l

*

= 1 − 0,05

đ?‘ƒ −1,96 < đ?‘§ < 1,96 = 0,95 Die z-waarde 1,96 is uit die z-tabel gelees waar die area onder die normaalkurwe gelyk aan đ?‘ƒ(0 < đ?‘§ < 0,475) is (verwys na Figuur 2.16).

Figuur 2.20: Grafiese voorstelling van die waarskynlikheid waar đ?œś = đ?&#x;Ž, đ?&#x;Žđ?&#x;“ vir ’n vertrouensinterval wat met behulp van z-waardes bereken word (Davis, Pecar & Santana 2016: 293) Tabel 2.1 gee die z-limiete vir die vlak van vertroue vir die algemeenste waarskynlikhede.

Vlak van vertroue

đ?œś-waarde

z-limiete

90%

0,10

Âą1,645

95%

0,05

Âą1,96

99%

0,01

Âą2,58

Tabel 2.1: z-limiete vir die algemeenste vlakke van vertroue Onthou om die waarde van 1 − đ?›ź met twee te deel voordat jy die waarskynlikheid soek in die z-tabel omdat hierdie tabel slegs đ?‘ƒ(0 < đ?‘§ < đ?‘§Ăˆ * ) gee. Maak seker dat jy die waardes in Tabel 2.1 kan aflees uit die z-tabel. Daar kan selfs van jou verwag word om die z-limiete te Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 119


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes vind vir ʼn vertrouensinterval met ʼn 95,44% vlak van vertroue (đ?‘§ = Âą2). As jy hiermee sukkel, werk weer deur paragraaf 2.6.3, die standaard-normaalwaarskynlikheidsverdeling. Doen Voorbeeld 7.1 in die handboek. Voorbeeld 2.18 Die kwaliteitsbestuurder van ʼn koeldrankfabriek trek tien 500ml botteltjies koeldrank ewekansig van die produksielyn. Hy meet die inhoud van elke botteltjie presies om te probeer vasstel of die masjien wat die koeldrank in die botteltjies spuit, steeds binne die aanvaarbare limiete is. Aanvaar dat die inhoud van hierdie botteltjies koeldrank normaal versprei is en dat die populasie se standaardafwyking bekend is đ??ˆ = đ?&#x;?đ?&#x;Ž . Hy vind die volgende: Bottel:

1

2

3

4

5

6

7

8

9

10

Inhoud (ml):

485,3 477,2 488,2 476,1 494,1 485,2 491,9 503,6 488,0 493,2

Bereken ʼn vertrouensinterval, met 95% vlak van vertroue, vir die populasie se gemiddeld (đ?? ) gebaseer op die data hierbo. Oplossing: Die steekproefgemiddeld kan bereken word as 488,28ml đ?œś = đ?&#x;Ž, đ?&#x;Žđ?&#x;“, dus is die z-limiet Âą1,96 Dan bereken ons die vertrouensinterval as: đ?’™âˆ’đ?’›

đ??ˆ đ?’?

≤đ?? ≤đ?’™+đ?’›

đ?&#x;’đ?&#x;–đ?&#x;–, đ?&#x;?đ?&#x;– − đ?&#x;?, đ?&#x;—đ?&#x;”

đ?&#x;?đ?&#x;Ž đ?&#x;?đ?&#x;Ž

đ??ˆ đ?’?

< đ?? < đ?&#x;’đ?&#x;–đ?&#x;–, đ?&#x;?đ?&#x;– + đ?&#x;?, đ?&#x;—đ?&#x;”

đ?&#x;?đ?&#x;Ž đ?&#x;?đ?&#x;Ž

đ?&#x;’đ?&#x;–đ?&#x;–, đ?&#x;?đ?&#x;– − đ?&#x;?, đ?&#x;—đ?&#x;” đ?&#x;‘, đ?&#x;?đ?&#x;”đ?&#x;?đ?&#x;‘ < đ?? < đ?&#x;’đ?&#x;–đ?&#x;–, đ?&#x;?đ?&#x;– + đ?&#x;?, đ?&#x;—đ?&#x;” đ?&#x;‘, đ?&#x;?đ?&#x;”đ?&#x;?đ?&#x;‘ đ?&#x;’đ?&#x;–đ?&#x;–, đ?&#x;?đ?&#x;– − đ?&#x;”, đ?&#x;?đ?&#x;—đ?&#x;–đ?&#x;? < đ?? < đ?&#x;’đ?&#x;–đ?&#x;–, đ?&#x;?đ?&#x;– + đ?&#x;”, đ?&#x;?đ?&#x;—đ?&#x;–đ?&#x;? đ?&#x;’đ?&#x;–đ?&#x;?, đ?&#x;Žđ?&#x;–đ?&#x;?đ?&#x;— < đ?? < đ?&#x;’đ?&#x;—đ?&#x;’, đ?&#x;’đ?&#x;•đ?&#x;–đ?&#x;? Daar is dus ʼn 95% kans dat die werklike gemiddelde volume van al die 500ml koeldrankbotteltjies tussen 482,1ml en 494,5ml is. Dus sal die kwaliteitsbestuurder die betrokke masjien wil kalibreer om te verseker dat die botteltjies met ʼn aanvaarbare volume gevul word.

Bladsy 120

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementêre kwantitatiewe metodes v Akkuraatheid van vertrouensintervalle Bestudeer die handboek paragraaf 7.5. Wegner (2016: 181-185) bespreek die invloed wat die volgende maatstawwe op die akkuraatheid van ʼn vertrouensinterval het: •

vlak van sekerheid;

•

steekproefgrootte; en

•

die populasie se standaardafwyking.

Dit kan in kort soos volg opgesom word: Maatstaf Vlak van sekerheid

Invloed Kleiner

Hoe kleiner die vlak van sekerheid, hoe kleiner is die vertrouensinterval.

Groter

Hoe groter die vlak van sekerheid, hoe groter is die vertrouensinterval.

Steekproefgrootte

Kleiner

Hoe kleiner die steekproefgrootte, hoe kleiner is die vertrouensinterval.

Groter

Hoe groter die steekproefgrootte, hoe groter is die vertrouensinterval.

Populasie se

Kleiner

standaardafwyking

Hoe kleiner die populasie se standaardafwyking, hoe kleiner is die vertrouensinterval.

Groter

Hoe groter die populasie se standaardafwyking, hoe groter is die vertrouensinterval.

Tabel 2.2: Invloed van maatstawwe op die grootte van vertrouensintervalle As ons Voorbeeld 2.18 vat en ons gaan doen dieselfde berekeninge as in die handboek, sien ons wat die invloed van hierdie drie maatstawwe is op die grootte van ʼn vertrouensinterval.

Vlak van sekerheid 90%

Formule đ?œ‡ = đ?‘Ľ Âą 1,645

Gevolg đ?œŽ đ?‘›

đ?œ‡ = 488,28 Âą 1,645 5,2019 483,1 < đ?œ‡ < 493,5

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 121


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

95%

đ?œ‡ = đ?‘Ľ Âą 1,96

99%

đ?œ‡ = đ?‘Ľ Âą 2,58

đ?œŽ đ?‘›

đ?œŽ đ?‘›

đ?œ‡ = 488,28 Âą 1,96 6,1981 482,1 < đ?œ‡ < 494,5 đ?œ‡ = 488,28 Âą 2,58 8,1587 480,1 < đ?œ‡ < 496,4

Tabel 2.3: Invloed van die vlak van sekerheid op die grootte van vertrouensintervalle Steekproefgrootte

Formule đ?œŽ

10

đ?‘›

đ?œŽ

50

đ?‘›

đ?œŽ

150

đ?‘›

= 3,1623

Gevolg đ?œ‡ = 488,28 Âą 1,96 3,1623 482,1 < đ?œ‡ < 494,5

= 1,4142

đ?œ‡ = 488,28 Âą 1,96 1,4142 485,5 < đ?œ‡ < 491,1

= 0,8165

đ?œ‡ = 488,28 Âą 1,96 0,8165 486,7 < đ?œ‡ < 489,9

Tabel 2.4: Invloed van die steekproefgrootte op die grootte van vertrouensintervalle Standaardafwyking

Formule

Gevolg

van die populasie 10

đ?œŽ đ?‘›

50

đ?œŽ đ?‘›

150

đ?œŽ đ?‘›

= 3,1623

đ?œ‡ = 488,28 Âą 1,96 3,1623 482,1 < đ?œ‡ < 494,5

= 15,8114

đ?œ‡ = 488,28 Âą 1,96 15,8114 457,3 < đ?œ‡ < 519,3

= 47,4342

đ?œ‡ = 488,28 Âą 1,96 47,4342 395,3 < đ?œ‡ < 581,3

Tabel 2.5: Invloed van die populasie se standaardafwyking op die grootte van vertrouensintervalle

Bladsy 122

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Daar word van jou verwag om ʼn volledige beskrywing te kan gee van die invloed wat die vlak van sekerheid, steekproefgrootte en die populasie se standaardafwyking op ʼn vertrouensinterval het. Maak dus seker jy is vertroud hiermee. Doen nou Voorbeeld 7.3 en 7.4 in die handboek. Paragraaf 7.6 in die handboek verduidelik die rasionaal waarop vertrouensintervalle gebaseer is. Lees deur hierdie paragraaf om ʼn beter oorsig oor die gebruik van vertrouensintervalle te verkry. v Vertrouensinterval vir die steekproefgemiddeld đ?? waar die populasie se standaardafwyking đ?›” onbekend is Bestudeer die handboek paragraaf 7.7-7.8. Dit gebeur dikwels in praktyk dat geen statistieke van die populasie bekend is nie; dus is die populasie-standaardafwyking đ?œŽ nie beskikbaar nie. In so ʼn geval moet die steekproef se standaardafwyking đ?‘ gebruik word. In so ʼn geval, gebruik Formule 2.17 hieronder om die vertrouensintervalle te bereken:

đ?’™âˆ’đ?’• Waar:

đ?’” đ?’?

≤đ?? ≤đ?’™+đ?’•

đ?’” đ?’?

đ?‘Ľ

= gemiddeld van die steekproef

đ?‘Ą

= die t-waarde wat afgelees word uit die t-tabel

đ?‘

= standaardafwyking van die steekproef

đ?‘›

= steekproefgrootte

Formule 2.17: Berekening van die vertrouensinterval vir die steekproefgemiddeld đ?? waar die populasie se standaardafwyking đ?›” onbekend is. Daar is twee statistieke in Formule 2.17 wat jou moet opval: •

ons gebruik die steekproef se standaardafwyking in plaas van die populasie se standaardafwyking omdat die laasgenoemde nie beskikbaar is nie; en

•

ons gebruik t-waardes in die plek van z-waardes.

Die naam van hierdie waarskynlikheidsverdeling is die “student-t-verdeling� en dit word hoofsaaklik gebruik waar die steekproefgrootte klein is en die populasie normaal versprei is. As jy na die t-tabel in die agterkant van die handboek gaan kyk, sal jy sien hoe groter die grade van vryheid (df) word, hoe nader kom die t-waardes aan die z-waardes. Om die regte waardes uit die t-tabel af te lees het ons twee waardes nodig:

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 123


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

vlak van sekerheid (1 − đ?›ź); en

•

die steekproefgrootte (đ?‘›), wat in hierdie geval gebruik word om die grade van vryheid (đ?‘‘đ?‘“) af te lei: đ?‘‘đ?‘“ = đ?‘› − 1.

Gestel dat ons die t-waarde aflees vir ʼn vertrouensinterval van 99% waar die steekproefgrootte gelyk is aan 16. Dan is: đ?›ź = 1 − 0,99 = 0,01 Om dieselfde rede as met die z-limiete deel ons đ?›ź deur 2 (ons het ʼn boonste en onderste tlimiet waarin ons belangstel): Ăˆ *

= 0,005

đ?‘‘đ?‘“ = đ?‘› − 1 = 16 − 1 = 15 Nou gaan soek ons die ry wat đ?‘‘đ?‘“ = 15 verteenwoordig en die 0,005 kolom. Die waarde waar die twee kruis, is gelyk aan 2,947. Dit is baie belangrik dat jy weet hoe en waar om hierdie t-waardes uit die tabel af te lees. Voorbeeld 2.19 ’n Onderneming wat beleggingsdienste oor die telefoon bied, probeer bepaal hoe lank die gemiddelde oproep duur. Hulle trek elf oproepe ewekansig uit hul opname-basis. Aanvaar dat die duur van hierdie oproepe normaal versprei is en dat die populasie se standaardafwyking onbekend is. Die volgende tye (in sekondes) is verkry: Oproep:

1

2

3

4

5

6

7

8

9

10

11

Duur (s):

469

848

499

534

539

582

570

636

560

575

456

Bereken ʼn vertrouensinterval, met 90% vlak van vertroue, vir die populasie se gemiddeld (đ?? ) gebaseer op die data hierbo. Oplossing: Die steekproefgemiddeld kan bereken word as 536,7 sekondes Die steekproef se standaardafwyking kan bereken word as 55.1 sekondes Die volgende is gegee: đ?œś = đ?&#x;Ž, đ?&#x;? en đ?’? = đ?&#x;?đ?&#x;? Bereken die grade van vryheid: đ?’…đ?’‡ = đ?’? − đ?&#x;? = đ?&#x;?đ?&#x;? − đ?&#x;? = đ?&#x;?đ?&#x;Ž

Bladsy 124

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Lees die korrekte waarde uit die tabel: df

�

0.1000

0.0500

0.0250

0.0100

0.0050

0.0025

1

3.078

6.314

12.706

31.821

63.657

127.321

2

1.886

2.920

4.303

6.965

9.925

14.089

3

1.638

2.353

3.182

4.541

5.841

7.453

4

1.533

2.132

2.776

3.747

4.604

5.598

5

1.476

2.015

2.571

3.365

4.032

4.773

6

1.440

1.943

2.447

3.143

3.707

4.317

7

1.415

1.895

2.365

2.998

3.499

4.029

8

1.397

1.860

2.306

2.896

3.355

3.833

9

1.383

1.833

2.262

2.821

3.250

3.690

10

1.372

1.812

2.228

2.764

3.169

3.581

11

1.363

1.796

2.201

2.718

3.106

3.497

12

1.356

1.782

2.179

2.681

3.055

3.428

Tabel 2.6: Uittreksel van die t-tabel waar đ?’•(đ?&#x;?đ?&#x;Ž)(đ?&#x;Ž,đ?&#x;?

đ?&#x;?)

đ?’•(đ?&#x;?đ?&#x;Ž)(đ?&#x;Ž,đ?&#x;Žđ?&#x;“) = đ?&#x;?, đ?&#x;?đ?&#x;–đ?&#x;?đ?&#x;? Dan bereken ons die vertrouensinterval as: đ?’™âˆ’đ?’•

đ?’” đ?’?

≤đ?? ≤đ?’™+đ?’•

đ?&#x;“đ?&#x;‘đ?&#x;”, đ?&#x;• − đ?&#x;?, đ?&#x;–đ?&#x;?đ?&#x;?

đ?&#x;“đ?&#x;“, đ?&#x;? đ?&#x;?đ?&#x;?

đ?’” đ?’?

< đ?? < đ?&#x;“đ?&#x;‘đ?&#x;”, đ?&#x;• + đ?&#x;?, đ?&#x;–đ?&#x;?đ?&#x;?

đ?&#x;“đ?&#x;“, đ?&#x;? đ?&#x;?đ?&#x;?

đ?&#x;“đ?&#x;‘đ?&#x;”, đ?&#x;• − đ?&#x;?, đ?&#x;–đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;”, đ?&#x;” < đ?? < đ?&#x;“đ?&#x;‘đ?&#x;”, đ?&#x;• + đ?&#x;?, đ?&#x;–đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;”, đ?&#x;” đ?&#x;“đ?&#x;‘đ?&#x;”, đ?&#x;• − đ?&#x;‘đ?&#x;Ž, đ?&#x;? < đ?? < đ?&#x;“đ?&#x;‘đ?&#x;”, đ?&#x;• + đ?&#x;‘đ?&#x;Ž, đ?&#x;? đ?&#x;“đ?&#x;Žđ?&#x;”, đ?&#x;” < đ?? < đ?&#x;“đ?&#x;”đ?&#x;”, đ?&#x;– Daar is dus ʼn 90% kans dat die werklike gemiddelde duur van ʼn oproep tussen 506,6 en 566,8 sekondes lank sal wees. Doen nou Voorbeeld 7.5 in die handboek. 2.7.3

Selfevalueringsvrae

Doen Vraag 1-13 aan die einde van Hoofstuk 7 in die handboek. 2.8

Samevatting

In hierdie studie-eenheid het ons begin om te kyk na waarskynlikhede en hoe dit gebruik kan word om afleidings en beramings te maak van die populasie.

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming

Bladsy 125


GQM105 Inleiding tot elementêre kwantitatiewe metodes Ons het gekyk na die belangrikste begrippe wat die fondamente is van waarskynlikheidsleer, insluitende snyding van gebeurtenisse, onderling uitsluitlike gebeurtenisse, subversamelings van gebeurtenisse, komplementêre gebeurtenisse en statisties onafhanklike gebeurtenisse. Toe het ons die marginale, gesamentlike, saamgevoegde en voorwaardelike waarskynlikhede van hierdie gebeurtenisse bereken. Om ons te help met hierdie berekeninge het ons permutasies en kombinasies uitgewerk met behulp van die telreëls. Nadat ons die basiese beginsels van waarskynlikhede onder die knie gekry het, het ons gaan kyk na die verskillende kategorieë van waarskynlikheidsverdelings: ons het die binominale (waarskynlikheid op ʼn sukses) en die Poisson (die waarskynlikheid van ʼn gebeurtenis binne ʼn bepaalde interval) diskrete waarskynlikheidsverdelings behandel. Daarna het ons oorgegaan na die kontinue waarskynlikheidsverdelings, waar ons die standaard-normaalverdeling en die normaalverdeling gedoen het. Hierdie beginsels en berekening het ons gebruik om puntberamings en intervalberamings te doen. Ons het gewys wat die invloed van die vlak van sekerheid, steekproefgrootte en die grootte van die standaardafwyking op ʼn vertrouensinterval is. Ons het vertrouensintervalle bereken waar die populasie se standaardafwyking bekend (z-limiete) en onbekend (t-limiete) was. Ons gaan hierdie basis nou verder gebruik in hipotesetoetsing (die volgende studieeenheid), waar ons gevolgtrekkings gaan maak wat gebaseer is op waarskynlikhede en waarskynlikheidsverdelings. Hier sal ons ook gebruik maak van z-waardes en t-waardes.

Bladsy 126

Studie-eenheid 2: Waarskynlikhede, waarskynlikheidsverdelings en beraming


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

STUDIE-EENHEID 3: HIPOTESETOETSING

3.1

Studie-eenheid leeruitkomste

Kennis en begrip Na voltooiing van Studie-eenheid 3 sal jy in staat wees om jou kennis en begrip van die volgende te demonstreer: •

Basiese begrippe wat gebruik word vir hipotesetoetsing

•

Die proses wat ons gebruik om ʼn hipotesetoets te doen

•

Hipotesetoetsing van ʼn enkele populasie se gemiddeld waar die populasie se standaardafwyking bekend is

•

Hipotesetoetsing van ʼn enkele populasie se gemiddeld waar die populasie se standaardafwyking onbekend is

•

Hipotesetoetsing van ʼn enkele populasie se gemiddeld met behulp van die �-waarde

Vaardighede Jy sal ook in staat wees om: •

te verduidelik wat die volgende begrippe beteken: o

nulhipotese en ʼn alternatiewe hipotese

o

peil van betekenis

o

Tipe I- en II-foute

o

toetsstatistiek

o

kritieke waarde

o

đ?’‘-waarde

•

die vyf stappe van hipotesetoetsing te identifiseer en toe te pas;

•

hipotesetoetsing vir ʼn populasiegemiddeld te doen as die populasie se standaardafwyking bekend is (z-toets);

•

hipotesetoetsing vir ʼn populasiegemiddeld te doen as die populasie se standaardafwyking onbekend is (t-toets); en

•

ʼn p-waarde te interpreteer en vir hipotesetoetsing te gebruik.

Studie-eenheid 3: Hipotesetoetsing

Bladsy 127


GQM105 Inleiding tot elementêre kwantitatiewe metodes 3.2

Voorgeskrewe handboek

Wegner, T. 2016. Applied business statistics. 4de uitgawe. Claremont: Juta. Vir die doeleindes van hierdie studie-eenheid moet jy die volgende paragrawe bestudeer: Hoofstuk 8 paragrawe 8.1-8.4 en 8.6-8.8 3.3

Hoe kan jy jou begrip verbeter?

Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord

Omskrywing

Aanvaardingsarea

Die area/oppervlak onder ʼn kurwe waar die nulhipotese as waarskynlik waar aanvaar word.

Alternatiewe hipotese

Die hipotese wat die komplementêre stelling van die nulhipotese is; dit is, met ander woorde, die teenoorgestelde van die nulhipotese.

Hipotese

ʼn Hipotese is ʼn stelling wat gemaak word.

Hipotesetoets

ʼn Prosedure wat die nulhipotese op die proef stel.

Kritieke waarde

Die waarde waarteen die toetsstatistiek oorweeg word ten einde ʼn gevolgtrekking te kan maak.

Kumulatiewe

Die gesamentlike waarskynlikheid vir alle onderling

waarskynlikheid

uitsluitlike gebeurtenisse van ʼn stogastiese veranderlike, tussen twee bepaalde limiete.

Limiete

ʼn Numeriese grens waarbo/waaronder ʼn hipotese getoets word.

Nulhipotese

’n Teorie oor of ʼn stelling wat gemaak word aangaande ’n populasiestatistiek wat nog bewys moet word.

Peil van

Die peil van betekenis is die waarskynlikheid dat ons die

betekenis/sekerheid/vertroue

nulhipotese (as waarskynlik waar) verwerp, terwyl die nulhipotese eintlik waar is.

Statisties betekenisvol

ʼn Beslissende uitkoms/resultaat na afloop van ʼn hipotesetoets.

Toetsstatistiek

Die waarde wat met die kritieke waarde vergelyk word ten

Bladsy 128 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementêre kwantitatiewe metodes einde ʼn gevolgtrekking te kan maak. Verwerpingsarea

Die area/oppervlak onder ʼn kurwe waar die nulhipotese as waarskynlik waar verwerp word.

3.4

Inleiding

Alles wat ons tot op hede behandel het, het opgebou na hipotesetoetsing. Nou mag jy vra waarom hipotesetoetsing só belangrik is. Hipotesetoetsing is so belangrik omdat ons dit gebruik om ʼn stelling te aanvaar of te verwerp. Hierdie stellings is gewoonlik gebaseer op ʼn navorsingsvraag wat iemand probeer beantwoord, byvoorbeeld of die inkomste van ʼn winkel meer as ʼn sekere bedrag is, of die tydperk wat ʼn aflewering minder is as ʼn bepaalde tyd, ensovoorts. Ons gebruik dus hipotesetoetsing in enige kwantitatiewe navorsing wat gedoen word. Dit is ʼn vyfstapproses wat ons gebruik om te wys dat ʼn stelling (hipotese) waarskynlik reg of waarskynlik verkeerd is. Tydens die stap waar ons die toetsstatistiek bereken, gebruik ons die steekproefdata en statistieke wat ons daarmee bereken het om ʼn gevolgtrekking te maak oor ʼn populasie-konstante. Daar is ʼn baie groot verskeidenheid van hipotesetoetsing, maar ons gaan slegs kyk na: •

die populasiegemiddeld waar die populasie se standaardafwyking bekend is; en

•

die populasiegemiddeld waar die populasie se standaardafwyking onbekend is.

3.5

Basiese begrippe van hipotesetoetsing

Alvorens ons verder kan aangaan, is dit nodig dat ons gou kyk na die basiese begrippe wat ons gaan gebruik om ʼn hipotesetoets te doen. 3.5.1

Die nul en alternatiewe hipotese

Soos vroeĂŤr genoem, gaan hipotesetoetsing daaroor dat ons die waarskynlikheid van ʼn stelling wil toets. Hierdie stelling is eintlik twee komplementĂŞre stellings (die nul- en alternatiewe hipotese), met ander woorde as die een aanvaar word, word die ander verwerp. Beide hierdie hipoteses kan nie op dieselfde tyd van toepassing wees nie. Daarom moet ons baie versigtig wees dat ons die nul- en die alternatiewe hipotese korrek formuleer. v Nulhipotese đ?‘Żđ?&#x;Ž Davis, Pecar en Santana (2016: 317) wys ons daarop dat die nulhipotese ’n teorie aangaande die populasie se konstantes verteenwoordig en dat hierdie teorie nog bewys moet word. Wegner (2016: 200) meld dat die nulhipotese sĂŞ dat die populasie-konstante

Studie-eenheid 3: Hipotesetoetsing

Bladsy 129


GQM105 Inleiding tot elementêre kwantitatiewe metodes gelyk aan, kleiner as of groter as ʼn spesifieke waarde is en dat dit gewoonlik die status quo verteenwoordig. Die manier waarop die nulhipotese geformuleer word, bepaal of dit ʼn eenkantige of tweekantige hipotesetoets gaan wees. Tabel 3.1 hieronder gee vir ons die trefwoorde en wiskundige simbole wat ons help om ʼn eenkantige of tweekantige hipotese te herken en te definieer.

Trefwoorde

Wiskundige simbole

Gelyk aan, dieselfde as Kleiner as, groter as, nie minder as,

= <, >, ≤, ≼

Tipe hipotesetoets Tweekantige hipotesetoets Eenkantige hipotesetoets

nie meer as, ten minste, op die meeste, ensovoorts Tabel 3.1: Woorde en simbole wat gebruik word vir die definiĂŤring van ’n hipotese v Alternatiewe hipotese đ?‘Żđ?&#x;? Davis, Pecar en Santana (2016: 317) stel dit dat hierdie hipotese alternatiewe waardes vir die populasie-konstante bevat as in die nulhipotese en dus as ʼn kontrasterende stelling vir die nulhipotese dien. Wegner (2016: 200) sĂŞ dat die alternatiewe hipotese die teenoorgestelde is as die nulhipotese. Die nulhipotese en alternatiewe hipotese het komplementĂŞre waarskynlikhede in die steekproefruimte van die hipotesetoets. Dus moet die alternatiewe hipotese aanvaar word (as waarskynlik waar) waar ons die nulhipotese (as waarskynlik waar) verwerp. 3.5.2

Peil van betekenis đ?œś

Die peil van betekenis is die waarskynlikheid dat ons die nulhipotese (as waarskynlik waar) verwerp, terwyl die nulhipotese eintlik waar is. Dus, as ons sê dat ons ʼn nulhipotese toets teen ʼn 0,05 peil van betekenis, sê ons eintlik dat die waarskynlikheid dat ons die nulhipotese verwerp, terwyl ons dit eintlik moet aanvaar, nie groter as 5% is nie. 3.5.3

Tipe I- en II-foute

Die waarskynlikheid dat ons die nulhipotese verwerp, terwyl dit eintlik waar is, staan bekend as ʼn Tipe I-fout (of die peil van betekenis). Die waarskynlikheid dat ons die nulhipotese aanvaar, terwyl dit eintlik nie waar is nie, staan bekend as ʼn Tipe II-fout.

Bladsy 130 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementêre kwantitatiewe metodes Hoe kleiner die kans op ʼn Tipe I-fout is, hoe groter die kans dat ʼn Tipe II-fout sal plaasvind. Om die waarskynlikheid van ʼn Tipe II-fout te beperk pas ons die peil van betekenis aan, omdat ons bepaal wat die kans van ʼn Tipe I-fout is. 3.5.4

Toetsstatistiek

Die toetsstatistiek is die waarde wat ons bereken met behulp van die data wat ons tydens die steekproef versamel het. Deur die toetsstatistiek te vergelyk met die kritieke waarde, kan ons bepaal of die nulhipotese aanvaar of verwerp word. 3.5.5

Kritieke waarde

Dit is die kwantiel, in verband met die waarskynlikheid dat ʼn Tipe I-fout sal plaasvind (peil van betekenis), wat afgelei is van die steekproefverdeling van die toetsstatistiek. ʼn Kritieke waarde is die limiet vir die toetsstatistiek, wat bepaal of die nulhipotese aanvaar of verwerp word. Met ander woorde, die kritieke waarde definieer die verwerpingsarea vir die nulhipotese. 3.5.6

đ?’‘-waarde

Die đ?‘?-waarde is die waarskynlikheid om die toetsstatistiek ewekansig te verkry, onder die nulhipotese. As đ?’‘-waarde < đ?œś sal ons die nulhipotese verwerp. Met ander woorde, as die waarskynlikheid om die toetsstatistiek te kry kleiner is as om die nulhipotese verkeerdelik te verwerp, is die kans dat die alternatiewe hipotese waar is baie groter. 3.6

Die proses van hipotesetoetsing

Hipotesetoetsing is ʼn vyfstapproses. Hierdie vyf stappe is presies dieselfde vir al die hipotesetoetse wat jy in hierdie vak moet kan doen. Indien jy hierdie stappe ken, is jy al halfpad daar! In hierdie studie-eenheid gaan ons net kyk na hipotesetoetse wat betrekking het op die populasiegemiddeld đ?œ‡. 3.6.1

Stap 1: Definieer die nulhipotese en die alternatiewe hipotese

Kyk na die vraag wat vir jou gevra word om te bepaal hoe jy die nulhipotese en die alternatiewe hipotese moet definieer. Soos vroeĂŤr genoem, is daar drie basiese maniere om ʼn hipotese te formuleer: v Tweekantige hipotesetoets: đ??ť8 : populasie-konstante = ʼn spesifieke waarde đ??ť( : populasie-konstante ≠ʼn spesifieke waarde

Studie-eenheid 3: Hipotesetoetsing

Bladsy 131


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Voorbeeld: As ʼn skoolhoof beweer dat die gemiddelde IK van sy leerlinge gelyk is aan 105. Dus sal: đ??ť8 : die gemiddelde IK van die leerlinge is gelyk aan 105. đ??ť( : die gemiddelde IK van die leerlinge is nie gelyk aan 105 nie. Maar dit kan ook soos volg geskryf word: đ??ť8 : đ?œ‡ = 105 đ??ť( : đ?œ‡ ≠105

Figuur 3.1: Aanvaardings- en verwerpingsarea van ’n tweekantige hipotesetoets v Eenkantige hipotesetoets na onder (links): đ??ť8 : populasie-konstante ≼ ʼn spesifieke waarde đ??ť( : populasie-konstante < ʼn spesifieke waarde Voorbeeld: As ʼn skoolhoof beweer dat die gemiddelde IK van sy leerlinge groter of gelyk aan 105 is. Dus sal: đ??ť8 : die gemiddelde IK van die leerlinge is groter of gelyk aan 105. đ??ť( : die gemiddelde IK van die leerlinge is kleiner as 105. Maar dit kan ook soos volg geskryf word: đ??ť8 : đ?œ‡ ≼ 105 đ??ť( : đ?œ‡ < 105

Bladsy 132 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 3.2: Aanvaardings- en verwerpingsarea van ’n eenkantige hipotesetoets na onder (links) v Eenkantige hipotesetoets na bo (regs): đ??ť8 : populasie-konstante ≤ ʼn spesifieke waarde đ??ť( : populasie-konstante > ʼn spesifieke waarde Voorbeeld: As ʼn skoolhoof beweer dat die gemiddelde IK van sy leerlinge kleiner of gelyk aan 105 is. Dus sal: đ??ť8 : die gemiddelde IK van die leerlinge is kleiner of gelyk aan 105. đ??ť( : die gemiddelde IK van die leerlinge is groter as 105. Maar dit kan ook soos volg geskryf word: đ??ť8 : đ?œ‡ ≤ 105 đ??ť( : đ?œ‡ > 105

Figuur 3.3: Aanvaardings- en verwerpingsarea van ’n eenkantige hipotesetoets na bo (regs) 3.6.2

Stap 2: Bepaal die aanvaardingsarea vir die nulhipotese

Verwys na Figure 3.1-3.3 hierbo – dit dui die verwerpingsarea aan vir die drie verskillende hipotesetoetse. Deel van hierdie stap is om te bepaal hoe groot hierdie areas moet wees, maar vir die doel van hierdie vak sal dit vir jou gegee word in die vraag, byvoorbeeld bepaal met ʼn 1%, 5% of 10% peil van betekenis dat...

Studie-eenheid 3: Hipotesetoetsing

Bladsy 133


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Onthou dat hierdie peil van betekenis die waarskynlikheid van ʼn Tipe I-fout voorstel (met ander woorde die kans dat die nulhipotese verkeerdelik verwerp word). Let daarop dat die verwerpingsarea vir ʼn tweekantige hipotesetoets (verwys na Figuur 3.1) verdeel is in ʼn onderste (linkerkantse) en boonste (regterkantse) area. Omdat daar twee Ăˆ

verwerpingsareas is, moet ons vir elkeen . Vir ʼn eenkantige hipotesetoets (verwys na *

Figuur 3.2 en 3.3) is daar slegs een verwerpingsarea wat � volledig verteenwoordig. Ons moet die inligting wat in die vraag aan ons gegee is, gebruik om die betrokke verdeling te bepaal. In die geval waar die populasie se standaardafwyking bekend is, sal ons die standaard-normaalverdeling (z-waardes) gebruik. Indien die populasie se standaardafwyking nie aan ons bekend is nie, sal ons die student-t-verdeling (t-waardes) gebruik. Dit is baie belangrik dat jy onderskeid tussen hierdie twee gevalle kan tref en weet wanneer om watter verdeling te gebruik. In die geval van die standaard-normaalverdeling gebruik ons die z-tabel om die kritieke waardes af te lees vir �: Peil van

Verwerpingsarea

Tipe

betekenis (đ?œś)

z-limiete

hipotesetoets

0,01 (1%)

đ?‘ƒ −đ?‘§-krit > đ?‘§) + đ?‘ƒ(đ?‘§ > đ?‘§-krit = 0,01

Tweekantig

Âą2,58

0,05 (5%)

đ?‘ƒ −đ?‘§-krit > đ?‘§) + đ?‘ƒ(đ?‘§ > đ?‘§-krit = 0,05

Tweekantig

Âą1,96

0,10 (10%)

đ?‘ƒ −đ?‘§-krit > đ?‘§) + đ?‘ƒ(đ?‘§ > đ?‘§-krit = 0,10

Tweekantig

Âą1,645

0,01 (1%)

đ?‘ƒ(−đ?‘§-krit > đ?‘§) = 0,01

Eenkantig na onder

−2,33

0,05 (5%)

đ?‘ƒ(−đ?‘§-krit > đ?‘§) = 0,05

Eenkantig na onder

−1,645

0,10 (10%)

đ?‘ƒ(−đ?‘§-krit > đ?‘§) = 0,10

Eenkantig na onder

−1,28

0,01 (1%)

đ?‘ƒ(đ?‘§ > đ?‘§-krit) = 0,01

Eenkantig na bo

+2,33

0,05 (5%)

đ?‘ƒ(đ?‘§ > đ?‘§-krit) = 0,05

Eenkantig na bo

+1,645

0,10 (10%)

đ?‘ƒ(đ?‘§ > đ?‘§-krit) = 0,10

Eenkantig na bo

+1,28

Tabel 3.2: z-limiete vir die verskillende peile van betekenis vir tweekantige en eenkantige hipotesetoetse (Wegner, 2016: 204) Vir die t-limiete sal ons uit, die aard van die saak, die t-tabel gebruik. Omdat hierdie tabel afhanklik is van spesifieke grade van vryheid, is daar nie ʼn standaard tabel (soos hierbo) vir

Bladsy 134 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes die t-limiete nie. Jy moet dus weet hoe om die kritieke waarde af te lees uit die t-tabel (maar dit sal later in hierdie studie-eenheid in meer detail behandel word). 3.6.3

Stap 3: Bereken die toetsstatistiek

Op hierdie punt het ons die nulhipotese en die alternatiewe hipotese, wat ons self gedefinieer het na aanleiding van die vraag. Uit die hipoteses kon ons bepaal of dit ʼn eenkantige of tweekantige toets moet wees. Die vraag spesifiseer of die standaardafwyking van die populasie đ?œŽ bekend of onbekend is en dit bepaal watter verdeling ons moet gebruik: standaard-normaal- of die student-t-verdeling. Nou kan ons voortgaan om die toetsstatistiek te bereken. v Standaard-normaalverdeling In die geval waar die populasie se standaardafwyking bekend is, gebruik ons die standaard-normaalverdeling om die toetsstatistiek vir die populasiegemiddeld te bereken.

đ?’›-stat =

đ?’™âˆ’đ?? đ??ˆ đ?’?

Waar:

đ?‘Ľ

= gemiddeld van die steekproef

đ?œ‡

= die waarde aan wat die populasie se gemiddeld gelyk is (volgens đ??ť8 )

đ?œŽ

= die standaardafwyking van die populasie

đ?‘›

= steekproefgrootte Formule 3.1: Berekening van die đ?’›-stat toetsstatistiek

v Student-t-verdeling In die geval waar die populasie se standaardafwyking onbekend is, gebruik ons die student-t-verdeling om die toetsstatistiek vir die populasiegemiddeld te bereken.

đ?’•-stat =

đ?’™âˆ’đ?? đ?’” đ?’?

Waar:

đ?‘Ľ

= gemiddeld van die steekproef

đ?œ‡

= die waarde waaraan die populasie se gemiddeld gelyk is (volgens đ??ť8 )

đ?‘

= die standaardafwyking van die steekproef

đ?‘›

= steekproefgrootte Formule 3.2: Berekening van die đ?’•-stat toetsstatistiek

Studie-eenheid 3: Hipotesetoetsing

Bladsy 135


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 3.6.4

Stap 4: Vergelyk die steekproef se toetsstatistiek met die aanvaardingsarea vir die nulhipotese

Nou word daar gekyk of die toetsstatistiek in die aanvaardings- of die verwerpingsarea val. 3.6.5

Stap 5: Maak ʼn gevolgtrekking

Indien die toetsstatistiek in die aanvaardingsarea val, word die nulhipotese aanvaar. Indien die toetsstatistiek in die verwerpingsarea val, word die nulhipotese verwerp. Verwys na Tabel 3.2 hieronder. Geval

Tipe hipotesetoets

Resultaat

−đ?‘§-krit > đ?‘§-stat

Een- of tweekantig

Verwerp đ??ť8

−đ?‘§-krit < đ?‘§-stat

Eenkantig

Aanvaar đ??ť8

−đ?‘§-krit < đ?‘§-stat < đ?‘§-krit

Tweekantig

Aanvaar đ??ť8

�-stat < �-krit

Eenkantig

Aanvaar đ??ť8

�-stat > �-krit

Een- of tweekantig

Verwerp đ??ť8

Tabel 3.3: Waar die nulhipotese aanvaar en verwerp word Dit is belangrik om op hierdie stadium te meld dat ʼn hipotese nooit bewys word nie. Tydens ʼn hipotesetoetse aanvaar of verwerp ons ʼn nulhipotese as “waarskynlik waarâ€?. As ons dus ʼn nulhipotese (as waarskynlik waar) verwerp, sĂŞ ons eintlik dat die alternatiewe hipotese waarskynlik waar is. ʼn Alternatiewe hipotese word nooit as ʼn resultaat aanvaar nie: Ons aanvaar of verwerp die nulhipotese. Moenie hier stop nie! Nou moet jy ʼn gevolgtrekking maak ten opsigte van die stelling wat gemaak is. Jy moet die resultaat (of die đ??ť8 aanvaar of verwerp word) toepas op die vraag wat gestel is, met ander woorde die stelling wat gemaak is, is waarskynlik waar of vals. 3.7 3.7.1

Praktiese voorbeelde van hipotesetoetse Hipotesetoets vir ʼn populasiegemiddeld đ?? waar die populasie se standaardafwyking đ??ˆ bekend is

Bestudeer die handboek paragraaf 8.3.

Bladsy 136 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 3.1 ʼn Vervaardiger van kunsmis beweer dat koringlande wat met sy kunsmis behandel word, ʼn gemiddelde 4,5 ton per hektaar koring sal lewer. Om hierdie stelling te toets is 30 hektaar koringlande wat met sy kunsmis behandel is, ewekansig getrek regoor Suid-Afrika en is die opbrengs daarvan opgeskryf per hektaar: 5,33

4,36

5,35

4,40

4,39

4,55

4,03

3,52

4,03

4,28

2,46

4,51

4,56

4,35

5,63

4,73

3,12

4,44

5,23

4,61

4,51

4,87

4,72

4,95

5,49

2,44

2,33

4,31

4,79

4,56

Aanvaar dat hierdie populasie waaruit hierdie steekproef getrek is, normaal versprei is, met ʼn populasie-standaardafwyking van 0,645. Die steekproef se gemiddeld kan bereken word as đ?’™ = đ?&#x;’, đ?&#x;‘đ?&#x;”đ?&#x;?đ?&#x;•. Doen ʼn hipotesetoets, met ʼn 5% peil van betekenis, om die vervaardiger se bewering op die proef te stel. Oplossing: Stap 1: Definieer die hipoteses đ?‘Żđ?&#x;Ž

: Dat die gemiddelde opbrengs van koringlande wat met die vervaardiger se kunsmis behandel is, gelyk is aan 4,5 ton per hektaar. (Die stelling wat ons wil toets.)

đ?‘Żđ?&#x;?

: Dat die gemiddelde opbrengs van koringlande wat met die vervaardiger se kunsmis behandel is, nie gelyk is aan 4,5 ton per hektaar nie. (Die komplementĂŞre stelling.)

Hierdie hipoteses kan ook soos volg uitgedruk word: đ?‘Żđ?&#x;Ž

: đ?? = đ?&#x;’, đ?&#x;“

đ?‘Żđ?&#x;?

: đ?? ≠đ?&#x;’, đ?&#x;“

Stap 2: Bepaal die aanvaardingsarea Ons het die volgende: •

Die populasie se standaardafwyking is vir ons bekend, đ??ˆ = đ?&#x;Ž, đ?&#x;”đ?&#x;’đ?&#x;“, dus moet ons van die standaard-normaalverdeling gebruik maak.

•

Die peil van betekenis wat ons moet gebruik, word gegee as đ?œś = đ?&#x;Ž, đ?&#x;Žđ?&#x;“.

•

Dit is ʼn tweekantige hipotesetoets omdat đ?‘Żđ?&#x;Ž : đ?? = đ?&#x;’, đ?&#x;“ (daar sal ʼn onderste en boonste verwerpingsarea wees waar die populasie se gemiddeld minder of meer as 4,5 is).

Studie-eenheid 3: Hipotesetoetsing

Bladsy 137


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Die onderste en boonste z-limiete vir hierdie hipotesetoets word uit die z-tabel afgelees vir: đ?‘ˇ −đ?’Œ < đ?’› < đ?’Œ = đ?‘ˇ −đ?’Œ < đ?’› < đ?&#x;Ž + đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;?Ă— đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;—đ?&#x;“ dus is đ?‘ˇ đ?&#x;Ž < đ?’› < đ?’Œ = đ?&#x;Ž, đ?&#x;’đ?&#x;•đ?&#x;“ waar đ?’Œ = đ?&#x;?, đ?&#x;—đ?&#x;” daarom is die z-limiete vir hierdie toets đ?‘ˇ −đ?&#x;?, đ?&#x;—đ?&#x;” < đ?’› < đ?&#x;?, đ?&#x;—đ?&#x;” = đ?&#x;Ž, đ?&#x;—đ?&#x;“ Figuur 3.4 gee die aanvaardings- en verwerpingsareas vir hierdie hipotesetoets.

Figuur 3.4: Aanvaardings- en verwerpingsareas vir ’n tweekantige hipotesetoets vir đ?‘ˇ(−đ?&#x;?, đ?&#x;—đ?&#x;” < đ?’› < đ?&#x;?, đ?&#x;—đ?&#x;”)

Stap 3: Bereken die toetsstatistiek đ?’›-stat = =

đ?’™mđ?? đ??ˆ đ?’?

đ?&#x;’, đ?&#x;‘đ?&#x;”đ?&#x;?đ?&#x;• − đ?&#x;’, đ?&#x;“ đ?&#x;Ž,đ?&#x;”đ?&#x;’đ?&#x;“ đ?&#x;‘đ?&#x;Ž

=

−đ?&#x;Ž, đ?&#x;?đ?&#x;‘đ?&#x;–đ?&#x;‘ đ?&#x;Ž,đ?&#x;”đ?&#x;’đ?&#x;“ đ?&#x;“,đ?&#x;’đ?&#x;•đ?&#x;•đ?&#x;?

=−

đ?&#x;Ž, đ?&#x;?đ?&#x;‘đ?&#x;–đ?&#x;‘ đ?&#x;Ž, đ?&#x;?đ?&#x;?đ?&#x;•đ?&#x;–

= −đ?&#x;?. đ?&#x;?đ?&#x;•đ?&#x;’đ?&#x;’ Stap 4: Vergelyk die toetsstatistiek met die aanvaardingsarea Aanvaardingsarea: −đ?&#x;?, đ?&#x;—đ?&#x;” < đ?’›-stat < đ?&#x;?, đ?&#x;—đ?&#x;”

Bladsy 138 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

đ?’›-stat = −đ?&#x;?, đ?&#x;?đ?&#x;•đ?&#x;’đ?&#x;’ Die toetsstatistiek val dus binne die aanvaardingsarea: (−đ?&#x;?, đ?&#x;—đ?&#x;” < đ?’›-stat = −đ?&#x;?, đ?&#x;?đ?&#x;•đ?&#x;’đ?&#x;’ < đ?&#x;?, đ?&#x;—đ?&#x;”)

Figuur 3.5: Aanduiding van waar die toetsstatistiek val Stap 5: Maak ʼn gevolgtrekking Omdat die toetsstatistiek binne die aanvaardingsarea val, word die nulhipotese as waarskynlik waar aanvaar. Daar is nie genoeg statistiese bewyse om die nulhipotese op ʼn 5% peil van betekenis te verwerp nie. Ons kan dus die gevolgtrekking maak dat die vervaardiger van die kunsmis se bewering waarskynlik waar is: dat koringlande wat met sy kunsmis behandel is, ʼn gemiddelde 4,5 ton per hektaar sal lewer.

Doen nou Voorbeeld 8.1 en 8.2 in die handboek. 3.7.2

Hipotesetoets vir ʼn populasiegemiddeld đ?? waar die populasie se standaardafwyking đ??ˆ onbekend is

Bestudeer die handboek paragraaf 8.4. Voorbeeld 3.2 ʼn Klimatoloog beweer dat die gemiddelde reÍnval van Suid-Afrika minder as 412mm per jaar is. Om hierdie stelling te toets is die laaste 30 jaar se gemiddelde reÍnval per jaar verkry:

Studie-eenheid 3: Hipotesetoetsing

Bladsy 139


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

471,4 415,4 478,3 539,6 330,4 400,9 278,9 270,4 714,4 637,4 532,5 709,7 456,5 371,5 315,6 531,8 616,0 427,5 306,1 474,2 170,9 468,4 467,3 494,7 458,4 722,6 450,1 565,0 435,7 341,1 Aanvaar dat die gemiddelde reĂŤnval per jaar normaal versprei is. Die steekproef se gemiddeld kan bereken word as đ?’™ = đ?&#x;’đ?&#x;”đ?&#x;?, đ?&#x;•đ?&#x;” met ʼn steekproefstandaardafwyking van đ?’” = đ?&#x;?đ?&#x;‘đ?&#x;’, đ?&#x;’đ?&#x;”đ?&#x;”đ?&#x;—. Doen ʼn hipotesetoets, met ʼn 5% peil van betekenis, om die klimatoloog se bewering op die proef te stel. Oplossing: Stap 1: Definieer die hipoteses đ?‘Żđ?&#x;Ž

: Dat die gemiddelde reĂŤnval van Suid-Afrika minder of gelyk aan 412mm per jaar is. (Die stelling wat ons wil toets.)

đ?‘Żđ?&#x;?

: Dat die gemiddelde reĂŤnval van Suid-Afrika meer as 412mm per jaar is.

Hierdie hipoteses kan ook soos volg uitgedruk word: đ?‘Żđ?&#x;Ž

: đ?? ≤ đ?&#x;’đ?&#x;?đ?&#x;?

đ?‘Żđ?&#x;?

: đ?? > đ?&#x;’đ?&#x;?đ?&#x;?

Stap 2: Bepaal die aanvaardingsarea Ons het die volgende: •

Die populasie se standaardafwyking is vir ons onbekend, dus moet ons van die student-t-verdeling gebruik maak.

•

Die peil van betekenis wat ons moet gebruik, word gegee as đ?œś = đ?&#x;Ž, đ?&#x;Žđ?&#x;“.

•

Dit is ʼn eenkantige hipotesetoets omdat đ?‘Żđ?&#x;Ž : đ?? ≤ đ?&#x;’đ?&#x;?đ?&#x;?. Daar sal ʼn boonste verwerpingsarea wees waar die populasie se gemiddeld meer as 412 is.

Die boonste z-limiete vir hierdie hipotesetoets word uit die t-tabel afgelees vir: đ?’…đ?’‡ = đ?’? − đ?&#x;? = đ?&#x;‘đ?&#x;Ž − đ?&#x;? = đ?&#x;?đ?&#x;— waar đ?’•(đ?&#x;?đ?&#x;—)(đ?&#x;Ž,đ?&#x;Žđ?&#x;“) = đ?&#x;?, đ?&#x;”đ?&#x;—đ?&#x;—

Bladsy 140 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

daarom is die t-limiet vir hierdie toets đ?‘ˇ đ?’• < đ?&#x;?, đ?&#x;”đ?&#x;—đ?&#x;— = đ?&#x;Ž, đ?&#x;—đ?&#x;“ Figuur 3.6 gee die aanvaardings- en verwerpingsareas vir hierdie hipotesetoets.

Figuur 3.6: Aanvaardings- en verwerpingsareas vir ’n eenkantige hipotesetoets vir đ?‘ˇ(đ?’• < đ?&#x;?, đ?&#x;”đ?&#x;—đ?&#x;—) Stap 3: Bereken die toetsstatistiek đ?’•-stat = =

đ?’™mđ?? đ?’” đ?’?

đ?&#x;’đ?&#x;”đ?&#x;?, đ?&#x;•đ?&#x;” − đ?&#x;’đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;‘đ?&#x;’,đ?&#x;’đ?&#x;”đ?&#x;”đ?&#x;–

=

đ?&#x;‘đ?&#x;Ž

đ?&#x;’đ?&#x;—, đ?&#x;•đ?&#x;” đ?&#x;?đ?&#x;‘đ?&#x;’,đ?&#x;’đ?&#x;”đ?&#x;”đ?&#x;– đ?&#x;“,đ?&#x;’đ?&#x;•đ?&#x;•đ?&#x;?

=

đ?&#x;’đ?&#x;—, đ?&#x;•đ?&#x;” đ?&#x;?đ?&#x;’, đ?&#x;“đ?&#x;“đ?&#x;Žđ?&#x;?

= đ?&#x;?, đ?&#x;Žđ?&#x;?đ?&#x;”đ?&#x;— Stap 4: Vergelyk die toetsstatistiek met die aanvaardingsarea Aanvaardingsarea: đ?’•-stat < đ?&#x;?, đ?&#x;”đ?&#x;—đ?&#x;— đ?’•-stat = đ?&#x;?, đ?&#x;Žđ?&#x;?đ?&#x;”đ?&#x;— Die toetsstatistiek val dus binne die aanvaardingsarea: đ?’•-stat = đ?&#x;?, đ?&#x;Žđ?&#x;?đ?&#x;”đ?&#x;— > đ?&#x;?, đ?&#x;”đ?&#x;—đ?&#x;—)

Studie-eenheid 3: Hipotesetoetsing

Bladsy 141


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 3.7: Aanduiding van waar die toetsstatistiek val Stap 5: Maak ʼn gevolgtrekking Omdat die toetsstatistiek buite die aanvaardingsarea val, word die nulhipotese as waarskynlik waar verwerp. Daar is genoeg statistiese bewyse om die nulhipotese op ʼn 5% peil van betekenis te verwerp. Ons kan dus die gevolgtrekking maak dat die klimatoloog se bewering waarskynlik vals is: dat die gemiddelde reÍnval van Suid-Afrika minder as 412mm per jaar is. Doen nou Voorbeeld 8.3 in die handboek. 3.7.3

Hipotesetoetsing deur gebruik te maak van die đ?’‘-waarde

Bestudeer die handboek paragraaf 8.6. Hierdie benadering gebruik dieselfde proses, maar in plaas daarvan dat ʼn kritieke waarde tydens Stap 3 bereken word, word die betrokke đ?‘?-waarde bereken. Die verwerpingsarea, weet ons, is waar die đ?‘?-waarde kleiner is as đ?›ź, soos bespreek in paragraaf 3.5.6 in die gids. Onthou dat die waarskynlikheid van ʼn gebeurtenis voorgestel word deur die oppervlak/area onder die kurwe. In plaas daarvan om ʼn z-waarde of ʼn t-waarde te bereken, bereken ons die waarskynlikheid van hierdie toetsstatistiek en vergelyk dit met die waarde van đ?›ź. As daar van jou verwag word om die waarskynlikheid te vind waar đ?‘§ > 1,29 dan gaan soek jy eenvoudig die waarde in die z-tabel:

Bladsy 142 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Z

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.0

0.0000

0.0040

0.0080

0.0120

0.0160

0.0199

0.0239

0.0279

0.0319

0.0359

0.1

0.0398

0.0438

0.0478

0.0517

0.0557

0.0596

0.0636

0.0675

0.0714

0.0753

0.2

0.0793

0.0832

0.0871

0.0910

0.0948

0.0987

0.1026

0.1064

0.1103

0.1141

0.3

0.1179

0.1217

0.1255

0.1293

0.1331

0.1368

0.1406

0.1443

0.1480

0.1517

0.4

0.1554

0.1591

0.1628

0.1664

0.1700

0.1736

0.1772

0.1808

0.1844

0.1879

0.5

0.1915

0.1950

0.1985

0.2019

0.2054

0.2088

0.2123

0.2157

0.2190

0.2224

0.6

0.2257

0.2291

0.2324

0.2357

0.2389

0.2422

0.2454

0.2486

0.2517

0.2549

0.7

0.2580

0.2611

0.2642

0.2673

0.2704

0.2734

0.2764

0.2794

0.2823

0.2852

0.8

0.2881

0.2910

0.2939

0.2967

0.2995

0.3023

0.3051

0.3078

0.3106

0.3133

0.9

0.3159

0.3186

0.3212

0.3238

0.3264

0.3289

0.3315

0.3340

0.3365

0.3389

1.0

0.3413

0.3438

0.3461

0.3485

0.3508

0.3531

0.3554

0.3577

0.3599

0.3621

1.1

0.3643

0.3665

0.3686

0.3708

0.3729

0.3749

0.3770

0.3790

0.3810

0.3830

1.2

0.3849

0.3869

0.3888

0.3907

0.3925

0.3944

0.3962

0.3980

0.3997

0.4015

1.3

0.4032

0.4049

0.4066

0.4082

0.4099

0.4115

0.4131

0.4147

0.4162

0.4177

1.4

0.4192

0.4207

0.4222

0.4236

0.4251

0.4265

0.4279

0.4292

0.4306

0.4319

1.5

0.4332

0.4345

0.4357

0.4370

0.4382

0.4394

0.4406

0.4418

0.4429

0.4441

Tabel 3.4: Uittreksel uit die z-tabel vir die waarskynlikheid waar đ?’› = đ?&#x;?, đ?&#x;?đ?&#x;— is Onthou dat die tabel die waarskynlikhede gee vir: đ?‘ƒ(0 < đ?‘§ < đ?‘˜) Die vraag vra egter: đ?‘ƒ đ?‘§ > 1,29

= 0,5 − đ?‘ƒ 0 < đ?‘§ < 1,29

= 0,5 − 0.4015 = 0,0985 So die đ?‘?-waarde vir đ?‘§ > 1,29 is 0,0985. As hierdie ʼn hipotesetoets was en ons het dit vergelyk met ’n 10% peil van betekenis, het ons die nulhipotese verwerp omdat die đ?‘?-waarde < 0,10. As ons dit egter met ʼn 5% peil van betekenis gedoen het, sou ons nie die nulhipotese verwerp het nie.

Studie-eenheid 3: Hipotesetoetsing

Bladsy 143


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

MS Excel-formule:

=NORM.S.DIST(đ?’Œ, đ?‘ťđ?‘šđ?‘źđ?‘Ź)

(vir z-waardes)

MS Excel-formule:

=NORM. DIST(đ?’Œ, đ?’…đ?’‡, đ?‘ťđ?‘šđ?‘źđ?‘Ź)

(vir t-waardes)

Formule 3.3: Berekening van die kumulatiewe waarskynlikheid van đ?‘ˇ(−∞ < đ?’ < đ?’›) en đ?‘ˇ(−∞ < đ?‘ť < đ?’•) As ons die formule gebruik, is: đ?‘ƒ đ?‘§ > 1,29 = 1 − NORM.S.DIST(1.29,TRUE) = 0,0985 Hierdie benadering is belangrik omdat baie van die statistiese programmatuur wat vandag op die mark is, die toetsstatistiek en die đ?‘?-waarde bereken, en dit is baie makliker om sommer die đ?‘?-waarde af te lees en ʼn gevolgtrekking te maak as om deur die hele berekening van kritieke waardes te gaan en dan eers ʼn gevolgtrekking te maak. Maar vir die doel van hierdie vak moet jy weet hoe om beide die benaderinge te gebruik met betrekking tot hipotesetoetsing. Voorbeeld 3.3 ʼn Motormaatskappy beweer dat die gesinsmotor wat hulle vervaardig meer as 800km kan ry op 100 liter petrol. Om hierdie stelling te toets is 40 van hierdie motors ewekansig gekies en is die volgende data verkry: 803,2 767,9 789,4 764,1 735,1 805,7 795,2 821,8 785,3 777,7 789,8 753,3 792,5 826,0 692,3 756,0 801,8 776,7 743,6 788,9 738,2 815,8 798,9 769,5 724,3 775,7 775,8 739,2 805,4 801,1 801,2 796,0 767,4 735,7 794,2 830,4 759,0 800,6 776,2 769,9 Aanvaar dat die gemiddelde brandstofverbruik per motor normaal versprei is, met ʼn populasie-standaardafwyking van đ??ˆ = đ?&#x;‘đ?&#x;—. Die steekproef se gemiddeld kan bereken word as đ?’™ = đ?&#x;•đ?&#x;•đ?&#x;–, đ?&#x;“. Doen ʼn hipotesetoets, met ʼn 5% peil van betekenis, om die motormaatskappy se bewering op die proef te stel. Oplossing: Stap 1: Definieer die hipoteses đ?‘Żđ?&#x;Ž

: Dat die gemiddelde brandstofverbruik van hierdie motor meer of gelyk aan 800km per 100 liter petrol is. (Die stelling wat ons wil toets.)

đ?‘Żđ?&#x;?

: Dat die gemiddelde brandstofverbruik van hierdie motor minder as 800km per 100

Bladsy 144 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes liter petrol is. Hierdie hipoteses kan ook soos volg uitgedruk word: đ?‘Żđ?&#x;Ž

: đ?? ≼ đ?&#x;–đ?&#x;Žđ?&#x;Ž

đ?‘Żđ?&#x;?

: đ?? < đ?&#x;–đ?&#x;Žđ?&#x;Ž

Stap 2: Bepaal die aanvaardingsarea Waar die đ?’‘-waarde < đ?œś is en đ?œś = đ?&#x;Ž, đ?&#x;Žđ?&#x;“. Stap 3: Bereken die toetsstatistiek đ?’›-stat = =

đ?’™mđ?? đ??ˆ đ?’?

đ?&#x;•đ?&#x;•đ?&#x;–, đ?&#x;“ − đ?&#x;–đ?&#x;Žđ?&#x;Ž đ?&#x;‘đ?&#x;—

=

đ?&#x;’đ?&#x;Ž

−đ?&#x;?đ?&#x;?, đ?&#x;“ đ?&#x;‘đ?&#x;—

=−

đ?&#x;”,đ?&#x;‘đ?&#x;?đ?&#x;’đ?&#x;”

đ?&#x;?đ?&#x;?, đ?&#x;“ đ?&#x;”, đ?&#x;?đ?&#x;”đ?&#x;”đ?&#x;’

= −đ?&#x;‘, đ?&#x;’đ?&#x;–đ?&#x;‘đ?&#x;’ đ?‘ˇ đ?’› < −đ?&#x;‘, đ?&#x;’đ?&#x;–đ?&#x;‘đ?&#x;’

= đ?&#x;Ž, đ?&#x;“ − đ?&#x;Ž, đ?&#x;’đ?&#x;—đ?&#x;—đ?&#x;•đ?&#x;“ = đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;Žđ?&#x;?đ?&#x;“

Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = NORM.S.DIST(−đ?&#x;‘. đ?&#x;’đ?&#x;–đ?&#x;‘đ?&#x;’, đ?‘ťđ?‘šđ?‘źđ?‘Ź) Stap 4: Vergelyk die toetsstatistiek met die aanvaardingsarea đ?‘ˇ đ?’› < −đ?&#x;‘, đ?&#x;’đ?&#x;–đ?&#x;‘đ?&#x;’ < đ?œś đ?&#x;Ž, đ?&#x;Žđ?&#x;Žđ?&#x;Žđ?&#x;?đ?&#x;“ < đ?&#x;Ž, đ?&#x;Žđ?&#x;“ Stap 5: Maak ʼn gevolgtrekking Omdat die đ?’‘-waarde kleiner as đ?œś is, word die nulhipotese as waarskynlik waar verwerp. Daar is genoeg statistiese bewyse om die nulhipotese op ʼn 5% peil van betekenis te verwerp. Ons kan dus die gevolgtrekking maak dat die motormaatskappy se bewering waarskynlik vals is: dat die gemiddelde brandstofverbruik van hierdie motor meer of gelyk aan 800km per 100 liter petrol is. Doen nou Voorbeeld 8.5 van die handboek. 3.8

Selfevalueringsvrae

Doen Vraag 5-14 aan die einde van Hoofstuk 8 in die handboek.

Studie-eenheid 3: Hipotesetoetsing

Bladsy 145


GQM105 Inleiding tot elementêre kwantitatiewe metodes 3.9

Samevatting

Ons het in hierdie studie-eenheid gekyk na hipotesetoetsing. Hipotesetoetsing is ʼn vyfstapproses waardeur ons gaan om te bepaal of ʼn stelling wat gemaak is, waarskynlik waar of vals is. Die eerste stap is om hierdie stelling, of hipotese, te formuleer. Hierdie stelling bestaan uit twee komplementêre hipoteses: die nulhipotese (die stelling wat ons op die proef stel) en die alternatiewe hipotese (wat die teenoorgestelde van die nulhipotese is). Dit is baie belangrik om hierdie stap reg te doen, want dit het ʼn groot invloed op die gevolgtrekking wat gemaak word in die laaste stap. Die tweede stap is om te bepaal wanneer ons die nulhipotese gaan aanvaar of verwerp. Dit is in hierdie stap waar ons die kriteria definieer wat ons gaan gebruik, of dit nou ʼn interval tussen (of buite) kritieke waardes is of eenvoudig ʼn peil van betekenis. In Stap drie bereken ons die toetsstatistiek vir die steekproef waarmee ons werk. Ons het gekyk na die z-waardes (van die standaard-normaalverdeling), t-waardes (van die student-tverdeling) en p-waardes (wat in hierdie geval die waarskynlikheid van ʼn z-waarde is). Wanneer ons weet wanneer die nulhipotese aanvaar/verwerp word en wat die betrokke toetsstatistiek is, word hierdie twee met mekaar vergelyk in Stap vier. Al wat oorbly, in die vyfde stap, is om ʼn gevolgtrekking te maak oor die vergelyking van die toetsstatistiek met die aanvaardingsarea. Indien die toetsstatistiek in die aanvaardingsarea val, word die nulhipotese aanvaar. Waar die toetsstatistiek buite die aanvaardingsarea val, word die nulhipotese verwerp. Hierdie resultaat word dan gebruik om ʼn gevolgtrekking te maak ten opsigte van die betrokke stelling wat op die proef gestel is. Dit wat in hierdie studie-eenheid behandel is, is werklik ʼn inleiding tot hipotesetoetsing. Daar bestaan baie ander toetse vir ʼn verskeidenheid van populasie-konstantes. Van die ander hipotesetoetse in die handboek bespreek die vergelyking van verskeie populasiegemiddeldes met mekaar. Indien jy belangstel om meer te leer van die onderskeie hipotesetoetse, is jy welkom om ook deur hierdie paragrawe in die handboek te werk. Hipotesetoetsing is werklik ʼn handige stukkie statistiek wat in alle velde gebruik kan word vir kwantitatiewe navorsing.

Bladsy 146 Studie-eenheid 3: Hipotesetoetsing


GQM105 Inleiding tot elementêre kwantitatiewe metodes

STUDIE-EENHEID 4: EENVOUDIGE LINEÊRE REGRESSIE- EN KORRELASIE-ANALISE

4.1

Studie-eenheid leeruitkomste

Kennis en begrip Na voltooiing van Studie-eenheid 4 sal jy in staat wees om jou kennis en begrip van die volgende te demonstreer: •

Eenvoudige lineêre regressie-analise

Tydreeksanalise

Vaardighede Jy sal ook in staat wees om: •

die snyding en helling van lineêre regressieformule te bereken en te interpreteer;

die korrelasiekoëffisiënt te bereken en te interpreteer;

die bepaaldheidskoëffisiënt te bereken en te interpreteer;

ʼn hipotesetoets te doen om te bepaal of ʼn regressiemodel statisties betekenisvol is;

onderskeid te tref tussen tendense, siklusse, seisoenaliteit en onreëlmatige invloede;

ʼn bewegende gemiddeld vir periodes te bereken, dit te analiseer en te interpreteer; en

• 4.2

dit te gebruik om eenvoudige vooruitskattings te maak. Voorgeskrewe handboek

Wegner, T. 2016. Applied business statistics. 4de uitgawe. Claremont: Juta. •

Hoofstuk 12 paragrawe 12.1-12.7

Hoofstuk 15 paragrawe 15.1-15.8

Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise

Bladsy 147


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes 4.3

Hoe kan jy jou begrip verbeter?

Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord

Omskrywing

Additiewe tydreeksmodel

ʼn Model wat uit veranderlikes (en hul interaksie met mekaar) saamgestel word, wat gelyk is aan die som (+) van hul afsonderlike invloede.

Afhanklike veranderlike

ʼn Veranderlike (gewoonlik �) waarvan die waarde bepaal word deur ʼn ander veranderlike (gewoonlik �) se waarde.

BepaaldheidskoĂŤffisiĂŤnt

Die bepaaldheidskoÍffisiÍnt is ʼn maatstaf wat ons gebruik om te bepaal watter proporsie van variasie in die afhanklike veranderlike (�), deur die onafhanklike veranderinge (�), verklaar word.

Bewegende gemiddeld

ʼn Metode wat gebruik word om ʼn tydreeks gladder te maak deur die invloed van sikliese variasie, seisoenale variasie en onreÍlmatige invloede te verwyder.

Gesentraliseerde

Die gladgemaakte waarde van ʼn tydreeks wat geassosieer

bewegende gemiddeld

word met die ooreenstemmende periode.

Helling

Die hoek van ʼn lineĂŞre funksie; word gegee deur die konstante đ?‘?( .

LineĂŞre funksie

Die eenvoudigste en algemeenste statistiese regressiemodel. Dit beskryf die verhouding van die afhanklike veranderlike (đ?‘Ś) met die onafhanklike veranderlike (đ?‘Ľ).

Metode van die kleinste

Die beraming van onbekende konstantes van ʼn model, deur

kwadrate

die som van die kwadrate (van die verskil tussen die waargenome waardes en die verwagte waardes van hierdie model) te minimaliseer.

Multiplikatiewe

ʼn Model wat uit veranderlikes (en hul interaksie met mekaar)

tydreeksmodel

saamgestel word, wat gelyk is aan die produk (Ă—) van hul afsonderlike invloede.

Onafhanklike

ʼn Veranderlike (gewoonlik �) wat gebruik word om ʼn ander

veranderlike

veranderlike se waarde (gewoonlik đ?‘Ś) te bepaal.

Bladsy 148 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

OnreĂŤlmatige variasies

Onverklaarbare variasies in tydreeksdata. OnreĂŤlmatige invloede is enkele ewekansige gebeurtenisse wat heeltemal onvoorspelbaar is, met geen patroon of ritme nie.

Pearson se

Pearson se korrelasiekoĂŤffisiĂŤnt is een van die algemeenste

korrelasiekoĂŤffisiĂŤnt

maatstawwe wat gebruik word om die sterkte van ʼn lineêre verhouding tussen twee kontinue veranderlikes te bepaal.

Seisoenale indeks

Die gemiddelde seisoenale variasie wat waargeneem word in ʼn tydreeks.

Seisoenaliteit/Seisoenale

ʼn Patroon in ʼn tydreeks wat gereeld met konstante intervalle

variasie

voorkom. Hierdie patroon word gewoonlik veroorsaak deur herhaalde omgewingsgebeurtenisse, soos die seisoene van die jaar.

Sikliese variasie

Sikliese variasie is ʼn langtermynpatroon wat rondom die tendens van ʼn tydreeks voorkom, wat onreÍlmatig plaasvind oor lang onvoorspelbare periodes.

Snypunt

Die punt waar die lineĂŞre funksie die Y-as sny waar đ?‘Ľ = 0 is; word gegee deur die konstante đ?‘?8 .

Spreidingstippingsgrafiek

Die eenvoudigste voorstelling van datapunte op ʼn grafiek wat bestaan uit twee veranderlikes. Punte word gestip deur gebruik te maak van die X- en Y-koÜrdinate.

Tendens

Die helling van ʼn tendenslyn.

Tendenslyn

ʼn Lyn wat die bewegende gemiddelde van ʼn tydreeks die beste pas.

Tydreeks

ʼn Reeks waardes wat oor tyd waargeneem is, gewoonlik met gereelde intervalle, van ʼn stogastiese veranderlike.

Vensterperiode

Die reikwydte van die aantal periodes wat gebruik word om ʼn bewegende gemiddeld te bereken. Indien vier periodes gebruik word sal die vensterperiode gelyk aan vier wees.

Vooruitskatting

Die beraming van ʼn toekomswaarde in ʼn tydreeks.

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 149


GQM105 Inleiding tot elementêre kwantitatiewe metodes 4.4

Inleiding

In hierdie studie-eenheid gaan ons kyk na die verhouding van ʼn afhanklike veranderlike (y) teenoor die onafhanklike veranderlike (x). In de sakewêreld is ons geneig om besluite te neem oor ʼn bepaalde saak gebaseer op ʼn verandering in een of ander aanwyser. Ons dink sommer aan ekonomiese verhoudings byvoorbeeld vraag en aanbod. Baie keer wil ons kyk na die verandering van ʼn stogastiese veranderlike oor die loop tyd. In ons soeke om hierdie verhoudings te verstaan gaan ons eenvoudige lineêre regressieanalise (wat korrelasies insluit) as ook tydreeksanalise. 4.5

Eenvoudige lineêre regressie-analise

Bestudeer die handboek paragrawe 12.1-12.2. Wegner (2016: 329) sê dat regressie- en korrelasie-analise twee statistiese metodes is om die verhouding tussen veranderlikes te kwantifiseer. Hierdie twee koëffisiënte dui verder die krag van hierdie verhouding aan. Om hierdie verhoudings te verken gaan ons kyk na spreidingstippings (scatter plots), lineêre regressiemodelle en Pearson se korrelasiekoëffisiënt. 4.5.1

Spreidingstipping

Davis, Pecar en Santana (2016: 394) definieer ʼn spreidingstipping as ʼn tweedimensionele stipping van een veranderlike teenoor ʼn ander (waar elkeen van hierdie veranderlikes op ʼn as van hul eie aangedui word). Elke observasie in die steekproef word verteenwoordig deur ʼn datapunt in die grafiek. Die verhouding tussen twee veranderlikes kan ʼn magdom vorms aanneem, maar vir die doel van hierdie vak gaan ons slegs fokus op veranderlikes wat ʼn lineêre verhouding het. Ten einde ʼn spreidingstippingsgrafiek saam te stel het ons die koördinate (die x- en ywaardes) van elke observasie nodig. Dan gaan bring jy die datapunt op die grafiek aan, waar dit ooreenstem met die koördinate van die observasie. As die datastel groot is, kan hierdie nogal ʼn redelike tydjie neem om te doen en om hierdie rede gebruik ons sommer MS Excel om hierdie grafiek vir ons te skep. Voorbeeld 4.1 ʼn Tweedehandse motorhandelaar wil vasstel watter effek die kilometers op die odometer het op die prys waarteen tweedehandse bakkies verkoop word. Hy trek 21 bakkies wat hy deur die loop van die jaar verkoop het ewekansig en lê die volgende datastel vas:

Bladsy 150 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Kilometers

Prys (R)

1

160 199

70 369

2

143 473

96 717

3

132 891

131 923

4

183 158

46 463

5

141 511

101 773

6

144 612

108 164

7

153 756

98 465

8

149 416

95 815

9

154 985

80 748

10

143 060

101 445

11

127 358

117 657

12

138 971

113 037

13

170 985

48 029

14

123 025

136 994

15

144 298

107 204

16

157 058

79 238

17

138 250

113 604

18

166 446

79 893

19

153 746

102 280

20

159 018

97 211

21

117 083

65 024

Skep ʼn spreidingstippingsgrafiek om aan te dui waar hierdie observasies lê tussen die kilometers en prys.

Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise

Bladsy 151


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Oplossing:

Prys van 'n tweedehandse bakkie 150000 140000 130000

Prys (R)

120000 110000 100000 90000 80000 70000 60000 50000 100000

110000

120000

130000

140000

150000

160000

170000

180000

190000

Kilometers op die odometer

Figuur 4.1: Spreidingstippingsgrafiek van kilometers teenoor die prys van tweedehandse bakkies Uit Figuur 4.1 kan ons die volgende afleidings maak: •

Die verhouding tussen die prys en kilometers van ʼn tweedehandse bakkie blyk lineêr te wees.

•

Dit blyk dat hierdie ʼn negatiewe verhouding is (met ander woorde, waar die kilometers toeneem, neem die prys af).

•

Die datastel het ʼn uitskieter: observasie 21, waar ʼn bakkie met 117 083kms op die odometer verkoop is vir slegs R65 024. (Hierdie uitskieter word uit die datastel verwyder vir die volgende gedeeltes van hierdie voorbeeld.)

Voorbeeld 4.1 wys dat ons spreidingstippingsgrafieke kan gebruik om uitskieters te identifiseer. 4.5.2

LineĂŞre regressiemodelle

ʼn LineĂŞre regressiemodel vind die reguitlyn wat die gegewe data op die heel beste moontlike manier pas en die metode wat ons gebruik om dit te bepaal word die “metode van die kleinste kwadrateâ€? genoem. Dit bereken die waardes van die snypunt, đ?‘?8 , en die helling, đ?‘?( van Formule 4.1.

Bladsy 152 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

đ?’š = đ?’ƒđ?&#x;Ž + đ?’ƒđ?&#x;? đ?’™ Waar:

đ?‘Ľ

= die waardes van die onafhanklike veranderlike

đ?‘Ś

= die beraamde waarde van die afhanklike veranderlike

đ?‘?8

= die snypunt van die Y-as (waar đ?‘Ľ = 0)

đ?‘?(

= die helling van die regressielyn Formule 4.1: Die lineĂŞre regressiefunksie

Om die helling en snypunt te bereken kan ons Formule 4.2 en 4.3 onderskeidelik gebruik.

đ?’ƒđ?&#x;? = Waar:

đ?’?

đ?’™đ?’Š đ?’šđ?’Š − đ?’?

đ?’™đ?&#x;?đ?’Š

−

�� ��

đ?’šđ?’Š đ?&#x;?

đ?‘›

= steekproefgrootte

đ?‘ĽO đ?‘ŚO

= die vermenigvuldiging van die x- en y-waarde van die đ?‘– ste observasie

đ?‘ĽO

= die x-waarde van die đ?‘– ste observasie

đ?‘ŚO

= die y-waarde van die đ?‘– ste observasie

đ?‘?(

= die helling van die regressielyn Formule 4.2: Berekening van die helling, đ?’ƒđ?&#x;?

đ?’ƒđ?&#x;Ž = Waar:

đ?’šđ?’Š − đ?’ƒđ?&#x;? đ?’?

��

đ?‘›

= steekproefgrootte

đ?‘?(

= die helling van die regressielyn

đ?‘ĽO

= die x-waarde van die đ?‘– ste observasie

đ?‘ŚO

= die y-waarde van die đ?‘– ste observasie

đ?‘?8

= die snypunt van die regressielyn Formule 4.3: Berekening van die snypunt, đ?’ƒđ?&#x;Ž Voorbeeld 4.1 (vervolg)

Bereken die helling en die snypunt vir die lineêre regressiemodel wat gebruik kan word om die prys van ʼn tweedehandse bakkie te beraam. Oplossing: Bereken

�� ,

đ?’šđ?’Š ,

đ?’™đ?&#x;?đ?’Š en

�� �� :

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 153


GQM105 Inleiding tot elementêre kwantitatiewe metodes

𝒊

𝒙

𝒙𝟐

𝒚

𝒙𝒚

1

160 199

70 369

25 663 719 601

11 273 043 431

2

143 473

96 717

20 584 501 729

13 876 278 141

3

132 891

131 923

17 660 017 881

17 531 379 393

4

183 158

46 463

33 546 852 964

8 510 070 154

5

141 511

101 773

20 025 363 121

14 401 999 003

6

144 612

108 164

20 912 630 544

15 641 812 368

7

153 756

98 465

23 640 907 536

15 139 584 540

8

149 416

95 815

22 325 141 056

14 316 294 040

9

154 985

80 748

24 020 350 225

12 514 728 780

10

143 060

101 445

20 466 163 600

14 512 721 700

11

127 358

117 657

16 220 060 164

14 984 560 206

12

138 971

113 037

19 312 938 841

15 708 864 927

13

170 985

48 029

29 235 870 225

8 212 238 565

14

123 025

136 994

15 135 150 625

16 853 686 850

15

144 298

107 204

20 821 912 804

15 469 322 792

16

157 058

79 238

24 667 215 364

12 444 961 804

17

138 250

113 604

19 113 062 500

15 705 753 000

18

166 446

79 893

27 704 270 916

13 297 870 278

19

153 746

102 280

23 637 832 516

15 725 140 880

20

159 018

97 211

25 286 724 324

15 458 298 798

2 986 216

1 927 029

449 980 686 536

281 578 609 650

TOTALE

Tabel 4.1: Bereken

𝒙𝒊 ,

𝒚𝒊 ,

𝒙𝟐𝒊 en

𝒙𝒊 𝒚𝒊

Nou kan ons hierdie waardes gebruik om die helling en snyding te bereken: 𝒃𝟏

=

𝒏

𝒙𝒊 𝒚𝒊 m 𝒙𝒊 𝒏

𝒙𝟐𝒊 m

𝒚𝒊 𝒙𝒊 𝟐

=

𝟐𝟎 𝟐𝟖𝟏 𝟓𝟕𝟖 𝟔𝟎𝟗 𝟔𝟓𝟎 − 𝟐 𝟗𝟖𝟔 𝟐𝟏𝟔 𝟏 𝟗𝟐𝟕 𝟎𝟐𝟗 𝟐𝟎 𝟒𝟒𝟗 𝟗𝟖𝟎 𝟔𝟖𝟔 𝟓𝟑𝟔 − 𝟐 𝟗𝟖𝟔 𝟐𝟏𝟔 𝟐

=

𝟓 𝟔𝟑𝟏 𝟓𝟕𝟐 𝟏𝟗𝟑 𝟎𝟎𝟎 − 𝟓 𝟕𝟓𝟒 𝟓𝟐𝟒 𝟖𝟑𝟐 𝟐𝟔𝟒 −𝟏𝟐𝟐 𝟗𝟓𝟐 𝟔𝟑𝟗 𝟐𝟔𝟒 = 𝟖 𝟗𝟗𝟗 𝟔𝟏𝟑 𝟕𝟑𝟎 𝟕𝟐𝟎 − 𝟖 𝟗𝟏𝟕 𝟒𝟖𝟓 𝟗𝟗𝟖 𝟔𝟓𝟔 𝟖𝟐 𝟏𝟐𝟕 𝟕𝟑𝟐 𝟎𝟔𝟒

= −𝟏, 𝟓 En

Bladsy 154 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

đ?’ƒđ?&#x;Ž

=

đ?’šđ?’Š mđ?’ƒđ?&#x;? đ?’?

��

đ?&#x;? đ?&#x;—đ?&#x;?đ?&#x;• đ?&#x;Žđ?&#x;?đ?&#x;— − −đ?&#x;?, đ?&#x;“ đ?&#x;? đ?&#x;–đ?&#x;—đ?&#x;” đ?&#x;?đ?&#x;?đ?&#x;” đ?&#x;? đ?&#x;—đ?&#x;?đ?&#x;• đ?&#x;Žđ?&#x;?đ?&#x;— + đ?&#x;? đ?&#x;–đ?&#x;–đ?&#x;’ đ?&#x;—đ?&#x;‘đ?&#x;”, đ?&#x;”đ?&#x;? = đ?&#x;?đ?&#x;Ž đ?&#x;?đ?&#x;Ž đ?&#x;” đ?&#x;‘đ?&#x;—đ?&#x;• đ?&#x;”đ?&#x;”đ?&#x;’, đ?&#x;‘đ?&#x;? = đ?&#x;?đ?&#x;Ž =

= đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? Om dieselfde waardes in MS Excel te kry, kan ons die dataverwerkingsmodule (data analysis toolkit) se Regression-funksie gebruik. Baie belangrik: indien jy nie die dataverwerkingsmodule sien in MS Excel nie, moet jy dit gaan byvoeg. (Sien die instruksies in die eerste studie-eenheid.)

Figuur 4.2: MS Excel se dataverwerkingsmodule (data analysis toolkit)

Figuur 4.3: MS Excel se dataverwerkingsmodule se grafiese koppelvlak vir regressieanalise Sit jou Y-waardes in die eerste blokke en die X-waardes in die tweede blokkie. Baie belangrik: as jy die opskrifte ook ingesluit het by jou datastel, moet jy die Labels-blokkie

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 155


GQM105 Inleiding tot elementêre kwantitatiewe metodes merk, anders gaan die berekeninge verkeerd gedoen word. In hierdie geval het ek gekies om die resultate uit te voer na ʼn nuwe sigblad. Die volgende uitvoer is verkry (let daarop dat hierdie slegs ʼn uittreksel is en dat MS Excel baie meer uitvoer lewer):

Figuur 4.4: ’n Uittreksel van MS Excel se regressie-uitvoer van die dataverwerkingsmodule vir Voorbeeld 4.1 Die Intercept is ons snypunt, đ?’ƒđ?&#x;Ž en x is ons helling, đ?’ƒđ?&#x;? . Jy mag dalk op hierdie stadium oplet dat die helling wat ons met die hand bereken het en die helling wat MS Excel gee, van mekaar verskil. Die rede hiervoor is dat ons ʼn afrondingsfout gemaak het gedurende ons berekeninge. Die twee waardes is egter naby genoeg aan mekaar dat ons -1,5 kan gebruik vir verdere berekeninge. As ons nou hierdie waardes in Formule 4.1 vervang, kry ons die volgende lineĂŞre regressiemodel vir tweedehandse bakkies: đ?’š = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?, đ?&#x;“đ?’™ Op die ou einde van die dag wil ons regressiemodelle gebruik om die waarde van ons afhanklike te beraam, gegee ʼn bepaalde waarde van die onafhanklike veranderlike. Wegner (2016: 335) waarsku ons egter om versigtig te werk wanneer ons waardes ekstrapoleer (beraam), wat buite die steekproefruimte val. Die rede hiervoor is dat ons nie weet wat die aard van die veranderlikes se verhouding, buite hierdie grense, is nie en daar is altyd die kans dat dit nie dieselfde is nie. Dus sal enige beraminge wat ons maak, nie reg wees nie. Voorbeeld 4.1 (vervolg) Beraam die prys van ʼn tweedehandse bakkie, met die volgende odometerlesings: a) 120 000km b) 145 000km c) 180 000km Oplossing: a) đ?’š = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?, đ?&#x;“đ?’™

Bladsy 156 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?, đ?&#x;“ đ?&#x;?đ?&#x;?đ?&#x;Ž đ?&#x;Žđ?&#x;Žđ?&#x;Ž = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?đ?&#x;•đ?&#x;— đ?&#x;”đ?&#x;“đ?&#x;Ž, đ?&#x;–đ?&#x;“ = đ?&#x;?đ?&#x;’đ?&#x;Ž đ?&#x;?đ?&#x;‘đ?&#x;?, đ?&#x;‘đ?&#x;• Dus word die prys van ʼn tweedehandse bakkie, met 120 000km op die odometer, beraam teen R140 232,37. b) đ?’š = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?, đ?&#x;“đ?’™ = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?, đ?&#x;“ đ?&#x;?đ?&#x;’đ?&#x;“ đ?&#x;Žđ?&#x;Žđ?&#x;Ž = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?đ?&#x;?đ?&#x;• đ?&#x;Žđ?&#x;•đ?&#x;–, đ?&#x;?đ?&#x;? = đ?&#x;?đ?&#x;Žđ?&#x;? đ?&#x;–đ?&#x;Žđ?&#x;“, đ?&#x;?đ?&#x;? Dus word die prys van ʼn tweedehandse bakkie, met 145 000km op die odometer, beraam teen R102 805,11. c) đ?’š = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?, đ?&#x;“đ?’™ = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?, đ?&#x;“ đ?&#x;?đ?&#x;–đ?&#x;Ž đ?&#x;Žđ?&#x;Žđ?&#x;Ž = đ?&#x;‘đ?&#x;?đ?&#x;— đ?&#x;–đ?&#x;–đ?&#x;‘, đ?&#x;?đ?&#x;? − đ?&#x;?đ?&#x;”đ?&#x;— đ?&#x;’đ?&#x;•đ?&#x;”, đ?&#x;?đ?&#x;• = đ?&#x;“đ?&#x;Ž đ?&#x;’đ?&#x;Žđ?&#x;”, đ?&#x;—đ?&#x;’ Dus word die prys van ʼn tweedehandse bakkie, met 180 000km op die odometer, beraam teen R50 406,94.

Doen nou Voorbeeld 12.1 in die handboek. 4.5.3

Pearson se korrelasiekoĂŤffisiĂŤnt

Bestudeer die handboek paragraaf 12.3. Pearson se korrelasiekoÍffisiÍnt is een van die algemeenste maatstawwe wat gebruik word om die sterkte van ʼn lineêre verhouding tussen twee kontinue veranderlikes te bepaal (Davis, Pecar & Santana, 2016: 401).

đ?’?

đ?’“= đ?’? Waar:

đ?’™đ?&#x;?đ?’Š −

đ?’™đ?’Š đ?’šđ?’Š − đ?’™đ?’Š

đ?&#x;?

��

Ă—đ?’?

đ?‘&#x;

= Pearson se korrelasiekoĂŤffisiĂŤnt

đ?‘›

= steekproefgrootte

đ?’šđ?’Š đ?’šđ?&#x;?đ?’Š −

đ?’šđ?’Š

đ?&#x;?

đ?‘ĽO đ?‘ŚO = die vermenigvuldiging van die x- en y-waarde van die đ?‘– ste observasie đ?‘ĽO

= die x-waarde van die đ?‘– ste observasie

đ?‘ŚO

= die y-waarde van die đ?‘– ste observasie

MS Excel-formule:

=CORREL(x-waardes, y-waardes)

Formule 4.4: Berekening van Pearson se korrelasiekoĂŤffisiĂŤnt

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 157


GQM105 Inleiding tot elementêre kwantitatiewe metodes Korrelasies het die volgende eienskappe: •

Korrelasies is altyd tussen -1 en 1 (−1 ≤ đ?‘&#x; ≤ 1).

•

As đ?‘&#x; ≼ 0 beteken dit dat daar ʼn positiewe verhouding tussen die twee veranderlikes is.

•

As đ?‘&#x; ≤ 0 beteken dit dat daar ʼn negatiewe verhouding tussen die twee veranderlikes is.

•

As −1 ≤ đ?‘&#x; ≤ −0,5 of 0,5 ≤ đ?‘&#x; ≤ 1 is dit ʼn aanduiding van ʼn sterk lineĂŞre verhouding tussen die twee veranderlikes.

•

As −0,5 ≤ đ?‘&#x; ≤ −0,3 of 0,3 ≤ đ?‘&#x; ≤ 0,5 is dit ʼn aanduiding van ʼn matige lineĂŞre verhouding tussen die twee veranderlikes.

•

As −0,3 ≤ đ?‘&#x; ≤ 0,3 is dit ʼn aanduiding van ʼn swak lineĂŞre verhouding tussen die twee veranderlikes.

•

Die korrelasie word geensins beĂŻnvloed deur die eenhede waarin die veranderlikes gemeet word nie. Om die eenheid te verander van een of beide die veranderlikes behoort geen invloed te hĂŞ op die waarde đ?‘&#x; nie.

Die handboek gee gedetailleerde illustrasies van hoe ʼn spreidingstippingsgrafiek sal lyk in ieder geval. Wegner (2016: 339) en Davis, Pecar en Santana (2016: 405) waarsku ons: •

ʼn Lae korrelasie nie beteken dat daar nie ʼn verhouding is tussen die twee veranderlikes nie. ʼn Lae korrelasie beteken net dat daar ʼn swak verhouding bestaan. Dit mag ook wees dat die verhouding tussen die twee veranderlikes nie lineêr is nie.

•

ʼn Korrelasie bewys nie dat daar ʼn oorsaak-en-gevolg-verhouding tussen die twee veranderlikes bestaan nie. ʼn Sterk korrelasie kan egter ʼn goeie aanduiding wees dat daar moontlik so ʼn verhouding is.

As ons kyk na die voorbeeld wat Davis, Pecar en Santana (2016: 405) gee, is dit duidelik hoe maklik ons tot die verkeerde gevolgtrekking kan kom: ʼn Steekproef is gedoen waar 50 dorpies ewekansig gekies is. Tydens hierdie steekproef is daar gevind dat die verhouding tussen die aantal kinders wat gebore is (y) en die alkohol-verkope (x) vir hierdie 50 dorpies đ?‘&#x; = 0,97 is (ʼn baie sterk positiewe verhouding). Dit lei die navorsers om verkeerdelik tot die gevolg te kom dat alkohol ʼn direkte oorsaak was dat meer kinders gebore is.

Bladsy 158 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Dit kom egter aan die lig dat daar ʼn derde veranderlike was wat ʼn rol gespeel het in hierdie verhouding, naamlik die aantal mense wat in die dorpie woon. Hierdie veranderlike veroorsaak beide dat daar meer kinders gebore word en dat die alkoholverkope styg. Dus het hierdie indirekte korrelasie veroorsaak dat die navorsers ʼn verkeerde gevolgtrekking gemaak het: dat alkohol die oorsaak was dat meer kinders gebore word. Ons moet dus baie versigtig wees met die interpretasie van die korrelasie en die gevolgtrekkings wat ons maak. Voorbeeld 4.1 (vervolg) Bereken wat die korrelasie, đ?’“, tussen die odometerlesing en die prys van ʼn tweedehandse bakkie is. Oplossing: Die volgende is gegee of reeds bereken: đ?’?

= 20 �� �� = 281 578 609 650 ��

= 2 986 216

đ?’šđ?’Š

= 1 927 029

đ?’™đ?&#x;?đ?’Š

= 449 980 686 536

đ?’šđ?&#x;?đ?’Š

= 196 278 824 293

(word op dieselfde wyse as

đ?’™đ?&#x;?đ?’Š bereken)

Dan kan ons nou die korrelasie bereken: đ?’“

đ?’?

= đ?’?

= = = =−

�� �� m ��

đ?’™đ?&#x;?đ?’Š m

��

đ?&#x;?

Ă—đ?’?

đ?’šđ?’Š đ?’šđ?&#x;?đ?’Š m

đ?’šđ?’Š đ?&#x;?

đ?&#x;?đ?&#x;Ž đ?&#x;?đ?&#x;–đ?&#x;? đ?&#x;“đ?&#x;•đ?&#x;– đ?&#x;”đ?&#x;Žđ?&#x;— đ?&#x;”đ?&#x;“đ?&#x;Ž m đ?&#x;? đ?&#x;—đ?&#x;–đ?&#x;” đ?&#x;?đ?&#x;?đ?&#x;” đ?&#x;? đ?&#x;—đ?&#x;?đ?&#x;• đ?&#x;Žđ?&#x;?đ?&#x;— đ?&#x;?đ?&#x;Ž đ?&#x;’đ?&#x;’đ?&#x;— đ?&#x;—đ?&#x;–đ?&#x;Ž đ?&#x;”đ?&#x;–đ?&#x;” đ?&#x;“đ?&#x;‘đ?&#x;” m đ?&#x;? đ?&#x;—đ?&#x;–đ?&#x;” đ?&#x;?đ?&#x;?đ?&#x;” đ?&#x;? Ă— đ?&#x;?đ?&#x;Ž đ?&#x;?đ?&#x;—đ?&#x;” đ?&#x;?đ?&#x;•đ?&#x;– đ?&#x;–đ?&#x;?đ?&#x;’ đ?&#x;?đ?&#x;—đ?&#x;‘ m đ?&#x;? đ?&#x;—đ?&#x;?đ?&#x;• đ?&#x;Žđ?&#x;?đ?&#x;— đ?&#x;? đ?&#x;“ đ?&#x;”đ?&#x;‘đ?&#x;? đ?&#x;“đ?&#x;•đ?&#x;? đ?&#x;?đ?&#x;—đ?&#x;‘ đ?&#x;Žđ?&#x;Žđ?&#x;Žmđ?&#x;“ đ?&#x;•đ?&#x;“đ?&#x;’ đ?&#x;“đ?&#x;?đ?&#x;’ đ?&#x;–đ?&#x;‘đ?&#x;? đ?&#x;?đ?&#x;”đ?&#x;’ đ?&#x;– đ?&#x;—đ?&#x;—đ?&#x;— đ?&#x;”đ?&#x;?đ?&#x;‘ đ?&#x;•đ?&#x;‘đ?&#x;Ž đ?&#x;•đ?&#x;?đ?&#x;Žmđ?&#x;– đ?&#x;—đ?&#x;?đ?&#x;• đ?&#x;’đ?&#x;–đ?&#x;“ đ?&#x;—đ?&#x;—đ?&#x;– đ?&#x;”đ?&#x;“đ?&#x;” Ă— đ?&#x;‘ đ?&#x;—đ?&#x;?đ?&#x;“ đ?&#x;“đ?&#x;•đ?&#x;” đ?&#x;’đ?&#x;–đ?&#x;“ đ?&#x;–đ?&#x;”đ?&#x;Žmđ?&#x;‘ đ?&#x;•đ?&#x;?đ?&#x;‘ đ?&#x;’đ?&#x;’đ?&#x;Ž đ?&#x;•đ?&#x;”đ?&#x;” đ?&#x;–đ?&#x;’đ?&#x;? mđ?&#x;?đ?&#x;?đ?&#x;? đ?&#x;—đ?&#x;“đ?&#x;? đ?&#x;”đ?&#x;‘đ?&#x;— đ?&#x;?đ?&#x;”đ?&#x;’ đ?&#x;–đ?&#x;? đ?&#x;?đ?&#x;?đ?&#x;• đ?&#x;•đ?&#x;‘đ?&#x;? đ?&#x;Žđ?&#x;”đ?&#x;’ Ă— đ?&#x;?đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;‘đ?&#x;“ đ?&#x;•đ?&#x;?đ?&#x;— đ?&#x;Žđ?&#x;?đ?&#x;— đ?&#x;?đ?&#x;?đ?&#x;? đ?&#x;—đ?&#x;“đ?&#x;? đ?&#x;”đ?&#x;‘đ?&#x;— đ?&#x;?đ?&#x;”đ?&#x;’ đ?&#x;?đ?&#x;‘đ?&#x;? đ?&#x;—đ?&#x;—đ?&#x;‘ đ?&#x;?đ?&#x;•đ?&#x;– đ?&#x;?đ?&#x;?đ?&#x;?

=−

đ?&#x;?đ?&#x;?đ?&#x;? đ?&#x;—đ?&#x;“đ?&#x;? đ?&#x;”đ?&#x;‘đ?&#x;— đ?&#x;?đ?&#x;”đ?&#x;’ đ?&#x;?đ?&#x;• đ?&#x;’đ?&#x;?đ?&#x;? đ?&#x;?đ?&#x;?đ?&#x;“ đ?&#x;’đ?&#x;—đ?&#x;? đ?&#x;•đ?&#x;—đ?&#x;” đ?&#x;’đ?&#x;Žđ?&#x;Ž đ?&#x;Žđ?&#x;Žđ?&#x;Ž đ?&#x;Žđ?&#x;Žđ?&#x;Ž

= −đ?&#x;Ž, đ?&#x;—đ?&#x;‘đ?&#x;?đ?&#x;“

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 159


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Om dieselfde waarde in MS Excel te bereken sal soos volg lyk: = CORREL(A1:A20, B1:B20) waar die x-waardes in kolom A, ry 1-20 is en die y-waardes in kolom B, ry 1-20 kruis. Hierdie resultaat kan soos volg geïnterpreteer word: daar bestaan ʼn sterk negatiewe verhouding tussen die odometerlesing en die prys van ʼn tweedehandse bakkie; met ander woorde hoe meer kilometers ʼn bakkie op die odometer het, hoe laer is die prys van hierdie bakkie. Doen nou Voorbeeld 12.2 in die handboek. 4.5.4

BepaaldheidskoĂŤffisiĂŤnt

Bestudeer die handboek paragraaf 12.4. Die bepaaldheidskoÍffisiÍnt is ʼn maatstaf wat ons gebruik om te bepaal watter proporsie van variasie in die afhanklike veranderlike y, deur die onafhanklike veranderinge verklaar word. Dus sê hierdie maatstaf vir ons hoe goed ons lineêre regressiemodel is. Die bepaaldheidskoÍffisiÍnt se waarde is altyd tussen 0 en 1, oftewel 0% en 100%. Hoe groter die bepaaldheidskoÍffisiÍnt, hoe beter.

đ?’“đ?&#x;? = đ?’“Ă—đ?’“ Waar:

đ?‘&#x;

= korrelasie tussen die twee veranderlikes Formule 4.5: Berekening van die bepaaldheidskoĂŤffisiĂŤnt Voorbeeld 4.1 (vervolg)

Bereken die bepaaldheidskoĂŤffisiĂŤnt, đ?’“đ?&#x;? , vir die lineĂŞre regressiemodel wat die odometerlesing en die prys van ʼn tweedehandse bakkie voorstel. Oplossing: đ?’“ = −đ?&#x;Ž, đ?&#x;—đ?&#x;‘đ?&#x;?đ?&#x;“ dus is: đ?’“đ?&#x;? = −đ?&#x;Ž, đ?&#x;—đ?&#x;‘đ?&#x;?đ?&#x;“ đ?&#x;? = đ?&#x;Ž, đ?&#x;–đ?&#x;”đ?&#x;•đ?&#x;• Dit beteken dat die aantal kilometers op die odometer van ʼn tweedehandse bakkie, x, 86,77% van die variasie in die prys van ʼn tweedehandse bakkie, y, verduidelik. Dus het die aantal kilometers ʼn groot invloed op die prys van ʼn tweedehandse bakkie.

Bladsy 160 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Doen nou Voorbeeld 12.3 in die handboek. 4.5.5

Toets om die betekenisvolheid van die regressiemodel te bepaal

Bestudeer die handboek paragraaf 12.5. As ons die korrelasie wil gebruik, moet ons bepaal of daar ʼn werklike verhouding tussen die twee veranderlikes bestaan en of die korrelasie blote toeval is. In Studie-eenheid 3 het ons gekyk na ʼn metode om stellings te toets soos “daar bestaan ʼn betekenisvolle verhouding tussen die twee veranderlikes x en yâ€?. Hierdie metode is natuurlik ʼn hipotesetoets. Omdat ons nou kyk na die verhouding tussen die veranderlikes x en y (en nie meer die populasie se gemiddeld đ?œ‡ nie), gebruik ons ʼn ander toetsstatistiek.

đ?’•-stat = đ?’“ Waar:

đ?’?−đ?&#x;? đ?&#x;? − đ?’“đ?&#x;?

đ?‘&#x;

= die korrelasie tussen die veranderlikes x en y

đ?‘&#x;*

= die bepaaldheidskoĂŤffisiĂŤnt vir die veranderlikes x en y

đ?‘›

= steekproefgrootte

Die grade van vryheid vir hierdie toetsstatistiek is: đ?‘‘đ?‘“ = đ?‘› − 1 Formule 4.6: Berekening van die đ?’•-stat toetsstatistiek vir die toets vir betekenisvolheid van ʼn regressiemodel Voorbeeld 4.1 (vervolg) Bepaal of die verhouding đ??† (die Griekse simbool rho wat die korrelasiekoĂŤffisiĂŤnt verteenwoordig), tussen die aantal kilometers op die odometer x en die prys van ʼn tweedehandse bakkie y betekenisvol is op ʼn 5% peil van betekenis. Oplossing: Let daarop dat die stappe wat gevolg word, presies dieselfde is as in Studie-eenheid 3. Stap 1: Definieer die hipoteses đ?‘Żđ?&#x;Ž : đ??† = đ?&#x;Ž (dat die verhouding tussen die odometerlesing en die prys van ʼn tweedehandse bakkie nie betekenisvol is nie) đ?‘Żđ?&#x;? : đ??† ≠đ?&#x;Ž (dat die verhouding tussen die odometerlesing en die prys van ʼn tweedehandse bakkie betekenisvol is)

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 161


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Uit die staanspoor kan ons sien dat hierdie ʼn tweekantige toets gaan wees (omdat ons kyk of đ??† = đ?&#x;Ž) Hoe nader đ?’“ aan 0 is, hoe groter is die kans dat die nulhipotese aanvaar gaan word. Stap 2: Bepaal die aanvaardingsarea Hierdie toets is gebaseer op die student-t-verdeling (met ʼn t-toetsstatistiek) met die volgende gegewens: đ?œś

= đ?&#x;Ž, đ?&#x;Žđ?&#x;“

đ?’…đ?’‡ = đ?’? − đ?&#x;? = đ?&#x;?đ?&#x;Ž − đ?&#x;? = đ?&#x;?đ?&#x;– Nou gaan lees ons die betrokke kritieke waarde uit die t-tabel af: df

�

0.1000

0.0500

0.0250

0.0100

0.0050

0.0025

1

3.078

6.314

12.706

31.821

63.657

127.321

2

1.886

2.920

4.303

6.965

9.925

14.089

3

1.638

2.353

3.182

4.541

5.841

7.453

4

1.533

2.132

2.776

3.747

4.604

5.598

5

1.476

2.015

2.571

3.365

4.032

4.773

6

1.440

1.943

2.447

3.143

3.707

4.317

7

1.415

1.895

2.365

2.998

3.499

4.029

8

1.397

1.860

2.306

2.896

3.355

3.833

9

1.383

1.833

2.262

2.821

3.250

3.690

10

1.372

1.812

2.228

2.764

3.169

3.581

11

1.363

1.796

2.201

2.718

3.106

3.497

12

1.356

1.782

2.179

2.681

3.055

3.428

13

1.350

1.771

2.160

2.650

3.012

3.372

14

1.345

1.761

2.145

2.624

2.977

3.326

15

1.341

1.753

2.131

2.602

2.947

3.286

16

1.337

1.746

2.120

2.583

2.921

3.252

17

1.333

1.740

2.110

2.567

2.898

3.222

18

1.330

1.734

2.101

2.552

2.878

3.197

19

1.328

1.729

2.093

2.539

2.861

3.174

20

1.325

1.725

2.086

2.528

2.845

3.153

Tabel 4.2: Uittreksel uit die t-tabel vir die limiete waar đ?’•(đ?&#x;?đ?&#x;–)(đ?&#x;Ž,đ?&#x;Žđ?&#x;“

đ?&#x;?)

is

Dus sal ons die nulhipotese verwerp as: đ?’•-stat < −đ?&#x;?, đ?&#x;?đ?&#x;Žđ?&#x;? of đ?’•-stat < đ?&#x;?, đ?&#x;?đ?&#x;Žđ?&#x;?

Bladsy 162 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 4.5: Aanvaardingsarea vir hierdie hipotesetoets Sou ons die đ?’‘-waarde gebruik het vir hierdie toets, sou ons die nulhipotese verwerp sodra die đ?’‘-waarde < đ?œś. Stap 3: Bereken die toetsstatistiek đ?’•-stat = đ?’“

đ?’?mđ?&#x;? đ?&#x;?mđ?’“đ?&#x;?

= −đ?&#x;Ž, đ?&#x;—đ?&#x;‘đ?&#x;?đ?&#x;“

đ?&#x;?đ?&#x;Ž − đ?&#x;? đ?&#x;?đ?&#x;– = −đ?&#x;Ž, đ?&#x;—đ?&#x;‘đ?&#x;?đ?&#x;“ đ?&#x;? − đ?&#x;Ž, đ?&#x;–đ?&#x;”đ?&#x;•đ?&#x;• đ?&#x;Ž, đ?&#x;?đ?&#x;‘đ?&#x;?đ?&#x;‘

= −đ?&#x;Ž, đ?&#x;—đ?&#x;‘đ?&#x;?đ?&#x;“ đ?&#x;?đ?&#x;‘đ?&#x;”, đ?&#x;Žđ?&#x;“đ?&#x;—đ?&#x;“ = −đ?&#x;Ž, đ?&#x;—đ?&#x;‘đ?&#x;?đ?&#x;“ đ?&#x;?đ?&#x;?, đ?&#x;”đ?&#x;”đ?&#x;’đ?&#x;“ = −đ?&#x;?đ?&#x;Ž, đ?&#x;–đ?&#x;”đ?&#x;“đ?&#x;“ As ons kyk na die MS Excel-uitvoer wat ons vroeĂŤr gegenereer het:

Figuur 4.6: ʼn Uittreksel van MS Excel se regressie-uitvoer van die dataverwerkingsmodule vir Voorbeeld 4.1 Ons kan sien dat die đ?’•-stat se waarde -10,8655 (afgerond) is, met ʼn đ?’‘-waarde = đ?&#x;Ž. Stap 4: Vergelyk die toetsstatistiek met die aanvaardingsarea Aanvaardingsarea: đ?’•-stat < −đ?&#x;?, đ?&#x;?đ?&#x;Žđ?&#x;? of đ?’•-stat < đ?&#x;?, đ?&#x;?đ?&#x;Žđ?&#x;? đ?’•-stat = −đ?&#x;?đ?&#x;Ž, đ?&#x;–đ?&#x;”đ?&#x;“đ?&#x;“

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 163


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Die toetsstatistiek val dus binne die aanvaardingsarea: đ?’•-stat = −đ?&#x;?đ?&#x;Ž, đ?&#x;–đ?&#x;”đ?&#x;“đ?&#x;“ < đ?&#x;?, đ?&#x;?đ?&#x;Žđ?&#x;?) Die toetsstatistiek is sĂł klein dat dit nie eers sinvol is om dit op ʼn grafiek voor te stel nie. Die đ?’‘-waarde = đ?&#x;Ž is kleiner as 0,05. Stap 5: Maak ʼn gevolgtrekking Omdat die toetsstatistiek buite die aanvaardingsarea val, word die nulhipotese as waarskynlik waar verwerp. Daar is genoeg statistiese bewyse om die nulhipotese op ʼn 5% peil van betekenis te verwerp. Dus is die verhouding đ??† tussen die aantal kilometers op die odometer x en die prys van ʼn tweedehandse bakkie y statisties betekenisvol is op ʼn 5% peil van betekenis. Doen nou Voorbeeld 12.4 in die handboek. Bestudeer ook paragrawe 12.6 en 12.7 in die handboek. Maak seker dat jy die dataverwerking in MS Excel kan doen. 4.5.6

Selfevalueringsvrae

Jy kan al die vrae aan die einde van Hoofstuk 12 in die handboek doen. Bereken dit met die hand en verifieer dit met MS Excel. Gebruik beide die aanvaardingsarea- en die đ?‘?-waardemetode (jy moet gemaklik met beide wees). 4.6

Tydreeksanalise

Bestudeer die handboek paragraaf 15.1. Ons gaan nou bietjie kyk na tydreekse. Hierdie is ʼn spesiale geval waar die verhouding tussen ʼn afhanklike veranderlike (y) en die onafhanklike veranderlike tyd (x) is. Tot op hede het ons gekyk na steekproewe wat op ʼn bepaalde punt in tyd gedoen is; nou gaan ons werk met data wat oor ʼn periode van tyd versamel is. Davis, Pecar en Santana (2016: 449) definieer ʼn tydreeks as ʼn veranderlike wat gemeet en voorgestel word vir bepaalde eenhede van tyd. Hierdie eenhede kan onderskeidelik ure, dae, weke, maande, ensovoorts wees. Tydreeksanalise is vir ons belangrik, want dit laat ons toe om vooruitskattings te maak vir die toekoms en dit help ons om te verstaan hoe die veranderlike oor tyd gaan reageer. Om hierdie dinge te weet help ons om met meer sekerheid te beplan vir die toekoms. Dit is veral nuttig in die volgende gevalle waar:

Bladsy 164 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

Eskom die elektrisiteit wat hulle moet voorsien, moet beplan vir die volgende kwartaal;

die munisipaliteit moet bepaal hoeveel water ʼn bepaalde woonbuurt gaan gebruik vir die volgende maand; of

waar ʼn maatskappy moet bepaal wat hulle omset vir die volgende vyf jaar gaan wees.

4.6.1

Stipping van tydreekse

Soos met eenvoudige lineêre regressie skop ons af met die vaslê van tydreeksdata en hoe om dit deur middel van ʼn grafiek voor te stel. Voorbeeld 4.2 ʼn Huiseienaar het oor die laaste drie jaar sy huis se kragverbruik gemoniteer. Die volgende tabel gee sy kragverbruik, per maand, in kilowatt: 2014

2015

2016

Januarie

1 285

1 299

1 308

Februarie

1 288

1 304

1 306

Maart

1 292

1 300

1 309

April

1 297

1 317

1 322

Mei

1 309

1 315

1 324

Junie

1 315

1 320

1 321

Julie

1 323

1 322

1 326

Augustus

1 319

1 324

1 325

September

1 315

1 323

1 318

Oktober

1 306

1 311

1 317

November

1 303

1 316

1 316

Desember

1 302

1 310

1 309

Tabel 4.3: ’n Huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 Skets ʼn lyngrafiek van die huiseienaar se maandelikse kragverbruik vir 2014-2016.

Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise

Bladsy 165


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Oplossing: Die volgende grafiek is getrek met behulp van MS Excel se lyngrafiek (met merkers).

Huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1330

Kragverbruik (kW.)

1325 1320 1315 1310 1305 1300 1295 1290 1285

2014

2015

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

1280

2016

Jaar/Maand

Figuur 4.7: Lyngrafiek van die huiseienaar se maandelikse kragverbruik (kW) vir 20142016 Doen nou Voorbeeld 15.1 in die handboek. 4.6.2

Elemente van tydreeksanalise

Bestudeer die handboek paragrawe 15.2 en 15.3. Klassieke tydreeksanalise aanvaar dat elke tydreeks uit die volgende vier elemente bestaan: •

ʼn onderliggende tendens (T);

•

sikliese variasies (C);

•

seisoenale variasies (S); en

•

onreĂŤlmatige variasies (I).

Daar is verskillende modelle wat ons kan gebruik om hierdie elemente bymekaar te voeg. Die model waarna ons gaan kyk, staan bekend as die “multiplikatiewe model�:

� = ���� Waar:

đ?‘Ś

= afhanklike veranderlike

�

= tendens

Bladsy 166 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

đ??ś

= sikliese variasies

�

= seisoenale variasies

đ??ź

= onreĂŤlmatige variasies Formule 4.7: Multiplikatiewe tydreeksmodel

v Tendense Die tendens is die gladde onderliggende beweging van die tydreeks in ʼn bepaalde rigting, naamlik op (positief) of af (negatief). Dit word op ʼn lyngrafiek van ʼn tydreeks voorgestel deur ʼn reguit lyn. Indien ons die tendens van Voorbeeld 4.2 isoleer, sal die lyngrafiek soos volg lyk.

Die tendens van 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016

Kragverbruik (kW.)

1310 1305 1300 1295 1290 1285

Desember

Oktober

November

September

Jullie

Augustus

Mei

2015

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

2014

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

1280

2016

Jaar/Maand

Figuur 4.8: Lyngrafiek van die tendens van ’n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 (uit voorbeeld 4.2) Wanneer ons die tendens wil analiseer, isoleer ons die onderliggende langtermynbeweging van die reeks. v Siklusse Sikliese variasie is langtermynvariasies om die tendens, wat onreÍlmatig plaasvind oor lang periodes. Met ander woorde, die een siklus is nie so lank soos die ander nie en die grootte van die variasie is anders, van die een siklus tot die volgende. Dit maak dit moeilik om siklusse te identifiseer en te verduidelik. Ons kan indekse bereken wat die data beskryf, maar hierdie indekse is nie baie werd wanneer dit kom by vooruitskatting nie omdat ons dit nie kan voorspel nie. Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise

Bladsy 167


GQM105 Inleiding tot elementêre kwantitatiewe metodes Indien ons die sikliese variasie van Voorbeeld 4.2 isoleer, sal die lyngrafiek soos volg lyk:

Sikliese variasie van 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1320

Kragverbruik (kW.)

1315 1310 1305 1300 1295 1290 1285

Desember

Oktober

November

September

Jullie

Augustus

Mei

2015

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

2014

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

1280

2016

Jaar/Maand

Figuur 4.9: Lyngrafiek van die sikliese variasie van ’n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 (uit Voorbeeld 4.2) v Seisoenaliteit ʼn Seisoenale variasie is die afwisseling van ʼn gereelde voorspelbare afwisseling oor kort gereelde periodes wat ewe groot is, byvoorbeeld dae, weke, maande, kwartale, jare, ensovoorts. Hierdie afwisselings word gewoonlik veroorsaak deur herhaalde omgewingsgebeurtenisse, soos die seisoene van die jaar. Seisoenale variasie word bereken as ʼn indeks wat gebruik kan word vir vooruitskattings omdat ons kan bepaal wanneer dit gaan gebeur en hoe groot hierdie variasie is. Indien ons die seisoenale variasie van Voorbeeld 4.2 isoleer, sal die lyngrafiek soos volg lyk:

Bladsy 168 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Seisoenale variasie van 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1320

Kragverbruik (kW.)

1315 1310 1305 1300 1295 1290 1285

Desember

Oktober

November

September

Jullie

Augustus

Mei

2015

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

2014

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

1280

2016

Jaar/Maand

Figuur 4.10: Lyngrafiek van die seisoenale variasie van ’n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 (uit Voorbeeld 4.2) v Onreëlmatige invloede Indien ons die onreëlmatige invloede Van voorbeeld 4.2 isoleer, sal die lyngrafiek soos volg lyk:

Onreëlmatige invloede van 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1315

Kragverbruik (kW.)

1310 1305 1300 1295 1290 1285

2015

Desember

November

Oktober

September

Jullie

Augustus

Junie

Mei

April

Maart

Februarie

Januarie

Desember

November

Oktober

September

Jullie

Augustus

Junie

Mei

April

Maart

Februarie

Januarie

Desember

November

Oktober

September

Jullie

2014

Augustus

Junie

Mei

April

Maart

Januarie

Februarie

1280

2016

Jaar/Maand

Figuur 4.11: Lyngrafiek van die onreëlmatige invloede van ’n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 (uit Voorbeeld 4.2)

Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise

Bladsy 169


GQM105 Inleiding tot elementêre kwantitatiewe metodes Onreëlmatige invloede is enkel- ewekansige gebeurtenisse wat heeltemal onvoorspelbaar is, met geen patroon of ritme nie. Dit kan glad nie gebruik word vir vooruitskatting nie en verskaf geen bruikbare insig met betrekking tot die afhanklike veranderlike nie. 4.6.3

Tendensanalise

Bestudeer die handboek paragraaf 15.4. Om die onderliggende langtermynbeweging van die tydreeks waar te neem wil ons die korten mediumtermynvariasies (siklusse, seisoenaliteit en onreëlmatige invloede) uit die data haal. v Metode 1: Bewegende gemiddelde Hierdie metode lig vir ons die tendens en sikliese variasie (TC) uit die tydreeks. Dit vat ʼn vensterperiode en werk die sentrale gemiddeld uit vir hierdie periode. Indien die vensterperiode drie periodes is, is die resultaat die sentrale gemiddeld vir periode 2. Indien die vensterperiode vyf is, is die resultaat die sentrale gemiddeld vir periode 3. Wanneer die vensterperiode ʼn onewe getal is, is dit die sentrale gemiddeld vir die middelste periode.

Figuur 4.12: Illustrasie van sentrale gemiddeldes vir ’n drie-periode bewegende gemiddeld Voorbeeld 4.3 Bereken ʼn drie-periode bewegende gemiddeld vir die volgende data: Periode

Waarde

1

13

2

19

3

18

4

14

5

15

Tabel 4.4: Datastel vir Voorbeeld 4.3

Bladsy 170 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Oplossing: Periode

Waarde

Berekening

1

13

-

2

19

13 + 19 + 18 = 15,8 3

3

18

19 + 18 + 14 = 16,5 3

4

14

18 + 14 + 15 = 15,7 3

5

15

-

Tabel 4.5: Berekening van ’n drie-periode bewegende gemiddeld

Wanneer ons werk met ʼn vensterperiode van vier periodes, val die sentrale gemiddeld tussen periode 2 en 3 (soos aangedui in Figuur 4.13).

Figuur 4.13: Illustrasie van sentrale gemiddeldes vir ’n vier-periode bewegende gemiddeld Voorbeeld 4.4 Bereken ʼn vier-periode bewegende gemiddeld vir die volgende data: Periode

Waarde

1

13

2

19

3

18

4

14

5

15

Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise

Bladsy 171


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

6

20

7

19

8

16

9

11

Tabel 4.6: Datastel vir Voorbeeld 4.3 Oplossing: Periode

Waarde

1

13

Berekening

2

19 13 + 19 + 18 + 14 = 16 4

3

18 19 + 18 + 14 + 15 = 16,5 4

4

14 18 + 14 + 15 + 20 = 16,75 4

5

15 14 + 15 + 20 + 19 = 17 4

6

20 15 + 20 + 19 + 16 = 17,5 4

7

19 20 + 19 + 16 + 11 = 16,6 4

8

16 -

9

11

Tabel 4.7: Berekening van ’n vier-periode bewegende gemiddeld Om die sentrale gemiddeld per periode te kry word die gemiddeld van die twee sentrale gemiddeldes bo en onder die periode bereken:

Bladsy 172 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Figuur 4.14: Illustrasie van hoe om bewegende gemiddeldes te sentraliseer Voorbeeld 4.4 (vervolg) Sentraliseer die vier-periode bewegende gemiddeld: Periode

Waarde

1

13

Berekening

2

19 13 + 19 + 18 + 14 = 16 4

3

18 19 + 18 + 14 + 15 = 16,5 4

4

14 18 + 14 + 15 + 20 = 16,75 4

5

15 14 + 15 + 20 + 19 = 17 4

6

20 15 + 20 + 19 + 16 = 17,5 4

7

19 20 + 19 + 16 + 11 = 16,5 4

8

16 -

9

11

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 173


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Tabel 4.8: ’n Vier-periode bewegende gemiddeld Oplossing: Periode

Waarde

1

13

Berekening

Gesentraliseerde waarde

2

19

13 + 19 + 18 + 14 = 16 4

3

16 + 16,5 = 16,25 2

18 19 + 18 + 14 + 15 = 16,5 4

4

16,5 + 16,75 = 16,625 2

14 18 + 14 + 15 + 20 = 16,75 4

5

16,75 + 17 = 16,875 2

15 14 + 15 + 20 + 19 = 17 4

6

17 + 17,5 = 17,25 2

20 15 + 20 + 19 + 16 = 17,5 4

7

17,5 + 16,5 = 17 2

19 20 + 19 + 16 + 11 = 16,5 4

8

16

-

9

11 Tabel 4.9: Gesentraliseerde vier-periode bewegende gemiddeld

Bladsy 174 Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise


GQM105 Inleiding tot elementêre kwantitatiewe metodes Baie belangrik: onthou om die bewegende gemiddeld vir ʼn ewe getal (byvoorbeeld 4, 6, 12, 24, ensovoorts) altyd te sentraliseer! Doen nou Voorbeeld 15.2-15.4 in die handboek. Voorbeeld 4.2 (vervolg) 2014

2015

2016

Januarie

1 285

1 299

1 308

Februarie

1 288

1 304

1 306

Maart

1 292

1 300

1 309

April

1 297

1 317

1 322

Mei

1 309

1 315

1 324

Junie

1 315

1 320

1 321

Julie

1 323

1 322

1 326

Augustus

1 319

1 324

1 325

September

1 315

1 323

1 318

Oktober

1 306

1 311

1 317

November

1 303

1 316

1 316

Desember

1 302

1 310

1 309

Tabel 4.3: ’n Huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 Bereken ʼn twaalf-periode bewegende gemiddeld vir die maandelikse kragverbruik en teken ʼn lyngrafiek wat die periodes en die twaalf-periode bewegende gemiddeld aandui. Oplossing: Herrangskik die tabel om die waardes onder mekaar te gee: Jaar 2014

Maand

Waarde

Januarie

1 285

Februarie

1 288

Maart

1 292

April

1 297

Mei

1 309

Bereken

Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise

Gesentraliseer

Bladsy 175


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Junie

1 315 1 304, 5

Julie

1 323

1 305,1 1 305,7

Augustus

1 319

1 306,3 1 307,0

September

1 315

1 307,3 1 307,7

Oktober

1 306

1 308,5 1 309,3

November

1 303

1 309,6 1 309,8

Desember

1 302

1 310,0 1 310,3

2015

Januarie

1 299

1 310,2 1 310,2

Februarie

1 304

1 310,4 1 310,6

Maart

1 300

1 310,9 1 311,3

April

1 317

1 311,5 1 311,7

Mei

1 315

1 312,2 1 312, 8

Junie

1 320

1 313,1 1 313,4

Julie

1 322

1 313,8 1 314,2

Augustus

1 324

1 314,3 1 314,3

September

1 323

1 314,7 1 315,1

Oktober

1 311

1 315,3

Bladsy 176 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementêre kwantitatiewe metodes

1 315,5 November

1 316

1 315,9 1 316,3

Desember

1 310

1 316,3 1 316,3

2016

Januarie

1 308

1 316,5 1 316,7

Februarie

1 306

1 316,7 1 316,8

Maart

1 309

1 316,5 1 316,3

April

1 322

1 316,6 1 316,8

Mei

1 324

1 316,8 1 316,8

Junie

1 321

1 316,8 1 316,8

Julie

1 326

Augustus

1 325

September

1 318

Oktober

1 317

November

1 316

Desember

1 309

Tabel 4.10: Twaalf-periode bewegende gemiddelde vir ’n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016

Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise

Bladsy 177


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

12 periode bewegende gemiddele vir 'n huiseienaar se maandelikse kragverbruik (kW.) vir 2014-2016 1330

Kragverbruik (kW.)

1325 1320 1315 1310 1305 1300 1295 1290 1285

2014

Desember

Oktober

November

September

Jullie

Augustus

Mei

2015

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

1280

2016

Jaar/Maand

Figuur 4.15: Lyngrafiek van ʼn twaalf-periode bewegende gemiddelde vir ’n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 ʼn Nadeel van bewegende gemiddelde is dat ons data aan die begin en einde van ons tydreeks verloor. Uit Voorbeeld 4.4 kan ons duidelik sien dat ons ses periodes se data aan die begin en einde van die tydreeks verloor het. Hoe groter jou vensterperiode, hoe meer data verloor ons. v Metode 2: Lineêre regressie-analise As ons die tendens wil analiseer deur middel van lineêre regressie, bereken ons dit op dieselfde wyse as in paragraaf 4.5.2, met die uitsondering dat ons x-waardes 1, 2, ..., n is, waar n die laaste periode van ons tydreeks verteenwoordig. Voorbeeld 4.4 (vervolg) Gebruik die gegewe data en skep ʼn lineêre regressiemodel daarvoor. Gebruik hierdie regressiemodel om die kragverbruik (in kW) te beraam vir Januarie 2017. Oplossing: Bereken

�� ,

Jaar 2014

đ?’šđ?’Š ,

đ?’™đ?&#x;?đ?’Š en

�� �� :

Maand

đ?’™

đ?’š

đ?’™đ?&#x;?

��

Januarie

1

1285

1

1285

Februarie

2

1288

4

2576

Bladsy 178 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

2015

2016

Maart

3

1292

9

3876

April

4

1297

16

5188

Mei

5

1309

25

6545

Junie

6

1315

36

7890

Julie

7

1323

49

9261

Augustus

8

1319

64

10552

September

9

1315

81

11835

Oktober

10

1306

100

13060

November

11

1303

121

14333

Desember

12

1302

144

15624

Januarie

13

1299

169

16887

Februarie

14

1304

196

18256

Maart

15

1300

225

19500

April

16

1317

256

21072

Mei

17

1315

289

22355

Junie

18

1320

324

23760

Julie

19

1322

361

25118

Augustus

20

1324

400

26480

September

21

1323

441

27783

Oktober

22

1311

484

28842

November

23

1316

529

30268

Desember

24

1310

576

31440

Januarie

25

1308

625

32700

Februarie

26

1306

676

33956

Maart

27

1309

729

35343

April

28

1322

784

37016

Mei

29

1324

841

38396

Junie

30

1321

900

39630

Julie

31

1326

961

41106

Augustus

32

1325

1024

42400

September

33

1318

1089

43494

Oktober

34

1317

1156

44778

November

35

1316

1225

46060

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 179


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Desember TOTALE

36

1309

1296

47124

666

47216

16206

875789

Tabel 4.11: Berekening van �� ,

đ?’šđ?’Š ,

đ?’™đ?&#x;?đ?’Š en

�� ��

Bereken nou die waardes van đ?’ƒđ?&#x;? en đ?’ƒđ?&#x;Ž : đ?’ƒđ?&#x;?

=

đ?’? đ?’?

đ?’™đ?’Š đ?’šđ?’Š m đ?’™đ?’Š đ?’šđ?’Š đ?’™đ?&#x;?đ?’Š m đ?’™đ?’Š đ?&#x;?

=

đ?&#x;‘đ?&#x;” đ?&#x;–đ?&#x;•đ?&#x;“ đ?&#x;•đ?&#x;–đ?&#x;— − đ?&#x;”đ?&#x;”đ?&#x;” đ?&#x;’đ?&#x;• đ?&#x;?đ?&#x;?đ?&#x;” đ?&#x;‘đ?&#x;” đ?&#x;?đ?&#x;” đ?&#x;?đ?&#x;Žđ?&#x;” − đ?&#x;”đ?&#x;”đ?&#x;” đ?&#x;?

=

đ?&#x;‘đ?&#x;? đ?&#x;“đ?&#x;?đ?&#x;– đ?&#x;’đ?&#x;Žđ?&#x;’ − đ?&#x;‘đ?&#x;? đ?&#x;’đ?&#x;’đ?&#x;“ đ?&#x;–đ?&#x;“đ?&#x;” đ?&#x;–đ?&#x;? đ?&#x;“đ?&#x;’đ?&#x;– = đ?&#x;“đ?&#x;–đ?&#x;‘ đ?&#x;’đ?&#x;?đ?&#x;” − đ?&#x;’đ?&#x;’đ?&#x;‘ đ?&#x;“đ?&#x;“đ?&#x;” đ?&#x;?đ?&#x;‘đ?&#x;— đ?&#x;–đ?&#x;”đ?&#x;Ž

= đ?&#x;Ž, đ?&#x;“đ?&#x;—đ?&#x;Žđ?&#x;? en đ?’ƒđ?&#x;Ž

=

đ?’šđ?’Š mđ?’ƒđ?&#x;? đ?’?

��

đ?&#x;’đ?&#x;• đ?&#x;?đ?&#x;?đ?&#x;” − đ?&#x;Ž, đ?&#x;“đ?&#x;—đ?&#x;Žđ?&#x;? đ?&#x;”đ?&#x;”đ?&#x;” đ?&#x;’đ?&#x;• đ?&#x;?đ?&#x;?đ?&#x;” − đ?&#x;‘đ?&#x;—đ?&#x;‘, đ?&#x;Žđ?&#x;–đ?&#x;“đ?&#x;• = đ?&#x;‘đ?&#x;” đ?&#x;‘đ?&#x;” đ?&#x;’đ?&#x;” đ?&#x;–đ?&#x;?đ?&#x;?, đ?&#x;—đ?&#x;?đ?&#x;’đ?&#x;‘ = đ?&#x;‘đ?&#x;” =

= đ?&#x;? đ?&#x;‘đ?&#x;Žđ?&#x;Ž, đ?&#x;”đ?&#x;‘đ?&#x;”đ?&#x;“ Verifieer jou resultaat met MS Excel:

Figuur 4.16: MS Excel-uitvoer vir Voorbeeld 4.4

Bladsy 180 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

LineĂŞre funksie vir 'n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 y = 0.5902x + 1300.6

1330

Kragverbruik (kW)

1325 1320 1315 1310 1305 1300 1295 1290 1285

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

2015

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

2014

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

1280

2016

Jaar/Maand

Figuur 4.17: Lyngrafiek vir die lineêre funksie vir ’n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 As ons die kragverbruik vir Januarie 2017 wil beraam, gebruik ons die formule: �

= đ?&#x;? đ?&#x;‘đ?&#x;Žđ?&#x;Ž, đ?&#x;”đ?&#x;‘đ?&#x;”đ?&#x;“ + đ?&#x;Ž, đ?&#x;“đ?&#x;—đ?&#x;Žđ?&#x;?đ?’™ = đ?&#x;? đ?&#x;‘đ?&#x;Žđ?&#x;Ž, đ?&#x;”đ?&#x;‘đ?&#x;”đ?&#x;“ + đ?&#x;Ž, đ?&#x;“đ?&#x;—đ?&#x;Žđ?&#x;? đ?&#x;‘đ?&#x;• = đ?&#x;? đ?&#x;‘đ?&#x;?đ?&#x;?, đ?&#x;’đ?&#x;•đ?&#x;‘đ?&#x;—

Dus het die huiseienaar, met behulp van tendensanalise, die kragverbruik vir Januarie 2017 beraam as 1 322kW. Doen nou Voorbeeld 15.5 in die handboek. Uit Voorbeeld 4.4 kan ons sien dat daar ʼn baie groot seisoenale variasie in die data is. Januarie 2017 se kragverbruik is beraam teen 1 322kW, maar as ons net na die lyngrafiek kyk, sien ons dat dit beslis nie die geval gaan wees nie. Om hierdie stelling verder te staaf kan ons đ?‘&#x; * = 0,3354 bereken vir hierdie regressielyn. Onthou dat dit beteken dat hierdie model slegs 33,54% van die variasie in die kragverbruik verklaar. Om ʼn beraming te kry wat meer akkuraat is, sal ons die seisoenale variasie ook in berekening moet bring. 4.6.4

Seisoenale analise

Bestudeer die handboek paragrawe 15.5-15.8. In hierdie paragraaf sal ons bespreek hoe om die seisoenale variasie (S) uit ons tydreeksdata te haal. Dit help ons om: •

die seisoenale variasie apart te analiseer;

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 181


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

die seisoenale variasie uit die data te haal, want dit help ons om die langtermyntendens beter te beraam; en

•

vooruitskattings meer akkuraat te beraam omdat ons die seisoenale indeks in berekening kan neem.

Stap 1: Identifiseer die tendens/siklusse beweging (TC), soos wat ons in paragraaf 4.6.3 gedoen het, met behulp van die bewegende gemiddelde. Stap 2: Vind die seisoenale verhouding (SI).

đ?‘şđ?‘° = Waar:

đ?’€ đ?‘ťđ?‘Şđ?‘şđ?‘° = đ?‘ťđ?‘Ş đ?‘ťđ?‘Ş

đ?‘Œ

= die observasies in die tydreeks

�

= tendens

đ??ś

= sikliese variasies

�

= seisoenale variasies

đ??ź

= onreĂŤlmatige variasies

đ?‘‡Ă—đ??ś = bewegende gemiddeld đ?‘†Ă—đ??ź

= seisoenale variasie

Formule 4.8: Berekening van die seisoenale variasie van die tydreeks Stap 3: Vind die gemiddeld van die seisoenale variasies. Kry die seisoenale variasies vir al die ooreenstemmende periodes (byvoorbeeld die seisoenale variasies vir al die Januaries, Maandae, ensovoorts) en bereken die gemiddeld (seisoenale indeks). Let daarop dat Wegner (2016: 425) die mediaan van die seisoenale variasies gebruik omdat dit minder beĂŻnvloedbaar is deur uitskieters. Ons gebruik egter die gemiddeld om dat dit meer algemeen in die praktyk is. Stap 4: Pas die seisoenale indekse aan sodat die totaal daarvan gelyk is aan die aantal periodes wat gebruik is om die bewegende gemiddelde te bereken.

Aanpassingsfaktor =

Waar:

đ?’Œ đ?‘şđ?‘°đ?’Š

đ?‘˜

= aantal periodes wat gebruik is om die bewegende gemiddelde te bereken

đ?‘†đ??źO

= seisoenale variasie vir periode đ?‘– Formule 4.9: Berekening van die aanpassingsfaktor

Bladsy 182 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Voorbeeld 4.4 (vervolg) Bereken die seisoenale indekse vir die huiseienaar se kragverbruik (in kW) per maand vir 2014-2016. Oplossing: Bereken eers die seisoenale variasies: Jaar 2014

2015

đ?‘Œ = đ?‘‡đ??śđ??źđ?‘†

đ?‘‡đ??ś

đ?‘‡đ??śđ??źđ?‘† = đ?‘†đ??ź đ?‘‡đ??ś

Januarie

1 285

-

-

Februarie

1 288

-

-

Maart

1 292

-

-

April

1 297

-

-

Mei

1 309

-

-

Junie

1 315

-

-

Julie

1 323

1 305,1

1 323 = 1,0137 1 305,1

Augustus

1 319

1 306,3

1 3193 = 1,0097 1 306,3

September

1 315

1 307,3

1 315 = 1,0059 1 307,3

Oktober

1 306

1 308,5

0,9981

November

1 303

1 309,6

0,9950

Desember

1 302

1 310,0

0,9939

Januarie

1 299

1 310,2

0,9915

Februarie

1 304

1 310,4

0,9951

Maart

1 300

1 310,9

0,9917

April

1 317

1 311,5

1,0042

Mei

1 315

1 312,2

1,0021

Junie

1 320

1 313,1

1,0053

Julie

1 322

1 313,8

1,0062

Maand

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 183


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

2016

Augustus

1 324

1 314,3

1,0074

September

1 323

1 314,7

1,0063

Oktober

1 311

1 315,3

0,9967

November

1 316

1 315,9

1,0001

Desember

1 310

1 316,3

0,9952

Januarie

1 308

1 316,5

0,9935

Februarie

1 306

1 316,7

0,9919

Maart

1 309

1 316,5

0,9943

April

1 322

1 316,6

1,0041

Mei

1 324

1 316,8

1,0055

Junie

1 321

1 316,8

1,0032

Julie

1 326

-

-

Augustus

1 325

-

-

September

1 318

-

-

Oktober

1 317

-

-

November

1 316

-

-

Desember

1 309

-

-

Tabel 4.12: Berekening van die seisoenale indekse vir ’n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016 Tabuleer die seisoenale variasies soos volg: Maand

2014

2015

2016

Gemiddeld

Januarie

-

0,9914

0,9935

0,9925

Februarie

-

0,9951

0,9919

0,9935

Maart

-

0,9917

0,9943

0,9930

April

-

1,0042

1,0041

1,0042

Mei

-

1,0021

1,0054

1,0038

Junie

-

1,0053

1,0032

1,0043

Bladsy 184 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Julie

1,0137

1,0062

-

1,0100

Augustus

1,0097

1,0074

-

1,0086

September

1,0059

1,0063

-

1,0061

Oktober

0,9981

0,9967

-

0,9974

November

0,9950

1,0001

-

0,9976

Desember

0,9939

0,9952

-

0,9946

Totaal:

12,0056

Tabel 4.13: Berekening van die seisoenale indekse Die seisoenale indekse moet nou eers aangepas word. Bereken die aanpassingsfaktor: Aanpassingsfaktor = =

đ?’Œ đ?‘şđ?‘°đ?’Š

đ?&#x;?đ?&#x;?, đ?&#x;Žđ?&#x;Žđ?&#x;Žđ?&#x;Ž đ?&#x;?đ?&#x;?, đ?&#x;Žđ?&#x;Žđ?&#x;“đ?&#x;”

= đ?&#x;Ž, đ?&#x;—đ?&#x;—đ?&#x;—đ?&#x;“ Pas nou die seisoenale indekse aan: Maand

Seisoenale Indeks

Aanpassing Aangepaste seisoenale indeks

Januarie

0,9925

Ă—0,9995

0,99204

Februarie

0,9935

Ă—0,9995

0,99304

Maart

0,9930

Ă—0,9995

0,99254

April

1,0042

Ă—0,9995

1,00373

Mei

1,0038

Ă—0,9995

1,00333

Junie

1,0043

Ă—0,9995

1,00383

Julie

1,0100

Ă—0,9995

1,00953

Augustus

1,0086

Ă—0,9995

1,00813

September

1,0061

Ă—0,9995

1,00563

Oktober

0,9974

Ă—0,9995

0,99693

November

0,9976

Ă—0,9995

0,99713

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 185


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Desember

0,9946

Totaal

12,0056

Ă—0,9995

0,99414 12,00000

Tabel 4.14: Aanpassing van die seisoenale indekse

Ons kan nou hierdie indekse gebruik om die seisoenale variasie uit die tydreeks te haal.

đ?‘ťđ?‘Şđ?‘° = Waar:

đ?’€ đ?‘ťđ?‘Şđ?‘şđ?‘° = đ?‘ş đ?‘ş

đ?‘Œ

= die observasies in die tydreeks

�

= tendens

đ??ś

= sikliese variasies

�

= seisoenale variasies

đ??ź

= onreĂŤlmatige variasies

đ?‘‡Ă—đ??ś = bewegende gemiddeld đ?‘†Ă—đ??ź

= seisoenale variasie

Formule 4.10: Berekening van die tendens/sikliese variasie deur die seisoenale variasie uit te haal Voorbeeld 4.4 (vervolg) Bereken die tendens/sikliese variasie, van die huiseienaar se kragverbruik (in kW) per maand vir 2014-2016, deur die seisoenale variasie uit te haal. Toon hierdie waardes, saam met die oorspronklike tydreeks, op ʼn lyngrafiek. Oplossing: Jaar

Maand

đ?‘Œ = đ?‘‡đ??śđ??źđ?‘†

Seisoenale indeks

2014

đ?‘‡đ??śđ??źđ?‘† = đ?‘‡đ??śđ??ź đ?‘†

Januarie

1 285

0,99204

1 285 = 1 295,4 0,99204

Februarie

1 288

0,99304

1 288 = 1 297,1 0,99304

Maart

1 292

0,99254

1 292 = 1 301,3 0,99254

April

1 297

1,00373

1 292,3

Bladsy 186 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

2015

2016

Mei

1 309

1,00333

1 304,5

Junie

1 315

1,00383

1 309,6

Julie

1 323

1,00953

1 310,4

Augustus

1 319

1,00813

1 308,7

September

1 315

1,00563

1 308,0

Oktober

1 306

0,99693

1 309,7

November

1 303

0,99713

1 306,6

Desember

1 302

0,99414

1 309,7

Januarie

1 299

0,99204

1 309,1

Februarie

1 304

0,99304

1 313,6

Maart

1 300

0,99254

1 309,7

April

1 317

1,00373

1 311,9

Mei

1 315

1,00333

1 310,2

Junie

1 320

1,00383

1 315,3

Julie

1 322

1,00953

1 309,9

Augustus

1 324

1,00813

1 313,6

September

1 323

1,00563

1 315,6

Oktober

1 311

0,99693

1 315,5

November

1 316

0,99713

1 319,5

Desember

1 310

0,99414

1 317,5

Januarie

1 308

0,99204

1 318,3

Februarie

1 306

0,99304

1 315,6

Maart

1 309

0,99254

1 318,6

April

1 322

1,00373

1 317,0

Mei

1 324

1,00333

1 319,3

Junie

1 321

1,00383

1 315,6

Julie

1 326

1,00953

1 313,6

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 187


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Augustus

1 325

1,00813

1 314,2

September

1 318

1,00563

1 311,0

Oktober

1 317

0,99693

1 321,1

November

1 316

0,99713

1 320,3

Desember

1 309

0,99414

1 317,1

Tabel 4.15: Berekening van die tendens vir ’n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016, deur die seisoenale variasie uit te haal

Tendens vir 'n huiseienaar se maandelikse kragverbruik (kW) vir 2014-2016 waar die seisoenale variasie uitgehaal is 1330

Kragverbruik (kW)

1325 1320 1315 1310 1305 1300 1295 1290 1285

Desember

Oktober

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

2015

November

September

Jullie

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

Desember

Oktober

November

September

Jullie

2014

Augustus

Mei

Junie

April

Maart

Januarie

Februarie

1280

2016

Jaar/Maand

Figuur 4.16: Lyngrafiek van die tendens vir ’n huiseienaar se kragverbruik (in kW) per maand vir 2014-2016, waar die seisoenale variasie uitgehaal is Noudat ons weet wat die tendens en seisoenale indeks van ons tydreeks is, kan ons dit gebruik om vooruitskattings te maak. Om hierdie beraming te maak gebruik ons die lineĂŞre funksie đ?‘Ś = đ?‘?8 + đ?‘?( đ?‘Ľ en deel ons die waarde hiervan met die seisoenale indeks. Voorbeeld 4.4 (vervolg) Beraam die huiseienaar se kragverbruik (in kW) vir Januarie, Februarie, Maart en April van 2017 en neem die seisoenale indekse in berekening. Oplossing: Ons het hierbo đ?’š = đ?&#x;? đ?&#x;‘đ?&#x;Žđ?&#x;Ž, đ?&#x;”đ?&#x;‘đ?&#x;”đ?&#x;“ + đ?&#x;Ž, đ?&#x;“đ?&#x;—đ?&#x;Žđ?&#x;?đ?’™ gekry. Bereken nou die waardes waar đ?’™ = đ?&#x;‘đ?&#x;•, 38, 39 en 40:

Bladsy 188 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

đ?’šđ?&#x;‘đ?&#x;•

= đ?&#x;? đ?&#x;‘đ?&#x;Žđ?&#x;Ž, đ?&#x;”đ?&#x;‘đ?&#x;”đ?&#x;“ + đ?&#x;Ž, đ?&#x;“đ?&#x;—đ?&#x;Žđ?&#x;? đ?&#x;‘đ?&#x;• = đ?&#x;? đ?&#x;‘đ?&#x;?đ?&#x;?, đ?&#x;’đ?&#x;•đ?&#x;‘đ?&#x;—

đ?’šđ?&#x;‘đ?&#x;–

= đ?&#x;? đ?&#x;‘đ?&#x;Žđ?&#x;Ž, đ?&#x;”đ?&#x;‘đ?&#x;”đ?&#x;“ + đ?&#x;Ž, đ?&#x;“đ?&#x;—đ?&#x;Žđ?&#x;? đ?&#x;‘đ?&#x;– = đ?&#x;? đ?&#x;‘đ?&#x;?đ?&#x;‘, đ?&#x;Žđ?&#x;”đ?&#x;’đ?&#x;?

đ?’šđ?&#x;‘đ?&#x;—

= đ?&#x;? đ?&#x;‘đ?&#x;Žđ?&#x;Ž, đ?&#x;”đ?&#x;‘đ?&#x;”đ?&#x;“ + đ?&#x;Ž, đ?&#x;“đ?&#x;—đ?&#x;Žđ?&#x;? đ?&#x;‘đ?&#x;— = đ?&#x;? đ?&#x;‘đ?&#x;?đ?&#x;‘, đ?&#x;”đ?&#x;“đ?&#x;’đ?&#x;‘

đ?’šđ?&#x;’đ?&#x;Ž

= đ?&#x;? đ?&#x;‘đ?&#x;Žđ?&#x;Ž, đ?&#x;”đ?&#x;‘đ?&#x;”đ?&#x;“ + đ?&#x;Ž, đ?&#x;“đ?&#x;—đ?&#x;Žđ?&#x;? đ?&#x;’đ?&#x;Ž = đ?&#x;? đ?&#x;‘đ?&#x;?đ?&#x;’, đ?&#x;?đ?&#x;’đ?&#x;’đ?&#x;“

Pas nou hierdie waardes aan met die seisoenale indekse: đ?‘Ľ

đ?‘Ś

�

��

37

1 322,4739

0,99204 1 322,4739Ă—0,99204 = 1 311,9470

38

1 323,0641

0,99304 1 323,0641Ă—0,99304 = 1 313,8556

39

1 323,6543

0,99254 1 323,6543Ă—0,99254 = 1 313,7798

40

1 324,2445

1,00373 1 324,2445Ă—1,00373 = 1 329,1839

Tabel 4.12: Beraming van Januarie, Februarie, Maart en April 2017 se kragverbruik (in kW), met seisoenale aanpassings

Let daarop dat hierdie vooruitskattings nie sikliese variasies en onreĂŤlmatige invloede insluit nie en ons maak die aanname dat die invloed hiervan minimaal is. Solank hierdie aanname waar is, kan hierdie vooruitskattings gebruik word. Verder maak ons staat daarop dat die tendens en seisoenale patroon aangaan soos in die verlede. Sodra een van hierdie elemente drasties verander, kan hierdie model nie verder gebruik word vir vooruitskattings nie. Hoe verder in die toekoms ons vooruitskattings maak, hoe groter is die onsekerheid waarmee ons dit doen. 4.6.5

Selfevalueringsvrae

Jy kan al die vrae aan die einde van Hoofstuk 15 in die handboek doen. Let net daarop dat ons die gemiddeld gebruik om die seisoenale indeks te bereken en nie die mediaan nie. 4.7

Samevatting

In hierdie studie-eenheid het ons gekyk na die verhouding van ʼn afhanklike veranderlike (y) met die onafhanklike veranderlike (x). Hierdie verhouding is vir ons belangrik omdat die eienskappe daarvan gebruik word om besluite te neem.

Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise

Bladsy 189


GQM105 Inleiding tot elementêre kwantitatiewe metodes Ons het begin deur die datareeks grafies voor te stel deur spreidingstippings- en lyngrafieke. Hierdie prentjie het ons gehelp om te sien of daar ʼn moontlike verhouding bestaan tussen die twee veranderlikes. Ons kon selfs uit hierdie voorstellings aflei of dit ʼn positiewe of negatiewe verhouding is en hoe sterk dit is. Om ons vermoedens te bevestig het ons die lineêre funksie bereken vir die verhouding. Die funksie gee vir ons die snypunt (die waarde van � waar � = 0), asook die helling van die regressielyn. Die volgende stap in hierdie proses was om te bepaal hoe sterk die verhouding tussen die veranderlikes is en ons het Pearson se korrelasiekoÍffisiÍnt gebruik om dit te bereken. Die kwadraat van die korrelasiekoÍffisiÍnt gee vir ons die bepaaldheidskoÍffisiÍnt. Die bepaaldheidskoÍffisiÍnt wys hoeveel van die variasie in die afhanklike veranderlike (y) deur die onafhanklike veranderlike (x) beskryf word. Al wat nou oorbly, is om te kyk of die verhouding tussen hierdie twee veranderlikes statisties betekenisvol is. Ons gebruik hipotesetoetsing om dit te doen. Die toetsstatistiek vir hierdie hipotesetoets maak gebruik van die student-t-verdeling. Die resultate van al die bogenoemde berekeninge stel ons in staat om die verhouding tussen die twee veranderlikes te beskryf en, meer belangrik, afleidings te maak op grond daarvan. Ons het toe vandaar oorgegaan na ʼn spesiale verhouding tussen die afhanklike veranderlike (y) en die onafhanklike veranderlike tyd (x). Om hierdie verhouding beter te beskryf het ons na die elemente van ʼn tydreeks gekyk, naamlik die tendens (T), sikliese variasie (C), seisoenale variasie (S) en die onreÍlmatige invloede (I). Met tendensanalise het ons die tendens bereken deur middel van bewegende gemiddelde, maar ook met ʼn lineêre regressiemodel. Daarna het ons seisoenale analise gedoen waar ons die seisoenale variasie bereken het en toe ʼn indeks vir die seisoenale effek. Dit het ons gehelp om die seisoenale variasie uit die tydreeksdata te haal om die langtermyntendens te beraam en om vooruitskattings te maak vir toekomstige periodes. Hierdie vak se doel is om jou ʼn breÍ blootstelling te gee aan ʼn verskeidenheid velde binne statistiek, as ʼn wetenskap. Dit vind sy oorsprong in die wiskundige opsomming en verwerking van data, maar het gepoog om dit prakties toepasbaar te maak in die interpretering van resultate en afleidings ten opsigte van die groter populasie. Aan die einde van hierdie vak behoort ʼn gemiddeld nie net bloot meer ʼn waarde te wees nie, maar eerder een deeltjie van ʼn groter prentjie. Dit is soos ʼn legkaart: hoe meer legkaartstukkies jy het, hoe meer sin maak die prentjie, maar dan moet jy weet waar elke legkaartstukkie kom...

Bladsy 190 Studie-eenheid 4: Eenvoudige lineĂŞre regressie- en korrelasie-analise


GQM105 Inleiding tot elementêre kwantitatiewe metodes Gebruik wat jy in hierdie vak geleer het om seker te maak dat al die syfertjies en statistieke wat die wêreld na jou kant toe gooi, jou nie mislei nie, maar dat jy weet wat hulle beteken. Gebruik hierdie kennis om kwantitatiewe data op te som en te verwerk sodat jy betroubare afleidings kan maak op grond daarvan. Dit is heel moontlik dat jy oorweldig voel deur al die onderwerpe wat tydens die vak behandel is, maar dit begin eers werklik waarde kry wanneer jy dit by jou huis, in jou werk en ander areas van jou lewe gebruik. Beskou hierdie materiaal as ʼn paar stukkies gereedskap, in jou gereedskapkas wat jy kan gebruik: hoe meer jy dit gebruik, hoe vaardiger raak jy daarmee. Moenie dat dit net lê en stof opgaar nie, gebruik dit!

Studie-eenheid 4: Eenvoudige lineêre regressie- en korrelasie-analise

Bladsy 191


GQM105 Inleiding tot elementêre kwantitatiewe metodes

AFRIKAANS/ENGELSE TERME Afrikaans

Engels

Aanvaardingsarea

Region of acceptance

Additiewe tydreeksmodel

Additive time series model

Afgeleide statistiek

Inferential statistics

Afhanklike veranderlike

Dependent variable

Alternatiewe hipotese

Alternative hypothesis

Analise van variansie

Analysis of variance (ANOVA)

Bepaaldheidskoëffisiënt

Coefficient of determination

Beskrywende statistiek

Descriptive statistics

Bewegende gemiddeld

Moving average

Binominale waarskynlikheidsverdeling

Binominal probability distribution

Data

Data

Datapunt

Data point

Dataverwerkingsmodule

Data Analysis Tool/Toolkit

Diskrete data

Discrete data

Eenvoudige ewekansige steekproefneming

Simple random sampling

Ewekansig

Random

Frekwensieverdeling

Frequency distribution

Gemiddeld

Mean

Gepaarde t-toets

Match pair t-test

Geriefsteekproefneming

Convenience sampling

Gesamentlik uitputbaar

Collectively exhaustive

Gesamentlike waarskynlikhede

Joint probabilities

Gesentraliseerde bewegende gemiddeld

Centralised moving average

Gestapelde kolomgrafiek

Stacked bar chart

Bladsy 192

Afrikaans/Engelse terme


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Gestratifiseerde steekproefneming

Stratified sampling

Helling

Grade/Slope

Hipotese

Hypothesis

Hipotesetoets

Hypothesis test

Histogram

Histogram

Houer-en-punt-stippingsgrafiek

Box plot

Koëffisiënt van determinasie

Coefficient of determination

Kolomgrafiek

Bar chart

Kombinasie

Combination

Kontinue data

Continuous data

Korrelasiekoëffisiënt

Correlation coefficient

Kritieke waarde

Critical value

Kruisfrekwensietabel

Cross frequency table

Kumulatiewe frekwensie

Cumulative frequency

Kumulatiewe frekwensieveelhoek

Cumulative frequency polygon

Kumulatiewe waarskynlikheid

Cumulative probability

Kurtose

Kurtosis

Kwalitatiewe data

Qualitative data

Kwantiel

Quantile

Kwantitatiewe data

Quantitative data

Kwartiel

Quartile

Kwotasteekproefneming

Quota sampling

Limiete

Limits

Lineêre funksie

Linear function

Lyngrafiek

Line graph

Mediaan

Median

Afrikaans/Engelse terme

Bladsy 193


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Meervoudige kolomgrafiek

Multiple bar chart

Meetkundige gemiddeld

Geometric mean

Metode van die kleinste kwadrate

Method of the least squares

Modus

Mode

Multiplikatiewe tydreeksmodel

Multiplicative time series model

Nie-ewekansig

Non random

Niewaarskynlikheidsteekproefneming

Non-probability sampling

Normaalverdeling

Normal distribution

Observasie

Observation

Nulhipotese

Null hypothesis

Onafhanklike veranderlike

Independent variable

Onderling uitsluitend

Mutually exclusive

Onreëlmatige variasies

Random effects/Irregular fluctuations

Oordeelsteekproefneming

Judgement sampling

Opname

Survey

Pearson se korrelasiekoëffisiënt

Pearson’s Correlation Coefficient

Peil van betekenis

Level of significance

Permutasie

Permutation

Persentiel

Percentile

Poisson-verdeling

Poisson probability distribution

Populasie

Population

Postulaat

Postulate

Proporsie

Proportion

Puntberaming

Point estimation

Reikwydte

Range

Rekenkundige gemiddeld

Mean

Bladsy 194

Afrikaans/Engelse terme


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Samevoeging

Union

Seisoenale indeks

Seasonal index

Seisoenaliteit/Seisoenale variasie

Seasonality/Seasonal variations

Sigblad

Spreadsheet

Sikliese variasies

Cyclical variations

Sirkelgrafiek

Pie chart

Skeefheid

Skewness

Sneeubalsteekproefneming

Snowball sampling

Snyding/Snypunt

Intersection

Spreidingstippingsgrafiek

Scatter plot diagram

Standaardafwyking/Standaardfout

Standard deviation

Statisties betekenisvol

Statistically significant

Statisties onafhanklik

Statistically independent

Steekproef

Sample

Steekproefeenheid

Sampling unit

Steekproefmetode

Sampling technique

Steekproefruimte

Sample space

Stelling

Theorem

Stelselmatige steekproefneming

Systematic sampling

Stogastiese veranderlike

Random variable

Tendens

Trend

Tendenslyn

Trend line

Toetsstatistiek

Test statistic

Trossteekproefneming

Cluster sampling

Tydreeks

Time series

Uitskieters

Outliers

Afrikaans/Engelse terme

Bladsy 195


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Variansie

Variance

Vensterperiode

Window period

Verhouding

Ratio

Verhouding

Relationship

Vertrouensinterval

Confidence interval

Verwagte waarde

Expected value

Verwerpingsarea

Region of rejection

Vlak van vertroue/sekerheid

Confidence level

Vooruitskatting

Forecasting

Voorwaardelike waarskynlikheid

Conditional probabilities

Vraelys

Questionnaire

Waarskynlikheid

Probability

Waarskynlikheidsboomdiagram

Probability tree

Waarskynlikheidsteekproefneming

Probability sampling

Bladsy 196

Afrikaans/Engelse terme


Elementêre Kwantitatiewe Metodes Handboek • Wegner, T. 2016. Applied business statistics. 4th Ed. Claremont: Juta.

E

lementêre kwantitatiewe metodes behels ʼn aantal statistiese tegnieke wat die interpretasie van ʼn verskeidenheid data vergemaklik. Die tipes en volumes data wat deur organisasies versamel word, maak dit soms moeilik of onmoontlik om hierdie data deur blote observasies te interpreteer. ʼn Verskeidenheid statistieke en statistiese berekeninge maak hierdie interpretasie moontlik en makliker.

om die data te verstaan.

Hierdie vak word hoofsaaklik in vier afdelings verdeel, naamlik: • basiese beginsels en beskrywende statistiek (beskrywende statistiek); • waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle (afgeleide statistiek); • hipotesetoetsing (afgeleide statistiek); en • eenvoudige lineêre regressie en korrelasieanalise (statistiese modellering).

Beraamde statistieke is in werklikheid ʼn geleerde raaiskoot en as ons dit wil gebruik, is dit belangrik dat ons darem bietjie vertroue daarin moet hê, daarom doen ons hipotesetoetse in studie-eenheid 3. ʼn Hipotesetoets is ʼn vyfstapproses waardeur ons die betekenisvolheid van ʼn statistiek toets. Die uitslag van so ʼn toets gaan ʼn navorser vertroue gee in ʼn statistiese resultaat of nie en dit is uiters belangrik om die regte gevolgtrekking te maak op grond van die resultaat wat verkry is.

Inleiding tot elementêre kwantitatiewe metodes se doel is om jou bloot te stel aan die hulpmiddels en tegnieke om data te verwerk tot bruikbare inligting.

Dit is baie keer noodsaaklik om sakebesluite te neem op grond van vooruitskattings van waardes wat tans onbekend is. Om hierdie tipe vooruitskattings te kan maak, is dit belangrik om die data te verstaan en om die verhouding tussen stogastiese veranderlikes te begryp. Hierdie is die derde en laaste been van statistiek waarna gekyk word, naamlik statistiese modellering. In studie-eenheid 4 kyk ons na eenvoudige lineêre regressie, korrelasies en tydreekse.

Studie-eenheid 1 fokus op die basiese beginsels en beskrywende statistiek. Hierdie afdeling behandel begrippe soos stogastiese veranderlikes, populasies, steekproewe ensovoorts en hoe hierdie statistieke gebruik kan word om ons te help

Wanneer ons die basiese beginsels en beskrywende statistiek onder die knie het, sal ons in studie-eenheid 2 kyk na waarskynlikhede, waarskynlikheidsverdelings en vertrouensintervalle. Hierdie drie temas gebruik beskrywende statistiek om afleidings te maak van die groter populasie waarvan hulle deel is.

www.akademia.ac.za


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.