GQM105 - Elementêre Kwantitatiewe Metodes

Page 1

ElementĂŞre Kwantitatiewe Metodes


Elementêre Kwantitatiewe Metodes

© Kopiereg 2014 Onder redaksie van: Paul JN Steyn, BA (PU vir CHO), THOD (POK), DEd (Unisa) Skrywer: Johann Smith Onderwysontwerp, bladuitleg & taalversorging: Dr. Daleen van Niekerk ’n Publikasie van Akademia. Alle regte voorbehou. Adres: H/v D.F. Malan- & Eendrachtstraat, Kloofsig, Pretoria Posadres: Posbus 11760, Centurion, 0046 Webtuiste: www.akademia.ac.za

Geen gedeelte van hierdie boek mag sonder die skriftelike toestemming van die uitgewers gereproduseer of in enige vorm of deur enige middel weergegee word nie, hetsy elektronies of deur fotokopiëring, plaat- of bandopnames, vermikrofilming of enige ander stelsel van inligtingsbewaring nie. Enige ongemagtigde weergawe van hierdie werk sal as ’n skending van kopiereg beskou word en die dader sal aanspreeklik gehou word onder siviele asook strafreg.

akademia Akademia MSW (Maatskappyregistrasienommer: 2005/024616/08) is voorwaardelik by die Departement van Hoër Onderwys en Opleiding tot 31 Desember 2016 as privaat hoëronderwysinstelling geregistreer ingevolge die Wet op Hoër Onderwys, 1997, Registrasienommer: 2011/HE08/005. Akademia is deel van die Solidariteit Beweging

w w w. a k a d e m i a . a c . z a


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Inhoudsopgawe Programoorsig ................................................................................................................. 1 Inleiding ............................................................................................................................. 5 Vakleeruitkomste ........................................................................................................... 6 Woordomskrywing vir evaluering ........................................................................... 7

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek ................... 9 1.1

Studie-eenheid leeruitkomstes ........................................................................................... 9

1.2

Voorgeskrewe handboek .................................................................................................... 9

1.3

Hoe kan jy jou begrip verbeter? ....................................................................................... 10

1.4

Inleiding ................................................................................................................................ 11

1.5

Basiese begrippe en beginsels van statistiek ................................................................ 12

1.5.1

Wat is statistiek?............................................................................................................. 12

1.5.2

Data .................................................................................................................................. 15

1.5.3

Selfevalueringsvrae........................................................................................................ 17

1.6

Beskrywende statistiek ...................................................................................................... 17

1.6.1

Grafiese beskrywende statistiek vir kategoriese data .............................................. 18

1.6.2

Grafiese voorstelling van numeriese data: Een veranderlike .................................. 22

1.6.3

Grafiese voorstelling van numeriese data: Twee veranderlikes ............................. 26

1.6.4

Pareto se kurwe .............................................................................................................. 30

1.6.5

Excel ................................................................................................................................. 30

1.6.6

Selfevalueringsvrae: Hoofstuk 2 .................................................................................. 30

1.7

Numeriese beskrywende statistiek .................................................................................. 30

1.7.1

Maatstawwe van lokaliteit <sentrale neiging> ........................................................... 30

1.7.2

Nie-sentrale maatstawwe van lokaliteit ....................................................................... 38

1.7.3

Maatstawwe van spreiding............................................................................................ 41

1.7.4

Maatstawwe van skeefheid ........................................................................................... 44

1.7.5

Keuse van statistiek en MS Excel................................................................................ 48

1.7.6

Selfevaluering: Hoofstuk 3 ............................................................................................ 48

1.8

Samevatting ........................................................................................................................ 48

Šakademia (MSW)

Bladsy 1


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Studie-eenheid 2: Waarskynlikhede en steekproewe ..................................... 51 2.1

Studie-eenheid leeruitkomstes ......................................................................................... 51

2.2

Voorgeskrewe handboek .................................................................................................. 51

2.3

Hoe kan jy jou begrip verbeter? ....................................................................................... 52

2.4

Inleiding ................................................................................................................................ 52

2.5

Waarskynlikhede ................................................................................................................ 53

2.5.1

Basiese beginsels en konsepte van waarskynlikhede ............................................. 53

2.5.2

Berekening van waarskynlikhede ................................................................................ 56

2.5.3

Waarskynlikheidsreëls ................................................................................................... 58

2.5.4

Telreëls: Permutasies en kombinasies ....................................................................... 59

2.5.5

Selfevalueringsvrae........................................................................................................ 62

2.6

Waarskynlikheidsverspreidings ........................................................................................ 62

2.6.1

Diskrete waarskynlikheidsverspreidings ..................................................................... 64

2.6.2

Die normaalverdeling ..................................................................................................... 67

2.6.3

Selfevalueringsvrae........................................................................................................ 71

2.7

Steekproewe ....................................................................................................................... 71

2.7.1

Steekproefmetodes ........................................................................................................ 71

2.7.2

Die steekproefverspreiding ........................................................................................... 72

2.7.3

Selfevalueringsvrae........................................................................................................ 74

2.8

Samevatting ........................................................................................................................ 74

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I ......... 75 3.1

Studie-eenheid leeruitkomstes ......................................................................................... 75

3.2

Voorgeskrewe handboek .................................................................................................. 75

3.3

Hoe kan jy jou begrip verbeter? ....................................................................................... 76

3.4

Inleiding ................................................................................................................................ 76

3.5

Vertrouensintervalle ........................................................................................................... 77

3.5.1

Puntberamings en vertrouensintervalle ...................................................................... 77

3.5.2

Vertrouensinterval vir µ: bekend............................................................................... 77

3.5.3

Vertrouensinterval vir µ: bekend............................................................................... 79

3.5.4

Selfevalueringsvrae........................................................................................................ 80

3.6

Hipotesetoetsing vir een populasie.................................................................................. 81

3.6.1

Hipotesetoetsing ............................................................................................................. 81

3.6.2

Hipotesetoetsing vir ʼn populasiegemiddeld (slegs een en is bekend) ............ 83

©akademia (MSW)

Bladsy 2


GQM105 Inleiding tot elementêre kwantitatiewe metodes 3.6.3

Hipotesetoetsing vir ʼn populasiegemiddeld (slegs een en is onbekend) ....... 83

3.6.4

Hipotesetoetsing deur die p-waarde te gebruik ......................................................... 83

3.6.5

Selfevalueringsvrae........................................................................................................ 84

3.7

Samevatting ........................................................................................................................ 84

Studie-eenheid 4: Hipotesetoetsing: Deel II ........................................................ 87 4.1

Studie-eenheid leeruitkomstes ......................................................................................... 87

4.2

Voorgeskrewe handboek .................................................................................................. 87

4.3

Hoe kan jy jou begrip verbeter? ....................................................................................... 88

4.4

Inleiding ................................................................................................................................ 88

4.5

Hipotesetoets: Vergelyking van twee populasies .......................................................... 88

4.5.1

Verskil tussen die gemiddelde in onafhanklike steekproewe, σ bekend ............... 89

4.5.2

Verskil tussen twee gemiddeldes: Onafhanklike steekproewe en σ is onbekend 90

4.5.3

Die verskil tussen twee gemiddeldes: Steekproewe is nie onafhanklik nie .......... 91

4.5.4

Selfevalueringsvrae........................................................................................................ 92

4.6

Hipotesetoets: ............................................................................................................... 92

4.6.1

Die -toets ..................................................................................................................... 92

4.6.2

Selfevalueringsvrae........................................................................................................ 94

4.7

Hipotesetoets: ANOVA ...................................................................................................... 94

4.7.1

ANOVA en die F-statistiek ............................................................................................ 94

4.7.2

Selfevalueringsvrae........................................................................................................ 96

4.8

Samevatting ........................................................................................................................ 97

Afrikaans/Engelse terme ........................................................................................... 98

©akademia (MSW)

Bladsy 3


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Programoorsig BCom Ondernemingsbestuur Eerste Jaar

Ondernemingsbestuur I GBM105

Bedryfsetiek GBE105

Bedryfskommunikasie GBC105

Inleiding tot elementêre kwantitatiewe metodes GQM105

Inleiding tot Bedryfsinligtingstelsels GBI105

Studie-eenheid 1: Inleiding tot Ondernemingsbestuur

Studie-eenheid 1: Die etiese dimensie van sake

Studie-eenheid 1: Grondbeginsels van bedryfskommunikasie

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Studie-eenheid 2: Die nuwe sakeonderneming

Studie-eenheid 2: Teorieë oor etiek en sake

Studie-eenheid 2: Verbale kommunikasie in die werksplek

Studie-eenheid 3: Algemene bestuursbeginsels

Studie-eenheid 3: Etiek in die sakeomgewing

Studie-eenheid 3: Interne en eksterne interaksie

Studie-eenheid 4: Bestuursfunksies Deel I

Studie-eenheid 4: Etiese besluitneming in sake

Studie-eenheid 5: Bestuursfunksies Deel II

Studie-eenheid 5: Die bestuur van etiese prestasie

©akademia (MSW)

Handelsreg GCL105

Ekonomie GEC105

Studie-eenheid 1: Inleiding tot bedryfsinligtingstelsels

Studie-eenheid 1: Inleiding tot Handelsreg

Studie-eenheid 1: Mikro-ekonomie: Deel I

Studie-eenheid 2: Waarskynlikhede en steekproewe

Studie-eenheid 2: Inligtingstegnologieinfrastruktuur

Studie-eenheid 2: Algemene beginsels van Kontraktereg

Studie-eenheid 2: Mikro-ekonomie: Deel II

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing, Deel I

Studie-eenheid 3: Toepassings van bedryfsinligtingstelsels: Deel I

Studie-eenheid 3: Kontrakte

Studie-eenheid 3: Makro-ekonomie: Deel I

Studie-eenheid 4: Hipotesetoetsing, Deel II

Studie-eenheid 4: Toepassings van bedryfsinligtingstelsels: Deel II Studie-eenheid 5: Die bestuur van bedryfsinligtingstelsels

Studie-eenheid 4: Ander aspekte van Handelsreg

Studie-eenheid 4: Makro-ekonomie: Deel II

Studie-eenheid 5: Makro-ekonomie: Deel III

Bladsy 4


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Inleiding Elementêre kwantitatiewe metodes behels ʼn aantal statistiese tegnieke wat die interpretasie van ʼn verskeidenheid data vergemaklik. Die tipes en volumes van data wat deur organisasies versamel word, maak dit soms moeilik of onmoontlik om hierdie data deur blote observasies te interpreteer. ʼn Verskeidenheid statistieke en statistiese berekeninge maak hierdie interpretasie moontlik en makliker. Hierdie vak word hoofsaaklik in vier afdelings verdeel. Eerstens, word ʼn inleiding verskaf oor die aard van, en behoefte aan, statistiese berekeninge. Wanneer data versamel word, moet die aard van die data op ʼn beskrywende manier voorgestel word. Hierdie statistieke, wat beide grafieke en numeriese berekeninge insluit, word beskrywende statistiek genoem. Studie-eenheid 1 bespreek onderskeidelik die grafiese en numeriese voorstelling van data. Die derde afdeling verskaf ʼn grondslag vir inferensiële of afleidende statistiek (inferential statistics) – die berekeninge wat gebruik word om ʼn kleiner groep data (steekproef) op ʼn groter groep (populasie) van toepassing te maak. Waarskynlikhede, waarskynlikheidsverspreidings, en steekproewe en steekproefverspreidings word in Studieeenheid 2 bespreek. Die laaste afdeling wat in hierdie vak behandel word, is hipotesetoetsing. Hier word sekere stellings oor eienskappe van die populasie (of populasies) statisties getoets. Studie-eenheid 3 verskaf ʼn grondslag vir hipotesetoetsing. Die wyse waarop ʼn hipotese, wat met ʼn enkele populasiegemiddeld te make het, getoets word, word ook hier bespreek. Studie-eenheid 4 bou hierop voort deur ander gevalle van hipotesetoetsing te bespreek. Dit sluit, onder andere, hipotesetoetsing ten opsigte van gemiddelde oor twee of meer populasies in. Voorgeskrewe handboek Vir hierdie vak is die volgende handboek voorgeskryf: Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta. Die gedeeltes wat betrekking het op die inhoud van die studie-eenhede sal telkens aangedui word. Die gids sal jou dan deur die handboek begelei en poog om moeilike gedeeltes toe te lig; om aan te vul waar nodig en om die belangrike gedeeltes uit te wys. Vir eksamendoeleindes moet jy dus die voorgeskrewe gedeeltes in die handboek, asook hierdie begeleidingsgids bestudeer.

©akademia (MSW)

Bladsy 5


GQM105 Inleiding tot elementêre kwantitatiewe metodes Aanbevole bron English – Afrikaans Glossary Of Statistical Terms, Editors: Faans Steyn, Chris Smit, Corna Vorster, July 2009. http://www.sastat.org.za/sites/default/files/documents/files/Eng_Afr_fin.pdf http://www.sastat.org.za/sites/default/files/documents/files/Afr_Eng_fin.pdf (Hierdie bronne is aanlyn beskikbaar en verskaf Afrikaanse vertalings vir Engelse statistiese terme en selfs eenvoudige definisies. Dit is ʼn baie handige bron wanneer ʼn mens twyfel oor die korrekte vertaling, konteks en betekenis.)

Vakleeruitkomste Kennis en begrip Na voltooiing van die vak INLEIDING TOT ELEMENTÊRE KWANTITATIEWE METODES sal jy in staat wees om jou kennis en begrip te demonstreer van: •

Numeriese en grafiese beskrywende statistiek

Waarskynlikhede en waarskynlikheidsverspreidings

Steekproewe en steekproefverspreidings

Vertrouensintervalle

Hipotesetoetsing

Vaardighede Jy sal ook in staat wees om: •

Data grafies voor te stel

Data deur middel van basiese numeriese beskrywende statistiek voor te stel

Basiese waarskynlikheidsberekeninge te doen

Vertrouensintervalle op te stel

ʼn Verskeidenheid tipes hipoteses te toets

©akademia (MSW)

Bladsy 6


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Woordomskrywing vir evaluering In die afdeling oor selfevaluering, asook in die werkopdragte sal daar van jou verwag word om sekere take te verrig. Dit is belangrik dat jy presies weet wat van jou verwag word. Die woordelys hieronder sal jou hiermee help. Werkwoord Wanneer daar van jou

Omskrywing Moet jy die volgende doen:

verwag word om te: Lys

Lys die name/items wat bymekaar hoort

Identifiseer

Eien (ken uit) en selekteer die regte antwoorde

Verduidelik

Ondersoek die moontlikhede, oorweeg en skryf dan jou antwoord (verklaring/verduideliking) neer

Beskryf

Omskryf die konsep of woorde duidelik

Kategoriseer/

Bepaal tot watter klas, groep, afdeling bepaalde

klassifiseer

items/voorwerpe behoort

Analiseer

Om iets te ontleed

Evalueer

Bepaal die waarde van ʼn stelling/stelsel/beleid/ens

Toepas

Pas die teoretiese beginsels toe in ʼn praktiese probleem

Hersien

Evalueer, verbeter en/of wysig ʼn beleid/dokument/stelsel/ens

©akademia (MSW)

Bladsy 7


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Notas

Šakademia (MSW)

Bladsy 8


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

1.1

Studie-eenheid leeruitkomstes

Kennis en begrip Na voltooiing van Studie-eenheid 1 sal jy in staat wees om jou kennis en begrip te demonstreer van die volgende: •

Basiese statistiese begrippe

Grafiese beskrywende statistiek

Numeriese beskrywende statistiek

Vaardighede Jy sal ook in staat wees om: •

basiese statistiese begrippe te omskryf.

ʼn keuse tussen ʼn verskeidenheid grafieke en tabelle te maak om verskillende data grafiese voor te stel.

verskillende numeriese beskrywende statistieke te bereken.

ʼn keuse tussen ʼn verskeidenheid numeriese beskrywende statistieke te maak om data voor te stel.

1.2

Voorgeskrewe handboek

Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Cape Town. Vir die doeleindes van hierdie studie-eenheid moet jy die volgende afdelings bestudeer: Hoofstuk 1, Paragraaf 1.1 – 1.11 Hoofstuk 2, Paragraaf 2.1 – 2.7, 2.9 Hoofstuk 3, Paragraaf 3.1 – 3.7, 3.9

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 9


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.3

Hoe kan jy jou begrip verbeter?

Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord

Omskrywing

Afleidende statistiek

Statistieke wat gebruik word om gevolgtrekkings ten opsigte van elemente in die populasie te maak.

Beskrywende

Grafieke en numeriese waardes wat die data wat versamel is

statistiek

beskryf. Dit word gedoen voordat enige afleidings gemaak word.

Data

Die fisiese waardes (getalle) wat aan ʼn veranderlike toegeken word.

Diskrete data

Data wat slegs uit heelgetalle bestaan. (Daar is dus geen waardes tussen byvoorbeeld 1 en 2 nie)

Ewekansige

Enige eienskap van ʼn populasie wat van belang is, wat

veranderlike

versamel en geanaliseer word.

Kolomgrafiek

ʼn Grafiek wat frekwensies per kategorie voorstel.

Kontinue data

Data wat uit reële getalle bestaan. Daar is dus, byvoorbeeld, ʼn oneindige hoeveelheid waardes tussen 1 en 2 (bv. 1.0001).

Kumulatiewe

ʼn Grafiek van ʼn kumulatiewe frekwensieverspreiding.

frekwensieveelhoek Meervoudige

ʼn Kolomgrafiek wat twee kategorieë (in plaas van een) se

kolomgrafiek

frekwensies voorstel, byvoorbeeld ouderdomme vir mans en vroue.

Reikwydte

Die verskil tussen die maksimum en minimum waardes in ʼn steekproef.

Sirkelgrafiek

ʼn Grafiek wat verskillende proporsies van ʼn geheel (100%) voorstel.

Steekproef

ʼn Kleiner groep wat vanuit ʼn populasie verkry word. Eienskappe van die steekproef kan gemeet word en word gebruik om gevolgtrekkings van dieselfde eienskappe van die populasie te maak.

©akademia (MSW)

Bladsy 10


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.4

Inleiding

Statistiek behels die verwerking van data na inligting deur middel van wiskundige berekeninge. Om statistiek moontlik te maak, moet data kwantitatief (numeries) wees of gekwantifiseer (na getalle omgeskakel) word. Hierdie studie-eenheid verskaf ʼn inleiding tot Statistiek, en bespreek die verskillende aspekte van beskrywende statistiek. Daar word na twee tipes beskrywende statistiek gekyk: grafies en numeries. Die doel van beskrywende statistiek is om ʼn oorsig oor die data te gee. (Daarna kan afleidende statistiek toegepas word, om sekere afleidings van ʼn groter groep, of populasie, te maak.) Wat tabelle en grafieke betref, word daar eerstens gekyk na die grafiese voorstelling van kategoriese data waar slegs een veranderlike betrokke is. Dan word datastelle met meer as een veranderlike ondersoek. In die tweede plek word daar na numeriese data gekyk. Weer eens word die verskillende wyses waarop een, en dan twee, veranderlikes voorgestel kan word, bespreek. Hoofstuk 2 en 3 in die handboek bestaan uit ʼn verskeidenheid hulpmiddels. Dit is die statistikus se taak om te bepaal watter van hierdie hulpmiddels die beste gepas sal wees vir ʼn spesifieke situasie. Die figuur hieronder (Figuur 1.1) stel die uitleg van Hoofstuk 2 en 3 grafies voor. Statistiek

Beskrywend

Afleidend

Tabelle en grafieke (Hoofstuk 2)

Kategoriese data (2.2)

Numeriese data (2.3)

Die Pareto kurwe

Numeries (Hoofstuk 3)

Excel

Sentrale neiging (3.2)

Een veranderlike

Een veranderlike

Nie-sentrale neiging

Twee veranderlikes

Twee veranderlikes

Verspreiding

Skeefheid

Houer-enstipping

Figuur 1. 1: Oorsig oor Hoofstuk 2 en 3 (Bron: Wegner, 2013: 26 – 100) Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 11


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.5

Basiese begrippe en beginsels van statistiek

Bestudeer die handboek: Hoofstuk 1, paragraaf 1.1 – 1.11. Hoofstuk 1 in die handboek is nie ʼn lang hoofstuk nie. Dit mag die verkeerdelike indruk skep dat hierdie hoofstuk nie belangrik is nie. Niks kan egter verder van die waarheid af wees nie. Die belangrikste kernbegrippe word in hierdie hoofstuk bespreek. ʼn Student wat nie deeglik bewus is van die inhoud van hierdie hoofstuk nie, sal die res van die handboek uiters uitdagend vind. Die doel van hierdie begeleidingsgids is nie om die handboek te herhaal nie. Dus sal daar nie ʼn definisie en beskrywing van elke begrip in die handboek verskaf word nie. Sommige van die begrippe sal egter in meer detail beskryf word. 1.5.1

Wat is statistiek?

Bestudeer die handboek: Paragraaf 1.1 tot 1.5 Om hierdie te vraag te beantwoord is dit belangrik om eers na die definisies in paragraaf 1.1 in die handboek te kyk. Daar word onderskei tussen terme soos bestuursbesluitneming, inligting, data en statistiek. Data het nie enige waarde, indien dit nie na inligting verwerk word nie. Statistiek is een van die stel hulpmiddels wat hier verwerking nodig maak. Statistiek het te make met kwantitatiewe data, met ander woorde, data wat in syfers omgeskakel is. In die meeste gevalle word data waarop statistiese berekeninge uitgevoer moet word, van die begin af as data versamel. Voorbeeld Kyk na die volgende vrae. Watter van hierdie vrae versamel statistiese data? •

Hoe voel jy oor die e-tolstelsel?

Hoe oud is jy (in jare)?

Wat was die punt wat jy vir Statistiek behaal het?

Op ʼn skaal van 1 tot 10, dui aan hoe tevrede jy met die dosent is.

Al die bogenoemde vrae, behalwe die eerste een, versamel kwantitatiewe data. Dit is egter moontlik om, deur ʼn verskeidenheid tegnieke, data wat nie kwantitatief is nie, in getalle om te skakel. Daar word verwys na die kwantifisering van kwalitatiewe data. Hierdie is ʼn omvattende proses wat nie in hierdie vak bespreek sal word nie.

©akademia (MSW)

Bladsy 12


GQM105 Inleiding tot elementêre kwantitatiewe metodes Paragraaf 1.2 in die handboek beskryf die taal van Statistiek. Die volgende voorbeeld sal poog om elk van hierdie terme te illustreer: Voorbeeld Daar is 30 000 werknemers by Maatskappy X. Ek wil graag weet hoe gereeld hierdie werknemers by restaurante eet, maar hierdie data is nie beskikbaar nie. Ek besluit om die werknemers hieroor uit te vra. Omdat ek nie die tyd en geld het om al 30 000 werknemers te vra nie, kies ek ʼn kleiner groep van 1 000 werknemers uit die groter groep. Ek kies hierdie groep sodat hulle so ver as moontlik verteenwoordigend van die 30 000 is. Ek vra elk van hierdie werknemers hoeveel keer per jaar hy/sy by ʼn restaurant uiteet. Ek kry ʼn gemiddeld van 14.75 keer per jaar. •

Ewekansige veranderlike (random variable): Die hoeveelheid keer wat ʼn werknemer in Maatskappy X per jaar by ʼn restaurant eet, in hierdie geval 14.75.

Data: Die 1 000 antwoorde wat ek versamel het.

Populasie (population): Die totale hoeveelheid individue waarvoor ek afleidings wil maak, gebaseer of my statistiese analise (die 30 000 werknemers). Belangrik: Die steekproef moet altyd uit die populasie saamgestel word. Ek kon dus nie my 1 000 werknemers vanaf ʼn ander onderneming as Maatskappy X gevind het nie.

Populasie parameter (population parametre): Die spesifieke eienskap van die populasie wat ek wil meet, in hierdie geval die gemiddelde hoeveelheid kere wat ʼn werknemer (van die 30 000) uiteet in ʼn jaar.

Steekproef (sample): Die 1 000 werknemers (nie hul antwoorde nie) wat verteenwoordigend van die volledige groep werknemers (30 000) behoort te wees.

Steekproef-eenheid (Sampling unit): Elkeen van hierdie werknemers wat in die steekproef voorkom, is ʼn steekproef-eenheid.

Steekproef statistiek (sample statistic): Omdat ek nie die data vir al die werknemers in die populasie kan meet nie, moet ek ʼn statistiek in die steekproef gebruik om die soortgelyke statistiek in die populasie te skat. Dus is die gemiddelde hoeveelheid kere wat werknemers in die steekproef uiteet, my steekproef statistiek.

Grootte (N en n). Die grootte van die steekproef (n) was 1 000. Die grootte van die populasie (N) is 30 000.

Proporsie (p). Die steekproef se proporsie van die populasie, was 0.033

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 13


GQM105 Inleiding tot elementêre kwantitatiewe metodes (1 000/30 000). Vir nog voorbeelde, sien gerus Tabel 1.1 in die handboek. Statistiek behels ʼn verskeidenheid berekeninge. Om ʼn som te doen en die woorde "gemiddelde hoeveelheid keer wat ʼn werknemer in die steekproef by ʼn restaurant eet" te gebruik, sal hierdie somme bemoeilik. Vir hierdie rede word daar standaardsimbole gebruik om sekere veranderlikes voor te stel. Vir ʼn gemiddeld word, byvoorbeeld, µ en x̄ (vir die populasie- en steekproefgemiddelde, onderskeidelik) gebruik. Waarom verskillende simbole vir populasie- en steekproefstatistieke? Die steekproefstatistiek sal in die meeste gevalle die enigste statistiek wees wat bereken gaan word. As die statistikus nie foute maak nie, is hierdie statistiek 100% akkuraat. Die steekproefstatistiek word egter slegs gebruik om die ooreenkomstige populasiestatistiek te beraam. Daarom is dit belangrik dat daar onderskei word tussen die statistiek wat bereken is (steekproef) en die statistiek wat beraam word (in die populasie). Sien Tabel 1.2 in die handboek vir die simbole wat gebruik word vir die belangrikste statistieke. Die name van hierdie statistieke word in Figuur 1.2 hieronder opgesom: Gemiddeld •(Mean) Standaardafwyking •(Standard deviation) Variansie •(Variance) Grootte •van steekproef of populasie, met ander woorde, hoeveel mense (of objekte) was in die steekproef of populasie? Proporsie •(Proportion) Korrelasie •(Correlation) Figuur 1. 2: Belangrike statistieke (Bron: Aangepas uit Wegner, 2013:6) Paragraaf 1.3 in die handboek beskryf ʼn paar belangrike komponente van statistiek wat die grondslag vorm vir die wyse waarop die res van die handboek gestruktureer is. Hierdie studie-eenheid sal beskrywende statistiek (descriptive statistics) bespreek. Enige

©akademia (MSW)

Bladsy 14


GQM105 Inleiding tot elementêre kwantitatiewe metodes kwantitatiewe studie sal gewoonlik begin deur die data te beskryf (sonder om gevolgtrekkings te maak). Hierdie beskrywings kan in die vorm van grafieke wees, maar sal tipies ʼn aantal statistieke (soos gemiddelde en standaardafwykings) ook insluit. Daarna word sekere afleidings ten opsigte van die resultate gemaak. Hierdie afleidings word inferensiële/afleidende statistiek (inferential statistics) genoem. Figuur 1.2 in die handboek demonstreer hoe die populasie, steekproef, statistieke en statistiese modellering bymekaar pas. Paragraaf 1.5 in die handboek verskaf ʼn oorsig waar statistiek in die sakewêreld gebruik kan word. Hierdie lys is natuurlik nie volledige nie. Statistiek kan op ʼn verskeidenheid wyses in verskillende kontekste toegepas word. 1.5.2

Data

Bestudeer die handboek: Paragraaf 1.5 – 1.11 Statistiek is gebaseer op data. As hierdie data van swak kwaliteit is (byvoorbeeld as gevolg van foute met die versameling), maak dit nie saak hoe goed die kwaliteit van die statistiese ontleding is nie. Die inligting wat verkry word, sal foutief wees. Beskou weer die voorbeeld van Maatskappy X in paragraaf 1.5.1 hierbo genoem. Daar is gevind dat die gemiddelde werknemer 14.75 per jaar by restaurante eet. Gestel nou dat die vraag nie ʼn tydsperiode (in hierdie geval die afgelope jaar) gespesifiseer het nie. Sommige respondente mag antwoord hoeveel keer hul per week, dag of maand uiteet. Die inligting sal steeds foutief wees, ongeag hoe akkuraat die gemiddeld bereken is. ʼn Goeie navorser sal dus twee belangrike aspekte in ag moet neem: •

Hoe kan die kwaliteit van data verseker word?

Wat is die beste statistiese metode om gevolgtrekkings oor die populasie te kan maak?

Eienskappe van data Elke statistiese metode (byvoorbeeld die berekening van ʼn gemiddeld) het ʼn aantal voorwaardes wat nagekom moet word voordat die metode gebruik kan word. Die belangrikste voorwaardes hou gewoonlik verband met die aard van die data. Dit is belangrik om te onderskei tussen die aard van data en meetskale (of vlakke) van data. Eersgenoemde beskryf slegs sekere eienskappe van die data, terwyl laasgenoemde verband hou met die wyse waarop data versamel word. Beide bogenoemde word, vir meer duidelikheid, in Figuur 1.3 beskryf.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 15


Kwalitatief vs Kwantitatief Diskreet vs kontinue data

Vlakke

Eienskappe

GQM105 Inleiding tot elementêre kwantitatiewe metodes

Nominaal Ordinaal Interval Ratio

Figuur 1. 3: Eienskappe en vlakke van data (Bron: Wegner, 2013: 10 – 11) Soos reeds genoem, kan kwalitatiewe data op ʼn kwantitatiewe wyse gemeet word. Kyk byvoorbeeld na die volgende vraag: "Wat is jou gunsteling restaurant?". Hoe sal ʼn mens ʼn antwoord op hierdie vraag kan kwantifiseer? Hoe doen ʼn mens somme met "Spur" en "Dros"? Die antwoord lê in die gebruik van nominale veranderlikes. Elke restaurant kry ʼn nommer, byvoorbeeld: •

Spur = 1

Dros = 2

Bessie se kombuis = 3

Uit die aard van die saak is hierdie data baie beperk. ʼn Mens kan nie ʼn gemiddelde uitwerk nie (Wat beteken ʼn 2.6 in hierdie geval?). Dit is egter moontlik om uit te vind wat die gemiddelde ouderdom is van respondente wat Spur besoek, teenoor die ouderdom van respondente wat ander restaurante besoek. Dus kan hierdie kategorieë gebruik word vir statistiese berekeninge. Die statistiese metodes wat met hierdie tipe data gebruik kan word, is egter beperk. Sien Figuur 1.4 vir meer inligting oor die data tipes/vlakke. Dit is belangrik om hierdie vlakke te verstaan, omdat dit in die meeste gevalle sal bepaal watter statistiese toets gebruik kan word.

©akademia (MSW)

Bladsy 16


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Nominale data •Gewoonlike slegs kategorieë •Bv. manlike en vroulik

Ordinale data •Die spesifeke getalle stel nie slegs kategorieë voor nie, maar het ʼn waarde, bv. 1 is groter as 2 •Bv. maatskappygrootte (mikro, klein, medium, groot)

Interval data •Gewoonlik gebruik met vrae wat skale (rating scales) bevat. •Die afstand tussen verskillende opsies is ewe groot.

Ratio data •Die data is kontinu. Daar is dus enige hoeveelheid data wat tussen twee waardes voorkom. •Bv. salaris (tussen R1 000 en R2000 in onbeperkte hoeveelheid antwoorde).

Figuur 1. 4: Vlakke van data (Bron: Wegner, 2013: 10 – 11) Paragraaf 1.8 in die handboek beskryf die bronne waar data vandaan gekry kan word, terwyl paragraaf 1.9 in die handboek beskryf hoe hierdie data versamel moet word. Die handboek beskryf slegs drie vorme van dataversameling – daar is meer. Hierdie drie metodes is egter van groot belang en voldoende vir die doel van hierdie vak. 1.5.3

Selfevalueringsvrae

Voltooi al die oefeninge aan die einde van Hoofstuk 1 in die handboek. Die antwoord op hierdie vrae is aan die einde van die handboek. Dit is belangrik dat jy nie na die antwoorde kyk voordat jy die vrae heeltemal voltooi het nie, selfs al sukkel jy om ʼn vraag te voltooi. Belangrik: Moenie met Hoofstuk 2 begin voordat jy Hoofstuk 1 ten volle verstaan nie. Indien daar enige begrippe is wat vir jou onduidelik is, kontak jou dosent om te verseker dat jy oor die nodige grondslag beskik om die res van die handboek te kan baasraak. 1.6

Beskrywende statistiek

Bestudeer die handboek: Hoofstuk 2, paragraaf 2.1 – 2.7, 2.9. As gevolg van die groot verskeidenheid berekeninge wat gedoen moet word, gaan die uitleg van hierdie begeleidingsgids verskil van ander begeleidingsgidse in hierdie program. Die doel van ʼn begeleidingsgids is nie om bloot inligting in die handboek te herhaal nie, maar om dit te vereenvoudig en meer verteerbaar vir die student te maak. In hoofstukke (soos Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 17


GQM105 Inleiding tot elementêre kwantitatiewe metodes Hoofstuk 2), waar ʼn verskeidenheid statistieke en grafieke bespreek word, sal die begeleidingsgids poog om ʼn opsomming van elke statistiek (of grafiek) te verskaf. Vrae soos die volgende sal beantwoord word: •

Waarvoor word die statistiek (of grafiek) gebruik?

Hoe word die statistiek bereken (of grafiek) opgestel?

Hoe word die resultate (of grafiek) geïnterpreteer.

Dit is dus belangrik om te onthou dat die begeleidingsgids nie die handboek vervang nie, maar bloot aanvul. 1.6.1

Grafiese beskrywende statistiek vir kategoriese data

Bestudeer die handboek: Paragraaf 2.2 In paragraaf 1.6 is die verskillende tipes data beskryf. Nominale data is gewoonlik kategories van aard. Die voorbeeld van die gunsteling restaurante behels kategoriese data. Kategoriese data kan grafies op die volgende wyses voorgestel word: Kategoriese frekwensietabel Hierdie tabel dui aan hoeveel keer elke kategorie deur respondente genoem is. ʼn Voorbeeld word in Figuur 1.5 voorgestel. Gunsteling

Telling (count)

Persentasie

Spur

370

37%

Dros

250

25%

Bessie se

380

38%

1000

100%

restaurant

kombuis

Figuur 1. 5: Voorbeeld van ʼn frekwensietabel Kolomgrafiek (bar chart) Hierdie grafiek stel frekwensies (bv. hoeveel keer ʼn restaurant as gunsteling genoem is) grafies voor.

©akademia (MSW)

Bladsy 18


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1. 6: ʼn Kolomgrafiek Sirkelgrafiek (pie chart) Hierdie grafiek word gebruik om die proporsie van elke kategorie as deel van alle respondente te vertoon. Figuur 1.7 verskaf ʼn voorbeeld.

Figuur 1. 7: ʼn Sirkelgrafiek Kyk ook na Voorbeeld 2.1 in die handboek. Soms is daar meer as een veranderlike wat gemeet word. In plaas van ʼn gunsteling restaurant, kan die respondente ook gevra word om hul geslag (manlik of vroulik) aan te dui. Sodoende kan daar bepaal word of die gunsteling restaurante van mans en vroue verskil. Die volgende is wyses waarop kategoriese data met meer as een veranderlikes voorgestel kan word.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 19


GQM105 Inleiding tot elementêre kwantitatiewe metodes Moenie deurmekaar raak nie: Kategorie vs. veranderlike Ons onderskei hier tussen veranderlikes en kategorieë. In die restaurant voorbeeld, is daar drie kategorieë (Spur, Dros en Bessie se kombuis), maar slegs een veranderlike (gunsteling restaurant). In die voorbeelde hieronder is daar twee veranderlikes (gunsteling restaurant en geslag), wat elk ʼn aantal kategorieë bevat: •

Veranderlike 1: Gunsteling restaurant. 3 kategorieë: o

Kategorie 1: Spur

o

Kategorie 2: Dros

o

Kategorie 3: Bessie se kombuis

Veranderlike 2: Geslag. 2 kategorieë: o

Kategorie 1: Manlik

o

Kategorie 2: Vroulik

Die veranderlike vorm dus die grondslag waarvolgens kategorieë geskep word. Kruis-tabuleringstabel (cross-tabulation table) ʼn Tabel wat beide een veranderlike se frekwensies verdeel volgens ʼn tweede veranderlike, byvoorbeeld: Geslag Restaurant

Totaal Manlik

Vroulik

Spur

250

120

370

Dros

180

70

250

Bessie se kombuis

50

330

380

Totaal

480

520

1000

Figuur 1. 8: ʼn Kruis-tabuleringstabel

©akademia (MSW)

Bladsy 20


GQM105 Inleiding tot elementêre kwantitatiewe metodes Uit bogenoemde is dit duidelik: •

dat daar meer vroulike (n=520) respondente as manlike (n=480) respondente was.

dat daar meer manlike respondente was wat van Spur en Dros gehou het, as vroulike respondente (250 en 180 vs. 120 en 70).

dat die vroulike respondente meer van Bessie se kombuis hou as mans, asook dat vroulike respondente se gunsteling restaurant oor die algemeen Bessie se kombuis is.

Stapel-kolomgrafiek (Stacked bar chart) Hierdie grafiek is soortgelyk aan ʼn gewone kolomgrafiek, hoewel die frekwensies van ʼn spesifieke kategorie verdeel word volgens die proporsie van ʼn tweede veranderlike. Kyk na die voorbeeld in Figuur 1.9.

Figuur 1. 9: ʼn Stapel-kolomgrafiek

Meervoudige kolomgrafiek (multiple bar chart) Hierdie grafiek is soortgelyk aan die stapel-kolomgrafiek, maar die waardes vir beide kategorieë word langs mekaar vertoon (in plaas van binne-in dieselfde kolom). Figuur 1.10 verskaf ʼn voorbeeld:

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 21


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1. 10: ʼn Meervoudige kolomgrafiek Sien ook Voorbeeld 2.2 in die handboek vir meer inligting. 1.6.2

Grafiese voorstelling van numeriese data: Een veranderlike

Bestudeer die handboek: Paragraaf 2.3 Paragraaf 1.6.1 hierbo het kategoriese data bespreek. Kategoriese data is gewoonlik kwalitatiewe data wat gekwantifiseer word deur dit in kategorieë te plaas. Hierdie paragraaf bespreek nou numeriese data (ordinaal, interval en ratio) en die wyses waarop dit grafies voorgestel kan word. Hierdie grafiese voorstelling behels grafieke en tabelle. Een numeriese veranderlike Vir die doel van hierdie paragraaf, sal die volgende voorbeeld gebruik word. Die volgende inligting word van Maatskappy X verkry: •

Die ouderdom van 1 000 van hul werknemers uit ʼn ewekansige steekproef. Die hoogste ouderdom is 67 en die jongste is 18.

Numeriese frekwensieverspreiding Hierdie verspreiding deel alle data in intervalle op. Dan word bepaal hoeveel van alle waardes in elke interval aangetref word. Hierdie is dus ʼn poging om iets soos ratio-data na kategoriese data om te skakel. Waarom sal ʼn mens dit wil doen? In hierdie geval is die doel bloot om data beter te vertoon. Om hierdie verspreiding te bepaal, moet die volgende eers verkry word:

©akademia (MSW)

Bladsy 22


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

Reikwydte (range): hoogste waarde - laagste waarde (dus 67 - 18 = 49).

Interval wydte. Eerstens, moet op die hoeveelheid intervalle besluit word. Daarna moet die grootte van elke interval bepaal word. Gestel dus ons wil 5 intervalle hê. Die berekening is dan soos volg:

o

Reikwydte/hoeveelheid intervalle

o

= 49/5

o

= 9.8 ≈ 10

o

Elke interval sal dus 10 jaar groot wees

Verdeel nou alle data (die 1 000 ouderdomme) in hierdie groepe op. Dit is belangrik dat ʼn enkele respondent se ouderdom slegs in een kategorie ingedeel word. Figuur 1.11 stel hierdie verdeling grafies voor: Interval (10 jaar)

Frekwensies (Hoeveel respondente val in die kategorie?)

18 – 27

400

28 – 37

290

38 – 47

190

48 – 57

90

58 – 69

30

Totaal

1000

Figuur 1. 11: Numeriese frekwensieverspreiding

Histogram ʼn Histogram is ʼn grafiese voorstelling van bogenoemde numeriese frekwensieverspreiding en lyk soos ʼn kolomgrafiek. Figuur 1.12 stel ʼn histogram vir bogenoemde data voor.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 23


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1. 12: ʼn Histogram Interpretasie: Uit hierdie histogram is dit duidelik dat Maatskappy X se menslike hulpbronne uit jonger personeel bestaan. Hoe hoër die ouderdom is, hoe minder personeel val in daardie kategorie. (Hierdie gevolgtrekking kan natuurlik slegs gemaak word, indien die 1 000 personeel wat ondersoek is, verteenwoordigend is van die totale personeelkorps van Maatskappy X.) Kumulatiewe frekwensieverspreiding Die kumulatiewe frekwensieverspreiding is ʼn tabel wat presies dieselfde is as die gewone numeriese frekwensieverspreiding. ʼn Bykomende kolom word egter bygesit om die totale frekwensies vir ʼn kategorie, plus die frekwensies van alle kategorieë wat sodanige kategorie voorafgaan, te vertoon. Kyk na Figuur 1.13 hieronder vir meer duidelikheid (die laaste kolom met beskrywings is nie deel van hierdie tabel nie – dit is slegs in hierdie figuur ingevoeg ter verduideliking): Interval

Frekwensies

Kumulatiewe

(Notas ter

(10 jaar)

(Hoeveel respondente

frekwensie

verduideliking)

val in die kategorie?) 18 – 27

400

400

28 – 37

290

690

©akademia (MSW)

400+290

Bladsy 24


GQM105 Inleiding tot elementêre kwantitatiewe metodes

38 – 47

190

880

400+290+190

48 – 57

90

970

400+290+190+90

58 – 69

30

1000

400+290+190+90+30

Totaal

1000 Figuur 1. 13: Kumulatiewe frekwensieverspreiding

Die laaste kumulatiewe frekwensie sal altyd n wees. Met ander woorde, dit sal altyd dieselfde wees as al die frekwensies saamgevoeg. (Onthou, n stel die grootte van die steekproef voor, met ander woorde, die hoeveelheid mense van Maatskappy X wat ons vraag beantwoord het.) Kumulatiewe frekwensieveelhoek ʼn Kumulatiewe frekwensieveelhoek (Ogive) is die grafiese voorstelling van ʼn kumulatiewe frekwensietabel. Dit is ʼn lyngrafiek. Figuur 1.14 stel hierdie veelhoek vir bogenoemde data voor:

Figuur 1. 14: ʼn Kumulatiewe frekwensieveelhoek om kumulatiewe frekwensies grafies voor te stel Sien ook Voorbeeld 2.5 in die handboek vir meer inligting.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 25


GQM105 Inleiding tot elementêre kwantitatiewe metodes Houer-en-punt-stipping-grafiek (Box plot) Die houer-en-stipping-grafiek word in Hoofstuk 3 in die handboek in meer detail behandel. Hierdie grafiek vertoon die minimum- en maksimumwaardes, asook ʼn verskeidenheid waardes wat tussen die minimum en maksimum voorkom. Voorbeelde sluit in die mediaan, gemiddelde en kwantiele (sal later behandel word). 1.6.3

Grafiese voorstelling van numeriese data: Twee veranderlikes

Bestudeer die handboek: Paragraaf 2.3 (vervolg) Vir gevalle waar twee veranderlikes gemeet word, sal die volgende voorbeeld gebruik word: Maatskappy A wil ʼn ouderdomsprofiel van hul kliënte opstel. Hulle wil sien wat die ouderdomme van hul kliënte is (Veranderlike 1), maar ook hoeveel geld hul kliënte per besoek aan die winkel spandeer (Veranderlike 2). Beide hierdie data is ratio data. Spreidingstipping Hierdie grafiek (scatter plot) plaas elke respondent se antwoord op beide vrae as ʼn enkele kolletjie op ʼn grafiek. Gestel Maatskappy A het die twee vrae (1. Hou oud is jy?, 2. Hoeveel geld spandeer jy op ʼn keer by die winkel?) vir vyftien respondente gevra. Die antwoorde word in die tabel hieronder opgesom: Respondent nommer

Ouderdom

Hoeveel geld spandeer

1

18

350

2

70

150

3

24

500

4

29

1500

5

27

1000

6

34

1700

7

43

2500

8

40

2000

©akademia (MSW)

Bladsy 26


GQM105 Inleiding tot elementêre kwantitatiewe metodes

9

19

400

10

21

450

11

65

130

12

60

170

13

20

410

14

70

50

15

38

3000

Figuur 1. 15: ʼn Puntediagram Let daarop dat die hoogste waardes tussen ongeveer 35 en 45 gevind word. Tendensgrafiek (Trendline) Hierdie grafiek stel tipies verandering oor tyd voor. Die horisontale as stel tyd voor en die vertikale as stel ʼn tweede veranderlike voor. Figuur 1.16 stel die verkope van produkte by Maatskappy A oor ʼn tydperk van 12 maande voor.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 27


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1. 16: ʼn Lyngrafiek wat ʼn tendens voorstel Lorenz-kurwe Die Lorenz-kurwe vergelyk twee veranderlikes se kumulatiewe frekwensies met mekaar. Die doel is om te bepaal watter persentasie van een veranderlike, verantwoordelik is vir watter persentasie van ʼn ander veranderlike. Beskou die volgende voorbeeld: ʼn Spesifieke land het ʼn bevolking van 10 miljoen mense. Van hierdie 10 miljoen betaal slegs 3.5 miljoen belasting. Die totale belasting wat ingesamel word, is US$ 100 000 miljoen. Die volgende tabel dui aan hoeveel van 3.5 miljoen belastingbetalers sekere persentasies van die totale belasting betaal: Hoeveelheid

Hoeveelheid mense in hierdie

Geld wat betaal word deur hierdie

belasting:

kategorie

kategorie

Kategorie

n

0 – $5 000 $5 001 –

% van totale belastingbetalers

Kumulatiewe %

$

% van totale inkomste

Kumulatiewe %

1 495 000

43%

43%

1 500 000

15%

15%

700 000

20%

63%

2 000 000

20%

35%

600 000

17%

80%

2 000 000

20%

55%

$10 000 $10 001 – $15 000

©akademia (MSW)

Bladsy 28


GQM105 Inleiding tot elementêre kwantitatiewe metodes

$15 001 –

400 000

11%

91%

2 500 000

25%

80%

250 000

7%

98%

1 000 000

10%

90%

55 000

2%

100%

1 000 000

10%

100%

10 000 000

100%

$20 000 $20 001 – $25 000 $25 001 – $25 000 TOTAAL

3 500 000

100%

Let op die volgende: •

Ons maak die aanname dat niemand meer as $25 000 aan belasting betaal het nie.

Elke kategorie is presies ewe groot ten opsigte van die bogrens en ondergrens (bv. $0 en $5 000.

As die hoeveelheid mense wat belasting betaal in verhouding is tot die hoeveelheid belasting wat deur elke kategorie betaal word, sal die Lorenz-kurwe ʼn reguit lyn gewees het. Hoe verder die kurwe egter van ʼn reguitlyn afwyk, hoe groter is die verskil tussen die hoeveelheid mense in ʼn kategorie en die hoeveelheid geld wat deur die kategorie bygedra word. In Figuur 1.17 kan gesien word dat die twee kumulatiewe waardes nie proporsioneel is nie. Die boonste lyn is die reguitlyn, terwyl die onderste grafiek die Lorenz-kurwe voorstel.

Figuur 1. 17: Die Lorenz-kurwe en ʼn reguitlyn

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 29


GQM105 Inleiding tot elementêre kwantitatiewe metodes 1.6.4

Pareto se kurwe

Bestudeer die handboek: Paragraaf 2.4 Pareto se kurwe is ʼn grafiese voorstelling wat veral nuttig is om vrae ten opsigte van kwaliteitskontrole te beantwoord. ʼn Tipiese vraag wat hierdie kurwe sal probeer antwoord is: "Uit 25 moontlike redes vir ʼn spesifieke probleem, wat is die drie mees algemene redes?" Pareto se reël veronderstel dat die 80% kleiner probleme onderskei moet word van die 20% kritieke probleme. Daar word van ʼn histogram/kolomgrafiek gebruik gemaak om hierdie kurwe te skep. Bestudeer paragraaf 2.4 in die handboek om Pareto se kurwe beter te verstaan en toe te pas. Werk veral deur Voorbeeld 2.9 in die handboek. 1.6.5

Excel

Bestudeer die handboek: Paragraaf 2.5. Aan die einde van elke hoofstuk is daar ʼn geleentheid vir die student om die teorie in Microsoft Excel toe te pas. Hierdie toepassings is veral belangrik vir die werkopdragte, omdat moontlike groot hoeveelhede data gebruik kan word. Dit is dus belangrik dat die student kennis dra van Excel en alle berekeninge (en grafieke) wat in Excel gedoen moet word. 1.6.6

Selfevalueringsvrae: Hoofstuk 2

Daar is 24 vrae aan die einde van Hoofstuk 2. Voltooi al hierdie vrae. ʼn Groot hoeveelheid van hierdie vrae moet in Microsoft Excel gedoen word. Die CD met hierdie data word in die agterkant van die handboek verskaf. 1.7

Numeriese beskrywende statistiek

Bestudeer die handboek: Paragraaf 3.1 – 3.7, 3.9. Hoewel grafieke en tabelle ʼn goeie oorsig oor data kan gee, kan statistiese waardes meer spesifieke beskrywings verskaf. Hierdie statistieke fokus veral op lokaliteit, spreiding en vorm van data. Daar word na ʼn aantal statistieke in elk van hierdie drie kategorieë gekyk. 1.7.1

Maatstawwe van lokaliteit

Bestudeer die handboek: Paragraaf 3.2. Maatstawwe van lokaliteit (measures of central tendency) verskaf ʼn aanduiding van watter waarde “tipies” of “in die middel” van alle waardes is. Die bekendste voorbeeld van ʼn

©akademia (MSW)

Bladsy 30


GQM105 Inleiding tot elementêre kwantitatiewe metodes maatstaf van lokaliteit, is wat in die algemene taal bekend staan as die “gemiddeld”. In Statistiek word daar verwys na die rekenkundige gemiddeld. Rekenkundige gemiddeld Hierdie statistiek, vir die steekproef voorgestel deur x̄ , word bepaal deur al die numeriese waardes bymekaar te tel, en dan te deel deur die hoeveelheid waardes. Die formule is in die handboek aangeteken as Formule 3.1 in Paragraaf 3.2 en kan opgesom word soos volg: x̄ = die som van alle observasies (waardes)/hoeveelheid observasies (waardes) Voorbeeld Die ouderdomme van 10 werknemers by Maatskappy X is: 18, 20, 32, 26, 70, 55, 34, 43, 53, 31 Die gemiddelde ouderdom is: (18 + 20 + 32 + 26 + 70 + 55 + 34 + 43 + 53 + 31)/10 = 382/10 = 38.2 jaar Doen Voorbeeld 3.1 in die handboek om te verseker dat jy die rekenkundige gemiddeld verstaan. Mediaan Die tweede maatstaf van lokaliteit, is die mediaan. Om die mediaan te bereken, moet alle waardes van kleinste na grootste sorteer word. Die getal wat presies in die middel is, word die mediaan genoem. As daar twee getalle in die middel is, word die rekenkundige gemiddeld van die twee getalle in die middel bereken om die mediaan te verkry. Daar is nie ʼn formule in die handboek vir die mediaan nie. Voorbeeld 1: Die ouderdomme van 11 werknemers by Maatskappy A is: 18, 20, 32, 26, 70, 55, 34, 43, 53, 31, 22 Bereken die mediaan: Stap 1: Sorteer die waardes van klein na groot: 18 20 22 26 31 32 34 43 53 55 70

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 31


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Stap 2: Vind die waarde in die middel 18 20 22 26 31 32 34 43 53 55 70 Die mediaan is dus 32

Voorbeeld 2: Die ouderdomme van 10 werknemers by Maatskappy A is: 18, 20, 32, 26, 70, 55, 34, 43, 53, 31 Bereken die mediaan: Stap 1: Sorteer die waardes van klein na groot 18 20 26 31 32 34 43 53 55 70 Stap 2: Vind die middelste waarde Omdat daar 10 waardes is, is daar nie ʼn enkele middelste waarde nie. Die middelste waardes is 32 en 34. Die rekenkundige gemiddeld moet dus van hierdie twee waardes bereken word: Mediaan

= (32 + 34)/2 33

Doen nou Voorbeeld 3.2 (a) en (b) in die handboek. Mediaan vir kategorieë of gegroepeerde waardes ʼn Mediaan kan ook vir kategorieë bereken word deur Formule 3.2 in die handboek te gebruik. Voorbeeld Interval

Frekwensies

(10 jaar)

Kumulatiewe frekwensie

18 – 27

400

400

28 – 37

290

690

38 – 47

190

880

©akademia (MSW)

Bladsy 32


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

48 – 57

90

970

58 – 69

30

1000

Totaal

1000

Bereken die mediaan vir bogenoemde waardes. In hierdie geval is dit moeiliker omdat dit baie tyd sal neem om ʼn duisend waardes van klein na groot te rangskik. Om die mediaan te vind, moet die volgende stappe gevolg word: Stap 1: Vind die posisie van die mediaan. Soos reeds gesê is die mediaan presies in die middel van alle waardes, indien die waardes sorteer is. Dus is die mediaan by posisie: 1 000/2 = 500 Met ander woorde, as al 1 000 waardes van klein na groot rangskik is, sal die 500ste waarde die mediaan wees. Stap 2: Deur na die kumulatiewe frekwensie-kolom te kyk, bepaal in watter kategorie die 500ste waarde sal voorkom. Die eerste kategorie eindig by die 400ste waarde, die tweede kategorie eindig by die 690ste waarde. Die 500ste waarde sal dus êrens in die tweede kategorie (28 – 37) voorkom. Stap 3: Gebruik die formule om die presiese plek te bepaal:

Me = Ome +

[ ]

•

Ome = 28 jaar

•

c = die grootte van die interval = 10 jaar

•

n = steekproefgrootte = 1 000

•

Fme = frekwensie van mediaan interval = 290

•

f(<) = kumulatiewe frekwensie van die interval voor die mediaaninterval = 400

Dus is: Me

= 28 +

[ ]

= 31.44 Doen nou Voorbeeld 3.3 in die handboek.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 33


GQM105 Inleiding tot elementêre kwantitatiewe metodes Modus ʼn Derde maatstaf van lokaliteit is die modus. Die modus is die enkele waarde wat die meeste kere voorkom. Hierdie maatstaf is veral nuttig vir kategoriese data. Vir kategoriese data kan die modus bereken word deur eenvoudig die frekwensies van elke kategorie met mekaar te vergelyk. Voorbeeld:

Restaurant

Frekwensies

Spur

370

Dros

250

Bessie se kombuis

380

Totaal

1000

Bereken die modus. Deur bloot na die bogenoemde tabel te kyk, is dit duidelik dat Bessie se kombuis die gewildste is. Dus is die modus "Bessie se kombuis". In hierdie geval is die modus nie ʼn getal nie, maar ʼn kategorie. Met ratio data kan dit egter gebeur dat daar uit ʼn 1 000 waardes nie een waarde is wat tweemaal herhaal word nie. Dink byvoorbeeld aan die pryse van kruideniersware. In so ʼn geval sal ʼn modus niksseggend wees. (As die bedrag van R25.88 drie keer genoem is, maar die bedrae R70.55, R70.56, R70.10, R70.80 en R70.00 ook voorkom, is die modus van R25.88 dan werklik akkuraat?) Vir hierdie doel word die modus geskat deur al die data in intervalle in te deel. Daarna word die interval met die voorafgaande en opeenvolgende interval vergelyk om ʼn modus te bepaal. Voorbeeld Nota: Hierdie tabel is effens aangepas vir hierdie oefening en is dus nie dieselfde as die tabel wat vir vorige voorbeelde gebruik is nie. Interval

Frekwensies

(10 jaar) 18 – 27

©akademia (MSW)

Kumulatiewe frekwensie

290

290

Bladsy 34


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

28 – 37

400

690

38 – 47

190

880

48 – 57

90

970

58 – 69

30

1000

Totaal

1000

Bereken die modus. In hierdie geval is die doelwit om te bepaal watter ouderdom die meeste voorkom. Die interval met die meeste frekwensies is 28 – 37 (met 400 van alle respondente wat in hierdie kategorie val). Hierdie is dus die modale interval. Beskou nou die formule in die handboek (Formule 3.3). Die waardes in die formule kan soos volg vervang word: •

Omo = onderste grens van die modale interval = 28 jaar

•

c = wydte van die modale interval = 10 jaar

•

fm = frekwensie van die modale interval = 400 respondente

•

fm-1 = frekwensie wat die modale interval voorafgaan = 290 respondente (dit sou nul gewees het indien die modale interval ook die eerste interval was)

•

fm+1 = frekwensie wat na die modale interval voorkom = 190 (dit sou nul gewees het indien die modale interval die laaste interval was).

M0

= 28 + = 28 +

[ ]

= 28 + 3.44 = 31.44 Dus is die modus 31.44, wat beteken dat die meeste respondente se ouderdom benader kan word na 31.44. Hoe toets ek of my antwoord korrek is? Wat ook al die modus is, dit moet steeds in die modale interval wees. As die modus wat bereken is, dus minder as 28 was of meer as 37, was die antwoord verkeerd.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 35


GQM105 Inleiding tot elementêre kwantitatiewe metodes Doen nou Voorbeeld 3.4 in die handboek. Meetkundige gemiddeld Die meetkundige gemiddeld word gebruik om die gemiddelde persentasie verandering in data te bepaal. Die formule word as Formule 3.4 in die handboek gegee. Voorbeeld Die prys van motors by ʼn spesifieke handelaar het vir die laaste vyf jaar jaarliks gestyg. Die tabel hieronder stel die persentasieverhogings per jaar voor. 2013

5%

2012

4%

2011

8%

2010

3%

2009

2%

2008

1%

Bereken die meetkundige gemiddeld van die persentasieverhogings. Die formule is reeds in die handboek gegee en die waardes kan soos volg uiteengesit word: •

n = 6 jaar

x1, x2, x3, x4, x5 en x6 = 5%, 4%, 8%, 3%, 2%, en 1% onderskeidelik. Vir die doel van hierdie formule, word die persentasie egter anders uitgedruk. ʼn 5% verhoging is eintlik 1.05 keer die vorige jaar se bedrag. Dus word 5% as 1.05 uitgedruk.

Dus GM

!

= √ . . . . . . !

= √ ! =1.034

≈ 3.4%

Waarom kan ons nie die rekenkundige gemiddeld gebruik nie? Persentasieverhogings behels ʼn faktor waarmee ʼn bedrag (of ander waarde) vermenigvuldig moet word, in die voorbeeld hierbo was dit 1.05 in die eerste jaar. Ons wil dus ʼn gemiddelde faktor bereken waarmee ʼn bedrag jaarliks vermenigvuldig moet word om dieselfde verhoging oor die ses jaar periode te verkry. Vir hierdie rede is die meetkundige gemiddeld

©akademia (MSW)

Bladsy 36


GQM105 Inleiding tot elementêre kwantitatiewe metodes meer akkuraat om gemiddelde persentasieverhogings te bepaal. Die rekenkundige gemiddeld sal egter nuttig wees om die gemiddelde randwaarde van die rente/opbrengs te bepaal. Hierdie stelling kan met die volgende voorbeeld gedemonstreer word: ʼn Bedrag van R100 word belê: •

Jaar 1 verdien die bedrag 10% rente. Dus is die rente R10 en die bedrag is R110.

Jaar 2 verdien die bedrag (nou R110) 5% rente. Dus is die rente R5.50 en die bedrag is R115.50

Jaar 3 verdien die bedrag (nou R115.50) 3% rente. Dus is die rente R3.47 en die bedrag is R118.97.

Die meetkundige gemiddeld van die persentasieverhogings van die bedrag is 1.06 (dus 6%). Die rekenkundige gemiddeld van die rente is (10 + 5.50 + 3.47)/3 = R6.32 Dus is die gemiddelde jaarlikse styging 6% (R100 x 1.06) en die gemiddelde jaarlikse rente (in randwaarde) is R6.32. (Nota: In hierdie geval is dit toevallig dat die meetkundige gemiddeld en rekenkundige gemiddeld vir die data dieselfde is. Dit is egter ʼn uitsondering. Die meetkundige gemiddeld is altyd groter of dieselfde as die rekenkundige gemiddeld) Doen nou Voorbeeld 3.5 in die handboek. Geweegde rekenkundige gemiddeld Kyk na die volgende voorbeeld: ʼn Restaurant-eienaar wil graag weet wat die gemiddelde koste per kilogram meel is. Hy het 80kg meel in die vorige maand gekoop. Die meel is by verskillende verskaffers gekoop. Die strokies dui op die volgende aankope: Koste per kilogram

Kilogram

Week 1

R9.50

10

Week 2

R10.00

4

Week 3

R9.80

6

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 37


GQM105 Inleiding tot elementêre kwantitatiewe metodes Week 4

R7.40

60

Totaal

R36.7

80kg

Wat is gemiddelde koste per kilogram? As die rekenkundige gemiddeld gebruik sou word, sou dit maklik wees om die vier weke se koste per kilogram bymekaar te tel en deur 4 te deel. Die antwoord sal egter nie so akkuraat wees nie. Week 4 se bedrag behoort meer gewig te dra, omdat die eienaar meer meel teen daardie prys gekoop het. In ʼn geval waar al die waardes nie dieselfde gewig dra nie, word die geweegde rekenkundige gemiddeld gebruik. Elke waarde word met sy gewig vermenigvuldig, bymekaar getel en dan deur die som van die gewigte (in hierdie geval die totale kilogram) gedeel. Vir ʼn beter illustrasie sal die rekenkundige gemiddeld en geweegde rekenkundige gemiddeld met mekaar vergelyk word: Rekenkundige gemiddeld = (9.50 + 10.00 + 9.80 + 7.40) / 4 = R9.18 per kilogram Volgens die rekenkundige gemiddeld het die eienaar gemiddeld R9.18 per kilogram meel betaal. Geweegde rekenkundige gemiddeld = [(9.50 x 10) + (10.00 x 4) + (9.80 x 6) + (7.40 x 60)] / 80 = R7.97 per kilogram. Omdat die hoeveelheid kilogram wat teen elke prys aangekoop is, ook nou in ag geneem is, verskil die gemiddelde koste per kilogram drasties. In werklikheid het die eienaar dus gemiddeld R7.97 per kilogram betaal. Doen nou Voorbeeld 3.6 in die handboek. 1.7.2

Nie-sentrale maatstawwe van lokaliteit

Bestudeer die handboek: Paragraaf 3.3. Die vorige maatstawwe van lokaliteit was gemoeid met een of ander "middelpunt" of sentrale punt. Daar is egter maatstawwe van lokaliteit wat nie met die middelpunt van data te make het nie. Hierdie maatstawwe is kwantiele en persentiele. Kwantiele Kwantiele is maatstawwe wat geordende data in vier ewe groot dele (kwarte) deel. Die statistikus moet die spesifieke waardes bepaal wat sorg dat daar ewe veel waardes in elke kwantiel is. Daar kan tussen die volgende kwantiele onderskei word:

©akademia (MSW)

Bladsy 38


GQM105 Inleiding tot elementêre kwantitatiewe metodes Q1: Hierdie is die spesifieke waarde wat skeiding maak tussen die laagste 25% van

alle waarnemings/observasies en die oorblywende 75%. Q2: Hierdie is die waarde wat presies in die middel van die waardes voorkom en dus

die data presies in die helfte deel. (Dit is dus die mediaan van die data.) Q3: Hierdie is die waarde wat die boonste 25% van alle waarnemings skei van die

oorblywende 75%. Om ʼn kwantiel te bepaal is eintlik eenvoudig. Die stappe is soos volg: •

Sorteer die waardes van klein na groot.

Bepaal hoeveel waarnemings/observasie (getalle) in die datastel voorkom.

Tel 1 by hierdie getal en deel dit deur 4.

Die antwoord is die posisie van Q1 (afgerond na die naaste heelgetal).

Die formule vir die eerste kwantiel is dus (n+1) / 4, waar n = die hoeveelheid observasies.

Die posisies van die drie kwantiele is dan: •

Q1= (n+1)/4

Q2 = (n+1)/2 (Dit is ook die posisie van die mediaan)

Q3 = (n+1)/4x3

As hierdie posisie gevind is (en afgerond is tot die naaste heelgetal), kan die spesifieke waarde wat by elke kwantiel voorkom, bloot afgelees word. Soms wil ʼn mens egter ʼn meer akkurate kwantiel bereken. Voorbeeld Beskou die volgende data. Die boonste ry verteenwoordig die waardes van die data. Die onderste ry dui die plekke van die data aan. 10 30 34 39 40 45 50 67 70 78 79 80 90 92 95 96 97 98 99 99 1

2

3

4

5

6

7

8

9

10 11 12 13 14 15 16 17 18 19 20

Die eerste kwantiel se posisie is by (n+1) / 4 = 21/4 = 5.25

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 39


GQM105 Inleiding tot elementêre kwantitatiewe metodes As die breuk geïgnoreer word, is die posisie 5. Die waarde wat by posisie 5 voorkom, is 40. Hierdie is dus ʼn benaderde waarde van die eerste kwantiel. Om ʼn meer akkurate waarde te bepaal, kan Formule 3.6 in die handboek gebruik word met die volgende waardes: •

Benaderde kwantielwaarde (hierbo bereken) = 40

Breukdeel van kwantielposisie (dus breukdeel van 5.25) = 0.25

Waarde na kwantielposisie = waarde by posisie 6 = 45

Kwantielwaarde

= 40 + 0.25 x (4 - 40) = 40 + 1.25 = 41.25

Dus: 25% van alle waardes is kleiner of gelyk aan 41.25. (Nota: Vir die benaderde posisie in bogenoemde formule, word die posisie nie afgerond nie, maar die breuk word bloot verwyder.) Doen self: •

Bereken nou die boonste kwantiel (Q3) van die data hierbo genoem. (Die antwoord is 95.75.)

Doen nou Voorbeeld 3.7 in die handboek.

Soos met die mediaan, is die volledige data nie altyd beskikbaar nie, maar slegs kategorieë. Die formule om die mediaan te bereken, is aangepas om die kwantiele ook te bereken. Hierdie formule word in die handboek verskaf as Formules 3.7 en 3.8 vir die eerste en derde kwantiel onderskeidelik. Maak seker dat jy hierdie formules verstaan.

Doen nou Voorbeeld 3.8 in die handboek.

Persentiele ʼn Persentiel is soortgelyk aan ʼn kwantiel. Waar kwantiele die data in kwarte deel, sal persentiele die data in 100 gelyke dele deel. Die 25e en 75e persentiele is dus dieselfde as die eerste en derde kwantiele. Die 50e persentiel is dan ook dieselfde as die 2e kwantiel, wat gelyk is aan die mediaan. Om die persentiele te bereken, is soortgelyk aan die formules vir kwantiele. Om die posisie van die xe persentiel te bereken, word die volgende formule gebruik:

©akademia (MSW)

Bladsy 40


GQM105 Inleiding tot elementêre kwantitatiewe metodes + # Die waarde van die persentiel word dan op dieselfde manier bereken as die kwantiele. 1.7.3

Maatstawwe van spreiding

Bestudeer die handboek: Paragraaf 3.4 Gestel ʼn bemarkingsagentskap wil ʼn advertensie-veldtog loods wat spesifiek op ʼn sekere ouderdomsgroep gefokus is. In ʼn steekproef word die volgende ouderdomme gevind: 14

15

16

13

90

95

Die rekenkundige gemiddeld van hierdie ouderdomme is 40.5. As die agentskap egter hul advertensieveldtog rig op mense wat 40 jaar oud is, sal dit ʼn mislukking wees. (Daar is nie een kliënt in bogenoemde steekproef wat naby aan 40 jaar oud is nie.) Daar het dus ʼn behoefte ontstaan om die akkuraatheid van die rekenkundige gemiddeld te bepaal. Met ander woorde, daar moet bepaal word op watter wyse al die verskillende waardes rondom die gemiddeld versprei is. Die statistieke wat hiervoor gebruik word, word die maatstawwe van spreiding genoem. Die reikwydte Die reikwydte is reeds vroeër bespreek. Hierdie statistiek bepaal bloot hoe ver die grootste en kleinste waardes van mekaar is. Voorbeeld Bereken die reikwydte van die volgende getalle: 14

15

16

13

90

95

Die formule vir die reikwydte word as Formule 3.9 in die handboek weergegee:

xmax = die kleinste waarde = 13 xmin = die grootste waarde = 95 Die reikwydte is dus: 95 – 13 = 82. Hierdie groot reikwydte behoort al reeds ʼn aanduiding te gee dat die gemiddeld deur groot verskille in die waardes beïnvloed kan word. (As die reikwydte, byvoorbeeld, 2 of 3 was, sou die gemiddeld moontlik baie meer akkuraat gewees het). Die reikwydte word egter deur uitskieters beïnvloed. Daarom word meer akkurate maatstawwe van spreiding benodig.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 41


GQM105 Inleiding tot elementêre kwantitatiewe metodes Doen Voorbeeld 3.9 in die handboek. Variansie en standaardafwyking Variansie en standaardafwyking word hier saam bespreek omdat die standaardafwyking bloot die vierkantswortel van die variansie is: Variansie se simbool is s2 en standaardafwyking is s. (Hierdie is die simbole vir die standaardafwyking en variansie van die steekproef. Ooreenkomstige simbole vir die populasie se standaardafwyking en variansie is $ en $ ) Die formule om die variansie te bereken word as Formule 3.10 in die handboek verskaf. Hierdie formule mag intimiderend lyk. Dit is egter heel eenvoudig. Kyk weer na die verskillende ouderdomme. 14

15

16

13

90

95

Die getalle, asook die rekenkundige gemiddeld van 40.5, word op die getallelyn hieronder aangedui.

Volg die volgende stappe: •

Vir elke waarde: o

Bereken hoe ver hierdie waarde van die gemiddeld af is: (xi - x̄ )

o

Kwadreer hierdie antwoord (om van moontlik negatiewe getalle ontslae te raak). Wat beteken die Σ-teken? Alles aan die regterkant van die Σ moet bymekaar getel word.

Tel nou al hierdie gekwadreerde afstande bymekaar en deel dit deur die n-1. (Onthou, n is die hoeveelheid waardes wat geobserveer is.)

Vir bogenoemde geval, sal die stappe dus soos volg uitgevoer word: Die gemiddeld is 40.5. Begin eers deur die boonste gedeelte van die breuk (in Formule 3.10 in die handboek) te bereken. % #& − #̄ = (14 - 40.5) 2 + (15 - 40.5) 2 + (16 - 40.5) 2 + (13 - 40.5) 2 + (90 - 40.5) 2 + (95 - 40.5) 2 = (-26.5) 2 + (-25.5) 2 + (-24.5) 2 + (-27.5) 2 + (49.5)2 + (54.5) 2

©akademia (MSW)

Bladsy 42


GQM105 Inleiding tot elementêre kwantitatiewe metodes = 702.25 + 650.25 + 600.25 + 756.25 + 2450.25 + 2970.25 = 8 129.50 Hierdie getal word dan deur n-1 gedeel, n-1 = 6-1 = 5. Dus 8 129.50 5 = 1 625.9 Dus is s2 = 1 625.9 Wat beteken hierdie getal? Die variansie is nie in dieselfde eenheid (jare) as wat die data is nie en is dus moeilik om te interpreteer. Om hierdie rede word die vierkantswortel van die variansie verkry. Hierdie statistiek, s, staan bekend as die standaardafwyking en word in dieselfde eenheid gemeet as die oorspronklike data. s=

√/

1

= √1 625.9 = 40.32 jaar. Wat beteken ʼn standaardafwyking van 40.32 jaar? Dit beteken dat die gemiddelde afstand tussen elke waarde en die rekenkundige gemiddeld, 40.32 is: •

Hoe groter hierdie getal is, hoe verder is die waardes van die gemiddeld versprei.

Daar kan dus gesê word dat bogenoemde gemiddeld nie baie "akkuraat" is as aanduiding van alle waardes nie.

As die standaardafwyking vir die ouderdomme, byvoorbeeld, 2 of 3 jaar was, kon daar met redelike sekerheid gesê word dat die meeste ouderdomme baie naby aan die gemiddeld is. Die advertensieveldtog kan dus met meer sekerheid op die gemiddelde ouderdom gefokus word.

Doen nou Voorbeeld 3.10 en 3.11 in die handboek. Dit is nie op hierdie stadium belangrik om Figuur 3.3 in die handboek (die normaal-kromme) te verstaan nie. Wanneer hipotesetoetsing later bespreek word, sal daar weer na hierdie kromme gekyk word. Wat egter belangrik is, is om te besef dat die rekenkundige gemiddeld (x̄ ) en die standaardafwyking (s) ʼn belangrike rol hier speel.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 43


GQM105 Inleiding tot elementêre kwantitatiewe metodes Variansiekoëffisiënt In hierdie stadium weet ons dat, vir die ouderdomme wat hierbo genoem is, ʼn standaardafwyking van 40.32 baie groot is en dat die data nie rondom die gemiddeld van 40.5 gesentreer is nie. Die besluit of die standaardafwyking "groot" of "klein" is, is egter subjektief in hierdie geval. Voorbeeld Datastel A het ʼn gemiddeld van 40.5 en ʼn standaardafwyking van 40.32. Datastel B het ʼn gemiddeld van 13 598 en ʼn standaardafwyking van 1 250. Watter standaardafwyking is die "grootste"? Dit is duidelik dat 1 250 ʼn groter getal as 40.32 is, maar die gemiddeld moet altyd in ag geneem word as die standaardafwyking geïnterpreteer word. Om hierdie rede is die variansiekoëffisiënt (CV) geskep. Die formule word as Formule 3.13 in die handboek weergegee. In eenvoudige terme is: CV = s / x̄ Vir datastel A (en ook die ouderdomsvoorbeeld) is: CV

= 40.32 / 40.5 = 0.996

Vir datastel B is: CV

= 1 250 / 13 598 = 0.092

Hoe groter die CV is, hoe groter is die standaardafwyking ten opsigte van die gemiddeld en hoe minder "akkuraat" is die rekenkundige gemiddeld. Die tweede datastel se gemiddeld is dus ʼn baie beter aanduiding van die gemiddelde waarde as die eerste datastel. Doen nou Voorbeeld 3.12 in die handboek. 1.7.4

Maatstawwe van skeefheid

Bestudeer die handboek: Paragraaf 3.5 – 3.6. Die wyse waarop data rondom die gemiddeld versprei is, kan grafies en numeries voorgestel word. ʼn Histogram met relatiewe klein intervalle, kan hierdie data grafies voorstel. Daar word onderskei tussen drie wyses waarop data rondom die gemiddeld versprei word: Simmetrie Die waardes word simmetries rondom die gemiddeld versprei. Dit beteken dat die frekwensies van waardes aan die linkerkant en die frekwensies van waardes aan die ©akademia (MSW)

Bladsy 44


GQM105 Inleiding tot elementêre kwantitatiewe metodes regterkant ooreenstem. Figuur 1.18 hieronder is ʼn voorbeeld van ʼn simmetriese verdeling. (Die handboek gebruik ʼn lyngrafiek om hierdie verdelings voor te stel. Vir alle verdere verduidelikings sal die lyngrafieke gebruik word).

Figuur 1. 18: ʼn Simmetriese verdeling van data In bogenoemde grafiek is die rekenkundige gemiddeld, die mediaan en die modus dieselfde getal wees. Positiewe skeefheid Die waardes met die grootste frekwensies sal na die linkerkant van die gemiddeld neig. Die "stert" gedeelte is dus aan die regterkant. Figuur 1.19 stel ʼn dataverspreiding voor wat positief skeef is.

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 45


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Figuur 1. 19: ʼn Datastel wat positief skeef is In bogenoemde datastel sal die mediaan kleiner as die gemiddeld wees. Die modus sal egter die kleinste getal wees (in hierdie geval 6.5). Negatief skeef In hierdie geval sal die grootste frekwensies aan die regtekant van die gemiddeld voorkom. Die waardes wat dus die meeste voorkom, sal almal groter as die gemiddeld wees. Figuur 1.20 stel ʼn datastel voor wat negatief skeef is.

Figuur 1. 20: ʼn Datastel wat negatief skeef is

©akademia (MSW)

Bladsy 46


GQM105 Inleiding tot elementêre kwantitatiewe metodes In hierdie geval sal die gemiddeld die kleinste wees, gevolg deur die mediaan en dan deur die modus. Pearson se koëffisiënt van skeefheid Hoewel data se simmetrie grafies voorgestel kan word, is dit ook moontlik om bereken te word. Hiervoor word Pearson se koëffisiënt van skeefheid (SKp) gebruik. Die formule word as Formule 3.14 in die handboek gegee. Hierdie formule kan, soos die berekening van die standaardafwyking, tydrowend wees. Om hierdie rede, is daar ʼn tweede formule gegee om as beraming van hierdie statistiek te dien. Die beraming se formule word as Formule 3.15 in die handboek gegee. Interpretasie Skp kan enige getal wees: •

As hierdie getal 0 is (met ander woorde Skp = 0), is die data simmetries om die gemiddeld versprei.

As hierdie getal groter as nul is (met ander woorde Skp > 0), is die data positief skeef.

As hierdie getal kleiner as nul is (met ander woorde Skp < 0), is die data negatief skeef.

Die grootte van die getal bepaal hoe ver die data positief of negatief skeef is. Doen Voorbeeld 3.13 in die handboek. Hierdie voorbeeld verwag van jou om: •

Skp te bereken

Skp te benader/beraam

Skp te interpreteer

Die houer-en-stipping-grafiek Die houer-en-stipping-grafiek is ʼn spesiale maatstaf wat gebruik kan word om vyf belangrike statistiese waardes grafies voor te stel. Hierdie waardes is reeds bespreek: •

Minimumwaarde

Q1 of die onderste kwantiel

Q2 of M2, die mediaan

Q3 of die boonste kwantiel

Maksimumwaarde

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 47


GQM105 Inleiding tot elementêre kwantitatiewe metodes Bestudeer Paragraaf 3.6 in die handboek om meer inligting ten opsigte van die houer-enstipping-grafiek te vind. Dit is belangrik dat ʼn houer-en-stipping-grafiek geïnterpreteer kan word. Doen nou Voorbeeld 3.14 in die handboek. 1.7.5

Keuse van statistiek en MS Excel

Bestudeer die handboek: Paragraaf 3.7 – 3.8. Wanneer word die rekenkundige gemiddeld gebruik? Wanneer is dit beter om ʼn mediaan of modus te bereken? Wanneer is ʼn reikwydte voldoende en wanneer is ʼn standaardafwyking nodig? Die keuse van die regte statistiek om te gebruik, is net so belangrik soos die korrekte berekening daarvan. Om, byvoorbeeld, ʼn rekenkundige gemiddeld vir kwantitatiewe, kategoriese data te bereken, is nutteloos en kan glad nie geïnterpreteer word nie. In so ʼn geval sal ʼn modus baie meer inligting oor die data kan weergee. Die kriteria vir, en kriteria van, beskrywende statistieke word in Paragraaf 3.7 weergegee. Al die statistieke en grafieke wat in hierdie afdeling van die studie-eenheid bespreek is, kan ook in Microsoft Excel bereken word. Dit is belangrik dat die student al hierdie statistieke met die hand kan bereken. Dit is egter handig – veral in die praktyk – vir studente om Microsoft Excel hiervoor te gebruik. Dit is egter moontlik dat die antwoorde in Excel en dié wat met die hand bereken is, effens kan verskil. Die rede is dat Excel geen waardes afrond nie. 1.7.6

Selfevaluering: Hoofstuk 3

Doen al die oefeninge aan die einde van Hoofstuk 3. Daar is 26 oefeninge. As jy hierdie vrae korrek kan beantwoord, het jy numeriese beskrywende statistiek onder die knie! 1.8

Samevatting

Statistiek is ʼn versameling beginsels en tegnieke wat gebruik kan word om data na inligting om te skakel sodat dit vir besluitneming gebruik kan word. Dit is dus belangrik dat hierdie data van hoë kwaliteit is. Data kan kwalitatief of kwantitatief wees. Kwalitatiewe data kan in woorde beskryf word, maar kan ook numeries voorgestel word. Data kan ook diskreet of kontinu wees. Die vlakke waarop data gemeet kan word, is (van die laagste na die hoogste vlak) nominaal, ordinaal, interval en ratio. Data kan, onder andere, deur observasies, vraelyste en eksperimente versamel word. Figuur 1.21 dui aan watter grafiese beskrywende statistiek in watter gevalle gebruik kan word:

©akademia (MSW)

Bladsy 48


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Grafiese beskrywende statistiek

Kategoriese data

Een veranderlike

Numeriese data

Twee veranderlikes

Een veranderlike

Kategoriese frekwensietabel

Kruistabuleringstabel

Numeriese frekwensieverspreiding

Kolomgrafiek

Gestapelde kolomgrafiek

Histogram

Sirkelgrafiek

Meervoudige kolomgrafiek

Kumulatiewe frekwensieverspreiding

Ogive

Boksplot

Scatterplot

Lyngrafiek

Lorenz-kurwe

Figuur 1. 21: Verskillende opsies beskrywende statistiek

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

Bladsy 49


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Notas

Šakademia (MSW)

Bladsy 50


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Studie-eenheid 2: Waarskynlikhede en steekproewe

2.1

Studie-eenheid leeruitkomstes

Kennis en begrip Na voltooiing van Studie-eenheid 2 sal jy in staat wees om jou kennis en begrip te demonstreer van die volgende: •

Inleiding tot waarskynlikhede

Waarskynlikheidsverspreidings

Steekproewe en steekproefverspreidings

Vaardighede Jy sal ook in staat wees om: •

tussen verskillende waarskynlikheidsbegrippe en -reëls te onderskei.

basiese waarskynlikheidsberekeninge te doen.

tussen diskrete en kontinue waarskynlikheidsverspreidings te onderskei.

die eienskappe van die normaalverdeling te identifiseer.

waarskynlikhede met die formules van waarskynlikheidsverspreidings te bereken

steekproefmetodes te evalueer en die korrekte steekproefmetode vir ʼn spesifieke situasie te kies.

2.2

ʼn normaalverdeling gebruik om ʼn steekproefverspreiding te konseptualiseer.

Voorgeskrewe handboek

Wegner, T. 2013. Applied Business Statistics. 3rd ed. Claremont: Juta. Hoofstuk 4: Paragraaf 4.1 – 4.9 Hoofstuk 5: Paragraaf 5.1 – 5.10 Hoofstuk 6: Paragraaf 6.1 – 6.4, 6.6, 6.8

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 51


GQM105 Inleiding tot elementêre kwantitatiewe metodes 2.3

Hoe kan jy jou begrip verbeter?

Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord

Omskrywing

Gesamentlik

Gebeurtenisse waarvan die waarskynlikhede, indien dit

uitputbaar

bymekaar getel word, 1 is.

Normaalverdeling

ʼn Klokvormige verdeling van waarskynlikhede. Vir ʼn standaard-normaalverdeling is die gemiddeld 0 en die standaardafwyking 1.

Onderling

Twee gebeurtenisse wat nie tegelyktydig kan plaasvind nie.

uitsluitend Samevoeging

Die waarskynlikheid dat ten minste een van twee gebeurtenisse sal plaasvind.

Snyding

Die waarskynlikheid dat twee gebeurtenisse beide sal plaasvind.

Statisties

Een gebeurtenis beïnvloed nie die waarskynlikheid dat ʼn

onafhanklik

ander gebeurtenis sal plaasvind nie.

Vlak van sekerheid

Die sekerheid waarmee die navorser ʼn gevolgtrekking oor die populasie wil maak, gebaseer op data wat deur ʼn steekproef verkry is. Die vlak van sekerheid is gewoonlik 90%, 95% of 99%.

Voorwaardelike

Die waarskynlikheid dat een gebeurtenis sal plaasvind,

waarskynlikheid

gegewe dat ʼn ander (statisties afhanklike) gebeurtenis wel plaasgevind het.

2.4

Inleiding

ʼn Navorser wil dikwels voorspellings maak: Wat is die kans dat verkope gaan toeneem? Wat is die waarskynlikheid dat die aandelemark gaan daal? Om hierdie vrae te beantwoord, moet waarskynlikhede bereken word. Praktiese voorspellings soos hierdie is egter nie die enigste rede waarom waarskynlikhede in die sillabus ingesluit is nie. Dit vorm ook die basis waarop hipotesetoetsing, ʼn onderwerp wat in Studie-eenheid 3 en 4 bespreek word, gedoen word.

©akademia (MSW)

Bladsy 52


GQM105 Inleiding tot elementêre kwantitatiewe metodes Hierdie studie-eenheid gaan ʼn agtergrond oor waarskynlikhede bied. Daar gaan gekyk word na verskillende beginsels en reëls van waarskynlikhede. Daarna gaan na spesifieke waarskynlikheidsverspreidings gekyk word. Laastens, word steekproewe in meer detail bespreek. ʼn Steekproef is ʼn kleiner versameling van elemente (mense, produkte, ensovoorts) wat uit die groter populasie geneem word. ʼn Steekproef word dan gebruik om gevolgtrekkings ten opsigte van die populasie te maak. Die rasionaal onderliggend aan die gebruik van ʼn steekproef vir hierdie gevolgtrekkings, word in hierdie studie-eenheid bespreek. 2.5

Waarskynlikhede

Bestudeer die handboek: Paragraaf 4.1 – 4.9 Waarskynlikhede vorm, tot ʼn mate, die grondslag vir statistiese afleidings. Die volgende vraag word dikwels gevra: "Met hoeveel sekerheid kan ek ʼn afleiding, ten opsigte van ʼn populasie op ʼn resultaat van ʼn steekproef, baseer?" Voorbeeld Navorsing word gedoen om werknemers van Maatskappy X se mening oor ʼn nuwe reël te toets. Omdat daar 30 000 werknemers is, word ʼn steekproef gebruik om die gevolgtrekkings te maak. Die steekproef bestaan uit 1 000 personeellede. Uit hierdie 1 000 werknemers is 60% positief oor die nuwe reël. Die vraag ontstaan nou: Met hoeveel sekerheid kan gesê word dat 60% van die 30 000 werknemers ook positief oor die nuwe reël is? Met ander woorde, met hoeveelheid sekerheid kan die 60% op die hele populasie van toepassing gemaak word? Ten opsigte van waarskynlikhede kan die vraag herfraseer word na: "Wat is die waarskynlikheid dat ek ʼn fout gaan maak, indien ek dieselfde (60%) aanname oor die populasie maak?" In die meeste gevalle probeer statistici hierdie waarskynlikheid onder 0.05 (of 5%) hou. Om hierdie vraag konsekwent te kan beantwoord, is dit belangrik om ʼn goeie agtergrond oor waarskynlikhede te verkry. 2.5.1

Basiese beginsels en konsepte van waarskynlikhede

Bestudeer die handboek: Paragraaf 4.1 – 4.4

Woord van waarskuwing: Die student word weer daaraan herinner dat die begeleidingsgids bloot ʼn hulpmiddel is

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 53


GQM105 Inleiding tot elementêre kwantitatiewe metodes om die handboek deur te werk. Dit is egter van uiterste belang om die handboek deur te werk en alles in die genoemde paragrawe te lees. Daar word onderskei tussen subjektiewe en objektiewe waarskynlikhede. Subjektiewe waarskynlikheid kan nie statisties gestaaf word nie en word nie in statistiese berekeninge gebruik nie. Byvoorbeeld, een vriend sê aan ʼn ander "daar is ʼn baie goeie waarskynlikheid dat ek aan die slaap gaan raak as ons daardie film kyk". Die kanse dat daar statistiese data bestaan vir hierdie stelling is skaars. Vir die doel van hierdie vak word na objektiewe waarskynlikheid verwys. Dit is waarskynlikhede wat deur statistiek bereken kan word. Die formule van ʼn basiese waarskynlikheid word deur Formule 4.1 in die handboek voorgestel. Doen Voorbeeld 4.1 in die handboek om te verseker dat jy die formule wel kan gebruik. ʼn Waarskynlikheid word as getal tussen 0 en 1 voorgestel (met 0 en 1 ingesluit). Hierdie waarskynlikheid kan op drie wyses bereken word. Figuur 2.1 stel hierdie wyses grafies voor:

A priori •Die uitkomste is vooraf bekend •Bv. as ʼn munt gegooi word, is dit bekend dat die uitkoms slegs een van twee kan wees. Die waarskynlikheid is dus altyd 0.5 Empiries •Die waardes van r en n is nie bekend nie (sien Formule 4.1 in die handboek), maar kan deur dataversameling wel gevind word •Bv. Voorbeeld 4.2 in die handboek Wiskundig •Deur die gebruik van sekere waarskynlikheidsverspreidings kan waarskynlikhede vir spesifieke geleenthede bepaal word. •Sien Hoofstuk 5.

Figuur 2. 1: Wyses om waarskynlikhede af te lei (Wegner, 2013:102) Waarskynlikhede het ook spesifieke eienskappe. Om hierdie eienskappe bloot te memoriseer gaan nutteloos wees. Elkeen van hierdie eienskappe maak sin. Dit help dus om hierdie eienskappe aan die hand van die voorbeelde in die handboek te leer. Hierdie eienskappe word in paragraaf 4.3 in die handboek bespreek. Die eienskappe is:

©akademia (MSW)

Bladsy 54


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

ʼn Waarskynlikheid is altyd tussen 0 en 1, met 0 en 1 ingesluit. (Bv. die waarskynlikheid dat dit volgende week gaan reën is 0.7; die waarskynlikheid dat ek die Lotto gaan wen is 0.00000002.)

Indien iets onmoontlik is, is die waarskynlikheid dat dit gaan gebeur, 0. (Bv. die waarskynlikheid dat ek vanaand op Mars gaan beland, is 0).

As iets definitief gaan gebeur, is die waarskynlikheid 1. (Bv. die waarskynlikheid dat ek eendag sal doodgaan, is 1.)

As die waarskynlikhede van alle moontlik gebeurtenisse bymekaar getel word, is die antwoord 1. (Die handboek verskaf ʼn kort voorbeeld onder paragraaf 4.3 in die handboek om hierdie reël beter te illustreer.)

Die waarskynlikheid dat iets nie gaan gebeur nie, is dieselfde as 1, minus die waarskynlikheid dat dit wel gaan gebeur.

Bestudeer hierdie eienskappe in die handboek. Maak ook seker dat jy die Wiskundige formules vir elk van hierdie reëls ken voordat jy verder gaan.

Doen nou Voorbeeld 4.2 in die handboek om te sien hoe hierdie eienskappe toegepas kan word. Paragraaf 4.4 verduidelik vyf belangrike basiese statistiese konsepte. Hierdie konsepte is afkomstig van algemene versamelingsleer (set theory). Die vyf begrippe is: •

Snyding (intersection) van gebeurtenisse (events)

Samevoeging (union) van gebeurtenisse

Onderling uitsluitend (mutually exclusive) gebeurtenisse

Gesamentlik uitputbare (Collectively exhaustive) gebeurtenisse

Statisties-onafhanklike gebeurtenisse.

Werk baie noukeurig deur Voorbeeld 4.3 in die handboek. Hierdie voorbeeld verskaf ʼn datastel waarmee elk van die bogenoemde begrippe wiskundig, sowel as grafies voorgestel word.

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 55


GQM105 Inleiding tot elementêre kwantitatiewe metodes 2.5.2

Berekening van waarskynlikhede

Bestudeer die handboek: Paragraaf 4.5 In paragraaf 4.5 word drie waarskynlikhede bereken: •

Marginale waarskynlikhede. Hierdie is die waarskynlikheid dat ʼn enkele gebeurtenis sal plaasvind. Byvoorbeeld: Die waarskynlikheid dat dit volgende week gaan reën, is 0.4. Daar is slegs een waarskynlikheid wat bereken moet word. Die formule hiervoor is reeds in die handboek as Formule 4.1 gegee. Doen Voorbeeld 4.4 (Vraag (a) en (b)) in die handboek om te verstaan hoe ʼn marginale waarskynlikheid bereken word.

Gesamentlike waarskynlikheid (joint probability). In hierdie geval word die waarskynlikheid dat twee gebeurtenisse gelyktydig plaasvind, bereken. Bv. wat is die waarskynlikheid dat dit volgende week tegelyktydig gaan reën en gaan hael? (Hierdie waarskynlikheid word ook voorgestel deur die snyding-beginsel hierbo genoem.) Nota: Hoewel die gesamentlike waarskynlikheid in die tabel verkry kon word (sien Voorbeeld 4.4), is daar ook ʼn formule om hierdie waarskynlikheid te bereken. Die gesamentlike waarskynlikheid van geleentheid A en B se formule is: P(A∩B) = P(A) x P(B) Doen Voorbeeld 4.4 (Vraag (c)) in die handboek om te verstaan hoe ʼn gesamentlike waarskynlikheid verkry kan word.

Voorwaardelike waarskynlikheid (conditional probability) is die waarskynlikheid dat ʼn spesifieke gebeurtenis (A) sal plaasvind, gegewe dat ʼn ander gebeurtenis (B) wel plaasgevind het. Dit beteken dat die feit dat B wel plaasgevind het, die steekproef in so ʼn mate verminder dat dit A se waarskynlikheid sal beïnvloed. Die formule om ʼn voorwaardelike waarskynlikheid te meet, word as Formule 4.2 in die handboek verskaf. Voorbeeld Uit ʼn groep van 100 personeellede, is 30 ingenieurs, 20 administratiewe personeel en 50 verkoopspersoneel. Uit dieselfde groep personeellede is 25 in Johannesburg,

©akademia (MSW)

Bladsy 56


GQM105 Inleiding tot elementêre kwantitatiewe metodes 50 in Pretoria en 25 in Kaapstad. Gegewe dat ʼn spesifieke personeellid in Johannesburg is, wat is die kans dat sodanige personeellid ook ʼn ingenieur is? Oplossing: Gestel A: Die personeellid is ʼn ingenieur. Gestel B: Die personeellid is in Johannesburg. Die formule vir die voorwaardelike waarskynlikheid, vereis dat P(A∩B) bereken moet word: P(A∩B) = P(A) x P(B) = 30/100 x 25/100 = 0.075 Die formule vereis ook dat P(B) bereken moet word: P(B) = 25/100 = 0.25 Vervang hierdie nou in Formule 4.2 in die handboek in: P(A/B) =

=

3 4∩5 3 5

. 67 . 7

= 0.3 Daar is dus ʼn 0.3 waarskynlikheid (of 30% kans) dat ʼn werknemer ʼn ingenieur is, as dit bekend is dat hierdie werknemer wel in Johannesburg is. Doen nou Voorbeeld 4.4 (Vraag (d)) in die handboek. Hierdie voorbeeld vereis nie van jou om P(A∩B) te bereken nie, omdat dit bloot van die tabel afgelees kan word.

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 57


GQM105 Inleiding tot elementêre kwantitatiewe metodes 2.5.3

Waarskynlikheidsreëls

Bestudeer die handboek: Paragraaf 4.6 Om P(A∪B) en P(A∩B) te bereken is nie moeilik nie. P(A∪B) Om hierdie statistiek te bereken moet die vraag gevra word: Is die gebeurtenisse onderling uitsluitend? Met ander woorde, is dit moontlik dat A en B gelyktydige kan plaasvind of nie? Indien dit nie moontlik is vir twee gebeurtenisse om tegelyk plaas te vind nie (onderling uitsluitend), dan is die formule ʼn eenvoudige optelsom: P(A∪B) = P(A) + P(B) Indien dit egter wel moontlik is dat die twee geleenthede tegelyk kan plaasvind, moet die gedeelte waar snyding plaasvind, afgetrek word. Dan is die formule: P(A∪B) = P(A) + P(B) - P(A∩B) Om laasgenoemde formule beter te verstaan, kan daar na die Venn-diagram gekyk word. Verwys na Figuur 2.2 hieronder:

Figuur 2. 2: ʼn Venn-diagram om die optelreël te verduidelik Wanneer P(A) bereken word, word die hele linkerkantste "sirkel" in berekening gebring. Wanneer P(B) bereken word, word die hele regterkantse "sirkel" in berekening gebring. Die gedeelte wat in die wit spasie in die middel lê, word dus twee keer in berekening gebring. Om te verhoed dat daardie gedeelte (wat voorgestel word deur P(A∩B)) twee keer in ag geneem word, word P(A∩B) dus weer afgetrek. Hierdie formules word as Formule 4.3 en Formule 4.4 in die handboek verskaf. Voltooi nou Voorbeeld 4.5 (Vraag (a) en (b)) in die handboek om die bogenoemde optelreëls beter te verstaan.

©akademia (MSW)

Bladsy 58


GQM105 Inleiding tot elementêre kwantitatiewe metodes P(A∩B) Die formule om hierdie waarskynlikheid te bereken, is reeds gegee. Die formule wat vroeër gegee is (naamlik P(A∩B) = P(A) x P(B)) kan slegs gebruik word, indien A en B statisties onafhanklik is. Dit beteken dat A en B mekaar nie kan beïnvloed nie. Die vermenigvuldigingsreël is dus: •

Indien A en B statisties onafhanklik is: P(A∩B) = P(A) x P(B)

Indien A en B nie statisties onafhanklik is nie: P(A∩B) = P(A/B) x P(B)

Doen nou Voorbeeld 4.5 (Vraag (c) en (d)) in die handboek om die vermenigvuldigingsreël beter te verstaan. Nog ʼn wyse om waarskynlikhede te bereken en grafies voor te stel, is deur middel van waarskynlikheidsboomdiagramme (probabilities trees).

Lees deur Paragraaf 4.7 en voltooi Voorbeeld 4.6 om waarskynlikheidsboomdiagramme te verstaan.

2.5.4

Telreëls: Permutasies en kombinasies

Bestudeer die handboek: Paragraaf 4.8 In Paragraaf 4.8 in die handboek word twee telreëls verduidelik. Die eerste behels permutasies en die tweede, kombinasies. Om die verskil tussen permutasies en kombinasies te verstaan, kan Voorbeeld 4.7 (permutasies) en Voorbeeld 4.8 (kombinasies) in die handboek voltooi word. Belangrik: Kyk ook na die formule vir n faktor (n!) verskaf as Formule 4.8 in die handboek. Die grootste verskil tussen permutasies en kombinasies, is die belangrikheid van volgorde by eersgenoemde, terwyl volgorde nie van toepassing is by laasgenoemde nie. Om hierdie verskil te verduidelik, kyk na die volgende twee datastelle: Datastel A: 2, 4, 6, 8, 10 Datastel B: 4, 6, 8, 10, 2

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 59


GQM105 Inleiding tot elementêre kwantitatiewe metodes Hierdie is twee verskillende permutasies (omdat die volgorde verskil, selfs al is die waardes dieselfde), maar slegs een kombinasie (omdat die volgorde nie saak maak nie). Permutasiereël Kyk dan na die volgende voorbeeld: ʼn Onderwyser laat tien kinders daagliks in ʼn ry staan. Om dit interessant te maak, moet die kinders elke dag ʼn nuwe volgorde vorm. Hoeveel dae gaan dit neem voordat die kinders elke moontlike volgorde gebruik het? Dag

Plek

Plek

Plek

Plek

Plek

Plek

Plek

Plek

Plek

Plek

1

2

3

4

5

6

7

8

9

10

1

Jan

Sarie

Jessy

Karin

Willem

Petra

Bossie

Barry

Rian

Juan

2

Sarrie

Jessy

Karin

Willem

Petra

Bossie

Barry

Rian

Juan

Jan

3

Jessy

Karin

Willem

Petra

Bossie

Barry

Rian

Juan

Jan

Sarie

4

...

...

...

...

...

...

...

...

...

...

n! In hierdie geval is n = 10. Dit is dus die hoeveelheid kinders wat in die ry sorteer word. Omdat daar nie ʼn subgroep van kinders uit die 10 geneem word nie, is die formule redelik eenvoudig. Die hoeveelheid permutasies (wyses waarop die kinders in die ry sorteer kan word), is n! Omdat n = 10 kinders: n!

= 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1

(Sien Formule 4.8 in die handboek)

= 3 628 800 Dus, sal die kinders meer as 3.5 miljoen dae neem om al die moontlike kombinasies op te gebruik! Gestel nou dat die onderwyser besluit om drie kinders uit die groep te kies. Een word as die klaskaptein gekies, ʼn ander word as die klassekretaris gekies en die derde word as die klastesourier gekies. Hierdie drie persone word uit 10 totale leerders gekies. Hoeveel verskillende kombinasies is moontlik?

©akademia (MSW)

Bladsy 60


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Dag

Klaskaptein

Sekretaris

Tesourier

1

Jan

Jessy

Willem

2

Jan

Jessy

Rian

3

Willem

Jessy

Rian

4

Willem

Jan

Bessie

...

...

...

...

? Omdat daar nou ʼn subset uit die groter groep leerders gekies word, word Formule 4.10 in die handboek gebruik. Die volgorde is ook belangrik (kaptein, sekretaris, tesourier), dus is dit ʼn permutasie. Die formule is: nP r

= = =

!

: ! !

! ; < <

6 = ; = 7 = = = =

= 720 Daar is dus 720 moontlike samestellings van die leierskapkomitee vir die klas van tien leerders. Doen nou Voorbeeld 4.9 om permutasies onder die knie te kry. KombinasiereÍl Waar ʼn kombinasie ter sprake is, is die volgorde nie van toepassing nie. Daar word dus meer na versamelings gekyk. Kyk weer na die klas-van-tien voorbeeld hierbo genoem: Die onderwyseres besluit om nie portefeuljes (klaskaptein, sekretaris en tesourier) aan die kinders toe te ken nie. Daar word bloot drie kinders gekies om op die komitee te dien. Daar is dus nou ʼn groep kinders (n) waaruit drie kinders gekies moet word (r). As die onderwyser elke dag ʼn ander komitee uit die tien kinders wil aanstel, hoeveel dae sal sy kan aanhou totdat alle moontlike unieke kombinasies gebruik is?

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 61


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Die volgorde waarin die kinders gekies word, is nie belangrik nie (almal se plekke op die komitee is dieselfde). Dus word daar nie van permutasies gebruik gemaak nie, maar kombinasies. Gebruik Formule 4.11 in die handboek: nCr

=

= =

!

:! : ! !

! 6! ; < <

; 7

= 120 Na 120 dae, sal die onderwyser alle moontlik kombinasies van kinders op die komitee gehad het. 2.5.5

Selfevalueringsvrae

Daar is 21 vrae aan die einde van Hoofstuk 4. Beantwoord al hierdie vrae. Dit is baie werk en gaan heelwat tyd in beslag neem, maar dit sal jou help om te verseker dat jy die werk onder die knie het. 2.6

Waarskynlikheidsverspreidings

Bestudeer die handboek: Paragraaf 5.1 tot 5.10. In Hoofstuk 4 in die handboek is waarskynlikhede bereken deur data te versamel (empiries). Waarskynlikhede kan ook wiskundig bereken word deur sogenaamde waarskynlikheidsverspreidings. Hoofstuk 5 bespreek drie verskillende waarskynlikheidsverspreidings. Die normaalverspreiding is veral belangrik, omdat hierdie verspreiding die grondslag vorm vir statistiek wat in die res van die vak bespreek word. ʼn Waarskynlikheidsverspreiding is ʼn lys van alle moontlike uitkomste van ʼn ewekansige (random) veranderlike met elk se waarskynlikhede. Byvoorbeeld, ʼn eenvoudige waarskynlikheidsverspreiding is diÊ van ʼn muntstuk wat gegooi word. Die uitkomste wanneer ʼn muntstuk gegooi word, kan kop of stert wees. Daar is dus slegs twee moontlike uitkomstes. Die waarskynlikheid van beide is 0.5. Dus sal die waarskynlikheidsverspreiding vir ʼn muntstuk wat gegooi wees, soos volg lyk:

Šakademia (MSW)

Bladsy 62


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Moontlike uitkoms

Waarskynlikheid

Kop

0.5

Stert

0.5

Tabel 2. 1: Waarskynlikheidsverspreiding vir ʼn muntstuk wat gegooi word Hierdie is natuurlik ʼn eenvoudige voorbeeld. Daar is slegs twee moontlike uitkomste. In ander gevalle kan daar meer moontlike uitkomste wees. Die uitkomste hoef ook nie noodwendig heelgetalle te behels nie. Byvoorbeeld, wanneer na salarisse verwys word, is daar ʼn sekere waarskynlikheid dat iemand R1 000.00 salaris kry. Daar is ʼn ander waarskynlikheid dat iemand R1 000.01 salaris kry en nog ʼn ander waarskynlikheid dat iemand R1 000.02 salaris kry. Laasgenoemde is ʼn tipiese voorbeeld van ʼn kontinue waarskynlikheidsverspreiding. Waarskynlikheidsverspreidings word in twee kategorieë verdeel. Hierdie kategorieë, asook die verskillende verspreidings wat in elk voorkom, word in Figuur 2.3 grafies voorgestel. (Let wel: Die paragraafnommers wat in die figuur aangedui word, verwys na die paragrawe in die handboek.)

Waarskynlikheidsverspreidings

Diskreet (par 5.3)

Binominaal (par 5.4)

Kontinue (par 5.6)

Normaal (par 5.7)

Poisson (par 5.5)

Figuur 2. 3: Kategorieë van waarskynlikheidsverspreidings (Bron: Wegner, 2013:125 – 142)

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 63


GQM105 Inleiding tot elementêre kwantitatiewe metodes 2.6.1

Diskrete waarskynlikheidsverspreidings

Bestudeer die handboek: Paragraaf 5.3 – 5.5. ʼn Diskrete veranderlike is enige veranderlike wat slegs spesifieke waardes kan aanneem. Hierdie waardes is gewoonlik heelgetalle. Waardes soos A, B, C, D en E kan egter ook as diskrete waardes gesien word. Die vraag wat gevra word om te toets of ʼn waarde diskreet is, is: "Is dit bekend watter waarde hierdie spesifieke waarde voorafgaan?". Byvoorbeeld, dit is bekend dat 4 voor 5 is, en dat 6 na 5 is (as daar van heelgetalle gepraat word). Dit is ook bekend dat C na B kom en dat D na C is (as daar van die alfabet gepraat word). Vir nog ʼn voorbeeld kan daar na Paragraaf 5.3 in die handboek verwys word. Die tweede kategorie van verspreidings, is kontinue verspreidings. In hierdie geval is daar ʼn oneindige hoeveelheid waardes tussen enige twee waardes. Byvoorbeeld, watter waarde is tussen 1 en 3 as daar na kontinue getalle verwys word? Die waarde 2 is wel tussen 1 en 3, maar die waarde 2.5 ook; en die waarde 2.501 en die waarde 2.000000015 ook. Daar is dus ʼn oneindige hoeveelheid waardes wat tussen 1 en 3 is. ʼn Beskrywing van kontinue verspreidings word in Paragraaf 5.6 in die handboek verskaf. Die diskrete waarskynlikheidsverspreidings sluit die binominale en poisson-verspreidings in. Elk word kortliks hieronder bespreek. Binominale waarskynlikheidsverspreiding Die binominale verspreiding word gebruik vir enige gebeurtenisse wat slegs een van twee uitkomste kan hê. ʼn Voorbeeld is reeds hierbo genoem: ʼn Muntstuk wat gegooi word. Die waarskynlikheid vir ʼn spesifieke uitkoms is egter nie altyd 0.5 nie. Dit mag gebeur dat die twee uitkomste se waarskynlikhede onderskeidelik 0.3 en 0.7 is. ʼn Diskrete veranderlike volg ʼn binominale verspreiding as dit aan die vereistes voldoen wat in Paragraaf 5.4 in die handboek verskaf word. Voorbeeld (Hierdie voorbeeld dien as voorbereiding vir Voorbeeld 5.1 in die handboek.) ʼn Maatskappy verhuur motors. Onder hierdie motors is Opel motors beskikbaar. Uit ondervinding weet die bestuur van die maatskappy dat 1 uit elke 4 kliënte, ʼn Opel verkies. Dus is die waarskynlikheid van ʼn “sukses” (ʼn Opel word gehuur) 0.25. (Dit word bereken deur p(sukses) = 1/4) Vraag 1: Wat is die waarskynlikheid dat ʼn enkele kliënt wat by die maatskappy instap, ʼn Opel sal verkies?

©akademia (MSW)

Bladsy 64


GQM105 Inleiding tot elementêre kwantitatiewe metodes Die antwoord op hierdie vraag is eenvoudig. Hierdie waarskynlikheid is reeds bekend en is 0.25. Vraag 2: Wat is die waarskynlikheid dat ʼn enkele kliënt wat by die maatskappy instap, nie ʼn Opel gaan kies nie? Die antwoord is weer eens redelik eenvoudig: p(mislukking) = 1 – p (sukses) = 1 - 0.25 = 0.75 Vraag 3: Wat is die waarskynlikheid dat, as vyf kliënte by die winkel instap, twee van hierdie kliënte elk ʼn Opel gaan huur? Dit is op hierdie stadium dat die antwoord nie so ooglopend is nie en ʼn formule benodig word. Hierdie formule word as Formule 5.1 in die handboek verskaf. Die formule bestaan uit ʼn aantal elemente. In hierdie geval is dit: •

n = die grootte van die steekproef (in hierdie geval kyk ons na 5 kliënte)

x = die hoeveelheid suksesvolle uitkomste (in hierdie geval, is ons op soek na die waarskynlikheid dat daar twee suksesvolle uitkomste sal wees, met ander woorde, dat twee van die vyf kliënte wel ʼn Opel sal huur)

p = die waarskynlikheid van ʼn sukses (met ander woorde, die waarskynlikheid dat een kliënt ʼn Opel sal huur)

(1-p) = die waarskynlikheid van ʼn mislukking

nCx

= Hier word ʼn kombinasie bereken. Verwys na paragraaf 2.6.4 hierbo om jou

geheue te verfris. In hierdie geval, word die kombinasie met n = 5 en x = 2 gevind, dus 5C2. Doen Voorbeeld 5.1 in die handboek. Vraag 3 hierbo is dieselfde vraag wat in Voorbeeld 5.1 in die handboek gevra word. Die inligting wat hierbo verskaf word, behoort vir jou ʼn idee te gee hoe om hierdie voorbeeld te voltooi. Hou in gedagte: •

Jy moet eers die vier voorwaardes vir ʼn binominale verspreiding toets, voordat Formule 5.1 in die handboek toegepas kan word.

ʼn Goeie idee sal wees om eers die kombinasie (nCx) te bereken en dan die res van

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 65


GQM105 Inleiding tot elementêre kwantitatiewe metodes die formule te bepaal. Uitdaging: Gestel die vraag in Voorbeeld 5.1 het gelees: Wat is die waarskynlikheid dat ten minste twee van die vyf kliënte ʼn Opel sou kies? Hoe sou ʼn mens dan te werk gaan? Die antwoord lê daarin om die vraag in diskrete eenhede op te breek. Indien ten minste twee kliënte wel ʼn Opel kies, beteken dit dat twee, drie, vier of vyf kliënte ʼn Opel kies. In hierdie geval moet die waarskynlikheid vir: •

x = 2,

x = 3,

x = 4 en

x = 5,

bereken word en bymekaar getel word. Dus: Wanneer die woorde "ten minste", "meer as", "minder as", ensovoorts gebruik word, moet die waarskynlikhede vir alle moontlike waardes van x wat aan daardie vereiste voldoen, bepaal word. Doen nou Voorbeeld 5.2 in die handboek. Hierdie voorbeeld maak gebruik van woorde soos "ten minste" of "meer as". Omdat daar met diskrete waardes gewerk word, is dit maklik om die verskillende x-waardes te bepaal. Poisson-verspreiding Die poisson-verspreiding verwys na die hoeveelheid keer wat iets binne-in ʼn spesifieke tydperk of spasie, of volume, plaasgevind het. Byvoorbeeld, die hoeveelheid kere wat ʼn masjien in ʼn agt-uurskof gebreek het. Die vraag wat dus gevra word, is soos volg: Wat is die waarskynlikheid dat iets x keer sal gebeur in ʼn spesifieke tyd, as dit bekend is dat dit gemiddeld a keer in dieselfde tydperk gebeur? Byvoorbeeld, as ʼn masjien gemiddeld vier keer per dag breek (a = 4), wat is die waarskynlikheid dat ʼn masjien drie keer per dag sal breek (x = 3, bereken p(3))? Of, wat is die waarskynlikheid dat ʼn masjien ten minste twee keer per dag sal breek (x>= 2). Of, wat is die waarskynlikheid dat ʼn masjien ten minste vier keer in ʼn twee-dag periode sal breek? Dit is belangrik dat die tydsperiode in ag geneem moet word. As a (die gemiddelde hoeveelheid kere wat die gebeurtenis plaasvind) per dag bepaal word, maar die vraag dui op ʼn tweedag-periode, moet die nodige aanpassing gedoen word. Die formule om ʼn

©akademia (MSW)

Bladsy 66


GQM105 Inleiding tot elementêre kwantitatiewe metodes waarskynlikheid in ʼn poisson-verspreiding te bepaal, word in die handboek as Formule 5.3 weergegee. Doen Voorbeeld 5.3 in die handboek. •

Vraag (a) is bloot ʼn toepassing van die formule met a = 5 en x = 3.

Vraag (b) vereis van jou om drie waarskynlikhede met die formule te bereken en bymekaar te tel. Hierdie waarskynlikhede is p(0), p(1) en p(2).

Vraag (c) is ʼn uitdaging. Hier word van jou verwag om die waarskynlikheid vir alle waardes bo 4 te bereken. Maar daar is ʼn oneindige hoeveelheid waardes bo 4! Die antwoord is eintlik eenvoudig. Ons weet dat, as al die waarskynlikhede van ʼn poisson-verspreiding bymekaar getel word, die getal 1 verkry sal word. Dus, as die waarskynlikhede van alle x-waardes van 4 en minder bereken word, en dan van 1 afgetrek word, sal die waarskynlikheid van alle x-waardes bo 4 verkry word.

Vraag (d) verander aan die tydsperiode. Dus, moet a aangepas word. Omdat a = 5 per dag, sal a = 10 vir twee dae. Verder kan die formule gewoonweg gebruik word.

Beskrywende statistiek vir poisson en binominale waarskynlikheidsverspreidings Die gemiddeld en standaardafwyking kan ook vir hierdie verspreidings bereken word. (Onthou: Die verspreiding is bloot ʼn versameling van waarskynlikhede, met ander woorde, ʼn groep getalle tussen 0 en 1). Die gemiddeld en standaardafwyking vir die binominale verspreiding word bereken deur Formule 5.2 in die handboek. Die gemiddeld en standaardafwyking vir poisson-verspreidings word verskaf in Formule 5.4 in die handboek. 2.6.2

Die normaalverdeling

Bestudeer die handboek: Paragraaf 5.6 en 5.7 Die normaalverdeling word gebruik om enige waardes (nie slegs heelgetalle nie) voor te stel. In Paragraaf 5.7 in die handboek word die eienskappe van ʼn normaalverdeling verskaf. Alle data wat versamel word, sal natuurlik nie ʼn normaalverdeling hê nie. Een datastel kan ʼn gemiddeld van 10 000 hê, terwyl ʼn ander ʼn gemiddeld van -17 kan hê (ʼn normaalverdeling se gemiddeld is 0). Die normaalverdeling vorm egter die basis. Dit is belangrik om eers te verstaan hoe die normaalverdeling werk en hoe om waarskynlikhede vanaf ʼn normaalverdeling te verkry. Daarna kan hierdie metode aangepas word vir datastelle met ander gemiddelde en standaardafwykings.

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 67


GQM105 Inleiding tot elementêre kwantitatiewe metodes Vir Voorbeeld 5.4 kan daar aangeneem word dat data perfek normaal versprei is, met ander woorde, die verdeling het ʼn gemiddeld van 0 en ʼn standaardafwyking van 1. Vanaf Voorbeeld 5.5 word die data meer realisties voorgestel. Die gemiddelde en standaardafwykings verander en daar word gekyk na wyses om steeds die waarskynlikhede te meet. ʼn Tipiese vraag wat met ʼn normaalverdeling beantwoord kan word, is: Data is normaal versprei met ʼn gemiddeld van 0 en standaardafwyking van 1. Indien ʼn spesifieke waarde ewekansig uit die data geneem word, wat is die waarskynlikheid dat hierdie waarde tussen 0 en 2.33 sal wees? Hoe om ʼn waarskynlikheid uit ʼn normaalverdeling te kry: •

Teken die normaalverdeling om ʼn beter oorsig te kry.

Maak ʼn kruisie op die x-as om vir jouself ʼn aanduiding te gee waar die spesifieke waarde sal voorkom. Merk hierdie waarde as z (met ander woorde, vir die voorbeeld hierbo genoem, sal z, 2.33 wees).

Kleur die oppervlakte tussen 0 en z in.

Bereken nou die oppervlakte.

Vind die oppervlakte Om die oppervlakte te bereken, is kompleks. Om hierdie rede is daar aan die einde van die handboek ʼn tabel opgestel met die oppervlaktes tussen 0 en ʼn groot verskeidenheid zwaardes. Om die oppervlakte in die z-tabel (Tabel 1, Aanhangsel 1 in die handboek) te vind, kan jy die volgende stappe volg: •

Neem die z-waarde (byvoorbeeld 2.35).

Soek die syfers voor die desimaal, asook die eerste syfer na die desimaal in die linkerkantste kolom van die tabel (in hierdie geval, vind 2.3).

Soek nou die tweede desimaal (in hierdie geval 0.05) in die eerste ry van die tabel.

Vind nou die plek waar hierdie ry (2.3) en kolom (0.05) kruis. Die waarde wat op daardie kruising voorkom, is die oppervlakte tussen 0 en 2.35 (in hierdie geval is dit 0.49061.

Interpretasie: Die waarskynlikheid dat ʼn waarde in ʼn normaalverdeling tussen 0 en

©akademia (MSW)

Bladsy 68


GQM105 Inleiding tot elementêre kwantitatiewe metodes 2.35 sal wees, is 0.49061 Jy kan dus bloot die z-waarde neem (Tabel 1, Aanhangsel A in die handboek) Doen nou Voorbeeld 5.4 in die handboek. Wenke: •

Vraag (a) is redelik eenvoudig en kan bloot van die tabel afgelees word.

Vraag (b) werk met ʼn negatiewe getal. Maar omdat die twee helftes van die normaalverdeling presies simmetries is, is die waarskynlikheid om ʼn getal tussen 0 en -2.3 te kry, presies dieselfde as die waarskynlikheid om ʼn getal tussen 0 en 2.3 (positief) te kry. Dus kan die oppervlakte tussen 0 en 2.3 bepaal word – dit sal presies dieselfde wees vir die oppervlakte tussen 0 en -2.3.

Vraag (c) vereis nie die oppervlakte tussen 0 en ʼn getal nie, maar van die oppervlakte aan die regterkant van ʼn getal. Dit is egter bekend dat die totale oppervlakte onder die normaalverdeling 1 is (alle moontlike waarskynlikhede) en, omdat die twee helfte simmetries is, is die oppervlakte aan die regtekant 0.5 (en die linkerkant is ook 0.5). Vir hierdie voorbeeld kan die oppervlakte tussen 0 en 1.82 bereken word, en dan afgetrek word van 0.5 om die oppervlakte aan die regterkant van 1.82 te bepaal.

Vraag (d) is nog ʼn bietjie moeiliker. Die oppervlakte tussen -2.1 en 1.32 moet bereken word. Omdat die twee helftes simmetries is, kan die oppervlakte aan die linkerkant van 0 bereken word. Dan kan die oppervlakte aan die regterkant van 0 bereken word. As die twee oppervlaktes bymekaar getel word, word die totale oppervlakte gevind.

Vraag (e) verskil van Vraag (d) omdat die oppervlakte nie aan 0 raak nie. Die oppervlakte tussen 1.24 en 2.075 moet bereken word. Hierdie oppervlakte is egter die verskil tussen twee oppervlaktes: o

0 tot 1.24 se oppervlakte en

o

0 tot 2.075 se oppervlakte

Deur hierdie twee oppervlaktes van mekaar af te trek, sal die oppervlakte tussen 1.24 en 2.075 bereken word.

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 69


GQM105 Inleiding tot elementêre kwantitatiewe metodes Belangrik: Uit hierdie voorbeeld kan gesien word hoe belangrik dit is om eers die normaalverdeling te teken voordat enige berekenings gedoen word. Gestel die gemiddeld van ʼn verspreiding getalle is 20 (en nie 0 nie) en die standaardafwyking is 4 (en nie 1 nie). Gestel ons wil weet wat die waarskynlikheid is dat ʼn waarde tussen 20 en 22 sal voorkom. Daar is nie ʼn 20 of 22 in die z-tabel nie! Die getal 20 en 22 is nie z-waardes nie, omdat die verdeling nie ʼn standaard-normaalverdeling is nie. Die voorwaarde vir ʼn standaard-normaalverdeling is ʼn gemiddeld van 0 en standaardafwyking van 1. Hoe kan ʼn mens dan die oppervlak bereken? Hoewel daar nie ʼn z-waarde gegee word nie, is dit moontlik om die z-waarde te bereken. Wanneer ʼn z-waarde bereken is, is dit maklik om die oppervlak, en dus die waarskynlikheid te bereken. Die formule vir ʼn z-waarde (as die gemiddeld en standaardafwyking nie 0 en 1 onderskeidelik is nie) word in Formule 5.6 in die handboek gegee. Lees die verduideliking direk na Voorbeeld 5.4 in die handboek. Doen dan Voorbeeld 5.5 in die handboek. Onthou, sodra die z-waarde gevind is, word die oefeninge presies dieselfde as in Voorbeeld 5.4 gedoen. Vind nou die x-waarde vir ʼn waarskynlikheid In bogenoemde voorbeelde is ʼn waarde (z of x) gegee en die waarskynlikheid (p) is bepaal deur die oppervlakte te bereken. (Met ʼn standaard-normaalverdeling is die z-waarde gebruik, maar indien die gemiddeld nie 0 is en/of die standaardafwyking nie 1 is nie, word ʼn x-waarde gegee en die z-waarde word eers bereken.) Vir die volgende voorbeelde, word die waarskynlikhede (p) gegee en daar word van jou verwag om die z-waarde of x-waarde te vind. Doen Voorbeeld 5.6 in die handboek. In hierdie voorbeeld word daar van jou verwag om die z-waarde te vind. Om dit te doen, word die oppervlakte in die z-tabel gevind, en dan word die ooreenkomstige z-waarde in die ry en kolom bloot afgelees. Om die x-waarde te vind, vereis ʼn bykomende stap. Eerstens, word die z-waarde gevind, en dan word die z-waarde, die gemiddeld en die standaardafwyking in Formule 5.6 (in die handboek) ingelees. Sodoende kan die x-waarde gevind word.

©akademia (MSW)

Bladsy 70


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Doen Voorbeeld 5.7 in die handboek. Hierdie voorbeeld is soortgelyk aan Voorbeeld 5.6, maar dit maak nie gebruik van ʼn standaard-normaalverdeling (met ʼn gemiddeld van 0 en standaardafwyking van 1) nie. 2.6.3

Selfevalueringsvrae

Daar is 26 vrae aan die einde van Hoofstuk 5 in die handboek. Doen al hierdie vrae om te verseker dat jy ʼn behoorlike grondslag het vir verdere werk wat behandel gaan word. 2.7

Steekproewe

Bestudeer die handboek: Paragraaf 6.1 – 6.4, 6.6, 6.8 Nota: Hoewel die berekening en interpretasie van steekproefproporsies ʼn baie belangrike deel van die wetenskap van Statistiek uitmaak, is dit nie in hierdie sillabus ingesluit nie. Soos reeds genoem, is dit nie altyd moontlik om ʼn spesifieke statistiek vir ʼn hele populasie te bereken nie. Om hierdie rede word ʼn steekproef geneem. Onthou dat ʼn steekproef ʼn kleiner groepering is van waardes wat uit die populasie kom. ʼn Steekproef moet ook sover as moontlik verteenwoordigend van die populasie wees. 2.7.1

Steekproefmetodes

Bestudeer die handboek: Paragraaf 6.1 – 6.2 Daar is ʼn verskeidenheid metodes waarop steekproewe gevind kan word. Die aard van die steekproefmetode het ʼn groot invloed op die wyse waarop die steekproef die populasie verteenwoordig. Ewekansige (random) steekproefmetodes lewer meer verteenwoordigende steekproewe as nie-ewekansige metodes. Ongelukkig is ewekansige steekproewe dikwels moeiliker om in die hande te kry. Die verskillende metodes word in paragraaf 6.2 in die handboek verduidelik en kortliks in Tabel 2.2 hieronder opgesom. Ewekansige steekproefneming

Nie-ewekansige steekproefneming

Elke lid van die populasie het ʼn ewe groot

Elke lid van die populasie het nie dieselfde

kans om deel van die steekproef uit te maak.

kans om deel van die steekproef uit te maak nie.

Eenvoudige ewekansige streekproefneming

Geriefsteekproefneming (Convenience

(Simple random sampling)

sampling)

Sistematiese steekproefneming (Systematic

Oordeelsteekproefneming (Judgement

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 71


GQM105 Inleiding tot elementêre kwantitatiewe metodes

random sampling)

Sampling)

Gestratifiseerde steekproefneming (Stratified

Kwotasteekproefneming (Quota sampling)

random sampling)

Sneeubalsteekproefneming (Snowball

Trossteekproefneming (Cluster random

sampling)

sampling) Tabel 2. 2: Steekproefmetodes (Bron: Wegner, 2013:153 – 157) Aan die einde van Paragraaf 6.2 in die handboek, word die voordele van ewekansige steekproefneming uiteengesit. Die skrywer gaan selfs so ver om te sê dat data wat op ʼn nieewekansige wyse versamel is, nie gebruik kan word om afleidende statistiek te bereken nie. Dit is egter nie waar nie. In die praktyk word afleidings dikwels op grond van data wat op hierdie wyse versamel is, gemaak. Die navorser moet egter in hierdie gevalle deeglik bewus wees van die feit dat die data – en dus, die afleidings – met groot sorg geïnterpreteer word, veral wanneer besluite ten opsigte van die populasie op grond van hierdie data gemaak word. 2.7.2

Die steekproefverspreiding

Handboek, paragraaf 6.3 – 6.4 en 6.6. Hoewel daar nie berekeninge in hierdie paragraaf ingesluit word nie, word daar in diepte verduidelik waarom die steekproef se gemiddeld en standaardafwyking as benadering tot dié van die populasie gebruik word. Die belangrikheid van die standaardfout (standard error) word ook beskryf. Wanneer ʼn navorser ʼn statistiek uit die steekproef bereken, kan hy of sy nooit ten volle seker wees dat die populasiestatistiek presies dieselfde sal wees nie. Daar bestaan egter metodes om te bepaal met watter mate van sekerheid hierdie steekproefstatistiek op die populasie van toepassing gemaak kan word. Die rasionaal wat die grondslag hiervoor lê, word in Paragraaf 6.4 bespreek. Paragraaf 6.6 beskryf hoe hierdie beginsels op die verskil tussen twee steekproewe van toepassing gemaak word. Belangrik vir die pad vorentoe Hoewel die volgende terminologie later weer aangeraak word, sal dit nuttig wees om op hierdie stadium daarvan bewus te wees: •

Vlak van sekerheid: Hierdie is ʼn persentasie tussen 0 en 100. In die meeste gevalle

©akademia (MSW)

Bladsy 72


GQM105 Inleiding tot elementêre kwantitatiewe metodes sal die vlak van sekerheid 90%, 95% of 99% wees. Hierdie getal word vooraf deur die navorser bepaal en beantwoord die vraag: Hoe seker wil ek wees dat die resultate wat ek gekry het, werklik op die populasie van toepassing gemaak kan word? Indien akkuraatheid van kritieke belang is (en foute katastrofiese gevolge kan hê), sal die vlak van sekerheid hoër wees as wanneer, byvoorbeeld, marknavorsing gedoen word. •

p-waarde. Hierdie is ʼn statistiek wat die betroubaarheid van die berekende statistiek aandui. Die p-waarde is ʼn getal tussen 0 en 1. Hoe nader die getal aan 0 is, hoe meer betroubaar is die statistiek wat bereken is. Die p-waarde word ook saam met die vlak van betroubaarheid geïnterpreteer. Indien die vlak van betroubaarheid 95% is, moet die p-waarde kleiner as 0.05 (5%) wees. In die geval van ʼn 99% vlak van betroubaarheid, moet die p-waarde kleiner as 0.01 wees.

Voorbeeld ʼn Maatskappy wil weet of daar ʼn verskil is tussen die inkomste van mans en van vroue onder sy moontlike kliënte. Uit ʼn steekproef word die volgende data verkry:

x̄ mans = R23 500 x̄ vroue = R19 300 x̄ mans - x̄ vroue = R4 200 p = 0.043 Vraag: Is daar ʼn verskil tussen die salarisse van mans en vroue? Antwoord: Die navorser moes vooraf besluit het hoe seker die maatskappy van die resultate wil wees. In die meeste gevalle sal die navorser ʼn vlak van sekerheid van 95% kies. Dit beteken dat die resultate slegs aanvaar kan word, indien p kleiner as 0.05 is. In hierdie geval is dit wel so en die maatskappy kan aanvaar dat, vir die populasie, mans ʼn groter salaris as vroue kry. Indien die vlak van sekerheid op 99% bepaal is, moet die p-waarde kleiner as 0.01 wees. Dit is nie die geval nie en die resultate kan dus nie aanvaar word nie. Is dit ʼn slegte ding as die p-waarde te groot is? Sommige beginner-navorsers glo dat die navorsing misluk het, indien die p-waarde groter is

Studie-eenheid 2: Waarskynlikhede en steekproewe

Bladsy 73


GQM105 Inleiding tot elementêre kwantitatiewe metodes as wat toelaatbaar is. Dit is natuurlik nie waar nie. In die tweede geval hierbo genoem (vlak van sekerheid = 99%), sal die navorser se gevolgtrekking wees: Daar is nie voldoende bewyse om 99% of meer seker te wees dat daar ʼn noemenswaardige verskil tussen die salarisse van mans en vroue bestaan nie. Dus sal daar aangeneem word mans en vroue se salarisse gelyk is. Die volgende hoofstukke in die handboek sal die tema van hipotesetoetsing in meer detail bespreek. 2.7.3

Selfevalueringsvrae

Daar is geen selfevalueringsvrae vir Hoofstuk 6 nie. 2.8

Samevatting

Hierdie studie-eenheid het die beginsels van waarskynlikhede en steekproewe bespreek. Daar word onderskei tussen subjektiewe en objektiewe waarskynlikhede – statistiek word gebruik om laasgenoemde te bereken op een van drie wyses: 1) a priori, 2) empiries en 3) wiskundig. Vyf belangrike konsepte betrokke by stelteorie wat vir waarskynlikhede gebruik kan word is 1) snyding, 2) samevoeging, 3) onderling uitsluitend, 4) gesamentlik uitputbare en 5) statisties onafhanklike gebeure. Daar word onderskei tussen twee belangrike konsepte waar telreëls van toepassing is, naamlik permutasies en kombinasies. Elk kan nuttig wees om waarskynlikhede te bereken. Die grootste verskil tussen hierdie twee, is die feit dat volgorde belangrik is by permutasies, maar nie by kombinasies nie. Daar word tussen twee kategorieë van waarskynlikheidverspreidings onderskei: 1) Diskrete verspreidings, wat die binominale en poisson-verspreidings insluit en 2) kontinue verspreiding waarvan die normaalverdeling die bekendste is. Die normaalverdeling vorm ook die grondslag van z-toetse en t-toetse, wat later in die vak bespreek word. Steekproefmetodes word in twee kategorieë verdeel. Die eerste kategorie, ewekansige steekproefneming, bevat 1) eenvoudige ewekansige steekproefneming, 2) sistematiese steekproefneming, 3) gestratifiseerde steekproefneming, en 4) trossteekproefneming. Die tweede kategorie, naamlik nie-ewekansige steekproefneming, bestaan uit 1) geriefsteekproefneming, 2) oordeelsteekproefneming, 3) kwotasteekproefneming, 4) sneeubalsteekproefneming. Ewekansige steekproefneming lei gewoonlik tot steekproewe wat meer verteenwoordigend van die populasie is. Die steekproefverspreiding verduidelik waarom steekproewe as benaderings vir die populasie gebruik kan word.

©akademia (MSW)

Bladsy 74


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I

3.1

Studie-eenheid leeruitkomstes

Kennis en begrip Na voltooiing van Studie-eenheid 3 sal jy in staat wees om jou kennis en begrip te demonstreer van die volgende: •

Vertrouensintervalle

Hipotesetoetsing van ʼn enkele populasie se gemiddeld

Vaardighede Jy sal ook in staat wees om: •

ʼn vertrouensinterval en die faktore wat die grootte daarvan beïnvloed, te bespreek.

ʼn vertrouensinterval vir ʼn populasiegemiddeld op te stel, indien die populasiestandaardafwyking bekend is (z-limiete).

ʼn vertrouensinterval vir ʼn populasiegemiddeld op te stel, indien die populasiestandaardafwyking nie bekend is nie (t-limiete).

die vyf stappe van hipotesetoetsing te identifiseer en toe te pas.

hipotesetoetsing vir ʼn populasiegemiddeld te doen as die populasiestandaardafwyking bekend is (z-toets).

hipotesetoetsing vir ʼn populasiegemiddeld te doen as die populasiestandaardafwyking nie bekend is nie (t-toets).

• 3.2

ʼn p-waarde te interpreteer en vir hipotesetoetsing te gebruik. Voorgeskrewe handboek

Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta. Vir die doeleindes van hierdie studie-eenheid moet jy die volgende afdelings bestudeer: Hoofstuk 7: Paragraaf 7.1 – 7.8 en 7.10, 7.11 Hoofstuk 8: Paragraaf 8.1 – 8.4 en 8.6 – 8.8

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I

Bladsy 75


GQM105 Inleiding tot elementêre kwantitatiewe metodes 3.3

Hoe kan jy jou begrip verbeter?

Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord

Omskrywing

Alternatiewe

Die stelling wat aanvaar sal word, indien die nulhipotese

hipotese

verwerp word.

Hipotesetoets

ʼn Statistiese toets wat bepaal of ʼn spesifieke stelling (ʼn hipotese) waar is. Hierdie toets word op data vanaf ʼn steekproef gedoen en word gebruik om aannames ten opsigte van die populasie te maak.

Nulhipotese

Die hipotese wat statisties getoets is en aanvaar dat die status quo waar is. Hierdie hipotese bevat gewoonlik die = teken.

Peil van betekenis

ʼn Waarde tussen 0 en 1 wat aandui teen watter sekerheid die navorser gevolgtrekkings oor die populasie wil maak. Hierdie waarde word vanaf die vlak van sekerheid verkry.

Puntberaming

Die beraming van ʼn spesifieke getal (statistiek), soos ʼn gemiddeld of standaardafwyking van die populasie. Hierdie beraming word gedoen met data wat vanaf ʼn steekproef verkry word.

Vertrouensinterval

ʼn Ondergrens en bogrens wat die area waarin ʼn spesifieke getal (byvoorbeeld, ʼn populasiegemiddeld) met die grootste waarskynlikheid sal voorkom.

3.4

Inleiding

Een van die belangrikste gebruike van Statistiek is om steekproefdata te gebruik om gevolgtrekkings ten opsigte van die populasie te maak. Hierdie tipe berekeninge word inferensiële/afleidende statistiek (inferential statistics) genoem. Statistiese afleidings word verdeel tussen hipotesetoetsing en vooruitskatting. Laasgenoemde is nie deel van die omvang van hierdie vak nie en sal dus nie behandel word nie. Die res van hierdie vak sal dus aan vertrouensintervalle en hipotesetoetsing gewy word. Vertrouensintervalle is een manier om ʼn beraming te maak ten opsigte van die gemiddeld van ʼn populasie. Dit behels die stel van ʼn onderste en boonste grens van ʼn interval waarin die populasiegemiddeld sal voorkom. Die data wat vir die stel van hierdie grense gebruik

©akademia (MSW)

Bladsy 76


GQM105 Inleiding tot elementêre kwantitatiewe metodes word, word deur ʼn steekproef gevind. Vertrouensintervalle word eerste bespreek en kan gevind word in Hoofstuk 7 in die handboek. Hipotesetoetsing behels die toets van ʼn stelling, wat ʼn hipotese genoem word. Die eerste tipe hipotese wat getoets word, is ʼn beraming van die gemiddeld van ʼn enkele populasie. Hierdie tipe hipotesetoets word in Hoofstuk 8 in die handboek bespreek. 3.5

Vertrouensintervalle

Bestudeer die handboek: Paragraaf 7.1 – 7.8 en 7.10 – 7.11 3.5.1

Puntberamings en vertrouensintervalle

Bestudeer die handboek: Paragraaf 7.1 – 7.3 Voordat vertrouensintervalle bereken kan word, is dit belangrik om eerstens, te onderskei tussen twee begrippe: Puntberaming en beraming van ʼn vertrouensinterval. ʼn Puntberaming word gemaak wanneer ʼn spesifieke statistiek (byvoorbeeld ʼn gemiddeld) vir ʼn steekproef bereken word, en dan as beraming vir populasie gebruik word. (Verwys na Paragraaf 7.2 in die handboek vir voorbeelde.) Wanneer ʼn vertrouensinterval bereken word, word twee grense vir ʼn spesifieke statistiek bereken. Die populasiestatistiek sal dan, teen ʼn vasgestelde sekerheid, in hierdie interval voorkom. (Verwys na Paragraaf 7.3 in die handboek vir ʼn volledige definisie.) 3.5.2

Vertrouensinterval vir µ: bekend

Bestudeer die handboek: Paragraaf 7.4 – 7.6 Die eerste formule wat gebruik word, neem aan dat die populasiegemiddeld $ bekend is. Dit is egter nie altyd die geval nie. Paragraaf 7.7 en 7.8 bespreek hoe vertrouensintervalle bereken kan word as $ nie bekend is nie en die steekproefstandaardafwyking (s) gebruik moet word. Soos vroeër genoem, is µ die simbool vir die populasiegemiddeld, byvoorbeeld, die gemiddelde salaris van alle kliënte, die gemiddelde ouderdom van studente en die gemiddelde hoeveelheid keer ʼn persoon van ʼn spesifieke pad gebruik maak. Om µ te beraam, word ʼn steekproef uit die populasie getrek en die gemiddeld van die steekproef, x̄ , word bereken. Laasgenoemde (x̄ ) word dan gebruik om µ te beraam.

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I

Bladsy 77


GQM105 Inleiding tot elementêre kwantitatiewe metodes Vraag: x̄ = 78 Kan ek dus aanneem dat µ ook 78 is? Antwoord: Die antwoord is nie so eenvoudig nie. ʼn Meer korrekte antwoord sal wees: "Ek kan met 95% sekerheid sê dat µ tussen 75.624 en 80.376 sal wees". Vir hierdie rede word vertrouensintervalle gebruik. Dit is dus nie altyd moontlik om die presiese populasiegemiddeld te bepaal nie, veral nie wanneer ʼn groot mate van sekerheid nodig is nie. Om hierdie rede word die steekproefstatistieke gebruik om ʼn interval op te stel waarin die populasiegemiddeld sal voorkom. ʼn Tipiese gevolgtrekking wat met ʼn vertrouensinterval gemaak kan word, is: "daar kan met 95% sekerheid gesê word dat die gemiddelde salaris van alle kliënte tussen R10 000 en R15 000 is". Doen Voorbeeld 7.1 in die handboek. Die doel van ʼn vertrouensinterval is om, met die hulp van steekproefstatistieke, ʼn bogrens en ondergrens te bepaal waarin die populasiegemiddeld sal val. Die formule wat gebruik word, is Formule 7.2 in die handboek Die waarde wat benodig word, word soos volg verkry: •

Vlak van sekerheid (%): Hierdie word deur die navorser besluit. (In Voorbeeld 7.1 word hierdie waarde verskaf.)

x̄ : Hierdie is die steekproefgemiddeld. Dit word bereken deur alle waardes bymekaar te tel en dit dan deur die hoeveelheid waardes (n) te deel. (In hierdie voorbeeld word x̄ gegee.)

z: Die z-waarde word uit die z-tabel aan die einde van die handboek verkry.

$: Hierdie is die populasiestandaardafwyking. Vir Voorbeeld 7.1 word aangeneem dat die populasiestandaardafwyking bekend is. Hierdie waarde word gegee.

n: Hierdie is die hoeveelheid waardes wat gebruik is om x̄ te bereken – dit is die

©akademia (MSW)

Bladsy 78


GQM105 Inleiding tot elementêre kwantitatiewe metodes steekproefgrootte. Paragraaf 7.5 bespreek drie belangrike faktore wat die grootte van ʼn vertrouensinterval kan beïnvloed. Hulle is: •

Die vlak van sekerheid verlang: Hoe hoër die vlak van vertroue is, hoe groter sal die vertrouensinterval wees.

Die steekproefgrootte: ʼn Groter steekproef sal (indien alle ander veranderlikes konstant bly) meer verteenwoordigend wees van die populasie. Dus sal die vertrouensinterval kleiner kan wees vir dieselfde vlak van sekerheid.

Die populasie se standaardafwyking. Hoe kleiner ʼn standaardafwyking is, hoe nader is die meeste waardes aan die gemiddeld. Dit beteken dat die vertrouensinterval kleiner sal wees.

Doen Voorbeeld 7.2 in die handboek Hierdie voorbeeld dui aan hoe die vlak van sekerheid die vertrouensinterval kan beïnvloed. Doen Voorbeeld 7.3 in die handboek. Doen Voorbeeld 7.4 in die handboek Voorbeeld 7.4 dui aan hoe groot ʼn vertrouensinterval word as die standaardafwyking van die populasie groot is. Probeer hierdie voorbeeld en verander die populasiestandaardafwyking na 250. Kyk hoe die vertrouensintervalle verskil.

Waarom bereken ons vertrouensintervalle? Paragraaf 7.6 in die handboek verduidelik die rasionaal waarop vertrouensintervalle gebaseer is. Lees deur hierdie paragraaf om ʼn beter oorsig oor die gebruik van vertrouensintervalle te verkry. 3.5.3

Vertrouensinterval vir µ: bekend

Dit gebeur dikwels in praktyk dat geen statistieke van die populasie bekend is nie, dus, is $ nie beskikbaar nie. In so ʼn geval moet die steekproef se standaardafwyking (s) gebruik word. Wat is die verskil? Die formule en prosedure om die vertrouensinterval te bereken, bly dieselfde. Al wat verander is dat t- in plaas van z-waardes gebruik word.

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I

Bladsy 79


GQM105 Inleiding tot elementêre kwantitatiewe metodes Om ʼn t-waarde te bereken Die t-waarde word ook van ʼn tabel afgelees. Hierdie tabel is in die handboek as Tabel 2 in Aanhangsel A verskaf. Die tabel vereis twee waardes wat gebruik moet word: •

df: Die grade van vryheid (degrees of freedom) word bereken deur n-1, waar n die steekproefgrootte is.

∝ word van die vlak van sekerheid verkry. Vir 95% is ∝ = 0.05.

Die t-waarde sal dan verkry word deur die kolom met die ∝-waarde en die ry met die dfwaarde te kruis. Doen Voorbeeld 7.5 Gebruik formule 7.3 in die handboek om die vraag te voltooi, en die t-tabel om die twaardes te vind. 3.5.4

Selfevalueringsvrae

Doen die volgende vrae aan die einde van Hoofstuk 7 in die handboek: •

Vraag 2

Vraag 4

Vraag 5 (a)

Vraag 6 (a) en (d)

Vraag 7 (a), (b) en (e)

Vraag 8 (a) en (b)

Vraag 9 (a)

Vraag 10 (a), (b), (c) en (e)

Vraag 11 (a)

Vraag 12 (a) en (b)

Vraag 13 (a), (b) en (c)

©akademia (MSW)

Bladsy 80


GQM105 Inleiding tot elementêre kwantitatiewe metodes 3.6

Hipotesetoetsing vir een populasie

Bestudeer die handboek: Paragraaf 8.1 – 8.4, en 8.6 – 8.8 3.6.1

Hipotesetoetsing

Bestudeer die handboek: Paragraaf 8.1 – 8.2 ʼn Hipotese is ʼn stelling wat deur statistiese berekening aanvaar of verwerp kan word. Die res van die handboek wat in hierdie vak behandel gaan word (Hoofstuk 8 tot 11) behels hipotesetoetsing. Elke hipotese wat getoets word, kan (en moet) op twee wyses weergegee word: •

Nulhipotese: Hierdie hipotese behels die formulering wat statisties getoets of verwerp gaan word. Die nulhipotese het altyd ʼn = teken (of ≤ of ≥ teken). Die nulhipotese word normaalweg as die status quo aanvaar, tensy die statistiese toets (hipotesetoets) genoegsame bewyse lewer om die nulhipotese te verwerp – ten gunste van die alternatiewe hipotese.

Alternatiewe hipotese: Die alternatiewe hipotese is die formulering van die hipotese wat die teenoorgestelde van die nulhipotese voorstel. As die nulhipotese verwerp word, word die bewoording in die alternatiewe hipotese in die gevolgtrekking gebruik.

Voorbeeld ʼn Maatskappy wil bepaal of die gemiddelde ouderdom (A) van hul teikenmark bo 18 is. Die nul (H0) en alternatiewe (H1) hipoteses sal soos volg voorgestel word: H0: A ≤ H1: A > Belangrik: Die twee hipotese mag onder geen omstandighede dieselfde stelling maak nie; daarom word slegs die > teken vir die alternatiewe hipotese gegee. As die statistiese toets H0 verwerp, sal die bestuur tot die gevolgtrekking kom dat die gemiddelde ouderdom van hul teikenmark groter as 18 is. Indien die statistiese toets H0 nie verwerp nie, sal die bestuur tot die gevolgtrekking kom dat die gemiddelde ouderdom van hul teikenmark 18 of jonger is. Daar word ook tussen drie tipes hipoteses onderskei. Dit is belangrik om die regte tipe te kies, omdat dit ʼn invloed op die statistiese berekeninge sal hê. Hierdie tipes word in meer

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I

Bladsy 81


GQM105 Inleiding tot elementêre kwantitatiewe metodes detail onder Stap 1, Paragraaf 8.2 in die handboek, beskryf en word in Figuur 3.1 hieronder opgesom:

Tweekantige (Two sided) hipotese •Gebruik nie groter of kleiner as tekens nie. Toets slegs of ʼn populasieveranderlike gelyk of ongelyk is aan ʼn spesifieke waarde

Regskantige (One-sided upper tailed) hipotese •Bepaal of die populasieveranderlike groter as ʼn spesifieke waarde is

Linkskantige (One-sided lower tailed) hipotese •Bepaal of die populasieveranderlike kleiner is as ʼn spesifieke waarde Figuur 3. 1: Tipes hipoteses (Bron: Wegner, 2013: 188 – 189) Om ʼn hipotese te toets, word vyf stappe gevolg. Hierdie stappe word in Paragraaf 8.2 in die handboek in detail beskryf. Hierdie stappe vorm die grondslag vir alle werk wat in die res van hierdie vak behandel word. Dit is dus belangrik om alles wat in Paragraaf 8.2 in die handboek bespreek word, ten volle te verstaan. Stap 1 beskryf die tipes hipoteses, asook die nul- en alternatiewe hipoteses, soos hierbo bespreek. Stap 2 bespreek die kriteria waarvolgens die nulhipotese verwerp sal word. Die vlak van sekerheid word gebruik om die area, waar die hipotese nie verwerp sal word nie, uit een te sit. Die betekenispeil (level of significance) word dan gebruik om die area (oppervlakte) waar die nulhipotese verwerp sal word, te spesifiseer. Hierdie statistiek, voorgestel deur die Cteken, word vanaf die vlak van sekerheid verkry en is gewoonlik 0.01, 0.05 of 0.1. Dit is ook belangrik om na die grafiese voorstelling van hierdie areas te kyk. Vir hipoteses wat nie rigting (> en <) aandui nie, word C se waarde in twee gedeel om beide "sterte" van die normaalverdeling in te sluit. Die z- of t-statistieke wat gebruik word, sal dus verskil vir die twee tipes hipotese. Vir oefening is dit ʼn goeie idee om die normaalverdeling hier te teken en die toetsstatistiek (in Stap 3 bereken) daarop aan te dui. Die derde stap behels die berekening van die toetsstatistiek. Hierdie is die statistiek wat met die C vergelyk moet word om te bepaal of H0 verwerp gaan word. Die toetsstatistiek word bereken met data wat van die steekproef verkry word en, afhangende van of die populasiegemiddeld bekend is, $ of s. In Stap 4 word die toetsstatistiek met die C en die areas van aanvaarding en verwerping vergelyk. Indien die toetsstatistiek binne die area van aanvaarding (90%, 95% of 99% van

©akademia (MSW)

Bladsy 82


GQM105 Inleiding tot elementêre kwantitatiewe metodes die totale area) val, word H0 nie verwerp nie. Indien dit egter in die area van verwerping val, word H0 verwerp. In die vyfde stap word gevolgtrekkings gemaak. ʼn Tipiese gevolgtrekking is: Die gemiddelde ouerdom van ons teikenmark is hoër as 18. 3.6.2

Hipotesetoetsing vir ʼn populasiegemiddeld (slegs een en is bekend)

Bestudeer die handboek: Paragraaf 8.3 Die eerste hipotesetoetse wat gedoen word, is vir ʼn enkele populasiegemiddeld. Daar sal later na meer gemiddelde en die verskille tussen gemiddelde gekyk word. Soos met vertrouensintervalle, word daar gekyk na populasies waar $ bekend is en dié waar $ nie bekend is nie. Vir alle hipotesetoetse sal dieselfde vyf stappe gebruik word. Doen nou Voorbeeld 8.1 in die handboek Hierdie voorbeeld pas die vyf stappe van hipotesetoetsing toe op data waar die populasiestandaardafwyking (A) bekend is. Onthou: dit is belangrik om altyd die normaalverdeling te teken en die areas van aanvaarding en verwerping te teken en dan die betrokke z-waardes en toetsstatistieke daarop aan te dui. Sodoende is dit baie makliker om te bepaal of die hipotese verwerp kan word. 3.6.3

Hipotesetoetsing vir ʼn populasiegemiddeld (slegs een en is onbekend)

Bestudeer die handboek: Paragraaf 8.4 Soos met vertrouensintervalle word die t-statistiek gebruik wanneer $ onbekend is. Verder bly die hipotesetoets dieselfde. Doen Voorbeeld 8.3 in die handboek Hier word van jou verwag om self s te bereken. Verwys weer na Hoofstuk 3 in die handboek hiervoor.

3.6.4

Hipotesetoetsing deur die p-waarde te gebruik

Bestudeer die handboek: Paragraaf 8.6 Die p-waarde is in Studie-eenheid 2 reeds bespreek. Waar Studie-eenheid 2 die interpretasie van die p-waarde beskryf het, word daar in Paragraaf 8.6 in die handboek

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I

Bladsy 83


GQM105 Inleiding tot elementêre kwantitatiewe metodes aangedui hoe hierdie waarde bereken kan word. Hierdie is dus ʼn alternatiewe wyse om ʼn hipotesetoets te doen. Hoofstuk 8 in die handboek het reeds beskryf hoe C gevind kan word. Die p-waarde word met C vergelyk. Indien die p-waarde kleiner is as C, word H0 verwerp.

Waar die C-waarde die oppervlak van die verwerparea voorstel, word die toetsstatistiek (zof t-waarde) gebruik om p te bereken – p is dus ook ʼn oppervlakte. p-waardes word in die praktyk gebruik wanneer statistiese ontledings deur programmatuur gedoen word. Dit is dus belangrik om hiervan bewus te wees en ʼn p-waarde te kan interpreteer.

3.6.5

Selfevalueringsvrae

Doen die volgende vrae aan die einde van Hoofstuk 8 in die handboek

3.7

Vraag 5

Vraag 6 (a) en (b) vir (i) tot (v)

Vraag 7 (a) – (c)

Vraag 8 (a) – (c)

Vraag 9 (a) en (b)

Vraag 10 (a) – (c)

Vraag 11 (a) en (c)

Vraag 12 (a)

Vraag 13 (a)

Vraag 14 (a) Samevatting

ʼn Puntberaming word gemaak wanneer ʼn spesifieke statistiek (byvoorbeeld ʼn gemiddeld) vir ʼn steekproef bereken word, en dan as beraming vir populasie gebruik word. Wanneer ʼn vertrouensinterval bereken word, word twee grense vir ʼn spesifieke statistiek bereken. Die populasiestatistiek sal dan, teen ʼn vasgestelde sekerheid, in hierdie interval voorkom. Vertrouensintervalle kan onder verskeie omstandighede bereken word: 1) As die populasiestandaardafwyking bekend is en 2) as die populasiestandaardafwyking nie bekend is nie.

©akademia (MSW)

Bladsy 84


GQM105 Inleiding tot elementêre kwantitatiewe metodes ʼn Hipotese is ʼn stelling wat deur statistiese berekening aanvaar of verwerp kan word. Deur hipotesetoetsing wat met data uit die steekproef gedoen word, word bepaal of die hipotese verwerp word al dan nie. Daar word tussen die volgende hipoteses onderskei: 1) tweekantige hipotese, 2) regskantige hipotese en 3) linkskantige hipotese. Wanneer ʼn hipotese vir ʼn enkele populasiegemiddeld bereken word, word verskillende toetse gebruik afhangende van of die populasiestandaardafwyking bekend is. Indien hierdie standaardafwyking bekend is, word die z-toets gebruik. Indien nie, word die t-toets gebruik. Enige hipotesetoets bestaan uit 5 stappe. Hierdie stappe is 1) formuleer die hipotese, 2) bepaal die areas van aanvaarding en verwerping (en dus die kritieke waarde), 3) bereken die toetsstatistiek (in hierdie geval die z- of t-statistiek), 4) vergelyk die toetsstatistiek met die areas van aanvaarding en verwerping en 5) maak bestuursgevolgtrekkings.

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I

Bladsy 85


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes Notas

Šakademia (MSW)

Bladsy 86


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Studie-eenheid 4: Hipotesetoetsing: Deel II

4.1

Studie-eenheid leeruitkomstes

Kennis en begrip Na voltooiing van Studie-eenheid 4 sal jy in staat wees om jou kennis en begrip te demonstreer van die volgende: •

Hipotesetoetsing: Die verskil tussen die gemiddelde van twee populasies

Hipotesetoetsing: Die D - toets

Hipotesetoetsing: Die verskil tussen gemiddeldes van meer as twee populasies

Vaardighede Jy sal ook in staat wees om: •

ʼn hipotesetoets te doen om die verskil tussen twee onafhanklike populasiegemiddelde te bepaal, as die populasiestandaardafwyking bekend is (ztoets).

ʼn hipotesetoets te doen om die verskil tussen twee onafhanklike populasiegemiddelde te bepaal, as die populasiestandaardafwyking nie bekend is nie (t-toets).

ʼn hipotesetoets te doen om die verskil tussen twee afhanklike populasiegemiddelde te bepaal (gepaarde t-toets).

die D - toets te doen om sodoende te toets of twee faktore afhanklik of onafhanklik van mekaar is.

4.2

ʼn ANOVA toets te doen deur die F-statistiek te bereken

Voorgeskrewe handboek

Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta. •

Hoofstuk 9,

Hoofstuk 10

Hoofstuk 11

Studie-eenheid 4: Hipotesetoetsing: Deel II

Bladsy 87


GQM105 Inleiding tot elementêre kwantitatiewe metodes 4.3

Hoe kan jy jou begrip verbeter?

Jy moet seker maak dat jy die volgende terminologie verstaan: Sleutelwoord

Omskrywing

D

ʼn Statistiek wat gebruik word om die afhanklikheid tussen waargeneemde frekwensies en verwagte frekwensies te toets.

ANOVA

ʼn Statistiese toets wat die verskil tussen die gemiddelde van meer as twee populasies vergelyk.

F-statistiek

Die statistiek wat gebruik word om ʼn ANOVA toets uit te voer.

Gepaarde t-toets

ʼn Toets wat gebruik word om die verskil tussen gemiddelde uit twee afhanklike steekproewe te meet.

4.4

Inleiding

In Studie-eenheid 3 is die eerste tipe hipotesetoets bekendgestel: Die gemiddeld van ʼn enkele populasie. In Studie-eenheid 4 word nog drie hipotesetoetse bespreek: Die verskil tussen gemiddelde van twee populasies (byvoorbeeld manlike en vroulike kliënte), die D toets (uitgespreek Chi-squared) en die ANOVA toets (Analise van variansie). Wanneer die verskil tussen twee gemiddeldes bereken word, moet die aard van die data ook in ag geneem word. Die twee steekproewe kan afhanklik of onafhanklik van mekaar wees. ʼn Hipotesetoets van onafhanklike data moet ook in ag neem of die populasiestandaardafwyking bekend is of nie. Daar sal dus drie verskillende hipotesetoetse in hierdie studie-eenheid bespreek word. Die D -toets vergelyk individuele frekwensies: waargeneemde waardes word vergelyk met verwagte waardes. Die hipotesetoets sal dan bepaal of data ʼn verwagte patroon volg. Die ANOVA toets word gebruik om die verskil tussen gemiddelde van meer as twee populasies te toets. Hierdie toets bepaal slegs of alle gemiddeldes van die verskeie populasies gelyk is. 4.5

Hipotesetoets: Vergelyking van twee populasies

Bestudeer die handboek: Paragraaf 9.1 – 9.4 en 9.7 – 9.8 In Hoofstuk 8 in die handboek was die gemiddeld van een populasie se gemiddeld met ʼn getal vergelyk. In Hoofstuk 9 word daar na twee verskillende gemiddeldes gekyk. Die hipotese bepaal dan of daar ʼn verskil tussen hierdie twee gemiddeldes bestaan. Daar word na drie verskillende gevalle gekyk. Hierdie drie gevalle word in Figuur 4.1 opgesom:

©akademia (MSW)

Bladsy 88


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Steekproewe is onafhanklik van mekaar, σ is bekend • Bv, die verskil tussen gemiddelde verkope by tak 1 en tak 2. • Paragraaf 9.2 in die handboek Steekproewe is onafhanklik van mekaar, σ is onbekend • Paragraaf 9.3 in die handboek Steekproewe is nie onafhanklik nie • Bv, die verskil tussen werknemers se afwesighede in maand 1 en maand 2 • Die werknemers bly dieselfde, maar die tyd of omstandighede verander • Paragraaf 9.4 in die handboek

Figuur 4. 1: Verskillende omstandighede waar twee populasiegemiddeldes vergelyk word (Bron: Wegner: Hoofstuk 9)

4.5.1

Verskil tussen die gemiddelde in onafhanklike steekproewe, σ bekend

Bestudeer die handboek: Paragraaf 9.2 Die eerste geval behels die vergelyking van twee gemiddeldes waar die populasiestandaardafwyking bekend is (en die z-statistiek gebruik kan word). Die steekproewe is ook nie afhanklik van mekaar nie (die gemiddelde word nie van dieselfde groep bereken nie.) Dieselfde stappe vir hipotesetoetsing word gevolg (verwys na Studie-eenheid 3). Stap 1 behels die formulering van ʼn nul- en alternatiewe hipotese. Hierdie is dieselfde as in Hoofstuk 8 in die handboek, hoewel die µ met µ1 - µ2 vervang sal word, omdat daar na die verskil verwys word. (Onthou dat die verskil tussen hierdie twee gemiddeldes ook ʼn enkele getal is en dus maklik in ʼn vergelyk gebruik kan word: Bv. H0: µ1 - µ2>0 of µ1 - µ2<0. In Stap 2 word die areas van aanvaarding en verwerping bereken. Hierdie is dieselfde as in Hoofstuk 8 waar die z-statistiek gebruik is. Stap 3 behels die berekening van die toetsstatistiek. Die toetsstatistiek word volgens Formule 9.1 in die handboek bereken. Hoewel hierdie formule anders is as by ander hipotesetoetsing, word die z-statistiek op dieselfde wyse geïnterpreteer. Stap 4 en 5 sal dus dieselfde wees as vorige hipotesetoetse.

Studie-eenheid 4: Hipotesetoetsing: Deel II

Bladsy 89


GQM105 Inleiding tot elementêre kwantitatiewe metodes Vir die z-statistiek in hierdie geval, word die volgende waardes benodig (sien Formule 9.1 in die handboek): •

x̄ 1 en x̄ 2: Hierdie is die gemiddelde van die twee, onafhanklik steekproewe wat gevind is.

n1 en n2: Hierdie is die groottes van die twee verskillende steekproewe

σ1 en σ2: Die standaardafwyking van die twee populasies van waar die steekproewe verkry is.

α: Die alfa-waarde word verkry vanaf die vlak van sekerheid en kan 0.01, 0.05 of 0.1 wees.

Doen nou Voorbeeld 9.1 in die handboek Vraag (a) behels ʼn tweekantige hipotesetoets. Vraag (b) behels ʼn eenkantige hipotesetoets. Stap 2 en stap 4 sal veral deur hierdie verskil beïnvloed word.

4.5.2

Verskil tussen twee gemiddeldes: Onafhanklike steekproewe en σ is onbekend

Bestudeer die handboek: Paragraaf 9.3 Wanneer die populasiestandaardafwyking nie bekend is nie, word die t-statistiek in plaas van die z-statistiek gebruik. Vir hierdie tipe hipotese word ʼn ander formule (as vir een populasie) gebruik. Die stappe van hipotesetoetsing word gevolg: Stap 1 is dieselfde as in Paragraaf 4.5.2 hierbo. Stap 2 verskil van die hipotese wat in Paragraaf 4.5.2 hierbo getoets is. Omdat die tstatistiek gebruik word as toetsstatistiek, sal die kritieke waarde ook ʼn t-statistiek wees (en nie ʼn z-statistiek nie). Om die kritieke waarde te kry, word die grade van vryheid (df) en C gebruik. •

α is reeds verkry vanaf die vlak van sekerheid.

df word verkry deur die formule n1 + n2 - 2 (n1 en n2 stel onderskeidelik die eerste en tweede steekproewe se groottes voor).

In Stap 3 word die toetsstatistiek bereken. Hiervoor word Formule 9.2 in die handboek gebruik. Hierdie formule mag dalk intimiderend voorkom, maar al die waardes wat daarvoor benodig word, is reeds bekend:

©akademia (MSW)

Bladsy 90


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

x̄ 1 en x̄ 2: Hierdie word uit die steekproewe bereken.

µ1 en µ2: Die nulhipotese aanvaar dat die twee populasies se gemiddelde dieselfde is. Dus is die verskil tussen hierdie twee waardes 0 en kan buite rekening gelaat word.

n1 en n2: Die groottes van die twee steekproewe.

s1 en s2: Die standaardafwykings van die twee steekproewe.

In Stap 4 en Stap 5 word die toetsstatistiek met die kritieke waarde vergelyk en ʼn gevolgtrekking word gemaak. Hierdie is dieselfde as in Paragraaf 4.5.1 hierbo. Doen nou Voorbeeld 9.2 in die handboek. 4.5.3

Die verskil tussen twee gemiddeldes: Steekproewe is nie onafhanklik nie

Bestudeer die handboek: Paragraaf 9.4 Hierdie tipe hipotese word gebruik wanneer ʼn steekproef twee maal uit dieselfde populasie verkry word, maar op verskillende tye, of onder verskillende omstandighede. Soos by Paragraaf 4.5.1 en 4.5.1 hierbo, word die verskil tussen die twee gemiddeldes ook gebruik. Daar word egter van die t-statistiek gebruik gemaak, met ʼn nuwe formule. (Hierdie statistiese toets word die gepaarde t-toets, of matched-pair t-test genoem.) Die verskil tussen hierdie twee gemiddelde word as µd voorgestel. Die stappe vir hipotesetoetsing kan soos volg beskryf word: Stap 1 behels die formulering van die hipotesestellings. Hierdie stap word soos in alle vorige gevalle uitgevoer, met die uitsonder dat µd in die hipotesestellings gebruik word, byvoorbeeld: H0: µd = 0 In Stap 2 word die areas van aanvaarding en verwerping weer uiteengesit. Omdat daar met die t-statistiek gewerk gaan word, sal die t-tabel hiervoor gebruik word. Verder is hierdie stap dieselfde as vorige hipotesetoetse waar die t-statistiek as kritieke waarde gebruik is. Om die t-statistiek in Stap 3 te bereken, word Formule 9.5 in die handboek gegee. Hiervoor word die volgende benodig: •

x̄ d: Hierdie statistiek kan bereken word deur Formule 9.3 in die handboek te gebruik. Dit word bepaal deur die verskil tussen elke stel waardes (bv. werknemer A se afwesighede in Maand 1, minus dieselfde werknemer se afwesighede in Maand 2)

Studie-eenheid 4: Hipotesetoetsing: Deel II

Bladsy 91


GQM105 Inleiding tot elementêre kwantitatiewe metodes bymekaar te tel, en dan te deel deur die hoeveelheid observasies (bv. hoeveelheid werknemers). •

µd: Die populasiegemiddeld van die verskille is nie bekend nie, maar word gelyk gestel aan nul, omdat dit so deur die nulhipotese bepaal word.

sd: Hierdie statistiek word deur middel van Formule 9.4 in die handboek bereken.

n is die hoeveelheid elemente in die steekproef.

Stap 4 en Stap 5 is weer eens dieselfde as vorige hipotesetoetse. Doen nou Voorbeeld 9.3 in die handboek

4.5.4

Selfevalueringsvrae

Voltooi die volgende vrae aan die einde van Hoofstuk 9: •

Vraag 1

Vraag 2

Vraag 6

Vraag 7 (a) – (d)

Vraag 8 (a) – (c)

Vraag 9

Vraag 10

Vraag 11 (a) en (b)

Vraag 12

Vraag 13 (a) – (c)

Vraag 14

4.6 4.6.1

Hipotesetoets: Die -toets

Bestudeer die handboek: Paragraaf 10.1 – 10.2 Die N -statistiek word gebruik om die onafhanklikheid van ʼn spesifieke veranderlike te toets deur waarneembare en verwagte frekwensies met mekaar te vergelyk. Dieselfde vyf stappe vir hipotesetoetsing word gebruik, terwyl die formule vir N (Chai squared) as

©akademia (MSW)

Bladsy 92


GQM105 Inleiding tot elementêre kwantitatiewe metodes Formule 10.1 in die handboek gegee word. Die data wat vir hierdie toets verskaf word, sal in tabelvorm voorkom, waar r die hoeveelheid rye en c die hoeveelheid kolomme in hierdie tabel sal voorstel. Die vyf stappe vir hipotesetoetsing word gevolg: Tydens Stap 1 word die nul- en alternatiewe hipotesestellings geformuleer. Omdat twee stelle data (waarvan slegs een stel fisies versamel is) met mekaar vergelyk word, sal die hipotesestellings anders voorkom. In die voorbeeld wat gedoen gaan word (Voorbeeld 10.1), sal die nulhipotese aandui dat geen verwantskap tussen geobserveerde en verwagte waardes bestaan nie. Dit beteken dat hierdie twee stelle data onafhanklik is. Die alternatiewe hipotese sal aandui dat die twee stelle data wel verwant is. Stap 2: Die areas van aanvaarding en verwerping van die nulhipotese sal anders bereken word as vir vorige hipotesetoetse. In hierdie geval word die N -tabel gebruik (Tabel 3, Aanhangsel A in die handboek). Om die kritieke waarde in die N -tabel te vind, is die volgende nodig: •

df: (grade van vryheid, of degrees of freedom): Die formule vir df word as Formule 10.2 in die handboek verskaf. Die hoeveelheid rye en kolomme word vir hierdie formule benodig.

α-waarde: Hierdie word verkry deur die voorafbepaalde vlak van sekerheid en sal tipies 0.01, 0.05 of 0.1 wees.

Waar die df-kolom en die α-ry kruis, sal die kritieke waarde vir N gevind word. Om die toetsstatistiek in Stap 3 te bereken, is ʼn redelike omslagtige proses, maar nie moeilik nie. Om die berekening te vergemaklik word N deur middel van ʼn tabel bepaal. Elke stap in die formule word dan as ʼn kolom weergegee (sien Voorbeeld 10.1, Tabel 10.5 in die handboek vir verwysing). Die volgende kolomme kom in die tabel wat hiervoor gebruik word, voor: •

Kolom 1: Die waarneembare waardes word hier uiteengesit. Hierdie data is deur ʼn steekproef versamel en stel die frekwensies voor. Die waarneembare waardes word deur die simbool fo voorgestel.

Kolom 2: Die verwagte waardes. Hierdie waardes moet bereken word deur Formule 10.3 in die handboek en die waarneembare waardes as grondslag te gebruik. Die verwagte waardes word deur die simbool fe voorgestel.

Studie-eenheid 4: Hipotesetoetsing: Deel II

Bladsy 93


GQM105 Inleiding tot elementêre kwantitatiewe metodes •

Kolom 3: Hierdie kolom behels die deel van die D -formule aan die bokant van die breuk, naamlik (fo-fe) . Die verskil tussen die twee waardes word gekwadreer om moontlike negatiewe getalle, positief te maak.

Kolom 4: Al die waardes wat in die vorige kolomme bereken is, word nou saamgevoeg in die formule vir D . Die Σ-teken in die formule beteken dat al die waardes in die laaste kolom bymekaar getel moet word om die D -toetsstatistiek te verkry.

Stap 4 en 5 behels weer eens die interpretasie van die toetsstatistiek (D ). Om die berekening van die toetsstatistiek N beter te verstaan, moet bostaande beskrywing saam met Voorbeeld 10.1 in die handboek deurgewerk word. Doen nou Voorbeeld 10.1 in die handboek.

4.6.2

Selfevalueringsvrae

Doen die volgende vrae aan die einde van Hoofstuk 10 in die handboek: •

Vraag 5

Vraag 6 (a) en (b)

Vraag 7 (a) en (b)

Vraag 8 (a) – (c)

4.7 4.7.1

Hipotesetoets: ANOVA ANOVA en die F-statistiek

Bestudeer die handboek: Paragraaf 11.1 – 11.5. Die t-toets en z-toets is vroeër gebruik om die verskil tussen twee populasies se gemiddeldes te bereken. ANOVA (Analysis of Variance) word gebruik om die verskille tussen meer as twee populasiegemiddeldes te toets. Die toetsstatistiek word die F-statistiek genoem. Om hierdie statistiek te bereken neem tyd, omdat dit deur ʼn groot aantal ander berekeninge voorafgegaan moet word. Dit is egter nie ingewikkelde formules nie. Die beste manier om ʼn F-statistiek te bereken, is om by die formule (Formule 11.10 in die handboek) te begin. Die formule lyk eenvoudig, omdat dit bloot uit twee veranderlikes bestaan: MST en MSE, maar MSE en MST moet ook bereken word en die veranderlikes wat vir elk van hierdie benodig word, vereis ook ʼn aantal

©akademia (MSW)

Bladsy 94


GQM105 Inleiding tot elementêre kwantitatiewe metodes berekeninge. Die volgende terminologie sal by die berekening van die F-statistiek gevind word (die terminologie sal aan die hand van Tabel 11.1 in die handboek bespreek word): •

Grade van vryheid (degrees of freedom): Hier word verwys na d1 en d2: o

d1 is die grade van vryheid vir elkeen van die kleiner steekproewe. Voorbeeld 11.1 in die handboek het drie kleiner steekproewe wat onderskeidelik uit 6, 4 en 5 waardes bestaan.

o

d2 is die grade van vryheid vir die totale steekproef (dus A, B en C saamgevoeg) wat in hierdie geval uit 15 waardes bestaan.

o

SST: Formule 11.4 in die handboek word gebruik om dit te bereken. Die verskil tussen die totale gemiddeld en die gemiddeld van elke steekproef word bepaal, gekwadreer en met die hoeveelheid waardes in daardie kategorie vermenigvuldig, en dan bymekaar getel.

o

SSE: Formule 11.5 word gebruik om dit te bereken. Hier word die verskil tussen elke steekproef se gemiddeld en elke waarde van die steekproef bereken, gekwadreer en bymekaar getel. Die waardes wat sodoende vir die drie steekproewe gevind word, word dan ook bymekaar getel om SSE te verkry.

o

MST: MST word verkry deur Formule 11.8 in die handboek te gebruik. Dit deel SST deur df1.

o

MSE: MSE word verkry deur Formule 11.9 in die handboek te gebruik. Dit deel SSE deur df2.

o

F-statistiek: Hierdie is die kritieke waarde wat bereken word vir hipotesetoetsing. Die formule hiervan word as Formule 11.10 in die handboek weergegee.

Die F-statistiek kan dus stelselmatig bereken word deur die volgende stappe te volg: •

Bereken SST (Formule 11.4 in die handboek)

Bereken SSE (Formule 11.5)

Bepaal k-1

Bepaal N-k

Bereken MST (Formule 11.8)

Bereken MSE (Formule 11.9

Bereken die F-statistiek

Studie-eenheid 4: Hipotesetoetsing: Deel II

Bladsy 95


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Moet ek hierdie stappe onthou? Dit is nie nodig om hierdie stappe te memoriseer nie. Hierdie stappe kan van die F-statistiek se formule afgelei word. Byvoorbeeld, om die F-statistiek te bereken, word ʼn waarde vir MSE en MST benodig. Uit MSE se formule word dit duidelik dat ʼn waarde vir SSE benodig word. Net so, sal uit MST se formule duidelik word dat ʼn waarde vir SST benodig word. As SST en SSE bereken is, kan jy voortgaan met die berekening van MSE en MST en as MSE en MST bereken is, kan die waardes in die F-statistiek se formule geplaas word.

Om leesbaarheid te vergemaklik, word die verskillende waardes wat bereken moet word, in ʼn sogenaamde ANOVA tabel geplaas. Hierdie tabel se formaat en struktuur word in Tabel 11.4 in die handboek verskaf. Die tabel word toepas op Voorbeeld 11.1 in Tabel 11.3 in die handboek. Doen nou Voorbeeld 11.1 om te verseker dat jy die F-statistiek kan bereken.

4.7.2

Selfevalueringsvrae

Doen die volgende vrae aan die einde van Hoofstuk 11 in die handboek: •

Vraag 4

Vraag 5

Vraag 7 (a) – (d)

Vraag 8 (a) en (b)

Vraag 9 (a) en (b)

Vraag 10

Vraag 11 (a) – (c)

Vraag 12 (a) – (c)

Vraag 13 (a) – (e)

Vraag 14 (a) – (d)

Vraag 15 (a) – (d)

©akademia (MSW)

Bladsy 96


GQM105 Inleiding tot elementêre kwantitatiewe metodes 4.8

Samevatting

Om die verskil tussen die gemiddelde van twee populasies te toets, moet ʼn besluit tussen die z-toets, t-toets of die gepaarde t-toets gemaak word. Vir onafhanklike populasies waar die populasiestandaardafwyking bekend is, word die z-toets gebruik. Vir onafhanklike populasies waar die populasiestandaardafwyking nie bekend is nie, word die t-toets gebruik. Vir afhanklike populasies (byvoorbeeld dieselfde respondente en dieselfde veranderlikes word getoets onder verskillende omstandighede) word die gepaarde t-toets gedoen. Die D - toets word hoofsaaklik gebruik om waarneembare frekwensies te vergelyk met dié van ʼn verwagte verspreiding. Met hierdie toets kan bepaal word of data ʼn sekere patroon (soos ʼn normaalverdeling) volg. Die F-statistiek word gebruik om die ANOVA toets te doen. Hierdie toets bepaal slegs of alle gemiddeldes (van die onderskeie populasies) dieselfde is. Indien die nulhipotese (dat alle gemiddelde dieselfde is) verwerp word, is dit steeds moontlik om met ʼn t-toets of z-toets (sien Hoofstuk 8) te bepaal of enige twee pare gemiddelde dieselfde is.

Studie-eenheid 4: Hipotesetoetsing: Deel II

Bladsy 97


GQM105 Inleiding tot elementêre kwantitatiewe metodes

Afrikaans/Engelse terme Afrikaans

Engels

Alternatiewe hipotese

Alternative hypothesis

Analise van variansie (ANOVA)

Analysis of variance

Beskrywende statistiek

Descriptive statistics

Betekenispeil

Level of significance

Houer-en-punt-stipping

Box plot

Ewekansige veranderlike

Random variable

Gepaarde t-toets

Matched pair t-test

Gesamentlik uitputbaar

Collectively exhaustive

Gesamentlike waarskynlikhede

Joint probabilities

Hipotese (meervoud: Hipoteses)

Hypothesis (Meervoud: Hypotheses)

Inferensiële/Afleidende statistiek

Inferential statistics

Kolomgrafiek

Bar chart

Kombinasie

Combination

Kwalitatief

Qualitative

Kwantiel

Quartile

Kwantitatief

Quantitative

Mediaan

Median

Meervoudige kolomgrafiek

Multiple bar chart

Modus

Mode

Normale verdeling

Normal distribution

Nulhipotese

Null/Zero hypothesis

Onderling uitsluitend

Mutually exclusive

©akademia (MSW)

Bladsy 98


GQM105 Inleiding tot elementĂŞre kwantitatiewe metodes

Permutasie

Permutation

Populasie

Population

Puntberaming

Point estimate

Reikwydte

Range

Rekenkundige gemiddeld

Arithmetic mean

Samevoeging

Union

Sirkelgrafiek

Pie chart

Skeefheid

Skewness

Snyding

Intersection

Standaardafwyking

Standard deviation

Steekproef

Sample

Steekproef-eenheid

Sampling unit

Uitskieters

Outliers

Variansie

Variance

Vertrouensinterval

Confidence interval

Vlak van sekerheid

Level of confidence

Voorwaardelike waarskynlikheid

Conditional probabilities

Vraelyste

Surveys / Questionnaires

Waarskynlikheidsboomdiagram

Probability tree

Šakademia (MSW)

Bladsy 99


Elementêre Kwantitatiewe Metodes (GQM105) Handboek: Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta. Elementêre kwantitatiewe metodes behels ’n aantal statistiese tegnieke wat die interpretasie van ’n verskeidenheid data vergemaklik. Die tipes en volumes van data wat deur organisasies versamel word, maak dit soms moeilik of onmoontlik om hierdie data deur blote observasies te interpreteer. ’n Verskeidenheid statistieke en statistiese berekeninge maak hierdie interpretasie moontlik en makliker. Hierdie vak word hoofsaaklik in vier afdelings verdeel. Eerstens, word ’n inleiding verskaf oor die aard van, en behoefte aan, statistiese berekeninge. Wanneer data versamel word, moet die aard van die data op ’n beskrywende manier voorgestel word. Hierdie statistieke, wat beide grafieke en numeriese berekeninge insluit, word beskrywende statistiek genoem. Studie-eenheid 1 bespreek onderskeidelik die grafiese en numeriese voorstelling van data. Die derde afdeling verskaf ’n grondslag vir inferensiële of afleidende statistiek (inferential statistics) – die berekeninge wat gebruik word om ’n kleiner groep data (steekproef) op ’n groter groep (populasie) van toepassing te maak. Waarskynlikhede, waarskynlikheidsverspreidings, en steekproewe en steekproefverspreidings word in Studie-eenheid 2 bespreek. Die laaste afdeling wat in hierdie vak behandel word, is hipotesetoetsing. Hier word sekere stellings oor eienskappe van die populasie (of populasies) statisties getoets. Studie-eenheid 3 verskaf ’n grondslag vir hipotesetoetsing. Die wyse waarop hipotese, wat met ’n enkele populasiegemiddeld te doen het, getoets word, word ook hier bespreek. Studie-eenheid 4 bou hierop voort deur ander gevalle van hipotesetoetsing te bespreek. Dit sluit, onder andere, hipotesetoetsing ten opsigte van gemiddelde oor twee of meer populasies in.

akademia Akademia MSW (Maatskappyregistrasienommer: 2005/024616/08) is voorwaardelik by die Departement van Hoër Onderwys en Opleiding tot 31 Desember 2016 as privaat hoëronderwysinstelling geregistreer ingevolge die Wet op Hoër Onderwys, 1997, Registrasienommer: 2011/HE08/005. Akademia is deel van die Solidariteit Beweging

w w w. a k a d e m i a . a c . z a


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.