Kuliah 12 analisis deskriptif dan inferensi

Page 1


Dapat memahami jenis analisis statistik dalam penyelidikan. ď Ž Dapat menggunakan jenis statistik yang sesuai dalam penyelidikan pendidikan. ď Ž


Analisis Statistik ď Ž

ď Ž ď Ž

Data merupakan skor mentah yang tidak memberi sebarang maklumat yang berguna kecuali dianalisis dengan menggunakan kaedah tertentu seperti kaedah berstatistik. Data perlu diproses untuk mendapatkan maklumat yang berguna dan bermakna daripada data. Pemprosesan data merupakan teknik untuk pengumpulan, pengolahan, penganalisisan, penyimpanan dan pengeluaran data.


Analisis Statistik Matlamat pemprosesan data ialah untuk mendapatkan maklumat yang berguna dan bermakna daripada data.

Analisis statistik berasaskan:Objektif penyelidikan Maklumat populasi atau sampel Populasi Populasi –– parameter parameter (keyakinan (keyakinan 100%) 100%) Sampel Sampel –– statistik statistik (keyakinan (keyakinan << 100%) 100%)

Aras ukuran pembolehubah Nominal, Nominal, Ordinal, Ordinal, Sela, Sela, Nisbah Nisbah


Dua jenis statistik: -

Statistik keperihalan atau deskriptif ď Ž Statistik Inferensi atau pentakbiran ď Ž


Perbezaan Statistik Deskriptif dan Inferensi

STATISTIK

FUNGSI  

DESKRIPTIF 

INFERENSI

UJIAN

Menghuraikan ciri-ciri pemboleh ubah. Ia digunakan untuk membuat kesimpulan mengenai data numerikal. Tidak membuat generalisasi daripada sampel kajian kepada populasi di mana sampel diambil.

Frekuensi, min, mod, medium, sela, sisihan piawai, varians, peratusan, kadar, nisbah, taburan normal, skor z dan sebagainya.

Menghurai perhubungan antara pemboleh ubah. Menghuraikan ciri-ciri sampel yang dipilih daripada populasi. Membuat generalisasi ciri-ciri sampel mengenai populasinya.

Ujian-t, unjian ANOVA, Ujian Khi-Kuasa Dua, ujian korelasi Pearson dan sebagainya.


For example, we use the Greek letter mu (i.e., Âľ) to symbolize the population mean and the Roman/English letter X with a bar over it, (called X bar), to symbolize the sample mean.



Statistik Deskriptif Merupakan statistik yang digunakan untuk menghuraikan ciri-ciri pembolehubah. Statistik deskriptif menggunakan petunjuk seperti min, sisihan piawai, medium, mod, taburan normal dan skor z untuk menyatakan ciri-ciri sesuatu pembolehubah.


Matlamat dan Kegunaan ď Ž untuk

meringkaskan data agar ia mudah difahami (menyediakan ringkasan data dan maklumat dalam bentuk yang jelas dan mudah)

ď Ž untuk

memerihal sesuatu peristiwa (contoh: memerihal taburan bilangan pelajar mengikut jantina)

ď Ž Teknik

untuk menerangkan data atau maklumat dengan cara meringkaskan beberapa set data atau maklumat seperti markah ujian, umur, tempat tinggal, jantina dll.


Langkah-Langkah : 1. Mengenal Mengenal pasti pasti pembolehubah pembolehubah 1. 2. Menyusun Menyusun dan dan meringkaskan meringkaskan data data 2. 3. Menggunakan Menggunakan teknik-teknik teknik-teknik statistik statistik yang yang sesuai sesuai 3.

untuk memerihal memerihal data data (guna (guna sukatan sukatan untuk kecenderungan memusat memusat seperti seperti min, min, mod, mod, kecenderungan penengah dan dan sukatan sukatan serakan serakan seperti seperti julat, julat, penengah varians dan dan sisihan sisihan piawai). piawai). varians


PENGUKURAN KECENDERUNGAN MEMUSAT Dilakukan dengan menggunakan satu nilai untuk mewakili satu set data. Measures of central tendency provide descriptive information about the single numerical value that is considered to be the most typical of the values of a quantitative variable. Three common measures of central tendency are the mode, the median, and the mean.


Istilah-istilah penting Min atau purata – purata arithmetik dan didapati dengan menjumlahkan skor-skor di dalam taburan skor dan dibahagikan dengan jumlah bilangan skor

Mod – skor yang mempunyai kekerapan terbanyak

Median atau penengah – skor yang membahagi duakan taburan skor supaya jumlah bilangan skor adalah sama di kedua-dua pihak. Nila yang terletak di tengah-tengah setelah disusun mengikut ranking. Sisihan piawai – pengukuran jarak daripada purata arithmetik

Julat – jarak antara skor terbesar dengan terkecil

Varian – bagaimana skor-skor diperbezakan daripada purata arithmetik


The mode is simply the most frequently occurring number.

(e.g., 2.5 is the median for the numbers 1, 2, 3, 7).

The median is the center point in a set of numbers

The mean is the arithmetic average (e.g., the average of the numbers 2, 3, 3, and 4, is equal to 3).

(e.g., three is the median for the numbers 1, 1, 3, 4, 9).


Taburan Normal ď Ž ď Ž

Merupakan satu graf yang menunjukkan bilangan skor atau nilai bagi sekumpulan responden. Kebanyakan populasi adalah bersifat taburan normal (graf berbentuk loceng). Kebanyakan subjek berada dalam lengkungan sederhana.

Min Penengah Mod


A Comparison of the Mean, Median, and Mode The mean, median, and mode are affected by what is called skewness (i.e., lack of symmetry) in the data.

Figure showed a normal curve, a negatively skewed curve, and a positively skewed curve


No skew (normal) - a variable is normally distributed, the mean, median, and mode are the same number. When the variable is skewed to the left (i.e., negatively skewed), the mean shifts to the left the most, the median shifts to the left the second most, and the mode the least affected by the presence of skew in the data when the data are negatively skewed, this happens: mean < median < mode.

When the variable is skewed to the right (i.e., positively skewed), the mean is shifted to the right the most, the median is shifted to the right the second most, and the mode the least affected. when the data are positively skewed, this happens: mean > median > mode.



Measures of variability tell you how "spread out" or how much variability is present in a set of numbers. They tell you how different your numbers tend to be. Note that measures of variability should be reported along with measures of central tendency because they provide very different but complementary and important information. Digunakan untuk menghurai keserakan pembolehubah iaitu sama ada nilai-nilai dalam satu kumpulan data berjauhan atau berdekatan antara satu sama lain. Tiga cara yang biasa digunakan ialah: • Sela • Sisihan piawai • varians


Sisihan piawai Petunjuk pengukuran yang utama dalam penyelidikan untuk menyatakan keserakan skor-skor dalam sesuatu taburan. Ia digunakan pada data skala sela dan nisbah. Sisihan piawai menunjukkan jumlah purata sesuatu nilai atau skor individu tersisih daripada skor min dalam sesuatu taburan.


Varians Varians juga digunakan untuk mengenal pasti keserakan skor-skor dalam satu taburan. Varians merupakan kuasa dua bagi nilai sisihan piawai.


To fully interpret one (e.g., a mean), it is helpful to know about the other (e.g., a standard deviation). An easy way to get the idea of variability is to look at two sets of data, one that is highly variable and one that is not very variable.

For example, which of these two sets of numbers appears to be the most spread out, Set A or Set B? • Set A. 93, 96, 98, 99, 99, 99, 100 • Set B. 10, 29, 52, 69, 87, 92, 100 If you said Set B is more spread out, then you are right! The numbers in set B are more "spread out"; that is, they are more variability. All of the measures of variability should give us an indication of the amount of variability in a set of data. We will discuss three indices of variability: the range, the variance, and the standard deviation.


Range (Sela/Julat) A relatively crude indicator of variability is the range (i.e., which is the difference between the highest and lowest numbers). Maximum score – Minimum score For example the range in Set A shown above is 7, and the range in Set B shown above is 90. • Set A. 93, 96, 98, 99, 99, 99, 100 • Set B. 10, 29, 52, 69, 87, 92, 100


Variance and Standard Deviation Two commonly used indicators of variability are the variance and the standard deviation. The standard deviation tells you (approximately) how far the numbers tend to vary from the mean. (If the standard deviation is 7, then the numbers tend to be about 7 units from the mean. If the standard deviation is 1500, then the numbers tend to be about 1500 units from the mean.) ••Zero Zerostands standsfor forno novariability variabilityat atall all (e.g., (e.g.,for forthe thedata data3, 3,3, 3,3, 3,3, 3,3, 3,3, 3, the thevariance varianceand andstandard standard deviation deviationwill willequal equalzero). zero).When When you youhave haveno novariability, variability,the the numbers numbersare areaaconstant constant(i.e., (i.e.,the the same samenumber). number).

••Higher Highervalues valuesfor forboth bothof of these theseindicators indicators(variance (variance and andSD) SD)indicate indicateaalarger larger amount amountof ofvariability variabilitythan than do dolower lowernumbers numbers


Contoh Mata Pelajaran

Pelajar 1

Pelajar 2

Pelajar 3

KH

54

64

70

BM

62

25

71

BI

86

88

74

Sains

74

72

74

Mat

65

95

72

Sej

82

65

78

PJK

84

98

68

Jumlah

507

507

507

72.42

72.42

72.42

Skor Min


Contoh Bil mata pelajaran

Minimu m

Maksimum

Jumlah Skor

Min

SP

Pelajar 1

7

54

86

507

72.42

11.43

Pelajar 2

7

25

98

507

72.42

29.20

Pelajar 3

7

68

78

507

72.42

3.02

Jika dibandingkan nilai sisihan piawai bagi ketiga-tiga pelajar, pelajar 2 mempunyai nilai paling besar iaitu 29.20, diikuti pelajar 1 (11.43) dan pelajar 3 (3.02). Ini bererti taburan skor pelajar 2 adalah terserak lebih jauh daripada nilai skor min dalam taburannya berbanding dengan taburan skor pelajar 1 dan 3.


Peratusan Dengan menggunakan peratusan, penyelidik dapat menyatakan peratusan setiap jenis data untuk menyatakan perhubungan antara pembolehubah. Analisis peratusan biasanya dinyatakan bersama dengan nilai frekuensi.



Perubahan peratusan Perubahan peratusan biasanya digunakan untuk membandingkan frekuensi dalam peratusan bagi aktiviti yang berlaku dalam satu masa yang tertentu dengan satu masa lain (digunakan dalam kajian longitudinal)


Contoh Kes salah laku tahun 2008 dan 2009

Salah laku

2008

2009

Perbezaan %

Merokok

16

25

56.25

Kes tumbuk

12

18

50.00

Mengugut

3

5

66.67



Inferential Statistics • Inferential statistics is defined as the branch of statistics that is used to make inferences about the characteristics of a populations based on sample data. • The goal is to go beyond the data at hand and make inferences about population parameters. • In order to use inferential statistics, it is assumed that either random selection or random assignment was carried out (i.e., some form of randomization must is assumed).


Inferential Statistics

Digunakan untuk untuk membuat membuat generalisasi generalisasi Digunakan keputusan kajian kajian yang yang diperoleh diperoleh daripada daripada keputusan sampel kajian kajian kepada kepada populasi populasi kajian. kajian. Dengan Dengan sampel data yang yang dikumpulkan dikumpulkan daripada daripada sampel, sampel, data penyelidik menggunakan menggunakan statistik statistik inferensi inferensi penyelidik untuk membuat membuat kesimpulan kesimpulan tentang tentang ciri-ciri ciri-ciri untuk populasi berdasarkan berdasarkan ciri-ciri ciri-ciri sampel. sampel. Statistik Statistik populasi inferensi menggunakan menggunakan ujian-ujian ujian-ujian berikut berikut bagi bagi inferensi menyatakan perhubungan perhubungan antara antara dua dua menyatakan pembolehubah pembolehubah


Bertujuan‌ ď Ž ď Ž

Menganalisis maklumat sampel sebagai anggaran kepada maklumat populasi. Menguji sejauh mana maklumat sampel (statistik) diyakini menganggar dengan tepat maklumat populasi (parameter).


Ujian Statistik Berkaitan 1. 2. 3. 4. 5.

Khi kuasa dua (chi-square) Ujian Korelasi Pearson Analisis pemfaktoran (factor analysis) Ujian-t Analisis varians (ANOVA)


Sampling Distributions One of the most important concepts in inferential statistics is that of the sampling distribution. That's because the use of a sampling distributions is what allows us to make "probability" statements in inferential statistics. • A sampling distribution is defined as "The theoretical probability distribution of the values of a statistic that results when all possible random samples of a particular size are drawn from a population." (For simplicity you can view the idea of "all possible samples" as taking a million random samples. That is, just view it as taking a whole lot of samples!)


Hypothesis Testing Hypothesis testing is the branch of inferential statistics that is concerned with how well the sample data support a null hypothesis and when the We use hypothesis testing when we expect a relationship to be present; in other words, we usually hope to “nullify� the null hypothesis and tentatively accept the alternative hypothesis null hypothesis can be rejected in favor of the

alternative hypothesis. The null hypothesis is usually the prediction that there is no relationship in the population. The alternative hypothesis is the logical opposite of the null hypothesis and says there is a relationship in the population.

Note that it is the null hypothesis that is directly tested in hypothesis testing (not the alternative hypothesis).



Probability Value The probability value is a number that is obtained from the SPSS computer printout. It is based on your empirical data, and it tells you the probability of your result or a more extreme result when it is assumed that there is no relationship in the population (i.e., when you are assuming that the null hypothesis is true which is what we do in hypothesis testing and in jurisprudence).


Significance Level [α] Aras Signifikan • Satu darjah yang boleh diterima oleh penyelidik untuk membuat keputusan sama ada menolak atau menerima hipotesis nol. • The significance level is just that point at which you would consider a result to be "rare." You are the one who decides on the significance level to use in your research study. It is the level that you set so that you will know what probability value will be small enough for you to reject the null hypothesis. • The significance level that is usually used in education is .05. • If your probability value is less than or equal to the significance level (e.g., .05) then you will reject the null hypothesis and tentatively accept the alternative hypothesis. If not (i.e., if it is > .05) then you will fail to reject the null. You just compare your probability value with your significance level.


Aras Signifikan [α] : 

 

Satu darjah yang boleh diterima oleh penyelidik untuk membuat keputusan sama ada menolak atau menerima Ho. Digunakan sebagai asas untuk menolak Ho . Merupakan risiko Ralat Jenis I yang penyelidik rela tanggung yakni menolak Ho yang benar atau paras keyakinan penyelidik dalam membuat keputusan menerima atau menolak Ho .  contoh: α = .05 menunjukkan paras keyakinan . 95 / 95% untuk menerima Ho benar.


Aras Signifikan [ι] : • The significance level is just that point at which you would consider a result to be "rare." You are the one who decides on the significance level to use in your research study. It is the level that you set so that you will know what probability value will be small enough for you to reject the null hypothesis. • The significance level that is usually used in education is .05.


You may be wondering, when do you actually reject the null hypothesis and make the decision to tentatively accept the alternative hypothesis? • You reject the null hypothesis when the probability of your result assuming a true null is very small. That is, you reject the null when the evidence would be unlikely under the assumption of the null. • In particular, you set a significance level (also called the alpha level) to use in your research study, which is the point at which you would consider a result to be very unlikely. Then, if your probability value is less than or equal to your significance level, you reject the null hypothesis. • It is essential that you understand the difference between the probability value (also called the p-value) and the significance level (also called the alpha level).


Aras Signifikan [α] :

Keputusan berasaskan Aras signifikan: α = .01 – sangat benar (ujian makmal) α = .05 – lazim digunakan (penyelidikan sains sosial) α = .10 – dibenarkan


Aras Signifikan [Îą] :

If your probability value is less than or equal to the significance level (e.g., .05) then you will reject the null hypothesis and tentatively accept the alternative hypothesis. If not (i.e., if it is > .05) then you will fail to reject the null. You just compare your probability value with your significance level.


Aras Signifikan Tidak Perlu

ď Ž ď Ž

Semua subjek dalam populasi adalah dijadikan responden. Prosedur persampelan bukan kebarangkalian digunakan.


Parametric Test A statistical test that involves making assumptions about estimates of population characteristics, or parameters.


Non Parametric Test A statistical test that does not involves the use of any population parameters, Âľ and Ďƒ are not needed, and underlying distribution does not have to be normal. Non-parametric tests are most often used to analyze ordinal and nominal data are referred to as non-parametric tests.


Steps in hypothesis testing‌ 1. 2.

3. 4.

State the null and alternative hypothesis State the significance level before the research study (most educational research use .05 as the significance level, is also called alpha level, or more simply, alpha). Obtain the probability value using a computer program such as SPSS. Compare the probability value to the significance level and make the statistical decision.


Rule 1:

If Probability value ≤ significance level (i.e. p ≤ α)

Then Reject the null hypothesis

And Conclude that the research finding is statistically significant


Rule 2: If Probability value > significance level (i.e. p > Îą) Then Fail to reject the null hypothesis And Conclude that the research finding is not statistically significant



Ralat Jenis l dan ll Ralat Jenis l Menolak hipotesis nol bila ia harus diterima. Ralat ini timbul apabila penyelidik menolak hipotesis nol yang benar. Penyelidik membuat keputusan bahawa terdapat perbezaan yang signifikan apabila ianya sebenar tidak ada. Ralat Jenis ll Tidak menolak hipotesis nol bila ia sebenarnya harus ditolak. Ralat ini timbul apabila penyelidik membuat keputusan bahawa tiada perbezaan, sedangkan wujud perbezaan.


Menentukan paras paras signifikan signifikan (α) (α) untuk untuk membuat membuat Menentukan keputusan menerima menerima atau atau menolak menolak Ho Ho dan dan sejauh sejauh keputusan mana kesanggupan kesanggupan penyelidikan penyelidikan menerima menerima risiko risiko mana rentetan RJ RJ II && RJ RJ II. II. rentetan Aturan Keputusan. Keputusan. Aturan Menentukan kawasan kawasan penolakan penolakan iaitu iaitu nilai nilai  Menentukan statistik bertentangan bertentangan dengan dengan nilai nilai Ho Ho yang yang statistik mengakibatkan Ho Ho ditolak. ditolak. mengakibatkan Kawasan penolakan penolakan bergantung bergantung kepada kepada aras aras  Kawasan signifikan. signifikan. 



More explanation.. • When the null hypothesis is true you can make the correct decision (i.e., fail to reject the null) or you can make the incorrect decision (rejecting the true null). The incorrect decision is called a Type I error or a "false positive" because you have erroneously concluded that there is an effect or relationship in the population. • When the null hypothesis is false you can also make the correct decision (i.e., rejecting the false null) or you can make the incorrect decision (failure to reject the false null). The incorrect decision is called a Type II error or a "false negative" because you have erroneously concluded that there is no effect or relationship in the population.


Membandingkan frekuensi

Khi kuasa dua 





Ujian Ujian bukan bukan parametrik parametrik yang yang banyak banyak digunakan digunakan dalam dalam penyelidikan penyelidikan sains sains sosial, sosial, terutamanya terutamanya dalam dalam kajian kajian yang yang menggunakan menggunakan skala skala Likert Likert sebagai sebagai skala skala pengukuran pengukuran kajian. kajian. Tujuan Tujuan ujian ujian ini ini adalah adalah untuk untuk membandingkan membandingkan frekuensi frekuensi yang yang diperhatikan diperhatikan dalam dalam sampel sampel dengan dengan frekuensi frekuensi yang yang dijangka dijangkayang yangsepatutnya sepatutnyawujud wujudsecara secarateori. teori. Skala Skala pengukuran pengukuran nominal nominal atau atau ordinal ordinal dan dan data data yang yang dikumpul dikumpuladalah adalahdalam dalam bentuk bentukfrekuensi. frekuensi.


Khi kuasa dua   

Persampelan rawak dan populasi dalam taburan normal. Untuk menjawab soalan mengenai data yang wujud dalam bentuk frekuensi. Contoh:  Kita ingin mengetahui sama ada wujud perbezaan yang signifikan antara pelajar daripada taraf sosio ekonomi tinggi atau rendah yang melanjutkan pelajaran atau keciciran. Kita memilih sampel daripada dua populasi (SES rendah dan tinggi), tentukan sama ada mereka melanjutkan pelajaran selepas SPM dan gunakan ujian khi kuasa dua.


Membandingkan dua atau lebih daripada dua kumpulan data sela atau nisbah ď Ž

ď Ž ď Ž ď Ž

Ujian-T

Statistik inferensi yang digunakan untuk membandingkan dua atau lebih daripada dua kumpulan data sela atau nisbah. Persampelan rawak. Populasi bertaburan normal. Digunakan untuk menentukan sama ada satu set atau set-set skor adalah berasal daripada populasi yang sama.


Ujian-T ď Ž

Ujian-t digunakan dalam kes-kes berikut; 1. 2. 3.

Saiz sampel kecil, iaitu 10 subjek dan ke atas. Pembolehubah bersandar diukur dalam skala sela atau nisbah. Kajian dilakukan untuk menentukan sama ada terdapat perbezaan yang signifikan secara statistik antara dua kumpulan data.


Ujian-T ď Ž

Tiga jenis ujian-t iaitu; Ujian- t untuk sampel bebas (Independent-Samples T Test) 2. Ujian-t untuk pengukuran berulangan (Paired-Samples T Test) 3. Ujian-t untuk satu sampel (Onesample T Test) 1.


Ujian-t Untuk Sampel Bebas ď Ž

Contoh- mengukur kreativiti antara dua kumpulan


Ujian-t Untuk Pengukuran Berulangan ď Ž

ď Ž

Digunakan apabila individu dalam sampel diukur dua kali dan kedua-dua data pengukuran digunakan untuk membuat perbandingan. Contoh: untuk melihat perbezaan min terhadap pencapaian markah Matematik sebelum dan selepas mengikuti bengkel motivasi.


Ujian-t Untuk Satu Sampel ď Ž ď Ž

ď Ž

Digunakan untuk membandingkan skor min sampel dengan skor min populasi. Ujian ini digunakan apabila data yang dikumpul memenuhi semua syarat ujian-t, iaitu data sela atau nisbah, taburan populasi normal (biasanya berlaku apabila N sama atau melebihi 50). Contoh; ďƒ˜

Seorang petani ingin menguji baja jenama baru untuk pokok jagung. Sebanyak 15 pokok jagung dipilih secara rawak daripada ladangnya dan diberikan baja jenama baru. Purata pertumbuhan jagung di ladangnya untuk tempoh dua minggu ialah 45cm. Selepas dua minggu, dia mengukur pertumbuhan 15 pokok jagung yang diberikan baja baru. Ujian-t dilakukan untuk melihat sama ada baja baru itu berkesan atau tidak.


Membandingkan lebih daripada dua kumpulan data sela atau nisbah

ď Ž

ANOVA

ANOVA atau analisis varians digunakan untuk membanding min apabila terdapat lebih daripada dua kumpulan perbandingan.


Regression Analysis Regression analysis is a set of statistical procedures used to explain or predict the values of a quantitative dependent variable based on the values of one or more independent variables. • In simple regression, there is one quantitative dependent variable and one independent variable. • In multiple regression, there is one quantitative dependent variable and two or more independent variables.


Perhubungan antara pemboleh ubah bersandar dengan pemboleh ubah bebas ď Ž ď Ž ď Ž

Ujian Korelasi

Pemboleh ubah bebas mengakibatkan kesan kepada pemboleh ubah bersandar. Pemboleh ubah bersandar menerima kesan akibat pemboleh ubah bebas. Perhubungan antara pemboleh ubah ini dinamakan sebagai korelasi.


Ujian Korelasi ď Ž

Beberapa jenis pekali ujian korelasi; 1. 2. 3. 4. 5. 6.

ď Ž ď Ž

Pekali Pearson product-moment (atau Pearson) Pekali Phi Pekali Point-biserial Pekali Spearman Rho Pekali Cramer dan Lambda dll

Jenis ujian ini bergantung kepada jenis skala pengukuran dan bilangan pembolehubah yang terlibat dalam korelasi. Kekuatan sesuatu korelasi diwakili oleh pekali dalam ujian korelasi.


Ujian Korelasi

Dua persoalan 1.

2.

Apakah persamaan yang mewakili perhubungan antara pemboleh ubah-pemboleh ubah? Apakah kekuatan perhubungan antara pemboleh ubah-pemboleh ubah tersebut?


Ujian Korelasi

Nilai pekali korelasi (r) ialah nilai pengukuran kekuatan perhubungan antara dua pembolehubah. Nilai r ini mempunyai sela antara +1.00 dan -1.00. Nilai pekali dilaporkan dalam nilai perpuluhan seperti r = .65 atau r = - .41


Ujian Korelasi

ď Ž

Pekali korelasi positif Y

X


Ujian Korelasi

ď Ž

Pekali korelasi negatif Y

X


Ujian Korelasi 

Contoh: 

Seorang penyelidik ingin mengetahui perhubungan antara IQ dengan prestasi ujian Matematik. Skor IQ dan prestasi ujian Matematik bagi 10 orang pelajar dikumpulkan dan disenaraikan. Berdasarkan pengiraan, nilai korelasi ialah 0.72. Nilai varians ialah 0.517. Ini bererti bahawa korelasi antara IQ dan prestasi ujian Matematik adalah kuat. 51.7% prestasi ujian matematik disebabkan oleh IQ sementara 48.3% lagi disebabkan oleh faktor lain. link


Kekuatan nilai pekali korelasi Saiz pekali korelasi (r)

Kekuatan korelasi

.91 hingga 1.00 atau -.91 hingga -1.00

Sangat kuat

.71 hingga .90 atau -.71 hingga -.90

Kuat

.51 hingga .70 atau -.51 hingga -.70

Sederhana

.31 hingga .50 atau -.31 hingga -.50

Lemah

.01 hingga .30 atau -.01 hingga -.30

Sangat lemah

00

Tiada korelasi



Maksud Nilai Pekali Sempurna Nilai pekali 1.00 a perfect positive correlation: changes in one variable are accompanied by equivalent changes in the same direction in the other variable, without exception. Nilai pekali .00 no correlation: changes in one variable have no relationship, or are randomly related, to changes in the other variable. Nilai pekali – 1.00 a perfect negative correlation: changes in one variable are accompanied by equivalent changes in the opposite direction in the other variable, without exception.


Graphic Representations of Data Another excellent way to describe your data (especially for visually oriented learners) is to construct graphical representations of the data

(i.e., pictorial representations of the data in two-dimensional space). • Some common graphical representations are bar graphs, histograms, line graphs, and scatterplots.


Pie Chart



Bar Graphs A bar graph uses vertical bars to represent the data. The height of the bars usually represent the frequencies for the categories that sit on the X axis. The X axis is the horizontal axis and the Y axis is the vertical axis. Bar graphs are typically used for categorical variables.


Histograms A histogram is a graphic that shows the frequencies and shape that characterize a quantitative variable.


Line Graphs A line graph uses one or more lines to depict information about one or more variables. • A simple line graph might be used to show a trend over time



Scatterplots A scatterplot is used to depict the relationship between two quantitative variables. • Typically, the independent or predictor variable is represented by the X axis (i.e., on the horizontal axis) and the dependent variable is represented by the Y axis (i.e., on the vertical axis).



Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.