Temel ve Klinik Biyoistatistik

Page 1

Temel ve Klinik

B‹YO‹STAT‹ST‹K Yenilenmiş 3. Baskı (Soru ilaveli)

Prof.Dr. Rian DİŞÇİ İstanbul Üniversitesi İstanbul Tıp Fakültesi

İSTANBUL TIP KİTABEVİ



Annem Fikriye (BRAVO) DİŞÇİ’ nin ve Babam Esat (DISHA) DİŞÇİ’ nin anısına...


©İstanbul Medikal Yayıncılık BİLİMSEL ESERLER dizisi TEMEL VE KLİNİK BİYOİSTATİSTİK Prof. Dr. Rian DİŞÇİ 3. Baskı 2015 ISBN - 978-605-4499-08-3 2015 İstanbul Medikal Yayıncılık Ltd. Şti. 34104, Çapa-İstanbul-Türkiye www.istanbultip.com.tr e-mail: info@istanbultip.com.tr Turgut Özal Cad. No: 4/A Çapa-İST. Tel: 0212.584 20 58 (pbx) 587 94 43 Faks: 0212.587 94 45

www.istanbultip.com.tr Yasalar uyarınca, bu yapıtın yayın hakları İstanbul Medikal Yayıncılık ltd.şti.’ye aittir. Yazılı izin alınmadan ve kaynak olarak gösterilmeden, elektronik, mekanik ve diğer yöntemlerle kısmen veya tamamen kopya edilemez; fotokopi, teksir, baskı ve diğer yollarla çoğaltılamaz.

UYARI Medikal bilgiler sürekli değişmekte ve yenilenmektedir. Standart güvenlik uygulamaları dikkate alınmalı, yeni araştırmalar ve klinik tecrübeler ışığında tedavilerde ve ilaç uygulamalarındaki değişikliklerin gerekli olabileceği bilinmelidir. Okuyuculara ilaçlar hakkında üretici firma tarafından sağlanan her ilaca ait en son ürün bilgilerini, dozaj ve uygulama şekillerini ve kontrendikasyonları kontrol etmeleri tavsiye edilir. Her hasta için en iyi tedavi şeklini ve en doğru ilaçları ve dozlarını belirlemek uygulamayı yapan hekimin sorumluluğundadır. Yayıncı ve editörler bu yayından dolayı meydana gelebilecek hastaya ve ekipmanlara ait herhangi bir zarar veya hasardan sorumlu değildir.

Yayına hazırlayan Yayıncı sertifika no İmy adına grafikerler Yazar Sayfa düzeni Redaksiyon ve Düzelti Kapak Baskı ve cilt

İstanbul Medikal Yayıncılık Ltd. Şti. 12643 Mesut Arslan, Tuğçe Yıldırım Rian Dişçi Mesut Arslan Tuğçe Yıldırım İmy Tasarım Gezegen Basım San. ve Tic. Ltd. Şti. 100. Yıl Mah. Matbaacılar Sitesi 2. Cad. No: 202/A, Bağcılar-İST Tel: (0212) 325 71 25


ÖNSÖZ

Siz değerli okurlardan gelen kıymetli eleştiriler ve yapıcı öneriler doğrultusunda kitap yeniden gözden geçirilmiş ve gerekli düzeltmeler yapılmıştır. Yine değerli öğrencilerimizden gelen yoğun istek üzerine kitapta yer alan tüm bölümlere ilişkin toplam 230 adet çoktan seçmeli soru ve yanıt anahtarı kitaba eklenmiştir. Yapılan bu eklemenin kitabın daha anlaşılabilir olmasında ve öğrencinin konuyla ilgili kendisini sınamasında yardımcı olacağını düşünmekteyim. Üçüncü basımın hazırlanmasında büyük yardımları ve emeği geçen çalışma arkadaşım Sevda Özel Yıldız (Ph D)’a teşekkürlerimi belirtmek isterim.

Prof. Dr. Rian DİŞÇİ

İstanbul, Mart 2015 İstanbul Üniversitesi, İstanbul Tıp Fakültesi, Biyoistatistik Anabilim Dalı

İ.Ü. Onkoloji Enstitüsü, Kanser Epidemiyolojisi ve Biyoistatistik Bilim Dalı rian@istanbul.edu.tr

v



İÇİNDEKİLER Bölüm 1. Tanımlar, Bilim Dili, Ölçüm Düzeyleri . . . . . . . . . . . . . . . 1 1.1. TANIMLAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. BİLİM DİLİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3. ÖLÇÜM DÜZEYLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Bölüm 2. Biyoistatistik Verilerin Sunulması . . . . . . . . . . . . . . . . . 7 2.1. TABLO SUNUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2. GRAFİK SUNUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12 2.2.1. KARTOGRAMLAR (HARİTALAR) . . . . . . . . . . . . . . . . . . . . . . .12 2.2.2. DİYAGRAMLAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13 2.2.2.1. ÇUBUK GRAFİKLER . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14 2.2.2.2. DAİRE DİLİMLERİ GRAFİĞİ . . . . . . . . . . . . . . . . . . . . . . .17 2.2.2.3. HİSTOGRAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18 2.2.2.4. ÇİZGİ GRAFİKLER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20 2.2.2.5. EĞRİSEL GRAFİKLER . . . . . . . . . . . . . . . . . . . . . . . . . . .24 2.2.2.6. YARI LOGARİTMALI GRAFİKLER . . . . . . . . . . . . . . . . . .25

Bölüm 3. Tanımlayıcı İstatistikler . . . . . . . . . . . . . . . . . . . . . . . . . .29 3.1. TOPLANMA ÖLÇÜLERİ . . . . . . . . . . . . . . . . . 3.1.1. ARİTMETİK ORTALAMA . . . . . . . . . . . . . 3.1.2. ORTANCA (MEDYAN) . . . . . . . . . . . . . . . 3.1.3. TEPE DEĞER, MOD . . . . . . . . . . . . . . . . 3.1.4. GEOMETRİK ORTALAMA . . . . . . . . . . . . 3.1.5. AĞIRLIKLI ORTALAMA . . . . . . . . . . . . . . 3.2. DAĞILIM (SAÇILMA) ÖLÇÜLERİ . . . . . . . . . . 3.2.1. YAYILMA GENİŞLİĞİ (AÇIKLIK, RANGE) 3.2.2. ÇEYREKLER ARASI YARI GENİŞLİK . . 3.2.3. 3.2.4. 3.2.5. 3.2.6.

. . . . . . . . . . . . . . . . .29 . . . . . . . . . . . . . . . . .29 . . . . . . . . . . . . . . . . .34 . . . . . . . . . . . . . . . . .38 . . . . . . . . . . . . . . . . .39 . . . . . . . . . . . . . . . . .40 . . . . . . . . . . . . . . . . .40 . . . . . . . . . . . . . . . .40 . . . . . . . . . . . . . . . . .40

(ÇEYREK SAPMA) ORTALAMA MUTLAK SAPMA . . . . . . . . . . . . . . . . . . . . . . . . . .41 VARYANS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42 STANDART SAPMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47 DEĞİŞİM KATSAYISI (VARYASYON KATSAYISI) . . . . . . . . . . .47

vii


Bölüm 4. Olasılık ve Kuramsal Dağılımlar . . . . . . . . . . . . . . . . . .49 4.1. OLASILIK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50 4.1.1. DENEY ÖNCESİ OLASILIK . . . . . . . . . . . . . . . . . . . . . . . . . . . .50 4.1.2. DENEYSEL OLASILIK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51 4.1.3. OLASILIĞIN ÖZELLİKLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . .52 4.1.4. BİRLEŞİK OLAYLARDA OLASILIK KURALLAR . . . . . . . . . . . .53 4.1.4.1. BAĞDAŞMAYAN OLAYLAR (ÖZEL TOPLAMA KURALI) .53 4.1.4.2. BAĞDAŞAN OLAYLAR (GENEL TOPLAMA KURALI) . . .54 4.1.4.3. BAĞIMSIZ OLAYLAR (ÖZEL ÇARPMA KURALI) . . . . . . .56 4.1.4.4. BAĞIMLI OLAYLAR (GENEL ÇARPMA KURALI) . . . . . . .56 4.1.5. ÖZEL BİR UYGULAMA ALANI

(TANI TESTLERİNİN DEĞERLENDİRİLMESİ) . . . . . . . . . . . . .59 4.1.5.1. BAYES TEOREMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .61 4.2. KURAMSAL DAĞILIMLAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62 4.2.1. BİNOM DAĞILIMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62 4.2.2. POISSON DAĞILIMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66 4.2.3. NORMAL DAĞILIM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .70 4.2.3.1. NORMAL DAĞILIMIN ÖZELLİKLERİ . . . . . . . . . . . . . . . . .71 4.2.3.2. NORMAL EĞRİNİN STANDARDİZASYONU . . . . . . . . . .73 4.2.3.3. NORMAL DAĞILIMA İLİŞKİN UYGULAMALAR . . . . . . . .74

Bölüm 5. Kuramsal Örnekleme Dağılımı . . . . . . . . . . . . . . . . . . . .79 5.1. ÖRNEKLEME DAĞILIMI VE STANDART HATA . . . . . . . . . . . . . . . .79 5.2. KURAMSAL ÖRNEKLEME DAĞILIMININ ÖZELLİKLERİ

(MERKEZİ SINIR TEOREMİ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .81

Bölüm 6. Örnekleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .87 6.1. RASTLANTISAL ÖRNEKLEME (OLASILIKLI ÖRNEKLEME) . . . . . .88 6.1.1. BASİT RASTLANTISAL ÖRNEKLEME . . . . . . . . . . . . . . . . . . .89 6.1.1.1. KURA YÖNTEMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .89 6.1.1.2. RASTLANTISAL SAYILAR YÖNTEMİ . . . . . . . . . . . . . . .89 6.1.1.3. SİSTEMATİK ÖRNEKLEME . . . . . . . . . . . . . . . . . . . . . . .90 6.1.2. KATMANLI ÖRNEKLEME . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91 6.1.3. KÜME ÖRNEKLEME . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91 6.1.4. OLASILIKLI ALAN ÖRNEKLEMESİ . . . . . . . . . . . . . . . . . . . . .92 6.2. YARGISAL ÖRNEKLEME . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92

Bölüm 7. Örneklem Büyüklüğü . . . . . . . . . . . . . . . . . . . . . . . . . . . .93 7.1. ANAYIĞIN ORTALAMASININ (μ) KESTİRİLMESİNDE ÖRNEKLEM BÜYÜKLÜĞÜ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94

viii


7.2. ANAYIĞIN ORANININ (P) KESTİRİLMESİNDE

ÖRNEKLEM BÜYÜKLÜĞÜ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .96 7.3. KONTROL VE DENEY GRUPLARINA İLİŞKİN, ORTALAMALARIN ( χ 1 , χ2 ) KARŞILAŞTIRILMASINDA

ÖRNEKLEM BÜYÜKLÜĞÜ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .98 7.4. KONTROL VE DENEY GRUPLARINA İLİŞKİN, BAŞARI

ORANLARININ (p1,p2) KARŞILAŞTIRILMASINDA ÖRNEKLEM BÜYÜKLÜĞÜ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .99

Bölüm 8. Ortalamaların Karşılaştırılması . . . . . . . . . . . . . . . . . . .101 8.1. KESTİRİM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .101 8.1.1. ORTALAMALARA İLİŞKİN KESTİRİM (GENELLEME) . . . . . . .101 8.1.2. STUDENT (t) DAĞILIMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .102 8.2.VARSAYIMLARIN KURULMASI VE SINANMASI

(HİPOTEZ TESTLERİ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .106 8.2.1. ÖRNEKLEM ORTALAMASI İLE ANAYIĞIN

ORTALAMASININ KARŞILAŞTIRILMASI . . . . . . . . . . . . . . . . .106 8.2.1.1. VARSAYIMLARIN (HİPOTEZLERİN) KURULMASI . . . . . .106 8.2.1.2. VARSAYIM SINAMASINDA KULLANILACAK

TESTİN SEÇİMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .109 8.2.1.3. GÜVEN DÜZEYİNİN SEÇİMİ . . . . . . . . . . . . . . . . . . . . . . .110 8.2.2. İKİ ÖRNEKLEM ORTALAMASININ

KARŞILAŞTIRILMASI

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .112

8.2.2.1. VARYANSLARIN EŞİTLİĞİNİN SINANMASI (F) TESTİ . .114 8.2.3. EŞLENDİRİLMİŞ SERİLERDE FARKIN ANLAMLILIĞININ

SINANMASI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .117

Bölüm 9. Oranların Karşılaştırılması . . . . . . . . . . . . . . . . . . . . . . .121 9.1. ORANLARA İLİŞKİN GENELLEME . . . . . . . . . . . . . . . . . . . . . . . . .121 9.2. ÖRNEKLEM ORANI İLE ANAYIĞIN ORANININ

KARŞILAŞTIRILMASI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .122 9.3. İKİ ÖRNEKLEM ORANININ KARŞILAŞTIRILMASI . . . . . . . . . . . . .124

Bölüm 10. Ki – Kare Testlerinin Kullanılması . . . . . . . . . . . . . . . .127 10.1. İKİ VEYA DAHA ÇOK BAĞIMSIZ GRUPTA,

NİTEL DEĞİŞKENLERİN KARŞILAŞTIRILMASI . . . . . . . . . . . . . . .127 10.1.1. YATES DÜZELTİMLİ Kİ-KARE TESTİ . . . . . . . . . . . . . . . . . . .130 10.1.2. FISHER KESİN Kİ-KARE ANALİZİ . . . . . . . . . . . . . . . . . . . . . .130 10.2. İKİ NİTEL DEĞİŞKEN ARASINDA İLİŞKİ

ARANMASI VE SINANMASINDA Kİ-KARE TESTİ . . . . . . . . . . . . .138 10.3. DENEYSEL BİR DAĞILIMIN KURAMSAL BİR

DAĞILIMA UYGUNLUĞUNUN SINANMASI . . . . . . . . . . . . . . . . . .140 ix


Bölüm 11. Korelasyon ve Regresyon . . . . . . . . . . . . . . . . . . . . . .151 11.1. REGRESYON DOĞRUSUNUN EN KÜÇÜK

KARELER YÖNTEMİ İLE ELDE EDİLMESİ . . . . . . . . . . . . . . . . . .155 11.2. BELİRLEME KATSAYISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .156 11.3. PEARSON-BRAVAIS KORELASYON KATSAYISI . . . . . . . . . . . . .157 11.3.1. KORELASYON KATSAYISININ

ANLAMLILIĞININ SINANMASI . . . . . . . . . . . . . . . . . . . . . . . . .157 11.4. REGRESYON KATSAYILARI İLE KORELASYON

KATSAYISI ARASINDAKİ İLİŞKİ . . . . . . . . . . . . . . . . . . . . . . . . . . .158 11.5. SPEARMAN SIRA FARKI İLİŞKİ KATSAYISI . . . . . . . . . . . . . . . . .163 11.5.1. rs'NİN ANLAMLILIĞININ SINANMASI . . . . . . . . . . . . . . . . . . .164 11.6. KISMİ KORELASYON KATSAYISI . . . . . . . . . . . . . . . . . . . . . . . . .166 11.7. ÇOKLU REGRESYON VE KORELASYON . . . . . . . . . . . . . . . . . . .167 11.7.1. ÇOKLU KORELASYON KATSAYISININ

ANLAMLILIĞININ SINANMASI . . . . . . . . . . . . . . . . . . . . . . . .168

Bölüm 12. Tek Yönlü Varyans Analizi (Model 1) . . . . . . . . . . . . . .173 12.1. VARYANS ANALİZİ MODELİNİN BİLEŞENLERİ . . . . . . . . . . . . . . .173 12.2. TOPLAM VARYANSIN AYRIŞTIRILMASI . . . . . . . . . . . . . . . . . . . .175 12.3. ÇOKLU KARŞILAŞTIRMA

(EN KÜÇÜK ÖNEMLİ FARK (LSD) YÖNTEMİ) . . . . . . . . . . . . . . . . . . . .177

Bölüm 13. Parametrik Olmayan Testler . . . . . . . . . . . . . . . . . . . .181 (Sıra İstatistik Testleri) 13.1. MANN WHITNEY U TESTİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .181 13.2. WILCOXON İŞARETLİ SIRA TESTİ . . . . . . . . . . . . . . . . . . . . . . . .184

Bölüm 14. Araştırma Planlanması . . . . . . . . . . . . . . . . . . . . . . . . .187 14.1. ARAŞTIRMA TİPLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .187 14.1.1. VAKA SERİLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .188 14.1.2. KESİTSEL ARAŞTIRMALAR . . . . . . . . . . . . . . . . . . . . . . . . . .188 14.1.3. KOHORT TİPİ ARAŞTIRMALAR . . . . . . . . . . . . . . . . . . . . . . .189 14.1.3.1. KOHORT TİPİ ARAŞTIRMALARDA RİSK ÖLÇÜTLERİ .190 14.1.4. VAKA KONTROL ARAŞTIRMALARI . . . . . . . . . . . . . . . . . . . .195 14.1.4.1. VAKA KONTROL ARAŞTIRMALARINDA

RİSK ÖLÇÜTLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .196 . . . . . . . . . . . . . .198 . . . . . . . . . . . . . . .199 . . . . . . . . . . . . . . .200 . . . . . . . . . . . . . . .200

14.1.5. PARALEL KONTROLLÜ KLİNİK ÇALIŞMA 14.1.6. DIŞ KONTROLLÜ KLİNİK ÇALIŞMA . . . . . 14.1.7. ÇAPRAZ KONTROLLÜ KLİNİK ÇALIŞMA . 14.2. RASTLANTISALLIK (RANDOMİZASYON) . . . .

x


14.3. KÖRLEME . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202

Bölüm 15. Tanı Testlerinin Değerlendirilmesi . . . . . . . . . . . . . . . .203 15.1. TANI TESTLERİ DEĞERLENDİRME

ÖLÇÜTLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .203 15.2. TANI KARAKTERİSTİĞİ EĞRİSİ (ROC) . . . . . . . . . . . . . . . . . . . . .209

Bölüm 16. Sağkalım (Sürvi Analizi) . . . . . . . . . . . . . . . . . . . . . . .221 16.1. 16.2. 16.3. 16.4. 16.5. 16.6.

SAĞKALIM ANALİZİNDE AMAÇ . . . . . . . . . . . . . . . . . . . . . . . . . . .221 SAĞKALIM ANALİZİNDE KARŞILAŞILAN PROBLEMLER . . . . . .222 SONLANMA İLE İLGİLİ TANIMLAR . . . . . . . . . . . . . . . . . . . . . . . . .222 SAĞKALIM ANALİZİ SONUÇLARININ SUNUMU . . . . . . . . . . . . . .223 KAPLAN–MEIER YÖNTEMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .224 YAŞAM TABLOSU YÖNTEMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . .232

Kaynakça . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .235 İstatistik Tabloları . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .236 Tablo Tablo Tablo Tablo

I. Rastlantısal Sayılar Tablosu . . . . . . . . . . . . . . . . . . . . . . . . . . . . .237 II. Poisson Olasılıkları . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .238 III. Standart Normal Eğri Alanları . . . . . . . . . . . . . . . . . . . . . . . . . .239 IV. Çeşitli Serbestlik Derecesi (s.d.) Ve (iki yönlü) Olasılık

Tablo Tablo Tablo Tablo Tablo Tablo

Va. α= 0.05 İçin F tablosu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .241 Vb. α= 0.01 İçin F tablosu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .242 VI. Ki-Kare Tablosu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .243 VII. Örneklem Oranlarına Ait % 95 Güven Aralıkları . . . . . . . . . . . .244 VIII. Örneklem Oranlarına Ait % 99 Güven Aralıkları . . . . . . . . . . .244 IX. 0.05 ve 0.01 Anlam Düzeylerine Karşılık Gelen

Değerlerine Karşılık Gelen t Tablosu . . . . . . . . . . . . . . . . . . . .240

Spearman Sıra Farkı İlişki Katsayısının Alt Sınırları . . . . . . . . .245 Tablo X. (iki yönlü) 0.05 Anlamlılık İçin Kritik U Değerleri . . . . . . . . . . . . .245 Tablo XI. (iki yönlü) 0.01 Anlamlılık İçin Kritik U Değerleri . . . . . . . . . . . .246 Tablo XII. Wilcoxon İşaretli Sıra Testinde Kritik T Değerleri . . . . . . . . . . .247

Ek 1. Ölçüm Düzeyleri ve Geçerli İstatistiksel İşlemler Tablosu . . . . .249 Ek 2. Kendimizi Sınayalım . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .251 2.1. Bölüm 1-4’e ilişkin sorular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .251 2.2. Bölüm 5-16’ya ilişkin sorular . . . . . . . . . . . . . . . . . . . . . . . . . . . . .273 Dizin

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .309

xi


xii


Bölüm 1

Tanımlar, Bilim Dili, Ölçüm Düzeyleri

1.1 . TANIMLAR İstatistik kelimesinin Latincede “devlet adamı” manasına gelen “Statista” kelimesinden ya da “devlet” anlamına gelen “status” kelimesinden türediği kabul edilir. Günümüzde istatistik kelimesi uluslararası bir terim olup sadece yazılış ve söyleyiş biçiminde farklılıklar gösterir ((İng.) Statistic, (Alm.) Statistik, (Fra.) Statistique, (İta.) Statistica). Bizde, Cumhuriyet’ten önce ihsa’iyyat tabiri kullanılmış, Cumhuriyet döneminde ise istatistik kelimesi dilimize yerleşmiştir. İstatistik kelimesi iki anlamda kullanılmaktadır. 1. İstatistik; deneklerle ilgili sayısal veriler veya bu sayısal verilerden hesap sonucu elde edilmiş ortalamalar, yüzdelik değerler, varyans, oransal değerler,…gibi değerlerdir. 2. İstatistik; veri toplama, özetleme, sunma ve bu verilerin çözümlenmesi ile neden–sonuç ilişkilerinin elde edilmesi, çeşitli alternatif kararların sınanması ile ilgili yöntemleri geliştiren bir bilim dalıdır. 1


İstatistik bilimi ile ilgili çeşitli tanımları verebiliriz. 1. İstatistik, sayı ile belirlenebilen yığın olaylarını özetlemek, ölçmek, tartmak, sınıflamak, karşılaştırmak ve özelliklerini saptayarak nedenlerini ve aralarındaki ilişkiyi bulmaya yardımcı olan bir bilim dalıdır. 2. Sayısal kümelerin ve bunlar arasındaki bağıntıların incelenmesine istatistik adı verilir. 3. İstatistik, yeterli derecede bilinmeyen bütünler hakkında olası bilgi sağlama yoludur. 4. İstatistik, toplumdaki olaylar hakkında, daha az sayıda veri toplayarak en az maliyetle, en kısa zamanda ve doğruluk derecesi yüksek bilimsel sonuçlara ulaşılması ve uygun kararlar alınması için teknikler geliştiren bir bilim dalıdır. İstatistik bilimi iki ana bölüme ayrılır. 1. Matematiksel İstatistik 2. Uygulamalı İstatistik Matematiksel İstatistik: İstatistik teorisinin matematiksel temellerini kuran, yeni kuramsal yaklaşımlarla teknikler üreten bir istatistik bilim dalıdır. Uygulamalı İstatistik: Matematiksel istatistiğin geliştirdiği teorileri ve teknikleri çeşitli alanlarda uygulayan, bu alanlardaki işleyişlerini kontrol eden ve bu tekniklerin uygulama alanlarına özgü uyarlamalar yapan, yeni teknikler geliştiren bir istatistik bilim dalıdır. Günümüzde Uygulamalı İstatistik, tıp, diş hekimliği, biyoloji, eczacılık, sosyoloji, psikoloji, veterinerlik, mühendislik, işletme,… gibi pek çok bilim dalında uygulama alanı bulmaktadır. Biyoistatistik uygulamalı bir istatistik dalı olup sağlık bilimleri alanında istatistik uygulamalarını içermektedir. Biyoistatistik: Matematik–istatistik tekniklerin tıp ve sağlık bilimlerinde uygulamalarını içeren, bu alana özgü uyarlamalar yapan, yeni teknikler üreten bir bilim dalıdır. 2


Biyoistatistik bilimi yığın olaylarını inceler ve bunlara ilişkin genel bağıntılar elde etmeye çalışır. Yığın olay: Bazı özellikleri ortak olan, ancak bireysel farklılıklar gösteren birimler topluluğunu ifade eder. Tipik olay: Bu çeşit olaylarda her birim diğeri ile özdeştir. Bu olaylardan birinin gözleme tabi tutulması diğerlerinin hepsini anlamak için yeterli olur. 1.2 . BİLİM DİLİ Bilimsel bir araştırmanın her aşamasında istatistik yöntem bilimi tekniklerini kullanmak kaçınılmazdır. Bilimsel araştırmanın aşamaları: 1. Amacın belirlenmesi (gözlem yapma, konu seçimi, hipotezlerin kurulması). 2. Planlama (yazılı bir protokolün hazırlanması, sorunun tanımı, çeşitli kaynaklara göre konunun önemi, sınanması düşünülen hipotezler, bağımlı ve bağımsız değişkenlerin tanımlanması, zorunlu olan ve olmayan kısıtlamalar, kullanılan kavramların tanımı, araştırmanın yönetimi, araç gereçler, gerekirse ön uygulama ile süre ve olanakların belirlenmesi,…). 3. Uygulama (verilerin toplanması). 4. Veri analizi (tanımlayıcı istatistikler, hipotez testlerinin sınanması). 5. Sonuçların yorumlanması ve raporun yazılması. Bu anlamda, istatistik, bilimsel araştırmalarda kullanılan ortak bir bilim dili olarak kabul edilir.

1.3.

ÖLÇÜM DÜZEYLERİ

Ölçüme sayı sistemi açısından bakıldığında, kullanılan sayıların taşıdığı özellikler ve olanak verdiği işlemlerden ötürü ölçekler arasında önemli farklılıklar vardır. 3


Ölçek türlerini birbirinden ayıran sayı sistemine ait özellikler şunlardır. 1. Gerçek sayılar birbirleriyle kesin bir sıra ilişkisi içindedir. (sıra özelliği). 2. Her gerçek sayı arasındaki uzaklık eşittir (aralık özelliği). 3. Gerçek sayılar sıfır noktasının belirlediği bir başlangıç noktasına sahiptir (başlangıç noktası, oran özelliği). Araştırmada incelenen bir özelliğin (değişkenin) ölçüm düzeyi; 1. sınıflayıcı (nominal), 2. sıralayıcı (ordinal, ranking), 3. aralıklı (interval), 4. oransal (ratio) ölçüm düzeylerinden herhangi birinde olabilir. Sınıflayıcı ölçüm düzeyi (nominal) Birimler çeşitli kategorilere göre sınıflanır. Bu ölçüm düzeyinde sıra, aralık ve oran özellikleri yoktur. Kan grubu, cinsiyet, göz rengi, tümör yerleşim yeri gibi değişkenler sınıflamalı ölçüm düzeyinde incelenir. Sıralayıcı ölçüm düzeyi (ordinal, ranking) Bu ölçüm düzeyinde sadece sıra özelliği vardır. Ağrı skoru, hastalık evresi gibi değişkenler sıralayıcı ölçüm düzeyine örnek gösterilir. Aralıklı ölçüm düzeyi (interval) Aralıklı ölçüm düzeyinde sadece sıra ve aralık özellikleri vardır. Hastanın ateşi değişkeni aralıklı ölçüm düzeyinde incelenir. Oransal ölçüm düzeyi (ratio) Sıra, aralık ve oran özelliklerinin tamamı vardır. 4


Uzunluk, zaman, ağırlık, hacim gibi ölçüme dayalı diğer tüm değişkenleri oransal ölçüm düzeyinde inceleyebiliriz. Sınıflayıcı ve sıralayıcı ölçüm düzeyinde incelenen değişkenleri nitel değişkenler, aralıklı ve oransal ölçüm düzeyindeki değişkenleri ise nicel değişkenler olarak adlandırabiliriz. Çeşitli ölçüm düzeylerinde geçerli olan istatistik işlemler ve sınama testleri aşağıdaki tabloda (Tablo 1) verilmektedir. Tablo 1. Ölçüm düzeyleri ve geçerli istatistik işlemler Ölçüm düzeyleri

Geçerli tanımlayıcı istatistikler

Sınıflayıcı (nominal)

Tepe değer (mod) Sıklık dağılımı (yukarıdakilere ek olarak) Ortanca Yüzdelik Sıra ilişki katsayısı

Sıralayıcı (ordinal)

Aralıklı veya oransal (interval, ratio) (normal dağılım geçerli ise)

(yukarıdakilere ek olarak) Aritmetik ortalama Standart sapma Korelasyon Regresyon

5

Geçerli sınama testleri Parametrik olmayan testler

Parametrik testler


6


Bölüm 2

Biyoistatistik VerilerinVerilerin Sunulması Sunumu

2.1. TABLO SUNUM İncelenen bir özelliğe (değişkene) ait çok sayıda gözlem değerinin (ham verinin) sadece liste halinde sunulması değişkenle ilgili açıklayıcı bilgi vermemektedir. Değişkenlerin tablolarla özetlenmesiyle gözlemlerle ilgili daha fazla bilgiye sahip oluruz. Aralıklı veya oransal ölçüm düzeyinde incelenen bir değişken için önce dağılım aralığı (en büyük değer–en küçük değer) hesaplanır. Belirlenen dağılım aralığı öngörülen sınıf sayısına (en az 5, en fazla 15) bölünerek sınıf genişliği hesaplanır. Uygun bir sunum için sınıf sayısının 10 civarında olması önerilir. Daha sonra, her sınıfa karşılık gelen gözlem sayısı çetele yöntemiyle (veya sayma yöntemiyle) belirlenir. Sınıf sayısının 10 olduğunu varsayarsak sıklık tablosu aşağıdaki gibi elde edilir (Tablo 1). 7


Tablo 1. Sıklık tablosu. Sınıflar Çetele 1.sınıf ........... 2.sınıf ........... 3.sınıf ........... 4.sınıf ........... 5.sınıf ........... 6.sınıf ........... 7.sınıf ........... 8.sınıf ........... 9.sınıf ........... 10.sınıf ........... Toplam

(Salt sıklık) fi f1 f2 f3 f4 f5 f6 f7 f8 f9 f10 n

Sıklık tablosuna yüzde sıklık, birikimli sıklık ve yüzde birikimli sıklık sütunları ilave edilerek tablonun daha açıklayıcı olması sağlanır. Yüzde sıklıklar salt sıklıkların toplam denek sayısına bölünmesiyle elde edilir. (Tablo 2). Tablo 2. Salt, birikimli ve yüzde sıklıklar. Sınıflar Salt sıklık Yüzde sıklık Birikimli sıklık (Yüzde birikimli sıklık) %Fi fi %fi Fi 1.sınıf f1 % f1 F1 % F1 2.sınıf f2 % f2 F2 % F2 3.sınıf f3 % f3 F3 % F3 4.sınıf f4 % f4 F4 % F4 5.sınıf f5 % f5 F5 % F5 6.sınıf f6 % f6 F6 % F6 7.sınıf f7 % f7 F7 % F7 8.sınıf f8 % f8 F8 % F8 9.sınıf f9 % f9 F9 % F9 10.sınıf f10 % f10 n 1.000 Toplam n 1.000

Sınıflayıcı veya sıralayıcı ölçüm düzeyinde incelenen bir değişkene ait sıklık tablosunda, sınıflar yerine, değişkene ait ölçülen kategorik değerler veya skorlar yer alır.

8


Örnek 1. 60 kişilik bir çalışma grubunda açlık kan şekeri ve sistolik kan basıncı değişkenleri ölçülmüştür. Bu ölçümlerle birlikte kişilerin cinsiyet bilgileri ve sigara içip içmediklerine ait bilgiler de toplanmıştır. 60 kişiye ait verilerin aşağıdaki gibi listelendiğini varsayalım (Tablo 3). Tablo 3. 60 Kişide cinsiyet, sigara, kan şekeri ve kan basıncı bilgileri. Denek Açlık kan no Cinsiyet Sigara şekeri

Sistolik Açlık kan Denek kan basıncı no Cinsiyet Sigara şekeri

Sistolik kan basıncı

1

1

1

95

110

31

2

1

116

127

2

1

2

99

122

32

2

1

98

118

3

1

2

87

124

33

2

1

89

125

4

1

2

106

106

34

2

1

86

120

5

1

2

105

117

35

2

2

105

119

6

1

2

116

118

36

2

2

100

125

7

1

2

95

115

37

2

1

104

123

8 9

1 1

1 1

96 104

121 111

38 39

2 2

1 1

99 87

120 128

10 11

1 1

1 2

111 85

125 118

40 41

2 2

2 2

100 101

119 120

12

1

2

108

108

42

2

2

110

120

13

1

2

91

111

43

2

1

98

121

14

1

2

102

119

44

2

2

98

118

15

1

2

96

115

45

2

1

117

120

16

1

1

106

120

46

2

1

101

118

17

1

2

96

117

47

2

1

103

121

18

1

1

93

126

48

2

1

106

118

19

1

1

100

119

49

2

1

102

118

20

1

2

95

113

50

2

1

99

120

21

1

2

96

116

51

2

1

87

107

22

1

2

101

118

52

2

1

104

112

23

1

2

98

124

53

2

2

94

132

24

1

2

113

120

54

2

1

95

130

25

1

2

106

114

55

2

1

106

114

26

1

2

100

133

56

2

1

106

119

27

1

2

113

120

57

2

1

94

107

28

1

1

89

116

58

2

1

90

108

29 30

1 1

2 2

107 89

122 119

59 60

2 2

1 2

98 96

132 132

( Cinsiyet : 1 = Kadın 2= Erkek ; Sigara : 1 = İçiyor 2 = İçmiyor )

9


Açlık kan şekeri değişkenine ait sıklık tablosunu oluşturmak isteyelim. Açlık kan şekerine ait en küçük değer 85, en büyük değer ise 117 ve dağılım aralığı 117–85=32 birimdir. Sınıf sayısını 9 kabul edersek sınıf genişliği (32/9)=3.56 ≅ 4 olur. Buna göre sıklık tablosu (’den az) özelliği kullanılarak aşağıdaki gibi elde edilir (Tablo 4). Tablo 4. Açlık kan şekeri sıklık tablosu. Salt (Sınıf gerçek sınırları) sıklık Sınıflar Çetele fi 85 - 89 'den az ///// 5 89 - 93 'den az ///// 5 93 - 97 'den az ///// ///// // 12 97 - 101 'den az ///// ///// // 12 101 - 105 'den az ///// //// 9 105 - 109 'den az ///// ///// 10 109 - 113 'den az // 2 113 - 117 'den az //// 4 117 - 121 'den az / 1 Toplam 60

Yüzde sıklık %fi 0,083 0,083 0,200 0,200 0,150 0,167 0,033 0,067 0,017

Birikimli sıklık Fi 5 10 22 34 43 53 55 59 60

Yüzde birikimli sıklık %Fi 0,083 0,167 0,367 0,567 0,717 0,883 0,917 0,983 1,000

Sıklık tablosunu (’den az) özelliğini kullanmadan da aşağıdaki gibi oluşturabiliriz (Tablo 5). Tablo 5. Açlık kan şekeri sıklık tablosu. (Sınıf ölçü sınırları) Sınıflar 85 - 88 89 - 92 93 - 96 97 - 100

Çetele ///// ///// ///// ///// // ///// ///// //

fi 5 5 12 12

%fi 0,083 0,083 0,200 0,200

Fi 5 10 22 34

%Fi 0,083 0,167 0,367 0,567

101 - 104

///// ////

9

0,150

43

0,717

105 - 108

///// /////

10

0,167

53

0,883

109 - 112

//

2

0,033

55

0,917

113 - 116

////

4

0,067

59

0,983

117 - 120 Toplam

/

1 60

0,017

60

1,000

10


Sınıf gerçek sınırları arasındaki orta değerler sınıf değerleri olarak kabul edilir. Bir önceki tabloya ait sınıf ölçü değerleri, sınıf gerçek sınırları ve sınıf değerleri aşağıdaki gibidir (Tablo 6). Tablo 6. Sınıf sınırları. (Sınıf gerçek sınırları) Sınıflar

(Sınıf ölçü sınırları) Sınıflar

Sınıf değerleri

84.5 - 88.5’den az

85 - 88

86.5

88.5 - 92.5’den az

89 - 92

90.5

92.5 - 96.5’en az

93 - 96

94.5

96.5 – 100.5’den az

97 - 100

98.5

100.5 – 104.5’den az

101 - 104

102.5

104.5 – 108.5’den az

105 - 108

106.5

108.5 – 112.5’den az

109 - 112

110.5

112.5 – 116.5’den az

113 - 116

114.5

116.5 – 120.5’den az

117 - 120

118.5

Cinsiyet değişkenine ait sıklık tablosu (Tablo 7) ve sigara içmenin cinsiyete göre dağılışı (Tablo 8) aşağıda verilmektedir. Tablo 7. Cinsiyet dağılımı. Cinsiyet Kadın Erkek Toplam

Salt sıklık n 30 30 60

Yüzde sıklık % 0.50 0.50 1.00

Tablo 8. Cinsiyete göre sigara içme durumu.

Kadın Erkek Toplam

Sigara içiyor n % 8 %26.67 22 %73.33 30 %50.00

Sigara içmiyor n % 22 %73.33 8 %26.67 30 %50.00 11

Toplam n 30 30 60


2.2. GRAFİK SUNUM Araştırmaların istatistiksel değerlendirilmesi sonucu elde edilen veriler kullanılarak, incelenen değişkenlerin kendi içindeki değişmeleri veya değişkenler arasındaki ilişkilerin karşılaştırmalı olarak çeşitli geometrik şekil veya resimlerle ifade edilmesine grafik gösterim diyoruz. Çizilecek grafiğin şekli incelenen değişkeni veya değişkenleri ayrıntılı bir şekilde canlandırabilmeli ve grafik herkes tarafından kolayca anlaşılabilmelidir. İstatistik incelemelerde elde edilen sayısal verinin (istatistik tabloların) yanında bu sayısal veriye ait grafiklerin verilmesinin yararlarını aşağıdaki gibi sıralayabiliriz. 1. İstatistik tabloları, grafik çizimleri ile herkesin kolayca anlayabileceği hale gelir. 2. Olayların karşılaştırılması grafiklerde daha kolaydır. 3. Grafik bilgilerin akılda tutulması daha kolaydır. 4. Grafik yardımıyla ara değer bulma (interpolasyon) işlemi yapılarak olaylarla ilgili eksik bilgiler tamamlanabilir. 5. Grafik sunum okuyucunun konu üzerindeki ilgisini arttırır. Grafik tiplerini iki ayrı kısımda inceleyebiliriz.

2.2.1. KARTOGRAMLAR (HARİTALAR) Bir değişkene ait değerlerin (yoğunlukların) çeşitli yerlere göre dağılışının harita üzerinde gösterilmesine kartogram denir. Harita üzerinde her bölgeye ait değerler özel işaretlerle (çeşitli taramalar, sık veya seyrek noktalar, çeşitli renkler, aynı rengin çeşitli tonları) gösterilir. Şekil 1'de verilen kartogram kalp hastalıklarına ilişkin ölüm hızının illere göre dağılımını göstermektedir.

Şekil 1. Kalp hastalıklarına ilişkin ölüm hızlarının illere göre dağılımı (1985- 1988). 12


2.2.2. DİYAGRAMLAR İstatistikte grafik ile diyagram kelimesi genellikle birbiri yerine kullanılmaktadır. Bundan sonraki bölümlerde grafik kelimesi tek başına kullanıldığında diyagram ifade edilecektir. İncelenen değişkene veya değişkenlere ait sonuçları temsil etmek için çeşitli geometrik şekillerle veya resimlerle yapılan çizimlere grafikler diyoruz. Çizilecek grafik türünün belirlenmesinde grafiği çizilecek değişken veya değişkenlerle ilgili olarak aşağıdaki sorulara cevap vermeliyiz. 1. Değişken hangi ölçüm düzeyinde ölçülmüştür? Sınıflayıcı veya sıralayıcı (nitel) ölçüm düzeyinde incelenen bir değişken için çubuk grafikleri ve daire dilimleri grafiği kullanılır. Aralıklı ve oransal (nicel) ölçüm düzeyinde ise histogram, çizgi grafikleri ve eğrisel grafikler kullanılır. 2. Çizilecek grafik kaç boyutlu olmalıdır? Grafikler genellikle iki boyutlu olarak çizilir. Grafiklere üçüncü boyut (derinlik) ilave edilerek grafiklerin algılanması kolaylaşır. 3. Kullanılacak eksen türü ne olmalıdır? Eğer seri terimleri arasındaki mutlak farklar inceleniyorsa doğrusal ölçülü eksen, seri terimleri arasındaki artış ya da azalış oranları karşılaştırılmak isteniyorsa logaritmik ölçü eksen kullanılır. 4. İncelenen değişkene ait hangi sıklık türü kullanılacak? Genellikle grafiklerde salt ve yüzdeli sıklıklar kullanılır. Eğer sınıf genişlikleri farklı olan serilerin karşılaştırılması isteniyorsa, birikimli seri grafikleri kullanılır. Sık kullanılan grafik türleri aşağıda verilmektedir. 1. Çubuk grafikler. 2. Daire dilimleri grafiği. 3. Histogram. 13


4. Çizgi grafikleri. 5. Eğrisel grafikler. 6. Yarı logaritmalı grafikler.

2.2.2.1.

ÇUBUK GRAFİKLER

Astımlı hastalarda sigara içme sıklığına ilişkin bilgiler aşağıda verilmektedir. (Tablo 9). Grafiği çizilecek değişken (astımlı hastalarda sigara içme durumu) sınıflamalı ölçüm düzeyinde incelendiğinden çubuk grafik türünü kullanmak uygun olur. Şekil 2'de verilen çubuk diyagramında her çubuğun genişliği birbirine eşittir. Aynı grafiğe derinlik boyutu ilave edilerek, grafik, üç boyutlu olarak da çizilebilir (Şekil 3). Tablo 9. Astımlı Hastalarda Sigara İçme Sıklığı Sigara içme durumu Hiç sigara içmemiş Halen sigara içiyor Daha önce sigara içmiş Toplam

Yüzde (%) 73.46 11.39 15.15 100.00

(Kaynak: Yildiz, F; Dursun, AB ; Disci, R PASTE Study Grp :”Prevalence of asthmatic smokers: Turkish experience (PASTE Study)”CLINICAL RESPIRATORY JOURNAL Volume: 8 Issue: 3 Pages: 350-356 DOI: 10.1111/crj.12079 Published: JUL 2014)

Şekil 2. Astımlı hastalarda sigara içme sıklığı. 14


Şekil 3. Astımlı hastalarda sigara içme sıklığı. Astımlı hastalarda sigara içme sıklığının bölgelere göre dağılımına (Tablo 10) ilişkin grafiği Şekil 4'deki gibi çizebiliriz. Aynı grafik üzerinde 2 ya da daha çok değişkeni birlikte incelemek mümkündür. Tablo 10. Astımlı hastalarda sigara içme sıklığının bölgelere göre dağılımı Bölgeler Doğu Anadolu Güney Doğu Anadolu Karadeniz Akdeniz Ege İç Anadolu Marmara

Hiç sigara içmemiş % 78 81 82 68 78 75 66

Halen içiyor veya daha önce içmiş bırakmış % 22 19 18 32 22 25 34

(Kaynak: Yildiz, F; Dursun, AB; Disci, R PASTE Study Grp :”Prevalence of asthmatic smokers: Turkish experience (PASTE Study) ”CLINICAL RESPIRATORY JOURNAL Volume: 8 Issue: 3 Pages: 350-356 DOI: 10.1111/crj.12079 Published: JUL 2014

15


Şekil 4. Astımlı hastalarda sigara içme sıklığının bölgelere göre dağılımı. Yine, 100.000 doğumda anne ölüm oranı değişkeninin uluslar arası karşılaştırmasını da (Tablo 11) çubuk grafikleri ile gösterebiliriz (Şekil 5).

Tablo 11. Anne Ölüm Oranı Uluslararası Karşılaştırması, (100.000 Canlı Doğumda), 2010 Dünya Orta- Üst Gelir Grubu Ülkeler DSÖ Avrupa Bölgesi Türkiye Üst Gelir Grubu Ülkeler

210.0 53.0 20.0 15.4 14.0

(Kaynak: Türkiye Halk Sağlığı Kurumu, DSÖ World Health Statistics 2013 Not: Türkiye verisi 2012 yılına aittir.

16


Şekil 5. Anne Ölüm Oranı Uluslararası Karşılaştırması, (100.000 Canlı Doğumda), 2010

2.2.2.2.

DAİRE DİLİMLERİ GRAFİĞİ

Çubuk grafikleri bölümünde grafiği çizilen astımlı hastalarda sigara içme durumu” değişkeni için daire dilimleri grafik türünü de (Şekil 6.) kullanabiliriz. İncelenen değişkene ait yüzde sıklık değerlerini kullanarak daire dilimlere ayrılır. Örneğin, hiç sigara içmeyenleri göstermek için % 74 sıklık değerine karşılık gelen daire dilimi için % 74 x 360 = 266.40 derecelik bir pay ayrılır.

Şekil 6. Astımlı hastalarda sigara içme sıklığı. 17


2.2.2.3. HİSTOGRAM 184 öğrencide ölçülen boy değişkenine ilişkin değerler Tablo 12'de verilmektedir. Boy değişkeni oransal ölçüm düzeyinde incelenen bir değişkendir. Yatay eksende boy değişkeni, dikey eksende sıklık değerleri (salt ya da yüzdeli sıklıklar) kullanılarak histogram çizilir (Şekil 7). Histogramda çubuk genişlikleri sınıf genişliklerine karşılık gelir. Çubukların üst orta noktaları birleştirilerek histogram grafiği, sıklık çokgeni veya sıklık eğrisine dönüştürülebilir (Şekil 8). Tablo 12. Öğrencilerin boy değerleri. Sınıflar

Sınıf Değeri

Salt Sıklık

147,5 - 152,5 'den az

150

4

152,5 - 157,5 'den az

155

12

157,5 - 162,5 'den az

160

19

162,5 - 167,5 'den az

165

35

167,5 - 172,5 'den az

170

46

172,5 - 177,5 'den az

175

38

177,5 - 182,5 'den az

180

19

182,5 - 187,5 'den az

185

8

187,5 - 192,5 'den az Toplam

190

3 184

Şekil 7. Öğrencilerin boy değerleri. 18


Şekil 8. Öğrencilerin boy değerleri. Histogram grafik türü kullanılarak nüfusun yaşa ve cinsiyete göre dağılışının incelendiği özel grafik türüne nüfus piramidi denir. 2013 Türkiye nüfusunun yaşa ve cinsiyete göre dağılışına ilişkin nüfus piramidi Şekil 9'da verilmektedir. Yatay eksende salt nüfus (ya da yüzdeli sıklık), dikey eksende ise yaş değerleri yer almaktadır. Piramidin sol tarafı erkeklere ait bilgileri, sağ tarafı ise kadınlara ait bilgileri içerir. Adrese dayalı nüfus kayıt sistemi sonuçlarına göre, nüfusun cinsiyete göre dağılışı aşağıda verilmektedir. (Tablo 13.) Tablo 13. 31 Aralık 2013 tarihi itibarıyla Türkiye nüfusunun cinsiyete göre dağılışı Erkek Kadın Toplam

38.473.360 38.194.504 76.667.864

% 50.2 % 49.8

Kaynak : Türkiye İstatistik Kurumu, Haber Bülteni, Sayı: 15974 - 29 Ocak 2014

19


31 Aralık 2013 tarihi itibarıyla Türkiye nüfusu 76 667 864’tür. Erkek nüfusun oranı %50,2 (38 473 360 kişi), kadın nüfusun oranı ise %49,8 (38 194 504 kişi)‘dir.

Şekil 9. 2013 yılı Türkiye nüfus piramidi. Kaynak : Türkiye İstatistik Kurumu, Haber Bülteni, Sayı: 15974 - 29 Ocak 2014

2.2.2.4. ÇİZGİ GRAFİKLER 6-11 yaş grubu çocuklarda ortalama sistolik kan basıncı değerlerinin yaşa ve cinsiyete göre dağılımına (Tablo 14) ilişkin çizgi (doğru) grafiği Şekil 10'da verilmektedir. Yatay eksende yaş, dikey eksende ise sistolik kan basıncı değerleri yer almaktadır. Her iki değişken oransal ölçüm düzeyinde incelenmiştir.

20


Tablo 14. 6-11 yaş çocuklarda ortalama sistolik kan basıncı değerleri (mm-Hg) . Yaş

Ortalama Kan Basıncı (mm-Hg) Kız Erkek

6

103,4

102,4

7

103,8

103,0

8

106,9

105,9

9

107,8

105,3

10

110,9

107,6

11

114,1

108,1

(Kaynak: Kıyak, M., Dişçi, R., Ertem, G.: “İlkokul çocuklarında kan basıncı araştırması”, Tıp Fak Mec., 48,386-393, (1985))

Şekil 10. 6-11 Yaş çocuklarda ortalama sistolik kan basıncı değerleri (mm-Hg) Yine, 1987-1991 döneminde, İstanbul Tıp Fakültesi'nden taburcu olan hastaların yıllara ve cinsiyete göre dağılımı Tablo 15’de verilmektedir. 21


Dağılımı gösteren çizgi grafiğinin (Şekil 11) yatay ekseninde yer alan süre değişkeni oransal ölçüm düzeyinde incelenen bir değişkendir. Dikey eksende ise, salt sıklıklar kullanılmıştır. Bu tür grafiklere zaman grafiği adı da verilir. Tablo 15. 1987-1991 Yıllarında İstanbul Tıp Fakültesi’nden taburcu olan hastaların cinsiyete göre dağılımı. Taburcu olan hastalar Yıllar

Erkek

Kadın

1987

13450

17638

1988

13113

15126

1989

13336

13535

1990

14796

15240

1991

13571

14565

Şekil 11.1987-1991 Yıllarında İstanbul Tıp Fakültesi'nden taburcu olan hastaların cinsiyete göre dağılımı.

22


1 yaşından küçük çocuk ölümlerinin kaç aylıkken öldüklerini (Tablo 16) göstermek için de çizgi grafik türünü kullanabiliriz (Şekil 12). Tablo 16. Bir yaşından küçük çocuk ölümlerinin kaç aylıkken öldüklerine göre dağılım (1988). Ay 1 2 3 4 5 6 7 8 9 10 11

Ölüm sayısı 12855 1537 871 501 400 398 545 624 766 723 734

(Kaynak : D.İ.E., İl ve ilçe merkezlerinde ölüm istatistikler (1988), sayfa:78.)

Şekil 12. Bir yaşından küçük çocuk ölümlerinin kaç aylıkken öldüklerine göre dağılımı (1988). 23


2.2.2.5. EĞRİSEL GRAFİKLER Çizgi grafik türünde yatay eksende yer alan değişken daha sık aralıklarla incelendiğinde çizgi grafiği eğrisel grafiğe dönüşür. 0-11 yaş erkek çocuklarının 3., 50. ve 97. boy persantil değerlerine (Tablo 17) ilişkin grafik, eğrisel grafik türü ile gösterilebilir (Şekil 13). Tablo 17. 0-11 yaş erkek çocuklarda 3., 50. ve 97. boy persantil değerleri (cm). Yaş

3.Persantil

50.Persantil

97.Persantil

Yeni doğan

48,1

51,0

53,9

3 ay

55,5

61,0

66,5

6 ay

60,9

67,0

73,0

9 ay

65,3

71,0

76,6

1 yaş

69,4

76,0

82,5

1 Y. 6 ay

71,4

79,0

86,5

2 yaş

76,0

84,0

91,9

2 Y. 6 ay

77,3

86,0

94,6

3 Yaş

79,6

90,0

100,2

3 Y. 6 ay

88,5

95,0

101,5

4 yaş

88,9

98,0

107,0

5 yaş

93,1

104,0

114,7

6 yaş

106,6

117,0

127,3

7 yaş

110,9

121,0

131,0

8 yaş

114,5

126,0

137,4

9 yaş

118,5

132,0

145,3

10 yaş

124,6

137,0

149,2

11 yaş

128,5

140,0

151,3

(Kaynak : Dişçi, R., Irmak, Y.: “0-11 Yaş Grubundaki Çocuklarda Tartı ve Boy Değişkenlerine İlişkin Persantil Değerlerinin Elde Edilmesinde Monte-Carlo Yönteminin Kullanılması”, Tıp Fak Mecm., 49:223-230, (1986).)

24


Şekil 13. 0 - 11 yaş erkek çocuklarda 3., 50. ve 97. boy persantil eğrileri.

2.2.2.6. YARI LOGARİTMALI GRAFİKLER X ve Y değişkenlerinin 10 günlük ölçüm değerleri Tablo 18'de verilmektedir. Tablo 18'den de görüleceği gibi X değeri günlük ortalama % 22'lik bir artışla, Y değerleri ise %35'lik bir artışla artmaktadır. X ve Y değerleri karşılaştırıldığında incelemede esas olan X ve Y değişkenlerine ait mutlak değerler ise dikey eksende doğrusal ölçü kullanılır (Şekil 14). X ve Y değişkenlerinin günlük artış hızları karşılaştırılmak isteniyorsa, dikey eksende doğrusal ölçek yerine logaritmik ölçek kullanılır (Şekil 15). Şekil 15 incelendiğinde Y değişkeninin X'e göre daha fazla arttığı açıkça görülmektedir. Şekil 14'de ise hangi değişkenin daha fazla arttığı (ya da azaldığı) belli değildir.

25


Tablo 18. X ve Y değişkenlerinin 10 günlük ölçüm değerleri. Gün

x

y

Log(x)

Log(y)

1

100,00

20,00

2,00

1,30

2

122,00

27,00

2,09

1,43

3

148,84

36,45

2,17

1,56

4

181,58

49,21

2,26

1,69

5

221,53

66,43

2,35

1,82

6

270,27

89,68

2,43

1,95

7

329,73

121,07

2,52

2,08

8

402,27

163,44

2,60

2,21

9

490,77

220,65

2,69

2,34

10

598,74

297,87

2,78

2,47

Şekil 14. X ve Y değişkenlerinin 10 günlük ölçüm değerleri (dikey eksen doğrusal ölçekli). 26


Şekil 15. X ve Y değişkenlerinin 10 günlük ölçüm değerleri (dikey eksen logaritmik ölçekli).

27



Bölüm 3

Tanımlayıcı İstatistikler

Araştırmada incelenen bir değişkene ait tüm verileri özetleyen tipik değerlere toplanma ölçüleri (merkezi eğilim) denir. Gözlem veya ölçüm değerlerinin ortalamadan ne kadar uzaklaştıkları, diğer bir ifadeyle, ortalamaya ne kadar yaklaştıkları, ölçüm değerlerinin hangi aralıkta yer aldıkları dağılım (saçılma) ölçüleri ile belirlenir. Anayığının tamamının incelenmesi veya gözleme tabi tutulması ile elde edilen verilere ait toplanma ve dağılım ölçülerine parametre, anayığın yerine, anayığını temsil ettiği düşünülen örnekleme ait toplanma ve dağılım ölçülerine ise istatistik adını veriyoruz. İstatistikler parametrelerin kestirim (tahmin) değerleridir.

3.1. TOPLANMA ÖLÇÜLERİ 3.1.1. ARİTMETİK ORTALAMA Gözlemlerin

sayısal

değerlerinin

toplamının

gözlem

sayısına

bölünmesiyle elde edilir. İncelenen grup örneklem ise aritmetik ortalama x (veya m ) simgesi ile, anayığın (evren) ise

µ simgesi ile gösterilir.

Basit serilerde aritmetik ortalama aşağıdaki ifade ile hesaplanır. n

!x

N

(örneklem için) x =

i =1

n

!x

i

i

, (anayığın için ) µ = 29

i =1

N


Formüllerde yer alan simgelerin açıklanması :

x ,

µ ! xi

: Aritmetik ortalama. : Toplama simgesi. : X değişkeninin i. gözlem değeri.

n : Örneklem birim sayısı. N : Anayığın birim sayısı. Örnek 1. 13 kişilik bir örneklem grubunda sistolik kan basıncı değerleri ölçülmüştür (Tablo 1). Elde edilen basit seride aritmetik ortalamayı hesaplayınız. Tablo 1. 13 Kişide sistolik kan basıncı değerleri

xi

Denek no 1 2 3 4 5 6 7 8 9 10 11 12 13

127 118 125 120 119 125 123 120 128 119 120 120 121

Çözüm : n = 13 13

!x

i

= (127 + 118 + … + 121) = 1585

i =1

30


n

x=

13

! xi

!x

i

i =1

i =1

=

n

13

=

1585 = 121.92 13

Sınıflanmış–gruplanmış serilerde aritmetik ortalama aşağıdaki ifade ile hesaplanır. k

x=

!

fi xi

i =1 k

!

fi

i =1

Burada k = sınıf sayısını, f i

ise sınıf sıklığını göstermektedir. Sınıf k

sıklıklarının toplamı örneklemdeki toplam denek sayısını verir

!f

i

=n

i =1

k

İncelenen grup anayığın ise

!f

i

= N ’dir.

i =1

Örnek 2 . 340 kişilik bir örneklem grubunda, X dersine ait sınav sonuçları sınıflanmış sıklık serisi ile verilmektedir (Tablo 2). Aritmetik ortalamayı hesaplayınız. Tablo 2. 340 kişilik örneklemde (X) dersi sınav sonuçları Sınıflar (’den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam 31

fi 3 12 35 45 110 45 35 30 15 10 340


Çözüm : Sınıf gerçek sınırları arasındaki orta değerler hesaplanarak sınıf değerleri ( xi ) ve sınıf değerleri ile sınıf sıklıkları çarpılarak

10

!

f i xi değeri hesaplanır

i =1

(Tablo 3). Tablo 3. Sınıflar (’den az)

xi

fi

f i xi

0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam

5 15 25 35 45 55 65 75 85 95

3 12 35 45 110 45 35 30 15 10 340

15 180 875 1575 4950 2475 2275 2250 1275 950 16820

k

!fx i

x=

i

i =1 k

!f

i

i =1

10

!f

i

= 340

i =1

x

=

16820 = 49.47 340 32


Aritmetik ortalamanın özellikleri : 1. Gözlem değerlerinin aritmetik ortalamadan sapmalarının toplamı sıfıra eşittir. n

" (x

i

! x) = 0

i =1

2. Gözlem değerleri ile aritmetik ortalama arasındaki farkların karelerinin toplamı minimumdur.

"d ! R için "d ! R için 3. a ve b ! R olmak üzere, yi = a ! xi + b serisinde aritmetik ortalama y = a ! x + b ifadesi ile hesaplanır. Başlangıç noktası ölçek değişimi yöntemi ile aritmetik ortalamanın hesabı :

xi ! x 0 dönüşümü ile elde edilen d i serisinde aritmetik ortalama ( d ) h hesaplanır. Buradan, x = h ! d + x0 ifadesi ile de X serisinin aritmetik ortalaması hesaplanır.

x0 (başlangıç değeri) olarak sıklığı en fazla olan sınıf değeri, h (ölçek değeri) olarak ise sınıf genişliği alınır. Örnek 2’ de verilen sınıflanmış serinin aritmetik ortalamasını başlangıç noktası ve ölçek değişimi yöntemiyle hesaplayalım. Başlangıç noktası, sıklığı en fazla olan sınıf değeri x 0 = 45 ve ölçek değeri olarak da sınıf genişliği h=10 alınarak elde edilen

di =

xi ! x 0 x ! 45 = i h 10

serisinin aritmetik ortalaması hesaplanır

(Tablo 4). 33


Tablo 4. (d) serisinde ortalamaya ilişkin işlemler. Sınıflar (‘den az)

xi

0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam

5 15 25 35 45 55 65 75 85 95

di =

xi ! x 0 h -4 -3 -2 -1 0 1 2 3 4 5

fi

fi di

3 12 35 45 110 45 35 30 15 10 340

-12 -36 -70 -45 0 45 70 90 60 50 152

10

d =

!f

i di

i =1 k 10

!f

= i

152 = 0.4471 340

i =1

x = h d + x0 = (10) (0.4471) + 45

x = 49.471 bulunur. 3.1.2. ORTANCA (MEDYAN) Basit seride ortanca değerinin hesaplanması : Seri terimlerini artan ya da azalan sırada sıraya dizdiğimizde, seriyi terim 0 sayısı açısından iki eşit kısma bölen değerdir. Q2 , x veya Med simgelerinden biri ile gösterilir. n +1 n Basit sıralı seride n tek ise , ’inci terim, n çift ise ’inci terim ile 2 2 n+2 ’inci terimin aritmetik ortalaması serinin ortanca değerini verir. 2

34


Örnek 1’de verilen basit seride ortanca değerini hesaplamak istersek, ilk olarak seri değerlerini artan sırada sıralamamız gerekir. Sıralama aşağıdaki gibi yapılır (Tablo 5). Tablo 5. Sıralı (x) değerleri. Denek no 1 2 3 4 5 6 7 8 9 10 11 12 13

n = 13 olduğundan

xi

Denek no 2 5 10 4 8 11 12 13 7 3 6 1 9

127 118 125 120 119 125 123 120 128 119 120 120 121

(Sıralı)

xi

118 119 119 120 120 120 120 121 123 125 125 127 128

n +1 13 + 1 = 7’inci terim olan 120 değeri = 2 2

ortanca değeridir . Q2 = 120

Sınıflanmış-gruplanmış serilerde ortaca değerinin hesaplanması : Sınıflanmış bir seride birikimli sıklıklar hesaplanır ve ortanca değerini içeren sınıf aralığı belirlenir. Daha sonra aşağıdaki ifade ile ortanca değeri hesaplanır.

n "F Q2 = l + 2 !i f Formülde yer alan simgeler : l : ortanca sınıfının gerçek alt sınırı. F : l’den küçük terim sayısı. 35


f : Ortanca sınıfının sıklığı. i : Ortanca sınıfının genişliği. Örnek 2’de verilen sınıflanmış seride ortanca değerini aşağıdaki gibi hesaplarız (Tablo 6). Önce birikimli sıklıklar hesaplanır ve ortanca sınıf belirlenir ( n=340 ve (n/2)=170). Basit bir seriyi inceliyor olsaydık, 170’inci ve 171’inci terimlerin aritmetik ortalamasını almamız gerekirdi. Ortanca sınıfının 40–50 sınıfı olduğu açıkça görülmektedir. Tablo 6. Sınıflar (’den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam

xi 5 15 25 35 45 55 65 75 85 95

fi 3 12 35 45 110 45 35 30 15 10 340

Fi 3 15 50 95 205 250 285 315 330 340

Ortanca sınıfının gerçek alt sınırı (l) 40, l’den küçük terim sayısı (F) 95 ve sınıf genişliği (i) 10’dur. Buna göre ortanca değeri,

n 340 "F " 95 2 2 Q2 = l + ! i = 40 + ! 10 f 110

Q2 = 46.818 bulunur. Seri terimlerini 4 eşit kısma ayıran değerlere çeyreklik, 10 eşit kısma ayıran değerlere ondalık ve 100 eşit kısma ayıran değerlere yüzdelik (persan36


til) değerleri adı verilir. 2. çeyreklik, 5. ondalık ve 50. persantil değerleri ortanca değerine karşılık gelir. Çeyrekliklerin, ondalık değerlerin ve persantil değerlerinin hesaplanmasında izlenen yol ortancanın hesabındaki gibidir. 1. çeyreklik Q1 , 2. çeyreklik Q2 ve 3.çeyreklik Q3 simgeleri ile gösterilir. Örnek 1’de verilen basit seride Q1 ve Q3 değerlerini hesaplayalım. n = 13 , (n/4) = (13/4) = 3.25 , 4. terim Q1 değerine karşılık gelir.

Q1 = 120 . n = 13 , (3n/4) = (39/4) = 9.75 , 10.terim Q3 değerine karşılık gelir.

Q3 = 125. Örnek 2’de verilen sınıflanmış seride Q1 ve Q3 değerlerini hesaplayalım. n=340, (n/4) = (340/4) = 85, 85. ve 86. terimlerin ortalaması Q1 değerini verecektir. Q1 sınıfı 30 – 40 olarak belirlenir. Buna göre Q1 değeri aşağıdaki ifade ile hesaplanır.

n 340 "F " 50 4 4 Q1 = l + ! i = 30 + ! 10 f 45 Q1 = 37.78 n=340, (3n/4) = (1020/4) = 255, 255. ve 256. terimlerin aritmetik ortalaması Q3 değerini verir. Q3 sınıfı 60 – 70 sınıfıdır. Buna göre Q3 değeri aşağıdaki gibi hesaplanır.

3n 1020 "F " 250 4 4 Q3 = l + ! i = 60 + ! 10 f 35 Q3 =61.43

37


Ortancanın özellikleri : 1. Ortanca, serideki değerlerin tümüne bağlı değildir. 2. Ortanca, serideki uç anormal değerlerden etkilenmez. 3. Sıralamalı ölçüm düzeyinde ortalama olarak ortanca değeri kullanılır. 4. Ortancanın cebirsel yapısı zayıftır. n

5.

!x

i

" Q2 = minimum.

i =1

6. İncelenen seride değişkenlik düzeyi yüksek ise aritmetik ortalama yerine ortanca kullanılır.

3.1.3. TEPE DEĞER (MOD) ^

Seride en sık tekrarlanan değere tepe değer denir ve X ile gösterilir. Örnek 1’de verilen basit seride en sık tekrarlanan değer 120’dir. Mod = 120 Sınıflanmış seride önce mod sınıfı belirlenir ve aşağıdaki ifade ile mod değeri hesaplanır.

Mod = l +

"1 !i "1 + " 2

l : Mod sınıfının gerçek alt sınırı.

! 1 : Mod sınıfı sıklığı – bir önceki sınıf sıklığı. ! 2 : Mod sınıfı sıklığı – bir sonraki sınıf sıklığı. Örnek 2’de verilen sınıflanmış sıklık serisinde mod değeri aşağıdaki gibi hesaplanır. 38


Sıklığı en fazla olan 40 – 50 sınıf mod sınıfıdır.

Mod = l +

"1 (110 " 45) ! i = 40 + ! 10 "1 + " 2 (110 " 45) + (110 " 45)

Mod = 45 İncelenen seride birden çok mod varsa, serinin homojen olup olmadığı kontrol edilir. Seri homojen ise sınıf genişlikleri değiştirilip tekrar sınıflama yapılır. U , J, ve ters J eğrilerinde mod hesaplanmaz. Mod değeri tek maksimumlu serilerde hesaplanır. Mod değerinin cebirsel yapısı zayıftır ve ortalamalar içerisinde en az duyarlı olanıdır.

3.1.4. GEOMETRİK ORTALAMA Seri terimleri geometrik olarak artıyor ya da azalıyorsa, aritmetik ortalama yerine geometrik ortalama kullanılır. Geometrik ortalama seri terimlerinin çarpımının toplam gözlem sayısı derecesinde kökünün alınmasıyla elde edilir. Geometrik ortalama G.O. simgesiyle gösterilir.

G.O. = n x1 x 2 L x n Geometrik ortalamayı logaritmanın özelliklerini kullanarak aşağıdaki gibi de hesaplayabiliriz. n

1 log(G.O.) = (log x1 + log x 2 + L + log x n ) = n

! log x

i

i =1

n

G.O. = Antilog(log(G.O.)) Örnek 3. Bir yığında 1. günde 0.10, 2. günde 0.12 ve 3. günde 0.15’lik bir artış varsa, incelenen yığında günlük ortalama artış hızı kaçtır ? Çözüm :

G.O. = n x1 x 2 L x n G.O. =

3

=

3

(0.10) ! (0.12) ! (0.15)

0.0018 = 0.121644 39


3.1.5. AĞIRLIKLI ORTALAMA X değişkeninin aynı anayığından rastlantısal olarak seçilmiş farklı büyüklükteki örneklemlerde ölçüldüğünü ve her bir örnekleme ait ortalamaların aşağıdaki şekilde hesaplandığını varsayalım.

x1 , x 2 L x k Ağırlıklı ortalama aşağıdaki ifade ile hesaplanır. k

!n

i

x=

" xi

i =1

k

!n

i

i =1

3.2. DAĞILIM (SAÇILMA) ÖLÇÜLERİ 3.2.1. YAYILMA GENİŞLİĞİ (AÇIKLIK, RANGE) Serideki terimlerin tümüne bağlı olmayan bir değişkenlik ölçüsüdür. Yayılma genişliği en büyük değerden en küçük değer çıkarılarak elde edilir. Yayılma genişliği = en büyük değer – en küçük değer Sıralı seride, yayılma genişliği = x n ! x1 Sınıflanmış seride, yayılma genişliği = son sınıf değeri – ilk sınıf değeri Örnek 1’ de, yayılma genişliği = 128 – 118 = 10, Örnek 2’de , yayılma genişliği = 95 – 5 = 90’dır.

3.2.2 . ÇEYREKLER ARASI YARI GENİŞLİK (ÇEYREK SAPMA) Çeyrekler arası yarı genişlik Q simgesi ile gösterilir ve aşağıdaki ifade ile hesaplanır.

Q=

Q3 ! Q1 . 2 40


Seride, aritmetik ortalama yerine ortanca hesaplamak daha uygun ise, değişkenlik ölçüsü olarak, standart sapma yerine çeyrekler arası yarı genişlik kullanılır. Örnek 1’de çeyrekler arası yarı genişlik,

Q=

Q3 ! Q1 125 ! 120 = = 2.5 , 2 2

Örnek 2’de ise,

Q=

Q3 ! Q1 61.43 ! 37.78 = = 11.825 olarak hesaplanır. 2 2

3.2.3. ORTALAMA MUTLAK SAPMA Seri terimlerinin tümüne bağlı olarak hesaplanan bir dağılım ölçüsüdür. Ortalama mutlak sapma em simgesi ile gösterilir ve terimlerin ortalamadan olan mutlak sapmalarının aritmetik ortalaması olarak hesaplanır. Sık kullanılan bir değişkenlik ölçüsü değildir. Ortalama mutlak sapma basit serilerde ve sınıflanmış serilerde aşağıdaki ifadelerle hesaplanır. n

em =

!x

i

n k

em =

"x

i =1

!f

i

xi " x

i =1

k

!f

i

i =1

Örnek 1’de verilen basit seride ortalama mutlak sapma aşağıdaki gibi hesaplanır (Tablo 7) 41


Tablo 7. Ortalama mutlak sapmanın hesaplanması ( x =121.92). Denek no

xi

xi ! x

1 2 3 4 5 6 7 8 9 10 11 12 13 Toplam

127 118 125 120 119 125 123 120 128 119 120 120 121

5,08 3,92 3,08 1,92 2,92 3,08 1,08 1,92 6,08 2,92 1,92 1,92 0,92 36,76

n

!x

13

"x

i =1

em = em =

i

i

=

n

!x

" 121,92

i =1

13

36,76 = 2,83 13

3.2.4. VARYANS Seri terimlerinin ortalamadan sapmalarının karelerinin aritmetik ortalaması olarak hesaplanır. Cebirsel işlemlere uygunluğu nedeniyle tüm istatistik analizlerde, değişkenlik ölçüsü olarak varyans değeri kullanılır. Varyans, anayığında hesaplandıysa ! 2 , örneklemde ise s ve aşağıdaki ifadelerden biri ile hesaplanır. Basit serilerde, n

n

2

s =

" ( x ! x)

n

2

i =1

(n ! 1)

"x

i

i

veya s 2 =

2

!

(" xi ) 2 i =1

i =1

(n ! 1) 42

n

2

ile gösterilir


N

N

#2 =

N

! ( xi " µ )2

!x

i

i =1

veya

N

#2 =

2

"

(! xi ) 2 i =1

N

i =1

N

Sınıflanmış serilerde ise, k

k

" f ( x ! x) i

s2 =

i

k

2

i =1

(n ! 1)

"fx

i i

2

veya s =

2

!

(" fi xi ) 2 i =1

n

i =1

(n ! 1) k

k

k

! f (x " µ) i

#2 =

2

i =1

N

!fx

i i

i

#2 =

veya

2

"

(! fi xi ) 2

i =1

i =1

N

N

ifadeleri kullanılır. Varyansın özellikleri : 1. k ! R sabit sayısı için 2. k ! R sabit sayısı için

!

!

2

2

x+k

2 k "x

=! x

( )!

= k2

2 x

3. Tchebycheff teoremi : k ≥ 1 ve n sayıda gözlemden oluşan bir seride,

& %

gözlemlerin en az $1 '

1 # ! kadarı, ortalamadan k standart sapma uzaklıkta k2 "

yer alır. Örnek 1’de verilen basit seride varyansı aşağıdaki gibi hesaplayabiliriz (Tablo 8) ( x =121.92).

43


Tablo 8. Varyans değerinin hesaplanması Denek no

xi

1 2 3 4 5 6 7 8 9 10 11 12 13 Toplam

127 118 125 120 119 125 123 120 128 119 120 120 121 1585

5,08 -3,92 3,08 -1,92 -2,92 3,08 1,08 -1,92 6,08 -2,92 -1,92 -1,92 -0,92 0

130.92 13 – 1

= 10.91

n

s2 =

" (x

i

! x) 2

i =1

(n ! 1)

=

25,8064 15,3664 9,4864 3,6864 8,5264 9,4864 1,1664 3,6864 36,9664 8,5264 3,6864 3,6864 0,8464 130.9232

Varyansı farklı bir ifadeyle de hesaplayabiliriz (Tablo 9) Tablo 9. Denek no

xi

xi2

1 2 3 4 5 6 7 8 9 10 11 12 13 Toplam

127 118 125 120 119 125 123 120 128 119 120 120 121 1585

16129 13924 15625 14400 14161 15625 15129 14400 16384 14161 14400 14400 14641 193379

44


n

s2 =

n

(" xi ) 2

i =1

n

" xi2 !

i =1

=

( n ! 1)

193379 !

(1585)2 13

=

(13 ! 1)

130.92 13 – 1

= 10.91

Örnek 2’de verilen sınıflanmış seride varyansı aşağıdaki gibi hesaplarız (Tablo 10). Tablo 10. Varyans değerinin hesaplanması ( x = 49.47). Sınıflar (’den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam k

" f ( x ! x) i

s2 =

i

i =1

(n ! 1)

xi

fi

5 15 25 35 45 55 65 75 85 95

3 12 35 45 110 45 35 30 15 10 340

-44,47 -34,47 -24,47 -14,47 -4,47 5,53 15,53 25,53 35,53 45,53

5932,7427 14258,1708 20957,3315 9422,1405 2197,8990 1376,1405 8441,3315 19553,4270 18935,7135 20729,8090 121804,7060

2

=

121804.7060 = 359.31 (340 ! 1)

Varyansın farklı yolla hesaplanması (Tablo 11). Tablo 11. Sınıflar (’den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam

xi

fi

f i xi

5 15 25 35 45 55 65 75 85 95

3 12 35 45 110 45 35 30 15 10 340

15 180 875 1575 4950 2475 2275 2250 1275 950 16820

45

fi

x

2 i

75 2700 21875 55125 222750 136125 147875 168750 108375 90250 953900


k

k

"fx

i i

s2 =

2

!

(" fi xi ) 2 i =1

n

i =1

(n ! 1)

=

953900 !

(16820)2

340 (340 ! 1)

=

121804.7060 (340 ! 1)

s = 359.31 2

Başlangıç noktası ve ölçek değişimi yöntemi ile varyansın hesaplanması.

xi ! x 0 dönüşümü ile d i serisi elde edilir. d i serisinin varyansı h 2 2 2 ise (Tablo 12), X serisinin varyansı, s x = h ! s d ifadesi ile hesaplanır. di =

s

2 d

Tablo 12. d i serisinin varyansı Sınıflar (’den az)

xi

0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100

5 15 25 35 45 55 65 75 85 95

di =

xi ! x 0 h -4 -3 -2 -1 0 1 2 3 4 5

Toplam

s

2 d

s

2 x

1286 ! =

(152)2 340

(340 ! 1)

= 3.5931

2

= h 2 ! s d = (10)2 ! (3.5931)=359.31 46

fi

fi di

2

fi d i

3 12 35 45 110 45 35 30 15 10

-12 -36 -70 -45 0 45 70 90 60 50

48 108 140 45 0 45 140 270 240 250

340

152

1286


3.2.5. STANDART SAPMA Varyans değerinin pozitif kareköküdür. En sık kullanılan değişkenlik ölçüsüdür ve örneklemde s , anayığında ! simgeleri ile gösterilir.

s = s2 , ! = ! 2 Örnek 1’de , s =

10,91 = 3.30,

Örnek 2’de , s=

359,31 = 18.96 olarak hesaplanır.

Bilimsel çalışmalarda standart sapma ve aritmetik ortalama aşağıdaki şekilde kullanılır.

x ± s (n ) Örnek 1 için ; 121.92± 3.30 (n=13).

3.2.6. DEĞİŞİM KATSAYISI (VARYASYON KATSAYISI) Standart sapma değerinin aritmetik ortalamaya göre yüzde büyüklüğünü ifade eder ve D.k. simgesi ile gösterilir. Değişim katsayısı aşağıdaki ifade ile hesaplanır.

D.k . =

s ! 100 x

Örnek 1. için, D.k . =

s 3.21 ! 100 = 3.30 ! 100 =2.71, 121.92 x

Örnek 2 için ise, D.k . =

s 18.96 ! 100 = ! 100 = 38.33 şeklinde 49.47 x

hesaplanır. 47



Bölüm 4

Olasılık ve Kuramsal Dağılımlar

İstatistik yöntemlerle ele aldığımız yığınlarda (topluluklarda), birimlerin (deneklerin) taşıdığı ve bir denekten diğerine farklılık gösterdiği özelliklerine, daha önce de gördüğümüz gibi, bu değişimlerden dolayı “değişken” adını veriyoruz. Bu değişkenlik, incelenen toplulukları oluşturan birimler arasında var olan biyolojik farklılıklardan kaynaklanabileceği gibi, ölçüm hatalarından da doğabilir. Rastlantısal olarak seçilmiş deneklerden oluşan bir çalışmadaki değişkene “rastlantısal değişken” adı verilir. Özelliklerin aldığı değerleri (yaş, kan basıncı ...) sıklık dağılımları ile göstermek mümkündür. Rastlantısal değişkene ilişkin değerleri özetleyen sıklık dağılımına “olasılık dağılımı” adı verilir. İstatistikte pek çok kuramsal olasılık dağılımı vardır. Bu bölümde, tıpta en sık karşılaşılan, Binom, Poisson ve Normal (Gaussian) dağılımları inceleyeceğiz. Bunlardan Binom ve Poisson dağılımları kesikli (discrete), Normal dağılım ise süreklidir. Binom ve Poisson dağılımlarında X rastlantısal değişkeni sadece tam sayı değerlerini (0,1,2,3,4,..), normal dağılımda ise, tanım aralığında her değeri alır. Kuramsal dağılımlar konusuna geçmeden önce olasılık kavramını ve temel olasılık kurallarını açıklayalım.

49


4.1.

OLASILIK

İstatistik, sadece verileri uygun ve standart ölçülerle betimlemekle kalmaz, aynı zamanda, bilinen verilere dayanarak, bir anayığının bilinmeyen karakteristiklerine (parametrelerine) ilişkin yargılarda da bulunmaya olanak sağlar (bir anayığından alınmış örnekten elde edilen ortalama ya da varyans gibi istatistiklerin, adı geçen anayığındaki aynı karakteristikleri kestirmek için kullanılabilmesi gibi). Nitekim, istatistiğin çağdaş bilimsel araştırmadaki yeri tanımlanırken, istatistik yöntemlerinin sonuç işlevinin de, tümevarımla yeni bilgi üretmek olduğu vurgulanmıştır. İşte bu çıkarımsal sıçrama, diğer bir deyişle, betimleyici istatistikten tümevarım istatistiğine geçiş, olasılık hesabına dayanarak gerçekleştirilebilmektedir. Bir belirsizlik öğesi içeren her durumda söz konusu olabilecek “olasılık” kavramı, değişik yaklaşımlarla çeşitli biçimlerde tanımlanabilmektedir. Bu yaklaşımlardan başlıcaları “öznelcilik” (sübjektivizm) ve “nesnelcilik” (objektivizm) dir. Nesnelci yaklaşıma göre, olasılık, incelenen bir olayın göreli sıklığı ya da tüm olanaklı durumlar içinde belirme oranından hareketle tanımlanırken, öznelciliğe göre olasılık, bir “inanç derecesi”’ ni ifade eder, diğer bir deyişle, bir olayın gerçekleşeceğine olan kişisel inanç düzeyidir. Bir olayın aynı koşullar altında, değişik şekillerde ortaya çıkması sırasında kaydedilen “başarı” durumları sayısının olanaklı durumlar sayısına bölünmesiyle elde edilen değere, o başarılı durum veya durumların olasılık değeri adı verilir . Olasılık, “deney öncesi” ve “deney sonrası” olmak üzere iki ayrı yaklaşımla incelenebilir.

4.1.1. DENEY ÖNCESİ OLASILIK Eğer istenilen durumları “başarı” olarak nitelendirirsek, “başarı” olarak kabul edilen olayın olasılığını aşağıdaki ifade ile hesaplarız. “başarı” sayısı p =  olanaklı durumlar sayısı Burada p simgesi “başarı” durumunun olasılık değerini göstermektedir. 50


Bir yazı - tura oyununda yazı gelmesi sonucunu “başarı” sayarsak, istenilen durum sayısı 1, olanaklı durumlar sayısı ise 2 olur. Dolayısıyla, burada yazı gelme olasılığı, 1 p =  = 0.50 değerine eşit olur. 2

4.1.2. DENEYSEL OLASILIK Bu yaklaşımda, bir olayın olasılığı, o olayın gözlemlenen sıklığından yola çıkılarak yapılan bir genellemeyle elde edilir. (n) sayıdaki bağımsız deneme sonucunda, “olumlu” sayılan, ya da “başarı” olarak tanımlanan durumların sayısı ( r ) ise, (r / n ) oranı incelenen olayın göreli sıklığını gösterir. Deneme sayısının sonsuza doğru büyümesi halinde de, olayın göreli sıklığı, olayın olasılığına dönüşür. n →∞ ise , ( r / n ) → p Yazı-tura denemesini sırasıyla n = 1, 2, 5, 10, 50, 100, 500, 1000 deneme sayısı için gerçekleştirdiğimizi düşünelim. Burada “başarı” olarak yazı gelmesini kabul edersek, her deneme sayısına karşılık gelen yazı gelme oranı (“başarı” oranı) ( r / n ) ifadesi ile hesaplanır. n deneme sayısına karşılık gelen ( r / n ) başarı oranlarını Tablo 1'de görebiliriz. Tablo 1. n denemede ‘yazı’gelme oranı. Deneme Sayısı (n) 1 2 5 10 50 100 500 1000

Başarı Sayısı (r) 1 1 2 6 24 52 245 505

51

Başarı Oranı (r/n) 1.000 0.500 0.400 0.600 0.480 0.520 0.490 0.505


Yazı - tura deneyinde yazı gelmesi olayının gerçek olasılığı p = 0.50 'dir. Tablo 1'den de görüldüğü gibi ( r / n ) oranının 0.50 'ye yaklaşması için deneme sayısı n' in yeterince büyük olması gerekir. (r / n) ve p arasındaki ilişkiyi Şekil 1'de görebiliriz.

Şekil 1. ( r / n ) ve p arasındaki ilişki (n → ∞ ise , ( r / n ) → p 'dir)

4.1.3. OLASILIĞIN ÖZELLİKLERİ Olasılık değeri daima pozitiftir ve 0 ile 1 arasında değerler alır. (0≤p≤1) Eğer “başarı” olarak kabul edilen olay her denemede ortaya çıkıyorsa olayın olasılığı 1'e, denemelerin hiç birinde ortaya çıkmıyorsa 0'a eşittir. Bir olayın gerçekleşme olasılığı (p) ile gerçekleşmeme olasılığının (q) toplamı 1’e eşittir. r p =  , n

n-r q =  olduğuna göre, p + q = 1 olur. n 52


Yukarıda yazı-tura örneğinde “başarı” ya da beklenen olay, alt olaylara ayrılması olanaklı olmayan, yalın bir olaydır. Oysa, pek çok durumda, gerçekleşmesi beklenen olay, birden çok yalın olaydan oluşur. Örneğin, bir öğrencinin Biyoistatistik sınavından “pekiyi” ya da “iyi” alması, bir oyunda atılan iki zarda 5 ve 6 çıkması, öğrencimizin Biyoistatistik ve Biyofizik derslerinden pekiyi alması gibi. Bu örneklerde olduğu gibi, birden çok yalın olaydan oluşmuş birleşik olayların gerçekleşme olasılığına birleşik olasılık denir.

4.1.4. BİRLEŞİK OLAYLARDA OLASILIK KURALLAR 4.1.4.1 BAĞDAŞMAYAN OLAYLAR (ÖZEL TOPLAMA KURALI) Bu kural, bağdaşmayan yani birlikte gerçekleşmesi olanaksız olaylar için geçerlidir. Bağdaşmayan iki olayı (A) ve (B) ile gösterirsek A veya B'nin gerçekleşmesi olasılığı, A' nın olasılığı ile B'nin olasılığının toplamına eşittir. P ( A veya B ) = P(A) + P(B) Aynı kuralı ikiden fazla ayrık olay (birbirleriyle kesişmeyen) için de uygulayabiliriz. Örneğin (A), (B), ve (C), ayrık 3 olay ise A veya B veya C' nin gerçekleşmesi olasılığı P ( A veya B veya C ) = P(A) + P(B) + P(C) ifadesi ile hesaplanır. Konunun daha iyi anlaşılabilmesi için yazı - tura, 52'lik desteden kağıt çekilmesi ve zar örneklerini tıbbi örneklerle birlikte vereceğiz. Örnek 1. Zar bir kez atılırsa 1'li veya 2'li yüzün ortaya çıkması olasılığı kaça eşittir? Çözüm : 1 1 1 P ( “1” veya “2” ) =  +  =  6 6 3 53


Örnek 2. İki zar birlikte atıldığında zarların üst yüzlerinin toplamının “7” veya “12” çıkma olasılığı kaça eşittir? Çözüm : 6 1 7 P ( “7” veya “12” ) =  +  =  36 36 36 Örnek 3. Bir toplumda kan gruplarının görülme sıklığı (olasılığı) Tablo 2'de verilmektedir. Tablo 2. Toplumda kan gruplarının dağılımı. Kan Grubu A B O AB Toplam

Kadın

Olasılıklar Erkek

Toplam

0.225 0.060 0.200 0.015 0.500

0.225 0.060 0.200 0.015 0.500

0.450 0.120 0.400 0.030 1.000

Bu toplumdan rastgele seçilen bir kişinin kan grubunun (A) veya (B) olması olasılığı kaça eşittir? Çözüm : Belli bir kişide A ve B kan gruplarının birlikte varolması olanaklı değildir. Yani A ve B ayrık iki olaydır. A veya B'nin gerçekleşme olasılığını hesaplamak için özel toplama kuralını uygulayabiliriz. P ( A kan g. veya B kan g. ) = P(A kan g.) + P(B kan g.) = 0.450 + 0.120 = 0.570 4.1.4.2. BAĞDAŞAN OLAYLAR (GENEL TOPLAMA KURALI) Bu kural bağdaşabilen, yani birlikte gerçekleşmesine olanak bulunan olaylar için geçerlidir. A ve B bağdaşabilen iki olay ise, A veya B 'nin gerçekleşme olasılığı 54


P ( A veya B ) = P(A) + P(B) – P ( A ve B ) ifadesi ile hesaplanır. Burada, P ( A ve B ) iki olayın birlikte gerçekleşme olasılığıdır. Aynı kuralı 2'den fazla bağdaşan olay için uygularsak, A veya B veya C' nin gerçekleşmesi olasılığını, P( A veya B veya C) = P(A) + P(B) + P(C) – P(A ve B) – P(A ve C) – P( B ve C) + P(A ve B ve C) ifadesi ile hesaplarız. Örnek 4. 52'lik bir desteden rastgele seçilen bir kağıdın siyah renkli veya 2'li bir kağıt olma olasılığı kaça eşittir? Çözüm : Simgesel olarak A ile siyah renkli kağıdı ve B ile 2'li kağıdı temsil ettiğimizi düşünelim. A ve B olayları bağdaşan olaylar olduğundan, A veya B olayının gerçekleşmesi olasılığını genel toplama kuralı ile hesaplayabiliriz. P ( A veya B ) = P(A) + P(B) – P ( A ve B ) = (26/52) + (4/52) – (2/52) = (28/52) = 0.5385 Örnek 5. Tablo 2'de toplumda kan gruplarının dağılımı verilmişti. Bu toplumdan rastgele seçilen bir kişinin cinsiyetinin erkek veya kan grubunun A olması olasılığı kaça eşittir? Çözüm : Bir kişi aynı anda cinsiyet bakımından erkek, kan grubu bakımından da (A) olabilir. Bu nedenle bu iki olay bağdaşmaktadır (yani bunlar ayrık iki olay değildir ). Bu toplumdan rastgele seçilen bir kişinin erkek veya A kan grubuna sahip bir kişi olma olasılığı P(erkek veya A kan g.) = P(erkek) + P(A kan g.) –P(erkek ve A kan g.) = 0.50 + 0.45 – 0.225 = 0.725 değerine eşit olur.

55


4.1.4.3. BAĞIMSIZ OLAYLAR (ÖZEL ÇARPMA KURALI) Bu kural birbirinden bağımsız olaylar için geçerlidir. İki olaydan birinin gerçekleşmesi veya gerçekleşmemesi ikinci olayın olasılığını etkilemiyorsa olayların bağımsız olduğundan söz edilir. A ve B'nin birlikte gerçekleşmesi olasılığı aşağıdaki ifade ile hesaplanır. P ( A ve B ) = P(A) · P(B) 2' den fazla bağımsız olay için olasılığı aşağıdaki ifade ile hesaplarız. P(A ve B ve C ve ...) = P(A) · P(B) · P(C) · ... Örnek 6. Bir para iki kez fırlatılmaktadır. Paranın iki atışta da yazı gelme olasılığı kaça eşittir ? P(1.yazı ve 2.yazı) = P(1.yazı) · P(2.yazı) = (1/2) · (1/2) = 1/4 = 0.25 Örnek 7. Toplumda kan gruplarının dağılımına ilişkin verilen bilgiden (Tablo 2.) yararlanarak, toplumdan rastgele seçilen bir kişinin cinsiyetinin kadın ve kan grubunun A olması olasılığı kaça eşittir? Çözüm : Cinsiyet ve kan grubu değişkenleri bağımsızdır. Yani, rastgele seçilen bir kişinin cinsiyetinin kadın olması ile kan grubunun A olması arasında bir ilişki yoktur. Kişinin cinsiyetinin kadın olması olayının olasılığı A kan grubu olayının olasılığını ( olumlu ya da olumsuz ) etkilememektedir. Rastgele seçilen bir kişinin kadın ve A kan grubuna sahip bir kişi olması olasılığı, P(kadın ve A kan g.) = P(kadın) · P(A kan g.) = 0.50 · 0.45 = 0.225 değerine eşit olur. 4.1.4.4. BAĞIMLI OLAYLAR (GENEL ÇARPMA KURALI) Genel çarpma kuralı bağımlı olaylarda uygulanır. A ve B olaylarının birlikte gerçekleşme olasılığını aşağıdaki ifadelerden biri ile hesaplarız. 56


P ( A ve B ) = P(A) · PA (B) veya P ( A ve B ) = P(B) · PB(A) Burada PA (B) simgesi, A olayı olduktan sonra B olayının gerçekleşme olasılığını gösterir. Literatürde PA (B) simgesi yerine P(B|A) simgesi de kullanılmaktadır. Örnek 8. 52'lik bir desteden iadesiz olarak arka arkaya iki kağıt çekiliyor. Her iki kağıdın da birli olma olasılığı kaçtır? Çözüm: A olayı olarak rastgele seçilen birinci kağıdın 1'li olmasını, B olayı olarak da, yine rastgele seçilen 2'inci kağıdın birli olmasını kabul edelim. Kağıt seçimi iadesiz olduğundan A olayının olması ya da olmaması B olayının gerçekleşme olasılığını etkilemektedir. A ve B olayları bağımlı olaylardır. A ve B olaylarının birlikte geçekleşme olasılığı P ( A ve B ) = P(A) · PA (B) = (4/52) · (3/51) = 0.0045 değerine eşit olur. Örnek 9. Aşağıdaki tabloda (Tablo 3) 1000 kişilik bir örneklem grubunda bireylerin sigara içip-içmeme ile cinsiyete göre dağılımları verilmektedir. Tablo 3. Bin kişide cinsiyet ve sigara dağılımı. Cinsiyet Kadın Erkek Toplam

Sigara içen 100 350 450

Sigara içmeyen 400 150 550

Toplam 500 500 1000

Bu gruptan rastgele seçilen bir kişinin sigara içen ve cinsiyetinin erkek olması olasılığı kaça eşittir? Çözüm: Cinsiyet ile sigara içme değişkenleri Tablo 3'den de görüldüğü gibi bağımlı değişkenlerdir. Kişinin cinsiyeti sigara içme olayını etkilemektedir. 57


Simgesel olarak erkek cinsiyeti E ile, sigara içmeyi de S+ ile gösterirsek, bu gruptan rastgele seçilen bir kişinin (E) ve (S+) bir kişi olma olasılığı aşağıdaki ifadeyle hesaplanır. P ( E ve S+ ) = P(E) · PE (S+) = (500/1000) · (350/500) = 0.35 Örnek 10. Bir zar iki kez atıldığında en fazla 1 kez 5'li çıkma olasılığı kaça eşittir? Çözüm : İki atış birbirinden bağımsızdır. 5'li çıkma olayını “başarı” sayarsak, iki ayrı atışta 5'li ya hiç gelmeyebilir ( burada başarı sayısı r = 0 ), ya bir kez (r = 1 ), ya da 2 kez ( r = 2 ) gelebilir. Soruda “en fazla bir kez 5'li çıkma” olasılığı sorulduğuna göre, başarı sayısı r' nin 0 veya 1 olması gerekmektedir. P(en fazla 1 kez 5'li) olasılığı ile, P ((r=0) veya (r=1)) olasılığı birbirine eşittir. P(r=0) = P(0 kez 5'li) ve P(r=1) = P(1 kez 5'li) olasılıklarını aşağıdaki şemadan hesaplayabiliriz.

P(r=0) = P((1.atışta 5'li değil) ve (2.atışta 5'li değil)) = (5/6) · (5/6) = 25/36 P(r=1) = P((1.atışta 5'li ve 2.atışta 5'li değil) veya (1.atışta 5'li değil ve 2.atışta 5'li)) 58


P(r=1) = (1/6) · (5/6) + (5/6) · (1/6) = 10/36 P((r=0) veya (r=1)) = P(r=0) + P(r=1) = (25/36) + (10/36) = 35 / 36 = 0.9722 Soruda zar 2 kez ( bağımsız deneme sayısı ) atılmaktadır. Eğer, n kez bağımsız deneme yapılsaydı ve bu n denemede x kez başarı elde etme olasılığını arasaydık, yukarıdaki örnekte olduğu gibi ağaç diyagramı çizip, diyagram üzerinden olasılığı hesaplamamız gerekirdi. Aynı sorunun yanıtını, biraz ileride göreceğimiz gibi, kuramsal bölünmelere ilişkin ifadeleri kullanarak da hesaplamak olanaklıdır.

4.1.5. ÖZEL BİR UYGULAMA ALANI (TANI TESTLERİNİN DEĞERLENDİRİLMESİ) Bir hastalığa tutulduğundan kuşku duyulan bir kişiye, belli bir tanı testi uygulandığında, ortaya çıkacak sonuçları dört ayrı grupta ele almak olanaklıdır. Gerçekten de, aşağıdaki tablodan izleneceği gibi, uygulanan tanı testinin olası iki doğru, iki de yanlış sonucu olabilir. Tablo 4. Kişinin gerçek durumuna göre test sonuçları. Test Uygulanan Kişinin Gerçek Durumu Önerilen Yeni Tanı Testi Sonucu

Hasta (+)

Hasta Değil (–)

Pozitif (+)

Doğru Sonuç (Doğru Pozitif)

Yanlış Sonuç (Yanlış Pozitif)

Negatif (–)

Yanlış Sonuç (Yanlış Negatif)

Doğru Sonuç (Doğru Negatif)

Dolayısıyla, bir tanı testinin geçerliliği iki ayrı açıdan değerlendirilebilir. Bunlardan ilki, testin duyarlılığıdır. Duyarlılık, uygulanan tanı testinin doğru pozitif verme olasılığını, diğer bir deyişle, testin uygulandığı toplulukta, “doğru pozitif” sonuçların, gerçekten hasta olan kişilere oranını verir. Bir tanı testinin duyarlılığı yüksekse, buna bağlı olarak, yanlış negatif sonuç verme olasılığı 59


düşük olur. Örneğin, belli bir tanı testinin duyarlılığı % 88 ise, söz konusu test, gerçekten hasta olan (100) kişiden (88)' ine doğru tanı, yani “hasta” tanısı koyuyor demektir. Tanı testlerinin geçerliliğine ilişkin ikinci özellik, seçiciliktir. Seçicilik, kullanılan testin, sağlam kişilerin yüzde kaçına doğru tanı koyduğunu ifade eder. Örneğin, seçiciliği % 95 olan bir test, (100) sağlıklı insanın 95' ine “doğru negatif” tanısı, “sağlıklı” tanısı koyuyor demektir. Örnek 11 : Kesin akciğer tüberkülozu olduğu bilinen 50 kişiyi de kapsayan (1550) kişilik bir toplulukta akciğer filmleri çekilmiş ve filmler incelenen topluluğu tanımayan uzmanlarca değerlendirilmiştir. Değerlendirme sonuçları Tablo 5’te verilmektedir. Akciğer tüberkülozu tanısı koymak üzere kullanılan röntgen filmlerinin duyarlılık ve seçiciliğini hesaplayınız. Tablo 5. Akciğer filmi değerlendirmesinde sonuçlar Değerlendirme Sonucu Hasta Sağlam Toplam

Gerçek Durum Hasta 36 14 50

Gerçek Durum Sağlam 44 1456 1500

Toplam 80 1470 1550

İncelenen testin duyarlılığı, 36 P( test+ | hasta ) =  = % 72 50 testin seçiciliği, 1456 P( test – | sağlam ) =  = % 97.1 1500 olarak hesaplanır. Bir tanı testinin pozitif prediktif değeri, test sonucunun pozitif çıktığı kişilerin yüzde kaçının gerçekten hasta olduğunu gösterir. (doğru pozitifler) P.D+ =  x 100 tüm pozitifler 60


Aynı şekilde, bir testin negatif prediktif değeri de, negatif sonuçların yüzde kaçının gerçekten sağlam kişilere ait olduğunu ifade eder. (doğru negatifler) P.D- =  x 100 tüm negatifler

4.1.5.1. BAYES TEOREMİ Bir koşullu olasılık olarak, pozitif sonuç veren bir tanı testinin prediktif değeri bayes formülüyle hesaplanabilir. P(test+ | hasta) · P(hasta)

P(hasta | test+) =  P(test+ | hasta) · P(hasta) + P(test+ | sağlam) · P(sağlam)

Yukarıdaki formülü “duyarlılık” ve “seçicilik” terimleriyle yazarsak : duyarlılık · prevalans

P(hasta | test+) =  duyarlılık · prevalans + (1 - seçicilik) · (1-prevalans)

Bir hastalığın toplum içindeki yaygınlığı, ya da göreliği sıklığı olan prevalans değeri, hastalığın olasılığı olarak ifade edilir. Tablo 5' deki örnekte, akciğer tüberkülozu prevalans değerinin 0.01 olduğu varsayılırsa, (0.72) · (0.01) P(hasta | test+) =  = 0.20 (0.72) · (0.01) + (0.029) · (0.99) Dolayısıyla, pozitif sonuç veren akciğer filmlerinin % 20' sinin gerçek hastalara ait olduğu söylenebilir. Aynı biçimde, negatif sonuç vermiş bir tanı testinin prediktif değerini hesaplamak için de, seçicilik · (1 - prevalans)

P(sağlam | test-) =  seçicilik · (1 – prevalans)+ (1 – duyarlılık) · prevalans

formülü kullanılır. 61


4.2.KURAMSAL DAĞILIMLAR Yukarıda gördüğümüz olasılıkla ilgili basit kurallar ve gereğinde ağaç diyagramlarıyla, (n) bağımsız denemede (x) kez “başarı” elde etme olasılıkları hesaplanabilmekle birlikte, deneme sayısının büyümesiyle bu yaklaşımlar yetersiz kalmaya başlar. Bu durumlarda, tüm olanaklı sonuçların olasılığını hesaplamak için kuramsal olasılık dağılımları kullanılır. 4.2.1. BİNOM DAĞILIMI Bir değişkenin A ve B simgeleri ile gösterilen sadece iki değeri alabildiğini varsayalım (evet / hayır; pozitif / negatif; sağ / ölü; kadın /erkek gibi...). (A)'nın olasılığını p (ya da π), (A)'nın gerçekleşmediği (B) durumunun olasılığını da (1-p) (ya da 1-π) olarak gösterelim. Böyle bir durumda, (A) ya da (B)'nin ortaya çıkabileceği deneme, birbirinden bağımsız olarak (yani, (p) ve (q) her bir denemede sabit) tekrarlanırsa, (A)'nın bağımsız (n) denemede (x) kez gerçekleşme olasılığı Binom dağılımıyla hesaplanır. Binom dağılımının temel kuralları 17. yüzyılda yaşamış İsviçre'li matematikçi Jacob Bernouilli tarafından konmuştur. Bernouilli'nin 1713'de yayınlanan kitabı, genel olarak, olasılık konusundaki ilk yapıt sayılır. Günümüzde de, Binom dağılımına uyan her denemeye “Bernouilli denemesi” ve bu türden denemelerden oluşan süreçlere de Bernouilli süreci adı verilmektedir. Yukarıda belirtilen koşullarda, n bağımsız denemede tam x kez başarı elde etme olasılığını, binom dağılımının aşağıda verilen ifadesiyle hesaplarız. n! P(x) =  px.qn-x x! (n-x)! Burada, n : birbirinden bağımsız deneme sayısı, x : “başarı” sayısı, p : “başarı” sayılan (A olayının) sonucun tek bir denemede gerçekleşme olasılığı, q : “başarı” sonucunun tek bir denemede gerçekleşmeme olasılığını göstermektedir. 62


“Başarı” sayıları 0 ile n arasındaki tam sayılardır. Binom dağılımının ortalaması µ = (n · p)'ye varyansı σ2 = (n · p · q)' ya eşittir. Olasılığın daima 0 ile 1 arasında olduğunu ve n

( p + q ) n =1= ! x =0

n! p x # q n" x x!#(n " x)!

özelliğinin

gerçeklendiğini

de

hatırlayalım. Örnek 12. Bir paranın 5 kez fırlatıldığını varsayalım. Bu 5 denemede tam 4 kez yazı çıkma olasılığı kaça eşittir? Çözüm: Bu örnekte “yazı gelmesi” “başarı” sayıldığına ve deneme sayısı 5 olduğuna göre, başarı sayısı (x) = 4, başarı sonucunun bir denemede ortaya çıkması olasılığı (p) = 0.5 ve başarı sonucunun bir denemede ortaya çıkmaması olasılığı da (q) = 0.5'dir. Tam 4 kez yazı çıkma olasılığı aşağıdaki şekilde hesaplanır. n! P(x) =  px.qn-x x! (n-x)! 5! P(4) =  (1/2)4(1/2) 5- 4; (5!=120 , 4!=24 , 0! = 1) 4! (5-4)! 120 P(4) =  (1/16)(1/2) (24)(1) P(4) = (5/32) P(4) = 0.15625 Örnek 13. Eğer 5 yazı - tura denemesinde en az 3 yazı çıkma olasılığını hesaplamak istersek, başarı sayısı sırasıyla 3, 4 ve 5 olacaktır.

63


P(en az 3 yazı) = P(3) + P(4) + P(5) 5! 5! 5! =  (1/2)3(1/2)2 +  (1/2)4(1/2)1 +  (1/2)5(1/2)0 3! 2! 4! 1! 5! 0! = (10/32) + (5/32) + (1/32) = (16/32) = 0.5 Örnek 14. Belli bir kanser türünde bir hastanın tedaviden sonra 10 yıl yaşama olasılığının 0.63 olduğunu varsayalım. Söz konusu kanser türüne yakalanan 12 hastanın tümünün de tedaviden sonra 10 yıl yaşama olasılığı kaça eşittir? Çözüm : Birbirinden bağımsız deneme sayısını 12, “başarı” olarak da bir hastanın tedaviden sonra 10 yıl yaşamasını kabul edersek, başarı sayısı 12, başarının bir denemede ortaya çıkma olasılığı 0.63 ve başarının bir denemede ortaya çıkmama olasılığı ise 0.37 (q = 1-0.63)'dir. 12! P(12) =  (0.63)12(0.37)0 12! (12-12)! = 0.0039 n = 12 ve p = 0.63 olduğunda sırasıyla x = 0,1,2...12 başarı sayıları için olasılıklar Tablo 6'da verilmiştir. Yine bu olasılıklara ilişkin grafik Şekil 2'de izlenebilir. Binom dağılımında, ortalama = (n · p)' idi. Örneğimizde ortalama (12)· (0.63) = 7.56'dir. Yani, 12 hastanın ortalama olarak 7.56' sının tedaviden sonra 10 yıl yaşaması beklenir. Standart sapma ise, σ=

(n ! p ! q )= (12)! (0.63)! (0.37 )

σ = 1.6725 değerine eşittir.

64


Tablo 6. n=12, p=0.63 parametreli Binom dağılımı için olasılıklar. X 0 1 2 3 4 5 6 7 8 9 10 11 12

n!  x! (n-x)! 1 12 66 220 495 792 924 792 495 220 66 12 1

px

qn-x

P(x)

1.00000 0.63000 0.39690 0.25005 0.15753 0.09924 0.06252 0.03939 0.02482 0.01563 0.00985 0.00621 0.00391

0.00001 0.00002 0.00005 0.00013 0.00035 0.00095 0.00257 0.00693 0.01874 0.05065 0.13690 0.37000 1.00000

0.00001 0.00013 0.00126 0.00715 0.02739 0.07462 0.14823 0.21633 0.23022 0.17422 0.08899 0.02755 0.00391

Yığışımlı P(x) 0.00001 0.00014 0.00140 0.00855 0.03594 0.11056 0.25878 0.47511 0.70533 0.87955 0.96854 0.99609 1.00000

Şekil 2. n=12, p=0.63 parametreli Binom dağılımı Örnek 15. Bir laboratuvarda üretilen aşıların % 15'inin içerdiği etkili maddenin standardın altında kaldığını varsayarsak, bu laboratuvarda üretilen aşılardan rastgele seçilen 8 aşı arasından en az bir tanesinin standardın altında kalma olasılığı kaça eşittir? Çözüm : “Başarı” olarak, rastgele seçilen bir aşının standardın altında kalmasını kabul edersek, problemimizde başarı sayısı 1 veya 2 veya 3 ...veya 8 65


olacaktır. Buna göre 8 aşıdan en az bir tanesinin standardın altında kalma olasılığı P(x=1 veya x=2 veya ... x=8) = P(1) + P(2) + ... + P(8) olur. P(0) + P(1) + P(2) + ... + P(8) = 1 eşitliğini kullanırsak, P(x≥1) = 1 - P(0) 8! = 1 -  (0.15)0 (0.85)8-0 0! (8-0)! = 1 - 0.2724 = 0.7276 Örnek 16. Belli bir hastalığa tutulmuş bir kişinin 3 ayrı uzman tarafından incelendiğini ve uzmanlardan herbirinin hastalığa doğru tanı koyma olasılığının %90 olduğunu varsayalım. 3 ayrı incelemede 3 doğru tanıya ulaşma olasılığı kaça eşittir? Çözüm : 3! P(x=3) =  (0.90)3 (0.10)3-3 3! (3-3)! = 0.729

4.2.2. POISSON DAĞILIMI Eğer, birbirinden bağımsız deneme sayısı (n) yeteri kadar büyük ve olayın “başarı” olarak kabul edilen sonucunun bir denemede ortaya çıkması olasılığı (p) 0.05'den küçük değerler alıyorsa ( yani, n → ∞ ve p → 0 veya n → ∞ ve q → 0), bu durumda Binom dağılımı Poisson dağılımına dönüşür. Poisson dağılımına, incelenen olayın olasılığının küçüklüğünden dolayı nadir olaylar dağılımı da denir.

66


(n) denemede (x) sayıda “başarı” elde etme olasılığı Poisson dağılımının genel ifadesi olan

P( x) = e ! µ

µx formülü ile hesaplanır. x!

Burada; e : sabit bir sayı ( e= 2.718 ), µ : np ( dağılımın ortalaması, x), p : "başarı" sonucun bir denemede gerçekleşme olasılığı, x : aranan başarı sayısıdır ( x = 0 veya 1 veya 2 ... veya n ). Poisson dağılımında ortalama ve varyans n · p'ye eşittir. µ = σ2 = n · p Bazı x ve µ değerleri için poisson olasılıkları Tablo II’de verilmektedir. Örnek 17. Bir toplumda her 8000 kişiden birinin belli bir kalıtsal hastalık taşıdığını varsayalım. 30000 nüfuslu bir yerleşim yerinde yapılacak taramada bu hastalık belirtisini taşıyan en fazla 1 kişiye rastlama olasılığı kaça eşittir? Çözüm : n = 30000, p = 1/8000 ve x = 0 veya 1'dir. Buna göre, µ =n·p = 30000 (1/8000) = 3.75 ve P(en fazla bir kişide kalıtsal hastalık) = P(x=0 veya x=1) = P(x=0) + P(x=1). (3.75)0 (3.75)1 P(x<=1) = e-3.75  + e-3.75  0! 1! = 0.0235 + 0.0882 = 0.1117 Örnek 18. Bir yol kavşağında bir haftada meydana gelen ortalama kaza sayısı 3'tür. Belli bir hafta içinde söz konusu kavşakta tam 5 kaza olma olasılığını hesaplayınız.

67


Çözüm : Bir hafta içinde söz konusu kavşaktan çok sayıda aracın geçtiğini ve bir aracın kaza yapma olasılığının oldukça küçük olduğunu ( p< 0.05) kabul edebiliriz. "Başarı" olarak bir aracın kaza yapmasını kabul edersek başarı sayısı 5 olur. 35 -3 P(x=5) = e  5! = 0.1008 Örnek 19. Her yıl ortalama olarak 2000 maden işçisi arasından 2 kişi kaza sonucu hayatını kaybederse, 800 maden işçisinin çalıştığı bir maden ocağında, bir yıl içinde kaza sonucu ölüm olmaması olasılığını bulunuz. Çözüm : Bir maden işçisinin bir yıl içinde kaza sonucu hayatını kaybetmesi olasılığı p= 2 / 2000 , 800 kişilik maden ocağında ortalama değer ( x ), m = n.p = 800x(2/2000) = 0.8 , (0.8)0 -0.8 P(x=0) = e  0! = 0.4493 Örnek 20. Çok sulandırılmış bir eriyiğin mikroskop altında incelenmesinde, 50 sayım karesinde gözlenen hücre sayısının dağılımı aşağıdaki gibi bulunmuştur. Hücre sayısı (xi) Kare sayısı (fi)   0 17 1 21 2 8 3 3 4 1  50 68


Poisson dağılımını kullanarak sıklıkları hesaplarsak, karelerin kaç tanesinde hücre sayısının en az iki olması beklenir? Çözüm : Herhangi bir karede bir hücre gözlenmesini “başarı” sayarsak, başarı sayıları sırasıyla x=2,3,4,5,...,50 olur. Verilen sıklık dağılımında önce aritmetik ortalama hesaplanır. ∑ fi(xi) 50 m = np =  =  = 1 ∑ fi 50 Burada, n birbirinden bağımsız deneme sayısı (kare sayısı) ve p başarı sonucun bir denemede ortaya çıkma olasığıdır (n=50, p=1/50). P(x>=2) = P(x=2) + P(x=3) + ... + P(x=50) = 1 – [ P(x=0) + P(x=1) ] 10 11 -1 = 1 – [ e  + e  ] 0! 1! = 1 – 2e-1 = 0.2642 -1

Bir karede 2 veya daha çok hücre gözlenme olasılığı 0.2642 ise, 50 karede bu özelliğin gerçeklendiği ( bir karede 2 veya daha fazla hücre olması) kare sayısının 50 x 0.2642 = 13.21 ~ 13 olması beklenir. Örnek 21. Belirli bir ilacın, yan etki yaratma olasılığının 0.002 olduğu ileri sürülmektedir. Bu ilacın 1000 kişide denenmesi halinde, sırasıyla, a) tam iki kişide, b) en fazla iki kişide ve c) ikiden fazla kişide yan etki görülme olasılığını hesaplayınız. Çözüm : Bu verilere göre, 1000 kişi içinde ortalama olarak m = np = 1000·(2/1000) = 2 kişide yan etki görülmesi beklenir. 69


22 a) P(x=2) = e  = 0.27066 2! -2

b) P(x ≤ 2) = P(x=0) + P(x=1) + P(x=2) 20 21 22 -2 -2 = e  + e  + e  0! 1! 2! -2

= 0.13533 + 0.27066 + 0.27066 = 0.67665 c) P(x>2) = P(x=3) + P(x=4) + ... + P(x=1000) = 1 – ( P(x=0) + P(x=1) + P(x=2) ) = 1 - 0.67665 = 0.32335

4.2.3. NORMAL DAĞILIM Yukarıda, (p)’nin çok küçük ve (n) sonsuza doğru büyüdüğünde, binom dağılımının poisson dağılımına dönüştüğüne değinmiştik. (p) ve (q) değerlerinin birbirine yakın olduğu durumlardaysa, binomun normal dağılım, ya da Laplace - Gauss Dağılımı’na dönüştüğü gösterilebilir. İstatistik kuramında merkezi bir önem taşıyan ve çok sayıda uygulama alanı bulunan bu dağılımı, ilk kez Abraham Demoivre bulmuş ve 1733’ de yaptığı yayında tanımlamış olmakla birlikte, normal dağılımın bilimsel özellikleri ve ilkeleri her ikisi de matematikçi ve astronom olan Fransız Pierre Simon Laplace ve Alman Carl Friedrich Gauss tarafından konmuştur. Bir çok istatistikçi, “normal” sözcüğünün yol açabileceği yanlış anlamalardan kaçınmak için, “Normal Dağılım” ifadesi yerine “Laplace - Gauss Dağılımı” ifadesini tercih etmiştir. Bizim burada “Normal Dağılım” ifadesini kullanmamızın nedeni, bu ifadenin tıp literatüründe yaygın biçimde yerleşmiş olmasıdır.

70


Belli bir fizik ölçümü (ısı, uzaklık, vs.) sabit koşullarda ve sistematik hata yapılmaksızın çok kez yinelendiğinde, yapılan ölçüm hatalarının da normal dağılıma yaklaştığı bilinmektedir. Nitekim, normal eğriye bazen “hatalar eğrisi” adı da verilmektedir. Aşağıda çeşitli örneklerini göreceğimiz gibi, aynı cinsten yapıdaki topluluklarda, biyolojik değişkenlerin belli bir bölümü (boy, kan parametreleri, bazı fizyolojik parametreler, v.s. ) normal dağılıma uygunluk gösterir. 4.2.3.1 NORMAL DAĞILIMIN ÖZELLİKLERİ a) İncelenen rastlantısal değişken tanım aralığında tüm değerleri alabilir, diğer bir deyişle, normal dağılım süreklidir. b) Normal dağılımın olasılık yoğunluk fonksiyonu aşağıdaki gibi gösterilir.

Y = f ( x) =

1 e * ) 2(

1 & x'µ # ' $ ! 2% * "

2

Burada, x : incelenen sürekli değişken ( rastlantısal değişken), µ : dağılımın ortalaması, σ : dağılımın standart sapmasıdır. Kısaca, normal eğri olarak da bilinen ve (x = µ) eksenine göre simetrik olan normal dağılım eğrisi aşağıdaki gibidir (Şekil 3).

Şekil 3. Normal Dağılım Eğrisi. 71


c) Yukarıdaki ifadeden de görüldüğü gibi, normal dağılım, µ ve σ değerleriyle belirlenir. ç) -∞’dan + ∞’a uzanan ve simetrik olan normal eğriyle, (x) ekseni arasında kalan alan, 1’ e eşittir.

!

+"

#"

f ( x)dx = 1

Normal eğri ile x ekseni arasında kalan alanın % 100'e eşit olduğunu düşünürsek, x değişkeninin µ ile (µ + 1σ ) aralığında değerler alması olasılığı % 34.13 ve yine µ ile ( µ - 1σ ) aralığında değerler alması olasılığı % 34.13'e eşittir. Dolayısıyla, x değişkeninin (µ - 1σ ) ile (µ + 1σ ) arasında yer alması olasılığı % 68.26’dır. Aynı şekilde, (x)’ in (µ - 2σ) ile (µ + 2σ) arasında değerler alma olasılığı % 95.45 ve (µ - 3σ) ile (µ + 3σ) arasında değerler alma olasılığı da % 99.73'e eşittir (Şekil 4).

Şekil 4 . Normal eğrinin özellikleri. µ +1#

"µ

!1#

µ + 2#

"µ

! 2#

f ( x ) dx = P ((µ ! 1# ) < x < (µ + 1# )) = 0.6826 f ( x) dx = P ((µ ! 2# ) < x < (µ + 2# )) = 0.9545

72


µ +3#

"µ

!3#

f ( x) dx = P ((µ ! 3# ) < x < (µ + 3# )) = 0.9973

Tam simetrik olmayan (sağa veya sola eğik ) ve tek tepeli dağılım gösteren bir çok biyolojik değişkene ilişkin verilerin normal dağılıma dönüştürülmesi gerekebilir. Bu dönüşümü gerçekleştirmenin en basit ve yaygın yolu, gözlemsel verilerin yerine, bunların logaritmalarını kullanmaktır. 4.2.3.2.

NORMAL EĞRİNİN STANDARDİZASYONU

Dağılımın parametre ( µ , ! ) değerleri ve ifade edildikleri ölçü birimleri ne olurlarsa olsunlar, her normal dağılım, yukarıda belirtilen (a), (b), (c) ve (ç) şıklarında verilen özelliklere sahiptir. Bu ilginç özelliklere sahip normal dağılım, gerçek yaşamda pratik bir yoldan kullanılabilmesi, karşılaştırmalı uygulamalarda yararlı olabilmesi için standardize edilir. Bu standardizasyon işlemi, normal dağılımla incelenen (x) değişkeninde başlangıç noktası ve ölçek değişimi yapılarak gerçekleştirilir.

"i =

xi # µ !

dönüşümü ile x yerine ! değişkeni incelenir.

Yapılan işlemlerden dolayı, ! değişkeninin dağılımının ortalaması (0)’ a, standart sapmasıysa (1)’ e eşit olur ve dağılımın eğrisi normal eğriyle temsil edilir (Şekil 5).

Şekil 5. Standart normal eğri. 73


Standart normal dağılımın olasılık yoğunluk fonksiyonu aşağıdaki gibidir.

f (! ) =

1 2#

e

1 " !2 2

Standart normal dağılımda da, gözlemlerimizin % 68.26'sı –1 < ! < +1 aralığında, % 95.45'i –2 < ! < +2 aralığında, % 99.73'ü ise –3 < ! < +3 aralığında yer alacaktır.

"

+1

!1

"

+2

!2

"

+3

!3

f (# ) d# = P (! 1 < # < +1) = 0.6826 f (# ) d# = P (! 2 < # < +2 ) = 0.9545 f (# ) d# = P (! 3 < # < +3) = 0.9973

Tablo III'de standart normal değişkenin 0 ile çeşitli uzaklıklardaki standart sapma değerleri arasında kalması olasılıkları verilmektedir. 4.2.3.3.

NORMAL DAĞILIMA İLİŞKİN UYGULAMALAR

Uygulamalı çalışmalarımızda ele aldığımız grupların anayığın olmayıp, örneklemlerden ibaret oldukları gözönüne alınırak µ yerine x ve σ yerine s değerlerini kullanmamız uygun olur. Standart normal değişkeni elde ederken

"i =

xi ! x dönüşümünden yararlanacağız. s

Örnek 22. Bir araştırmada, 6 - 11 yaş grubu erkek çocuklarında sistolik kan basıncı ortalaması 107.3 mm-Hg ve standart sapması 8.7 mm-Hg bulunmuştur. Bu bilgileri kullanarak, aynı yaş grubunda incelemeye alınacak 200 erkek öğrencinin kaçında kan basıncı değerinin 107.3 ile 115 mm-Hg değerleri arasında kalması beklenir? 74


Çözüm : X rastlantısal değişkeninin (sistolik kan basıncı) µ=107.3 ve σ =8.7 parametreli normal dağılıma uygunluk gösterdiğini varsayalım. Normal eğri ile x ekseni arasındaki alanın % 100'e eşit olduğunu düşünürsek, burada sorulan, taralı alanın kaç olduğudur (Şekil 6.). Diğer bir ifade ile, rastlantısal olarak seçilen bir öğrencinin kan basıncı değerinin 107.3 ile 115 arasında kalma olasılığının kaça eşit olduğudur. Bu olasılık değeri hesaplandıktan sonra bu değerin toplam denek sayısıyla çarpılmasından elde edilen sayı, bize incelenen grupta söz konusu aralıkta olması gereken öğrenci sayısını verecektir. x1 = 107.3'e karşılık gelen

"1 =

x1 ! x 107.3 ! 107.3 = =0 s 8.7

x2 = 115'e karşılık gelen

"2 =

x 2 ! x 115 ! 107.3 = = 0.89 s 8.7

Şekil 6. ! 1 = 0 İle ! 2 = 0.89 arasındaki normal alan

! 1 = 0 ile ! 2 = 0.89 arasındaki alan değeri Tablo III'den bulunur. Bu değer 0.3133’e eşittir. 75


İncelenen grupta toplam denek sayısı n = 200 olduğundan, bu grupta, (200 · 0.3133) = 62.6 öğrencide kan basıncı değerinin 107.3 ile 115 mm-Hg arasında kalması beklenir. Örnek 23. 350 öğrenciye ait zeka puanlarının bölünmesi normal dağılıma uymaktadır. Dağılımın aritmetik ortalaması 100.6 ve standart sapması 12.5 ise, a) Zeka puanı 90 - 118 arasında kalan kaç kişi vardır? b) Zeka puanı 110'dan düşük kaç kişi vardır? Çözüm : a) x1 = 90 ve x2 = 118 değerlerine karşılık gelen standart değerler aşağıdaki şekilde hesaplanır.

ile

!

"1 =

x1 ! x 90 ! 100.6 = = !0.85 s 12.5

"2 =

x 2 ! x 118 ! 100.6 = = 1.39 s 12.5

X rastlantısal değişkeninin ( zeka puanı) 90 - 118 arasında kalma olasılığı değişkeninin –0.85 - 1.39 arasında kalma olasılığı birbirine eşittir.

Tablo III'de verilen standart normal eğrinin ! = 0 eksenine göre simetrik olması özelliğini kullanarak, 0 ile ! 1 ve - ! 1 ile 0 arasındaki alan değerlerinin aynı olduğunu söyleyebiliriz. Buna göre, 0 ile 1.39'a karşılık gelen olasılık 0.4177 ve -0.85 ile 0'a karşılık gelen olasılık da 0.3023 değerine eşittir. ! değişkeninin -0.85 ile 1.39 arasında kalma olasılığı, ! değişkeninin -0.85 ile 0 ve 0 ile 1.39 arasında kalma olasılıklarının toplamına eşittir. P( 90 < x < 118 ) = P(-0.85 < ! < 1.39) = P(-0.85 < ! < 0) + P(0< ! <1.39) = P(0< ! <0.85) + P(0< ! <1.39) = 0.3023 + 0.4177 = 0.72

76


350 kişi arasında zeka puanı 90 - 118 arasında olanların sayısının (350 · 0.72) = 252 kişi olması beklenir. b) x1 = 110 değerine karşılık gelen standart değer 110 - 100.6 ! 1 =  = 0.75 . 12.5

Şekil 7.

! <0.75

için Normal alan.

Şekil 7'den de görüldüğü gibi, P(x<110) = P( ! <0.75) = P( ! <0) + P(0< yazabiliriz.

!

<0.75) eşitliğini

! <0 ile toplam alanın yarısı belirtildiğinden P( ! <0) = 0.50 ve Tablo III kullanılarak P(0< ! <0.75) = 0.2734 bulunur. Buna göre, P(x<110) = 0.50 + 0.2734 = 0.7734

77


(350·0.7734)=271 öğrencide zeka puanının 110'nun altında kalması beklenir. Örnek 24. Bir sınavda ortalama not 70 ve standart sapma 8'dir. Yüksek not alan öğrencilerin % 15'ine "A" derecesi verilecektir. "A" alabilmek için bir öğrencinin alması gereken en düşük not kaç olmalıdır? ( Notların bölünmesinin normal olduğu varsayılmaktadır). Çözüm : Standart normal eğrinin sağ tarafındaki % 15'lik uç alana (Şekil 8.) karşılık gelen standart değer, yani P(0< ε< ! 1 ) = 0.50 - 0.15 = 0.35 ifadesini gerçekleyen ! 1 değeri Tabol III.'den 1.04 olarak bulunur.

Şekil 8.

"1 =

x1 ! x ifadesi kullanılarak, s

x1 = (1.04) · (8) + 70 = 78.32 bulunur.

78


Bölüm 5

Kuramsal Örnekleme Dağılımı

5.1. ÖRNEKLEME DAĞILIMI VE STANDART HATA Daha önce de bir kaç kez vurguladığımız gibi, İstatistik Yöntembilim’ in sonul amacı, sınırlı gruplar ya da toplulukların incelenmesinden hareketle, tümevarımla anayığına genelleme yapabilmektir. Anayığının kestirmek istediğimiz parametresi, ortalama, standart sapma, belli bir persantil (yüzdelik) değeri, v.s... olabilir. Anayığının kestirmek istediğimiz parametresinin ( µ ) olduğunu varsayalım. Bu kestirim için hareket noktamız anayığından seçilmiş bir örnekten hesaplanan aritmetik ortalamamız ( x ) olacaktır. Acaba, örneğimizin ortalaması olan ( x ) asıl hedefimiz olan anayığın ortalaması ( µ )’yü ne derecede temsil edebilir? Bu soruyu bir başka biçimde de ifade edebiliriz. (n) birimden oluşan örneğimiz yerine, anayığından bir diğer (n) birimden oluşan ikinci bir örnek seçseydik, bu örneğin ortalaması, ilk örneğimizin ortalamasına eşit olacak mıydı? Dahası, bu işlem bir kaç kez yinelenmiş olsaydı, (n) büyüklüğündeki bu farklı örneklemlerin ortalamaları birbirlerinden ne derecede farklı olacaklardı? Kuşkusuz, gerçek yaşamda yapılan araştırmalarda, belli bir anayığının ortalamasını kestirmek için bu anayığından tek bir örnek seçmek yeterlidir. Yalnızca tek bir örneklem ortalamasından, anayığın ortalamasına genelleme 79


yapmanın sağlıklı bir yolunu bulmak amacıyla, belli bir anayığından (n) büyüklüğünde bir çok örneğin seçilip, bu örneklerin ortalamalarının nasıl bir dağılım gösterdiğini incelemek isteyelim. (N) birimden oluşan ve ortalaması (µ = 120.93) ve standart sapması ( ! = 8.49) olan bir anayığından iadeli olarak (n=10)’ar birimlik 40 örnek çektiğimizi ve bu örneklemlerde de aşağıdaki aritmetik ortalamaları bulduğumuzu varsayalım (Tablo 1) Tablo 1. n=10 olan 40 ayrı örnekte ortalamalar Örnek no 1 2 3 4 5 6 7 8 9 10

xi 120,50 123,21 122,40 119,42 120,73 120,61 119,87 120,70 119,39 118,51

Örnek no 11 12 13 14 15 16 17 18 19 20

Örnek no 21 22 23 24 25 26 27 28 29 30

xi 122,93 118,85 117,87 127,01 121,96 119,93 122,27 117,53 120,07 122,78

xi 116,46 124,18 120,57 117,37 124,67 119,64 115,80 120,20 117,88 118,85

Örnek no 31 32 33 34 35 36 37 38 39 40

xi 125,63 120,13 122,18 124,71 122,15 123,40 121,92 120,62 121,19 122,99

Bu örnek ortalamalarının meydana getirdiği dağılıma “deneysel örnekleme dağılımı” adı verilir (Şekil 1).

Şekil 1 . Deneysel örnekleme dağılımı

80


Aynı işlemlerin sınırsız sayıda birimden oluşan bir anayığından çekilebilecek tüm (n) büyüklüğündeki örnekler üzerinde yapıldığı varsayıldığında, “deneysel örnekleme dağılımı”nın yerini “kuramsal örnekleme dağılımı” alır. Dolayısıyla, “kuramsal örnekleme dağılımı”, bir anayığından alınabilecek (n) büyüklüğündeki tüm örneklemlerin ortalamalarının oluşturduğu dağılımdır. Bu türden bir dağılım, bir anayığından çekilebilecek sabit büyüklükteki örneklemlerde belli ortalama değerlerin belirme olasılığının kaça eşit olduğunu gösterir. Ortalama için olduğu gibi, anayığının standart sapması, ya da belli bir özelliğin oranı gibi parametreler için de kuramsal örnekleme dağılımları oluşturulabilir. Kuramsal örnekleme dağılımının standart sapmasına “standart hata” adı verilir. Standart hata, standart sapmayla karıştırılmamalıdır. Gerçekten, standart sapma, bir anayığındaki ( ! ) ya da bu anayığından alınmış belli bir örnekteki birimlere ilişkin gözlem sonuçları arasındaki değişkenliği ölçer. Standart hata ise, anayığından alınmış (n) büyüklüğündeki örneklerin ortalamaları arasındaki değişkenliğin ölçüsüdür. Diğer bir deyişle, standart hata, bulunan ortalama değerlerin bir örnekten diğerine ne derecede farklılık gösterebileceğini ifade eder.

5.2. KURAMSAL ÖRNEKLEME DAĞILIMININ ÖZELLİKLERİ (MERKEZİ SINIR TEOREMİ) Aritmetik ortalaması ( µ ) ve standart sapması ( ! ) olan bir anayığından alınan (n) büyüklüğündeki örneklerin ortalamalarının oluşturduğu kuramsal örnekleme dağılımının ortalaması µ ’ye, standart sapmasıysa (standart hata)

! ’e eşittir. n (n) büyüdükçe ( n " ! ) kuramsal örnekleme dağılımı normal eğriye yaklaşır. Pratikte, n ≥ 30 olması normal dağılıma yeterli bir yaklaşım sağlamaktadır (Şekil 2).

81


Şekil 2. Ortalamalara ilişkin kuramsal örnekleme dağılımı Anayığının sınırlı sayıda birim içermesi durumunda (veya örnekleme işlemi iadesiz yapılıyorsa), kuramsal örnekleme dağılımının ortalaması µ ’ ye, standart sapmasıysa,

# " n

(N ! n ) ’ye eşittir. (N ! 1)

Oranlara ilişkin kuramsal örnekleme dağılımında oranların ortalaması ve standart hata aşağıdaki ifadelerle belirlenir. Anayığın çok sayıda birim içeriyorsa ( N → ∞ ) (veya örnekleme işlemi iadeli yapılıyorsa)

x pi = P

ve (standart hata) s pi =

(P ! Q ) n

ifadeleriyle,

anayığın sınırlı sayıda birim içeriyorsa (veya örnekleme işlemi iadesiz yapılıyorsa) 82


x pi = P

ve (standart hata) s pi =

(P ! Q ) (N ! n ) ifadeleriyn

( N ! 1)

le hesaplanır. Burada;

x pi

: oranlara ilişkin kuramsal örnekleme dağılımında aritmetik ortalamayı,

s pi

: standart hatayı,

P : anayığına ilişkin incelenen olayda "başarı" olarak nitelendirilen sonucun olasılığını, Q : 1–P “başarı” sonucunun gerçekleşmeme olasılığını göstermektedir. Bu eşitliklerin gerçeklendiğini bir örnek üzerinde gösterelim. Örnek 1. Bir anayığının ( 1, 2, 3, 4, 5 ) sayılarından oluştuğunu varsayalım. Bu anayığından örneklem uzunluğu n = 2 olan tüm örneklemlerin seçildiğini düşünürsek, a) anayığının aritmetik ortalamasını, b) anayığının standart sapmasını, c) kuramsal örnekleme dağılımının aritmetik ortalamasını (iadeli seçim), d) standart hatayı (iadeli seçim), e) kuramsal örnekleme dağılımının aritmetik ortalamasını (iadesiz seçim), f) standart hatayı (iadesiz seçim) hesaplayınız. Çözüm : N

!x

i

a)

µ=

i =1

N

=

15 =3 5

83


N

b) # =

! (x

2

i

" µ)

10 = 1.4142 5

=

i =1

N

c) iadeli olarak n=2 uzunluklu tüm örneklemleri aşağıdaki gibi seçebiliriz. (1,1) (2,1) (3,1) (4,1) (5,1) (1,2) (2,2) (3,2) (4,2) (5,2) (1,3) (2,3) (3,3) (4,3) (5,3) (1,4) (2,4) (3,4) (4,4) (5,4) (1,5) (2,5) (3,5) (4,5) (5,5) Bu örneklemlerde ortalama değerler aşağıda verilmektedir. 1.0 1.5 2.0 2.5 3.0 1.5 2.0 2.5 3.0 3.5 2.0 2.5 3.0 3.5 4.0 2.5 3.0 3.5 4.0 4.5 3.0 3.5 4.0 4.5 5.0 25

x xi =

!x

i

i =1

=

25

75 =3=µ 25

25

# (x d) s x i =

i

"µ

i =1

25

2

) =

25 ! =1= 25 n

e) iadesiz olarak seçilen n=2 uzunluklu tüm örneklemler ve bu örneklemlerdeki aritmetik ortalamalar aşağıda verilmektedir. örneklemler (1,2) (2,3) (3,4) (4,5) (1,3) (2,4) (3,5) (1,4) (2,5) (1,5)

ortalamalar 1.5 2.5 3.5 4.5 2.0 3.0 4.0 2.5 3.5 3.0

84


10

x xi =

!x

i

i =1

=

10

30 =3=µ 10

f) 10

# (x s xi =

i

i =1

10

2

) =

7.5 $ = 0.866 = " 10 n

(N ! n ) (N ! 1)

Örnek 2. Bir anayığının ( 1, 2, 3, 4, 5 ) sayılarından oluştuğunu ve incelenen olayda 1, 2, ve 3 değerlerinin çıkmasını "başarı" olarak kabul edelim. Örneklem uzunluğu n = 2 olan tüm örneklerin seçildiğini düşünürsek, a) anayığında başarı oranını, b) kuramsal örnekleme dağılımında oranların aritmetik ortalamasını (iadeli seçim), c) standart hatayı (iadeli seçim), d) kuramsal örnekleme dağılımında oranların aritmetik ortalamasını (iadesiz seçim), e) standart hatayı (iadesiz seçim) hesaplayınız. Çözüm : "başarı" sayısı 3 a) P =  =  = 0.60 olanaklı durumlar sayısı 5 b) iadeli olarak seçilen n=2 uzunluklu örneklemlerde (Örnek 1) "başarı" oranları aşağıda verilmektedir. 1.0 1.0 1.0 0.5 0.5

1.0 1.0 1.0 0.5 0.5

1.0 1.0 1.0 0.5 0.5

0.5 0.5 0.5 0.0 0.0

0.5 0.5 0.5 0.0 0.0

85


25

x pi =

!p

i

i =1

25

=

15 = 0.60 = P 25

25

c)

s pi =

# (p

2

i

" P)

i =1

3 = 0.3464 = 25

=

25

P !Q n

d) iadesiz olarak seçilen n=2 uzunluklu örneklemlerde (Örnek 1.) "başarı" oranları aşağıda verilmektedir. 1.0 1.0 0.5 0.0 1.0 0.5 0.5 0.5 0.5 0.5 10

x pi =

!p

=

10 10

e) s pi =

i

i =1

# (p

6 = 0.60 = P 10 2

i

! P)

i =1

10

=

0.9 = 0.3 = 10

86

P "Q " n

(N ! n ) (N ! 1)


Bölüm 6

Örnekleme

Anayığının (evrenin) bütün birimleri yerine, bazı kurallara göre seçilen birimlerin oluşturduğu, temsil gücüne sahip bir alt grubun gözleme tabi tutulması, incelenmesi ve elde edilen sonuçların anayığına genellenmesine “örnekleme” denir. Örnekleme tekniği, bir araştırmayı geniş ve gereksiz bir bilgi yükünden kurtararak zaman, para, eleman ve malzeme tasarrufu sağlar. Örnekleme bu ölçüde yararlı bir teknik olmakla birlikte, riski yüksek ve gelişigüzel kullanılması sakıncalı bir işlemdir. Bir örnekten (örneklem) elde edilen sonuçların, örneğin içinden seçildiği anayığına genelleştirilebilmesi için, örneği oluşturan birimlerin anayığının karakteristiklerini yansıtacak özellikte olması gerekir. Temsil gücüne sahip olmayan bir örneğe dayanılarak yapılacak bir genellemede önemli sapmalar ve yanılgıların olması kaçınılmazdır. Bu nedenle, örnekleme işlemi yapılırken belli kurallara uymaya ve belli koşulları gerçekleştirmeye özen gösterilmelidir. 87


Örnekleme yöntemlerini aşağıdaki gibi sınıflayabiliriz. Örnekleme Yargısal örnekleme

Rastlantısal örnekleme (olasılıklı örnekleme)

Basit rastlantısal örnekleme Kura Yöntemi Rastlantısal sayılar yöntemi

Sistematik örnekleme yöntemi

Katmanlı örnekleme Orantılı katmanlı örnekleme

Orantısız katmanlı örnekleme

Küme örnekleme Olasılıklı alan örnekleme

Şekil 1. Örnekleme türleri.

6.1. RASTLANTISAL ÖRNEKLEME (OLASILIKLI ÖRNEKLEME) Birimlerin örneğe seçilme işleminin olasılık kurallarıyla yapıldığı bir örnekleme türüdür. Rastlantısal örneklemede anayığındaki her birimin örneğe seçilme olasılığı birbirine eşittir. 88


6.1.1. BASİT RASTLANTISAL ÖRNEKLEME Basit rastlantısal örnekleme yapabilmek için anayığının kuramsal ya da kavramsal olarak tanımlanmış olması yeterli değildir. Anayığının somut olarak tanımlanması veya anayığın birimlerine ait bir listesinin olması gerekir (muhtarlık kayıtları, seçmen kütükleri, telefon rehberi, ...) . Örnekleme işlemine geçmeden önce, liste üzerinde her birim numaralandırılır. 6.1.1.1. KURA YÖNTEMİ Anayığını oluşturan (N) sayıda birimin numaraları bir torbaya konarak karıştırılır ve bu torbadan örnek büyüklüğü (n) kadar birim seçilir. Örnek 1. Belli bir dönemde, (X) hastalığı nedeniyle hastaneye başvuran hastaların durumlarının incelendiği bir araştırmayı ele alalım. Belirtilen dönemde (X) nedeniyle hastaneye başvuran tüm hastalar anayığını oluşturur. Burada, hasta sayısının (N) çok büyük olduğunu ve tümünün incelenmesinin zaman, para, malzeme ve eleman açısından güç olduğunu kabul edersek, tüm hastaların incelenmesi yerine, bu anayığından, kura yöntemiyle örneklem büyüklüğü (n) kadar hastanın seçilerek incelenmesi yeterli olur. Bunun için tüm hastalara birer numara (protokol numarası) verilir ve numaralar fişlere kaydedilir. Bütün fişler bir torbaya konduktan sonra torba karıştırılır ve içinden (n) tanesi rastlantısal olarak seçilir. Burada anayığındaki her birimin örnekleme girme olasılığı birbirine eşittir. 6.1.1.2.

RASTLANTISAL SAYILAR YÖNTEMİ

Örnekleme işlemi için rastlantısal sayılardan oluşan tablo (Tablo I) kullanılır. Basit olarak rastlantısal sayılar tablosunu şu şekilde oluşturabiliriz. 0,1,2, … ,9 rakamları bir torbaya konur ve torbadan (iadeli) rastlantısal olarak bir rakam seçilir. Bu işlem çok kez tekrarlandığında, istenilen basamakta ve istenilen miktarda rastlantısal sayı elde edilir. Bu şekilde elde edilen rastlantısal sayıların oluşturduğu tabloya rastlantısal sayılar tablosu diyoruz. Bilgisayar kullanımının yoğun olduğu günümüzde, rastlantısal sayılar dizisi çok kısa zamanda elde edilebilmektedir Tablo I’de verilen rastlantısal sayılar tablosu, EXCEL bilgisayar programındaki “S_SAYI_ÜRET” fonksiyonu kullanılarak oluşturulmuştur. 89


Anayığındaki birimler 1’den N’e kadar numaralandırılır. Seçim işlemi için, rastlantısal sayılar tablosundaki l basamaklı (N’in basamak sayısı) rastlantısal sayılar kullanılır. Tablodan rastlantısal olarak seçilen satır ve sütuna karşılık gelen sayı başlangıç sayısı olarak seçilir. Daha sonra, yukarıdan aşağıya veya soldan sağa hareketle rastlantısal sayı seçmeye devam edilir. Seçilen rastlantısal sayı tekrar ettiyse veya bu sayıya karşılık gelen birim anayığında yoksa, bu sayı göz önüne alınmaz. Bu işleme örnek oluşturuluncaya kadar devam edilir. Örnek 2. N=9550 olan bir anayığından n=10 birimlik bir örneklemi rastlantısal sayılar tablosunu kullanarak oluşturmak isteyelim. Anayığındaki birimler 1’den 9550’ye kadar numaralandırılarak liste oluşturulur. Rastlantısal sayılar tablosundan kurayla satır sayısını 4 ve sütün sayısını 5 olarak seçelim. Tabloda, 4. satır ve 5. sütuna karşılık gelen başlangıç sayısı belirlenir (79247). Bu sayının sağa bitişik 4 basamağın (l=4) oluşturduğu 9247 numaralı birim örneklemin ilk birimi olacaktır. Yukarıdan aşağıya devam ederek, örneklemi oluşturan birimler aşağıdaki gibi belirlenir. 9247 2339 1876 4331 2734 8932 2492 5547 4876 1598 6.1.1.3.

k=

N n

SİSTEMATİK ÖRNEKLEME ifadesi ile örneklemi oluşturacak birimler arasındaki uzaklık

hesaplanır. 1 ile k arasından rastlantısal olarak bir tam sayı (a) seçilir. Daha sonra, (a)’dan başlayarak k’lı aralıklarla birimleri seçerek örneklem oluşturulur. Örnek 3. N=900 birimden oluşan bir anayığından n=15 birimlik bir örneklemi sistematik örnekleme yöntemiyle oluşturalım. Birimler arası uzaklık k =

N 900 = 60 ve a ! [1,60] olacak = n 15

şekilde rastlantısal olarak seçilir. a=20 olsun. 20’den başlayarak 60’arlık aralıklarla seçilen birimler örneklemi oluşturur. 20, 80, 140, 200, 260, 320, 380, 440, 500, 560, 620, 680, 740, 800, 860

90


6.1.2. KATMANLI ÖRNEKLEME Örneklemi teşkil etmeden önce, anayığın bazı katman ve sınıflara ayrılır ve örneklem bu katmanlardan rastlantısal olarak seçilir. Örneğin, ilköğrenim çağındaki öğrencilerin sağlık durumlarını araştırmak amacıyla yapılacak bir araştırmada , öğrencileri katmanlara ayırmak üzere, cinsiyet, yaş, sosyo-ekonomik durum gibi ölçütler kullanılabilir. Katmanlı bir örneklemede bölme ölçütlerinin saptanmasından sonra yapılacak ilk iş, her gruptan örnekleme girecek birimlerin seçilmesidir. Bunun için, önce anayığın birimlerinin bu ölçütlere göre dağılımı elde edilir. Daha sonra alt grupların her biri bir anayığın gibi ele alınarak basit rastlantısal örnekleme işlemiyle öngörülen sayıda birim seçilir. Orantılı katmanlı örneklemede, katmanın anayığın içindeki yeriyle orantılı olacak şekilde birim seçilir. Orantısız katmanlı örneklemede ise, katmanın anayığın içindeki oransal büyüklüğüne bakılmaksızın eşit sayıda birim seçilir. Orantısız katmanlı örnekleme yöntemiyle oluşturulan bir örneklemden elde edilen sonuçlar, katmanların anayığın içindeki oransal büyüklükleriyle ağırlıklandırıldıktan sonra anayığına genellenebilir.

6.1.3. KÜME ÖRNEKLEME Bu örneklemede seçilen birimler, anayığındaki birimlerin kendiliğinden içinde yer aldıkları kümelerdir. Anayığın birimlerini oluşturan kümeler ilk örnekleme birimleri sayılarak, bunlar arasından rastlantısal yolla seçilen kümeler alınır ve genellikle bu kümelerin tam sayımına başvurulur. Anayığını oluşturan birimlerin tam bir listesini elde edemiyorsak küme örnekleme yöntemi kullanılır. Örneğin belli bir bölgede ilköğrenim çağındaki öğrencilerin sağlık durumlarını araştırmak amacıyla yapılacak bir küme örneklemesinde, ilk olarak, bölgede yer alan ilköğretim kurumlarının listesi oluşturulur. Listede yer alan okullar birer birim (küme) olarak ele alınır ve bu listeden öngörülen sayıda okul (küme) basit rastlantısal örnekleme yöntemiyle seçilir. Seçilen her küme tam sayım yöntemiyle incelenir.

91


6.1.4. OLASILIKLI ALAN ÖRNEKLEMESİ Anayığın birimlerini içinde bulundukları yerleşim düzenine göre kümelendiren bir tekniktir. Bir alanın coğrafi bakımından bir bölgeyi (bir ülkeyi) temsil ettiğini düşünelim. Toplam alan alt alanlara ayrılır. Ayrılan bu alanlardan bir kısmı veya biri rastlantısal olarak seçilir ve aynı işleme zincirleme bir şekilde son birime ulaşılana kadar devam edilir. Örneğin belli bir coğrafi alan (n) sayıda alt alana ayrılır. Her bir alt alandaki yerleşim birimleri listelenir. Rastlantısal olarak seçilen yerleşim birimlerine ilk örnekleme birimi adı verilir. Daha sonra seçilmiş yerleşim birimleri daha alt alanlara, bloklara ayrılarak her alandan birimler rastlantısal olarak seçilir.

6.2. YARGISAL ÖRNEKLEME Bu örnekleme tipinde, araştırmacının kişisel bilgi ve görüşlerine göre bazı birimlerin anayığını temsil edebilecekleri düşünülür ve bu birimler seçilerek örneklem oluşturulur.

92


Bölüm 7

Örneklem Büyüklüğü

Pek çok araştırmada, anayığına ilişkin parametrelerin (anayığın aritmetik ortalaması (µ ) veya anayığın oranı (P)) tahmin edilmesi veya aynı değişkenin incelendiği farklı örneklemlerden elde edilen istatistiklerin karşılaştırılması amaçlanır. Doğru bir tahmin (kestirim) yapabilmek için, üzerinde araştırma yapılacak çalışma grubunun (örneklemin) en az kaç birim içermesi gerektiği hesaplanarak belirlenmelidir. Örneklem büyüklüğünün (n) hesaplanmasında, araştırmacının öncelikle örneklem istatistikleri ile anayığın parametreleri arasındaki farkın (kabul edilebilir örnekleme hatası) en fazla hangi değeri alabileceğini belirlemesi gerekir. Kestirim gücü yüksek, duyarlı sonuçlar elde edebilmek için kabul edilebilir örnekleme hatası olabildiğince düşük tutulmalıdır. Yapılacak çalışmada, kabul edilebilir örnekleme hatasının düşük tutulabilmesi, örneklem büyüklüğünün arttırılması ile sağlanabilir. Diğer taraftan, örneklem büyüklüğünün artması, çalışma olanaklarını zorlayacağından, araş93


tırmacı çalışma koşulları ile araştırma sonuçlarının duyarlılığı arasında bir denge kurmak durumundadır. Farklı uygulamalar için, örneklem büyüklüğünün (n) hesaplanmasında kullanılan ifadeler aşağıda verilmektedir. Hesaplamalarda göz önüne alınan örneklemlerin basit rastlantısal örneklemler olduğu kabul edilecektir.

7.1. ANAYIĞIN ORTALAMASININ (µ ) KESTİRİLMESİNDE ÖRNEKLEM BÜYÜKLÜĞÜ Burada, tahmin edilmek istenen anayığın ortalaması (µ ) ile örneklem ortalaması ( x ) arasındaki farkın, önceden belirlenen bir değeri belli bir olasılıkla aşmaması istenir. Bu ifadeyi olasılık simgeleriyle aşağıdaki gibi yazarız.

(

)

P | x " µ |< d = 1 " ! Yukarıda verilen ifadede, (d) öngörülen kabul edilebilir örnekleme hatasını, (1-α) güven düzeyini ve α simgesi yanılma düzeyini göstermektedir. Güven düzeyi olarak genellikle % 95, % 99 ve % 99.9 düzeyleri seçilir. Bu güven düzeylerine karşılık gelen yanılma düzeyleri, sırasıyla 0.05, 0.01 ve 0.001’dir. Ortalamalara ilişkin kuramsal örnekleme dağılımının, ortalaması (µ ) ve standart sapması (standart hata) (

! ) olan normal dağılıma sahip olduğu göz n

önüne alındığında, yukarıda verilen eşitliği sağlayan örneklem büyüklüğü (n) değerini (anayığın birim sayısı çok büyük ise) aşağıdaki ifade ile hesaplarız. 2

"# $! 2 n= d2 Anayığın birim sayısı (N) çok büyük değilse, (n) aşağıdaki gibi hesaplanır.

94


2

n=

$% "# 2 " N 2 $ % " # 2 + d 2 " (N ! 1)

n > 0.05 ise, hesapladığımız n değerini n0 değerine eşitleyerek, N aşağıdaki ifadeyle (n) hesaplanır.

n=

n0 n 1+ 0 N

Örnek 1. Kurşun elementinin neden olduğu çevre kirliliğinin toplum üzerinde etkisini araştırmak için, toplumda kan kurşun düzeyini tahmin etmek isteyelim. % 95 Güven düzeyinde oluşturulacak bir basit rastlantısal örneklemde, (µ ) ile ( x ) arasındaki farkın d= 2 µg/100 ml değerini aşmaması için örneklem büyüklüğü kaç olmalıdır? Çözüm : Kabul edilebilir örnekleme hatası d= 2 µg/100ml , güven düzeyi (1-α) = 0.95 ve yanılma düzeyi α =0.05’dir. Normal alanlar tablosu (Tablo III) ve t tablosundan (Tablo IV) α =0.05 değerine karşılık gelen standart normal değer ! 0.05 = 1.96 alınır. Kan kurşun düzeyinin anayığındaki varyansının kestirim değeri, daha önce yapılmış olan çalışmalardan (literatürden) veya yapılacak ön çalışmadan, ! 2 = 144 µg/100ml olarak elde edilir. Anayığın birim sayısının (toplumdaki kişi sayısının) çok büyük olduğu kabul edilirse, örneklem büyüklüğünü aşağıdaki ifade ile hesaplarız.

2

"# $! 2 n= d2

=

(1.96)2 ! (144) = 139 (2)2

95


7.2. ANAYIĞIN ORANININ (P) KESTİRİLMESİNDE ÖRNEKLEM BÜYÜKLÜĞÜ Tahmin edilmek istenen anayığın oranı (P) ile örneklem oranı p 0 arasındaki farkın, önceden belirlenen bir değeri belli bir olasılıkla aşmaması isteniyorsa ( P (| P " p 0 |< d ) = (1 " ! )), örneklem büyüklüğünü (n), ( N " ! için) aşağıdaki ifade ile hesaplarız. 2

# ! P !Q n= " 2 d Burada, P : anayığına ait oran değerini (bu oran genellikle bir hastalığın toplumda görülme sıklığını (prevalans) göstermek için kullanılır), Q = 1- P , d : kabul edilebilir örnekleme hatasını,

" ! : α değerine karşılık gelen standart normal değeri göstermektedir. N çok büyük değilse, n aşağıdaki ifade ile hesaplanır. 2

n=

$# " P " Q " N 2

$ # " P " Q + d 2 " (N ! 1)

n0 n > 0.05 ise, n = ifadesi ile düzeltme yapılır. n N 1+ 0 N

Aşağıdaki tabloda α =0.05 için çeşitli P ve d değerlerine karşılık gelen n değerleri verilmektedir. 96


Tablo 1. α =0.05 için örneklem büyüklükleri. P d

0,05 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,15 0,20 0,25 0,30

0,10

0,20

0,30

0,40

0,50

0,60

0,70

0,80

0,90

1825 3458 457 865 203 385 115 217 73 139 51 97 38 71 29 55 23 43 19 35 9 16 5 9 -6 ---

6147 1537 683 385 246 171 126 97 76 62 28 16 10 7

8068 2017 897 505 323 225 165 127 100 81 36 21 13 9

9220 2305 1025 577 369 257 189 145 114 93 41 24 15 11

9604 9220 2401 2305 1068 1025 601 577 385 369 267 257 196 189 151 145 119 114 97 93 43 41 25 24 16 15 11 11

8068 2017 897 505 323 225 165 127 100 81 36 21 13 9

6147 1537 683 385 246 171 126 97 76 62 28 16 10 7

3458 865 385 217 139 97 71 55 43 35 16 9 6 --

(d: kabul edilebilir örnekleme hatası , P : anayığın tahmini oranı)

Örnek 2. Bir hastalığın toplumda görülme sıklığının (prevalans) 0.10 civarında olduğunu varsayalım. Söz konusu hastalığın prevalansını belirlemek amacıyla bir alan araştırması yapılmak istenmektedir. Yapılacak araştırmada, % 95 güvenle, kabul edilebilir örnekleme hatasının 0.01 değerini aşmaması isteniyorsa, örneklem büyüklüğü kaç olmalıdır? Çözüm : P = 0.10 , Q = 1-0.10 = 0.90 ve α =0.05 için ! 0.05 = 1.96’dır. 2

# ! P ! Q (1.96) 2 ! (0.10) ! (0.90) n= " 2 = = 3458 d (0.01) 2 97


7.3. KONTROL VE DENEY GRUPLARINA İLİŞKİN, ORTALAMALARIN ( x1 , x 2 ) KARŞILAŞTIRILMASINDA ÖRNEKLEM BÜYÜKLÜĞÜ İki ayrı örneklemden elde edilen aritmetik ortalamaların karşılaştırılması söz konusudur. İki örneklem ortalamasının istatistiksel karşılaştırmasında yapılacak işlemler (hipotezlerin kurulması, sınanması, tip I hata(α) ve tip II hata (β)) daha sonraki bölümlerde ayrıntılı olarak açıklanacaktır. Klinik araştırmalarda, genellikle, bir gruba etkin madde (etkisi araştırılmak istenen madde, veya yöntem) uygulanırken, diğer gruba plasebo (etkisiz madde veya geleneksel yöntem,..) uygulanır. Etkisi araştırılan maddenin uygulandığı gruba deney grubu, plasebo grubuna ise kontrol grubu adı verilir. Burada, kontrol grubundaki aritmetik ortalama ( x 1 ) ile deney grubundaki aritmetik ortalama ( x 2 ) arasındaki mutlak farkın

x1 ! x 2 ,

önceden belirlenen bir değeri belirli olasılıkla aşmaması istenir. Her bir grup için gerekli denek sayısı aşağıdaki ifade ile hesaplanır.

Yukarıdaki ifadede, d : kabul edilebilir örnekleme hatasını, ! 2 : anayığın varyansını, " ! , " ! : tip I hata(α) ve tip II hata (β) (veya testin gücü =(1- β)) için, standart normal değerleri göstermektedir. Hesaplamalarda, genellikle, (α = 0.05) ve (β = 0.10 veya β =0.20) alınır. Tablo III (Normal Alanlar Tablosu) ve Tablo IV (t tablosu) incelendiğinde, (iki-yönlü) α = 0.05 için " ! =1.96, (tekyönlü) β = 0.10 için " ! =1.28 ve (tek-yönlü) β=0.20 için " ! =0.84 değerleri elde edilir.

98


Örnek 3. Yeni geliştirilen bir (A) maddesinin, sistolik kan basıncını düşürmekte (veya kontrol altına almakta) etkili olduğu iddia edilmektedir. Bu iddianın doğruluğunu sınamak amacıyla planlanan klinik bir çalışmada, (A) maddesi deney grubunda, plasebo ise kontrol grubunda uygulanacaktır. Deney grubu ile kontrol grubu ortalamaları arasındaki farkın (istatistiksel olarak anlamlı kabul edilebilecek fark) en az d=10 mm-Hg olması için grupların büyüklükleri kaç olmalıdır? Çözüm : (α = 0.05) ve (β = 0.10) için standart normal değerler sırasıyla (ikiyönlü) " ! = 1.96 ve (tek yönlü) " ! = 1.28 değerleri Tablo III ve IV’den okunur. Kan basıncına ait anayığın varyansının ! 2 (varyansın kestirimi literatür bilgisi veya yapılacak ön çalışmadan elde edilir) 64 olduğunu varsayarsak, kontrol ve deney gruplarına almamız gereken denek sayısını aşağıdaki gibi hesaplarız.

2 ( 1.96 + 1.28) ! 64 n = 2!

10 2

Her bir grup için n = 14 bulunur. Çalışmada kabul edilebilir örnekleme hatasını daha küçük belirlersek örneklem büyüklüğünün artacağı açıktır. Örneğin, kabul edilebilir örnekleme hatasını d = 5 mm-Hg alırsak, her bir grup için, n = 54 hesaplanır.

7.4. KONTROL VE DENEY GRUPLARINA İLİŞKİN, BAŞARI ORANLARININ ( p1 , p 2 ) KARŞILAŞTIRILMASINDA ÖRNEKLEM BÜYÜKLÜĞÜ Kontrol grubundaki başarı oranı ( p1 ) ile deney grubundaki başarı oranı ( p 2 ) arasındaki mutlak farkın

(p

1

! p2 ), önceden belirlenen bir değeri belirli 99


olasılıkla aşmaması için gerekli olan denek sayısının hesaplanması amaçlanır. Her bir grup için gerekli denek sayısını aşağıdaki ifade ile hesaplarız.

(% n= P=

" 2 " P " (1 ! P ) +% # " p1 " (1 ! p1 )+ p2 " (1 ! p2 )

$"

)2

(p1 ! p2 )2

(p1 + p2 ) 2

Örnek 4. Plaseboya göre etkinliği araştırılan bir maddenin (bir yöntemin) deney gruplarındaki başarı oranının p 2 =0.60 ve plasebonun kullanıldığı kontrol grubundaki başarı oranının ise, p1 =0.40 olacağını öngörelim. 0.05 yanılma düzeyinde (α = 0.05) ve 0.90 güçte (β= 0.10), gruplara alınması gereken denek sayıları aşağıdaki gibi hesaplanır. Çözüm :

P=

(p1 + p2 ) 2

(0.40+0.60) = 0.50 veve 2

(α = 0.05) ve (β = 0.10) için standart normal değerler sırasıyla, (ikiyönlü) " ! = 1.96 ve (tek yönlü) " ! = 1.28 değerleri Tablo III ve IV’den alınır.

(% n=

$"

" 2 " P " (1 ! P ) +% # " p1 " (1 ! p1 )+ p2 " (1 ! p2 )

(1.96 " n=

)2

(p1 ! p2 )2 2 " 0.50 " (1 ! 0.50) + 1.28 " 0.40 " (1 ! 0.40)+ 0.60 " (1 ! 0.60)

(0.40 ! 0.60)2

Her bir grup için, n = 130 elde edilir.

100

)2


Bölüm 8

Ortalamaların Karşılaştırılması

Kuramsal örnekleme dağılımı ve taşıdığı özellikler bize, örneklemlere ilişkin hesapladığımız çeşitli ortalama ve oranlardan hareketle genellemelere ulaşma olanağını vermektedir. Bu genelleme işlemlerini iki ayrı başlık altında inceleyeceğiz : 1. Parametrelerin kestirimi (genelleme). 2. Varsayımların sınanması (hipotez testleri).

8.1. KESTİRİM Burada tikel’den tümel’e giden bir yaklaşımla anayığından seçilmiş bir örneğe ait ortalama veya orandan hareketle, anayığındaki adı geçen parametrelerin değeri kestirilmektedir. Aşağıda ortalamaya ilişkin genelleme işlemleri anlatılmaktadır. Oranlara ilşkin genelleme işlemleri, “oranların karşılaştırılması” bölümünde ayrıntılı olarak incelenecektir. 8.1.1. ORTALAMALARA İLİŞKİN KESTİRİM (GENELLEME) Bir örneklemde hesaplanan ortalama değerden hareketle, anayığın ortalaması kestirilirken, bir örnekten diğerine varolduğunu bildiğimiz değişkenlik hesaba katılarak, kestirim “güven aralığı” adı verilen belli bir aralık içinde yapılır. 101


Ortalamanın kuramsal örnekleme dağılımının normal eğriye uyduğunu, normal eğri altındaki toplam alanın % 95’ inin de ( ! = -1.96) ile ( ! = +1.96) sınırları arasında kaldığını bildiğimize göre, anayığın ortalaması olan ( µ )’nün, %95 olasılıkla içinde yer alacağı sınırları (güven aralığımızın sınırları) şöyle ifade edebiliriz. P(( x - 1.96·(

! ! )) ≤ µ ≤ ( x + 1.96·( ))) = 0.95 n n

Dolayısıyla, ( x - 1.96·(

! ! )) ve ( x + 1.96·( )) noktaları, anayığın n n

ortalamasının içinde yer aldığı % 95’lik güven aralığının alt ve üst sınırlarını belirler. Aradığımız anayığın ortalaması, % 95 olasılıkla ( x ± 1.96·(

! )) n

aralığının içinde yer alır. n < 30 ise, incelenen değişkenin anayığındaki dağılımının normal olması koşulu ile, güven aralığı aşağıdaki ifade ile belirlenir. ( x - t·(

s s )) ≤ µ ≤ ( x + t·( )) n n

Burada t, (n-1) serbestlik derecesi ve verilen güven düzeyine karşılık gelen Student't dağılımına ilişkin değerdir. 8.1.2. STUDENT (t) DAĞILIMI Standart normal eğriye benzeyen bu olasılık dağılımı ( Şekil 1 ) küçük örneklere ait ortalamaların dağılımını inceleyen William Sealey Gosset (Guinness bira fabrikasında çalışan Gosset, bu firmanın, çalışanlarına yayın yapma izni vermemesinden dolayı, bilimsel çalışmalarını “Student” takma adıyla yayınlamak zorunda kalmıştır) isimli bir İngiliz araştırmacı tarafından 1908’ de tanımlanmıştır.

102


Şekil 1. Serbestlik derecesi 1,2,5,10,20 ve 50 için Student’t dağılım eğrileri ve Standart Normal Dağılım eğrisi Gosset’ in gözlemlerine göre, örnek uzunluğu (n) kaça eşit olursa olsun, dağılımı normal eğriye uyan bir anayığına ait ortalamanın örnekleme dağılımı, anayığının standart sapması olan (σ)’nın değerinin bilinmesi durumunda, normal eğriye uyar. Bununla birlikte, (σ)’nın değerinin bilinmediği durumlarda, (σ)’yı kestirmek için örneğin standart sapması olan (s) kullanılmaktadır. Örneklemin yeterince büyük olduğu (n ≥ 30) durumlarda herhangi bir sorun yaratmayan bu yaklaşım “küçük” (n < 30) örneklerde uygun düşmemektedir. Gerçekten de, bu durumlarda, “kritik oran”’ın dağılımı, normal eğriye uymamaktadır. Ortaya çıkan bu dağılım Gosset tarafından (t) dağılımı olarak adlandırılmıştır. Kritik oran, t =

x!µ s n

( t )’nin dağılımı da, standart normal eğri ( ! ) gibi, ortalaması (0) olan simetrik bir eğridir; ne var ki, bu dağılımın standart sapması, ( (t) dağılımının standart sapması, (n) büyüdükçe, (1)’e yaklaşır.) “serbestlik derecesi” adı verilen bir parametreye bağımlıdır. Bu parametrenin tüm yönleriyle ayrıntılı 103


olarak ele alınarak açıklanması bu kitabın kapsamını aşacağından, burada serbestlik derecesinin yalnızca pratik kullanımda hesaplanması üzerinde duracağız. Uygulamada, tek bir örnekle çalışıldığında, s.d. (serbestlik derecesi) (n1) olacaktır. Serbestlik derecesi kavramına bir diğer yaklaşım ileride ki-kare bölümünde görülecektir. Student - t dağılımının çeşitli serbestlik dereceleri ve güven düzeylerine karşılık gelen değerleri Tablo IV’ de verilmektedir. Örnek 1. 6 - 11 yaş grubu 302 kız öğrencinin kan basıncı değerleri ölçülmüş ve aşağıdaki sonuçlar elde edilmiştir.

x = 107.3 mm-Hg, s = 8.7 mm-Hg, n = 302 Bu değerlere göre anayığın ortalaması µ ' nün güven aralığını, sırasıyla %95, %99 ve %99.9 güven düzeyleri için belirleyiniz. Çözüm : n = 302 >30 olduğundan güvenirlik aralıklarını aşağıdaki ifade ile hesaplayabiliriz. Anayığın varyansı bilinmediğinden, σ yerine s değerini kullanıyoruz. ( x - ! ·(

s s )) ≤ µ ≤ ( x + ! ·( )) n n

%95'e karşılık gelen standart normal değer 1.96, %99'a karşılık gelen değer 2.58 ve %99.9 için ε değeri 3.29'a eşittir (Tablo IV). %95 için; (107.3 - 1.96 ·

8.7 8.7 ≤ µ ≤ 107.3 + 1.96 · ) 302 302

106.32 ≤ µ ≤ 108.28 %99 için; ( 107.3 - 2.58 ·

8.7 8.7 ≤ µ ≤ 107.3 + 2.58 · ) 302 302

106.01 ≤ µ ≤ 108.59 104


8.7 8.7 ≤ µ ≤ 107.3 + 3.29 · ) 302 302

%99.9 için; ( 107.3 - 3.29 ·

105.65 ≤ µ ≤ 108.95 Örnek 2. Bir önceki örnekte elde edilen değerlerin ( x = 107.3, s = 8.7) 25 birimlik bir örneklemden elde edildiğini varsayarsak µ 'nün güven aralığını, sırasıyla, %95, %99 ve %99.9 güven düzeyleri için hesaplayınız. Çözüm : n = 25 < 30 olduğundan güvenirlik aralıklarını aşağıdaki ifade ile hesaplayabiliriz. ( x - t·(

s s )) ≤ µ ≤ ( x + t·( )) n n

s.d. = n - 1 = 25 - 1 = 24 ve %95 güven düzeyine karşılık gelen student't değeri (Tablo IV) 2.064, %99 için 2.797, %99.9 için 3.745'dir. %95 için; (107.3 - 2.064 !

8.7 8.7 ! µ ! 107.3 + 2.064 ! ) 25 25

103.71 ! µ ! 110.89 %99 için; (107.3 - 2.797 !

8.7 8.7 ! µ ! 107.3 + 2.797 ! ) 25 25

102.43 ! µ ! 112.17 %99.9 için; (107.3 - 3.745 !

8.7 8.7 ! µ ! 107.3 + 3.745 ! ) 25 25

100.78 ! µ ! 113.82

105


8.2. VARSAYIMLARIN KURULMASI VE SINANMASI (HİPOTEZ TESTLERİ) Varsayım, olaylar arasında ilişkiler kurmak, ya da olayları belli nedenlere bağlamak üzere tasarlanan ve geçerli sayılan bir önermedir. Biyoistatistik bağlamında bir varsayımın, örneklemlerde elde edilen istatistik değerler ve anayığındaki parametreler konusunda tasarlanan bir önerme olduğu söylenebilir. Biyoistatistikte; varsayım testlerine, farklı örneklemlere ilişkin istatistik ölçülerin, kendi aralarında, ya da bunlarla anayığın parametrelerinin karşılaştırılması amacıyla başvurulur. Varsayımların kurulmasına ilişkin işlemleri, örneklem ortalaması ile anayığın ortalamasının karşılaştırılmasına yönelik olarak, aşağıdaki gibi açıklayabiliriz. Hipotez testlerinin daha kolay anlaşılabilmesi için parametrelere ait simgelerin yerine istatistiklere ait simgeler kullanıldı.

8.2.1. ÖRNEKLEM ORTALAMASI İLE ANAYIĞIN ORTALAMASININ KARŞILAŞTIRILMASI 8.2.1.1. VARSAYIMLARIN (HİPOTEZLERİN) KURULMASI Karşılaştırmalara yönelik araştırmalarda, H o ve H1 ile simgelenen iki ayrı varsayımın önerilmesi söz konusudur: a) Sıfır varsayımı (farksızlık varsayımı) ( H o ) Bu varsayım, karşılaştırmak istediğimiz değerler arasındaki farkın aslında (0) olduğunu, uygulamada sıfırdan farklıysa, bu farkın yalnızca rastlantısal olduğunu ileri sürer. Örneğin, bir anayığın ortalamasıyla ( µ ) bir örneklem ortalamasını ( x ) karşılaştırmak istediğimizi düşünelim: Bu durumda,

H 0 : x = µ ya da

H0 : | x ! µ | = 0

biçiminde ifade edilir. Burada ilginç bir nokta, araştırmacıların sıfır varsayımlarını, genellikle, reddedebilecekleri beklentisiyle kurmalarıdır. 106


Araştırma sürecinde H o ’ın reddedilmesi, ( H1 ) simgesiyle gösterilen alternatif varsayımın kabulü anlamına gelecektir. b) Alternatif varsayım ( H1 )

H1 : x ! µ ya da

H1 : | x ! µ | ! 0 olarak ifade edilir.

Varsayımın sınanması sonucunda, araştırmacı H o ’ı ya doğru bularak karşılaştırılan iki değer arasında gerçek bir fark olmadığını kabul edecek, ya da H o ’ı reddederek incelenen değerler arasındaki farkın salt rastlantısal olmayacak derecede büyük olduğunu ileri sürecektir. H1 sıfır varsayımını kabul etmeyen bir varsayımdır. Sıfır varsayımının reddi, H1 ’in kabulü anlamına gelmekle birlikte, H 0 ’ın reddedilmemesi, “kabul edilmesi” anlamına gelmez. Gerçekten de, ( H 0 )’ın reddini sağlayacak daha iyi düzenlenmiş bir araştırmanın yapılmasının her zaman olanaklı olduğu söylenebilir. Konu biraz daha yakından incelendiğinde, H 0 ’ın sınanmasının aslında iki değil, dört sonuçtan birini doğuracağı görülür. Aşağıdaki şemadan da açıkça anlaşılacağı gibi araştırmacı bu durumlardan ikisinde doğru, diğer ikisindeyse yanlış bir sonuca ulaşmış olacaktır (Tablo 1).

Tablo 1. Varsayım sınamanın olası sonuçları Varsayım testinin sonuçları

Gerçek durum Fark var Fark yok

Fark var, H 0 red

Doğru sonuç

1. tür hata

Fark yok, H 0 kabul

2. tür hata

Doğru sonuç

107


Belli bir sıfır varsayımını sınayan araştırmacının düşebileceği, “1. ve 2. tür hatalar” olarak adlandırılan yanılgıların, gerek rastlantısal anlamı, gerekse yol açabileceği bilimsel ve pratik sonuçlar birbirinden farklıdır. Konuyu bir örnekle somutlaştırmaya çalışalım: Belli bir kanser türünde kullanılmakta olan standart ilaç tedavisinde, hastaların ortalama sağkalım süresinin ( µ ) 5.1 yıl olduğunu, buna karşılık bu kanser türüne yakalanmış hastalardan oluşan bir örneklem grubuna uygulanan yeni bir ilaç tedavisinde ortalama sağkalım süresinin ( x ) 6.8 yıl olarak hesaplandığını düşünelim. Burada,

H 0 : | 6.8 - 5.1 | = 0 olarak ifade edilen sıfır varsayımının, aslında doğru olduğunda reddedilmesi, hastaların gereksiz yere denenmiş bir tedaviden ayrılarak yeni bir tedavinin etkilemine sokulmaları sonucunu doğurabilir. Öte yanda, aslında yanlış olan bir sıfır varsayımının reddedilmemesi (2. tür hata) hastaların yaşam sürelerini uzatacak olan bir tedaviden yoksun bırakılmalarına yol açacaktır. 1. tür hatanın olasılığı ( α ), 2. tür hatanın olasılığıysa, (β ) simgesiyle gösterilir. Varsayım sınamasında bir diğer önemli tanım, “güç” kavramıdır. Güç, doğru olmayan bir sıfır varsayımını red ( ya da doğru olan alternatif varsayımı kabul) olasılığıdır. Diğer bir anlatımla, bir testin gücü, gerçekte var olan bir farkı yakalayabilme yetisini ifade eder. Güç, ( 1- β) olarak hesaplanır. İşlenen konu ve kavramlarla tanı testleri bölümünde gördüğümüz duyarlılık ve seçicilik kavramları arasında kurulacak bir koşutlukla daha iyi anlaşılabilir. Anlamlı olmayan bir farkı var gösteren 1. tür hatayla, sağlam kişiye hasta tanısı koyan bir yanlış pozitif test arasında olduğu gibi, anlamlı bir farkı yok sayan 2. tür hatayla, aslında var olan bir hastalığı yakalayamayan yanlış - negatif test arasında da benzerlik vardır. Öte yandan, bir istatistik testin gücü de tanı testinin var olan bir hastalığı yakalama olasılığı olan duyarlılığına benzetilebilir. Gerek sıfır varsayımı, gerekse alternatif varsayım, yukarda verildiği biçimde ifade edildiğinde, farkları değerlendirecek test iki yönlü kurulacak 108


demektir. Diğer bir deyişle, ( x ) ve ( µ ) arasındaki farkın eksi ya da artı yönde, yeterince büyük olması, sıfır varsayımını reddetmek için yeterlidir. Varsayımın sınanmasında kullanılan testin tek yönlü olarak değerlendirilmesindeyse H 0 ve H1 aşağıdaki gibi kullanılr.

H0 : x = µ

; H1 : x > µ

veya

H0 : x = µ

; H1 : x < µ

Kolayca görüleceği gibi, kullanılan testin tek mi ya da iki yönlü mü olduğunu alternatif varsayım gösterir. Sağlık bilimlerinde yapılan araştırmalarda sık sık beklenmedik (önceden kestirilemeyen) ters tepkilerin ortaya çıkması olası olduğundan, bu araştırmalarda, testler genellikle iki yönlü olarak değerlendirilir. 8.2.1.2. VARSAYIM SINAMASINDA KULLANILACAK TESTİN SEÇİMİ Bir örneklem ortalamasıyla, anayığın ortalaması arasındaki farkın sınanmasında, n ≥ 30 ise ve anayığın standart sapması biliniyorsa,

"=

|x#µ| formülü kullanılır. ! n

( ! )‘nın değerinin bilinmediği durumlarda, normal eğri yerine Student-t dağılımını kullanmak daha uygun olur.

t=

|x!µ| ifadesi, (n - 1)’ e eşit serbestlik derecesinde kullanılır. s n

109


8.2.1.3. GÜVEN DÜZEYİNİN SEÇİMİ İstatistik testin uygulanmasından önce seçilen, ve aslında geçerli olan bir sıfır varsayımının yanlışlıkla reddedilme olasılığını ölçen güven düzeyi ( ! ) ile gösterilir. Ulaşılacak sonuçların geçerli olabilmesi için, ( ! )’nın olabildiğince küçük olması gerektiğine kuşku yoktur. Bu konuda, yaygın bir kabule uyarak, ( ! ) için (0.05), (0.01), ya da (0.001) değerleri kullanılır. Yayınlanan bilimsel çalışmalarda sürekli olarak verilen (p) değerine gelince, bu değer, sıfır varsayımının doğru olması durumunda, gözlenen farka eşit, ya da ondan daha büyük bir farkın doğmasının, diğer bir deyişle, gözlenen farkın salt rastlantısal değerlere bağlı olmasının olasılığını verir. (p) değeri teste ilişkin tüm işlemler tamamlandıktan sonra hesaplanır; ve eğer p < ! ise, ( H o ) reddedilir. Varsayımlarımızın tek yönlü olarak kurulması durumunda, hesaplanan (p) değeri ikiye bölünerek yorumlanır. Bilindiği gibi; her test istatistiğinin belli bir dağılımı vardır. Bu dağılımın alanı, varsayımın kabul ve red bölgelerinden oluşur. Aşağıda verilen Şekil 2‘den, standart normal dağılımın ! = 0.05 için kabul ve red alanları izlenebilir.

Şekil 2 Testin iki yönlü kullanımı. 110


Şekil 3. Testin tek yönlü kullanımı (daha büyük değerlere doğru).

Şekil 4. Testin tek yönlü kullanımı (daha küçük değerlere doğru). 111


Örnek 3. Bir toplumda menarş yaşının 13 olduğu bilinmektedir. 872 kişide gerçekleştirilen bir anket çalışması sonucunda menarş yaşı ortalamasının 12.875 ve standart sapmasının ise 1.012 yıl olduğu tespit edilmiştir. Elde edilen örneklem ortalaması ile anayığın ortalaması arasındaki farkın anlamlı olup olmadığını sınayınız. Çözüm: Başlangıç (sıfır) ve alternatif hipotezlerimiz aşağıdaki gibidir.

H0 : x = µ

H1 : x ! µ n = 872 > 30 olduğundan ! testini kullanabiliriz.

!=

12.875 ! 13 |x"µ| = = 3.64 s 1.012 n 872

Hesapladığımız ! = 3.64 değeri 1.96'dan büyük olduğundan, yani hesaplanan standart normal değer red bölgesine girdiğinden (Şekil 2.) örneklem ortalaması ile anayığın ortalaması arasındaki farkın istatistiksel olarak anlamlı olduğuna, daha ayrıntılı bir incelemeyle, ! = 3.64>3.29 olduğundan farkın çok ileri derecede anlamlı olduğuna karar veririz ( diğer bir ifade ile H1 hipotezi kabul edilir).

8.2.2. İKİ ÖRNEKLEM ORTALAMASININ KARŞILAŞTIRILMASI Birbirinden ayrı ve bağımsız iki örneklem grubunda yapılmış gözlemlerin ortalamalarını karşılaştırmak istediğimiz durumlarda, sıfır varsayımı ve alternatif varsayım aşağıdaki gibi kurulur.

H 0 : x1 = x 2

veya

H 0 : x1 ! x 2 = 0

H1 : x1 ! x 2

veya

H1 : x1 " x 2 ! 0

112


İki ortalama arasındaki farkın istatistiksel olarak anlamlı sayılacak kadar büyük olup olmadığına, eğer, n1 ≥ 30 ve n2 ≥ 30 ise,

(=

x1 ' x 2 & s12 s2 2 # $ ! $n + n ! 1 2 % "

ifadesini kullanarak karar veririz. Eğer n1 ve n2 ’den biri veya her ikisi < 30 ise, normal dağılım yerine,

t=

x1 ' x 2 & s2 s2 # $$ + !! % n1 n2 "

; s.d.= n1 + n2 -2

ifadesi kullanılır. Burada s 2 değeri iki örneklem grubuna ilişkin ortak varyanstır ve bu değeri aşağıdaki ifade ile hesaplarız. 2

s2 =

(n1 ! 1) " s1 + (n2 ! 1) " s2 (n1 + n2 ! 2)

2

(t) testinden iki bağımsız örneklem grubuna ait ortalamalar arasındaki farkı değerlendirmede yararlanabilmek için bazı koşulların varlığı aranır. (t) testinin kullanılabilmesi için, (a) her iki örneklem grubunda dağılımın normal eğriye uyması, (b) varyansların ya da standart sapmaların eşit olması, (c) incelenen iki gruptaki gözlemlerin birbirinden bağımsız olması gerekir. 113


(b) koşulunun gerekçesini, iki örneklem ortalamasının aslında eşit olduğunu, diğer bir anlatımla, iki örneklemin de aynı ana yığından alınmış olduğunu ifade eden sıfır varsayımında aramak gerekir. Bununla birlikte, (t) testi üzerinde yapılmış olan matematiksel incelemeler, iki örneklem grubundaki gözlem sayısının eşit olması durumunda varyansların eşitliği koşulundan vazgeçilebileceğini göstermiştir. n1 ≠ n2 olduğu durumlarda, (t) testini kullanmadan önce iki grubun varyanslarının eşit olup olmadığı sınanmalıdır. Bu amaçla, ilerde göreceğimiz (F) testi kullanılır. (c)’de dile getirilen “bağımsızlık” koşuluna gelince, bu koşul örneklemlerden birinde yer alan gözlemlerin değerlerinin ikinci örneklemdeki değerler konusunda herhangi bir bilgi vermemesi anlamına gelir. Bağımsızlığı belli bir istatistik testle sınamak olanağı olmadığından bu koşulun, araştırmanın tasarlanması ve yürütülmesi sırasında sağlanması gerekir. Yukarıda formülü verilen ortak varyans, karşılaştırılan iki örnek varyansının ağırlıklı ortalamasından ibarettir. İki bağımsız örneklem ortalaması arasındaki farkın değerlendirilmesinde, (t) testinin ön koşullarından biri ya da birkaçının var olmaması durumunda, ileride göreceğimiz parametresiz testlerden biri kullanılmalıdır. 8.2.2.1. VARYANSLARIN EŞİTLİĞİNİN SINANMASI (F) TESTİ Bu test, eşitlikleri sınanmak istenen iki varyansın birbirine olan oranının, kuramsal (F) dağılımındaki ilgili kritik değerle karşılaştırılması yoluyla uygulanır. Payda iki varyanstan daha büyük olanın yer aldığı (F) oranının Tablo Va’da verilen kritik değerden (Tablo Va’da ! = 0.05 , ve (n1 -1), (n2 -1) serbestlik derecelerine karşılık gelen değer) yüksek çıkması, varyansların eşitliği varsayımının reddine yol açar. Demek ki burada,

H 0 : !1 = ! 2

2

2

H1 : ! 21 " ! 2

2

114


2

olarak ifade edilmekte, ve F =

s1 formülüyle hesaplanmakta bulunan (F) 2 s2

değeri, (n1 -1) ve (n2 -1) serbestlik derecelerinde yorumlanmaktadır. Örnek 4. Standart sapmanın, 20 kişiden oluşan kontrol grubunda 13 ve 10 kişiden oluşan deney grubunda 11 olarak ölçüldüğünü varsayalım. Gruplardaki varyanslar istatistiksel olarak birbirinden anlamlı derecede farklı mıdır? Çözüm : Varyansların eşitliğinin sınanmasına ilişkin hipotezlerimizi aşağıdaki gibi ifade ederiz.

H 0 : !1 = ! 2

2

2

H1 : ! 21 " ! 2

2

2

Hipotezleri sınamak için, F =

132 s1 = = 2.95 oranı hesaplanır. 2 112 s2

Hesaplanan F=1.40 değeri, α=0.05, (n1-1)=(20-1)=19 ve (n2-1)=(101)=9 serbestlik derecelerine karşılık gelen kritik F = 2.95 değerinden (Tablo V a.) küçük olduğundan H 0 hipotezini kabul ederiz. Diğer bir ifadeyle grup varyanslarının eşit olduğunu veya varyanslar arasındaki farkın rastlantısal olduğunu söyleyebiliriz. Örnek 5. Ülkemizde 18 - 30 yaş grubu 189 denekte yapılan bir araştırmada günlük ortalama uyku süresinin 7.28 saat ve standart sapmasının ise 1.38 saat olduğu tespit edilmiştir. Diğer bir ülkede, aynı yaş grubunda 120 denekte yapılan bir araştırmada günlük ortalama uyku süresi 7.05 saat ve standart sapma 0.50 saat bulunmuştur. Elde edilen bu iki ortalama birbirinden istatistiksel olarak anlamlı derecede farklı mıdır? Çözüm : n1 = 189, n2 = 120,

x1 = 7.28, s1 = 1.38 x 2 = 7.05, s2 = 0.50 115


Hipotezler:

H 0 : x1 = x 2

H1 : x1 ! x 2 n1 = 189 ve n2 = 120 > 30 olduğundan hipotezlerimizi sınamak için ( ! ) epsilon testini kullanacağız.

(=

x1 ' x 2 & s12 s2 2 # $ ! $n + n ! 2 " % 1

=

7.28 ' 7.05 & 1.382 0.50 2 # $$ ! + 120 !" % 189

= 2.09

Hesaplanan ! değeri ( 2.09 ), 0.05 anlam düzeyine karşılık gelen standart normal değerden ( 1.96 ) büyük olduğundan iki ortalama arasındaki fark istatistiksel olarak anlamlıdır ( p < 0.05 , H1 kabul). Örnek 6. 20 kız öğrencide yapılan bir araştırmada sistolik kan basıncı (SKB) değeri 108 mm-Hg, standart sapma 7.5 mm-Hg bulunmuştur. Yine, aynı yaş grubunda 25 erkek öğrencide yapılan araştırmada ortalama 105 mm-Hg ve standart sapma 6 mm-Hg bulunmuştur. Söz konusu yaş grubu kız ve erkeklerde SKB değerlerinin aynı olduğunu söyleyebilir miyiz ( iki ortalama arasındaki fark istatistiksel olarak anlamlı mıdır)? Çözüm : n1 = 20, n2 = 25,

x1 = 108, s1 = 7.5 x 2 = 105, s2 = 6

Hipotezler:

H 0 : x1 = x 2

H1 : x1 ! x 2 n1 = 20 ve n2 = 25 < 30 olduğundan hiptezlerin sınanmasında Student't testini kullanacağız. 116


t=

x1 ' x 2 & s2 s2 # $$ + !! % n1 n2 "

; s.d.= n1 + n2 -2

Ortak varyans aşağıdaki gibi hesaplanır.

2

s2 =

(n1 ! 1) " s1 + (n2 ! 1) " s2 (n1 + n2 ! 2)

2

(20 ! 1) " (7.52 ) + (25 ! 1) " (6 2 ) s = =44.95 (20 + 25 ! 2) 2

t=

108 ' 105 & 44.95 44.95 # + $ ! 25 " % 20

=

3 = 1.49 2.0113

(Serbestlik derecesi) s.d. = 20 + 25 - 2 = 43 Hesaplanan t değeri (1.49), p = 0.05 ve s.d. = 43'e karşılık gelen kuramsal student't değerinden (2.02) küçük olduğundan, iki ortalama arasındaki farkın istatistiksel olarak anlamlı olmadığına karar veririz ( p > 0.05, H0 kabul). Serbestlik derecesi 30 'dan büyük olan değerlerde Student't dağılımı ile Standart Normal Dağılım uygunluk göstermektedir (Tablo III veTablo IV ).

8.2.3. EŞLENDİRİLMİŞ SERİLERDE FARKIN ANLAMLILIĞININ SINANMASI Yukarıda, ortalamaları karşılaştırılan iki örneklem grubunun birbirinden tümüyle bağımsız oldukları durumlarda yapılacak işlemleri gözden geçirdik. İki gruptaki gözlemlerin birbirinden bağımsız olmadığı durumlarda “eşlenmiş” 117


örneklem gruplarından söz edilir. Burada, tek bir örneklem grubu üzerinde iki kez gözlem yapılır. Genellikle, örneklemlerden biri etkisi ölçülmek istenen bir tedavi (ya da bir müdahele) öncesi yapılan gözlem sonuçlarından, ikincisi ise, söz konusu müdahele sonrasına ait sonuçlardan oluşur. Eşlendirilmiş seriler, “önce” ve “sonra” serileri olarak da adlandırılır. Aynı denekte ikiden çok gözlemin yapıldığı denemelerin incelendiği tekrarlı ölçümlerde varyans analizi konusu, kitabın kapsamı dışında tutulmuştur. Bu türden bir araştırma tasarımı, özellikle, bireysel değişkenliğin çok yüksek olabildiği biyolojik özelliklerin ele alındığı tıp araştırmalarının gereklerine uygun düşmektedir. Gerçekten de, bu durumlarda bazen, aynı grup içinde yer alan bireyler arasındaki farklar, iki grup arasındaki ortalama farkı çok aşabilmektedir. Hipotezlerimiz,

H0 : x = 0

H1 : x ! 0 şeklinde yazılır. Burada, x , farklar serisinin aritmetik ortalamasıdır. (Eşlenmiş çiftler serisinde) n ≥ 30 ise,

!=

x ifadesi ile s n

n < 30 ise,

t=

x s n

; s.d. = n -1 ifadesi ile,

hangi hipotezin kabul edileceğine karar verilir. Gerek normal dağılımın, gerekse (t) dağılımının eşlenmiş gruplarda kullanımı da gözlemlerin dağılımının normal olması koşuluyla geçerlidir.

118


Örnek 7. Aşağıda 20 kişide, Pazartesi-Cuma ve Cumartesi-Pazar günlerine ilişkin günlük ortalama uyku süreleri verilmiştir (Tablo 2). PazartesiCuma ve Cumartesi-Pazar günlük ortalama uyku süreleri arasındaki farkın istatistiksel olarak anlamlı olup olmadığını sınayınız. Tablo 2. Deneklere İlişkin Ortalama Uyku Süreleri Denek no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Pazartesi-Cuma 7.10 6.50 7.40 8.00 6.95 7.10 7.13 7.55 8.90 7.00 7.00 8.40 7.10 6.95 7.10 7.30 8.00 5.30 6.10 7.40

Cumartesi-Pazar 7.40 7.00 7.80 9.10 7.30 7.00 8.05 7.50 8.30 7.15 7.90 8.30 7.85 8.10 7.30 7.90 8.00 6.00 6.40 8.20

Fark (xi) 0.30 0.50 0.40 1.10 0.35 -0.10 0.92 -0.05 -0.60 0.15 0.90 -0.10 0.75 1.15 0.20 0.60 0.00 0.70 0.30 0.80

Çözüm : Burada, bir denekte elde edilen iki ayrı zamana ilişkin ölçüm değerlerinin karşılaştırılması söz konusudur. n=20 < 30 olduğundan aradaki farkın anlamlı olup olmadığını eşlendirilmiş serilerde Student't testi ile sınayacağız. İki ölçüm arasındaki fark serisinde aritmetik ortalama 0.4135 ve standart sapma 0.4576 olarak hesaplanır. Hipotezler:

H0 : x = 0 119


H1 : x ! 0 t değeri ve serbestlik derecesi,

t=

0.3935 x = 0.4532 s 20 n

= 4.04 ; s.d. = n - 1 = 20 - 1 = 19

olarak hesaplanır. Hesaplanan t değeri (4.04), s.d.=19 ve p = 0.05 anlam düzeyine karşılık gelen kuramsal Student' t değerinden (kritik değer) (2.093, Tablo IV )büyük olduğundan H1 hipotezini kabul ederiz. Yani, Pazartesi-Cuma ile CumartesiPazar günlerine karşılık gelen ortalama uyku süreleri arasındaki fark (0.4135 saat ) istatistiksel olarak anlamlıdır.

120


Bölüm 9

Oranların Karşılaştırılması

9.1.

ORANLARA İLİŞKİN GENELLEME

n·P ve n·Q'nun 5'den büyük olması örneklemin yeteri kadar büyük olduğunu gösterir. Oranlara ilişkin kuramsal örnekleme dağılımının özellikleri dikkate alındığında, n·P ve n·Q ≥ 5 ise, anayığına ilişkin P' nin güven aralığı aşağıdaki ifade ile belirlenir.

p0 " # !

po ! qo ! P ! p0 + " ! n

po ! qo n

Burada, p o : incelenen değişkenin (özelliğin, “başarı” sonucunun) örneklem içindeki oranı, q o : 1 - p o değerini temsil etmektedir. Eğer n·P ve n·Q 'dan biri 5'den küçük ise P' nin çeşitli güven düzeylerine karşılık gelen güven sınırları Tablo VII ve Tablo VIII' de verilmektedir. Örnek 1. 100000 birimli bir anayığından çekilen 350 birimlik basit rastlantılı bir örneklemde aranılan özelliğin oranı p o =0.65 olarak bulunmuştur. Anayığına ilişkin P oranının güven aralığını 0.01 yanılma (anlam) düzeyinde belirleyiniz. 121


Çözüm : 0.01 yanılma düzeyine karşılık gelen standart normal değer 2.58'dir. P' nin tahmin değeri olarak 0.65 değerini alırsak 350 x 0.65 , ve 350 x 0.35 > 5 olduğundan örneklemimiz yeteri kadar büyüktür. Anayığının yeterince büyük olduğunu varsayarsak, güven aralığını aşağıdaki ifade ile hesaplarız.

p0 " # !

po ! qo ! P ! p0 + " ! n

0.65 ± (2.58) !

po ! qo n

(0.65) ! (0.35) 350

0.65 ± (2.58)·(0.0255) 0.5842 < P < 0.7158

9.2. ÖRNEKLEM ORANI İLE ANAYIĞIN ORANININ KARŞILAŞTIRILMASI Hipotezlerimizi aşağıdaki gibi kurarız.

H 0 : po = P H1 : po ! P veya,

H 0 :| po ! P |= 0 (fark rastlantısal ) H1 :| po " P |! 0 (fark istatistiksel olarak anlamlı, rastlantısal nedenlerin yanında, farkı ortaya çıkaran belirli bir neden var). Ho hipotezi örneklemin P oranına sahip bir anayığından çekildiğini, H1 ise örneklemin P'den farklı bir değere sahip bir anayığından çekildiğini gösterir. n·P ve n·Q ≥ 5 ise,

122


#=

| po " P | P !Q n

ifadesi ile, kabul edilen anlam düzeyine göre H 0 veya H1 hipotezlerinden birini kabul ederiz. Anlam düzeyini 0.05 kabul edersek, ! ≥1.96 ise H1 , ! < 1.96 ise H 0 hipotezini kabul ederiz. Örnek 2. Yeni bir ilacın bir çeşit alerjiyi iyileştirmede 0.60 etkili olduğu ileri sürülmektedir. İlaç, alerjisi olan 100 kişilik bir hasta grubuna verilmiş ve uygulama sonucunda 55 kişinin iyileşmiş olduğu görülmüştür. İddia edildiği gibi, ilacın 0.60 etkili olduğunu söyleyebilir miyiz? Çözüm : 100 kişilik örneklemde aranılan özelliğin oranı (iyileşenlerin oranı)

p0 =

55 = 0.55 100

(P = 0.60) değerini anayığın oranı olarak kabul edersek, |0.60-0.55|=0.05 farkının istatistiksel olarak anlamlı olup olmadığını,diğer bir ifade ile 100 kişilik örneklemin P=0.60 oranına sahip bir anayığından alınıp alınmadığını sınamak istiyoruz. 100 x 0.60 ve 100 x 0.40 > 5 olduğundan örneklemimiz yeteri kadar büyük kabul edilir. Hipotezlerimiz ve sınama işlemlerimiz aşağıdaki gibidir.

H 0 : po = P H1 : po ! P #=

| 0.55 " 0.60 | | po " P | = = 1.02 (0.60) ! (0.40) P !Q n 100

Hesapladığımız ! değeri 1.96'dan küçük olduğundan H 0 hipotezini kabul ederiz (p>0.05). 123


9.3.

İKİ ÖRNEKLEM ORANININ KARŞILAŞTIRILMASI

Burada, birbirinden bağımsız, n1 ve n2 büyüklüğüne sahip iki örnekleme (kontrol ve deney gruplarında) ait ‘başarı’ oranlarının karşılaştırılması amaçlanır. Gruplara ait başarı oranları aşağıdaki gibi hesaplanır.

p1 =

d d1 , p2 = 2 , n1 n2

d1 ve d2, sırasıyla, n1 ve n2 uzunluklu örneklemlerde, incelenen değişkende aranılan özelliği gerçekleyen denek sayılarını (“başarı sayılarını”) göstermektedir. Hipotezlerimiz aşağıdaki gibidir.

H 0 : Karşılaştırılan iki örneklem oranı arasındaki fark rastlantısaldır. Her iki örneklem aynı orana sahip anayığından çekilmiştir. H1 : İki örneklem oranı arasındaki fark istatistiksel olarak anlamlıdır. Söz konusu fark rastlantısal nedenlerin yanında belirli bir nedenden ileri gelmektedir. Örneklemler, farklı oranlara sahip farklı anayığınlardan çekilmiştir. Simgesel olarak gösterecek olursak, hipotezlerimizi aşağıdaki gibi ifade edebiliriz.

H 0 : p1 = p2 (veya, H 0 :| p1 ! p2 |= 0 )

H1 : p1 ! p2 ( veya, H1 :| p1 " p2 |! 0 ).

P=

d1 + d 2 ifadesi ile anayığına ilişkin oran tahmin edilir. n1 + n2

n1·P, n1·Q, n2·P ve n2·Q ≥ 5 ise hipotezlerimizi aşağıdaki ifade ile sınarız.

124


#=

| p1 " p2 | P !Q P !Q + n1 n2

0.05 yanılma düzeyinde ! ≥1.96 ise H1, ! <1.96 ise, Ho hipotezini kabul ederiz. Hipotezlerin sınanmasında, daha ileride incelenecek olan, ki-kare ( ! 2 ) testleri de kullanılmaktadır. Örnek 3. Yeni bir ilaç (etkin madde, yeni tedavi yöntemi) 450 hastalık bir gruba (deney grubu) uygulanmış ve 45 hastada yan etki (istenmeyen etki) görülmüştür. 700 kişilik kontrol grubunda (plasebo grubu) ise, 60 hastada yan etki görülmüştür. Her iki grupta yan etki görülme oranlarının aynı seviyede olduğunu söyleyebilir miyiz? Çözüm : Deney grubu, n1 = 450 , (yan etki görülen hasta sayısı) d1 = 45 Kontrol grubu, n2 = 700 , (yan etki görülen hasta sayısı) d 2 = 60 Hipotezlerimizi aşağıdaki gibi oluştururuz.

H 0 : p1 = p2

H1 : p1 ! p2

p1 =

d 60 45 d1 = = 0.10 , p2 = 2 = = 0.0857 n1 450 n2 700

P=

d1 + d 2 45 + 60 = = 0.0913 n1 + n2 450 + 700

Q = 1 - P= 1 - 0.0913 = 0.9087 değerleri hesaplanır.

125


450 x 0.0913, 450 x 0.9087, 700 x 0.0913 ve 700 x 0.9087 > 5 olduğundan örneklemlerin yeteri kadar büyük olduğunu kabul ederiz. Hipotezlerimizi aşağıdaki ifade ile sınarız. #=

| p1 " p2 | = P !Q P !Q + n1 n2

| 0.10 " 0.0857 | = =0.0.8217 7921 (0.0913) ! (0.9087) (0.0913) ! (0.9087) + 400 700 450

0.8217<1.96 olduğundan H 0 hipotezini kabul ederiz (p>0.05). İki grupta yan etki oranlarının aynı olduğunu, aradaki farkın rastlantısal nedenlerden kaynaklandığını söyleyebiliriz.

126


Bölüm 10

Ki-Kare Testlerinin Kullanılması

İki ya da daha çok bağımsız grupta nitel değişkenlerin (sınıflayıcı ve sıralayıcı ölçüm düzeyinde incelenen değişkenler) karşılaştırılmasında, iki nitel değişken arasındaki ilişkinin anlamlılığının sınanmasında ve deneysel bir dağılımın kuramsal bir dağılıma uygunluğunun sınanmasında ki-kare (Chi- square, χ 2 ) testleri kullanılır.

10.1. İKİ VEYA DAHA ÇOK BAĞIMSIZ GRUPTA, NİTEL DEĞİŞKENLERİN KARŞILAŞTIRILMASI Testin daha kolay anlaşılabilmesi için iki sonucu olan nitel bir değişkeni birbirinden bağımsız iki ayrı grupta (deney ve kontrol grubu) incelediğimizi ve iki grupta elde edilen sonuçları karşılaştırmak istediğimizi düşünelim. Gözlem sonuçlarını 2 x 2 tablosunda aşağıdaki gibi sunabiliriz. Tablo 1. Deney ve kontrol grubunda elde edilen gözlem sonuçları. Gruplar Deney grubu Kontrol grubu Toplam

X nitel değişkeni sonucu (+) (-) a b c d a+c b+d

127

Toplam a+b c+d a+b+c+d


Hipotezlerimizi aşağıdaki gibi oluştururuz.

H 0 : Birbirinden bağımsız iki gruptan elde edilen x değişkenine ilişkin sonuçlar arasında bir fark yoktur. İki grup x değişkeni açısından homojendir. İki grup arasındaki fark rastlantısaldır.

H1 : İki gruba ilişkin sonuçlar arasındaki fark istatistiksel olarak anlamlıdır. İki grup, x değişkeni açısından homojen değildir. Eğer H 0 hipotezinin doğru olduğunu kabul edersek, yani x' in (+) olması her iki grupta aynı oranda ise, a, b, c, d gözlemsel sıklıklarına karşılık gelen a´, b´, c´, d´ kuramsal sıklıkları aşağıdaki gibi hesaplarız. (a+b+c+d) kişiden rastgele seçilen bir kişinin (deneğin) deney grubundan olması olasılığı (a+b)/(a+b+c+d) değerine ve yine (a+b+c+d) kişiden rastgele seçilen bir kişide x değişkenin (+) olması olasılığı (a+c)/(a+b+c+d) değerine eşittir. H 0 hipotezi gerçekte doğru ise (a+b+c+d) kişiden rastgele seçilen bir kişinin hem deney grubundan olması hem de x' in sonucunun (+) olması olasılığı

( a + b) (a + c) ⋅ (a + b + c + d ) (a + b + c + d )

değerine eşittir.

(a+b+c+d) kişide bu özelliğe (seçilen kişinin hem deney grubundan olması hem de x'in (+) olması) sahip olanların sayısının (kuramsal sıklık)

a' =

( a + b) (a + c) ⋅ ⋅ (a + b + c + d ) (a + b + c + d ) (a + b + c + d )

a' =

( a + b) ⋅ ( a + c ) (a + b + c + d )

değerine eşit olması beklenir. Pratik olarak a´ kuramsal sıklık değeri a'ya ait kenar toplamlarının çarpımının ana toplama bölünmesiyle elde edilir. Benzer şekilde b´, c´ ve d´ sıklıklarını aşağıdaki gibi hesaplarız.

128


b' =

(a + b) ⋅ (b + d ) (c + d ) ⋅ ( a + c ) (c + d ) ⋅ (b + d ) , c' = ve d ' = (a + b + c + d ) (a + b + c + d ) (a + b + c + d )

a ' , b ' , c ' ve d ' kuramsal sıklıkları 5'den büyük ise hipotezlerimizi aşağıda verilen, ki - kare testi ile sınarız.

χ2 =

(a − a ' ) 2 (b − b ' ) 2 (c − c ' ) 2 (d − d ' ) 2 + + + a' b' c' d'

veya kısaca,

χ2 =

(a ⋅ d − b ⋅ c) 2 ⋅ (a + b + c + d ) (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d )

Hesapladığımız ki - kare değeri (s-1) x (c-1) serbestlik derecesi ve kabul edilen anlam düzeyine ( α ) karşılık gelen kuramsal ki - kare değerinden büyük ise H1 hipotezini, küçükse H 0 hipotezini kabul ederiz. İncelediğimiz örnekte (satır sayısı) s=2 ve (kolon sayısı) c=2 olduğundan (serbestlik derecesi) s.d.=(2-1)·(2-1) =1 değerine eşittir. Karşılaştırılan grup sayısı 2'den çok ve/veya x nitel değişkeninin aldığı değerler 2'den çok ise, yani s x c tablosunun incelenmesi söz konusu ise ki - kare ifadesini aşağıdaki şekilde yazarız. 2

s

c

χ = ∑∑ i =1 j =1

'

( f ij − f ij ) 2 f ij

'

Burada, (serbestlik derecesi) s.d. = (s - 1) x (c - 1),

f ij : i. satır ve j. kolondaki gözlemsel sıklık değeri ' f ij :i. satır ve j. kolondaki kuramsal sıklık değeridir

s.d. ≥ 2 olduğunda, beklenen sıklıkları 5'den küçük olan hücre sayısı, toplam hücre sayısının % 20 'sinden az ve beklenen sıklıklar 1'den büyük ise hipotezlerin sınanmasında ki - kare testi kullanılır. Bu gerçekleşmiyorsa komşu sınıflar birleştirilerek analize devam edilir. 129


10.1.1. YATES DÜZELTİM Lİ Kİ-KARE TESTİ s.d.= 1 ve kuramsal sıklıklardan biri, 3 ile 5 arasında ise, hipotezlerin sınanmasında Yates düzeltimli ki - kare ifadesi kullanılır.

2

(a + b + c + d ) 2 ) ⋅ (a + b + c + d ) 2 ve s.d.=1 (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d )

(| a ⋅ d − b ⋅ c | −

χy = veya, 2

2

2

χ y = ∑∑

'

(| f ij − f ij | −0.5) 2 f ij

i =1 j =1

'

ve s.d.=1

Kuramsal (beklenen) sıklıklar ile gözlemsel sıklıklar arasındaki farklardan biri 0.5'den küçük ise

χ y 2 = 0 olur.

10.1.2. FISHER KESİN Kİ-KARE ANALİZİ s.d.= 1 ve kuramsal sıklıklardan en az biri 3'den küçük ise hipotezlerimizi Fisher Kesin Ki - Kare analizi ile sınarız. Kenar toplamlarının aynı kalması şartı ile en küçük gözlemsel sıklık bir eksiltilerek diğer hücrelerdeki değerler değiştirilir. Bu işleme en küçük gözlemsel sıklık 0 olana kadar devam edilir. Her bir tablo için aşağıdaki ifade ile olasılık değerleri hesaplanır. Elde edilen olasılık değerlerinin toplamı bize yanılma düzeyini verecektir. Yanılma düzeyi 0.05'den küçük veya eşit ise H1 hipotezini kabul ederiz.

pi =

(a + b)!⋅(c + d )!⋅(a + c)!⋅(b + d )! (a + b + c + d )!⋅a!⋅b!⋅c!⋅d! k

(anlam düzeyi ) p =

∑p

i

(k: tablo sayısı)

i =1

Örnek 1. Rastlantısal olarak eşleştirilmiş iki ayrı hasta grubundan birine (deney grubu) yeni bir tedavi yöntemi, diğerine (kontrol grubu) ise plasebo uygu130


lanmıştır. Sonuçlar aşağıdaki çizelgede verilmektedir. Yeni tedavi yönteminin etkili olduğunu söyleyebilir miyiz? Tablo 2. Deney ve kontrol grubunda elde edilen tedavi sonuçları. Gruplar Deney grubu Kontrol grubu Toplam

Tedavi sonucu (+) (-) 85 15 62 38 147 53

Toplam 100 100 200

Çözüm : Hipotezlerimizi aşağıdaki gibi yazarız.

H 0 : Deney ve kontrol grubunda elde edilen sonuçlar arasındaki fark rastlantısaldır. Tedavi yönteminin etkisi istatistiksel olarak anlamlı değildir.

H1 : İki gruba ilişkin sonuçlar arasındaki fark istatistiksel olarak anlamlıdır, tedavi etkilidir. İki grup arasında bir fark yoksa, yani H 0 hipotezi doğru ise beklenen sıklıkları aşağıdaki gibi hesaplarız.

a' =

147⋅100 ' 53⋅100 ' 147⋅100 53⋅100 ,b= , c= , d'= 200 200 200 200

a ' = 73.5 , b ' = 26.5 , c ' = 73.5 ve d ' = 26.5 'dir. s.d.= 1 ve kuramsal sıklıkların her biri 5'den büyük olduğundan ki - kare değerini aşağıdaki ifade ile hesaplarız.

χ2 =

(85 − 73.5) 2 (15 − 26.5) 2 (62 − 73.5) 2 (38 − 26.5) 2 + + + 73.5 26.5 73.5 26.5

χ 2 = 13.58 , s.d.= (2 - 1)(2 -1) = 1

131


Hesaplanan χ 2 değeri, p = 0.05 ve s.d.= 1'e karşılık gelen kuramsal χ 2 değerinden (3.841) (Tablo VI) büyük olduğundan H1 hipotezini kabul ederiz (p < 0.05). Daha ayrıntılı bir inceleme ile hesaplanan ki-kare değeri s.d.= 1 ve p=0.001'e karşılık gelen kuramsal ki-kare değerinden de (10.828) büyük oldu-ğundan anlam düzeyinin p < 0.001 olduğuna karar verilir.

χ 2 değerini, beklenen sıklıkları hesaplamadan, aşağıdaki ifadeden de hesaplayabiliriz.

(a ⋅ d − b ⋅ c) 2 ⋅ (a + b + c + d ) (85 ⋅ 38 − 15 ⋅ 62) 2 ⋅ 200 = χ = 100 ⋅ 100 ⋅ 147 ⋅ 53 (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d ) 2

χ 2 = 13.58 Örnek 2. 38 deney hayvanında bir bakteri türünün aşılandığını ve bu hayvanlardan bir bölümüne vitamin sağıltımı uygulanırken, diğerine vitamin verilmediğini varsayalım. Aşağıdaki çizelgede görüldüğü gibi, deney sonucu bir kısmı ölen bir kısmı da sağ kalan bu hayvanlarda vitamin sağıltımının etkili olup olmadığını araştırınız. Tablo 3. Deney sonuçları. Gruplar Vitamin alan Vitamin almayan Toplam

Deney sonucu Sağ Ölü 5 14 3 16 8 30

Toplam 19 19 38

Çözüm : H 0 : Vitamin tedavisi etkili değil.

H1 : Vitamin tedavisi etkili.

Kuramsal sıklıklar aşağıdaki gibi hesaplanır.

a' =

8 ⋅ 19 30 ⋅ 19 8 ⋅ 19 30 ⋅ 19 = 4, b ' = = 15 , c ' = = 4, ve d ' = = 15 38 38 38 38 132


s.d.= 1 ve kuramsal sıklıklardan en az biri 5'den küçük olduğundan hipotezlerimizi Yates düzeltimli ki - kare testi ile sınarız.

χ y2 =

(| 5 − 4 | −0.5) 2 (| 14 − 15 | −0.5) 2 (| 3 − 4 | −0.5) 2 (| 16 − 15 | −0.5) 2 + + + 4 15 4 15

χ y 2 = 0.1583 Hesaplanan Yates düzeltimli ki - kare değeri, s.d.= 1 ve p=0.05 yanılma düzeyine karşılık gelen kuramsal ki-kare değerinden (3.841) (Tablo VI) küçük olduğundan H 0 hipotezini kabul ederiz (p > 0.05). Yates düzeltimli ki-kare değerini aşağıdaki ifadeden de hesaplayabiliriz.

2

38 2 (a + b + c + d ) 2 ) ⋅ (a + b + c + d ) (| 5 ⋅16 − 14 ⋅ 3 | − ) ⋅ 38 2 2 = 19 ⋅19 ⋅ 8 ⋅ 30 (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d )

(| a ⋅ d − b ⋅ c | −

χy =

χ y 2 = 0.1583 Örnek 3. Hazırlanan koruyucu bir aşının etkinliğini ölçmek amacı ile bir araştırma yapılmıştır. Veriler aşağıdaki tabloda özetlenmiştir. Aşının etkili olup olmadığını sınayınız. Tablo 4. Deney sonuçları. Gruplar Deney grubu (aşılanan) Kontrol grubu (aşılanmayan) Toplam

Hastalıktan kurtulanlar 7

Hastalananlar

Toplam

1

8

10

8

18

17

9

26

Çözüm : H 0 : Aşı etkili değildir. Söz konusu fark rastlantısaldır.

H1 : Aşı etkilidir. Fark istatistiksel olarak anlamlıdır. 133


Kuramsal sıklıklar;

a ' = 5.23 , b ' = 2.77 , c ' = 11.77 ve d ' = 6.23 'dır. S.d. = 1 ve kuramsal sıklıklardan biri ( b ' = 2.77) 3'den küçük olduğundan hipotezlerimizi Fisher Kesin Ki-Kare Analizi ile sınarız. Kenar toplamları değişmeyecek şekilde gözlemsel sıklığı en küçük olan hücredeki sıklığı 1 eksilterek yeni tablolar elde ediyoruz. Bu işleme en küçük sıklık sıfır olana kadar devam ediyoruz. 1.Tablo

7 10 17

1 8 9

8 18 26

2.Tablo

8 9 17

0 9 9

8 18 26

1. ve 2. tablolar için olasılık değerlerini aşağıdaki gibi hesaplarız.

pi =

(a + b)!⋅(c + d )!⋅(a + c)!⋅(b + d )! (a + b + c + d )!⋅a!⋅b!⋅c!⋅d!

p1 =

8!⋅18!⋅17!⋅9! = 0.1120 26!⋅7!⋅1!⋅10!⋅8!

p2 =

8!⋅18!⋅17!⋅9! = 0.0156 ve anlam düzeyi 26!⋅8!⋅0!⋅9!⋅9!

p = p1 + p2 = 0.1120 + 0.0156 = 0.1276 > 0.05 olduğundan H 0 hipotezini kabul ederiz (aşı etkili değil). Örnek 4. Değişik sosyo-ekonomik düzeye (S.E.D.) sahip gruplarda, 818 öğrencide yapılan bir anket çalışmasında öğrencilerin yeterli ve dengeli beslenme durumlarını gösteren bilgiler aşağıdaki tabloda verilmektedir. Gruplara ilişkin yeterli ve dengeli beslenme oranları arasında anlamlı bir fark var mıdır?

134


Tablo 5. Değişik sosyo-ekonomik gruplarda yeterli ve dengeli beslenme durumu. Yeterli ve dengeli beslenen Salt Yüzde 94 83.9 149 87.6 110 92.4 173 94.0 224 96.1 750 91.7

Gruplar S.E.D.= 1 S.E.D.= 2 S.E.D.= 3 S.E.D.= 4 S.E.D.= 5 Toplam

Yetersiz ve dengesiz beslenen Salt Yüzde 18 16.1 21 12.4 9 7.6 11 6.0 9 3.9 68 8.3

Toplam 112 170 119 184 233 818

Çözüm : Hipotezler aşağıdaki gibi yazılır.

H 0 : Gruplar arasında beslenme açısından bir fark yoktur. Gruplar beslenme açısından homojendir.

H1 : Gruplar arasından en az bir tanesi diğerlerinden farklıdır. Gruplar beslenme açısından homojen değildir. Beklenen sıklıkları hesaplarsak aşağıdaki tabloyu elde ederiz. Tablo 6. Değişik sosyo - ekonomik gruplarda yeterli ve dengeli beslenme durumuna ilişkin beklenen sıklıklar. Gruplar S.E.D.= 1 S.E.D.= 2 S.E.D.= 3 S.E.D.= 4 S.E.D.= 5 Toplam

Yeterli ve dengeli beslenen Salt Yüzde 102.69 91.7 155.87 91.7 109.11 91.7 168.70 91.7 213.63 91.7 750 91.7

Yetersiz ve dengesiz beslenen Salt Yüzde 9.31 8.3 14.13 8.3 9.89 8.3 15.30 8.3 19.37 8.3 68 8.3

Toplam 112 170 119 184 233 818

(Serbestlik derecesi) s.d. = (s - 1)(c - 1) = (5 - 1)(2 - 1)= 4 Tablo VI'da 10 hücre bulunmaktadır ve bu hücrelerin hiçbirinde beklenen sıklıklar 5'den küçük değildir. Bu nedenle hipotezleri sınamada ki - kare testini kullanabiliriz. Satır veya kolonlar üzerinde birleştirmeler yaparak tabloyu yeniden oluşturmaya gerek yoktur. 135


χ

2

5

=

2

∑∑ i =1 j =1

χ 2=

'

( fij − fij )2 fij

'

(94 − 102.69)2 (18 − 9.31) 2 + + 102.69 9.31

+

(9 − 19.37) 2 19.37

χ 2 = 19.95 Hesaplanan ki-kare değeri (19.95), s.d.= 4 ve p=0.001'e karşılık gelen kuramsal ki-kare değerinden (18.467) büyük olduğundan H1 hipotezini kabul ederiz (p < 0.001). Hangi grupların birbirinden farklı olduğunu sınamak için sırasıyla, en büyük farkı doğuran gruplar ikişer ikişer seçilerek karşılaştırılır. Örnek 5. Birbirinden bağımsız üç farklı grupta X etkeninin incelendiğini ve sonuçların aşağıdaki çizelgede verildiğini varsayalım. Grupların X etkeni açısından homojen olup olmadığını sınayınız. Tablo 7. Üç gruba ilişkin gözlem sonuçları. Gruplar Grup 1 Grup 2 Grup 3 Toplam

Çok kötü 5 3 4 12

Kötü 8 6 2 16

Normal 18 10 4 32

İyi 4 4 4 12

Çok iyi 2 2 2 6

Toplam 37 25 16 78

Çözüm : Hipotezler aşağıdaki gibi kurulur.

H 0 : Gruplar X etkeni açısından homojendir. Söz konusu rastlantısaldır.

H1 : Gruplar X etkeni açısından homojen değildir. Kuramsal sıklıklar hesaplanarak Tablo 8' elde edilir.

136

farklar


Tablo 8. Üç gruba ilişkin kuramsal sıklıklar. Gruplar Grup 1 Grup 2 Grup 3 Toplam

Çok kötü 5.69 3.85 2.46 12

Kötü 7.59 5.13 3.28 16

Normal 15.18 10.26 6.56 32

İyi 5.69 3.85 2.46 12

Çok iyi 2.85 1.92 1.23 6

Toplam 37 25 16 78

Toplam 15 hücrenin 8'inde (% 53.3) kuramsal sıklıklar 5'den küçüktür (Tablo 8). Ki - kare testini kullanabilmemiz için tabloyu yeniden düzenlememiz gerekir. Tablo 7' de 1. ile 2. ve 4. ile 5. kolonlar birleştirilerek tablo yeniden düzenlenir (Tablo 9). Tablo 9. Tablo 7' nin yeniden düzenlenmiş hali. Gruplar Grup 1 Grup 2 Grup 3 Toplam

Çok kötü ve kötü 13 9 6 28

Normal 18 10 4 32

Çok iyi ve iyi 6 6 6 18

Toplam 37 25 16 78

Tablo 9' a ilişkin kuramsal sıklıklar Tablo 10' da verilmektedir. Tablo 10. Yeniden düzenlenen verilere ilişkin kuramsal değerler. Gruplar Grup 1 Grup 2 Grup 3 Toplam

Çok kötü ve kötü 13.28 8.97 5.74 28

Normal 15.18 10.26 6.56 32

Çok iyi ve iyi 8.54 5.77 3.69 18

Toplam 37 25 16 78

Toplam 9 hücrenin sadece 1'inde (%11.11) kuramsal sıklık 5'den küçüktür. %11.11<%20 olduğundan hipotezlerimizi ki-kare testi ile sınayabiliriz. 2

3

3

χ = ∑∑ i =1 j =1

'

( fij − fij )2 fij

'

137


χ 2=

(13 − 13.28) 2 (18 − 15.18) 2 + + 13.28 15.18

+

(6 − 3.69) 2 3.69

χ 2 = 3.7579 s.d. = (s - 1) x (c - 1) = (3 - 1)(3 - 1) = 4 Hesaplanan

χ 2 değeri (3.7579), s.d.=4 ve p=0.05'e karşılık gelen kuramsal

χ 2 değerinden (9.488) küçük olduğundan H 0 hipotezi kabul edilir (p > 0.05). 10.2. İKİ NİTEL DEĞİŞKEN ARASINDA İLİŞKİ ARANMASI VE SINANMASINDA Kİ-KARE TESTİ Korelasyon ve regresyon konusunun incelendiği bölümden, sıralamalı ölçüm düzeyinde incelenen iki değişken arasındaki ilişkinin Spearman sıra ilişki katsayısı ile ölçüldüğünü biliyoruz. Eğer tekrar eden terim sayısı çok ise ve aralarında ilişki aranan değişkenlerden biri veya ikisi sınıflamalı ölçüm düzeyinde incelendiyse değişkenler arasında anlamlı bir ilişki olup olmadığını ki - kare testi ile sınarız. Hipotezlerimizi aşağıdaki gibi oluştururuz.

H 0 : X değişkeni ile Y değişkeni arasındaki ilişki rastlantısaldır. X ile Y bağımsızdır.

H1 : X ile Y arasındaki ilişki istatistiksel olarak anlamlıdır. Hipotezlerin sınanmasında, yukarıda verilen, iki ya da daha çok grupta nitel değişkenlerin karşılaştırılmasına ilişkin tüm ki - kare yöntemleri geçerlidir. X değişkenini grup değişkeni olarak ele aldığımızı varsayarsak, X'i sınıflayıcı ölçüm düzeyinde incelenen bir değişken olarak kabul edebiliriz. X ile Y arasındaki ilişkinin gücünü kontenjans katsayısı (cc) ile ölçeriz.

cc =

χ2 N + χ2

Kontenjans katsayısının alabileceği maksimum değer aşağıdaki ifade ile hesaplanır. 138


ccmax . =

e −1 e

Burada e satır veya kolonlardan az olanını göstermektedir. Örneğin 2x2 tablosunda cc'nin maksimum değeri,

ccmax . =

2 −1 = 0.707 değerine eşittir. 2

Örnek 6. Aşağıdaki çizelgede 500 kişilik bir grupta sigara içmenin cinsiyete göre dağılımı verilmektedir. Cinsiyet ile sigara içme arasında bir ilişki var mıdır?

Tablo 11. Sigara içenlerin cinsiyete göre dağılımı. Cinsiyet Kadın Erkek Toplam

Sigara içen 12 220 232

Sigara içmeyen 88 180 268

Toplam 100 400 500

Çözüm : Cinsiyet değişkenini X ile, sigara içme durumunu da Y ile gösterirsek, hipotezlerimizi aşağıdaki gibi kurarız.

H 0 : Cinsiyet ile sigara içme bağımsızdır.

H1 : Cinsiyet ile sigara içme arasındaki ilişki anlamlıdır. Kuramsal sıklıkları hesaplarsak,

a ' = 46.4 , b ' = 53.6 , c ' = 185.6, ve d ' = 214.4 bulunur. s.d.=1 ve kuramsal sıklıklardan hiç biri 5'den küçük değildir.

(12 ⋅ 180 − 88 ⋅ 220) 2 ⋅ 500 (a ⋅ d − b ⋅ c) 2 ⋅ (a + b + c + d ) = χ = 100 ⋅ 400 ⋅ 232 ⋅ 268 (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d ) 2

139


χ 2 = 59.476 Hesaplanan ki-kare (59.476) değeri, s.d.=1 ve p=0.001 'e karşılık gelen kuramsal ki-kare (10.828) değerinden büyük olduğundan H1 hipotezi kabul edilir (p<0.001). Kontenjans katsayısı cc aşağıdaki ifade ile hesaplanır.

χ2 cc = N + χ2

59.476 = 0.326 500 + 59.476

10.3. DENEYSEL BİR DAĞILIMIN KURAMSAL BİR DAĞILIMA UYGUNLUĞUNUN SINANMASI Burada gözleme dayalı deneysel bir dağılımın kuramsal bir dağılıma uygunluğunun sınanması söz konusudur. Hipotezler aşağıdaki gibi kurulur.

H 0 : Deneysel dağılım kuramsal dağılıma uygunluk göstermektedir. Söz konusu farklar rastlantısaldır.

H1 : Deneysel dağılım kuramsal dağılıma uygunluk göstermemektedir. Aradaki farklar istatistiksel olarak anlamlıdır. Tıpta sıklıkla karşılaşılan kuramsal dağılımlar arasında Düzgün, Binom, Poisson ve Normal dağılımları gösterebiliriz. '

f i ile gözlemsel sıklığı, f i ile kuramsal sıklığı gösterirsek hipotezlerimizi aşağıda verilen ki-kare ifadesi ile sınarız. '

( f − f )2 χ = ∑ i ' i , s.d.=k – s - 1 fi i =1 2

k

Burada; k : sınıf sayısı,

140


s : kuramsal sıklıkları hesaplarken kullandığımız gözleme dayalı parametre sayısıdır. Ki-kare uygunluk testinin kullanılabilmesi için örneklem uzunluğunun (denek sayısının) en az 50 olması gerekir. Örneklem uzunluğu 50'den küçük ise uygunluk sınamasında Kolmogorov - Smirnov testi uygulanır. Kuramsal sıklığı 5'den küçük olan sınıflar varsa, komşu sınıflar birleştirilerek analize devam edilir. Örnek 7. (Deneysel dağılımın Binom dağılımına uygunluğunun sınanması) 4 çocuklu 320 ailede yapılan bir araştırmada ailelerin sahip oldukları kız ve erkek çocuklarına göre dağılımı aşağıda verilmektedir. Elde edilen deneysel dağılımın p=0.50 parametreli (kız ve erkek çocuğu doğumlarının olasılıkları birbirine eşit) binom dağılımına uygunluğunu sınayınız. Tablo 12. 4 çocuklu 320 ailenin çocukların cinsiyetine göre dağılımı. Kız ve erkek çocuk sayısı 0 K, 4 E 1 K, 3 E 2 K, 2 E 3 K, 1 E 4 K, 0 E Toplam

Aile sayısı 14 70 125 85 26 320

Çözüm : Hipotezleri aşağıdaki gibi oluştururuz.

H 0 : Deneysel dağılım p=0.5 parametreli Binom dağılımına

uygunluk

göstermektedir. Aradaki farklılık rastlantısaldır.

H1 : Deneysel dağılım kuramsal dağılıma uymamaktadır. Farklar istatistiksel

olarak anlamlıdır.

Başarı olarak kız çocuğuna sahip olmayı varsayarsak, birbirinden bağımsız 4 denemede sırasıyla, 0, 1, 2, 3 ve 4 kız çocuğuna sahip olma olasılıklarını binom dağılımından hesaplarız. Bu olasılıkları 320 ile çarparak beklenen sıklıklar hesaplanır. x=0 için (yani 0 kız, 4 erkek) çocuğuna sahip olma kuramsal olasılığını ve kuramsal sıklığını aşağıdaki gibi hesaplarız. 141


P(0) =

4! 1 ⋅ (0.5)0 ⋅ (0.5) 4 − 0 = 0!⋅(4 − 0)! 16

'

f1 = n ⋅ P(0) = 320 ⋅

1 = 20 16

1. sınıfa karşılık gelen ki-kare değerini de aşağıdaki ifade ile hesaplarız. '

( f1 − f1 ) 2 (14 − 20) 2 χ1 = = = 1.80 ' 20 f1 2

5 sınıf için (i=1,2,3,4,5 veya x=0,1,2,3,4) işlemleri tekrarlarsak Tablo 13'ü elde ederiz. Tablo 13. Kuramsal olasılıklar, kuramsal sıklıklar ve Ki-kare değerleri Kız ve erkek çocuk sayısı 0 K, 4 E 1 K, 3 E 2 K, 2 E 3 K, 1 E 4 K, 0 E Toplam

Kuramsal Olasılık

Kuramsal Sıklık

Gözlenen Sıklık

Ki-Kare

P(x)

f i = n ⋅ P( x)

fi

χ2

1/16 4/16 6/16 4/16 1/16 16/16

20 80 120 80 20 320

14 70 125 85 26 320

1.80 1.25 0.21 0.31 1.80 5.37

'

'

( fi − fi )2 χ =∑ = 5.37 ' fi i =1 2

5

s.d. = k - s - 1 = 5 - 0 - 1 = 4 (kuramsal sıklıkları hesaplarken kullandığımız p=0.50 parametresi gözlem sonucu elde edilen bir değer olmadığından s = 0 alınır.) Hesaplanan ki-kare değeri (5.37), s.d.=4 ve (anlam düzeyi) p=0.05'e karşılık gelen kuramsal ki-kare değerinden (9.488) küçük olduğundan H 0 hipotezi kabul edilir. Deneysel dağılım binom dağılımına uymaktadır. 142


Örnek 8. (Deneysel dağılımın Poisson dağılıma uygunluğunun sınanması) Çok sulandırılmış bir eriyiğin mikroskop altında incelenmesinde, 50 sayım karesinde gözlenen hücre sayısının dağılımı aşağıdaki gibi bulunmuştur. Elde edilen dağılımın Poisson dağılımına uygunluğunu sınayınız. Tablo 14-a. Gözlem sonuçları. Hücre sayısı (başarı sayısı)

Kare sayısı gözlenen sıklık

xi

fi

0 1 2 3 4 veya daha çok Toplam

17 21 8 3 1 50

Çözüm : Hipotezler aşağıdaki gibi kurulur.

H 0 : Elde edilen deneysel dağılım poisson dağılımına uymaktadır (poisson dağılımının parametresi deneysel dağılımdan hesaplanacaktır). Fark rastlantısaldır.

H1 : Deneysel dağılım poisson dağılımına uymamaktadır. Kuramsal sıklıkları hesaplarken kullanacağımız parametre m deneysel dağılımdan hesaplanır.

(x ) , m =

∑ f ⋅x ∑f i

i

i

=

50 =1 50

Başarı olarak bir sayım karesinde bir hücre olmasını kabul edersek xi = 0, 1, 2, 3, 4, ... , 50 için kuramsal olasılıkları ,kuramsal sıklıkları ve ki-kare değerlerini aşağıdaki gibi hesaplarız (Tablo 14-b).

143


Tablo 14 -b Kuramsal sıklıklar. Başarı sayısı

Kuramsal olasılık

Kuramsal sıklık

xi

P(x)

f i = n ⋅ P( x)

'

10 = 0.3679 0! 1 −1 1 e ⋅ = 0.3679 1! 2 −1 1 e ⋅ = 0.1839 2! 13 e−1 ⋅ = 0.0613 3!

e −1 ⋅

0 1 2 3

18.395 18.395 9.195 3.065

4+

0.0190

0.950

Toplam

1.0000

50.000

Tablo 14 b'den de görüldüğü gibi, 4. ve 5. sınıflarda kuramsal sıklıklar 5'den küçüktür. Bu sınıflar 3. sınıf ile birleştirilerek analize devam edilir. (Tablo15). Tablo 15. Ki-kare değerleri Başarı sayısı

xi 0 1 2+ Toplam

Kuramsal sıklık

Ki-Kare

f i = n ⋅ P( x)

fi

χ2

18.395 18.395 13.210 50.000

17 21 12 50

0.1058 0.3689 0.1108 0.5855

'

3

( fi − fi )2

i =1

fi

χ2 = ∑

Gözlemsel sıklık

'

'

= 0.5855

s.d. = k - s - 1 = 3 - 1 - 1 = 1 (kuramsal sıklıkları hesaplarken kullandığımız m =1 parametresi gözlem sonucu elde edilen bir değer olduğundan s = 1 alınır.) 144


Hesaplanan ki-kare değeri (0.5855), s.d.=1 ve (anlam düzeyi) p=0.05'e karşılık gelen kuramsal ki-kare değerinden (3.841) küçük olduğundan H 0 hipotezi kabul edilir (p>0.05). Deneysel dağılım poisson dağılımına uymaktadır. Örnek 9. (Deneysel dağılımın normal dağılıma uygunluğunun sınanması) 1995-1996 Öğretim yılı, Istanbul Tıp Fakültesi 1.sınıf öğrencilerinin boy dağılımı aşağıdaki gibidir. Elde edilen deneysel dağılımın normal dağılıma uygunluğunu sınayınız. Tablo 16. Boy değişkenine ilişkin deneysel dağılım. Boy (x) 'den az

Gözlemsel sıklık

160 - 162 162 - 164 164 - 166 166 - 168 168 - 170 170 - 172 172 - 174 174 - 176 176 - 178 178 - 180 180 - 182 182 - 184 184 - 186 186 - 188 188 - 190 190 - 192 192 - 194 Toplam

fi

0 4 6 1 7 24 19 21 22 15 15 10 6 7 1 2 0 160

Çözüm :

H 0 : Boy dağılımı normal dağılıma uygunluk göstermektedir.

H1 : Boy dağılımı normal dağılıma uygunluk göstermemektedir.

Kuramsal sıklıkları hesaplarken kullanacağımız normal dağılımın parametresi olan aritmetik ortalamayı, ham verileri kullanarak, aşağıdaki gibi hesaplarız. 145


x=∑ n

xi

=

28084 = 175.525 cm. ve s = 5.9070 cm.’dir. 160

Aritmetik ortalama ve standart sapmayı, ham veriler yerine sınıflanmış tablodan hesaplasaydık, sınflama nedeniyle farklı sonuçlar bulacaktık. ( x = 176.075 ve s = 5.9299) Boy değişkeninin (x), 160-162 aralığında olması olasılığını aşağıdaki gibi hesaplarız. P(160 < x < 162) = P(

ε 1 ve ε 2 ’yi ε i =

ε1 < ε < ε 2 ) = ?

xi − x ifadesinden hesaplarsak s

ε 1 = -2.63 ve ε 2 = -2.29 bulunur. Normal alanlar tablosundan yararlanarak ( Tablo III), P(160 < x < 162) = P(-2.63 < ε < -2.29) = 0.0067 değeri hesaplanır. 160 öğrenciden (160)·(0.0067)=1.072'sinin boylarının 160-162 cm arasında olması beklenir. Diğer aralıklar için kuramsal sıklıkların hesaplanma-sında aynı yol izlenir (Tablo 17). Tablo 17. Kuramsal olasılıklar ve sıklıklar. Boy (x)'den az 160 - 162 162 - 164 164 - 166 166 - 168 168 - 170 170 - 172 172 - 174 174 - 176 176 - 178 178 - 180 180 - 182 182 - 184 184 - 186 186 - 188 188 - 190 190 - 192 192 - 194 Toplam

Kuramsal olasılık 0.0067 0.0146 0.0281 0.0483 0.0716 0.1006 0.1232 0.1344 0.1309 0.1136 0.0880 0.0593 0.0380 0.0209 0.0103 0.0045 0.0018 0.9948

146

Kuramsal sıklık 1.072 2.336 4.496 7.728 11.456 16.096 19.712 21.504 20.944 18.176 14.080 9.488 6.08 3.344 1.648 0.720 0.288 159.168


Tablo 17'den de görüldüğü gibi ilk üç sınıf ile son dört sınıfın kuramsal sıklıkları 5'den küçüktür. Bu sınıflar birleştirilerek analize devam edilir. Gözlemsel ve kuramsal sıklıklar ve bunlara ilişkin ki-kare değerleri Tablo 18'de verilmektedir. Tablo 18. Ki-kare değerleri. Boy (x)'den az

Gözlemsel sıklık

160 - 166 166 - 168 168 - 170 170 - 172 172 - 174 174 - 176 176 - 178 178 - 180 180 - 182 182 - 184 184 - 186 186 - 194

10 1 7 24 19 21 22 15 15 10 6 10

Toplam

160

fi

Kuramsal sıklık 7.904 7.728 11.456 16.112 19.696 21.520 20.944 18.176 14.064 9.728 5.840 6.052 159.220

'

f1

Ki-kare

χ2

0.5558 5.8574 1.7332 3.8813 0.0257 0.0118 0.0532 0.5550 0.0601 0.0276 0.0011 2.6667

15.4289

s.d. = k - s - 1 = 12 - 1 - 1 = 10 (kuramsal sıklıkları hesaplarken kullandığımız aritmetik ortalama (175.525) gözlem sonucu elde edilen bir değer olduğundan s =1 alınır.) Hesaplanan ki-kare değeri (15.4289), s.d.=10 ve (anlam düzeyi) p=0.05'e karşılık gelen kuramsal ki-kare değerinden (18.307) küçük olduğundan H 0 hipotezi kabul edilir (p > 0.05). Deneysel dağılım normal dağılıma uymaktadır. Örnek 10. (Deneysel dağılımın düzgün dağılıma uygunluğunun sınan-ması) Bir A yerleşim yerinde 1991 yılında meydana gelen doğumların aylara göre dağılışı aşağıdaki tabloda verilmektedir. Aylara göre doğum sayıları arasında bir fark olup olmadığını, diğer bir deyişle, doğumların aylara göre dağılışının düzgün dağılıma uyup uymadığını sınayınız.

147


Tablo 19. A Yerleşim yerinde, 996 doğumun aylara göre dağılışı. Aylar 1 2 3 4 5 6 7 8 9 10 11 12 Toplam

Doğum sayısı (gözlemsel sıklık) 75 86 90 64 78 83 82 86 90 92 78 92 996

Çözüm : H 0 : Deneysel dağılım düzgün dağılıma uymaktadır.

H1 : Deneysel dağılım düzgün dağılıma uymamaktadır. H 0 hipotezi altında, bir doğumun herhangi bir ayda olması olasılığı (1/12)'ye ve herhangi bir ayda beklenen doğum sıklığı (996)·(1/12) = 83' e eşittir. Beklenen sıklıklar ve ki-kare değerleri aşağıdaki tabloda (Tablo 20) verilmektedir. Tablo 20. Beklenen Sıklıklar ve Ki-Kare Değerleri. Aylar 1 2 3 4 5 6 7 8 9 10 11 12 Toplam

Doğum sayısı (gözlemsel sıklık)

Doğum sayısı

fi

(beklenen sıklık) 83 83 83 83 83 83 83 83 83 83 83 83 996

75 86 90 64 78 83 82 86 90 92 78 92 996 148

Ki-kare ' 1

f

χ2 0.7711 0.1084 0.5904 4.3494 0.3012 0.0000 0.0120 0.1084 0.5904 0.9759 0.3012 0.9759 9.0843


12

χ2 = ∑ i =1

'

( fi − fi )2 = 9.0843 ' fi

s.d. = k - s - 1 = 12 - 0 - 1 = 11 (kuramsal sıklıkları hesaplarken kullandığımız (1/12) olasılık değeri kuramsal bir değer olduğundan s = 0 alınır.) Hesaplanan ki-kare değeri (9.0843), s.d.=11 ve (anlam düzeyi) p=0.05'e karşılık gelen kuramsal ki-kare değerinden (19.675) küçük olduğundan H 0 hipotezi kabul edilir (p>0.05). Deneysel dağılım düzgün dağılıma uymaktadır.

149



Bölüm 11

Korelasyon ve Regresyon

Gerek günlük yaşantımız süresince, gerekse bilimsel incelemelerde karşılaştığımız sorulardan pek çoğu, iki ya da daha çok değişken arasında bir ilişki olup olmadığının aranması ile ilgilidir. Örneğin, kişilerin boy uzunlukları ile ağırlıkları arasındaki ilişkiyi, yine, bir bölgedeki trafik kazalarının sayısı ile mevsimsel özellikler arasındaki ilişkileri incelemek isteyebiliriz. Değişkenler arasındaki ilişkiyi araştırmak genellikle iki tür amaç için gereklidir. 1. Bir değişkene ilişkin bilgi ya da ölçümlerden hareketle diğer değişken üzerindeki ölçümü ne derece doğrulukla tahmin edebiliriz. Burada, bir tür davranış ya da özelliği, diğer türden davranış ya da özelliklerden tahmin etmek söz konusudur. Örneğin, kişinin zeka düzeyi ile okul başarısı arasında yüksek derecede bir ilişki varsa, zeka düzeyi yüksek olan bir kişinin okul başarısını "yeter" sayılabilecek bir doğruluk derecesinde tahmin etmek mümkündür. 151


2. Değişkenler üzerinde gözlenen farklılıklar ne dereceye kadar açıklayıcı bazı değişkenlere bağlıdır. Bu durumda bireyleri ya da denekleri değişken üzerinde farklı yapan etmenleri saptamak söz konusudur. Örneğin, çocuklarda kan basıncı değerlerindeki değişimin ne derecede çocukların boylarına, ağırlıklarına, baş ve boyun çevrelerine bağlı olduğunu saptamaya çalışmak. Korelasyon çözümlemesi, iki ya da daha çok sayıda değişken arasındaki ilişkiyi göstermek için kullanılır. İlişkinin derecesi, korelasyon katsayısı (ilişki katsayısı) olarak ifade edilen bir sayı ile belirtilir. Yine, iki ya da daha çok değişken arasındaki bağıntının şeklini ifade etmek için regresyon çözümlemesi kullanılır. Değişkenler arasındaki ilişki değişik şekillerde olabilir. Eğer ilişkiyi birinci dereceden bir matematiksel eşitlikle (doğru denklemi) ifade etme olanağı varsa, bu durumda ilişki doğrusaldır denir (Şekil 1). Diğer taraftan, değişkenler arasındaki ilişkiyi birinci dereceden bir matematiksel eşitlikle gösterme olanağı yoksa, bu durumda ilişki doğrusal değildir, ya da doğrusal olmayan bir ilişki vardır denir. Doğrusal olmayan ilişki, doğru denklemi dışında daha üst dereceden eşitliklerden biri ile ifade edilir (Şekil 2). Y 8

7

6

5

4

3

2 0

1

2

3

4

5

6

7

X

Şekil 1. Doğrusal ilişki

152


Y 600

500

400

300

200

100

0 1

2

3

4

5

6

7

X

Şekil 2. Doğrusal olmayan ilişki

Değişkenler arasındaki ilişkiyi saptarken ilişkinin biçimine (doğrusal olup olmayışına) göre farklı eşitlikler kullanmamız gerekir. Değişkenler arasındaki ilişkinin belirlenmesinde kullanılan teknik, ilişkinin biçimine göre değiştiği gibi, aralarında ilişki aranan değişken sayısına ve bu değişkenlerin ölçüm düzeylerine göre de değişir. İki değişken arasındaki ilişkiyi saptamada kullanılan korelasyon tekniklerine basit korelasyon teknikleri, değişken sayısı üç ya da daha çok ise çoklu korelasyon teknikleri ve bazı değişkenlerin etkisinin sabit tutulduğu durumlarda kullanılan tekniklere de kısmi korelasyon teknikleri adı verilir. Sürekli iki değişken (aralıklı veya oransal ölçüm düzeyinde incelenen) arasındaki ilişki değerini gösteren katsayıya "Pearson - Bravais momentler çarpımı ilişki katsayısı" denir. Tıpta tek başına ilişki katsayısı denilince bu katsayıdan söz edilir ve katsayı r simgesi ile gösterilir. Pearson - Bravais korelasyon katsayısı r, +1 ile -1 arasında değerler alır. Değişkenlerin her ikisi aynı yönde değişme gösteriyorsa r 'nin işareti pozitif, değişkenlerden biri bir yönde diğeri ters yönde değişiyorsa ( yani, biri azalırken diğeri çoğalıyorsa) r 'nin işareti negatiftir. Değişkenler arasında ne pozitif ne de negatif yönde birlikte bir değişme yoksa korelasyon katsayısı sıfırdır. Korelasyon katsayısının sıfır oluşu değişkenler arasında bir ilişkinin olmadığını gösterir. Korelasyon katsayısının mutlak değeri ilişkinin gücünü, işareti ise ilişkinin yönünü belirler. Örneğin, korelasyon katsayıları +0.95 ile -0.95 aynı derecede bir ilişkiyi gösterir. Birinci de ilişkinin yönü pozitif, ikinci de ise negatiftir. 153


İki yönlü değişim tablosunda noktaların oluşturduğu şekil (Serpilme Diyagramı) bir doğruya yaklaştıkça r 'nin değeri +1 ya da -1'e yaklaşır. Serpilme diyagramı bir daire şeklini aldıkça r 'nin mutlak değeri düşer ve en yaygın halde sıfır olur. Şekil 3 ve Şekil 4'de çeşitli serpilme diyagramları ve bunlara ait korelasyon katsayıları verilmektedir.

Şekil 3.

Şekil 4.

154


11.1. REGRESYON DOĞRUSUNUN EN KÜÇÜK KARELER YÖNTEMİ İLE ELDE EDİLMESİ Şekil 5'te n tane ( x, y ) gözlem çiftine ait serpilme diyagramı ve n gözlemi temsil ettiğini düşündüğümüz bir doğru parçası verilmektedir. Serpilme diyagramında n gözlemi temsil etmek amacı ile pek çok doğru çizilebilir. Amacımız bu doğrular arasından temsil gücü en fazla olan doğruyu belirlemektir.

Şekil 5. y 'nin x 'e göre regresyon doğrusu.

y = a + b ⋅ x ifadesi ile verilen doğruya " y 'nin x 'e göre regresyon doğrusu" adı verilir. Burada a değeri regresyon sabiti, b ise regresyon ' katsayısıdır. xi değerlerine karşılık gelen kuramsal yi değerlerinin yi' = a + b ⋅ xi ifadesinden hesaplandığını düşünürsek, n

n

i =1

i =1

∑ ( yi' − yi )2 = ∑ (a + b ⋅ xi − yi )2 ifadesini en küçük yapan regresyon sabiti ( a ) ve regresyon katsayısı ( b ) aşağıdaki şekilde hesaplanır.

155


( x )⋅( y ) ∑ (x ⋅ y ) − ∑ n ∑ b= ( x) ∑x − ∑ i

i

i

i

2

i = 1,2, , n

i

2 i

n

a = y −b⋅x = ∑ n

yi

−b⋅ ∑ n

xi

11.2. BELİRLEME KATSAYISI Belirleme katsayısı, y 'deki değişkenliğin yüzde kaçının x 'e bağlı olduğunu gösterir ve d y ⋅ x simgesi ile gösterilir.

y 'deki toplam değişkenliği, açıklanan ve açıklanmayan değişkenlik şeklinde gösterebiliriz. Toplam değişkenlik = açıklanan değişkenlik + açıklanmayan değişkenlik

s y2 = s yk2 + s yx2

, daha açık bir ifade ile,

− y ) 2 ∑ ( yi' − y ) 2 ∑ ( yi − yi' ) 2 = + şeklinde yazabiliriz. n −1 n −1 n −1 ' yi kuramsal değerlerinin yi' = a + b ⋅ xi eşitliğinden elde edildiğini

∑(y

i

hatırlayalım. Buradan belirleme katsayısı ( d y ⋅ x ) aşağıdaki ifade ile hesaplanır.

d y⋅x =

2 s yk

s y2

=1 −

s yx2 s y2 2

Belirleme katsayısı korelasyon katsayısının karesine eşittir ( d y ⋅ x = r ). Belirleme katsayısının 1'e eşit olması y 'deki tüm değişkenliğin x ile açıklanabildiğini gösterir. Bu durumda r 'nin mutlak değeri 1'e eşit olur. İlişkinin yönünü belirlemek için serpilme diyagramına bakmamız gerekir.

156


11.3. PEARSON-BRAVAIS KORELASYON KATSAYISI Pearson - Bravais momentler çarpımı korelasyon katsayısı aşağıdaki ifadelerden biri ile hesaplanabilir.

r=

∑ ((x − x) ⋅ ( y − y)) ∑ ( x − x) ⋅ ∑ ( y − y ) i

i

2

i

, i = 1,2,

2

,n

i

veya,

( x )⋅( y ) ∑ (x ⋅ y ) − ∑ n ∑ ( x) ( y) (∑ x − ∑ ) ⋅ (∑ y − ∑ i

r=

i

i

i

2

2 i

i

n

2 i

i

n

, i = 1,2,

2

,n

)

11.3.1. KORELASYON KATSAYISININ ANLAM LILIĞININ SINANM ASI Başlangıç hipotezimizi incelenen iki değişkenin birbirinden bağımsız olduğu ( r = 0 ), alternatif hipotezi ise iki değişkenin birbiriyle ilişkili olduğu şeklinde kurarız.

H0: r = 0 H1 : r ≠ 0 Hipotezleri sınamada Student't testini kullanırız.

t=

r (1 − r 2 )

⋅ ( n − 2)

(Serbestlik derecesi) s.d. = n - 2 Hesapladığımız t değeri, (n-2) serbestlik dereceli ve kabul edilen anlam düzeyine karşılık gelen kuramsal t değerine (Tablo IV) eşit veya büyükse H1 hipotezini, küçükse H 0 hipotezini kabul ederiz.

157


11.4. REGRESYON KATSAYILARI İLE KORELASYON KATSAYISI ARASINDAKİ İLİŞKİ y 'nin x 'e göre regresyon doğrusunu y = a + b ⋅ x ve x 'in y 'ye göre regresyon doğrusunu x = a ' + b' ⋅ y ifadesi ile gösterirsek

r 2 = b ⋅ b ' ve r = b ⋅ b'

eşitliklerini yazabiliriz.

Örnek 1. Aşağıda yeni doğan 15 kız çocuğuna ait boy ( x ) ve ağırlık ( y ) değerleri verilmektedir. x ve y arasındaki serpilme diyagramını çizerek, y 'nin x 'e göre regresyon doğrusu denklemini, x ve y arasındaki Pearson Bravais momentler çarpımı korelasyon katsayısını ( r ) ve belirleme katsayısını ( d y ⋅ x ) hesaplayınız. Tablo 1. 15 yeni doğan kız çocuğunda boy ve ağırlık değerleri. Boy (cm)

xi

Ağırlık (Kg)

50.0 50.5 50.0 51.0 53.0 48.0 49.5 46.0 49.0 50.0 51.0 50.0 51.0 51.5 48.5

yi

3.2 3.3 3.1 3.5 4.0 2.9 2.8 2.6 3.2 3.3 3.2 3.1 3.2 3.0 2.9

Çözüm : Boy ( x ) ve ağırlık ( y ) değişkenlerine ilişkin serpilme diyagramı aşağıdaki gibi çizilir ( Şekil 6).

158


Şekil 6. Boy ( x ) ve ağırlık ( y ) değişkenlerine ilişkin serpilme diyagramı.

15 yeni doğan kız çocuğuna ilişkin x 2 , y 2 , ve x ⋅ y değerlerini ve toplamlarını hesaplarız (Tablo 2). Tablo 2. Denek No

i

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Toplam

Boy

Ağırlık

xi

yi

xi2

50.00 50.50 50.00 51.00 53.00 48.00 49.50 46.00 49.00 50.00 51.00 50.00 51.00 51.50 48.50 749.00

3.20 3.30 3.10 3.50 4.00 2.90 2.80 2.60 3.20 3.30 3.20 3.10 3.20 3.00 2.90 47.30

2500.00 2550.25 2500.00 2601.00 2809.00 2304.00 2450.25 2116.00 2401.00 2500.00 2601.00 2500.00 2601.00 2652.25 2352.25 37438.00

159

yi2

xi ⋅ yi

10.24 10.89 9.61 12.25 16.00 8.41 7.84 6.76 10.24 10.89 10.24 9.61 10.24 9.00 8.41 150.63

160.00 166.65 155.00 178.50 212.00 139.20 138.60 119.60 156.80 165.00 163.20 155.00 163.20 154.50 140.65 2367.90


Regresyon sabiti ( a ) ve regresyon katsayısı ( b )'yi aşağıdaki ifade ile hesaplarız.

( x )⋅( y ) ∑ (x ⋅ y ) − ∑ n ∑ b= ( x) ∑x − ∑ i

i

i

i

i = 1,2, , n

2

2 i

b=

i

n

749.00 ⋅ 47.30 15 = 0.15958 7492 37438.00 − 15

2367.90 −

y x a = y −b⋅ x = ∑ i −b⋅ ∑ i n n

a=

47.30 749.00 –4.81503 − (0.15958) ⋅ = −4.81494 bulunur. 15 15

Serpilme diyagramını temsil eden en küçük kareler doğrusu aşağıdaki gibi belirtilir. y = – 4.81503 + 0.15958⋅x a ve b 'yi aşağıdaki ifadelerden de hesaplayabiliriz.

y = a + b ⋅ x eşitliğinin her iki tarafında toplama işlemini yaparsak (1), eşitliğin her iki tarafının x ile çarparak toplamları alırsak (2) eşitliklerini elde ederiz.

∑ y = n⋅ a + b⋅∑x

(1) 2

∑ ( x ⋅ y ) = (∑ x ) ⋅ a + b ⋅ (∑ x ) 47.30 = 15 ⋅ a + b ⋅ 749.00 2367.90 = 749.00 ⋅ a + b ⋅ 37438.00

160

(2)


(1) ve (2) eşitliklerinin (iki bilinmeyenli denklemler) çözümlenmesiyle

a = -4.81503 , b = 0.15958 değerleri elde edilir. Belirleme katsayısı ( d y ⋅ x ) ve korelasyon katsayısı r ’nin hesaplanması. '

yi tahmin (kuramsal) değerlerini y = –4.81503 + 0.15958⋅x ifadesinden hesaplarız. Örneğin, x1 = 50 cm'ye karşılık gelen tahmini ağırlık değeri y1’ = –4.81503 + 0.15958⋅50 = 3.16397 Kg elde edilir. x1 ' e karşılık gelen yi gözlem değerimiz 3.2 Kg idi. Toplam değişkenliği, açıklanan ve açıklanmayan değişkenliği aşağıdaki ifadelerle hesaplarız. Sonuçlar Tablo 3'de verilmektedir.

47.30 =3.153333 ve 15

y=

− y ) 2 ∑ ( yi' − y ) 2 ∑ ( yi − yi' ) 2 = + yazabiliriz. n −1 n −1 n −1

∑(y

i

Tablo 3. Toplam, açıklanan ve açıklanmayan değişkenlik.

xi

yi

yi'

( yi − y)2

( yi' − y)2

( yi − yi' ) 2

50.00 50.50 50.00 51.00 53.00 48.00 49.50 46.00 49.00 50.00 51.00 50.00 51.00 51.50 48.50 Toplam

3.20 3.30 3.10 3.50 4.00 2.90 2.80 2.60 3.20 3.30 3.20 3.10 3.20 3.00 2.90

3.1640 3.2438 3.1640 3.3236 3.6427 2.8448 3.0842 2.5257 3.0044 3.1640 3.3236 3.1640 3.3236 3.4033 2.9246

0.0022 0.0215 0.0028 0.1202 0.7168 0.0642 0.1248 0.3062 0.0022 0.0215 0.0022 0.0028 0.0022 0.0235 0.0642 1.4773

0.0001 0.0082 0.0001 0.0290 0.2395 0.0952 0.0048 0.3940 0.0222 0.0001 0.0290 0.0001 0.0290 0.0625 0.0523 0.9660

0.0013 0.0032 0.0041 0.0311 0.1277 0.0030 0.0808 0.0055 0.0383 0.0185 0.0153 0.0041 0.0153 0.1627 0.0006 0.5114

161


0.9660 d y ⋅ x = 2 = 15 − 1 = 0.6539 s y 1.4773 15 − 1 2 s yk

r = d y⋅x = 0.6539 = 0.8086 (İlişkinin yönünün pozitif olduğuna serpilme diyagramından karar verilir.)

d y ⋅ x ve r 'yi aşağıdaki ifadelerle de hesaplayabiliriz. 0.5114 d y ⋅ x = 1 − 2 = 1 − 15 − 1 = 0.6539 1.4773 sy 15 − 1

s yx2

( x )⋅( y ) ∑ (x ⋅ y ) − ∑ n ∑ ( x) ( y) (∑ x − ∑ ) ⋅ (∑ y − ∑ i

r=

i

i

i

2

2 i

i

n

2 i

i

n

, i = 1,2,

2

)

749.00 ⋅ 47.30 15 r= 2 749 47.30 2 (37438.00 − ) ⋅ (150.63 − ) 15 15 2367.90 −

r = 0.8086 bulunur. r ’ nin anlamlılığının sınanması. Hipotezler, H 0 : r = 0 ve H1 : r ≠ 0 şeklinde kurulur.

162

,n


t=

r 2

(1 − r )

⋅ ( n − 2) =

0.8086 (1 − 0.8086 2 )

⋅ (15 − 2) ,

t = 4.96

(Serbestlik derecesi) s.d. = n - 2 = 13 ve p=0.001'e karşılık gelen kuramsal t değeri 4.221 hesapladığımız t değerinden küçük olduğundan H1 hipotezini kabul ederiz (p<0.001). Boy ve ağırlık arasındaki ilişki istatistiksel olarak anlamlıdır.

11.5. SPEARMAN SIRA FARKI İLİŞKİ KATSAYISI Eğer, incelenen değişkenler normal dağılıma sahip değilse, değişkenler sadece sıralamalı ölçüm düzeyinde incelendiyse Pearson - Bravais momentler çarpımı korelasyon katsayısı yerine Spearman sıra farkı ilişki katsayısı hesaplanır. Yine, incelenen seride terim sayısı çok az ise veya normal dağılım koşulu gerçekleşmiyorsa, seri terimleri artan ( veya azalan) sırada sıraya dizilir ve x ve y 'ye ilişkin sıra numaraları üzerinde ilişki aranır. x ve y 'ye ilişkin ölçüm değerlerine sıra numaraları verildiğinde eşit değerlerin her birine, karşılık gelen sıra numaralarının aritmetik ortalaması sıra numarası olarak verilir. Spearman sıra farkı ilişki katsayısı rs simgesi ile gösterilir. rs 'yi aşağıdaki ifade ile hesaplayabiliriz.

rs =

Tx + Ty − ∑ di2 2 ⋅ Tx ⋅ Ty

Burada ;

n3 − n − STx Tx = 12

Ty =

n3 − n − STy 12

STx = ∑ (t 3 − t ) , ST y = ∑ (t 3 − t ) ( t , seride aynı değerleri alan eleman sayısı).

163


Eğer STx ve ST y = 0 ise,

n3 − n n3 − n + − ∑ di2 6⋅ d2 12 rs = 12 = 1 − 3∑ i n −n n3 − n n3 − n 2⋅ ⋅ 12 12

11.5.1.

rs 'NİN

olur.

ANLAM LILIĞININ SINANM ASI

Hipotezler: H 0 : rs = 0 ve H1 : rs ≠ 0 n > 10 ise, hipotezler Student't testi ile sınanır ( r 'nin sınanmasında olduğu gibi). n ≤ 10 ise, hipotezlerin sınanmasında Tablo IX kullanılır. Örnek 2. 10 hastaya x ve y testleri uygulanmış ve aşağıdaki sonuçlar elde edilmiştir. x ve y testlerinde değerlendirme 1-8 arasındaki derecelendirmeye göre yapılmıştır ( 1 = en kötü,..., 8 = en iyi). x ve y testleri arasındaki spearman sıra farkı ilişki katsayısını hesaplayınız. x:

1, 3, 5, 6, 4, 6, 1, 2, 4, 4,

y : 1, 3, 6, 7, 5, 8, 2, 3, 4, 3,

Çözüm :

x ve y değerleri sıraya konarak her bir değere sıra numarası verilir. x serisinde 1 değeri iki kez tekrarlandığından, sıra numarası olarak 1 ve 2 'nin aritmetik ortalaması 1.5 değeri verilir. 2' ye karşılık gelen sıra numarası 3, 3 değerine karşılık gelen sıra numarası 4, 4 değerine karşılık gelen sıra numarası olarak, 3 kez tekrarlandığından, 5,6 ve 7 'nin aritmetik ortalaması olan 6 değeri verilir. x , y değerlerine karşılık gelen sıra numaraları, sıra numaraları arasındaki farklar ve farkların kareleri aşağıdaki tabloda verilmektedir.

164


Tablo 4.

x

sıra( x )

y

sıra(

1.5 4 8 9.5 6 9.5 1.5 3 6 6

1 3 6 7 5 8 2 3 4 3

1 4 8 9 7 10 2 4 6 4

1 3 5 6 4 6 1 2 4 4 Toplam

y)

d i =sıra( x )-sıra( y ) 0.5 0 0 0.5 -1 -0.5 -0.5 -1 0 2

d i2 0.25 0 0 0.25 1 0.25 0.25 1 0 4 7

STx = ∑ (t 3 − t ) = { ( 2³-2) + (3³-3) + (2³-2) } = 36 , ST y =

∑ (t

3

− t ) = (3³-3) = 24,

n3 − n − STx 1000 − 10 − 36 = = 79.5 Tx = 12 12 Ty =

rs =

n3 − n − STy 1000 − 10 − 24 = = 80.5 12 12

Tx + Ty − ∑ di2 2 ⋅ Tx ⋅ Ty

=

79.5 + 80.5 − 7 2 ⋅ 79.5 ⋅ 80.5

rs = 0.95625 rs 'nin anlamlılığının sınanması. Hipotezler H 0 : rs = 0 ve H1 : rs ≠ 0 , n=10 olduğu için hipotezlerin sınanmasında Tablo IX' u kullanabiliriz. p=0.01 için rs 'nin alabileceği en küçük değer 0.79'dur ( Tablo IX) 0.95625 > 0.79 olduğundan yanılma düzeyimiz p<0.01 165


olur, diğer bir ifadeyle H1 hipotezini kabul ederiz. x ve y arasındaki ilişki istatistiksel olarak anlamlıdır. Örnek 3. 5 öğrencide x ve y değişkenleri incelenmiş ve aşağıdaki değerler elde edilmiştir. x ve y arasındaki Spearman sıra farkı ilişki katsayısını hesaplayınız.

x : 85, 60, 73, 40, 90 y : 93, 75, 65, 50, 80 Çözüm : x ve y serilerinde ölçüm değerlerine karşılık gelen sıra numaraları, sıra numaraları arasındaki farklar ve farkların kareleri hesaplanır (Tablo 5). Tablo 5. Öğrencinin adı

x

y

sıra( x )

A B C D E Toplam

85 60 73 40 90

93 75 65 50 80

4 2 3 1 5

sıra(

y)

5 3 2 1 4

di

d i2

-1 -1 1 0 1

1 1 1 0 1 4

x ve y 'de tekrarlayan değerler olmadığından STx ve ST y değerleri sıfıra eşittir.

rs == 1 −

6 ⋅ ∑ di2 3

n −n

=1−

6⋅4 = 0.80 125 − 5

n=5 ve p = 0.05 için rs 'nin alt sınırı 1'dir (Tablo IX). 0.80 < 1 olduğundan

H 0 : rs = 0 hipotezini kabul ederiz. Diğer bir ifade ile, x ve y değişkenleri arasındaki sıra farkı ilişki katsayısı istatistiksel olarak anlamlı değildir ( p > 0.05).

11.6. KISMİ KORELASYON KATSAYISI

x , y , z değişkenleri arasındaki ilişkiyi incelemek isteyelim. z değişkeni x ve y değişkenini etkiliyorsa, x ve y arasındaki korelasyonu hesaplarken z 'nin x ve y üzerindeki etkisinin giderilmesi gerekir. Bu durumda, x ve y

166


arasında hesaplanan korelasyon katsayısına kısmi korelasyon katsayısı denir ve rxy / z simgesi ile gösterilir. Kısmi korelasyon katsayısı aşağıdaki ifade ile hesaplanır.

rxy / z =

rxy − rxz ⋅ ryz (1 − rxz2 ) ⋅ (1 − ryz2 )

Burada, rxy , x ve y arasındaki, rxz , x ve z arasındaki ve ryz , y ve z arasındaki basit korelasyonu (Pearson momentler çarpımı korelasyon katsayısı) göstermektedir. Aynı şekilde, x 'in y ve z üzerindeki etkisinin giderildiği durumda y ve z arasındaki kısmi korelasyon katsayısı ve y 'nin x ve z üzerindeki etkisinin giderildiği durumda x ve z arasındaki kısmi korelasyon katsayısını aşağıdaki ifadelerle hesaplarız. Etkisini gidermek istediğimiz değişken sayısı kısmi korelasyon katsayısının derecesini belirler. rxy/z, ryz/x ve rxz/y 1.dereceden kısmi korelasyon katsayılarıdır.

ryz / x =

rxz / y =

ryz − ryx ⋅ rzx (1 − ryx2 ) ⋅ (1 − rzx2 ) rxz − rxy ⋅ rzy (1 − rxy2 ) ⋅ (1 − rzy2 )

11.7. ÇOKLU REGRESYON VE KORELASYON y 'yi açıklanan değişken (bağımlı değişken), x ve z 'yi açıklayıcı değişkenler (bağımsız değişkenler) olarak kabul edersek y 'nin x 'e ve z 'ye göre regresyon denklemini hesaplayabiliriz.

en

küçük

kareler

167

yöntemi

ile

aşağıdaki

şekilde


y 'nin x 'e ve z 'ye göre regresyon denklemini aşağıdaki ifade ile gösterelim.

y =b0 +b1 ⋅ x + b2 ⋅ z Burada, b0 regresyon sabiti, b1 ve b2 regresyon katsayılarıdır.

i . gözleme karşılık gelen kuramsal

yi' değerini

yi' =b 0 +b1 ⋅ x + b2 ⋅ z

ifadesi ile hesaplarız. ' i

2

∑ ( y − y ) = ∑ (b

0

i

+ b1 ⋅ x i + b2 ⋅ zi − yi ) 2 ifadesini

en küçük yapan b0 sabiti, b1 ve b2 regresyon katsayılarını aşağıda verilen normal denklemleri çözerek hesaplarız. Normal denklemler.

∑ y = n ⋅ b + ( ∑ x ) ⋅ b + (∑ z ) ⋅ b ∑ ( x ⋅ y) = (∑ x) ⋅ b + (∑ x ) ⋅ b + (∑ ( x ⋅ z)) ⋅ b ∑ ( y ⋅ z) = (∑ z) ⋅ b + (∑ x ⋅ z) ⋅ b + (∑ ( z )) ⋅ b 0

1

(1)

2

2

0

1

2

2

0

1

2

(2) (3)

x , y , z arasındaki çoklu korelasyon katsayısını da aşağıdaki ifade ile hesaplarız. Çoklu korelasyon katsayısı ry . xz simgesi ile gösterilir. Burada y açıklanan değişken, x ve z açıklayıcı değişkenlerdir.

ry. xz =

ryx2 + ryz2 − 2 ⋅ ryx ⋅ ryz ⋅ rxz 1 − rxz2

11.7.1. ÇOKLU KORELASYON KATSAYISININ ANLAM LILIĞININ SINANM ASI Çoklu korelasyon katsayısı F testi ile sınanır. Hipotezler H 0 : ry . xz = 0 ve H1 : ry . xz ≠ 0 şeklinde kurulur. 168


F=

ry2. xz ⋅ (n − k ) (1 − ry2. xz ) ⋅ (k − 1)

Burada, k incelenen değişken sayısıdır. Hesaplanan F değeri (n -k) ve (k -l) serbestlik dereceli kuramsal F değeri (Tablo V) ile karşılaştırılarak H 0 veya H1 hipotezi kabul edilir. Örnek 4. 6-11 yaş grubu 12 çocukta ölçülen kan basıncı ( y ), ağırlık ( x ) ve boy ( z ) değerleri aşağıda (Tablo 6) verilmektedir. Basit, kısmi ve çoklu korelasyon katsayılarını ve y 'nin x 'e ve z 'ye göre regresyon denklemini en küçük kareler yöntemi ile hesaplayınız. Tablo 6. Kan basıncı, ağırlık ve boy değerleri Denek No

Kan basıncı

Ağırlık

Boy

1 2 3 4 5 6 7 8 9 10 11 12 Toplam

102.40 103.00 105.90 105.30 107.60 108.10 96.40 97.10 95.80 98.80 99.70 102.00 1222.10

21.10 22.00 25.60 27.70 30.10 32.10 19.10 20.20 22.40 24.90 26.60 29.60 301.40

117.00 121.00 126.00 132.00 137.00 140.00 113.00 117.00 122.00 127.00 133.00 136.00 1521.00

x

y

z

Çözüm :

x 2 , y 2 , z 2 , ( x ⋅ y ), ( x ⋅ z ) ve ( y ⋅ z ) değerleri hesaplanarak toplamlar alınır (Tablo 7).

169


Tablo 7.

y2

x2

z2

(x⋅z)

10485.76 10609.00 11214.81 11088.09 11577.76 11685.61 9292.96 9428.41 9177.64 9761.44 9940.09 10404.00 124665.57

445.21 484.00 655.36 767.29 906.01 1030.41 364.81 408.04 501.76 620.01 707.56 876.16 7766.62

13689.00 14641.00 15876.00 17424.00 18769.00 19600.00 12769.00 13689.00 14884.00 16129.00 17689.00 18496.00 193655.00

2468.70 2662.00 3225.60 3656.40 4123.70 4494.00 2158.30 2363.40 2732.80 3162.30 3537.80 4025.60 38610.60

Basit korelasyonlar.

rxy = 0.738

rxz = 0.988

170

(x⋅

y)

2160.64 2266.00 2711.04 2916.81 3238.76 3470.01 1841.24 1961.42 2145.92 2460.12 2652.02 3019.20 30843.18

(

y⋅z)

11980.80 12463.00 13343.40 13899.60 14741.20 15134.00 10893.20 11360.70 11687.60 12547.60 13260.10 13872.00 155183.20


1222.10 ⋅1521.00 12 ryz = 2 1222.10 1521.00 2 (124665.57 − ) ⋅ (193655.00 − ) 12 12 ryz = 0.669 155183.20 −

Kısmi korelasyon katsayıları.

rxy / z =

rxy − rxz ⋅ ryz (1 − rxz2 ) ⋅ (1 − ryz2 )

=

0.738 − 0.988 ⋅ 0.669 (1 − 0.9882 ) ⋅ (1 − 0.6692 )

rxy / z = 0.671 ryz / x =

ryz − ryx ⋅ rzx (1 − ryx2 ) ⋅ (1 − rzx2 )

=

0.669 − 0.738 ⋅ 0.988 (1 − 0.7382 ) ⋅ (1 − 0.9882 )

ryz / x = -0.577 rxz / y =

rxz − rxy ⋅ rzy (1 − rxy2 ) ⋅ (1 − rzy2 )

=

0.988 − 0.738 ⋅ 0.669 (1 − 0.7382 ) ⋅ (1 − 0.6692 )

rxz / y = 0.985 Çoklu korelasyon katsayısı.

ry. xz = ry. xz =

ryx2 + ryz2 − 2 ⋅ ryx ⋅ ryz ⋅ rxz 1 − rxz2 0.7382 + 0.6692 − 2 ⋅ 0.738 ⋅ 0.669 ⋅ 0.988 1 − 0.9882

ry . xz = 0.8344 ry . xz 'nin anlamlılığının sınanması.

171


F=

ry2. xz ⋅ (n − k ) (1 − ry2. xz ) ⋅ (k − 1)

=

2 2 0.83869 (12 –− 3) 3) 0.8344 ⋅ ⋅(12 ==10 .67 10.31 22 (1 (1 –− 0.8344 0.83869 ⋅) ⋅(3(3–−1) 1)

Hesaplanan F değeri, 0.05 yanılma düzeyi ve (12 - 3) ve (3 - 1) serbestlik derecelerine karşılık gelen kuramsal F = 4.26 değerinden (Tablo Va) büyük olduğundan H1 : ry . xz ≠ 0 hipotezi kabul edilir. Belirleme katsayısı d y. xz = ry2. xz = 0.6962'dir. Yani, y 'deki değişkenliğin % 69.62'sini x ve z değişkenleri ile açıklamak mümkündür.

y 'nin x 'e ve z 'ye göre regresyon denklemi. (1) 1222.10 = 12 ⋅ b0 + 301.40 ⋅ b1 + 1521.0 ⋅ b2 (2) 30843.18 = 301.4 ⋅ b0 + 7766.62 ⋅ b1 + 38610.60 ⋅ b2 155183.20 = 1521.0 ⋅ b0 + 38610.60 ⋅ b1 + 193655.00 ⋅ b2 (3) (1), (2) ve (3) nolu denklemlerin çözümlenmesi ile b0 = 177.20563, b1 = 3.38111, b2 = - 1.26459 değerleri bulunur. Regresyon denklemini aşağıdaki gibi yazarız.

y = 177.21 + 3.38 ⋅ x − 1.26 ⋅ z

172


Bölüm 12

Tek Yönlü Varyans Analizi (Model 1)

12.1. VARYANS ANALİZİ MODELİNİN BİLEŞENLERİ İki ya da daha fazla gruba ilişkin, aritmetik ortalamaların karşılaştırılmasında varyans analizi yöntemi kullanılır. Tek yönlü varyans analizinde örneklerin (deneklerin) gruplara rastgele dağıldığı varsayılır. Modelde, deney sonucunda elde edilen bir cevabı (bir gözlemi, bir ölçüm değerini) etkileyen üç ana bileşen vardır.

xij = µ + " i + ! ij Burada,

xij = deney sonucu elde edilen ölçüm değerleri ( i .grupta j .ölçüm değeri)

i = 1,2,...,k (grup sayısı) ve j = 1,2,...,n (deneme sayısı)

µ = anayığın ortalaması 173


! i = i . grubun deneye etkisi ! ij = örnekleme hatası (rastlantısal hata). Her bir grupta gözlem sayısının eşit olduğunu varsayarsak, k grupta elde edilen sonuçları aşağıdaki gibi (Tablo 1) gösterebiliriz. Tablo 1. k Gruba ilişkin gözlem sonuçları

Grup sayısı( i )

1

Gözlem sayısı ( j ) 2 3 ....

Ortalama n

x11 x21 x31

x12 x22 x32

x13

....

x23

....

x2 n

x33

....

x3n

xi x1 . x2. x3.

. . .

. . .

. . .

. . .

. . .

. . .

. . .

k

xk1

xk 2

xk 3

....

xkn

xk .

1 2 3

Toplam

x1n

x..

Tek yönlü varyans analizinin varsayımları aşağıda verilmektedir. 1. Modelde yer alan grup etkileri toplanma özelliğine sahiptir. k

!"

i

=0

i =1

2. Hata terimleri ( ! ij ) ortalaması sıfır olan normal dağılıma sahiptir.

174


3. Hata terimleri birbirinden bağımsızdır ve rastlantısal olarak ortaya çıkmaktadır. Tek yönlü varyans analizinde hipotezleri aşağıdaki gibi kurarız.

H 0 : xi = x j , (i ! j ) (grup ortalamaları arasındaki farklar rastlantısaldır).

H 1 : En az iki grup ortalaması birbirinden farklıdır. 12.2. TOPLAM VARYANSIN AYRIŞTIRILMASI Bütün grupların birleştirilmesi ile elde edilen ana grubun ortalamasını (anayığın ortalaması µ 'nün tahminini) x.. ile ve i . grubun ortalamasını x i. ile gösterirsek ( xij ! µ ) farkını aşağıdaki şekilde iki kısma ayırabiliriz. ( xij - x.. ) = ( xij - x i . ) + ( x i . - x.. ) Her iki tarafın karesini alıp toplama işlemini yaparsak aşağıdaki sonucu elde ederiz. k

n

!! ( xij " x..)2 = i =1 j =1

k

k

n

!! ( xij " xi .)2 + n # ! ( xi . " x..)2 i =1

i =1 j =1

+ 2#

k

n

!! (( x

ij

" x i .) # ( x i . " x..)

i =1 j =1

Eşitliğin sağ tarafındaki son terim sıfıra eşit olduğundan k

n

!! ( xij " x..)2 = i =1 j =1

k

k

n

!! ( xij " xi .)2 + n # ! ( xi . " x..)2 i =1

i =1 j =1

ifadesini yazabiliriz. 175


Yukarıdaki eşitliğin sol ve sağ tarafındaki terimleri sözel olarak aşağıdaki şekilde ifade edebiliriz. k

n

!! ( x

ij

" x..) 2 : Genel kareler toplamı (G.K.T.) (toplam değişkenlik)

i =1 j =1 k

n

!! ( x

ij

" xi .) 2 : Gruplar içi kareler toplamı (G.I.K.T.)

i =1 j =1

(açıklanmayan değişkenlik, hata) k

n # ! ( xi . " x..) 2 : Gruplar arası kareler toplamı (G.A.K.T.) i =1

(açıklanan değişkenlik) G.K.T. = G.I.K.T. + G.A.K.T. Tek yönlü varyans analizi, k grupta n j gözlemi içeren bir deneyleme düzeninde genel değişimi gruplar arası ve gruplar içi değişime (hata) ayırmayı amaçlamaktadır. Varyans analizi sonucu elde edilen değişimler kaynaklarına göre bir tabloda gösterilir. Bu tabloya varyans analizi tablosu denir. Tablo 2. Varyans Analizi Tablosu Değişim kaynağı

Kareler toplamı

Serbestlik derecesi

Kareler ortalaması

Gruplar arası

G.A.K.T.

k !1

G.A.K.O.

Gruplar içi (Hata)

G.I.K.T.

N !k

G.I.K.O.

Toplam

G.K.T.

N-1 176

F

değeri

Anlam düzeyi

p=?


Burada,

N = n1 + n2 + L + nk (Gruplar arası kareler ortalaması) G. A.K .O. =

(Gruplar içi kareler ortalaması)

G.İ.K.O. G.Y.K .O. =

G. A.K .T . k !1

G .Y.K .T . G.İ.K.T. 'dir. N !k

G. A.K .O ifadesi ile hesaplanan F değeri, ( k ! 1 ) , ( N ! k ) serbestlik G .Y.K .O. G.İ.K.O.

derecelerine ve kabul edilen anlam düzeyine karşılık gelen kuramsal F değeri (Tablo V) ile karşılaştırılarak H 0 veya H1 hipotezlerinden biri kabul edilir.

Varyans analizi sonucu H1 hipotezini kabul edersek (yani en az iki grubun ortalaması birbirinden farklı ise) ortalamaları farklı olan grupları belirlememiz gerekir.

12.3. ÇOKLU KARŞILAŞTIRMA (EN KÜÇÜK ÖNEMLİ FARK (LSD) YÖNTEMİ) Gruplar eşit sayıda (n) denek içeriyorsa, ikişer ikişer tüm grupların ortalamaları arasındaki mutlak farklar hesaplanır. Hesaplanan farklar aşağıda ifadesi verilen kritik D değeri ile karşılaştırılır. Kiritik D değerine eşit veya daha büyük farkları oluşturan grupların ortalamalarının, kabul edilen anlam düzeyinde istatistiksel olarak anlamlı derecede farklı olduğuna karar verilir. Kritik D = t !

2!G .Y.K .O. G.İ.K.O. n

Burada, t değeri olarak, kabul edilen anlam düzeyi ve ( N ! k ) serbestlik derecesine karşılık gelen kuramsal t değeri alınır. Eğer gruplar eşit sayıda denek içermiyorsa, karşılaştırılan iki grup ortalamasına ilişkin kritik D değeri aşağıdaki gibi hesaplanır. 177


Kritik D = t !

G .Y.K .O. G .Y.K .O. G.İ.K.O. + G.İ.K.O. ni nj

Örnek 1. 4 Ayrı klinikten rastgele seçilen 40 hastanın klinikte kalış sürelerine ilişkin bilgiler aşağıda verilmektedir. Klinikte kalış süresi açısından klinikler arasında istatistiksel olarak anlamlı bir fark olup olmadığını sınayınız. Tablo 3. Dört ayrı klinikte hastaların kalış süreleri. Klinik adı 1 2 3 4

1

2

3

4

8 6 8 10

7 7 7 12

8 5 9 10

6 5 6 11

Hasta no 5 6 9 6 8 9

7 6 7 8

7

8

9

10

5 8 6 12

8 6 9 11

9 5 8 10

7 6 7 9

Çözüm : x1. x 2 . x 3 . x 4 . ile grup ortalamalarını (kliniklerde ortalama kalış sürelerini) ve x.. ile anayığın ortalamasını ( toplam 40 hastanın ortalama kalış süresi) gösterelim. Sonuçlar aşağıdaki tabloda verilmektedir. Tablo 4. Kliniklere İlişkin Ortalama Kalış Süreleri. Klinik adı 1 2 3 4 Toplam

Ortalama süre (gün) 7.400 6.000 7.500 10.200 7.775

Hipotezler:

H 0 : x1. = x 2 . = x3 . = x 4 .

H1 : En az iki klinik ortalaması birbirinden farklıdır. Genel kareler toplamı, gruplar arası kareler toplamı ve gruplar içi kareler toplamını aşağıdaki gibi hesaplarız. 178


4

10

"" ( x

ij

! 7.775) 2 = 140.975

(G.K.T.)

i =1 j =1

4

10 # ! ( xi . " 7.775) 2 = 92.475

(G.A.K.T.)

i =1

G.K.T. = G.I.K.T. + G.A.K.T. G.I.K.T. = 140.975 - 92.475 = 48.500 Varyans analizi tablosu aşağıdaki gibi kurulur. Tablo 5. Varyans analizi tablosu

F

Değişim kaynağı

Kareler toplamı

Serbestlik derecesi

Kareler ortalaması

değeri

Anlam düzeyi

Gruplar arası Gruplar içi (hata)

92.475

3

30.8250

22.8807

p < 0.001

48.500

36

1.3472

Toplam

140.975

39

Hesaplanan F değeri (22.8807), (3 ; 36) serbestlik dereceli ve p=0.001 anlam düzeyine karşılık gelen kuramsal F=6.7436 değerinden büyük olduğundan H1 hipotezi kabul edilir. Çoklu karşılaştırma: 0.05 anlam düzeyinde 36 serbestlik dereceli kuramsal t değeri 2.03 değerine eşittir (Student't tablosu). Kritik D = t !

2 !·GG.İ.K.O. .Y.K .O. 2 ! 1.3472 = 2.03 ! n 10 179


Kritik D = 1.0537 Grupların ikişerli mutlak farklarının kritik D değeri ile karşılaştırılması aşağıdaki gibidir. |G1 - G2| = | 7.40 - 6.00 | = 1.40 > 1.0537 |G1 - G3| = | 7.40 - 7.50 | = 0.10 < 1.0537 |G1 - G4| = | 7.40 - 10.2 | = 2.80 > 1.0537 |G2 - G3| = | 6.00 - 7.50 | = 1.50 > 1.0537 |G2 - G4| = | 6.00 - 10.2 | = 4.20 > 1.0537 |G3 - G4| = | 7.50 - 10.2 | = 2.70 > 1.0537

180

anlamlı anlamlı değil anlamlı anlamlı anlamlı anlamlı.


Bölüm 13

Parametrik Olmayan Testler (Sıra İstatistik Testleri)

Bu bölümde, “Mann-Whitney U testi” ve “Wicoxon işaretli sıra testi” incelenecektir. Literatürde, “parametrik olmayan istatistik yöntemler”, “sıra istatistik testleri” olarak da ifade edilir. (X) rastlantısal değişkeni normal dağılıma sahip değilse veya sıralamalı ölçüm düzeyinde incelendiyse, parametrik testler (bağımsız gruplarda (t) testi, eşlendirilmiş serilerde t testi, tek yönlü varyans analizi, … ) yerine parametrik olmayan istatistik testler kullanılır. Yine, parametrik olmayan testlerde, (X) değişkeninin değerleri yerine, (X)’in sıra değerleri ve karşılaştırmalarda aritmetik ortalamalar yerine ortancalar kullanılır. “Spearman sıra ilişki katsayısı” ile sıralamalı ölçüm düzeyinde incelenen iki değişken arasındaki ilişkinin incelenmesini “korelasyon ve regresyon” bölümünde görmüştük.

13.1. MANN WHITNEY U TESTİ (Wilcoxon Rank Sum Test) İki bağımsız örneklem grubuna ait aritmetik ortalamanın karşılaştırılmasında Student’t testinin (büyük örneklemlerde ! testi) kullanıldığını “Ortalamaların karşılaştırılması” bölümünde incelemiştik. Student’t testinin kullanılabilmesi için, incelenen (X) sürekli değişkenin aşağıda belirtilen koşulları sağlaması gerektiğini hatırlayalım. 181


(a) İncelenen (X) rastlantısal değişkeni her iki örneklem grubunda normal dağılıma sahip olmalı. (b) Her iki grupta varyanslar ya da standart sapmalar eşit olmalı. (c) Gözlemler, her iki grupta da birbirinden bağımsız olmalı. (d) Örneklemler basit rastlantısal örnekleme yöntemiyle seçilmiş olmalı. (e) (X) rastlantısal değişkeni sürekli olmalı. Grupların karşılaştırılmasında, incelenen (X) rastlantısal değişkeni normal dağılıma sahip değilse veya (X) değişkeni sıralamalı ölçüm düzeyinde incelendiyse, “bağımsız gruplarda (t) testi” yerine “Mann – Whitney U testi” kullanılır. Mann-Whitney U testinin kullanılabilmesi için de aşağıda belirtilen koşulların sağlanmış olması gerekir. (a) Ölçüm düzeyi en azından sıralamalı olmalı (b) Gözlemler, her iki grupta da birbirinden bağımsız olmalı. (c) Örneklemler basit rastlantısal örnekleme yöntemiyle seçilmiş olmalı. İki bağımsız grubun ortancalarının karşılaştırıldığı Mann – Whitney U testinde hipotezler aşağıdaki gibi kurulur.

H 0 : !1 = ! 2 H1 : !1 " ! 2 ( n1 ) ve ( n2 ) büyüklüklü örneklemler tek bir grup gibi göz önüne alınarak, (X) değişkenine ait gözlem değerleri küçükten büyüğe doğru sıraya dizilir. En küçük değere 1 sıra numarası, 2. büyük değere 2 sıra numarası, ... ve en büyük değere ( n1 + n2 ) sıra numarası verilir. (X)’in eşit değerleri için, karşılık gelen sıra değerlerinin aritmetik ortalaması kullanılır. 1. grupta sıra değerleri toplamı ( R1 ) ve 2. grupta sıra değerleri toplamı ( R2 ) ise, ( U1 ) ve ( U 2 ) değerleri aşağıdaki gibi hesaplanır. 182


n1 ! (n1 + 1) 2 n2 ! (n2 + 1) U 2 = R2 2 U test değeri olarak, U1 ve U 2 değerlerinden küçük olanı alınır. n1 ! 20 ve n2 ! 20 ise, hesaplanan U değeri Tablo X ve Tablo XI’de verilen kritik U değeri ile karşılaştırılarak, H 0 ve H1 hipotezlerinden hangisinin kabul edileceğine karar verilir. U hesap ! U kritik ise, H1 hipotezi kabul edilir.

U1 = R1 -

n1 > 20 veya n2 > 20 ise, hipotezler aşağıdaki ifade ile karşılaştırılır. n !n U" 1 2 2 != n1 + n2 + 1 n1 ! n2! ! 12 Normal alanlar tablosu (Tablo III) kullanılarak, hesaplanan ! test değerine karşılık gelen istatistiksel anlamlılık değeri (p) bulunur. Diğer bir ifadeyle, hesaplanan ! ! 1.96 ise, H1 hipotezi kabul edilir. Örnek 1. Kontrol ve deney gruplarında, (X) rastlantısal değişkeni ölçülmüş ve aşağıdaki sonuçlar elde edilmiştir. Kontrol ve deney gruplarına ait ortanca değerlerinin aynı olup olmadığını sınayınız.

Tablo 1. Kontrol ve deney gruplarında (X) sonuçları. Kontrol grubu 3 8 2 16 5

n1 = 5

Deney grubu 1 14 4 7 23 10

183

n2 = 6


Çözüm : 1.grupta ortanca !1 =5 ve 2. grupta ortanca ! 2 =8.5 olarak hesaplanır. (X) değerleri, hangi grupta olduklarına bakılmaksızın, sıraya konur ve her bir grup için, (X)’in sıra değerleri toplamları ( R1 , R2 ) hesaplanır (Tablo2). Tablo 2. (X)’e ait sıra değerleri. Kontrol grubu

Deney grubu

n1 = 5

n2 = 6

(X) 3 8 2 16 5

Sıra (X) 3 7 2 10 5

(X) 1 14 4 7 23 10

R1 =27

Sıra (X) 1 9 4 6 11 8 R2 =39

( U1 ) ve ( U 2 ) değerleri aşağıdaki gibi hesaplanır.

U1 = R1 -

n1 ! (n1 + 1) 5 ! (5 + 1) = 27 = 12 2 2

n2 ! (n2 + 1) 6 ! (6 + 1) = 39 = 18 2 2 Hesaplanan U = 12 değeri ( U1 ve U 2 ’den küçük olan) ! =0.05 için kritik U = 5 (Tablo X) değerinden büyük olduğundan H 0 : !1 = ! 2 hipotezi

U 2 = R2 -

kabul edilir.

13.2. WILCOXON İŞARETLİ SIRA TESTİ Eşlendirilmiş serilerde (“önce” ve “sonra” serilerinde), (X) rastlantısal değişkeni normal dağılıma sahip değilse veya (X) değişkeni sıralamalı ölçüm düzeyinde incelendiyse, “eşlendirilmiş serilerde (t) testi” yerine “Wilcoxon işaretli sıra testi ” kullanılır. 184


Bağımlı gruplarda, (X)’e ait ortanca değerlerinin farklılığı (diğer bir ifadeyle fark serisinde ortanca değerinin sıfıra eşit olup olmadığı) Wilcoxon işaretli sıra testi ile sınanır. Hipotezler aşağıdaki gibi kurulur.

H0 : ! = 0 H1 : " ! 0 (X)’in deney öncesi ve deney sonrası değerlerine ait fark serisi, küçükten büyüğe doğru sıraya konarak numaralandırılır. Sıraya konma ve numaralandırma işleminde farkın işareti göz önüne alınmaz. Daha sonra negatif farklara ait sıra numaraları toplamı ile pozitif farklara ait sıra numaraları toplamı hesaplanır. Farklar serisinde bir tane sıfır değeri varsa, bu gözlem değeri değerlendirmeden çıkarılır ve gözlem sayısı (n-1) olur. Farklar serisinde sıfır değerleri birden çok ise, yarısına (-), diğer yarısına da (+) işareti verilir. Negatif ve pozitif işaretli fark sayının küçük olanına ait sıra numaraları toplamı T hesaplanır.

n ! 20 ise, hesaplanan sıra numaraları toplamı Tablo XII’de verilen kritik değerle karşılaştırılarak gruplar arasındaki farklılığın anlamlılığı sınanır. n > 20 ise, gruplar arasındaki anlamlılık aşağıdaki ifade ile belirlenir.

T"

#=

n ! (n + 1) 4

1 ! n ! (n + 1) ! (2n + 1) 24

! ! 1.96 ise, H1 hipotezi kabul edilir. Örnek 2. Belli bir tedaviden önce ve sonra ölçülen (X) değerleri aşağıdaki tabloda (Tablo 3) verilmektedir. Fark serisine ait ortanca değerinin sıfıra eşit olup olmadığını ( tedavinin etkinliğini) sınayınız.

185


Tablo 3. Tedavi öncesi ve sonrası (X) değerleri. Tedavi öncesi 8 12 14 2 25 14 13 16 18 22

Tedavi sonrası 10 11 17 6 18 4 20 16 10 12

Çözüm : (X)’e ait fark serisi hesaplanır (Tablo 4). Negatif fark sayısı 5, pozitif farkların sayısı 4 ve sıfır fark sayısı 1’dir. Toplam gözlem çifti sayısı bir eksiltilir (n=10 – 1 = 9). Geriye kalan 9 fark değeri, işaret göz önüne alınmaksızın, sıraya konarak numaralandırılır. Daha sonra sıra numaralarına farkların işareti konur. İşaret sayısı az olan pozitif farklara ait işaretli sıra numaraları toplamı ( T =14) hesaplanır. Hesaplanan T =14 değeri, Tablo XII’de ! =0.05’e karşılık gelen kritik T =6 değerinden büyük olduğundan H 0 : ! = 0 hipotezi kabul edilir. Tablo 4. Tedavi öncesi ve sonrası farklara ait sıra numaraları Tedavi öncesi Tedavi sonrası 8 12 14 2 25 14 13 16 18 22

10 11 17 6 18 4 19 16 10 11

Farklar (X) +2 -1 +3 +4 -7 -10 +6 0 -8 -11 186

Sıra no

İşaretli sıra no

2 1 3 4 6 8 5 -7 9

+2 -1 +3 +4 -6 -8 +5 --7 -9


Bölüm 14

Araştırma Planlaması

Çalışma planlamasında ve istatistiksel çözümlemede yer alan önemli kavramları aşağıdaki gibi sıralayabiliriz. 1. Araştırma tipleri. 2. Rastlantısallık (randomizasyon). 3. Körleme. 4. Genelleme. 5. Güven aralığı. 6. Hipotez testleri, hipotezlerin sınanması. 7. p değeri. ................... Genelleme, güven aralığı, hipotezlerin kurulması, hipotez testleri “p değeri” kavramları daha önceki bölümlerde açıklanmıştı. Bu bölümde; araştırma tipleri, randomizasyon ve körleme kavramlarını açıklamaya çalışacağız.

14.1. ARAŞTIRMA TİPLERİ Araştırmaları, amaçlarına ya da yapılış tarzlarına göre aşağıdaki gibi sınıflayabiliriz. Gözlemsel / Deneysel Gözlemsel çalışmalarda bireylere (deneklere) bir işlem veya girişim yapılması söz konusu değildir. Bu tür çalışmalarda, sadece gözlem sonucu elde 187


edilen bireysel özellikler kaydedilir. Deneysel araştırmalarda ise bireylerin bir kısmına veya tümüne bir girişimde (tedavi,…) bulunulmakta ve girişim öncesi ve sonrası bireylerde ortaya çıkan değişiklikler kaydedilmektedir. Tanımlayıcı / Çözümleyici Tanımlayıcı araştırmalarda bireyleri tanımaya yönelik, çözümleyici araştırmalarda ise neden–sonuç ilişkilerini belirlemeye yönelik veriler toplanmaya çalışılır. Tanımlayıcı araştırmalarda “kim”, “nerede” ve “ne zaman” sorularına yanıt aranırken, çözümleyici araştırmalarda ise “neden”, “niçin” sorularına yanıt aranır. Tanımlayıcı araştırmalarla elde edilen verilere dayanılarak hipotezler kurulur. Kurulan bu hipotezlerin sınanması, şüphelenilen etyolojik neden ile hastalık arasında bir ilişkinin bulunup bulunmadığının araştırılması çözümleyici araştırmalarla gerçekleştirilir. Retrospektif / Prospektif Retrospektif araştırmalarda incelenen veriler araştırmanın başlama tarihinden önceki dönemle ilgilidir. Sağlıklı kişilerle hastalıklı kişilerin geçmişteki bilgileri karşılaştırılarak hastalık nedenleri araştırılır. Burada, klinikte tutulan hasta dosyalarının içeriği ve kalitesi çok önemlidir. Prospektif çalışmalarda ise, bireylerin ileriye dönük olarak izlenmesi ve bu izleme sonucunda ortaya çıkan değişikliklerin kaydedilmesi söz konusudur. Sağlık alanında sıklıkla kullanılan araştırma tipleri aşağıdaki gibidir. 14.1.1. VAKA SERİLERİ Hasta grubuna ait basit tanımlayıcı istatistikler elde edilir. İncelenen hastalıkla ilgili olarak, “kim”, “nerede” ve “ne zaman” sorularına yanıt aranır. Çalışmada elde edilen sonuçlara dayanılarak çeşitli hipotezler kurulur.

14.1.2. KESİTSEL ARAŞTIRMALAR Bu tür araştırmalarda bir olay çok kısa bir süre içerisinde anket veya genel tarama yöntemi ile incelenir. Gerekli veriler toplandıktan sonra neden– sonuç ilişkileri belirlenmeye çalışılır. Genellikle hastalıklara ait prevalans (hastalığın toplumda görülme sıklığı) değerleri bu tür çalışmalarla elde edilir (Şekil 1). 188


Şekil 1. Kesitsel araştırma

14.1.3. KOHORT TİPİ ARAŞTIRMALAR İzlemeye alınacak bireylerin oluşturduğu kohort, etkenle karşılaşacak ve karşılaşmayacak iki gruba rastlantısal olarak ayrılır. Her iki grup belirli bir süre izlenerek hastalık gelişimi ile ilgili bilgiler toplanır (Şekil 2).

Şekil 2. Kohort Çalışması. Bu tür araştırmalarda, hastalık insidansı (incelenen sürede, hastalık görülme sıklığı), göreceli risk oranı (relatif risk, (RR) ), etkene atfedilen risk 189


hesaplanabilir. Rastlantısal olarak oluşturulan gruplar, izlem altında olduklarından, bu tür araştırmalarda hastalık gelişimi ile ilgili daha doğru bilgi elde edilir. İzleme sonuçlarını aşağıdaki gibi, 2x2 tablosunda gösterebiliriz (Tablo 1). Tablo 1. Kohort araştırma tipinde sonuçlar. Hastalık gelişenler (D+)

Hastalık gelişmeyenler (D-)

Toplam

b

( a + b)

Etkene maruz kalanlar (E + ) Etkene maruz kalmayanlar (E -)

a c

d

(c + d )

Toplam

(a + c)

(b + d )

(a + b + c + d )

Etkene maruz kalan ve etkene maruz kalmayan gruplarda, ortaya çıkan hastalık insidansları karşılaştırılarak, etken ile hastalık arasında bir ilişkinin var olup olmadığı araştırılır. 14.1.3.1. KOHORT TİPİ ARAŞTIRMALARDA RİSK ÖLÇÜTLERİ Hastalık insidansı; incelenen süre içerisinde ortaya çıkan yeni olguların sıklığını gösterir. İzleme periyodunda ortaya çıkan olgular

I =  Risk altındaki nüfus (izlenen hasta sayısı) Etkene maruz kalan grupta hastalık insidansı I E + = kalmayan grupta ise, I E ! =

a , etkene maruz a+b

c ile hesaplanır. c+d

Etken–hastalık arasındaki ilişki, etken varlığının hastalık oluşumuna katkısını gösteren risk değeri, “Relatif Risk” ( RR ) ile gösterilir. RR değeri, 190


etkene maruz kalan gruptaki hastalık insidansının, etkene maruz kalmayan gruptaki insidansa bölünmesiyle elde edilir. Etkene maruz kalan grubun insidansı

RR =  Etkene maruz kalmayan grubun insidansı

RR =

I E+ I E!

a P( D + / E +) = = a+b c P ( D + / E !) c+d

RR ’in güven aralığı aşağıdaki ifade ile hesaplanır.

e

ln ( RR ) ±"

1 1 1 1 ! + ! a a +b c c + d

% 95 güven aralığı için ! değeri 1.96 , % 99 için 2.58 olarak alınır (Tablo III).

RR 'nin 1'e yakın değerler alması (“1” değerinin RR ’nin güven aralığı içinde yer alması) hastalık ile etken maruziyeti arasında bir ilişkinin istatistiksel olarak anlamlı olmadığını, RR 'nin 1'den küçük olması veya 1'den büyük olması ise hastalık ile maruziyet arasında bir ilişki olduğunu gösterir. RR , sadece kohort çalışmalarında veya deneysel çalışmalarda hesaplanabilir. Olgu-kontrol çalışmalarında insidans değeri hesaplanamadığından RR direkt olarak hesaplanamaz. Bu tür çalışmalarda RR ’nin tahmin değeri için OR değeri hesaplanır. Etken varlığı ile hastalık insidansları arasındaki ilişkileri göstermek için

RR ile birlikte “Etkene Atfedilen Risk” ( AR ) ve “Yüzde Etkene Atfedilen Risk” (% AR ) değerleri kullanılır. Hesaplamalarda, etkene maruz kalan grup yerine toplum değerlerini kullanırsak, “Toplumda Etkene Atfedilen Risk” ( TAR ) ve “Toplumda Yüzde Etkene Atfedilen Risk” ( %TAR ) değerlerini elde ederiz. 191


Etkene atfedilen risk ( AR ), etkene maruz kalan grubun insidansının ne kadarının etken ile açıklanabileceğini gösterir. Diğer bir ifade ile, etken ortadan kaldırıldığında hastalığın ne kadarının önlenebileceği anlaşılır. AR değerini aşağıdaki ifade ile hesaplarız.

AR = etkene maruz kalan grubun insidansı - etkene maruz kalmayan grubun insidansı veya, AR = I E + ! I E ! =P(D+ | E+) - P(D+ | E-)

AR değeri sadece kohort çalışmalarında hesaplanabilir. Etkene Atfedilen Yüzde Risk (% AR ) % AR , etkene atfedilen riskin etkene maruz grup insidansı içindeki oransal büyüklüğüdür.

% AR =

AR AR = I E + P( D + / E +)

Eğer RR ≥ 1 ise,

% AR =

RR ! 1 RR

Toplumda Etkene Atfedilen Risk ( TAR ) Toplumdaki hastalık insidansının ne kadarının açıklanabileceğini gösterir ve aşağıdaki ifade ile hesaplanır.

TAR = AR ! P( E +) Toplumda Yüzde Etkene Atfedilen Risk ( %TAR )

%TAR =

TAR AR ! P( E +) = P( D +) P( D +) 192

etken

ile


veya

%TAR =

P( E +) " ( RR ! 1) 1 + P( E +) " ( RR ! 1)

ifadesi ile hesaplanır. Örnek 1. (E) etkeni ile (D) hastalığı arasındaki ilişkiyi, etken varlığının hastalık gelişimi üzerindeki etkisini araştırmak amacıyla kohort tipi (prospektif, izlemeli, ileriye yönelik) bir araştırma planlanmıştır. Toplumda etkene maruziyet sıklığının P(E+) = 0.50 olduğu varsayımıyla, 200 kişilik bir kohort grubu rastlantısal olarak iki gruba ayrılmıştır. Her iki grup uygun bir süre izlem altında tutularak (D) hastalığının gelişip gelişmediğine bakılmıştır. Sonuçlar Tablo 2’de verilmektedir. Etken (E) ile ilgili hastalık (D) risklerini hesaplayınız. Tablo 2. Araştırma sonuçları.

Etkene maruz kalanlar (E + ) Etkene maruz kalmayanlar (E -) Toplam

Hastalık gelişenler (D+) 30

Hastalık gelişmeyenler (D-) 70

Toplam

10

90

100

40

160

200

100

Çözüm . Toplumda etkene maruziyet sıklığı, P(E+) = (D) hastalığı insidansı, P(D+)=

100 =0.50 200

40 =0.20 200

Etkene maruz kalan grupta hastalık insidansı, I E + =

193

a 30 = =0.30 a + b 100


Etkene

I E! =

maruz

kalmayan

grupta

hastalık

c 10 = =0.10 c + d 100

Relatif risk, RR =

I E + 0.30 = =3 I E ! 0.10

RR ’nin %95 güven aralığı ,

e

e

ln( RR ) ±"

1 1 1 1 ! + ! a a +b c c + d

ln( 3) ± (1.96 )

1 1 1 1 ! + ! 30 100 10 100

e ln(3)±(1.96 )!( 0.33665) (1.551 - 5.804) Etkene atfedilen risk, AR = I E + ! I E ! = 0.30 – 0.10 = 0.20 Etkene Atfedilen Yüzde Risk, (% AR )=

(Eğer RR =3 ≥ 1 ise, % AR =

AR 0.20 = = 0.67 I E + 0.30

RR ! 1 3 ! 1 = =0.67) RR 3

Toplumda Etkene Atfedilen Risk ( TAR ) = AR ! P ( E +) = (0.20) ! (0.50)

TAR = 0.10 194

insidansı,


Toplumda Yüzde Etkene Atfedilen Risk,

TAR AR ! P( E +) = P( D +) P( D +) (0.20) ! (0.50) 0.10 =0.50 , %TAR = = 0.50 %TAR = (0.20) 0.20

( %TAR )=

%TAR =

P( E +) " ( RR ! 1) (0.50) " (3 ! 1) = = 0.50 1 + P( E +) " ( RR ! 1) 1 + (0.50) " (3 ! 1)

14.1.4. VAKA KONTROL ARAŞTIRMALARI Vaka – kontrol araştırmalarında “geçmişte ne oldu ?” sorusuna yanıt aranır. Nedensellik ilişkisinin araştırıldığı bu araştırma tipinde, söz konusu hastalığı taşıyan (vaka grubu) ve taşımayan (kontrol grubu) iki grubun geçmiş bilgileri incelenir (Şekil 3). Araştırma veri tabanını, genellikle, klinikteki hasta dosyaları oluşturur. Araştırmanın yapılabilmesi için hastalık ve etkene ait bilgilerin, daha önceden, dosyalarda kaydedilmiş olması gerekir. Nadir görülen hastalıkların nedenlerinin araştırılmasında, uygun bir araştırma türüdür. Grupların karşılaştırılabilir olması için, her iki grubun hastalık varlığı dışındaki değişkenler açısından homojen (benzer) olması gerekir.

Şekil 3. Vaka kontrol çalışması. 195


Araştırma sonucunda elde edilen bulgular aşağıdaki gibi (Tablo 3) özetlenir. Tablo 3. Vaka – Kontrol araştırma sonuçları D+ (Olgular)

14.1.4.1.

D- (Kontroller)

Toplam

b

( a + b)

c

d

(c + d )

(a + c)

(b + d )

(a + b + c + d )

a

E+ (Etken var) E– (Etken yok) Toplam

VAKA KONTROL ARAŞTIRMALARINDA RİSK ÖLÇÜTLERİ

Olgu ve kontrol gruplarına ait, etkenin görülme sıklıkları karşılaştırılarak, hastalık ile etken arasındaki ilişkinin varlığı araştırılır. Etken görülme sıklığı, olgu grubunda

a , kontrol grubunda ise, a+c

b ile hesaplanır. b+d

Hastalık – etken arasındaki ilişki, etken varlığının hastalık oluşumuna katkısını gösteren risk değeri, “Göreli Orantı” gösterilir.

(Odds oranı, ( OR =

a!d )) ile b!c

Bir olayın (A) ve (B) ile gösterilen iki sonucu varsa, verilen bir sonuca ait Odds değeri aşağıdaki ifade ile hesaplanır.

O=

P( A) P( A) = 1 ! P( A) P( B)

A ile hastalık varlığını (olgular, D + ), B ile hastalık yokluğunu (kontroller, D ! ) gösterirsek, olgu-kontrol çalışma tipinde OR oranı aşağıdaki ifade ile hesaplanır.

OR =

OE + / D+ OE + / D! 196


Olgularda etken varlığına ait odds değeri (olasılık oranı) OR =  Kontrollerde etken varlığına ait odds değeri (olasılık oranı)

a /(a + c) P( E + / D +) / P( E ! / D +) c /(a + c) a ! d = = OR = P( E + / D !) / P( E ! / D !) b /(b + d ) b ! c d /(b + d ) Hesaplanan OR değeri etken varlığının hastalık oluşumuna katkısını dolaylı olarak gösterir. Etkenin var olduğu grupta hastalık görülmesinin odds değeri (olasılık oranı), etkenin olmadığı gruba göre OR kat fazladır. OR değeri, kohort çalışmalarında hesaplanan RR ’in tahmin değeri olarak kullanılır.

OR ’in güven aralığı aşağıdaki ifade ile hesaplanır.

e

ln ( OR ) ±!

1 1 1 1 + + + a b c d

Örnek 2. Örnek 1’de verilen araştırmanın retrospektif (geriye dönük) olarak planlandığını varsayalım. 100 kişilik hasta grubu ile 100 kişilik kontrol grubunun geçmişteki bilgileri incelenerek etkene maruz kalıp kalmadıkları incelenmiştir. Sonuçlar Tablo 4’te verilmektedir. OR değerini hesaplayınız. Tablo 4. Araştırma sonuçları E + (Etken var) E - (Etken yok) Toplam

D+ (Olgular) 30 10 40

D- (Kontroller) 70 90 160

Toplam 100 100 200

Çözüm : Olgu grubunda etken görülme sıklığı P(E+|D+) = 197

30 a = = 0.75 a + c 40


Kontrol grubunda etken görülme sıklığı P(E+|D-) =

70 b = =0.44 b + d 160

Göreli Orantı (Odss oranı), OR =

a ! d 30 ! 90 = = 3.86 b ! c 70 ! 10

OR ’in % 95 güven aralığı,

e e

ln ( OR ) ±!

1 1 1 1 + + + a b c d

ln( 3.86 ) ± (1.96 )

1 1 1 1 + + + 30 70 10 90

e ln(3.86 )±(1.96 )!( 0.39841)

! 1.768 - 8.426

14.1.5. PARALEL KONTROLLÜ KLİNİK ÇALIŞMA Kliniğe gelen hastalardan uygun olanlar (çalışma protokolünde belirtilen kabul edilme kriterlerine uyan hastalar) rastlantısal olarak iki gruba (veya ikiden çok gruba) ayrılırlar. Bunlardan biri deney grubunu diğeri ise kontrol grubunu oluşturur (Şekil 4). Deney grubunda yeni bir ilaç veya tedavi yöntemi, kontrol grubunda ise plasebo veya geleneksel tedavi yöntemi uygulanır. Her iki grupta elde edilen tedavi sonuçları karşılaştırılarak ilaç (tedavi) etkinliği, yan etki varlığı, gibi sonuçlar değerlendirilir. Grupların karşılaştırılabilir olması için hastaların gruplara alınma işleminin rastlantısal (randomize) olması gerekir.

198


Yine, yan tutma ile oluşacak hataları (bias) en aza indirgeyebilmek için, hastaların hangi kolda yer aldıklarını, hem kendilerinin hem de uygulayıcıların (hekim, hemşire,…) bilmemeleri, gerekir (çift kör).

Şekil 4. Paralel kontrollü klinik çalışma. 14.1.6. DIŞ KONTROLLÜ KLİNİK ÇALIŞMA Bu tür çalışmalarda kontrol grubu yoktur. Karşılaştırma için, daha önce yapılmış çalışmaların sonuçları kullanılır (Şekil 5). Rastlantısallık ve körleme sağlanamadığından sağlıklı karşılaştırmalar yapmak oldukça güçtür.

Şekil 5. Dış kontrollü klinik çalışma 199


14.1.7. ÇAPRAZ KONTROLLÜ KLİNİK ÇALIŞMA Kabul edilme kriterlerine uyan hastalar, rastlantısal olarak deney ve kontrol gruplarına atanır. Her iki grupta, uygulamadan sonra uygun bir arınma süresi (geçiş dönemi) geçirilir. Daha sonra deney grubu kontrol, kontrol grubu da deney grubu olarak işlem görür (Şekil 6). Bireylerin hem deney hem de kontrol grubunda yer alması bireysel farklılıkların kontrol altında tutulmasını sağlar.

Şekil 6. Çapraz kontrollü klinik çalışma.

14.2.

RASTLANTISALLIK (RANDOMİZASYON)

Dahil edilme kriterlerini sağlayan bireylerin, eşit olasılıkla gruplara ayrıştırılmasına olanak sağlar. Randomizasyon için en sık başvurulan yöntem “rastlantısal sayılar” yöntemidir. Randomizasyon işlemi ile, grupların homojen (benzer) olması, dolayısıyla karşılaştırılabilir olması sağlanır. Örnek 3. Çalışma protokolünde belirtilen, dahil edilme kriterlerini sağlayan 20 bireyi kontrol ve deney gruplarına rastlantısal olarak atayınız. 200


Çözüm : Rastlantısal sayılar tablosunda (Tablo I) verilen sayıların (0,1) aralığında düzgün dağılıma sahip olduğunu hatırlayalım. Rastlantısal sayı 0.00000– 0.49999 arasında ise, “A” grubuna (kontrol grubu), 0.50000– 0.99999 arasında ise, “B” grubuna (deney grubu) atama yapılır. Rastlantısal sayının her iki aralıkta yer alması olasılığı birbirine eşittir. Dolayısıyla, bireyin gruplara atanması eşit olasılıkla yapılır. Grup sayısı üç ise aralık üçe, dört ise dörde bölünür. Başlangıç rastlantısal sayısı olarak, Tablo I ’de, 2. satır ve 3. sütuna karşılık gelen sayıyı ele alalım (32248). Bu sayı (0,1) aralığında 0.32248 olarak gösterilir. Sayı 0.00000-0.49999 arasında olduğundan 1. hasta “kontrol” grubuna atanır. Bir sonraki rastlantısal sayıyla atama işlemine devam edilir (Tablo 5). Tablo 5. Bireylerin gruplara atanması. Hasta no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Rastlantısal sayı 32248 25632 88736 29183 60758 65842 93100 25643 88310 38211 43221 87930 03438 58385 23898 59763 38820 50475 02568 96675 201

Grup Kontrol Kontrol Deney Kontrol Deney Deney Deney Kontrol Deney Kontrol Kontrol Deney Kontrol Deney Kontrol Deney Kontrol Deney Kontrol Deney


14.3.

KÖRLEME

Uygulayıcıların, bireylere hangi yöntemin uygulandığını bilmemesi, aynı şekilde, bireylerin de hangi grupta yer aldığını bilmemesine körleme diyoruz. Körleme (farkına vardırmama), yan tutmalardan oluşabilecek hataları önlemek amacıyla yapılır. Tablo 6. Körleme tipleri.

Denek

Tek kör

Çift kör

Üç kör

XXXXX

XXXXX

XXXXX

XXXXX

XXXXX

Uygulayıcı. Gözlemci Veri analizci, istatistikçi

XXXXX

Tek kör çalışmalarda, sadece, hastalar hangi grupta yer aldığını bilmemektedir. Çift kör çalışmalarda ise hastaların yanında, uygulayıcılar da hastaların hangi grupta yer aldığını bilmemektedir. Çalışma sonuçlarının istatistiksel değerlendirmesi aşamasında, veri analizci de hastaların hangi grupta yer aldığını bilmiyorsa üç kör çalışmadan söz edilir. Araştırma tipi, rastlantısallık ve körleme işlemlerine ilişkin bilgiler araştırma protokolünde mutlaka belirtilmelidir.

202


Bölüm 15

Tanı Testlerinin Değerlendirilmesi

Klinik çalışmalarda, özellikle saha taramalarında, riskli olmayan, ekonomik ve kullanımı basit tanı yöntemlerine ihtiyaç duyulur. Bir tanı testinin sonuçlarının değerlendirilmesi, ya tanı testinin gerçekten hasta olan ve olmayan kişilere uygulanmasıyla ya da gerçeği yansıttığı kabul edilen temel tanı testi sonucuna göre yapılır.

15.1. TANI TESTLERİ DEĞERLENDİRME ÖLÇÜTLERİ Tanı testinin değerlendirilmesinde genellikle aşağıda tanımlanan ölçütler kullanılır. Duyarlılık (sensitivity) : Hastalığın gerçekten var olduğu bilinen kişilerden yüzde kaçının önerilen yeni yöntemle tanınabildiğini gösterir. Seçicilik (özgüllük, özgü değer, specificity) : Hastalığı taşımayanların (sağlam olanların) yüzde kaçının önerilen yöntemle tanınabildiğini gösterir. Genel doğruluk (accuracy) : Hasta ve sağlam kişilerin yüzde kaçının önerilen yöntemle tanınabildiğini gösterir. Artı yorum gücü (positive predictive value) : Önerilen yöntemle artı bulguların ne oranda hastalık varlığını gösterdiğini (bilinen yönteme uyumu) belirtir. 203


Eksi yorum gücü (negative predictive value) : Önerilen yöntemle eksi bulguların ne oranda hastalık olmadığına işaret ettiğini gösterir. Deneklere ait test sonuçları ve gerçek duruma ait bilgiler (2 x 2) tablosunda (Tablo 1), aşağıdaki gibi özetlenebilir. Tablo 1. Gerçek durum ve test sonuçları. Test Sonucu (+)

Gerçek durum Hasta (+) Sağlam (-)

a c

(-)

( a + b) (c + d ) (a + b + c + d )

b d (b + d )

(a + c)

Toplam

Toplam

Test sonuçlarını doğru pozitif ( DP ), yanlış pozitif ( YP ), doğru negatif ( DN ) ve yanlış negatif ( YN ) simgeleriyle de gösterebiliriz (Tablo 2). Tablo 2. Gerçek durum ve test sonuçları. Test Sonucu (+) (-) Toplam

Gerçek durum Hasta (+) Sağlam (-)

Toplam

DP YP YN DN ( DP + YN ) (YP + DN )

( DP + YP) (YN + DN ) ( DP + YP + YN + DN )

Tanımlarımızı aşağıdaki gibi ifade edebiliriz.

DP a = a + c ( DP + YN ) DN d Seçicilik = = b + d (YP + DN ) Duyarlılık =

204


Toplam doğruluk =

a+d DP + DN = a + b + c + d DP + YP + YN + DN

Artı yorum gücü =

a DP = a + b DP + YP

Eksi yorum gücü =

d DN = c + d YN + DN

“Artı yorum gücü” ve “Eksi yorum gücü” değerlerinin kullanılabilmesi için, çalışmada elde edilen (hasta sayısı/toplam denek sayısı) yüzdesinin, hastalığın toplum içindeki görülme sıklığını (hastalığın prevalansını) temsil ediyor olması gerekir (Şekil 1).

Şekil 1. Hasta sayısının çalışma grupları ve toplum içindeki yeri. Prevalans değerini çalışma gruplarından veya toplum verilerinden aşağıdaki gibi hesaplarız.

205


( A) ile toplumdaki hasta sayısını ve (B) ile toplumdaki sağlam kişileri A gösterirsek, hastalığın toplumdaki prevalansı, P ( D + ) = ifadesi ile A+ B hesaplanır.

Prevalansı çalışma gruplarından hesaplamak istersek,

P( D +) =

a+c değerini hesaplarız. a+b+c+d

A prevalans değerinin, çalışma A+ B a+c gruplarından elde edilen prevalans değerine P ( D + ) = eşit a+b+c+d Toplum için geçerli olan, P ( D + ) =

olması gerekir.

Çalışmada, sadece duyarlılık ve özgüllük değerleri hesaplanmak isteniyorsa prevalans değerinin temsil edilme şartı aranmaz. Yine, prevalans değeri temsil edilmiyorsa ve “Artı yorum gücü” ve “Eksi yorum gücü” değerlerini kullanmak istiyorsak toplumdaki prevalans değerini de hesaba katarak, “Artı yorum gücü” ve “Eksi yorum gücü” değerlerini aşağıdaki ifadelerle hesaplayabiliriz (Bayes kuralı). duyarlılık · prevalans Artı yorum gücü =  duyarlılık · prevalans + (1 - seçicilik) · (1-prevalans)

seçicilik · (1 - prevalans) Eksi yorum gücü =  seçicilik· (1 – prevalans)+ (1 – duyarlılık)· prevalans

206


Örnek 1. (X) testinin meme kanseri için tanı değerlerini hesaplamak isteyelim. (X) testinin, meme kanserli 200 hastada ve meme kanseri olmayan 500 kadında uygulandığını ve elde edilen test sonuçlarının aşağıdaki tabloda (Tablo 3) özetlendiğini varsayalım. (X) testinin tanı değerlerini hesaplayınız. Tablo 3. (X) testi sonuçları. (X) Test Sonucu

Gerçek durum Meme kanseri Hasta (+) Sağlam (-) 190 75 10 425 200 500

(+) (-) Toplam

Toplam 265 435 700

Çözüm : Tanı değerleri : Duyarlılık =

Seçicilik =

DP a 190 = = = 0.95 a + c ( DP + YN ) 200

DN d 425 = = =0.85 b + d (YP + DN ) 500

Toplam doğruluk =

615 a+d DP + DN = = =0.879 a + b + c + d DP + YP + YN + DN 700

Elde edilen tanı yüzdeleri % 95 güven aralıkları ile birlikte verilmelidir (Tablo 4). Tablo 4. (X) testinin tanı değerleri. Duyarlılık Seçicilik Toplam doğruluk

% 95.0 85.0 87.9 207

% 95 Güven Aralığı 91.0 – 97.6 81.6 – 88.0 85.2 –90.2


Çalışma gruplarından elde edilen meme kanseri prevalans değerinin, ( P( D +) =

a+c 200 = = 0.286 ) a + b + c + d 700

toplum için geçerli olduğunu söyleyemeyiz. Toplumdaki prevalans değerinin geniş çaplı araştırmalara dayanılarak tahmin edilmesi gerekir. Toplumda meme kanseri prevalansının, P ( D + ) =0.01 olduğunu varsayalım. Bu durumda çalışma gruplarından elde edilecek “Artı yorum gücü” ve “Eksi yorum gücü” değerleri geçerli olmayacaktır. Artı yorum gücü !

a DP 190 = = = 0.717 a + b DP + YP 265

Eksi yorum gücü !

d DN 425 = = = 0.977 c + d YN + DN 435

Prevalans hesaplayabiliriz.

değerini

hesaba

katarak

yorum

gücü

değerlerini

duyarlılık · prevalans Artı yorum gücü =  duyarlılık · prevalans + (1 - seçicilik) · (1-prevalans) (0.95) · (0.01) Artı yorum gücü = ———————————————— (0.95) · (0.01) + (1- (0.85)) · (1-(0.01)) Artı yorum gücü = 0.06 seçicilik · (1 - prevalans) Eksi yorum gücü =  seçicilik · (1 – prevalans)+ (1 – duyarlılık) · prevalans 208


(0.85) · (1- (0.01)) Eksi yorum gücü = ————————————————— (0.85) · (1- (0.01)) + (1- (0.95)) · (0.01) Eksi yorum gücü = 0.999

15.2. TANI KARAKTERİSTİĞİ EĞRİSİ (ROC) Bu çözümleme yönteminde, belirli bir tanım aralığında sürekli değerler alan bir değişkenin (continuous variable, sürekli değişken) tanı testi olarak kullanımı amaçlanmaktadır. ROC (receiver operator characteristics curve) çözümleme yöntemini, MIA (melanom inhibating antigen) tümör marker değişkeninin (sürekli değişken) malin melanom tanısında kullanımına ilişkin bir örnek ile açıklamaya çalışalım. Örnek 2. Malin melanom tanısı konmuş 35 hastada ve sağlıklı 20 kişide (malin melanom hastası olmayan) MIA değerlerinin ölçüldüğünü ve elde edilen değerlerin aşağıdaki gibi özetlendiğini varsayalım.

Hasta grubu (Malin melanom hastaları) 55,0

11,0

15,0

20,0

17,0

10,0

13,0

57,5

11,0

15,5

22,5

93,0

10,0

14,0

8,0

11,5

17,0

23,0

57,0

11,0

15,0

9,0

11,5

17,5

27,5

17,5

38,0

19,0

10,0

12,0

17,5

36,3

18,0

46,5

95,0

Kontrol Grubu (Malin melanom hastası olmayan) 15,0

9,6

10,8

11,5

9,6

15,7

11,7

8,0

13,5

8,2

9,0

15,1

12,8

11,6

13,7

16,4

21,2

10,4

12,0

12,7

209


Hasta grubu ve kontrol grubuna ait değerler küçükten büyüğe sıraya dizilerek sıralı değerlerden oluşan tablolar elde edilir. Hasta grubu (Malin melanom hastaları) (Sıralı değerler) 8,0

9,0

10,0

10,0

10,0

11,0

11,0

11,0

11,5

11,5

12,0

13,0

14,0

15,0

15,0

15,5

17,0

17,0

17,5

17,5

17,5

18,0

19,0

20,0

22,5

23,0

27,5

36,3

38,0

46,5

55,0

57,0

57,5

93,0

95,0

Kontrol Grubu (Malin melanom hastası olmayan) (Sıralı değerler) 8,0

8,2

9,0

9,6

9,6

10,4

10,8

11,5

11,6

11,7

12,0

12,7

12,8

13,5

13,7

15,0

15,1

15,7

16,4

21,2

Hasta ve kontrol gruplarına ait tanımlayıcı istatistikler aşağıdaki gibi elde edilir. Hasta Grubu (n=35) ar.ort.=25.21, SD = 22.08, medyan = 17.00, min. = 8, maks.=95. Kontrol Grubu (n=20) ar.ort.=12.43, SD = 3.20, medyan = 11.85, min. = 8 . maks.=21.2 . Çeşitli “pozitiflik sınır değeri” (cut-off values, kesim değerleri) için duyarlılık ve (1 – seçicilik) değerleri hesaplanır. Hasta ve kontrol grupları birlikte ele alındığında, en küçük değer 8 , en büyük değer ise 95 bulunur. 8 ile 95 arasında en az 10 pozitiflik sınır değeri belirlenir. Örneğimiz için 8,10,12,14,16,18,20,25,30 ve 40 pozitiflik sınır değerlerini kullanalım. 210


Dikkat edilirse, kesim değerlerimiz 8 ile 20 arasında 2’şer artmakta, 20’den sonra ise 5’er artmaktadır. Bunun nedeni gözlemlerimizin büyük çoğunluğunun 8 ile 20 arasında yer almasıdır. Kesim değerlerinin sayısının artması ROC eğrisinin duyarlılığını artıracaktır. “Pozitiflik sınır değeri” (cut-off value) 16 için duyarlılık ve seçicilik değerlerini hesaplamak isteyelim. MIA ≥ 16 ise test sonucu pozitif (kişi hasta), aksine MIA < 16 ise test sonucu negatif (kişi sağlıklı) kabul edilecektir. Hasta grubunda 19 kişide, kontrol grubunda ise 2 kişide MIA ≥16’dır. 16 sınır değeri için; doğru pozitif, yanlış pozitif, yanlış negatif ve doğru negatif sayıları Tablo 5’te verilmektedir. Tablo 5. 16 sınır değeri için test sonuçları MIA Test Sonucu MIA ! 16 (+)

Gerçek durum Malin melanom Hasta (+) Sağlam (-)

Toplam

19

2

21

MIA <16 (-)

16

18

34

Toplam

35

20

55

19 = 0.543 35 18 Seçicilik = = 0.900 20 Duyarlılık =

(1 – seçicilik) = 1 – 0.90 = 0.100 16 sınır değeri için, “(1-seçicilik)” ve “duyarlılık” koordinat sisteminde (0.100 ; 0.543) noktası elde edilir. ROC eğrisinin çizileceği noktaları, diğer tüm sınır değerleri için benzer işlemleri tekrarlayarak elde ederiz. 211


Duyarlılık, (y) ekseninde ve (1–özgüllük) değerleri ise (x) ekseninde temsil edilir. Tüm sınır değerleri için elde edilen duyarlılık, özgüllük ve (1– özgüllük) değerleri aşağıdaki tabloda (Tablo 6) verilmektedir. Tablo 6. Çeşitli MIA pozitiflik sınır değerleri için tanı değerleri. MIA Pozitiflik Sınır Değeri (≥) 8 10 12 14 16 18 20 25 30 40

Duyarlılık DP % 35 100 33 94 25 71 23 66 19 54 14 40 12 34 9 26 8 23 6 17

Seçicilik DN % 0 0 5 25 10 50 15 75 18 90 19 95 19 95 20 100 20 100 20 100

(1-seçicilik) % 100 75 50 25 10 5 5 0 0 0

10 ayrı pozitiflik sınır değeri için elde edilen duyarlılık ve (1-seçicilik) koordinat değerlerini kullanarak ROC eğrisini çizeriz.

Şekil 2. MIA değişkeni için ROC eğrisi. MIA tümör marker değişkeninin tanı değerinin gücü (hasta ve sağlamı ayırt edebilme gücü) ROC eğrisinin altında kalan alan ile ifade edilir. 212


Alan değeri 1’e yaklaştıkça tanı değeri yükselir. % 100’lük tanı gücünde alan değeri 1’e eşit olur. Eğri altında kalan alan ve % 95 güven sınırları belirlenir. 0.50 değerinin (kuramsal farksızlık) güven sınırlarının dışında kalması durumunda, istatistiksel olarak anlamlı bir tanı değerinden bahsedebiliriz. En uygun pozitiflik sınır değeri, eğri üzerinde sol üst köşeye en yakın noktayı ((1-seçicilik);duy.) veren değerdir. Örneğimizde, en uygun MIA pozitiflik sınır değeri 14’tür. MIA ≥ 14 için elde edilen (0.25 ; 0.66) noktası, ROC eğrisi üzerinde sol üst köşeye en yakın olan noktadır. MIA değişkeninin ROC çözümlemesi SPSS programında yapıldığında eğri altında kalan alan aşağıdaki gibi elde edilir. 0.732 ± 0.067 (%95 G.A. : 0.601 – 0.863) Buna göre, MIA değişkeninin tanı değerinin istatistiksel olarak anlamlı olduğunu söyleriz. Örnek 3. PSA, kolesterol ve trigliserit değişkenlerinin prostat kanserindeki tanılarının ROC analizi ile incelenmesi ve birbirleriyle karşılaştırması amaçlanmaktadır. Söz konusu üç değişken 30 hasta ve 34 sağlam kişide ölçülmüştür. Ölçülen değerler Tablo 7 ve Tablo 8’de verilmektedir. PSA, kolesterol ve trigliserit değişkenlerinin prostat kanserindeki tanı değerlerini ROC analizi ile sınayınız.

213


Tablo 7. Prostat kanserli hastalarda PSA, kolesterol ve trigliserit deÄ&#x;erleri. Hasta no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

PSA 4,01 3,51 4,02 4,69 5,15 5,26 4,26 8,98 8,70 13,90 13,30 56,10 4,70 5,62 9,13 6,56 6,32 6,74 5,91 5,51 7,03 6,88 20,50 12,95 14,34 30,77 17,71 8,71 7,12 16,11

Kolesterol 276 188 214 218 193 194 192 252 245 191 269 255 190 187 175 229 248 203 191 201 167 142 218 196 137 168 222 221 268 236

214

Trigliserit 172 123 90 156 178 276 207 181 85 80 183 176 104 259 84 227 91 85 69 209 103 85 174 120 88 86 123 282 222 125


Tablo 8. Sağlıklı kişilerde PSA, kolesterol ve trigliserit değerleri. Hasta no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

PSA 1,28 1,47 3,70 3,27 2,18 0,16 2,54 4,01 3,66 2,34 0,94 3,61 3,50 0,54 2,10 1,93 3,59 2,88 3,02 0,36 0,55 0,62 0,90 2,09 2,10 1,06 1,56 0,39 2,88 1,93 1,08 0,81 2,15 2,09

Kolesterol 246 202 172 115 154 162 152 225 156 89 229 162 184 229 219 189 326 135 195 218 162 202 214 207 219 295 192 242 204 172 295 179 169 247

215

Trigliserit 121 166 189 142 88 96 74 81 144 68 228 79 99 129 153 96 202 126 158 186 62 60 98 170 153 286 68 215 87 95 296 168 205 223


Çözüm : SPSS programı kullanılarak yapılan ROC çözümlemesi sonuçları aşağıdaki tablolarda verilmektedir. PSA, kolesterol ve trigliserit değişkenlerine ait tanımlayıcı istatistikler aşağıda (Tablo 9) verilmektedir. Tablo 9. PSA, kolesterol ve trigliserit değişkenlerine ait tanımlayıcı istatistikler.

Ar.ort.

SD

n

medyan

Min.

Maks.

Hasta

PSA

10,82

10,46

n=30

6,96

3,51

56,10

Kontrol

PSA

1,98

1,14

n=34

2,09

0,16

4,01

Hasta

Kolesterol

209,53

35,82

n=30

202,00

137,00

276,00

Kontrol

Kolesterol

198,76

49,69

n=34

198,50

89,00

326,00

Hasta

Trigliserit

148,10

63,88

n=30

124,00

69,00

282,00

Kontrol

Trigliserit

141,50

63,10

n=34

135,50

60,00

296,00

Tablodan da görüldüğü gibi hasta ve kontrol grupları arasında sadece PSA değişkeni önemli bir farklılık göstermektedir. Çeşitli PSA sınır değerleri için (1-seçicilik) ve duyarlılık değerleri (SPSS programı kullanılarak) aşağıdaki gibi (Tablo 10) elde edilir. PSA pozitiflik sınır değerleri, ardışık PSA değerlerinin ortalaması alınarak belirlenmiş, ilk sınır değeri için en küçük değer bir eksiltilmiş, son sınır değer için en büyük değer bir arttırılmıştır.

216


Tablo 10. PSA için duyarlılık ve (1- seçicilik) değerleri PSA pozitiflik sınır değeri (≥)

Duyarlılık

(1-seçicilik)

-,8400 ,2600 ,3750 ,4650 ,5450 ,5850 ,7150 ,8550 ,9200 1,0000 1,0700 1,1800 1,3750 1,5150 1,7450 2,0100 2,0950 2,1250 2,1650 2,2600 2,4400 2,7100 2,9500 3,1450 3,3850 3,5050 3,5500 3,6000 3,6350 3,6800 3,8550 4,0150 4,1400 4,4750

1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 ,967 ,967 ,967 ,967 ,967 ,933 ,900 ,867

1,000 ,971 ,941 ,912 ,882 ,853 ,824 ,794 ,765 ,735 ,706 ,676 ,647 ,618 ,588 ,529 ,471 ,412 ,382 ,353 ,324 ,294 ,235 ,206 ,176 ,147 ,147 ,118 ,088 ,059 ,029 ,000 ,000 ,000

217


Tablo 10. Devamı 4,6950 4,9250 5,2050 5,3850 5,5650 5,7650 6,1150 6,4400 6,6500 6,8100 6,9550 7,0750 7,9100 8,7050 8,8450 9,0550 11,0400 13,1250 13,6000 14,1200 15,2250 16,9100 19,1050 25,6350 43,4350 57,1000

,833 ,800 ,767 ,733 ,700 ,667 ,633 ,600 ,567 ,533 ,500 ,467 ,433 ,400 ,367 ,333 ,300 ,267 ,233 ,200 ,167 ,133 ,100 ,067 ,033 ,000

,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000

Tablo 10’da verilen (1- seçicilik) ve duyarlılık değerlerine karşılık gelen ROC eğrisi aşağıdaki gibi çizilir.

218


Şekil 3. PSA değişkenine ilişkin ROC eğrisi. Eğri altında kalan alan 0.995 ± 0.006 (% 95 güven aralığı : 0.983 – 1.0) bulunur. Buna göre PSA değişkeninin prostat kanserini tanımada önemli olduğu kabul edilir. Aynı şekilde, kolesterol ve trigliserit değişkenleri için hesaplamalar yapılırsa ROC eğrilerini aşağıdaki gibi elde ederiz (Şekil 4).

Şekil 4. PSA, Kolesterol ve Trigliserit için ROC eğrileri. 219


Eğri altında kalan alanlar Tablo 11’de verilmektedir. Tablo 11. PSA, Kolesterol ve Trigliserit değişkenlerine ait eğri altında kalan alanlar. % 95 Güven aralığı

PSA

± S.E. 0.995 ± 0.006

Kolesterol

0.584 ± 0.072

0.444 – 0.725

Trigliserit

0.534 ± 0.073

0.390 – 0.677

Alan

0.983 – 1.000

Sonuç olarak, prostat kanseri tanısında sadece PSA değişkeninin tanı değerinin yüksek olduğunu söyleyebiliriz. Kolesterol ve trigliserit değişkenlerinin prostat kanserindeki tanı değerleri istatistiksel olarak anlamlı değildir. Her iki değişkende de 0.50 değeri güven aralığının içinde yer almaktadır. Prostat kanseri tanısında PSA’nın en uygun pozitiflik sınır değeri 3.86’dır. PSA ≥ 3.86 için, duyarlılık = 0.967, seçicilik = 0.971 ve (1-seçicilik) = 0.029 olarak hesaplanır. Eğri üzerinde (0.029 ; 0.967) noktası sol üst köşeye (tam tanı (0;1)) en yakın olan noktadır.

220


Bölüm 16

Sağkalım (Sürvi Analizi)

İleriye dönük (prospektif) izleme çalışmalarında sıklıkla kullanılan sağkalım çözümleme yöntemleri yaşam tablolarının özel bir uygulamasıdır. Sağkalım çözümleme yöntemleri olarak “Yaşam Tablosu” ve “KaplanMeier” yöntemlerini gösterebiliriz.

16.1. SAĞKALIM ANALİZİNDE AMAÇ Sağkalım çözümleme yönteminin amaçları aşağıda verilmektedir. 1. Tedaviden sonra hastaların beklenen yaşam sürelerinin kestirilmesi, genel sağkalım ve/veya hastalıksız sağkalım eğrilerinin elde edilmesi, 2. Tedavi edilenlerde ve edilmeyenlerde beklenen yaşam sürelerinin karşılaştırılmasıyla tedavi etkinliğinin ölçülmesi, iki farklı teknikle tedavi edilen hastalarda beklenen yaşam sürelerinin karşılaştırılmasıyla da hangi tedavi tekniğinin daha etkin olduğunun belirlenmesi, 3. Çeşitli konularda risk faktörlerinin belirlenmesi, 4. Hastalıkların doğal seyrinin incelenmesi.

221


16.2. SAĞKALIM ANALİZİNDE KARŞILAŞILAN PROBLEMLER İleriye dönük izleme çalışmalarında en sık karşılaşılan problemlerin başında, deneklerin araştırma periyodu süresince tam olarak izlenememesini ve uzun süren izlemelerde hastalara uygulanan tedavi yöntemlerindeki olası değişiklikleri gösterebiliriz. Çeşitli nedenlerden tam olarak izlenemeyen hastalar, izlendikleri süre kadarıyla çözümlemeye alınır. Hastaların tam olarak izlenememesinin nedenleri aşağıda verilmektedir. 1. Deneklerin diğer nedenlerden ölmesi. 2. Deneklerle işbirliğinin sona ermesi. 3. Deneğin bir başka bölgeye göç etmesi. 4. Bazı deneklerin araştırma periyodunun sonlarına doğru izlemeye alınması ve çalışmanın sona ermesi nedeni ile izlemenin eksik kalması. İzleme ile ilgili başlangıç zamanı, izleme süresi ve sonlanma zamanını aşağıdaki gibi gösterebiliriz (Şekil 1.).

16.3. SONLANMA İLE İLGİLİ TANIMLAR

Şekil 1. İzleme süreci. İzleme sonucunda “sonlanma” olarak, ölüm, nüks (hastalığın yinelenmesi), metastaz ve tedavi sonucunu gösteren herhangi bir olayı 222


inceleyebiliriz. Hastanın izlemeye alınmasından, “sonlanma” olarak kabul edilen sonucun gerçekleşmesine kadar geçen süreye izleme süresi diyoruz. Sağkalım çözümlemesinde sıklıkla kullanılan tanımlar aşağıdaki gibidir. 1. Genel Sağkalım (Overall survival): Başlangıçtan (randomizasyondan) ölüme kadar geçen süre. 2. Progresyonsuz veya hastalıksız sağkalım (Disease free survival (DFS), PFS): Randomizasyondan progresyon/nüks veya ölüme kadar geçen süre. 3. Progresyonsuz veya hastalıksız geçen süre (Disease free interval, DF) : Randomizasyondan progresyon veya nükse kadar geçen süre. 4. Tedavi sonucunu gösteren olayın gerçekleşmesine kadar geçen süre (time to event) : Başlangıçtan olayın gerçekleşmesine kadar geçen süre.

16.4. SAĞKALIM ANALİZİ SONUÇLARININ SUNUMU Sağkalım çözümlemesi sonuçlarının sunumu aşağıdaki gibi yapılır (Tablo 1). Tablo 1. Sağkalım analizi sonuçlarının sunumu. İzleme süresi Olay (sonuç) sıklığı Ortalama sağkalım süresi Medyan sağkalım süresi n. yılda birikimli sağkalım hızı (n. yıldaki birikimli sağkalım hızının verilebilmesi için, n. yılda halen en az 5 hastanın daha izlem altında olması gerekir) Sağkalım eğrilerinin istatistiksel karşılaştırması

Medyan izleme süresi (min. – maks.) Olay sayısı / hasta sayısı Ortalama sağkalım süresi ± standart hata (%95 Güven aralığı) Medyan sağkalım süresi ± standart hata (%95 GA) (n.yılda) R ± SE (%95 GA : …..)

(Log rank =… ; d.f.=….; p=….) 223


16.5. KAPLAN – MEIER YÖNTEMİ Kaplan-Meier sağkalım çözümleme yöntemini (product limit) bir örnek üzerinde açıklayalım. Örnek 1. (X) kanser türünde 12 hastaya ait (Y) tedavisinden sonraki izleme sonuçları aşağıdaki tabloda (Tablo 2) verilsin. Tablo 2. 12 Hastaya ait izlem bilgileri. HASTA İZLEME İZLEME ADI BAŞLANGICI SONU

İZLEME SONUCU

İZLEME SONUCU (Kod)

A

02.02.2009

08.03.2010 EX

1

B

28.08.2009

14.05.2013 EX

1

C

03.02.2010

03.12.2012 EX

1

Ç

19.06.2010

05.05.2013 KAYIP

2

D

02.07.2010

05.12.2013 EX

1

E

23.09.2010

24.01.2015 HAYATTA 3

F

03.05.2011

01.01.2013 EX

1

G

04.05.2012

09.07.2014 EX

1

H

26.05.2012

18.07.2012 EX

1

I

03.10.2012

08.09.2013 KAYIP

2

İ

29.04.2013

07.10.2013 KAYIP

2

J

23.05.2013

24.01.2015 HAYATTA 3

* : Bugünkü tarih : 24/01/2015

Çalışma periyodunun, Başlangıç tarihi : 02.02.2009 Bitiş tarihi : 24.01.2015 Kaplan-Meier yöntemini kullanarak, sağkalım ile ilgili hızları ve sağkalım eğrisini elde etmek isteyelim. 224


Çözüm: Her bir hasta için izleme süresini hesaplarız (Tablo 3) (Şekil 2, Şekil 3). İzleme süresi = Sonlanma tarihi – Başlangıç tarihi Tablo 3. 12 Hastaya ait izlem bilgileri. HASTA ADI A B C Ç D E F G H I İ J

İZLEME BAŞLANGICI 02.02.2009 28.08.2009 03.02.2010 19.06.2010 02.07.2010 23.09.2010 03.05.2011 04.05.2012 26.05.2012 03.10.2012 29.04.2013 23.05.2013

İZLEME SONU 08.03.2010 14.05.2013 03.12.2012 05.05.2013 05.12.2013 24.01.2015 01.01.2013 09.07.2014 17.07.2012 08.09.2013 04.10.2013 24.01.2015

İZLEME SÜRESİ (GÜN) 399 1355 1034 1051 1252 1584 609 796 52 340 158 611

İZLEME SÜRESİ (AY) 13,3 45,17 34,47 35,03 41,73 52,80 20,30 26,53 1,73 11,33 5,27 20,37

* : Bugünkü tarih : 24/1/2015

Şekil 2. Hastaların izlem süreleri.

225

İZLEME SONUCU EX EX EX KAYIP EX HAYATTA EX EX EX KAYIP KAYIP HAYATTA

İZLEME SONUCU (Kod) 1 1 1 2 1 3 1 1 1 2 2 3


Şekil 3. Hastaların izlem süreleri.

Hastaların izleme sürelerini küçükten büyüğe sıralayarak Tablo 3’ü yeniden düzenleriz. Sağkalım hesaplamalarında kullanılan simgeler aşağıda verilmektedir.

Dt : t anındaki izleme sonucu (sonlanma (olay) varsa 1, yoksa 0).

Lt : t anında, izleme altındaki hasta sayısı. D Qt : t anında, ölüm oranı ( t ). Lt Pt : t anında, sağkalım oranı (1- Qt ) Rt : başlangıçtan t anına kadar geçen süre için birikimli sağkalım hızı . Kaplan – Meier çözümleme yönteminde, her t sonlanma anı için Qt , Pt ve Rt değerleri hesaplanır. Başlangıçta izlenen hasta sayısı 12 iken, H hastası 1.73’üncü ayda ex olmuş ve izlenmekte olan hasta sayısı 11’e düşmüştür. 1.73’üncü ayda, ölüm oranı, Q1.73 =

1 = 0.083, 12

sağkalım oranı, P1.73 =1 – 0.083 = 0.917 226


birikimli sağkalım hızı, R1.73 = (1) ! (0.917) = 0.917 olarak hesaplanır. Başlangıçta birikimli sağkalım hızı, R0 =1’dir. 1.73’üncü ayda izlenmeye devam hasta sayısı 11 iken, 5.27’inci ve 11.33’üncü ayda birer hasta çeşitli nedenlerden izlemeden ayrılmıştır. 13.30’uncu ayda ise bir hasta ölmüştür. 13.30’uncu ayda ölüm oranı, Q13.30 =

1 = 0.111 , 9

sağkalım oranı, P13.30 =1 – 0.111 = 0.889 , birikimli sağkalım hızı, hesaplanır.

R13.30 = (0.917) ! (0.889) = 0.815

olarak

Her sonlanma anı için işlemlerimiz tamamlarsak aşağıdaki tabloyu elde ederiz (Tablo 4). Ortalama sağkalım süresi aşağıdaki ifade ile hesaplanır.

µ = t1 + R1 " (t 2 ! t1 ) + R2 " (t3 ! t 2 ) + L + Rn!1 " (t n ! t n!1 ) µ = 1.73 + (0.917) · (5.27 – 1.73) + (0.917) · (11.33 – 5.27)

+ L + (0.158) " (52.80 ! 45.17) Ortalama sağkalım süresi, µ =32.98 ay. Medyan sağkalım süresi, birikimli sağkalım hızının 0.50’ye eşit olduğu t süresi olarak hesaplanır. Tablo 4’ten, medyan sağkalım süresinin 34.47 ay olduğu görülür.

227


Tablo 4. Kaplan – Meier sağkalım çözümlemesi sonuçları. HASTA ADI

İZLEME SÜRESİ (AY)

H İ I A F J G C Ç D B E

t 0 1,73 5,27 11,33 13,30 20,30 20,37 26,53 34,47 35,03 41,73 45,17 52,80

İZLEME İZLEME SONUCU SONUCU

Dt EX. KAYIP KAYIP EX. EX. HAY. EX. EX. KAYIP EX. EX. HAY.

1 0 0 1 1 0 1 1 0 1 1 0

İZLEMEDEKİ KÜMÜLATİF ÖLÜM SAĞKALIM SAĞKALIM HASTA SAYISI OLASILIĞI OLASILIĞI OLASILIĞI

Lt 12 11 10 9 8 7 6 5 4 3 2 1

Qt 0,083 0,000 0,000 0,111 0,125 0,000 0,167 0,200 0,000 0,333 0,500 0,000

Pt

Rt

0,917 1,000 1,000 0,889 0,875 1,000 0,833 0,800 1,000 0,667 0,500 1,000

1,00 0,917 0,917 0,917 0,815 0,713 0,713 0,594 0,475 0,475 0,317 0,158 0,158

Sağkalım analizini SPSS istatistik analiz programı ile yaptığımızda analiz sonuçları aşağıdaki gibi elde edilir (Tablo 5). Tablo 5. Sağkalım çözümlemesi sonuçları. İzleme süresi Olay (sonuç) sıklığı Ortalama sağkalım süresi Medyan sağkalım süresi 2.yılda birikimli sağkalım hızı

Medyan izleme süresi (min. – maks.) 23.45 (1.70 – 52.80) Olay sayısı / hasta sayısı 7/12 Ortalama sağkalım süresi ± standart hata (%95 Güven aralığı) 32.98 ± 4.92 (23.30 – 42.58) Medyan sağkalım süresi ± standart hata (%95 GA) 34.47 ± 9.13 (16.58 – 52.35) (2.yılda) R ± SE % 71.30 ± % 14.14

228


3. yılda halen izlenmekte olan hasta sayısı (3) çok küçük olduğundan, burada birikimli sağkalım hızını veremiyoruz. Sağkalım eğrisi Şekil 4’te verilmektedir.

Şekil 4 Sağkalım eğrisi. Örnek 2 . Randomize paralel kontrollü klinik bir çalışmada, (A) kolunda 20 hasta (B) kolunda 15 hasta izlenmiştir. İzleme sonuçları aşağıdaki tabloda verilmektedir (Tablo 6.) (A) ve (B) kollarındaki sağkalım eğrilerini karşılaştırınız.

229


Tablo 6. (A) ve (B) kollarında izleme bilgileri.

HASTA NO 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20

A GRUBU İZLEME SURESİ (AY) 03 06 07 08 15 18 22 20 16 28 35 19 16 22 14 16 19 06 22 29

SONUÇ EX KAYIP HAYATTA EX KAYIP KAYIP EX EX EX KAYIP HAYATTA HAYATTA KAYIP HAYATTA EX EX KAYIP EX EX EX

230

HASTA NO 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35

B GRUBU İZLEME SURESİ (AY) 01 03 28 16 17 22 12 11 10 19 12 09 04 06 03

SONUÇ EX EX EX KAYIP EX EX EX EX EX EX EX EX KAYIP EX EX


Çözüm : Her iki koldaki sağkalım analizi sonuçları, sağkalım eğrileri ve istatistiksel karşılaştırma sonuçları (SPSS) aşağıdaki gibi hesaplanır (Tablo 7) (Şekil 5). Tablo 7. (A) ve (B) kollarında sağkalım sonuçları. Medyan izleme (A) süresi (ay) (B) Olay (sonuç) (A) sıklığı (B) Ortalama (A) sağkalım süresi (B) (ay) Medyan sağkalım (A) süresi (B) 1.yılda birikimli (A) sağkalım hızı (B) Sağkalım eğrilerinin istatistiksel karşılaştırması

17 ( 3 – 35 ) 11 ( 1 – 28 ) 10 / 20 13 / 15 21.90 ± 2.49 ( 17.02 – 26.78) 12.65 ± 2.18 ( 8.37 – 16.93 ) 22.00 ± 1.47 ( 19.11 – 24.89 ) 12.00 ± 1.18 ( 9.68 – 14.32 ) % 84.4 ± % 8.3 % 36.4 ± % 12.9 Log- rank = 7.82 , s.d.=1, p=0.0052

Şekil 5. (A) ve (B) kollarına ait sağkalım eğrileri. 231


16.6. YAŞAM TABLOSU YÖNTEMİ Yaşam tablosu (Life table, actuarial) yönteminde, Kaplan Meier yönteminden farklı olarak, izleme periyodu eşit aralıklara bölünür. İzleme periyodu, incelenen verinin özelliğine göre, 3’er aylık, 6’şar aylık veya 1’er yıllık aralıklara bölünür ve elde edilen her aralık için sağkalım hesaplamaları yapılır. Çözümlemede kullanılan simgeler aşağıdaki gibi tanımlanır. Li : i . aralığın başında izlenmekte olan hasta sayısı,

Di : i. aralıkta, sonlanan (“olay” tanımına göre, ölen ve/veya nüks eden) hasta sayısı, U i : i. aralıkta çeşitli nedenlerle izlenemeyen (kayıp) hasta sayısı,

Ei : i. aralıkta risk altındaki hasta sayısı ( Ei = Li !

Ui ), 2

Di ), Ei Pi : i. aralıkta sağkalım hızı ( Pi = 1 - Qi ) Ri : başlangıçtan 1. aralığın sonuna kadar olan dönemde birikimli

Qi : i. aralıkta sonlanma hızı ( Qi =

i

sağkalım hızı ( Ri =

! P ). j

J =1

Örnek 3. (X) kanser türünde tedavi edilen 290 hasta 5 yıl süreyle izlenmiş ve izleme sonucunda elde edilen bilgiler Tablo 8’de özetlenmiştir. İzleme periyodunu 6’şar aylık aralıklara bölerek yaşam tablosu yöntemi ile sağkalım hızlarını ve sağkalım eğrisini elde etmek isteyelim. Tablo 8. 290 hastanın tedaviden sonraki izleme bilgileri. İzleme periyodu (i)

Periyodun başında izlenen

Ölen hasta

İzlenemeyen hasta

hasta sayısı ( Li )

sayısı( Di )

sayısı ( U i )

0- 6 6 - 12 12 - 18 18 - 24 24 - 30 30 - 36 36 - 42 42 - 48 48 - 54 54 - 60

290

40 15 5 10 0 0 3 0 2 0

55 60 35 30 15 0 0 0 0 0

232


Çözüm : 1. aralıkta ( 0 – 6 ay ) ölen hasta sayısı, D1 = 40, izlenemeyen hasta sayısı, U1 = 55 ‘tir. İzlenemeyen 55 hastanın yarısının, periyot süresince izlendikleri ve hayatta oldukları kabul edilir. Buna göre, 1. periyoda ait ölüm hızının hesaplanmasında risk altındaki hasta sayısı, E1 = L1 !

U1 ifadesi ile 2

hesaplanır.

E1 = 290 !

55 = 262.5 2

Yine, 1.aralığa ait ölüm hızını, sağkalım hızını ve birikimli sağkalım hızını aşağıdaki gibi hesaplarız.

40 D1 = 0.15 = E1 262.5 P1 = 1 ! Q1 = 1- 0.15 = 0.85

Q1 =

R1 = (1) ! (0.85) =0.85 ( R0 = 1 olduğunu hatırlayalım). 1. aralığın sonunda (2.aralığın başında) halen izlenmekte olan hasta sayısı, L2 = L1 ! D1 ! U1 = 290 – 40 – 55 = 195 olarak hesaplanır. Aynı şekilde diğer aralıklar için hesaplamalar yapılır (Tablo 9). Tablo 9. “Yaşam Tablosu” yöntemi ile elde edilen sağkalım sonuçları. (i)

( Li )

( Di )

(Ui )

( Ei )

( Qi )

( Pi )

( Ri )

0- 6 6 - 12 12 - 18 18 - 24 24 - 30 30 - 36 36 - 42 42 - 48 48 - 54 54 - 60

290 195 120 80 40 25 25 22 22 20

40 15 5 10 0 0 3 0 2 0

55 60 35 30 15 0 0 0 0 0

262.5 165.0 102.5 65.0 32.5 25.0 25.0 22.0 22.0 20.0

0.15 0.09 0.05 0.15 0.0 0.0 0.12 0.0 0.09 0.0

0.85 0.91 0.95 0.85 1.0 1.0 0.88 1.0 0.91 1.0

0.85 0.77 0.73 0.62 0.62 0.62 0.55 0.55 0.50 0.50

233


Sağkalım eğrisi aşağıdaki gibi çizilir (Şekil 6.)

Şekil 6. Sağkalım eğrisi

234


KAYNAKÇA •

Daniel, W.W. :"Applied Nonparametric Statistics", Houghton Mifflin Company, Boston, (1978).

Dixon, W.J.: "BMDP Statistical Software Manual", University of California Press, Berkeley, (1988).

Dupont, W.D.: "Statistical Modeling for Biomedical Researchers", Cambridge University Press, Cambridge, (2002).

Edwards, A.L.: "An Introduction to Linear regression and Correlation", W.H. Freemann and Company, New York, (1984)

Edwards, A.L.: "Multiple Regression and the Analysis of Variance and Covariance", W.H. Freemann and Company, New York, (1985)

Fould, R.F.: "Cancer Statistics", Adam Hilger Ltd, Bristol, (1983).

Ingelfinger, J.A., Mosteller, F., Thibodeau, L.A., Ware, J.H.: “Biostatistics in Clinical Medicine”, Macmillian Publishing Co., Inc., New York, (1987).

Glantz, S.A.: "Primer of Biostatistics",McGraw-Hill Inc., Newyork, (1997).

Johnson, R.A.: " Applied Multivariate Statistical Analysis", Prentice- Hall Inc.,London, (1982).

Kirkwood, B.R.: "Medical Statistics",BlackwellScientific Publications, London, (1988).

Kleinbaum, D.G., Klein, M.: "logistic Regression", Springer-Verlag Inc., New York, (2002).

Kleinbaum, D.G., Kupper, L.L., Morgenstern, H. :"Epidemiologic Resarch", Van Nostrand Reinhold Company, Newyork, (1982).

Knapp, R.G., Miller, M.C.: "Clinical Epidemiology and Biostatistics", Williams & Wilkins, Baltimore, (1992).

Lentner, C.:" Geigy Scientific Tables", Ciba-Geigy co., New Jersey, (1982).

Lwanga, S.K., Tye, C.Y., Ayeni, O.: " Teaching Health Statistics", World Health Organization, Geneva, (1999).

Mardia, K.V., Kent J.T., Bibby, J.M.: "Multivariate Analysis", Academic Press, Inc., London, (1979).

Motulsky, H. :"Intuitive Biostatistics",Oxford University Press Inc., Newyork, (1995).

Orkin, M., Drogin, R.: "Vital Statistics",McGraw-Hill Inc., New Delhi, (1975).

Papoulis, A.: "Probability, Random Variables, and Stochastic Processes", McGraw-Hill, Inc.,

Riffenburgh, R.H.: “Statistics in Medicine”, Elsevier Academic Pres Inc., San Diego, (2006).

Saunders B.D., Trapp, R.G.: "Basic and Clinical Biostatistics", Prentice-Hill International Inc.,

Tokyo, (1984)

London, (1990). •

Savitz, D.A.: “Interpreting epidemiologic Evidence”, Oxford University Press , Inc., New York, (2003).

Siegel, S.: "Nonparametric Statistics", McGraw-Hill Inc., New York, (1956).

Spiegel, M.R.: "Statistic", McGraw-Hill Inc., Newyork, (1972).

Weast, R.C. :"Handbook of Tables for Probability and Statistics", The Chemical Rubber Co., Ohio, (1968).

Yamane, T.: "Statistics", Harper & Row and John Weatherhill, Inc., Tokyo, (1969).

235


İstatistik Tabloları

236


Tablo I . Rastlantısal Sayılar Tablosu 22310

08115

50591

14063

10277

42518

54877

65494

41721

44152

64962

18302

32248

08832

77881

12576

59663

39812

98580

63047

74525

90277

25632

70283

00961

66462

64044

50861

21105

83148

59144

56620

88736

16939

79247

09890

54705

13309

04885

11562

15969

27227

29183

18722

02339

41304

27168

86456

27793

54470

35388

18728

60758

30592

71876

10531

28139

37752

17643

23368

06550

89378

65842

69393

04331

04694

10861

64757

25872

42893

56885

01099

93100

14483

72734

75735

66185

31520

39590

88170

85411

30159

25643

80382

58932

28266

67126

88798

31692

52791

96075

42844

88310

69652

62492

75843

23971

66843

41358

15783

48470

28841

38211

12510

75547

35748

20704

00316

94538

77910

55683

70901

43221

92688

94876

92636

03123

83203

13941

52255

27618

44778

87930

74260

71598

69915

70767

35337

42328

79577

90356

63459

03438

14682

88043

15905

52712

67756

04799

80089

58214

81093

58385

64335

65921

37061

43329

40765

58332

07252

85278

46630

23898

66814

73349

76916

98945

12865

75860

39628

66748

46854

59763

68087

45008

59263

99242

93145

77277

45153

79686

61607

38820

85460

74455

04262

24408

47845

03769

26412

99460

43775

50475

00301

20073

54904

46143

54044

79689

66003

45844

89955

02568

09337

86269

96749

79750

74966

25881

74057

46081

94606

96675

26161

60197

85688

87652

85256

61564

38845

62694

85472

40016

11588

58374

09079

46334

89989

39667

84497

87652

92940

24064

51159

85719

49916

96541

68192

05102

97506

35399

86685

28781

95673

27348

21605

28408

01833

74828

70611

53684

90349

08600

82024

99658

68485

59476

59588

03028

23813

00840

45311

69412

25508

58691

77749

04556

83419

99473

15599

15077

57395

34144

08358

17870

42741

57648

03033

74020

27223

34658

37601

86379

13872

08281

77474

29275

55550

58483

53784

56389

86731

06988

99874

30667

01437

38743

13370

08154

47250

86517

28698

67210

10045

86806

57474

78979

57979

57561

12595

68279

57074

10365

08865

81381

02434

95848

00409

16229

72929

60849

29838

71486

50593

58344

60629

26898

35278

19360

74438

62356

69336

33475

39660

55349

21379

15048

99652

49687

93915

79575

72337

46044

99509

82682

39131

35743

61662

25892

58356

02430

96548

44275

09064

62155

67291

70386

08091

73932

71968

(Rastlantısal sayılar tablosu EXCEL bilgisayar programındaki “S_SAYI_ÜRET” fonksiyonu kullanılarak oluşturulmuştur)

237


Tablo II. Poisson Olasılıkları Başarı Sayısı (x)

µ =np , P( x) = e µ

0

1

2

3

µx x!

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,09

0

----

0,9048

0,8187

0,7408

0,6703

0,6065

0,5488

0,4014

0,4493

0,4628

1

0,3679

0,3329

0,3012

0,2725

0,2466

0,2231

0,2019

0,5718

0,1653

0,3028

2

0,1353

0,1225

0,1108

0,1003

0,0907

0,0821

0,0743

0,7500

0,0608

0,1152

3

0,0498

0,0450

0,0408

0,0369

0,0334

0,0302

0,0273

0,8728

0,0224

0,0355

4

0,0183

0,0166

0,0150

0,0136

0,0123

0,0111

0,0101

0,9407

0,0082

0,0109

5

0,0067

0,0061

0,0055

0,0050

0,0045

0,0041

0,0037

0,9738

0,0030

0,0035

µ

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,09

0

0,0000

0,0905

0,1637

0,2222

0,2681

0,3033

0,3293

0,3476

0,3595

0,3659

1

0,3679

0,3662

0,3614

0,3543

0,3452

0,3347

0,3230

0,3106

0,2975

0,2842

2

0,2707

0,2572

0,2438

0,2306

0,2177

0,2052

0,1931

0,1815

0,1703

0,1596

3

0,1494

0,1397

0,1304

0,1217

0,1135

0,1057

0,0984

0,0915

0,0850

0,0789

4

0,0733

0,0679

0,0630

0,0583

0,0540

0,0500

0,0462

0,0427

0,0395

0,0365

5

0,0337

0,0311

0,0287

0,0265

0,0244

0,0225

0,0207

0,0191

0,0176

0,0162

µ

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,09

0

0,0000

0,0045

0,0164

0,0333

0,0536

0,0758

0,0988

0,1217

0,1438

0,1647

1

0,1839

0,2014

0,2169

0,2303

0,2417

0,2510

0,2584

0,2640

0,2678

0,2700

2

0,2707

0,2700

0,2681

0,2652

0,2613

0,2565

0,2510

0,2450

0,2384

0,2314

3

0,2240

0,2165

0,2087

0,2008

0,1929

0,1850

0,1771

0,1692

0,1615

0,1539

4

0,1465

0,1393

0,1323

0,1254

0,1188

0,1125

0,1063

0,1005

0,0948

0,0894

5

0,0842

0,0793

0,0746

0,0701

0,0659

0,0618

0,0580

0,0544

0,0509

0,0477

µ

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,09

0

0,0000

0,0002

0,0011

0,0033

0,0072

0,0126

0,0198

0,0284

0,0383

0,0494

1

0,0613

0,0738

0,0867

0,0998

0,1128

0,1255

0,1378

0,1496

0,1607

0,1710

2

0,1804

0,1890

0,1966

0,2033

0,2090

0,2138

0,2176

0,2205

0,2225

0,2237

3

0,2240

0,2237

0,2226

0,2209

0,2186

0,2158

0,2125

0,2087

0,2046

0,2001

4

0,1954

0,1904

0,1852

0,1798

0,1743

0,1687

0,1631

0,1574

0,1517

0,1460

5

0,1404

0,1348

0,1293

0,1239

0,1185

0,1133

0,1082

0,1033

0,0985

0,0938

(Poisson Olasılıkları tablosu EXCEL bilgisayar programındaki “POISSON” fonksiyonu kullanılarak oluşturulmuştur)

238


Tablo III. Standart Normal Eğri Alanları

!i

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,00000

0,00399

0,00798

0,01197

0,01595

0,01994

0,02392

0,02790

0,03188

0,03586

0,1

0,03983

0,04380

0,04776

0,05172

0,05567

0,05962

0,06356

0,06749

0,07142

0,07535

0,2

0,07926

0,08317

0,08706

0,09095

0,09483

0,09871

0,10257

0,10642

0,11026

0,11409

0,3

0,11791

0,12172

0,12552

0,12930

0,13307

0,13683

0,14058

0,14431

0,14803

0,15173

0,4

0,15542

0,15910

0,16276

0,16640

0,17003

0,17364

0,17724

0,18082

0,18439

0,18793

0,5

0,19146

0,19497

0,19847

0,20194

0,20540

0,20884

0,21226

0,21566

0,21904

0,22240

0,6

0,22575

0,22907

0,23237

0,23565

0,23891

0,24215

0,24537

0,24857

0,25175

0,25490

0,7

0,25804

0,26115

0,26424

0,26730

0,27035

0,27337

0,27637

0,27935

0,28230

0,28524

0,8

0,28814

0,29103

0,29389

0,29673

0,29955

0,30234

0,30511

0,30785

0,31057

0,31327

0,9

0,31594

0,31859

0,32121

0,32381

0,32639

0,32894

0,33147

0,33398

0,33646

0,33891

1,0

0,34134

0,34375

0,34614

0,34849

0,35083

0,35314

0,35543

0,35769

0,35993

0,36214

1,1

0,36433

0,36650

0,36864

0,37076

0,37286

0,37493

0,37698

0,37900

0,38100

0,38298

1,2

0,38493

0,38686

0,38877

0,39065

0,39251

0,39435

0,39617

0,39796

0,39973

0,40147

1,3

0,40320

0,40490

0,40658

0,40824

0,40988

0,41149

0,41309

0,41466

0,41621

0,41774

1,4

0,41924

0,42073

0,42220

0,42364

0,42507

0,42647

0,42785

0,42922

0,43056

0,43189

1,5

0,43319

0,43448

0,43574

0,43699

0,43822

0,43943

0,44062

0,44179

0,44295

0,44408

1,6

0,44520

0,44630

0,44738

0,44845

0,44950

0,45053

0,45154

0,45254

0,45352

0,45449

1,7

0,45543

0,45637

0,45728

0,45818

0,45907

0,45994

0,46080

0,46164

0,46246

0,46327

1,8

0,46407

0,46485

0,46562

0,46638

0,46712

0,46784

0,46856

0,46926

0,46995

0,47062

1,9

0,47128

0,47193

0,47257

0,47320

0,47381

0,47441

0,47500

0,47558

0,47615

0,47670

2,0

0,47725

0,47778

0,47831

0,47882

0,47932

0,47982

0,48030

0,48077

0,48124

0,48169

2,1

0,48214

0,48257

0,48300

0,48341

0,48382

0,48422

0,48461

0,48500

0,48537

0,48574

2,2

0,48610

0,48645

0,48679

0,48713

0,48745

0,48778

0,48809

0,48840

0,48870

0,48899

2,3

0,48928

0,48956

0,48983

0,49010

0,49036

0,49061

0,49086

0,49111

0,49134

0,49158

2,4

0,49180

0,49202

0,49224

0,49245

0,49266

0,49286

0,49305

0,49324

0,49343

0,49361

2,5

0,49379

0,49396

0,49413

0,49430

0,49446

0,49461

0,49477

0,49492

0,49506

0,49520

2,6

0,49534

0,49547

0,49560

0,49573

0,49585

0,49598

0,49609

0,49621

0,49632

0,49643

2,7

0,49653

0,49664

0,49674

0,49683

0,49693

0,49702

0,49711

0,49720

0,49728

0,49736

2,8

0,49744

0,49752

0,49760

0,49767

0,49774

0,49781

0,49788

0,49795

0,49801

0,49807

2,9

0,49813

0,49819

0,49825

0,49831

0,49836

0,49841

0,49846

0,49851

0,49856

0,49861

3,0

0,49865

0,49869

0,49874

0,49878

0,49882

0,49886

0,49889

0,49893

0,49896

0,49900

3,1

0,49903

0,49906

0,49910

0,49913

0,49916

0,49918

0,49921

0,49924

0,49926

0,49929

(Standart Normal Alanlar tablosu EXCEL bilgisayar programındaki “NORMSDAĞ” fonksiyonu kullanılarak oluşturulmuştur)

239


Tablo IV Çeşitli Serbestlik Derecesi (s.d.) Ve (iki yönlü) Olasılık Değerlerine Karşılık Gelen t Tablosu

(iki yönlü) Olasılık

Serbestlik Derecesi s.d. 1 2 3 4 5 6 7 8 9 10

0,50 1,0000 0,8165 0,7649 0,7407 0,7267 0,7176 0,7111 0,7064 0,7027 0,6998

0,20 3,0777 1,8856 1,6377 1,5332 1,4759 1,4398 1,4149 1,3968 1,3830 1,3722

0,10 6,3138 2,9200 2,3534 2,1318 2,0150 1,9432 1,8946 1,8595 1,8331 1,8125

0,05 12,7062 4,3027 3,1824 2,7764 2,5706 2,4469 2,3646 2,3060 2,2622 2,2281

0,02 31,8205 6,9646 4,5407 3,7469 3,3649 3,1427 2,9980 2,8965 2,8214 2,7638

0,01 63,6567 9,9248 5,8409 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693

0,001 636,6192 31,5991 12,9240 8,6103 6,8688 5,9588 5,4079 5,0413 4,7809 4,5869

11 12 13 14 15 16 17 18 19 20

0,6974 0,6955 0,6938 0,6924 0,6912 0,6901 0,6892 0,6884 0,6876 0,6870

1,3634 1,3562 1,3502 1,3450 1,3406 1,3368 1,3334 1,3304 1,3277 1,3253

1,7959 1,7823 1,7709 1,7613 1,7531 1,7459 1,7396 1,7341 1,7291 1,7247

2,2010 2,1788 2,1604 2,1448 2,1314 2,1199 2,1098 2,1009 2,0930 2,0860

2,7181 2,6810 2,6503 2,6245 2,6025 2,5835 2,5669 2,5524 2,5395 2,5280

3,1058 3,0545 3,0123 2,9768 2,9467 2,9208 2,8982 2,8784 2,8609 2,8453

4,4370 4,3178 4,2208 4,1405 4,0728 4,0150 3,9651 3,9216 3,8834 3,8495

21 22 23 24 25 26 27 28 29 30

0,6864 0,6858 0,6853 0,6848 0,6844 0,6840 0,6837 0,6834 0,6830 0,6828

1,3232 1,3212 1,3195 1,3178 1,3163 1,3150 1,3137 1,3125 1,3114 1,3104

1,7207 1,7171 1,7139 1,7109 1,7081 1,7056 1,7033 1,7011 1,6991 1,6973

2,0796 2,0739 2,0687 2,0639 2,0595 2,0555 2,0518 2,0484 2,0452 2,0423

2,5176 2,5083 2,4999 2,4922 2,4851 2,4786 2,4727 2,4671 2,4620 2,4573

2,8314 2,8188 2,8073 2,7969 2,7874 2,7787 2,7707 2,7633 2,7564 2,7500

3,8193 3,7921 3,7676 3,7454 3,7251 3,7066 3,6896 3,6739 3,6594 3,6460

40 50 60 70 80 90 100 1000

0,6807 0,6794 0,6786 0,6780 0,6776 0,6772 0,6770 0,6747

1,3031 1,2987 1,2958 1,2938 1,2922 1,2910 1,2901 1,2824

1,6839 1,6759 1,6706 1,6669 1,6641 1,6620 1,6602 1,6464

2,0211 2,0086 2,0003 1,9944 1,9901 1,9867 1,9840 1,9623

2,4233 2,4033 2,3901 2,3808 2,3739 2,3685 2,3642 2,3301

2,7045 2,6778 2,6603 2,6479 2,6387 2,6316 2,6259 2,5808

3,5510 3,4960 3,4602 3,4350 3,4163 3,4019 3,3905 3,3003

n"!

0,6745

1,2816

1,6449

1,9600

2,3263

2,5758

3,2905

(t tablosu EXCEL bilgisayar programındaki “TTERS” fonksiyonu kullanılarak oluşturulmuştur)

240


241

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 40 50 100

(payda) s.d.

2

3

4

3,84

3,00

2,60

2,37

161,45 199,50 215,71 224,58 18,51 19,00 19,16 19,25 10,13 9,55 9,28 9,12 7,71 6,94 6,59 6,39 6,61 5,79 5,41 5,19 5,99 5,14 4,76 4,53 5,59 4,74 4,35 4,12 5,32 4,46 4,07 3,84 5,12 4,26 3,86 3,63 4,96 4,10 3,71 3,48 4,84 3,98 3,59 3,36 4,75 3,89 3,49 3,26 4,67 3,81 3,41 3,18 4,60 3,74 3,34 3,11 4,54 3,68 3,29 3,06 4,49 3,63 3,24 3,01 4,45 3,59 3,20 2,96 4,41 3,55 3,16 2,93 4,38 3,52 3,13 2,90 4,35 3,49 3,10 2,87 4,32 3,47 3,07 2,84 4,30 3,44 3,05 2,82 4,28 3,42 3,03 2,80 4,26 3,40 3,01 2,78 4,24 3,39 2,99 2,76 4,17 3,32 2,92 2,69 4,08 3,23 2,84 2,61 4,03 3,18 2,79 2,56 3,94 3,09 2,70 2,46

1

2,21

230,16 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2,68 2,66 2,64 2,62 2,60 2,53 2,45 2,40 2,31

5

6

2,10

233,99 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,42 2,34 2,29 2,19

Tablo V a. α=0.05 için F tablosu.

2,01

236,77 19,35 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54 2,51 2,49 2,46 2,44 2,42 2,40 2,33 2,25 2,20 2,10

7

1,94

238,88 19,37 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48 2,45 2,42 2,40 2,37 2,36 2,34 2,27 2,18 2,13 2,03

8

1,88

240,54 19,38 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,90 2,80 2,71 2,65 2,59 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,30 2,28 2,21 2,12 2,07 1,97

9

10

1,83

241,88 19,40 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,16 2,08 2,03 1,93

(pay) serbestlik derecesi

1,75

243,91 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,09 2,00 1,95 1,85

12

1,67

245,95 19,43 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,18 2,15 2,13 2,11 2,09 2,01 1,92 1,87 1,77

15

1,57

248,01 19,45 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 2,01 1,93 1,84 1,78 1,68

20

1,46

250,10 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,84 1,74 1,69 1,57

30

1,39

251,14 19,47 8,59 5,72 4,46 3,77 3,34 3,04 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 1,99 1,96 1,94 1,91 1,89 1,87 1,79 1,69 1,63 1,52

40

1,35

251,77 19,48 8,58 5,70 4,44 3,75 3,32 3,02 2,80 2,64 2,51 2,40 2,31 2,24 2,18 2,12 2,08 2,04 2,00 1,97 1,94 1,91 1,88 1,86 1,84 1,76 1,66 1,60 1,48

50

1,24

1,00

253,04 254,31 19,49 19,50 8,55 8,53 5,66 5,63 4,41 4,37 3,71 3,67 3,27 3,23 2,97 2,93 2,76 2,71 2,59 2,54 2,46 2,40 2,35 2,30 2,26 2,21 2,19 2,13 2,12 2,07 2,07 2,01 2,02 1,96 1,98 1,92 1,94 1,88 1,91 1,84 1,88 1,81 1,85 1,78 1,82 1,76 1,80 1,73 1,78 1,71 1,70 1,62 1,59 1,51 1,52 1,44 1,39 1,28

100

F tablosu EXCEL bilgisayar programındaki “FTERS” fonksiyonu kullanılarak oluşturulmuştur)


242

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 40 50 100

(payda) s.d.

2

3

6,63

4,61

3,78

4052,2 4999,5 5403,4 98,50 99,00 99,17 34,12 30,82 29,46 21,20 18,00 16,69 16,26 13,27 12,06 13,75 10,92 9,78 12,25 9,55 8,45 11,26 8,65 7,59 10,56 8,02 6,99 10,04 7,56 6,55 9,65 7,21 6,22 9,33 6,93 5,95 9,07 6,70 5,74 8,86 6,51 5,56 8,68 6,36 5,42 8,53 6,23 5,29 8,40 6,11 5,18 8,29 6,01 5,09 8,18 5,93 5,01 8,10 5,85 4,94 8,02 5,78 4,87 7,95 5,72 4,82 7,88 5,66 4,76 7,82 5,61 4,72 7,77 5,57 4,68 7,56 5,39 4,51 7,31 5,18 4,31 7,17 5,06 4,20 6,90 4,82 3,98

1

3,32

5624,6 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,21 5,04 4,89 4,77 4,67 4,58 4,50 4,43 4,37 4,31 4,26 4,22 4,18 4,02 3,83 3,72 3,51

4

3,02

5763,6 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,69 4,56 4,44 4,34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,85 3,70 3,51 3,41 3,21

5

6

2,80

5859,0 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,80 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 3,81 3,76 3,71 3,67 3,63 3,47 3,29 3,19 2,99

Tablo V b. α=0.01 için F tablosu.

2,64

5928,4 99,36 27,67 14,98 10,46 8,26 6,99 6,18 5,61 5,20 4,89 4,64 4,44 4,28 4,14 4,03 3,93 3,84 3,77 3,70 3,64 3,59 3,54 3,50 3,46 3,30 3,12 3,02 2,82

7

2,51

5981,1 99,37 27,49 14,80 10,29 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4,14 4,00 3,89 3,79 3,71 3,63 3,56 3,51 3,45 3,41 3,36 3,32 3,17 2,99 2,89 2,69

8

2,41

6022,5 99,39 27,35 14,66 10,16 7,98 6,72 5,91 5,35 4,94 4,63 4,39 4,19 4,03 3,89 3,78 3,68 3,60 3,52 3,46 3,40 3,35 3,30 3,26 3,22 3,07 2,89 2,78 2,59

9

10

2,32

6055,8 99,40 27,23 14,55 10,05 7,87 6,62 5,81 5,26 4,85 4,54 4,30 4,10 3,94 3,80 3,69 3,59 3,51 3,43 3,37 3,31 3,26 3,21 3,17 3,13 2,98 2,80 2,70 2,50

(pay) serbestlik derecesi

2,18

6106,3 99,42 27,05 14,37 9,89 7,72 6,47 5,67 5,11 4,71 4,40 4,16 3,96 3,80 3,67 3,55 3,46 3,37 3,30 3,23 3,17 3,12 3,07 3,03 2,99 2,84 2,66 2,56 2,37

12

2,04

6157,3 99,43 26,87 14,20 9,72 7,56 6,31 5,52 4,96 4,56 4,25 4,01 3,82 3,66 3,52 3,41 3,31 3,23 3,15 3,09 3,03 2,98 2,93 2,89 2,85 2,70 2,52 2,42 2,22

15

1,88

6208,7 99,45 26,69 14,02 9,55 7,40 6,16 5,36 4,81 4,41 4,10 3,86 3,66 3,51 3,37 3,26 3,16 3,08 3,00 2,94 2,88 2,83 2,78 2,74 2,70 2,55 2,37 2,27 2,07

20

1,70

6260,6 99,47 26,50 13,84 9,38 7,23 5,99 5,20 4,65 4,25 3,94 3,70 3,51 3,35 3,21 3,10 3,00 2,92 2,84 2,78 2,72 2,67 2,62 2,58 2,54 2,39 2,20 2,10 1,89

30

1,59

6286,8 99,47 26,41 13,75 9,29 7,14 5,91 5,12 4,57 4,17 3,86 3,62 3,43 3,27 3,13 3,02 2,92 2,84 2,76 2,69 2,64 2,58 2,54 2,49 2,45 2,30 2,11 2,01 1,80

40

1,52

6302,5 99,48 26,35 13,69 9,24 7,09 5,86 5,07 4,52 4,12 3,81 3,57 3,38 3,22 3,08 2,97 2,87 2,78 2,71 2,64 2,58 2,53 2,48 2,44 2,40 2,25 2,06 1,95 1,74

50

1,36

1,00

6334,1 6365,9 99,49 99,50 26,24 26,13 13,58 13,46 9,13 9,02 6,99 6,88 5,75 5,65 4,96 4,86 4,41 4,31 4,01 3,91 3,71 3,60 3,47 3,36 3,27 3,17 3,11 3,00 2,98 2,87 2,86 2,75 2,76 2,65 2,68 2,57 2,60 2,49 2,54 2,42 2,48 2,36 2,42 2,31 2,37 2,26 2,33 2,21 2,29 2,17 2,13 2,01 1,94 1,80 1,82 1,68 1,60 1,43

100

F tablosu EXCEL bilgisayar programındaki “FTERS” fonksiyonu kullanılarak oluşturulmuştur)


Tablo VI . Ki-Kare Tablosu Serbestlik Derecesi s.d.

Olasılıklar 0,90

0,50

0,30

0,20

0,10

0,05

0,02

0,01

0,001

1

0,016

0,455

1,074

1,642

2,706

3,841

5,412

6,635

10,828

2

0,211

1,386

2,408

3,219

4,605

5,991

7,824

9,210

13,816

3

0,584

2,366

3,665

4,642

6,251

7,815

9,837

11,345

16,266

4

1,064

3,357

4,878

5,989

7,779

9,488

11,668

13,277

18,467

5

1,610

4,351

6,064

7,289

9,236

11,070

13,388

15,086

20,515

6

2,204

5,348

7,231

8,558

10,645

12,592

15,033

16,812

22,458

7

2,833

6,346

8,383

9,803

12,017

14,067

16,622

18,475

24,322

8

3,490

7,344

9,524

11,030

13,362

15,507

18,168

20,090

26,124

9

4,168

8,343

10,656

12,242

14,684

16,919

19,679

21,666

27,877

10

4,865

9,342

11,781

13,442

15,987

18,307

21,161

23,209

29,588

11

5,578

10,341

12,899

14,631

17,275

19,675

22,618

24,725

31,264

12

6,304

11,340

14,011

15,812

18,549

21,026

24,054

26,217

32,909

13

7,042

12,340

15,119

16,985

19,812

22,362

25,472

27,688

34,528

14

7,790

13,339

16,222

18,151

21,064

23,685

26,873

29,141

36,123

15

8,547

14,339

17,322

19,311

22,307

24,996

28,259

30,578

37,697

16

9,312

15,338

18,418

20,465

23,542

26,296

29,633

32,000

39,252

17

10,085

16,338

19,511

21,615

24,769

27,587

30,995

33,409

40,790

18

10,865

17,338

20,601

22,760

25,989

28,869

32,346

34,805

42,312

19

11,651

18,338

21,689

23,900

27,204

30,144

33,687

36,191

43,820

20

12,443

19,337

22,775

25,038

28,412

31,410

35,020

37,566

45,315

21

13,240

20,337

23,858

26,171

29,615

32,671

36,343

38,932

46,797

22

14,041

21,337

24,939

27,301

30,813

33,924

37,659

40,289

48,268

23

14,848

22,337

26,018

28,429

32,007

35,172

38,968

41,638

49,728

24

15,659

23,337

27,096

29,553

33,196

36,415

40,270

42,980

51,179

25

16,473

24,337

28,172

30,675

34,382

37,652

41,566

44,314

52,620

26

17,292

25,336

29,246

31,795

35,563

38,885

42,856

45,642

54,052

27

18,114

26,336

30,319

32,912

36,741

40,113

44,140

46,963

55,476

28

18,939

27,336

31,391

34,027

37,916

41,337

45,419

48,278

56,892

29

19,768

28,336

32,461

35,139

39,087

42,557

46,693

49,588

58,301

30

20,599

29,336

33,530

36,250

40,256

43,773

47,962

50,892

59,703

.(t tablosu EXCEL bilgisayar programındaki “KİKARETERS” fonksiyonu kullanılarak oluşturulmuştur)

243


244

1 - 17

1 - 15

1 - 14

1 - 13

1 - 12

2 - 12

2 - 11

40

50

60

70

80

90

100

10 20 30 40 50 60 70 80 90 100

(n)

0 - 20

30

9 - 24

8 - 24

8 - 25

8 - 26

7 - 27

6 - 28

6 - 30

5 - 33

3 - 38

1 - 50

0.15

14 - 27

13 - 29

12 - 30

11 - 31

11 - 32

10 - 34

9 - 36

8 - 39

6 - 44

3 - 56

0.20

17 - 35

16 - 35

16 - 36

15 - 37

15 - 38

14 - 39

13 - 41

11 - 44

9 - 49

5 - 60

0.25

Örneklem oranı

21 - 40

21 - 41

20 - 41

20 - 42

19 - 43

18 - 45

17 - 47

15 - 49

12 - 54

7 - 65

0.30

26 - 45

25 - 45

25 - 46

24 - 47

23 - 48

22 - 50

21 - 52

19 - 54

15 - 59

9 - 70

0.35

30 - 50

30 - 51

29 - 52

28 - 52

28 - 53

26 - 55

25 - 57

23 - 59

19 - 64

12 - 74

0.40

35 - 55

34 - 56

34 - 57

33 - 57

32 - 58

31 - 60

29 - 62

27 - 64

23 - 68

15 - 78

0.45

-

32 25 21 19 17 16 15 14 14

0 1 1 2 2 3 3 3 4 4

-

54 39 32 28 26 24 23 22 21 20

0.10 1 2 3 4 5 5 6 6 7 7

-

60 45 38 35 32 30 29 28 27 26

0.15 1 - 65 4 - 51 5 - 44 7 - 41 8 - 38 9 - 36 9 - 35 10 - 34 10 - 33 11 - 32

0.20 2 - 69 6 - 56 8 - 50 10 - 46 11 - 44 12 - 42 13 - 40 14 - 39 14 - 38 15 - 38

0.25

4 - 74 8 - 61 11 - 55 13 - 51 15 - 49 16 - 47 17 - 46 18 - 45 18 - 44 19 - 43

0.30

6 - 77 11 - 66 15 - 60 17 - 57 19 - 54 20 - 52 21 - 51 22 - 50 23 - 49 23 - 48

0.35 8 15 19 21 23 24 25 26 27 28

-

81 70 65 61 59 57 56 55 54 53

0.40 10 18 22 25 27 29 30 31 32 32

-

84 74 69 66 64 62 61 60 59 58

0.45

(Kaynak : “Geigy scientific tables”, Introduction to statistics statistical tables, Ciba-geigy limited, Editor : Cornelius Lentner, Basle, Switzerland. Sayfa :89-107.)

0 0 0 0 1 1 1 1 1

0.05

Örneklem oranı

Tablo VIII. Örneklem Oranlarına Ait % 99 Güven Aralıkları

(Kaynak : “Geigy scientific tables”, Introduction to statistics statistical tables, Ciba-geigy limited, Editor : Cornelius Lentner, Basle, Switzerland. Sayfa: 89-107.)

5 - 18

5 - 18

4 - 19

4 - 20

4 - 21

3 - 22

3 - 24

2 - 27

0 - 45

1 - 32

0 - 25

0.10

20

0.05

10

(n)

Tablo VII. Örneklem Oranlarına Ait % 95 Güven Aralıkları

13 22 26 28 32 63 34 35 36 37

-

87 78 74 71 68 67 66 65 64 63

0.50

40 - 60

39 - 61

39 - 61

38 - 62

37 - 63

36 - 64

34 - 66

31 - 69

27 - 73

19 - 81

0.50


Tablo IX. 0.05 ve 0.01 Anlam Düzeylerine Karşılık Gelen Spearman Sıra Farkı Ilişki Katsayısının Alt Sınırları.

n 5 6 7 8 9 10

p <= 0.05 1.00 0.89 0.79 0.74 0.68 0.65

p <= 0.01 --1.00 0.93 0.88 0.83 0.79

Tablo X. (iki yönlü) 0.05 Anlamlılık İçin Kritik U Değerleri

n2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

n1 1 2 3

0 0 0 1 1 1 1 2 2 2 3 3 3 4 0 4 0 4

0 0 1 2 2 3 3 4 5 5 6 7 7 8 9 9 10 11

4 0 1 2 3 4 5 6 7 8 9 10 11 12 14 15 16 17 18

5 0 1 2 4 5 6 8 9 11 12 13 15 16 18 19 20 22 23 25

6 0 2 3 5 7 8 10 12 14 16 17 19 21 23 25 26 28 30 32

7 0 2 4 6 8 11 13 15 17 19 21 24 26 28 30 33 35 37 39

8 1 3 5 8 10 13 15 18 20 23 26 28 31 33 36 39 41 44 47

9 1 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54

10 11 12 13 14 15 1 4 7 11 14 17 20 24 27 31 34 37 41 44 48 51 55 58 62

1 5 8 12 16 19 23 27 31 34 38 42 46 50 54 57 61 65 69

2 5 9 13 17 21 26 30 34 38 42 47 51 55 60 64 68 72 77

2 6 10 15 19 24 28 33 37 42 47 51 56 61 65 70 75 80 84

16

17

2 3 3 3 7 7 8 9 11 12 14 15 16 18 19 20 21 23 25 26 26 28 30 33 31 33 36 39 36 39 42 45 41 44 48 51 46 50 54 57 51 55 60 64 56 61 65 70 61 66 71 77 66 72 77 83 71 77 83 89 77 83 89 96 82 88 95 102 87 94 101 109 92 100 107 115

18

19

20

4 9 16 22 28 35 41 48 55 61 68 75 82 88 95 102 109 116 123

0 4 10 17 23 30 37 44 51 58 65 72 80 87 94 101 109 116 123 130

0 4 11 18 25 32 39 47 54 62 69 77 84 92 100 107 115 123 130 138

(Kaynak : Beyer, W.H.: “Handbook of tables for probability and statistics”, The chemical rubber co., 1966, sayfa : 406.)

245


Tablo XI. (iki yönlü) 0.01 Anlamlılık İçin Kritik U Değerleri

n2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

n1 1

2

0 0 0 0 0 0 1 1

3

0 0 1 1 1 2 2 2 3 3 4 4 4 5

4

0 1 1 2 3 3 4 5 5 6 7 7 8 9 9 10

5

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

6

7

8

9

10

11

12

13

14

15

16

17

18

19

1 2 3 4 6 7 8 9 11 12 13 15 16 18 19 20 22

0 1 3 4 6 7 9 11 12 14 16 17 19 21 23 24 26 28

0 2 4 6 7 9 11 13 15 17 20 22 24 26 28 30 32 34

1 3 5 7 9 11 14 16 18 21 23 26 28 31 33 36 38 40

1 3 6 8 11 13 16 19 22 24 27 30 33 36 38 41 44 47

1 4 7 9 12 15 18 22 25 28 31 34 37 41 44 47 50 53

2 5 8 11 14 17 21 24 28 31 35 38 42 46 49 53 56 60

0 2 5 9 12 16 20 23 27 31 35 39 43 47 51 55 59 63 67

0 2 6 10 13 17 22 26 30 34 38 43 47 51 56 60 65 69 73

0 3 7 11 15 19 24 28 33 37 42 47 51 56 61 66 70 75 80

0 3 7 12 16 21 26 31 36 41 46 51 56 61 66 71 76 82 87

0 0 1 1 4 4 4 5 8 9 9 10 13 14 15 16 18 19 20 22 23 24 26 28 28 30 32 34 33 36 38 40 38 41 44 47 44 47 50 53 49 53 56 60 55 59 63 67 60 65 69 73 66 70 75 80 71 76 82 87 77 82 85 93 82 88 94 100 88 94 101 107 93 100 107 114

(Kaynak : Beyer, W.H.: “Handbook of tables for probability and statistics”, The chemical rubber co., 1966, sayfa : 407.)

246

20


Tablo XII Wilcoxon İşaretli Sıra Testinde Kritik T Değerleri. n 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(iki yönlü)

! = 0.05

1 2 4 6 8 11 14 17 21 25 30 35 40 46 52

(iki yönlü)

! = 0.01

0 2 3 5 7 10 13 16 19 23 28 32 37

(Kaynak : Beyer, W.H.: “Handbook of tables for probability and statistics”, The chemical rubber co., 1966, sayfa : 400.)

247



249

Aralıklı veya oransal (Interval, ratio) (normal dağılım varsa )

Sıralayıcı (Ordinal)

Sınıflayıcı (Nominal)

Ölçüm düzeyleri

Mann-Whitney U (Bölüm 13)

bağımsız gruplarda Student ‘ t test (Bölüm 8)

(yukarıdakilere ek olarak) aritmetik ortalama varyans, standart sapma geometrik ortalama (oransal için) (Bölüm 3)

varyans analizi (Bölüm 12)

Kruskal Wallis test

eşlendirilmiş serilerde Student ‘t test (Bölüm 8)

Wicoxon işaretli sıra testi (Bölüm 13)

Tekrarlı ölçümlerde varyans analizi

Friedman test

Pearson Bravais ilişki katsayısı r, belirleme katsayısı r2 Kısmi ve çoklu korelasyon. Regresyon eşitliği. (Bölüm 11)

Spearman sıra farkı ilişki katsayısı rs (Bölüm 11)

Kontenjans Katsayısı (Bölüm 10) (kohort araştırmalarında.) RR, AR (vaka kontrol) OR (Bölüm 14)

Cochran Q testi

Mc-Nemar testi (sign test)

ki-kare testi (Bölüm 10)

ki-kare testleri (ki-kare, Yates’s ki-kare, Fisher kesin ki-kare) (Bölüm 10) (veya ε testi) (Bölüm 9)

sıklık dağılımı (Bölüm 2) tepe değer (mod) (Bölüm 3)

(yukarıdakilere ek olarak) ortanca (medyan) yüzdelik (persantil) (Bölüm 3)

İki değişken arasındaki ilişki

Birden çok tekrarlı ölçüm

Tek grup (önce / sonra)

Üç veya daha fazla bağımsız grup

Bağımsız iki grup

Geçerli tanımlayıcı istatistikler

Ek 1. Ölçüm düzeyleri ve geçerli istatistik işlemler tablosu



Ek 2 Kendimizi Sınayalım

Ek 2.1. Bölüm 1-4’e ilişkin sorular. Sorular : Soru 1-26 için verilen ifadelerden hangisi/hangileri doğrudur? 1.

I Yığın olayda her birim diğeri ile özdeştir. II Biyoistatistik bilimi yığın olayları inceler. III İstatistik bir belirsizlikte mantıklı kararlar alınmasını sağlayan yöntembilimdir. IV Bir sayısal verinin istatistik olması için veriye ilişkin olayın koşullara göre değişken olması gerekir. a) I

2.

I II III IV

d) II, III, IV

e) I, IV

b) II

c) I, II, IV

d) II, III, IV

e) IV

I Bir varsayım akla uygun ve kavramca açık olmalıdır. II Bir bilimsel araştırma amacına ulaşabilmek için bir plana uymak zorunda değildir. III Olaylar arasında nedensellik ilişkisi aramak varsayımın temel özelliklerinden biridir. IV Bir araştırma her zaman anayığın üzerinde yapılmalıdır. a) I

4.

c) II, IV

İstatistik, bilimsel araştırmalarda kullanılan ortak bir bilim dilidir. Bir varsayımın yanıtı kesin evet veya hayır olmamalıdır. Bir varsayımı kurmak için gözlem yapmaya gerek yoktur. Gözlem yapmanın olanaklı olmadığı olaylar için varsayım kurmanın yararı yoktur. a) I

3.

b) II

b) I, III

c) II, IV

d) III, IV

I

e) I, IV

İstatistik yeterli derecede bilinmeyen bütünler hakkında olası bilgi sağlama yoludur. II Biyoistatistik bilimi yığın olayları inceler ve bunlara ait genel bağıntılar elde etmeye çalışır. 251


III Verilerin toplanması bilimsel bir araştırmanın ilk adımıdır. IV Uygulamalı istatistik, istatistik teorisinin matematiksel temellerini kurar. a) I

5.

e) I, II

b) II

c) III

d) II, III, IV

e) IV

I Bilimsel araştırma, amaca uygun bilgiyi toplamak için tasarlanır. II İstatistik bilim dalı bir tümdengelim bilimidir. Bu nedenle mantıklı kararlar alma ve genelleme yapma olanağı verir. III Araştırma sorunu yeterince açık olmadıkça araştırma tasarımının aşamaları belirlenemez. IV Varsayımın; gözlenebilir, sınanabilir olaylara ilişkin olmasına gerek yoktur. b) II

c) II, IV

d) II, III, IV

e) Hiçbiri

I

Bir araştırmada, ne arandığını ve ne tür bilgiler sağlanacağını bilmek için bir varsayıma gerek vardır. II Neden değişkene bağlı olarak değiştiği düşünülen olaya bağımsız değişken denir. III Oransal ölçüm düzeyindeki bir değişkende sayılar arasındaki uzaklığın eşit olması gerekmez. IV Oransal bir ölçüm düzeyi gerçek bir sıfır noktasına sahip olmalıdır. a) I

8.

d) II, III, IV

İstatistik yeterli derecede bilinen bütünler hakkında olası bilgi sağlama yoludur. II Biyoistatistik bilimi tipik olayları inceler ve bunlara ait genel bağıntılar elde etmeye çalışır. III İstatistik bilimi tipik olayları inceler. IV Bir araştırma, ya bir durum saptama ya da bir ilişkiyi arama amacıyla yapılır.

a) I

7.

c) II, IV

I

a) I

6.

b) II

b) II

c) II, IV

d) II, III, IV

I

e) I, IV

Sıralayıcı ölçüm düzeyinde birimler arasındaki uzaklık birbirine eşittir. II Sıralamalı ölçüm düzeyinde sadece aralık özelliği vardır. 252


III Oransal ölçüm düzeyi sayı sisteminin tüm özelliklerini taşır. IV Nitel değişkenler sınıflayıcı ve sıralayıcı ölçüm düzeylerinde incelenirler. a) I

9.

I II III IV

b) II

c) III, IV

d) II, III, IV

e) I, IV

Sayı sistemi özelliklerini taşımalarına göre ölçüm düzeyleri 3 tanedir. Sıralamalı ölçüm düzeyinde sadece aralık özelliği vardır. Nitel değişkenler aralıklı ve oransal ölçüm düzeyinde incelenirler. Bir değişkenin sıralayıcı ölçüm düzeyinde incelenebilmesi için, sayı sisteminin sıra ve aralık özelliklerini taşıması gerekir. a) I

b) II

c) II, IV

d) II, III, IV

e) Hiçbiri

10. I

Verilerin gruplandırılmasında sınıf sayısı araştırmanın konusuna bağlı olarak değişir. II Verilerin (gözlem değerlerinin) gruplandırılmasında sınıf sayısının 13 olması şarttır. III % 95 birikimli yüzde sıklık değerine karşılık gelen gözlem değeri en küçük değerdir. IV Sınıflayıcı ölçüm düzeyinde incelenen değişkenler için grafik türü olarak histogram kullanılır. a) I

11. I II III IV

b) II

c) II, IV

d) I, II

e) I, IV

Grafikler, tabloları herkesin anlayabileceği hale getirir. Sürekli değişkenler tanım aralığında her değeri alabilirler. Parametreler, istatistiklerin tahmin değerleridir. X değişkenine ait tüm verileri özetleyen değerlere tipik değerler denir. a) I

b) II

c) II, IV

d) I, II, IV

12. I

e) I, IV

X serisinin aritmetik ortalaması 4 iken Y= 2X+5 serisinin aritmetik ortalaması 13 olur. II Varyans, gözlem değerlerinin aritmetik ortalamadan sapmalarının karelerinin aritmetik ortalamasıdır. III İncelenen bir seride değişkenlik düzeyi yüksek ise seriyi temsil etmek için varyans kullanılır. 253


IV Örnekleme ait toplanma ve dağılma ölçülerine istatistik adı verilir. a) I

b) II

c) II, IV

d) I, II, IV

e) IV

13. I Varyans, standart sapmanın pozitif kareköküdür. II Ortanca, serideki değerlerin tümüne bağlı değildir. III Sayısal verinin istatistik olabilmesi için gözlem sonucu elde edilmesi yeterlidir. IV X değişkeninin aritmetik ortalaması 5'e eşit ise, Y = X + 5 değişkeninin aritmetik ortalaması 6'ya eşit olur. a) I

14. I II III IV

b) II

c) II, IV

d) II, III

e) I, IV

Bütün X değerleri negatif ise varyans değeri negatif olur. Bir değişkene ait verileri özetleyen değerlere tipik değerler adı verilir. Standart sapma toplanma ölçüsü olarak kullanılır. Aritmetik ortalama, daima, gözlem değerlerinin orta noktasını gösterir. a) I

b) II

c) II, IV

d) II, III, IV

e) I, IV

15. I Gözlem değerlerinden en sık tekrarlanan değer mod değeridir. II Ortalamaların en duyarlısı mod, en duyarsızı aritmetik ortalamadır. III Eğer seri terimleri geometrik olarak artıyor yada azalıyorsa ortanca yerine aritmetik ortalama hesaplanır. IV Seri terimlerinin aritmetik ortalamadan ayrılışlarının karelerinin aritmetik ortalamasına varyans denir. a) I

b) II

c) II, IV

d) II, III, IV

16. I

e) I, IV

Değişim katsayısı, ortalamanın standart sapma içindeki yüzde büyüklüğüdür. II Anayığında hesaplanan toplanma ölçülerine istatistik adı verilir. III Gözlemlerin aritmetik ortalamadan olan farklarının toplamı minimumdur. IV Medyan sıralı bir serideki terimlerin ortasında yer alan değerdir. a) I

b) II

c) II, IV

d) IV

e) I, IV 254


17. I Seride en sık tekrarlanan değere tepe değer adı verilir. II Sıralamalı ölçüm düzeyinde incelenen bir değişken için aritmetik ortalama hesaplanır. III Medyan(Ortanca) serideki uç değerlerden etkilenmez. IV X serisinin varyansı 4 iken Y= 2X+ 5 serisinin varyansı 16 olur. a) I

18. I II III IV

d) I, III, IV

e) I, IV

b) II

c) II, IV

d) II, III, IV

e) I, IV

Bir istatistik seride mod bir değişkenlik ölçüsüdür. Geometrik ortalama bir dağılım ölçüsüdür. Parametreler, istatistiklerin tahmin değerleridir. Ortalama mutlak sapma bir toplanma ölçüsüdür. a) I

20. I II III IV

c) II, IV

Seride en sık tekrarlanan değere medyan adı verilir. Gözlemlerin aritmetik ortalamadan olan farklarının toplamı sıfırdır. Tepe değer sıralı bir serideki terimlerin ortasında yer alan değerdir. Anayığında hesaplanan toplanma ölçülerine parametre adı verilir. a) I

19. I II III IV

b) II

b) II

c) II, IV

d) II, III, IV

e) Hiçbiri

Olasılık değeri -1 ile +1 arasında değişir. A ve B bağımsız iki olay ise P(A ve B) = P(A) + P(B) A ve B Bağdaşmayan iki olay ise P(A veya B)= P(A) x P(B) A ve B bağımlı olaylar ise P(A ve B)=P(A) x P(B|A) a) I

b) II

c) II, IV

d) II, III, IV

e) IV

21. I

Bir denemede "başarı" olayının gerçekleşmesi olasılığı p=0.01 ve birbirinden bağımsız deneme sayısı (n) 200'e eşit ise P(X < 2) olasılığı Binom dağılımı kullanılarak hesaplanır. II Bir denemede "başarı" olayının gerçekleşmesi olasılığı p=0.50 ve birbirinden bağımsız deneme sayısı 5'e eşit ise P(X < 2) olasılığı Binom dağılımı kullanılarak hesaplanır. III Eğer iki olay bağımsız ise, bu iki olay kesinlikle bağdaşmazdır. IV Eğer iki olay bağımlı ise, A ve B olaylarının birlikte gerçekleşmesi olasılığı P(A ve B) = P(A) x P(B) ifadesi ile hesaplanır. a) I

b) II

c) II, IV

d) II, III, IV

255

e) I, IV


22. I Biyolojik değişkenler genellikle normal dağılıma sahiptir. II Binom dağılımında ortalama (n x p)’ye, varyans (n x p x q)’ya eşittir. III Poisson bölünmesinde ortalama değer varyans değerine eşittir. IV Bir toplumda boy değişkeninin ( X ) ortalaması 175 ve varyansı 100'e eşit olan normal dağılıma sahip olduğunu varsayalım. Bu toplumda P(X < 175) = 0.45 'tir. a) I, II, III

b) II

c) II, IV

d) II, III, IV

e) I, IV

23. I

Bir toplumda boy değişkeninin ( X ) ortalaması 175 ve varyansı 100'e eşit olan normal dağılıma sahip olduğunu varsayalım. Bu toplumda P(X < 185) = 0.8413’tir. II Bir toplumda boy değişkeninin ( X ) ortalaması 175 ve varyansı 100'e eşit olan normal dağılıma sahip olduğunu varsayalım. Bu toplumda P (X > 195) = 0.1587’dir. III Birleşik olaylarda başarı olasılığı -1≤p≤+1 arasında değişir. IV Bir toplumda boy değişkeninin ( X ) ortalaması 175 ve varyansı 100’e eşit olan normal dağılıma sahip olduğunu varsayalım. Bu toplumda P(X > 185) = 0.8413’tir. a) I

24. I II III IV

c) II, IV

d) II, III, IV

e) I, IV

Özel çarpma kuralı bağdaşmayan olaylar için geçerlidir. A ve B bağdaşmayan iki olay ise P(A ve B) = P(A).PA(B) A ve B bağımsız iki olay ise P(A ve B)=P(A). P(B) A ve B bağdaşan iki olay ise P(A veya B)= P(A)+P(B)-P(A ve B) a) I

25. I II III IV

b) II

b) II

c) III, IV

d) II, III, IV

e) I, IV

A ve B bağdaşan iki olay ise P(A veya B)=P(A)+P(B)-P(A ve B) A ve B bağımsız iki olay ise P(A ve B) = P(A) + P(B) A ve B bağdaşmayan iki olay ise P(A veya B)= P(A) x P(B) A ve B bağımlı olaylar ise P(A ve B)=P(A) x P(B\A) a) I

b) II

c) II, III

d) II, III, IV

e) I, IV

26. I Olasılık değeri 0 ile +1 arasında değerler alır. II Olasılık değerleri -1 ile 0 arasında değerler alır. 256


III A ve B ayrık iki olay ise P(A veya B)=P(A)+P(B) IV A ve B ayrık iki olay ise P(A veya B)=P(A)xP(B) a) I, III

b) II

c) II, IV

d) II, III, IV

e) I, IV

27. “Rastlantısal olarak seçilen deneklerde incelenen değişkene …………… değişken adı verilir” ifadesinde boş bırakılan yere uygun seçenek aşağıdakilerden hangisidir? a) Bağımlı

b) Bağımsız

c) Rastlantısal

d) Nitel

e) Nicel

28. Aşağıdaki değişkenlerden hangisi sınıflayıcı ölçüm düzeyinde incelenir? a) b) c) d) e)

Kan Grubu Bebek ölüm hızı Günlük sigara içme adedi Kolesterol değeri Yaş

29. Aralıklı ve sıralayıcı ölçüm düzeyinde ortak olan sayı sisteminin özellik/özellikleri nelerdir? a) Sıra ve aralık

b) Sıra ve oran

c) Sınıf ve sıra

d) Sıra

e) Sınıf

30. Nitel değişkenler hangi ölçüm düzeylerinde incelenirler? a) b) c) d) e)

Sınıflayıcı – Oransal Sıralayıcı – Sınıflayıcı Aralıklı – Oransal Sıralayıcı – Aralıklı Sınıflayıcı - Aralıklı

31. Aşağıdaki değişkenlerden hangisi oransal ölçüm düzeyinde incelenir? a) Kan Grubu b) Bebek ölüm hızı c) Sigara içme durumu (içmiyor/az/çok) 257


d) Hastanın eğitim düzeyi(ilk/orta/lise/yüksekokul) e) Saç rengi

32. Aşağıdaki değişkenlerden hangisi sınıflayıcı ölçüm düzeyinde incelenmez? a) b) c) d) e)

Göz rengi Sistolik kan basıncı Cinsiyet Kan Grubu Tümör yerleşim yeri

33. Oransal ve aralıklı ölçüm düzeyinde ortak olan sayı sisteminin özellikleri nelerdir? a) b) c) d) e)

Sıra ve aralık Sıra ve oran Sınıf, sıra ve aralık Sıra, aralık ve oran Sınıf ve oran

34. Aşağıdaki değişkenlerden hangisi oransal ölçüm düzeyinde incelenir? a) b) c) d) e)

Göz rengi Diastolik kan basıncı Cinsiyet Hastalık tanısı Tümör yerleşim yeri

35. Aşağıdakilerden hangisi/hangileri grafik sunumunun yararlarındandır? I. Tabloların kolay anlaşılmasını sağlamak II. Olayları karşılaştırmak III. Ara değer bulmak IV. Konu üzerindeki ilgiyi artırmak a) I

b) III

c) II ve III

d) II ve IV

258

e) I, II, III ve IV


36. Aşağıdaki grafik türlerinden hangisi/hangileri sınıflayıcı ölçüm düzeyinde incelenen bir değişken için çizilir? I. Çubuk grafik II. Çizgi grafik III. Daire dilimleri grafiği IV. Histogram a) II ve III

b) IV

c) I ve III

d) II, III ve IV

e) II ve IV

37. Aşağıdaki değişkenlerden hangisi/hangileri için sütun grafik türü kullanılabilir? I. Cinsiyet II. Kan grubu III. Yaş IV. Doğum şekli a) I

b) III

c) II ve III

d) I, II ve IV

e) I, II, III ve IV

38. Oransal ölçüm düzeyinde incelenen sürekli bir değişken için hangi grafik türünün (türlerinin) kullanılması uygun olur? I. Çubuk grafik II. Çizgi grafik III. Histogram IV. Daire dilimleri grafiği a) I

b) IV

c) II ve III

d) II, III ve IV

e) I ve IV

39. Oransal ve Aralıklı ölçüm düzeyinde incelenen değişkenler için aşağıdaki grafik türlerinden hangisi/hangilerinin kullanımı daha uygundur? I. Histogram II. Daire dilimleri grafiği III. Çizgi grafik IV. Çubuk grafik a) I

b) III

c) II ve IV

d) III ve IV

259

e) I ve III


40. Aşağıdaki değişkenlerden hangisi/hangileri için çizgi grafik türü kullanılmaz? I. Son canlı doğumun yapıldığı yer II. Yaşlara göre 5 yaş altı çocuklarda boy uzunluğu III. Gebelik sayısına göre hemoglobin değeri IV. İlköğretim okullarındaki cinsiyet dağılımı a) II ve III

b) II

c) I ve IV

d) II, III ve IV

e) II ve IV

41. Aşağıdaki değişkenlerden hangisi/hangileri için Daire dilimleri grafik türü kullanılabilir? I. Cinsiyet II. Kan grubu III. Yaş IV. Doğum şekli a) I

b) III

c) II ve III

d) I, II ve IV

e) I, II, III ve IV

42. Sınıflayıcı ölçüm düzeyinde incelenen kesikli bir değişken için hangi grafik türünün (türlerinin) kullanılması uygun olur? I. Çubuk grafik II. Çizgi grafik III. Histogram IV. Daire dilimleri grafiği a) I

b) IV

c) II ve III

d) II, III ve IV

e) I ve IV

43. Aşağıdakilerden hangisi/hangileri grafik sunumunun yararlarından değildir? I. Tabloların kolay anlaşılmasını sağlamak II. Olayları karşılaştırmak III. Ara değer bulmak IV. Konu üzerindeki ilgiyi artırmak a) I

b) III

c) II ve III

d) II ve IV 260

e) Hiçbiri


44. Histogram grafik türü aşağıdaki değişkenlerden hangisi için kullanılabilir? a) Eğitim düzeyi

b) Kan Grubu

c) Yaş

d) Doğum şekli

e) Cinsiyet

45. Aşağıdaki değişkenlerden hangisi/hangileri için çizgi grafik türü kullanılır? I. Son canlı doğumun yapıldığı yer II. Yaşlara göre boy uzunluğu III. Gebelik sayısına göre hemoglobin değeri IV. İlköğretim okullarındaki cinsiyet dağılımı a) II ve III

b) II

c) I ve IV

d) II, III ve IV

e) II ve IV

46. Aşağıda verilen sınıflanmış seride salt sıklık sütununa ait değerler hangileridir? Sınıflar (den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 a) b) c) d) e)

Çetele III IIIII IIIII III IIIII I IIII

3, 4, 7, 6, 4 3, 8, 16, 22, 26 11.5, 19.2, 30.8, 23.1, 15.4 11.5, 30.8, 61.5, 84.6, 100.0 3, 5, 8, 6, 4

47. Yukarıda verilen seride (soru 46) birikimli sıklık sütununa ait değerler hangileridir? a) b) c) d) e)

3, 8, 16, 22, 26 3, 4, 7, 6, 4 11.5, 19.2, 30.8, 23.1, 15.4 11.5, 30.8, 61.5, 84.6, 100.0 3, 5, 8, 6, 4

48. X serisinin aritmetik ortalaması 12, standart sapması 6’dır. Buna göre, Y = 2X - 2 serisinin aritmetik ortalaması kaça eşittir? a) 20

b) 22

c) 12

d) 6

e) 16 261


1 49. X serisinin aritmetik ortalaması 12, standart sapması 6’dır. Buna göre y= x +2 2 serisinin standart sapması kaça eşittir? a) 9

b) 3

c) 6

d) 36

e) 5

50. “Hesaplanan toplanma ve dağılma ölçüleri anayığına ait ise …………………, anayığından rastgele seçilmiş bir örnekleme ait ise …………… adını alır” ifadesinde boş bırakılan yerlere sırası ile uygun seçenek aşağıdakilerden hangisidir? a) b) c) d) e)

bağımlı değişken; bağımsız değişken toplum; örneklem istatistik; parametre parametre; istatistik bağımsız değişken; bağımlı değişken

Sınıflar (den az)

fi

80-88 88-96 96-104 104-112 112-120 120-128 128-136

6 11 18 24 15 9 4

Yukarıda verilen sınıflanmış seri için aşağıdaki 51 - 56 numaralı soruları yanıtlayınız. 51. Verilen serinin aritmetik ortalaması kaça eşittir? a) 106.80

b) 87

c) 107.20

d) 105.83

e) 132

52. Serinin yayılma genişliği kaça eşittir? a) 132

b) 48

c) 4.58

d) 106.83

e) 107.20

53. Serinin modu kaça eşittir? a) 106.83

b) 87

c) 108

d) 107.20 262

e) 11.45


54. Serinin medyanı kaça eşittir? a) 87

b) 107.20

c) 106.83

d) 12.23

e) 11.45

55. Serinin standart sapması kaça eşittir? a) 11.45

b) 458

c) 149.57

d) 106.83

e) 12.23

56. Serinin değişim katsayısı kaça eşittir? a) 12.23

b) 48

c) 87

d) 11.45

e) 106.83

57. Aşağıdakilerden hangisi ya da hangileri toplanma ölçüsüdür? I. Aritmetik Ortalama II. Medyan III. Varyans IV. Tepe Değer V. Değişim Katsayısı a) I , II ve IV

b) III ve V

c) II, IV ve V

d) III

58. Xi: 4, 5, 9, 7, 3 serisinde aritmetik ortalama kaça eşittir? a) 5.6

b) 21.2

c) 21

d) 25.4

e) 12.07

59. Xi: 4, 5, 9, 7, 3 serisinde standart sapma kaça eşittir? a) 5.6

b) 2.41

c) 2.1

d) 25.4

e) 12.07

60. Xi: 4, 5, 9, 7, 3 serisinde değişim katsayısı kaça eşittir? a) %40

b) %43

c) %46

d) %55

e) %15

61. Xi: 4, 5, 9, 7, 3 serisinde ortanca kaça eşittir? a) 5

b) 3

c) 9

d) 7

e) 4 263

e) II, III ve IV


62. Xi: 4, 5, 9, 7, 3 serisinde değişim aralığı kaça eşittir? a) 6

b) 2

c) 4

d) 3

e) 9

63. Xi: 4, 5, 9, 7, 3 serisinde varyans kaça eşittir? a) 5.8

b) 6.2

c) 2.1

d) 2.4

e) Hiçbiri

64. Xi: 4, 5, 9, 9, 7, 3 serisinde ortanca kaça eşit olur? a) med.=6

b) med.=7

c) med.=5

d) med.=9

e) med.=3

65. Xi: 4, 5, 9, 9, 7, 3 serisinde tepe değer kaça eşit olur? a) mod.= 3

b) mod.= 4

c) mod.= 9

d) mod.= 5

e) mod.= 7

66. Xi: 4, 5, 9, 9, 7, 3 serisinde aritmetik ortalama kaça eşit olur? a) 6.80

b) 7.65

c) 6.17

d) 6

e) 8

67. Xi: 4, 5, 9, 9, 7, 3 serisinde standart sapma kaça eşit olur? a) 4.80

b) 8

c) 2.56

d) 6

e); Hiçbiri

68. Xi: 4, 5, 9, 9, 7, 3 serisinde değişim katsayısı kaça eşit olur? a) %34

b) %42

c) %46

d) %51

e) Hiçbiri

69. Aşağıdakilerden hangisi ya da hangileri değişkenlik ölçüsüdür? I. Aritmetik Ortalama II. Medyan III. Varyans IV. Tepe Değer V. Değişim Katsayısı

264


a) I, II, ve IV

b) III ve IV

c) II, IV ve V

d) III ve V

e) II, III ve IV

70. X serisinin ortalaması 56, standart sapması 12 iken; Y=0.5X-3 serisinin ortalaması ve varyansı kaça eşit olur? a) b) c) d) e)

71. X serisinin ortalaması 28, standart sapması 6 iken; Y=0.5X-3 serisinin ortalaması ve standart sapması kaça eşit olur? a) b) c) d) e)

Bir çalışmada açlık kan şekeri değişkeni ölçülmüştür. Açlık kan şekeri değişkenine ait sıklık tablosu sınıflanmış seri şeklinde düzenlenmiştir 72 – 81 no.lu soruları aşağıda verilen sıklık tablosunu kullanarak cevaplayınız. Sınıflar (den az) mg/dl

fi

80-86 86-92 92-98 98-104 104-110 110-116 116-122

6 11 17 24 20 11 5

72. Açlık kan şekeri değerlerinin aritmetik ortalaması aşağıdakilerden hangisidir? a) 94

b) 101.25

c) 101

d) 102.23 265

e) 102.64


73. Açlık kan şekeri değerlerinin standart sapması aşağıdakilerden hangisidir? a) 9.31

b) 8.09

c) 36

d) 65.49

e) 86.71

74. Açlık kan şekeri değerlerinin medyan (ortanca) değeri aşağıdakilerden hangisidir? a) 101.82

b) 101

c) 102.64

d) 101.25

e) 104.14

75. Açlık kan şekeri değerlerinin modu (tepe değeri) aşağıdakilerden hangisidir? a) 101.82

b) 102.64

c) 104.14

d) 102.23

e) 101.25

76. Bu serideki bireylerin yüzde kaçının açlık kan şekeri değeri 98-104 mg/dl arasında değişir? a) 24

b) 25.53

c) 25

d) 51.55

e) 25.77

77. Açlık kan şekeri değeri 110 mg/dl nin altında olan kaç kişi vardır? a) 20

b) 78

c) 36

d) 29

e) 79

78. Çalışmadaki bireylerin yüzde kaçının açlık kan şekeri değeri 98mg/dl nin üzerindedir? a) 74.23

b) 51.55

c) 61.70

d) 63.83

e) 25.53

79. Açlık kan şekeri değişkeninin dağılım aralığı kaça eşittir? a) 9.22

b) 7.92

c) 36

d) 37

e) 5

80. Açlık kan şekeri değişkeninin değişim katsayısı kaça eşittir? a) 9.22

b) 7.92

c) 9.31

d) 8.09 266

e) 36


81. Açlık kan şekeri değişkeni için çeyrekler arası yarı genişlik değeri kaça eşittir? a) 5.49

b) 6.73

c) 13.46

d) 10.99

e) 94.29

82. Bir laboratuarda yapılan 40 tahlilden 38’i doğru sonuç vermektedir(kusursuzdur). Bu laboratuarda tahlil yaptıran 3 kişiden 3’ünün de doğru sonuç alması olasılığı kaça eşittir? a) 0.86

b) 0.01

c) 0.14

d) 0.95

e) 0.05

83. Bir hastanede doğan bebeklerin doğum ağırlıkları ortalaması 3050± 230 gr olarak hesaplanmıştır. Yılda 780 bebeğin doğduğu bu hastanede bebeklerin doğum ağırlıklarının 2500 gramın altında olması olasılığı kaça eşittir? a) 0.492

b) 0.50

c) 0.001

d) 0.008

e) 0.498

84. Bir kliniğin acil servisine haftada ortalama 4 gıda zehirlenmesi vakası gelmektedir. Buna göre bu kliniğe bir haftada 2 gıda zehirlenmesi vakası gelmesi olasılığı kaça eşittir? a) 0.436

b) 0.090

c) 0.147

d) 0.493

e) 0.856

85. Tedavide başarı şansı 0.70 olan bir hastalığa yakalanan 5 kişiden en az 3’ünün hastalıktan kurtulma olasılığı kaça eşittir? a) 0.31

b) 0.53

c) 0.69

d) 0.42

e) 0.84

86. Toplumda erkeklerde X hastalığı görülme sıklığı 0.003’tür. 2000 erkek için ölçüm yapıldığında en az 2 erkekte X hastalığı görülme olasılığı kaça eşit olur? a) 0.014

b) 0.036

c) 0.964

d) 0.877

267

e) 0.983


87 – 90 numaralı soruları yukarıda verilen grafiği dikkate alarak yanıtlayınız. 87. Sistolik kan basıncı (SKB) değerlerinin normal dağılım gösterdiği ön kabulü ile çalışmanın yapıldığı toplumdan rastlantısal olarak seçilen bir bireyin SKB’nın 90mmHg’nın altında çıkması olasılığı kaça eşit olur? a) 0.4987

b) 0.0013

c) 0.5013

d) 0.9987

e) 0.0120

88. 1000 kişilik bir toplumda kaç kişinin SKB 140mmHg’nın üzerinde olur? a) 477

b) 977

c) 23

d) 523

e) 48

89. Seçilen bir bireyin SKB’nın 90mmHg ile 150mmHg arasında olması olasılığı kaça eşit olur? a) 0.0013

b) 0.4987

c) 0.5013

d) 0.0026

e) 0.9973

90. SKB en yüksek olan bireylerin % 5’ine ilaç tedavisi uygulanacaktır. İlaç verilmesi için bireyin SKB’nın kaç olması gerekir? a) 121.3

b) 103.5

c) 165.5

d) 136.5

e) 145

91. Bir hastanenin acil yoğun bakım servisine(AYBS) günde ortalama 3 hasta yatırılmaktadır. Herhangi bir günde AYBS’ne 5 hasta yatırılması olasılığı kaça eşittir? a) 0.1008

b) 0.1404

c) 0.8992

d) 0.8596 268

e) 0.2240


92. A hastalığına yakalanma olasılığı 0.004 olarak bilinmektedir. 1000 kişinin yaşadığı bir kasabada en çok 2 kişinin bu hastalığa yakalanması olasılığı kaça eşit olur? a) 0.8536

b) 0.7621

c) 0.0902

d) 0.1464

e) 0.2379

93. Belli bir kanser türünde bir hastanın tedaviden sonra 5 yıl yaşama olasılığı 0.70 ise, söz konusu kanser türüne yakalanan 7 hastanın 5’nin tedaviden sonra 5 yıl yaşama olasılığı kaça eşittir? a) 0.6354

b) 0.0250

c) 0.3177

d) 0.1277

e) 0.6823

94. Belli bir grip türüne karşı uygulanan aşının yan etki gösterme olasılığı %10’dur. Aşı uygulanan 5 bireyden en az 1 tanesinde yan etki görülmesi olasılığı kaça eşit olur? a) 0.5905

b) 0.4095

c) 0.2952

d) 0.7048

e) 0.0591

Cinsiyet

Sigara İçen (S +)

Sigara İçmeyen (S - )

Toplam

Kadın Erkek Toplam

200 750 950

800 250 1050

1000 1000 2000

Yukarıdaki tabloyu kullanarak 95 – 97 numaralı soruları hesaplayınız. 95. Bu gruptan seçilen bir bireyin kadın veya sigara içmeyen bir birey olma olasılığı kaça eşittir? a) 0.5

b) 0.475

c) 0.1

d) 0.875

e) 0.625

96. Bu gruptan seçilen bir bireyin erkek ve sigara içen bir birey olma olasılığı kaça eşittir? a) 0.475

b) 0.625

c) 0.6

d) 0.375

269

e) 0.9


97. Bu gruptan seçilen bir bireyin erkek veya kadın olma olasılığı kaça eşittir? a) 0

b) 1

c) 0.5

d) 0.475

e) 0.525

98. Bir hastanenin acil ameliyathanesinde hafta sonlarında ortalama 4 hasta ameliyat edilmektedir. Her hangi bir hafta sonunda en az 3 hastanın ameliyat edilmesi olasılığı kaça eşit olur (poisson dağılımı)? a) 0.19

b) 0.90

c) 0.09

d) 0.76

e) Hiçbiri

99. Bir hastanenin acil ameliyathanesinde hafta sonlarında ortalama 1 hasta ameliyat edilmektedir. Her hangi bir hafta sonunda sadece 1 hastanın ameliyat edilmesi olasılığı kaça eşit olur (poisson dağılımı)? a) 0.00

b) 0.50

c) 0.19

d) 0.37

e) Hiçbiri

100. Nadir rastlanan bir metabolizma hastalığının görülme sıklığı 0.0001 olarak bilinmektedir. 20 000 kişinin yaşadığı bir bölgede 3 kişinin bu hastalığa yakalanması olasılığı kaça eşittir? a) 0.0498

b) 0.1353

c) 0.8196

d) 0.1804

270

e) 0.2241


Ek 2.1 Yanıtlar: 1d 2c 3b 4e 5e 6a 7e 8c 9e 10 a 11 d 12 d 13 d 14 b 15 e 16 d 17 d 18 c 19 e 20 e 21 b 22 a 23 a 24 c 25 e

26 a 27 c 28 a 29 d 30 b 31 b 32 b 33 a 34 b 35 e 36 c 37 d 38 c 39 e 40 c 41 d 42 e 43 e 44 c 45 a 46 e 47 a 48 b 49 b 50 d

51 a 52 b 53 d 54 c 55 e 56 d 57 a 58 a 59 b 60 b 61 a 62 a 63 a 64 a 65 c 66 c 67 c 68 b 69 d 70 a 71 c 72 c 73 a 74 d 75a

271

76 b 77 b 78 d 79 c 80 a 81 b 82 a 83 d 84 c 85 e 86 e 87 b 88 c 89 e 90 d 91 a 92 e 93 c 94 b 95 e 96 d 97 b 98 d 99 d 100 d



Ek 2 Kendimizi Sınayalım

Ek 2.2. Bölüm 5-16’ya ilişkin sorular. Sorular : Soru 1-25 için verilen ifadelerden hangisi/hangileri doğrudur? 1.

I

Standart hata hangi büyüklükte olursa olsun, örneklem istenilen büyüklükte olabilir. II Örneklem, anayığını temsil gücüne sahip olmalıdır. III Olasılıklı örnekleme yönteminde eşit şans ilkesi geçerlidir. IV Küme örnekleme yöntemi orantılı ve orantısız olmak üzere iki şekilde yapılır. a) I

2.

d) II, III, IV

e) I, IV

b) II

c) II, IV

d) II, III, IV

e) Hiçbiri

I Standart hatayı azaltmanın bir yolu denek sayısını arttırmaktır. II Örneklemden elde edilen standart sapmaların oluşturduğu dağılımın standart sapmasına standart hata adı verilir. III Kuramsal örnekleme dağılımının ortalaması örnek büyüdükçe anayığının ortalamasına yaklaşır. IV Gruplar, gerekli sayıda birim içermedikçe yeterli olma özelliğini taşıyamaz. a) I

4.

c) II, III

I Örnekleme anayığındaki tüm birimlerin sayılması işlemidir. II Yargısal örnekleme kullanılarak yapılan araştırmaların bilimsel geçerliliği daha fazladır. III Standart hata kuramsal örnekleme dağılımının ortalamasına eşittir. IV Olasılıklı örnekleme yöntemlerinin tümüne araştırma tasarımı denir. a) I

3.

b) II

b) I, III

c) II, IV

d) III, IV

e) I, II, IV

I Standart hata, kuramsal örnekleme dağılımının standart sapmasıdır. II Örneklem uzunluğunu arttırdığımızda, anayığın parametrelerini daha geniş bir aralıkta tahmin edebiliriz. 273


III Güven düzeyi arttırıldıkça (yanılma düzeyi düşürüldükçe) güven aralığının genişliği daralır. IV μ = 10 değerine sahip bir anayığından çekilen örneklemde her gözlem değeri, μ = 6 değerine sahip bir anayığından çekilen örneklemdeki gözlem değerlerinin her birinden büyüktür. a) I

5.

I II III IV

d) II, III, IV

e) I, II

b) I, III, IV

c) II, IV

d) III, IV

e) I, IV

I

Hipotez testlerinin uygulanması sırasında ortaya çıkabilecek iki tip hata vardır. II İstatistiksel hipotezler, örneklemlerin çekildiği toplum parametreleri ile ilgili önermelerdir. III Hipotez testlerinin çözümlenmesinde ilk adım test istatistiğinin belirlenmesidir. IV Hipotez testlerinin amacı, araştırıcıya, toplum hakkında bir karara varma konusunda yardımcı olmaktır. a) I

7.

c) II, IV

Hipotez testlerinin bir diğer adı önemlilik testleridir. Hipotezin yönünü H0 hipotezi belirler. Sıfır hipotezi, bir testte öne sürülen ve test edilmek istenen hipotezdir. Örneklem uzunluğunu arttırdığımızda, anayığın parametrelerini daha dar bir aralıkta tahmin edebiliriz. a) I

6.

b) II

b) I, III

c) II, IV

d) III, IV

e) I, II, IV

I

H1 hipotezi gerçekte doğru iken bu hipotezin kabul edilmesi testin gücü (1- β) olarak adlandırılır. II H0 hipotezi gerçekte doğru iken bu hipotezin reddedilmesi I. Tip hata (α) olarak adlandırılır. III H0 hipotezi gerçekte yanlış iken bu hipotezin reddedilmesi II. Tip hata (β) olarak adlandırılır. IV Hesapla bulunan test istatistiği değeri, teorik tablo değerinden küçük ise H1 hipotezi kabul edilir. a) I

b) I, II

c) II, IV

d) III, IV

274

e) I, II, IV


8.

I

H1 hipotezi gerçekte doğru iken bu hipotezin kabul edilmesi testin gücü (1- β) olarak adlandırılır. II Eğer H1 hipotezi 0.05 anlam düzeyinde rededildiyse, 0.01 anlam düzeyinde de reddedilir. III Araştırmalarda, istatistik test sonuçları sadece Ho'ın reddedilmesi durumunda belirtilir. IV Student't testinin kullanımında anayığındaki dağılım ile ilgili hiçbir varsayım göz önüne alınmaz. a) I

9.

b) II

c) II, IV

d) II, III, IV

e) I, II

I

İki yönlü bir test kullanıldığında, Ho hipotezi, test istatistiğinin pozitif yada negatif yöndeki uç değerleri için reddedilir. II Serbestlik derecesinin veya örneklem uzunluğunun büyük olduğu durumlarda Student't dağılımı normal dağılıma yaklaşır. III Eğer Ho tek yönlü bir test ile reddedildiyse, iki yönlü bir testte de aynı anlam düzeyi için reddedilir. IV 4 farklı grubun ortalamalarının karşılaştırılmasında Student't testi kullanılır. a) I

b) I, III

c) I, II

d) III, IV

e) I, IV

10. I

Parametrik testler, ölçüm düzeylerinin tümünde geçerli olarak kullanılabilir. II Eşlenmiş seriler yöntemi iki küçük ve bağımsız örneklemle hesaplanan oranları karşılaştırmak için kullanılır. III İki ayrı grubun ortalama değerlerinin karşılaştırılmasında “Eşlendirilmiş serilerde Student't” testi kullanılır. IV Ki-kare testleri sadece normal dağılma sahip veriler için kullanılır. a) I

b) II

c) II, IV

d) II, III, IV

e) Hiçbiri

11. I

2 x 2 tablosunda, Ki-kare testinin kullanılabilmesi için beklenen sıklıkların her birinin en az 5 'e eşit olması gerekir. II Yates'in düzeltmeli ki-kare, serbestlik derecesinin 2 'ye eşit olduğu durumlarda geçerlidir. III 5 farklı grubun ortalamalarının karşılaştırılmasında Ki-kare testi kullanılır. IV 3 x 9 çapraz tabloda serbestlik derecesinin değeri 27'ye eşittir. a) I

b) I, III

c) II, IV

d) III, IV 275

e) I, IV


12. I

s.d. = 2 ve kuramsal sıklıklardan biri 5'ten küçük olan çapraz tablolarda Yates'in ki-kare testi kullanılır. II X ve Y arasında negatif bir ilişki var ve en küçük kareler doğrusu (0,0) noktasından geçmektedir. Bu verilere göre, X = 1 gözlem değeri için Y'nin tahmin değeri negatiftir. III Korelasyon katsayısı -1 ve +1'den sıfıra doğru yaklaştıkça ilişkinin gücü azalır. IV Eğer bütün X değerleri negatif ve bütün Y değerleri pozitif ise r negatif olmak zorundadır. a) I

b) I, III

c) II, III

d) III, IV

e) I, IV

13. I Eğer r > 0 ise, X arttığında Y'de artar. II X ile Y arasındaki en küçük kareler doğrusu X'in (0, 27) aralığındaki değerleri için hesaplandıysa, bu doğru denklemini kullanarak X = 112 değeri için Y değerini tahmin edebiliriz. III Korelasyon katsayısı her değeri alabilir. IV Regresyon analizinde bağımsız değişken bir ya da daha çok değişken tarafından etkilenen değişkendir. a) I 14. I II III IV

b) II

c) II, IV

d) II, III, IV

e) I, II

Regresyon analizi sadece değişkenler arasındaki ilişkinin gücünü ölçer. Korelasyon katsayısı -1'den küçük +1'den büyük olamaz. Eğer r < 0 ise, X arttığında Y de artar. Belirleme katsayısı, bağımlı değişkendeki değişkenliğin bağımsız değişken tarafından açıklanan kısmını gösterir. a) I

b) I, III

c) II, IV

d) III, IV

e) I, IV

15. I

Bir tanı testinde duyarlılık, gerçekten sağlam olanların test sonucunda yüzde kaçının sağlam olduğunu gösterir. II Hastalığı taşımayanların yüzde kaçının önerilen yöntemle tanınabildiğini özgüllük değeri verir. III Bir bilimsel araştırma yalnızca nedensellik ilişkisi kurmayı amaçladığında bir plana dayanmak zorundadır. IV Çözümleyici araştırmalar, olaylar arasında neden-sonuç bağıntısı kurmak amacıyla planlanmaktadır. a) I

b) II

c) III, IV

d) II, IV

276

e) I, II


16. I

Deney ve denetim kümeleri arasındaki fark, deney kümesinin etkenin dışında bırakılmasıdır. II Tanımlayıcı araştırmalar olaylar arasında bir neden-sonuç ilişkisi kurmayı amaçlar. III Tanımlayıcı araştırmalar, bir anayığında ilgili özelliklerin ne sıklıkta gözlendiğini saptamak amacıyla planlanmaz. IV Bir araştırma tasarımında önce hangi konuda, kimler üzerinde çalışılacağına sonra ne tip bir araştırma yapılacağına karar verilir. a) I

b) I, III

c) II, IV

d) III, IV

e) IV

17. I

Bir araştırma tasarımında, araştırma tipinin saptanması önemli adımlardan biridir. II Deney ve denetim gruplarıyla çalışıldığında, kullanılan etkisiz maddeye placebo denir. III Vaka serilerinde hasta grubuna ait özelliklerin dağılımı incelenir. IV Vaka-kontrol araştırmaları prospektif araştırmalardır. a) I

b) II

c) II, IV

d) II, III, IV

e) I, II, III

18. I

Kohort araştırmalarında insidans belirlenemediğinden Relatif Risk (RR) değeri hesaplanamaz. II Odds Ratio (OR) değeri 1’den büyük çıkarsa etkenin hastalıktan koruyucu olduğu söylenir. III Vaka serileri, analitik çalışmalar için ön bilgi sağlarlar. IV Vaka- Kontrol araştırmaları deneysel araştırmalar içinde yer alırlar. a) I

b) I, III

c) II, IV

d) III

e) I, IV

19. I Paralel kontrollü klinik çalışmalarda gruplar randomize olmalıdır. II Kohort araştırmaları ileriye dönük izleme çalışmalarıdır. III Çapraz kontrollü klinik çalışmada, her denek hem deney hem de kontrol grubunda yer alır. IV Kesitsel araştırmalar, gözlemsel araştırma tipi içinde yer alırlar. a) I

b) I, III

c) II, IV

d) I, II, III, IV

277

e) I, IV


20. I II III IV

Vaka- Kontrol araştırmaları prospektif araştırmalar içinde yer alırlar. Gözlemsel araştırmalarda, araştırmacının müdahalesi yoktur. Kesitsel araştırmalar, prevalans araştırmaları olarak da adlandırılır. Analitik araştırmalarda neden-sonuç ilişkisi aranmaz. a) I

b) II

c) II, IV

d) II, III

e) I, II

21. I

Paralel kontrollü klinik çalışmalarda gruplar rastlantısal olarak oluşturulmalıdır. II Paralel kontrollü klinik araştırmalar daima üç kör çalışılmalıdır. III Çapraz kontrollü klinik çalışmada hasta sayısının daha yüksek tutulması gerekir. IV Kesitsel araştırmalarda prevalans hesaplanır. a) I

22. I II III IV

c) II, IV

d) III, IV

e) I, IV

Prospektif araştırmalarda izleme yapılır. Vaka serileri, betimleyici çalışmalar için ön bilgi sağlarlar. Vaka- Kontrol araştırmaları deneysel araştırmalar içinde yer alırlar. Dış kontrollü klinik çalışmalarda gruplar randomize olmalıdır. a) I

23. I II III IV

b) I, III

b) II

c) II, IV

d) II, III, IV

e) I, II

Vaka serilerinde randomizasyon yapılmaz. Kesitsel araştırmalar, insidans araştırmaları olarak da adlandırılır. Analitik araştırmalarda neden-sonuç ilişkisi aranmaz. Kesitsel araştırmalarda insidans hesaplanır. a) I

b) II

c) II, IV

d) II, III, IV

e) I, II

24. I Retrospektif araştırmalarda izleme yapılır. II Gözlemsel araştırmalarda, araştırmacının müdahalesi yoktur. III Çapraz kontrollü klinik çalışmada, her denek hem deney hem de kontrol grubunda yer alır. IV Paralel kontrollü klinik çalışmalarda gruplar rastlantısal olarak oluşturulmalıdır. a) I

b) I, III

c) II, IV

d) II, III, IV 278

e) I, IV


25. I

Retrospektif araştırmalarda incelenen veriler araştırmanın başlama tarihinden önceki dönemle ilgilidir. II Sağkalım analizinde deneklerin tamamı sonlanana kadar izlemeye devam edilir. III Sağkalım analizinin amaçlarından biri de hastalıkların doğal seyrinin incelenmesidir. IV Yaşam tablosu yönteminde her sonlanma anı için ölüm olasılığı hesaplanır. a) I

26.

b) I, III

29.

e) I, IV

b) 2985

c) 2991

d) 2999

e) 2994

6000 öğrencisi olan bir okulda yapılacak bir araştırma için 300 öğrenci sistematik örnekleme yöntemi kullanılarak örnekleme seçilecektir. Başlangıç değeri olarak 14 numaralı öğrenci alınır ise örnekleme alınacak son öğrencinin numarası kaç olur? a) 6000

28.

d) III, IV

3000 öğrencisi olan bir okulda yapılacak bir araştırma için 200 öğrenci sistematik örnekleme yöntemi kullanılarak örnekleme seçilecektir. Başlangıç değeri olarak 6 numaralı öğrenci alınır ise örnekleme alınacak son öğrencinin numarası kaç olur? a) 3000

27.

c) II, IV

b) 5968

c) 5949

d) 5986

e) 5994

Aritmetik ortalaması= 80, standart sapması 12 olan bir anayığından 36’şar birimlik örnekler çekilerek oluşturulan kuramsal örnekleme dağılımının aritmetik ortalaması ve standart hata kaça eşit olur? a)

b)

d)

e)

c)

Standart hatanın 5 olduğu bir kuramsal örnekleme dağılımında çekilen örneklerin büyüklükleri 36’şar birim ise, bu dağılıma ilişkin anayığının aritmetik ortalaması kaça eşit olur? a) 5.48

b) 30

c) 5

d) 36

e) Hiçbiri 279


30.

5000 birimlik bir anayığından 100’er birimlik örnekler çekilerek oluşturulan kuramsal örnekleme dağılımının standart sapması 1.188 ise anayığına ait varyans kaça eşit olur? a) 100

31.

d) 12

e) 1.41

(n) birim sayısı büyür (n) birim sayısı küçülür (n) birim sayısı değişmez (n) birim sayısı güvenlik düzeyinden bağımsızdır Hiçbiri

Bir bölgede hipertansiyonun başlangıç yaşını belirlemek amacıyla yapılan bir araştırmada 25’er kişilik gruplar halinde örneklemler oluşturuluyor. Elde edilen kuramsal örnekleme dağılımının standart sapması 4 olduğuna göre bu bölgedeki bireylerin yaşlarının standart sapması kaça eşit olur? a) 400

33.

c) 144

Örneklem büyüklüğü (n) saptanırken güvenlik düzeyi yüksek tutulduğunda aşağıdakilerden hangisi gerçekleşir? a) b) c) d) e)

32.

b) 50

b) 25

c) 20

d) 625

e) 4

Ortalaması μ= 120 mmHg, varyansı: σ 2 = 25 mmHg olan bir toplumdan 20’şer birimlik çekilerek oluşturulan kuramsal örnekleme dağılımının ortalaması ve standart hata kaça eşit olur? a)

= 125; SX = 1.12

b)

= 120; SX = 20

c)

= 20; SX = 1.12

d)

= 120; SX = 1.12

e)

= 125; SX = 1.2

280


34.

Aritmetik ortalaması= 100, standart sapması 20 olan bir anayığından 100’er birimlik örnekler çekilerek oluşturulan kuramsal örnekleme dağılımının aritmetik ortalaması ve standart hata kaça eşit olur? a) b) c) d) e)

35.

“ ……………………, örneklem istatistiklerine ait kuramsal örnekleme dağılımının değişkenlik ölçüsüdür” ifadesinde boş bırakılan yer için uygun seçeneği işaretleyiniz. a) Standart Hata d) Varyans

36.

b) Standart Sapma e) Güven Aralığı

c) Değişim katsayısı

“İki örneklem ortalaması karşılaştırıldığında, p anlamlılık düzeyi 0.05’ten küçük ise ……………… kabul edilir” ifadesinde boş bırakılan yer için uygun seçeneği işaretleyiniz. a) Yokluk hipotezi b) Farksızlık hipotezi d) Homojenlik hipotezi e) Alternatif hipotez

37.

Çocuklarda diabet sıklığının 0.30 olduğu tahmin ediliyor. Bu konuda yapılacak bir çalışma için örneklem büyüklüğünü 0.05 örnekleme hatası ile %95 güven düzeyinde hesaplayınız. a) 323

38.

c) Sıfır hipotezi

b) 165

c) 84

d) 461

e) 460

Hiperlipidemi hastalarında kolesterol değerinin varyansının 225 mg/dl olduğu kabul edildiğinde, 6 mg/dl lik örnekleme hatası ile %95 güven düzeyinde örnekleme en az kaç kişi alınması gerekir? a) 25

b) 250

c) 225

d) 38

e) 5403

281


39.

Çocuklarda alerjik astım sıklığının %11.4 olduğu kabul edilmektedir. Bu konuda yapılacak bir araştırmada %3 örnekleme hatası ile alerjik astım sıklığı belirlenmek istenmektedir. Bu amaçla %95 güven düzeyi için en az kaç kişi örnekleme alınmalıdır ? (1 - α = 0.95 ). a) 203

40.

e) 113

b) 336

c) 197

d) 657

e) 155

b) 55

c) 58

d) 61

e) 62

1200 kişinin yaşadığı bir kasabada, diabet hastaları üzerinde yapılacak bir araştırma için örneklem büyüklüğü belirlenmek istenmektedir. Bu amaçla açlık kan şekeri değerleri 4 birimlik bir sapma(kabul edilebilir örnekleme hatası) ile tahmin edilmek isteniyor. 20 mg/dl standart sapma ile gerekli örneklem büyüklüğünü %95 güven düzeyi için hesaplayınız (1 - α = 0.95 ). a) 89

43.

d) 412

800 kişinin yaşadığı bir kasabada, Hipertansiyon hastaları üzerinde yapılacak bir araştırma için örneklem büyüklüğü belirlenmek istenmektedir. Bu amaçla sistolik kan basıncı değerleri 3 birimlik bir sapma (kabul edilebilir örnekleme hatası) ile tahmin edilmek isteniyor. 12mmHg standart sapma ile gerekli örneklem büyüklüğünü %95 güven düzeyi için hesaplayınız (1 - α = 0.95). a) 54

42.

c) 2076

Van ili ve yöresinde, hipertansiyon prevelansı %19’dur. Bu bölgede hipertansiyon ile ilgili yapılacak bir araştırmada %3 hata ile hipertansiyon prevelansı belirlenmek istenmektedir. Bu amaçla %95 güven düzeyi için en az kaç kişi örnekleme alınmalıdır ? (1 - α = 0.95 ). a) 335

41.

b) 432

b) 88

c) 83

d) 82

e) 84

Kolesterol düzeyini saptamak amacıyla yapılacak bir araştırma için örneklem büyüklüğü hesaplanmak isteniyor. Standart sapmanın 50 mg/dL olduğu bilinmektedir. 15 birimlik örnekleme hatası ile %95 güven düzeyinde en az kaç kişi örnekleme alınmalıdır? (1 - α = 0.95 ). a) 640

b) 13

c) 43

d) 42

e) 426 282


44.

Ülkemizde Hepatit B virüsü(HBV) taşıyıcılığının %7 olduğu kabul edilmektedir. Bu konuda yapılacak bir araştırmada %3 örnekleme hatası ile HBV taşıyıcılığının sıklığı belirlenmek istenmektedir. Bu amaçla %95 güven düzeyi için en az kaç kişi örnekleme alınmalıdır ? (1 - α = 0.95 ). a) 142

45.

b) 278

b) 0.18 - 0.32 e) 0.21 - 0.29

c) 0.34 - 0.51

b) 64.32 – 65.68 e) 39.4 – 49.8

c) 43.92 – 45.28

484 sağlıklı bireylerde ölçülen albümin değeri ortalaması 48.6g/l, standart sapma ise 6.2’dir. Bu değerlere göre Albümin düzeyine ilişkin %95 güven aralığı sınırları aşağıdakilerden hangisidir? a) 42.40 – 54.80 d) 38.68 – 60.75

48.

e) 2778

65 yaş üstü 225 sağlıklı bireylerde ölçülen albümin değeri ortalaması 44.6g/l, standart sapma ise 5.2’dir. Bu değerlere göre Albümin düzeyine ilişkin %95 güven aralığı sınırları aşağıdakilerden hangisidir? a) 44.25 – 44.95 d) 44.55 – 44.64

47.

d) 897

Rehabilitasyon programı sonrasında, inme geçiren 160 hastanın 40’ında motor iyileşme olduğu görülmüştür. Buna göre inmeli olgularda motor iyileşmenin %95 güven düzeyindeki sınır değerleri (güven aralığı) aşağıdakilerden hangisidir? a) 0.14 - 0.76 d) 0.16 - 0.34

46.

c) 23

b) 48.57 – 48.63 e) 48.05 – 52.77

c) 48.05 – 49.15

Geçirdikleri cerrahi operasyon sonrasında yoğun bakım ünitesine alınan 100 hastada idrar yolu enfeksiyonu (İYE) gelişme sıklığı %34 olarak bulunmuştur. %5 yanılma düzeyinde İYE gelişme sıklığı için güven aralığı sınırları aşağıdakilerden hangisidir? a) 0.20 – 0.40 d) 0.21 – 0.47

b) 0.29 – 0.39 e) 0.25 - 0.43

283

c) 0.31 – 0.37


49

İntravasküler yoldan 20 cc’lik enjeksiyon uygulaması yapılan (A) ilacının analjezik etkisinin, böbreklerinde kalkül oluşumu olan 400 hastadaki üreter kanal akut ağrıları için ortalama 8 saat sürdüğü görülmüştür. Standart sapma ise 0.4 saattir. (A) ilacına ilişkin analjezik etkinin %95 güvenlik düzeyindeki ortalama sınır değerleri (güven aralığı) aşağıdakilerden hangisidir? a) 7.98 – 8.02 d) 5.05 – 6.05

50.

b) 0.23 – 0.33 e) 0.25 - 0.43

c) 0.19 – 0.33

Diyabet hastalarında “beslenmenin” açlık kan şekeri üzerine etkisini belirlemek amacı ile bir çalışma planlanmıştır. Bu amaç doğrultusunda 25 diabetik bireyin diyet öncesinde ve sonrasında açlık kan şekeri değerleri ölçülmüş olup, iki ölçüm arasındaki farkın ortalaması 10.4 ± 6.8 mg olarak bulunmuştur. Buna göre diabet hastalarında beslenmenin(diyetin) etkisinin olduğu söylenebilir mi? a) b) c) d) e)

52.

c) 7.92 – 8.08

Geçirdikleri cerrahi operasyon sonrasında yoğun bakım ünitesine alınan 140 hastada idrar yolu enfeksiyonu (İYE) gelişme sıklığı %26 olarak bulunmuştur. %5 yanılma düzeyinde İYE gelişme sıklığı için güven aralığı sınırları aşağıdakilerden hangisidir? a) 0.21 – 0.31 d) 0.21 – 0.47

51.

b) 7.96 – 8.04 e) 4.90 – 8.10

t=7.65, p>0.05 H0 kabul diyet etkin t=0.76, p<0.001 H0 kabul diyet etkin değil t=7.65, p<0.001 H1 kabul diyet etkin t=0.76, p<0.001 H1 kabul diyet etkin değil t=1.65, p>0.001 H1 kabul diyet etkin

Anemi hastalarının tedavisi için geliştirilen bir ilacın etkinliği araştırılıyor. 20 anemi hastasında tedavi öncesi hemoglobin değeri ortalaması 9 g/dl, standart sapması 1.4 g/dl olarak bulunmuştur. Tedavi sonrasında ise hemoglobin değeri ortalaması 13 g/dl, standart sapması 1.8 g/dl ‘dir. İlaç tedavisinin Anemi hastaları üzerinde etkili olup olmadığı araştırılmış ve yapılan hipotez testi sonucu t = 16.62 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur?

284


a) b) c) d) e)

53.

64 anemi hastasında tedavi öncesi ve sonrası hemoglobin değerleri farklarının ortalaması 4.7 g/dl, standart sapması 2.2 g/dl olarak bulunmuştur. Uygulanan tedavinin etkili olup olmadığını belirlemek amacı yapılan hipotez testi sonucu t = 17.09 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)

54.

p>0.05, H0 hipotezi kabul p<0.05, H0 hipotezi kabul p>0.05, H1 hipotezi kabul p<0.001, H1 hipotezi kabul p>0.01, H0 hipotezi kabul

Beslenme tipinin demir eksikliği üzerine etkisi incelenmek isteniyor. “A” tipi beslenen 25 bireyde hemoglobin değeri ortalaması 13 g/dl, standart sapması 4 g/dl; “B” tipi beslenen 20 bireyde ise hemoglobin değeri ortalaması 9 g/dl, standart sapması 2 g/dl ‘dir. Beslenme tipinin hemoglobin değeri üzerinde etkili olup olmadığı araştırılmış ve yapılan hipotez testi sonucu t = 4.08 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)

55.

p>0.05, H0 hipotezi kabul p<0.05, H0 hipotezi kabul p>0.05, H1 hipotezi kabul p>0.01, H0 hipotezi kabul p<0.05, H1 hipotezi kabul

p>0.05, H0 hipotezi kabul p<0.05, H0 hipotezi kabul p>0.05, H1 hipotezi kabul p>0.01, H0 hipotezi kabul p<0.05, H1 hipotezi kabul

Diabet hastalarında glukoz değerlerinin cinsiyete göre farklılık gösterip göstermediğini bulmak amacı ile yapılan bir çalışmada; 41 kadında glukoz değeri ortalaması ± standart sapması 145±20 mg/dl iken 61 erkek hastada 165±30 mg/dl olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur?

285


a) Varyanslar ortak, p>0.05, H1 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık gösterir. b) Varyanslar ortak, p>0.05, H0 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık gösterir. c) Varyanslar farklı, p>0.05, H0 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık göstermez. d) Varyanslar farklı, p>0.05, H1 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık gösterir. e) Varyanslar farklı, p<0.05, H1 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık gösterir. 56.

49 anemi hastasında tedavi öncesi ve sonrası hemoglobin değerleri farklarının ortalaması 3.7 g/dl, standart sapması 1.6 g/dl olarak bulunmuştur. Uygulanan tedavinin etkili olup olmadığını belirlemek amacı yapılan hipotez testi sonucu t = 16.09 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)

57.

Kolesterol düzeyini düşürdüğü iddia edilen bir ilaç 36 hastada deneniyor. Hastaların kolesterol değerleri tedavi öncesi ve tedavi sonrasında ölçülmüştür. Alınan fark değerlerinin ortalaması(±standart sapması) 15±12 mmHg olarak hesaplanmıştır. Buna göre ilacın etkin olup olmadığı hakkında aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)

58.

p>0.05 , H0 hipotezi kabul p<0.05 , H0 hipotezi kabul p>0.05 , H1 hipotezi kabul p<0.01 , H1 hipotezi kabul p>0.01 , H0 hipotezi kabul

p>0.05 , H0 hipotezi kabul, ilaç etkin p<0.05, H0 hipotezi kabul, ilaç etkin değil p<0.05 , H1 hipotezi kabul, ilaç etkin p>0.001, H0 hipotezi kabul, ilaç etkin değil p>0.01, H0 hipotezi kabul, ilaç etkin

Yeni bir antibiyotiğin üst solunum yolu enfeksiyonunu(ÜSYE) dört günlük kullanım ile iyileştirmede 0.70 etkili olduğu ileri sürülmektedir. İlaç, ÜSYE olan 200 kişilik bir hasta grubuna verilmiş ve uygulama sonucunda 120 kişinin iyileştiği görülmüştür. İlacın 0.70 etkili olduğu söylenebilir mi? 286


a) b) c) d) e)

59.

Cinsiyetin bireylerin ağızdaki diş sayısı üzerine etkisi incelenmek isteniyor. Bu amaçla yapılan bir çalışmada 20 kadında ortalama diş sayısı 24, standart sapma 4; 25 erkekte ortalama 20, standart sapma 6 olarak bulunmuştur. Buna göre aşağıdaki seçeneklerden hangisi, cinsiyetin ağızdaki diş sayısı üzerinde etkili olup olmadığını göstermektedir? a) b) c) d) e)

60.

ε = 3.09, p<0.05 H1 kabul, ilacın etkinliği %70 değil ε = 3.09, p<0.05 H1 kabul, ilaç %70 etkin ε = 1.56, p>0.05 H0 kabul, ilaç %70 etkin ε = 1.56, p<0.05 H1 kabul, ilaç %70 etkin ε = 3.09, p>0.05 H0 kabul, ilacın etkinliği %70 değil

p>0.05, H1 hipotezi kabul p<0.05, H0 hipotezi kabul p>0.05, H0 hipotezi kabul p<0.05 , H1 hipotezi kabul p<0.01, H0 hipotezi kabul

Ankara ilinde yapılan genel bir tarama çalışmasında çocukların %35’inin obez olduğu bilinmektedir. Bu ildeki bir okulda ise 250 çocuğun 90’ının obez olduğu saptanmıştır. Bu okuldan elde edilen oranın toplum oranından farklı olup olmadığını sınamak istediğimizde, t değeri kaça eşit olur? a) 12.19

61.

b) 3.85

c) 0.33

d) 9.13

e) 2.04

Sağlıklı 30 bireyde açlık kan şekeri değeri ortalaması±standart sapması 80±10 mg, diabetik 25 bireyde ise 140±15 mg olarak ölçülmüştür. İki grup arasında açlık kan şekeri değeri bakımından istatistiksel olarak fark var mıdır? a) b) c) d) e)

t=17.1, p<0.001 H1 kabul fark var t=1.71, p<0.001 H0 kabul fark var t=17.71, p<0.001 H1 kabul fark var t=1.42, p<0.001 H1 kabul fark yok t=14.2, p>0.001 H1 kabul fark var

287


62.

1000 kişilik bir kümenin 320 kişisi erkektir. Kadınların yarısı hasta diğerleri sağlıklıdır. Erkeklerin ise 190 tanesi sağlıklıdır. Hasta olma açısından cinsiyetler arasında karşılaştırma hangi test ile yapılır? a) b) c) d) e)

63.

x2 Kolmogorov-Smirnov Fisher kesin olasılık testi Pearson r Regresyon analizi

Bir "A" tedavisi, kullanıldığı 90 olgunun 37’sinde başarılı, "B" tedavisi ise kullanıldığı 70 olgunun 34’ ünde başarılı olmuştur. Tedavilerin başarı durumunu kıyaslamak için hesaplanan ki-kare (X2) değeri kaçtır? a) 12.19

64.

b) 3.85

c) 0.89

d) 9.88

e) 2.04

Aynı hastalığın tedavisinde kullanılan 3 ilacın yan etkileri bakımından farklılık gösterip göstermediği araştırılmak isteniyor. Tabloda verilenler ışığında aşağıdaki ifadelerden hangisi doğrudur? Yan etki İlaç

Var

Yok

Toplam

A ilacı

60

110

170

B ilacı

40

90

130

C ilacı

80

120

200

Toplam

180

320

500

a) x2 = 2.97, p<0.05; H1 kabul, İlaçlar yan etkilerine göre farklılık gösterir. b) Fisher, p>0.05; H1 kabul, İlaçlar yan etkilerine göre farklılık gösterir. c) Fisher, p<0.05; H1 kabul, İlaçlar yan etkilerine göre farklılık göstermez. d) x2 = 2.97, p>0.05; H0 kabul, İlaçlar yan etkilerine göre farklılık göstermez. e) x2 = 9.7, p<0.05; H1 kabul, İlaçlar yan etkilerine göre farklılık gösterir.

288


65.

Trafik kazası sebebi ile acil servise getirilen çocuklardan yoğun bakıma alınanların, yaralanmalarının araç içi – araç dışı olmasına göre farklılık gösterip göstermediği araştırılmak isteniyor. Tabloda verilenler ışığında aşağıdaki ifadelerden hangisi doğrudur? Kaza Yeri Takip yeri

Araç İçi

Yoğun bakım

10

2

12

Acil Servis

1

4

5

Toplam

11

6

17

Araç Dışı

Toplam

a) x2 = 6.19, p<0.05; H1 kabul, Kaza yerine göre, takip yeri farklılık gösterir. b) x2 = 6.19, p>0.05; H1 kabul, Kaza yerine göre, takip yeri farklılık gösterir. c) Fisher, p>0.05; H1 kabul, Kaza yerine göre, takip yeri farklılık göstermez. d) x2 = 0.36, p>0.05; H0 kabul, Kaza yerine göre, takip yeri farklılık göstermez. e) Fisher, p<0.05; H1 kabul, Kaza yerine göre, takip yeri farklılık gösterir. 66.

Hipertansiyonlu bireylerde sigara içme sıklığının toplum sıklığından farklı olup olmadığına aşağıdaki test istatistiklerinden hangisi ile karar verilir? a)

d)

b)

c)

e)

289


67.

Çocuk hastalıkları kliniğine başvuran 40 hastada yüksek ateş ile birlikte idrar yolu enfeksiyonu (İYE) görülmesi sıklığı araştırılmış ve sonuçlar aşağıdaki tabloda verilmiştir. Buna göre çocuklarda yüksek ateş olup olmamasına göre İYE sıklığının değiştiği söylenebilir mi? Sonucu yorumlayınız. İdrar Yolu Enfeksiyonu Var

Yok

Toplam

10

4

14

8

18

26

Toplam 18

22

40

Yüksek Var Ateş

Yok

a) x2 = 6.08, p<0.05; H1 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkiler. b) x2 = 6.08, p>0.05; H0 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkilemez. c) x2 = 6.08, p<0.05; H1 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkilemez. d) Fisher, p=0.016; H0 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkiler. e) Fisher, p=0.016; H1 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkilemez.

68.

55 yaş üstü bireylerde cinsiyete göre kemik erimesi görülme sıklığının değişip değişmediğini belirleyiniz.

Kemik Erimesi Cinsiyet

Var

Yok

Toplam

Kadın

48

32

80

Erkek

15

55

70

Toplam

63

87

150

290


a) x2 = 2.28, p>0.05; H0 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmektedir. b) x2 = 2.28, p>0.05; H1 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmemektedir. c) x2 = 22.8, p<0.05; H1 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmektedir. d) Fisher, p<0.05; H0 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmemektedir. e) Fisher, p>0.05; H0 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmektedir.

69.

Yaşa göre hipertansiyonun görülme sıklığının değişip değişmediğini belirleyiniz. Hipertansiyon Yaş Grubu

Var

Yok

Toplam

35-50

18

27

45

51-70

25

20

45

Toplam

43

47

90

a) x2 = 13.83, p<0.05; H1 kabul, Yaşa göre hipertansiyon sıklığı değişmektedir. b) x2 = 13.83, p>0.05; H0 kabul, Yaşa göre hipertansiyon sıklığı değişmemektedir. c) x2 = 2.18, p>0.05; H0 kabul, Yaşa göre hipertansiyon sıklığı değişmemektedir. d) Fisher, p<0.05; H0 kabul, Yaşa göre hipertansiyon sıklığı değişmemektedir. e) Fisher, p>0.05; H0 kabul, Yaşa göre hipertansiyon sıklığı değişmektedir.

291


70.

X ve Y değişkenleri için 64 kişide için hesaplanan pearson korelasyon katsayısı r= - 0,80 çıkmıştır. Bu sonuca göre aşağıdakilerden hangisi doğrudur? a) b) c) d) e)

71.

t=10.5, p>0.05, r anlamlı t=10.5, p<0.05, r anlamlı t=1.05, p<0.05, r anlamlı t=1.05, p>0.05, r anlamlı t=1.05, p>0.05, r anlamlı değil

Aşağıda 20 öğrenciye ilişkin verilerden elde edilen toplam değerleri yer almaktadır. Buna göre, (X) ile (Y) arasında bir ilişki olup olmadığını Pearson korelasyon katsayısını kullanarak hesaplayınız.

a) r = 0,28; p>0.05 d) r = 0.89; p<0.05 72.

b) 0.96

d) 0.58

e) Hiçbiri

b) r = -0.72; p<0.05 e) r = 0.72; p<0.05

c) r = -0.85; p<0.05

73 numaralı soruda verilen değerleri kullanarak (Y) deki değişimlerin yüzde kaçının (X) ile açıklandığını bulunuz. a) 0.72

75.

c) 0.79

Aşağıda 10 öğrenciye ilişkin verilerden elde edilen toplam değerleri yer almaktadır. Buna göre, (X) ile (Y) arasında bir ilişki olup olmadığını Pearson korelasyon katsayısını kullanarak hesaplayınız.

a) r = 0,58; p>0.05 d) r = 0.85; p<0.05 74.

c) r = -0.89; p<0.05

Yukarıdaki soruda (soru 71) verilen değerleri kullanarak (Y) deki değişimlerin yüzde kaçının (X) ile açıklandığını bulunuz. a) 0.08

73.

b) r = -0.98; p<0.05 e) r = 0.76; p<0.05

b) 0.85

c) 0.34

d) 0.58

e) Hiçbiri

73 numaralı soruda verilen değerleri kullanarak Y = a + bX regresyon denklemini kurunuz. 292


a) Y = 6.8 - 4.4X d) Y = 4.4X - 6.8

76.

b) Y = 6.8X + 4.4 e) Hiçbiri

İlacın dozu(mg) ile iyileşme süresi (saat) değerleri için regresyon denklemi “Süre = 36.35 – 0.25 x Doz” olarak elde edilmiştir. Bu denklemi gösteren grafik aşağıdakilerden hangisidir? a)

b)

37.00

35.00 34.00 0

5

10

0

5

10

e)

d) -36.00 -37.00 -36.00 -39.00

5

10

c)

0

5

10

-34.00 -34.50 -35.00 -35.50 -36.00 -36.50

36.50 36.00 37.50 37.00 36.50 36.00 0

10

5

Çocuklarda gece uykusu süresi ile algılama düzeyi arasında bir ilişki olup olmadığını araştırmak için yapılan bir çalışmada, 7 çocuğa ilişkin bulgular aşağıdaki gibi elde edilmiştir. Spearman sıra korelasyon katsayısını ( rs ) hesaplayınız (Tx ve Ty’ler hesaplamaya dahil edilmeyecektir). Uyku Süresi (saat) 6

7

8

9

5

4

6

Algılama Düzeyi

8

6

8

6

5

5

a) 0.69

78.

0 10.00 0.00 -10.00 -20.00 -30.00 -40.00

36.00

77.

c) Y = 6.8 + 4.4X

b) 0.64

7

c) 0.82

d) 0.18

e) 0.31

Aşağıda Ailevi Akdeniz ateşi “FMF” hastalığına sahip 10 bireyin Hemoglobin(Hb) ve Hematokrit(Htc) değerleri verilmektedir. Hb ve Htc değerleri arasında ilişki olup olmadığını Pearson korelasyon katsayısını (r) kullanarak bulunuz ve sonucu yorumlayınız. Hb (X) : 12 14 16 Htc (Y): 35 37 38 ∑x = 130 ∑y = 349

15 13 12 11 10 14 13 36 36 34 32 30 36 35 ∑x2 = 1720 ∑y2 = 12231 ∑xy = 4573 293


a) r = 0.92, p<0.05 d) r = 0.48, p<0.05

79.

b) r = 0.92, p>0.05 e) r = 0.48, p<0.05

Aşağıda verilen x ve y değişkenleri için Pearson korelasyon katsayısını hesaplayınız.

a) r=0.74; p<0.05 d) r=0.87; p<0.05

80.

x

y

51 30 24 56 68 74 35 76 93 33

43 34 28 68 70 87 36 68 92 64

b) r= -0.74; p>0.05 e) r=0.56;p<0.05

c) r= -0.87; p<0.05

79 numaralı soruda verilen tabloyu kullanarak regresyon denklemini hesaplayınız. a) Y = 0.84X – 13.44 d) X= 0.84Y+13.44

81.

c) r = 0.80, p<0.05

b) Y = 0.84X + 13.44 e) X= -0.84+13.44Y

c) Y= 13.44 – 0.84X

Çocuklarda gece uykusu süresi ile algılama düzeyi arasında bir ilişki olup olmadığını araştırmak için yapılan bir çalışmada, 11 çocuğa ilişkin bulgular aşağıdaki gibi elde edilmiştir. Spearman sıra korelasyon katsayısını ( rs ) hesaplayınız (Tx ve Ty’ler hesaplamaya dahil edilmeyecektir). Uyku Süresi (saat) 4 Algılama Düzeyi 3 a) 0.69

b) 0.64

5.5

6

6.5

7.5

8

5

7

8.5

10

9

5

6

7

6

10

4

9

8

7

9

c) 0.82

d) 0.79 294

e) 0.77


82.

“ ……………… , bağımlı değişkendeki değişimlerin yüzde kaçının bağımsız değişken tarafından açıklandığını gösterir” ifadesinde boş bırakılan yer için uygun seçeneği işaretleyiniz.” a) Korelasyon katsayısı b) Belirleme Katsayısı d) Değişim katsayısı e) Spearman katsayısı

83.

Aşağıda verilen x ve y değişkenleri için Pearson korelasyon katsayısını hesaplayınız.

a) r=0.68; p<0.05 d) r=0.74; p<0.05

84.

x

y

11 14 16 9 7 12 10 12 7 6

50 64 66 62 44 72 40 56 32 44

b) r= 0.74; p>0.05 e) r=0.86;p<0.05

c) r= 0.86; p>0.05

Aşağıdakilerden hangisi tanı testi değerlendirmesi özgün ölçütlerinden değildir? a) Duyarlılık b) Özgüllük d) Yalancı pozitif oranı e) Göreli risk oranı

85.

c) Regresyon katsayısı

c) Doğruluk oranı

Gerçekte hasta olduğu bilinen 60 kişinin 36’sına yeni bir yöntem ile hasta tanısı konurken, gerçekte sağlam olduğu bilinen 120 kişinin 30’una hasta tanısı konulmuştur. Buna göre yöntemin sırası ile duyarlılığı ve özgüllüğü kaça eşit olur? a) 0.75; 0.60

b) 0.51; 0.82

c) 0.60; 0.75 295

d) 0.82; 0.51

e) 0.60; 0.51


86. ALTIN STANDART Hasta TANI

Hasta

TESTİ Sağlam

Sağlam

268

65

83

314

Yukarıdaki tabloya göre tanı testinin “Negatif kestirim değeri” ve “Duyarlılığı” sırasıyla aşağıdakilerden hangisidir? a) 0.80 - 0.83 d) 0.76 -0.79

87.

b) 0.91

c) 0.66

d) 0.79

e) 0.89

100 gerçek hasta ve 100 gerçek sağlamın katıldığı bir çalışmada, üç tanı testi (A,B ve C) %100 doğru tanı koyan “altın standart”’a göre yeniden değerlendirildiğinde duyarlılıkları sırasıyla, %98, %92 ve %84’dir. Özgüllükleri ise sırasıyla %76, %89 ve %93’dir. En başarılı test hangisidir? a) C

89.

c) 0.83 – 0.96

Altın Standarda göre yarısının hasta olduğu 400 kişilik bir çalışmada tanı testinin özgüllüğü 0,78 ise genel doğruluk oranı en yüksek kaç olabilir? a) 0.95

88.

b) 0.83 – 0.80 e) 0.79 – 0.76

b) A

c) B

d) A=C

e) A=B

Bir hastalığa tanı koymada 5 farklı kan değerinden birine(A, B, C, D, E) bakarak karar verilmek isteniyor. Her bir kan parametresi için ROC eğrisi çizilerek eğri altında kalan alanlar aşağıdaki gibi bulunuyor. Buna göre hangi kan parametresi tanı koymada daha yüksek güce sahiptir? a) A: 0.58

b) B:0.68

c) C:0.82

296

d) D:0.50

e) E: 0.63


90.

Demans prevalansının %7 olduğu bilinmektedir. Yeni bir tanı koyma yönteminin(testin) duyarlılığı 0.75, özgüllüğü ise 0.90 olarak bulunmuştur. Buna göre test sonucu negatif çıkan bir bireyin sağlam olma olasılığı kaça eşittir? a) 0.36

91.

b) 0.68

c) 0.98

d) 0.05

e) 0.93

Alzheimer hastalığına tanı koymak için geliştirilen yeni bir yöntemin duyarlılığı 0.85, özgüllüğü 0.55 olarak bulunmuştur. Toplumda Alzheimer hastalığı görülme sıklığının %7 olduğu bilindiğine göre aşağıdaki ifadelerden hangisi/hangileri doğrudur? I. Yöntem %55 olasılıkla hastaları ayırt edebilmektedir. II. Test sonucu pozitif çıktığında kişi %98 olasılıkla hastadır. III. Test sonucu negatif çıktığında kişi %98 olasılıkla sağlıklıdır. a) II

92.

c) II ve III

d) III

e) I

Parkinson hastalığına tanı koymak için geliştirilen yeni yöntemin özgüllüğü 0.85 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)

93.

b) I ve II

Yeni yöntemin sağlamları ayırt etme olasılığı 0.85’tir. Yeni yöntem 0.85 olasılıkla hastaları ayırt etmektedir. Test sonucu negatif çıkarsa birey 0.85 olasılıkla sağlamdır. Yöntem 0.85 olasılıkla yanlış tanı koymaktadır. Test sonucu pozitif çıkarsa birey 0.85 olasılıkla hastadır.

Parkinson hastalığına tanı koymak için geliştirilen yeni yöntemin eksi yorum gücü 0.45 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)

Yöntemin hastaları ayırt etme olasılığı %45’dir. Yöntem %45 olasılıkla sağlamları ayırt edebilmektedir. Yöntem %45 olasılıkla yanlış tanı koymaktadır. Test sonucu negatif çıktığında kişi %45 olasılıkla sağlamdır. Test sonucu pozitif çıktığında kişi %45 olasılıkla hastadır.

297


94.

MS hastalığına tanı koymak için geliştirilen yeni yöntemin eksi yorum gücü 0.25 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)

95.

Yeni yöntemin sağlamları ayırt etme olasılığı 0.25’tir. Yeni yöntem 0.25 olasılıkla hastaları ayırt etmektedir. Test sonucu negatif çıkarsa birey 0.25 olasılıkla sağlamdır. Yöntem 0.25 olasılıkla doğru tanı koymaktadır. Test sonucu pozitif çıkarsa birey 0.25 olasılıkla hastadır.

MS hastalığına tanı koymak için geliştirilen yeni yöntemin özgüllüğü 0.95 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)

Yöntemin hastaları ayırt etme olasılığı %95’dir. Yöntem %95 olasılıkla sağlamları ayırt edebilmektedir. Test sonucu pozitif çıktığında kişi %95 olasılıkla sağlamdır. Yöntem %95 olasılıkla doğru tanı koymaktadır. Test sonucu negatif çıktığında kişi %95 olasılıkla hastadır.

96. HASTALIK VAR

YOK

Toplam

Etken VAR

18

9

27

Etken YOK

134

26

160

Toplam

152

35

187

Kohort tipi bir araştırmada elde edilen sonuçlara göre uygun risk ölçütünü bulunuz? a) 0.52

97.

b) 0.80

c) 0.46

d) 0.84

e) 0.39

Yukarıdaki tablo (soru 96) bir vaka/kontrol çalışma sonuçları olsa idi uygun göreli değer kaç olurdu? a) 0.52

b) 0.39

c) 0.80

d) 0.46 298

e) 2.577


98.

“Bir araştırmada Relatif Risk (RR) değeri ve %95 güven aralığı alt ve üst değerleri 1.25(0.75-1.05) olarak bulunmuştur.” Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d)

Etken hastalık oluşumunu %1.25 arttırır. Etken hastalık oluşumunu 1.25 kat arttırır. Etken hastalık oluşumunun %1.25’ine engel olur. Etken ortadan kaldırılırsa etken var olan grupta hastalık oluşumu 1.25 kat engellenir. e) Etken ile hastalık arasında istatistiksel olarak ilişki yoktur.

99.

Aşağıdaki tabloda 200 bireye ilişkin on yıllık izleme sonuçları verilmiştir. Bireylerin 125’i sanayi bölgesi yakınında yaşarken, geri kalanı kırsal bölgede yaşamakta idi. (X) hastalığı +

(X) hastalığı -

Toplam

Sanayi bölgesinde yaşayanlar E+

55

70

125

Kırsal bölgede yaşayanlar E-

15

60

75

Toplam

70

130

200

Sanayi bölgesinde yaşamak (X) hastalığına yakalanma riskini arttırır mı? Geçerli risk ölçütü aşağıdakilerden hangisidir? Hesaplayınız. a) b) c) d)

RR= 2.2 Hastalık riski E – grubunda 1 iken, E+ grubunda 2.2 dir. OR= 3.1 Etken hastalık oluşumunu 3.1 kat arttırır. RR=2.2 Etken hastalık oluşumunun %2.2’sine engel olur. AR=0.24 Etkene maruz kalan grupta hastalık insidansının 0.24’lük bölümü etken ile açıklanabilir. e) Etken ile hastalık arasında istatistiksel olarak ilişki yoktur.

100.

(soru 99’da verilen bilgiler ışığında) AR değerini hesaplayınız. a) 2.2

b) 3.1

c) 0.20

d) 0.24

299

e) 0.55


101.

(soru 99’da verilen bilgiler ışığında) %AR değerini hesaplayınız. a) 2.2

102.

b) 3.1

c) 0.20

d) 0.24

e) 0.55

(soru 99’da verilen bilgiler ışığında) Tablodaki verileri kullanarak aşağıdaki ölçütlerden hangisi/hangilerinin doğru olduğunu belirtiniz. I. Ie+ = 0.44 IV. P(D+)= 0.63

II. AR=0.55 V. P(E+)= 0.63

III. OR= 2.2

a) I d) III, IV ve V

b) I ve V e) I, II ve III

c) II, III ve IV

103. Gribe yakalanan (+)

Gribe yakalanmayan (-)

1 - 30 Eylül (Erken dönem)

80

120

200

15 Ekim -15 Kasım

30

270

300

Toplam

110

390

500

Aşı zamanı

Toplam

İleri yaşlarda gribe yakalanmanın bireyler için riskli olduğu bilinmekte dir. Bu amaçla kohort tipi bir çalışma ile 65 yaş üzeri bireylerde sonbaharda aşı olma zamanının gripten korunmada etkili olup olmadığı araştırılmak isteniyor. Çalışmaya alınan bireyler aşı oldukları tarihten itibaren salgın dönemi sonuna kadar izleniyor. Bu süre içinde gribe yakalanıp yakalanmadıkları gözleniyor. Etken olarak 1-30 eylül dönemi alınıyor. Çalışma sonucunda elde edilen bulgular yukarıdaki tabloda verilmiştir. “İki grup arasındaki gribe yakalanma insidansları arasındaki (0.30)luk farkın nedeni erken dönemde aşılanmadır.” ifadesi ile aşağıdaki risk ölçütlerinden hangisi açıklanmaktadır? a) RR

b) OR

c) %AR

d) TAR

300

e) AR


104.

(soru 103’te verilen bilgiler ışığında) RR değeri kaça eşit olur ? a) 0.10

105.

b) 1.30

c) 0.25

d) 22.50

e) 4.00

(soru 103’te verilen bilgiler ışığında) OR (Odds Oranı) değeri ve %95 Güven Aralığı kaça eşit olur? a) 1.67 (1.25 - 2.23) d) 0.6 (045 – 0.80)

b) 6 (3.74 – 9.61) e) Hesaplanamaz

Beslenme Tipi

Hiperlipidemi (+)

c) 1.89(1.32 – 2.72)

106. Hiperlipidemi (-)

Toplam

Kırmızı et ağırlıklı

60

240

300

Sebze-beyaz et ağırlıklı

15

285

300

Toplam

75

525

600

Kohort tipi bir çalışma ile hiperlipidemi hastalığının beslenme alışkanlığından etkilenip etkilenmediği araştırılmak isteniyor. Çalışmaya alınan bireyler 20 yıl boyunca izleniyor. Bu süre içinde sebze-beyaz et ağırlıklı ve kırmızı et ağırlıklı beslenen bireylerde hiperlipidemi gelişip gelişmediği gözleniyor. Etken olarak kırmızı et ağırlıklı beslenme tipi alınıyor. Çalışma sonucunda elde edilen bulgular yukarıdaki tabloda verilmiştir. “İki grup arasındaki hiperlipidemi insidansları arasındaki (0.15)lik farkın nedeni kırmızı et ağırlıklı beslenmedir” ifadesi ile aşağıdaki risk ölçütlerinden hangisi açıklanmaktadır? a) RR

107.

b) TAR

c) %AR

d) AR

e) OR

(soru 106’da verilen bilgiler ışığında) Toplumda kırmızı et ağırlıklı beslenme sıklığı 0.40 olarak alındığında Toplumda Etkene Atfedilen Risk kaça eşit olur? a) 0.06

b) 0.15

c) 0.38

d) 0.75 301

e) 0.55


108.

(soru 106’da verilen bilgiler ışığında) OR (Odds Oranı) değeri ve %95 Güven Aralığı kaça eşit olur? a) 4.75 (2.63 - 8.58) d) 4 ( 2.34 – 6.89)

b) 0.25 (0.14 - 0.43) e) 4.75 (0.34 – 2.34)

c) Hesaplanamaz

109. PSA>

0

Duyarlılık 1.00 Özgüllük

0,07 0,09 0,11 0,13 0,15 0,17 0,19

0,21 0,23

0.90 0.85 0.75 0.70 0.60 0.48 0.30

0.20 0.03 0.00

0.00 0.05 0.15 0.18 0.25 0.40 0.60 0.68

0.85

1

0.98 1.00

Prostat kanseri şüphesi olan bireylerde PSA değerleri ölçülerek tanı konmak istenmektedir. Farklı kesim noktaları için hesaplanan duyarlılık ve özgüllük değerleri yukarıdaki tabloda verilmektedir. Aşağıda verilen grafiklerden hangisinde ROC eğrisi doğru olarak çizilmiştir? a)

b)

1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00

c)

1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 Özgüllük

Özgüllük

d)

e)

1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00

1-Özgüllük

1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00

1-Özgüllük

110.

1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00

1-Özgüllük

TSH hormon tedavisi alan bireylerde daha sık obezite görüldüğü hipotezi ile yapılan bir prospektif çalışmada bireyler 10 yıl süre ile izlenmiş ve bulgular aşağıdaki gibi elde edilmiştir. Buna göre; Relatif risk kaça eşit olur? TSH

Obezite

Tedavisi

Var

Yok

Toplam

Alan

30

10

40

Almayan

10

50

60

Toplam

40

60

100

302


a) 4.5

111.

b) 0.40

b) 0.30

e) Hiçbiri

c) 0.80

d) 0.15

e) 0.33

c) 0.50

d) 0.15

e) Hiçbiri

Kohort tipi bir çalışmada etkenle karşılaşan grupta hastalık insidansı 0.50, etkenle karşılaşmayan grupta 0.15 ise OR kaça eşit olur? a) 3.33

114.

d) 0.92

Kohort tipi bir çalışmada etkenle karşılaşan grupta hastalık insidansı 0.40, etkenle karşılaşmayan grupta 0.10 ise RR (Relatif Risk) kaça eşit olur? a) 4

113.

c) 15

Kohort tipi bir çalışmada etkene maruz kalan grupta gribe yakalanma sıklığı 0.60, etkene maruz kalmayan grupta ise 0.20 olarak belirleniyor. Buna göre etkene atfedilen risk kaça eşit olur? a) 3

112.

b) 0.58

b) 0.35

c) 0.65

d) 0.15

e) Hiçbiri

Grip aşısı olmanın hastalık gelişimine etkisini incelemek amacı ile 6 ay süre ile 65 yaş üzeri 340 birey izlenmiş ve izleme sonuçları aşağıdaki tabloda verilmiştir.

Hastalık Aşı

Gelişen

Gelişmeyen

(D+)

(D-)

Olan (E+)

40

160

200

Olmayan (E-)

95

45

140

135

205

340

Toplam

Toplam

Aşı olan bireylerde hastalık gelişme sıklığı aşağıdakilerden hangisidir? a) 0.30

b) 0.80

c) 0.68

d) 0.20

303

e) 0.32


115.

(soru 114’te verilen bilgiler ışığında) Aşı olmanın hastalık gelişimine etkisini gösteren değer aşağıdakilerden hangisidir? a) OR= 0.12

116.

b) AR= 0.48

c) IE+= 0.20

d) RR= 0.29

e) TAR= 0.28

Bir araştırmada Relatif Risk (RR) değeri 2.5 olarak bulunmuştur” Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d)

Etken hastalık oluşumunu %2.5 arttırır. Etken hastalık oluşumunu 2.5 kat arttırır. Etken hastalık oluşumunun %2.5’ine engel olur. Etken ortadan kaldırılırsa etken var olan grupta hastalık oluşumunu 2.5 kat engeller. e) Etken ile hastalık arasında ilişki yoktur.

117.

Yaşamının ilk 12 ayında yüksek düzeyde kurşuna maruz kaldığı bilinen 400 çocuk 15 yıl süre ile izlenmiş ve çocukların 160 'ında etkin bir hastalığın geliştiği görülmüştür. Yine, kurşuna maruz kalmayan benzer 600 çocukluk ayrı bir grup aynı sürede izlenmiş ve bunların 30’unda etkin bir hastalığın geliştiği görülmüştür. İzleme sonuçları aşağıdaki tabloda verilmektedir.

Etkin Hastalık Maruziyet

Gelişen

Kurşuna Maruz Kalanlar

160

Gelişmeyen

Toplam

240

400

Kurşuna Maruz 30 Kalmayanlar

570

600

Toplam

810

1000

190

Yaşamının ilk 12 ayında kurşuna maruz kalan grupta etkin hastalık gelişme insidansı kaçtır ? a) 0.40

b) 0.84

c) 0.60

d) 0.225

304

e) verilen bilgilerle hesaplanamaz


118.

(soru 117’de verilen bilgiler ışığında) Kurşuna maruz kalan grup, maruz kalmayan grupla karşılaştırıldığında RR değeri kaçtır? a) 12.67

119.

c) 0.23

d) 0.40

e) Hiçbiri

(soru 117’de verilen bilgiler ışığında) Kurşuna maruz kalmayan grupta etkin hastalık gelişme insidansı kaçtır? a) 0.05

120.

b) 8.0

b) 0.95

c) 0.23

d) 0.40

e) Hiçbiri

(soru 117’de verilen bilgiler ışığında) Etkene (kurşuna maruziyete) atfedilen risk (AR) değeri kaçtır ? a) 0.40

b) 0.05

c) 0.35

d) 8.0

e) Hiçbiri

121. Hasta B A E B D

İzleme Süresi (ay) 9 16 17 19 27

İzleme Sonucu Kayıp Ex Ex Hayatta Ex

Yukarıdaki tabloda 5 hastaya ilişkin izleme süreleri ve sonuçları verilmiştir. Ortalama yaşam süresi nedir? a) 23.00

122.

b) 17.07

c) 18.50

d) 21.75

e) 17.86

Yukarıdaki tabloya göre (soru 121) 17. aydaki kümülatif sağkalım olasılığı kaça eşittir? a) 0.20

b) 0.65

c) 0.89

d) 0.50

305

e) 0.70


123.

Prospektif bir izleme araştırmasının sonucunda yaşam tablosu (Life Table) oluşturulmuş ve 18-24 aylık dönemin başında 325 hastanın olduğu belirlenmiştir. Dönem içinde 30 hasta ex olmuş ve 50 hasta da izlemeden çıkmıştır. Bu dönem için ölüm olasılığı ne olur? a) 0.10

b) 0.15

c) 0.09

d) 0.25

e) 0.16

124.

İzleme aralığı (ay) (den az)

Li

Di

Ui

Ei

Qi

Pi

Ri

0-6

1250

40

112

1194

0,034

0,966

0,966

6-12

1098

22

68

1064

0,021

0,979

0,947

12-18

1008

45

0

1008

A

B

0,904

18-24

963

60

C

890

0,067

0,933

D

24-30

757

E

50

732

0,000

1,000

0,843

30-36

707

50

54

F

0,074

G

0,781

36-42

603

59

130

538

0,110

0,890

0,696

42-48

414

50

160

334

0,150

0,850

0,591

48-54

204

35

0

204

0,172

0,828

0,490

54-60

169

80

6

166

0,482

0,518

0,254

Yukarıda verilen yaşam tablosu verilerine göre, 12-18 ay arası izlenen bireylerde sağkalım olasılığı (B hücresi) kaça eşittir? a) 0.045

125.

c) 0

d) 1

e) Hiçbiri

(soru 124’te verilen yaşam tablosu verilerine göre) 30-36 ay arası izlenen bireylerde riskli nüfus (F hücresi) kaça eşittir? a) 707

126.

b) 0.955

b) 682

c) 54

d) 603

e) 680

(soru 124’te verilen yaşam tablosu verilerine göre) 18-24 ay arası izlenen bireylerde kayıplar ve 2 yıllık birikimli sağkalım olasılığı (C ve D hücreleri) kaça eşittir? 306


a) 173; 0.843

b) 146; 0.843

c) 60; 0.933

Hasta Adı

İzleme süresi(ay)

İzleme Sonucu

A B C D E F G H

8 11 14 24 28 30 36 40

Ex Kayıp Hayatta Ex Kayıp Kayıp Ex Ex

d) 146; 0.933

e) 890; 0.067

127. Qt

Pt

Rt

Yukarıdaki tabloda Kolon kanseri tanısı konan 8 hastaya ilişkin izleme süreleri ve izleme sonuçları verilmiştir. Buna göre, kolon kanseri tanısı konan 8 hastaya ilişkin ortanca ( medyan ) izleme süresi kaça eşittir? a) 24

128.

d) 23.88

e) Hiçbiri

b) 1

c) 0.70

d) 0.33

e) 0.67

(soru 127’de verilen izlem verilerine göre) 3 yıllık kümülatif sağkalım olasılığı kaça eşittir? a) 0.50

130.

c) 28

(soru 127’de verilen izlem verilerine göre) F adlı hastanın 30. aydaki ölüm olasılığı kaça eşittir? a) 0

129.

b) 26

b) 1

c) 0

d) 0.35

e) 0.70

(soru 127’de verilen izlem verilerine göre) D adlı hastanın 24. aydaki ölüm olasılığı kaça eşit olur? a) 0.80

b) 0

c) 0.88

d) 1

e) 0.20

307


Ek 2.2 Yanıtlar : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

c e e a b e b e c e a c a c d e e d d d e e a d b c e a e c

31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60

a c d c a e a a b d b c c b b c c e b c c e d e e d c a d c

61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90

c a c d e c a c c b d c d a c a a a d b e b d e c e e c c c

308

91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120

d a d c b b b e a d e b e e e d a c c a b a e d d b a b a c

121 122 123 124 125 126 127 128 129 130

d d a b e b b a d e


DİZİN

A

Bilim dili, 3 Bilimsel araştırma, 3 Binom dağılımı, 62 Birikimli sağkalım hızı, 234 Birikimli sıklık, 8 Birleşik olasılık, 53 Biyoistatistik, 2

Açıklanan değişkenlik, 156, 176 Açıklanmayan değişkenlik, 156, 176 Ağırlıklı ortalama, 40 Alternatif hipotez, 107 Alternatif varsayım, 107 Anayığın, 29, 89, 95 Anayığın birim sayısı, 94 Anayığın oranı, 96 Anayığın ortalaması, 96, 102 Aralıklı ölçüm düzeyi, 4 Araştırma Planlanması, 187 Araştırma protokolü, 202 Araştırma tipleri, 187 Aritmetik ortalama, 29, 79 Artı yorum gücü, 205

Ç Çapraz kontrollü klinik çalışma, 200 Çeyrek sapma, 40 Çeyrekler arası yarı genişlik, 41 Çeyreklik, 37 Çift kör, 202 Çizgi grafikleri, 21 Çoklu korelasyon, 153 Çözümleyici araştırmalar, 188 Çubuk grafikler, 14

B Bağdaşan olaylar, 54 Bağdaşmayan olaylar, 53 Bağımlı olaylar, 56 Bağımsız grup, 127 Bağımsız olaylar, 56 Bağıntı, 152 Basit korelasyon, 153 Basit rastlantısal örneklem, 94 Basit rastlantısal örnekleme, 89, 182 Başarı oranı, 51, 124 Başlangıç hipotezi, 157 Başlangıç noktası, 33, 73 Bayes kuralı, 206 Bayes teoremi, 61 Beklenen sıklık, 130 Beklenen yaşam süresi, 221 Belirleme katsayısı, 156 Bernouilli denemesi, 62

D Dağılım aralığı, 7 Dağılım ölçüleri, 40 Daire dilimleri grafiği, 17 Değişim katsayısı, 47 Değişim kaynağı, 176 Değişken, 49 Denek sayısı, 98 Deney grubu, 98, 115, 125, 133, 184 Deney öncesi olasılık, 50 Deneysel araştırmalar, 188 Deneysel dağılım, 140 Deneysel olasılık, 51 Deneysel örnekleme dağılımı, 81 Dış kontrollü klinik çalışma, 199 Diyagram, 13 Doğru negatif, 204 309


Doğru pozitif, 204 Doğrusal ilişki, 152 Doğrusal olmayan ilişki, 152 Duyarlılık, 59, 203 Düzgün dağılım, 140, 149

Güven aralığı, 101, 187, 197, 213, 223 H Harita, 12 Hasta grubu, 211 Hastalığın yinelenmesi, 222 Hastalıksız geçen süre, 223 Hastalıksız sağkalım, 223 Hata, 174, 176 Hata terimi, 174 Hatalar eğrisi, 71 Hipotez, 101, 122, 182 Hipotez testleri, 106, 187 Hipotezlerin sınanması, 125, 187 Histogram, 19 Homojenlik, 128, 195

E Eğri altında kalan alan, 212 Eğrisel grafikler, 25 Eksi yorum gücü, 204 En küçük önemli fark, 177 Epsilon testi, 116 Eşlendirilmiş seri, 117, 184 Etkene atfedilen risk, 191 Etkene maruziyet, 190 Evren, 87 F

İ F testi, 114, 169 Fark serisi, 185 Farkına vardırmama, 202 Fisher Kesin Ki - Kare, 130

İki yönlü test, 110 İlişki katsayısı, 153 İnanç derecesi, 50 İnsidans, 190 İstatistik, 1, 29 İstatistiksel anlamlılık, 131, 213 İzleme çalışması, 221 İzleme süreci, 222 İzleme süresi, 222 İzlenemeyen hasta, 232

G Geçerli sınama testleri, 5 Geçerli tanımlayıcı istatistikler, 5 Genel çarpma kuralı, 56 Genel doğruluk, 203 Genel kareler toplamı, 176 Genel sağkalım, 223 Genel toplama kuralı, 54 Genelleme, 79, 101, 121, 187 Geometrik ortalama, 39 Göreli orantı, 196 Gözlemsel çalışmalar, 187 Gözlemsel sıklık, 128 Grafik, 12 Gruplararası kareler toplamı, 176 Gruplariçi kareler toplamı, 176 Güç, 98, 108

K Kabul edilebilir örnekleme hatası, 94 Kabul edilme kriterleri, 200 Kaplan-Meier yöntemi, 224 Karakteristik, 50 Kareler ortalaması, 177 Kartogram, 12 Katmanlı örnekleme, 91 Kayıp hasta, 224 Kesikli değişken, 49 310


Kesitsel araştırma, 188 Kestirim, 29, 95, 101 Kısmi korelasyon, 153 Ki - kare, 127 Kiritik D değeri , 179 Kohort Çalışması, 189 Kontenjans katsayısı, 140 Kontrol grubu, 100, 117, 125, 133, 186, 197, 211 Korelasyon, 151 Korelasyon katsayısı, 153 Körleme, 202 Kritik oran, 103 Kura yöntemi, 89 Kuramsal dağılım, 62, 142 Kuramsal örnekleme dağılımı, 81, 96, 103, 121 Kuramsal sıklık, 128 Küme örnekleme yöntemi, 91

Normal dağılım eğrisi, 71, 110 Nüfus piramidi, 20 O Odds değeri, 196 Odds oranı, 196 Olasılık, 50 Olasılık dağılımı, 49 Olasılık oranı, 196 Olasılıklı alan örneklemesi, 92 Olasılıklı örnekleme, 88 Ondalık, 36 Oransal ölçüm düzeyi, 4, 153 Orantılı katmanlı örnekleme, 91 Orantısız katmanlı örnekleme, 91 Ortak varyans, 113 Ortalama, 81 Ortalama mutlak sapma, 41 Ortalama sağkalım süresi, 223 Ortanca, 34

L Ö Laplace - Gauss dağılımı, 70 Log rank testi, 223 LSD yöntemi, 177

Ölçek değişimi, 33, 74 Ölçüm düzeyleri, 3 Ölüm oranı, 226 Önerme, 106 Örnek, 79, 87 Örneklem, 79, 93, 182 Örneklem büyüklüğü, 96 Örneklem oran, 96, 124 Örneklem ortalaması, 100, 106 Örnekleme, 87 Örnekleme hatası, 93, 174 Örnekleme yöntemleri, 88 Özel çarpma kuralı, 56 Özel toplama kuralı, 53 Özgüllük, 203 Öznelcilik, 50

M Mann-Whitney U testi, 181 Matematiksel İstatistik, 2 Medyan, 34 Medyan sağkalım süresi, 223 Merkezi eğilim ölçüleri, 29 Merkezi sınır teoremi, 81 Mod, 38 N Nesnelcilik, 50 Nicel değişken, 5 Nitel değişken, 5 Normal dağılım, 70, 146, 176, 182 311


P

S

p değeri, 187 Paralel kontrollü klinik çalışma, 198 Parametre, 29, 50, 79, 93, 101 Parametrik olmayan testler, 5, 181 Parametrik testler, 5 Pearson - Bravais korelasyon katsayısı, 139 Persantil, 37 Planlama, 3 Plasebo, 98, 198 Plasebo grubu, 123 Poisson dağılımı, 66, 143 Pozitif prediktif değer, 61 Pozitiflik sınır değeri, 210 Prevalans, 188, 205 Prospektif çalışma, 188, 221

Saçılma ölçüleri, 40 Sağkalım çözümleme yöntemi, 221 Sağkalım eğrisi, 229 Sağkalım hızı, 223 Sağkalım oranı, 226 Salt sıklık, 8 Seçicilik, 60, 203 Serbestlik derecesi, 103, 129, 157, 176 Serpilme Diyagramı, 154 Sıfır varsayımı, 106 Sıklık tablosu, 8 Sınama, 122 Sınıf değeri, 11, 32 Sınıf gerçek sınırları, 32 Sınıf sayısı, 7, 31 Sınıflayıcı ölçüm düzeyi, 4, 127 Sıra değerleri, 181 Sıra istatistik testleri, 181 Sıra numarası, 184 Sıralayıcı ölçüm düzeyi, 4, 127 Sistematik örnekleme yöntemi, 90 Sonlanma hızı, 232 Sonlanma zamanı, 232 Spearman sıra farkı ilişki katsayısı, 163 Spearmen sıra ilişki katsayısı, 138 Standardizasyon, 73 Standart hata, 81, 213, 223 Standart normal değer, 123 Standart normal değişken, 73 Standart normal eğri, 73 Standart sapma, 47, 81, 83 Student't dağılımı, 101 Student't testi, 109 Sürekli değişken, 49, 153, 209

R Randomizasyon, 187, 201 Rastgele seçim, 128 Rastlantısal değişken, 49, 181 Rastlantısal hata, 174 Rastlantısal örnekleme, 88 Rastlantısal sayılar, 89, 201 Rastlantısal sayılar tablosu, 89, 237 Rastlantısal sayılar yöntemi, 89 Rastlantısallık, 174, 187 Regresyon, 151 Regresyon doğrusu, 155 Regresyon katsayısı, 155 Regresyon sabiti, 155 Relatif risk, 190 Resimli grafikler, 18 Retrospektif araştırma, 188 Risk altındaki hasta sayısı, 232 Risk faktörleri, 221 ROC eğrisi, 212 ROC yöntemi, 209

T t test, 109, 119 Tanı karakteristiği eğrisi, 209 312


Tanı testi, 203 Tanımlayıcı araştırmalar, 188 Tchebycheff teoremi, 43 Tek kör, 202 Tek yönlü test, 109 Tek yönlü varyans analizi, 173 Tepe değer, 38 Tip I hata(α), 98, 107 Tip II hata (β), 98, 107 Tipik değer, 29 Tipik olay, 3 Toplam değişkenlik, 161, 175 Toplanma ölçüleri, 29 Toplumda etkene atfedilen risk, 191 Toplumda yüzde etkene atfedilen risk, 191

Vaka serisi, 188 Varsayım, 106 Varsayımın sınanması, 106 Varyans, 42 Varyans analizi tablosu, 176 Varyans analizi yöntemi, 173 Varyasyon katsayısı, 47 Veri tabanı, 195 Wicoxon işaretli sıra testi, 184

Y Yan etki, 124 Yanılma düzeyi, 94, 166 Yanlış negatif, 204 Yanlış pozitif, 204 Yargısal örnekleme, 92 Yarı logaritmalı grafikler, 26 Yaşam süresi, 221 Yaşam Tablosu yöntemi, 221 Yates düzeltimli ki - kare, 130 Yayılma genişliği, 40 Yığın, 3 Yığın olay, 3 Yüzde birikimli sıklık, 8 Yüzde etkene atfedilen risk, 191 Yüzde sıklık, 8 Yüzdelik, 37

U Uygulamalı İstatistik, 2 Ü Üç kör, 202 V Vaka grubu, 195 Vaka kontrol çalışması, 195

313


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.