Temel ve Klinik
B‹YO‹STAT‹ST‹K Yenilenmiş 3. Baskı (Soru ilaveli)
Prof.Dr. Rian DİŞÇİ İstanbul Üniversitesi İstanbul Tıp Fakültesi
İSTANBUL TIP KİTABEVİ
Annem Fikriye (BRAVO) DİŞÇİ’ nin ve Babam Esat (DISHA) DİŞÇİ’ nin anısına...
©İstanbul Medikal Yayıncılık BİLİMSEL ESERLER dizisi TEMEL VE KLİNİK BİYOİSTATİSTİK Prof. Dr. Rian DİŞÇİ 3. Baskı 2015 ISBN - 978-605-4499-08-3 2015 İstanbul Medikal Yayıncılık Ltd. Şti. 34104, Çapa-İstanbul-Türkiye www.istanbultip.com.tr e-mail: info@istanbultip.com.tr Turgut Özal Cad. No: 4/A Çapa-İST. Tel: 0212.584 20 58 (pbx) 587 94 43 Faks: 0212.587 94 45
www.istanbultip.com.tr Yasalar uyarınca, bu yapıtın yayın hakları İstanbul Medikal Yayıncılık ltd.şti.’ye aittir. Yazılı izin alınmadan ve kaynak olarak gösterilmeden, elektronik, mekanik ve diğer yöntemlerle kısmen veya tamamen kopya edilemez; fotokopi, teksir, baskı ve diğer yollarla çoğaltılamaz.
UYARI Medikal bilgiler sürekli değişmekte ve yenilenmektedir. Standart güvenlik uygulamaları dikkate alınmalı, yeni araştırmalar ve klinik tecrübeler ışığında tedavilerde ve ilaç uygulamalarındaki değişikliklerin gerekli olabileceği bilinmelidir. Okuyuculara ilaçlar hakkında üretici firma tarafından sağlanan her ilaca ait en son ürün bilgilerini, dozaj ve uygulama şekillerini ve kontrendikasyonları kontrol etmeleri tavsiye edilir. Her hasta için en iyi tedavi şeklini ve en doğru ilaçları ve dozlarını belirlemek uygulamayı yapan hekimin sorumluluğundadır. Yayıncı ve editörler bu yayından dolayı meydana gelebilecek hastaya ve ekipmanlara ait herhangi bir zarar veya hasardan sorumlu değildir.
Yayına hazırlayan Yayıncı sertifika no İmy adına grafikerler Yazar Sayfa düzeni Redaksiyon ve Düzelti Kapak Baskı ve cilt
İstanbul Medikal Yayıncılık Ltd. Şti. 12643 Mesut Arslan, Tuğçe Yıldırım Rian Dişçi Mesut Arslan Tuğçe Yıldırım İmy Tasarım Gezegen Basım San. ve Tic. Ltd. Şti. 100. Yıl Mah. Matbaacılar Sitesi 2. Cad. No: 202/A, Bağcılar-İST Tel: (0212) 325 71 25
ÖNSÖZ
Siz değerli okurlardan gelen kıymetli eleştiriler ve yapıcı öneriler doğrultusunda kitap yeniden gözden geçirilmiş ve gerekli düzeltmeler yapılmıştır. Yine değerli öğrencilerimizden gelen yoğun istek üzerine kitapta yer alan tüm bölümlere ilişkin toplam 230 adet çoktan seçmeli soru ve yanıt anahtarı kitaba eklenmiştir. Yapılan bu eklemenin kitabın daha anlaşılabilir olmasında ve öğrencinin konuyla ilgili kendisini sınamasında yardımcı olacağını düşünmekteyim. Üçüncü basımın hazırlanmasında büyük yardımları ve emeği geçen çalışma arkadaşım Sevda Özel Yıldız (Ph D)’a teşekkürlerimi belirtmek isterim.
Prof. Dr. Rian DİŞÇİ
İstanbul, Mart 2015 İstanbul Üniversitesi, İstanbul Tıp Fakültesi, Biyoistatistik Anabilim Dalı
İ.Ü. Onkoloji Enstitüsü, Kanser Epidemiyolojisi ve Biyoistatistik Bilim Dalı rian@istanbul.edu.tr
v
İÇİNDEKİLER Bölüm 1. Tanımlar, Bilim Dili, Ölçüm Düzeyleri . . . . . . . . . . . . . . . 1 1.1. TANIMLAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. BİLİM DİLİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3. ÖLÇÜM DÜZEYLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Bölüm 2. Biyoistatistik Verilerin Sunulması . . . . . . . . . . . . . . . . . 7 2.1. TABLO SUNUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2. GRAFİK SUNUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12 2.2.1. KARTOGRAMLAR (HARİTALAR) . . . . . . . . . . . . . . . . . . . . . . .12 2.2.2. DİYAGRAMLAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13 2.2.2.1. ÇUBUK GRAFİKLER . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14 2.2.2.2. DAİRE DİLİMLERİ GRAFİĞİ . . . . . . . . . . . . . . . . . . . . . . .17 2.2.2.3. HİSTOGRAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18 2.2.2.4. ÇİZGİ GRAFİKLER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20 2.2.2.5. EĞRİSEL GRAFİKLER . . . . . . . . . . . . . . . . . . . . . . . . . . .24 2.2.2.6. YARI LOGARİTMALI GRAFİKLER . . . . . . . . . . . . . . . . . .25
Bölüm 3. Tanımlayıcı İstatistikler . . . . . . . . . . . . . . . . . . . . . . . . . .29 3.1. TOPLANMA ÖLÇÜLERİ . . . . . . . . . . . . . . . . . 3.1.1. ARİTMETİK ORTALAMA . . . . . . . . . . . . . 3.1.2. ORTANCA (MEDYAN) . . . . . . . . . . . . . . . 3.1.3. TEPE DEĞER, MOD . . . . . . . . . . . . . . . . 3.1.4. GEOMETRİK ORTALAMA . . . . . . . . . . . . 3.1.5. AĞIRLIKLI ORTALAMA . . . . . . . . . . . . . . 3.2. DAĞILIM (SAÇILMA) ÖLÇÜLERİ . . . . . . . . . . 3.2.1. YAYILMA GENİŞLİĞİ (AÇIKLIK, RANGE) 3.2.2. ÇEYREKLER ARASI YARI GENİŞLİK . . 3.2.3. 3.2.4. 3.2.5. 3.2.6.
. . . . . . . . . . . . . . . . .29 . . . . . . . . . . . . . . . . .29 . . . . . . . . . . . . . . . . .34 . . . . . . . . . . . . . . . . .38 . . . . . . . . . . . . . . . . .39 . . . . . . . . . . . . . . . . .40 . . . . . . . . . . . . . . . . .40 . . . . . . . . . . . . . . . .40 . . . . . . . . . . . . . . . . .40
(ÇEYREK SAPMA) ORTALAMA MUTLAK SAPMA . . . . . . . . . . . . . . . . . . . . . . . . . .41 VARYANS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42 STANDART SAPMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47 DEĞİŞİM KATSAYISI (VARYASYON KATSAYISI) . . . . . . . . . . .47
vii
Bölüm 4. Olasılık ve Kuramsal Dağılımlar . . . . . . . . . . . . . . . . . .49 4.1. OLASILIK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50 4.1.1. DENEY ÖNCESİ OLASILIK . . . . . . . . . . . . . . . . . . . . . . . . . . . .50 4.1.2. DENEYSEL OLASILIK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51 4.1.3. OLASILIĞIN ÖZELLİKLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . .52 4.1.4. BİRLEŞİK OLAYLARDA OLASILIK KURALLAR . . . . . . . . . . . .53 4.1.4.1. BAĞDAŞMAYAN OLAYLAR (ÖZEL TOPLAMA KURALI) .53 4.1.4.2. BAĞDAŞAN OLAYLAR (GENEL TOPLAMA KURALI) . . .54 4.1.4.3. BAĞIMSIZ OLAYLAR (ÖZEL ÇARPMA KURALI) . . . . . . .56 4.1.4.4. BAĞIMLI OLAYLAR (GENEL ÇARPMA KURALI) . . . . . . .56 4.1.5. ÖZEL BİR UYGULAMA ALANI
(TANI TESTLERİNİN DEĞERLENDİRİLMESİ) . . . . . . . . . . . . .59 4.1.5.1. BAYES TEOREMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .61 4.2. KURAMSAL DAĞILIMLAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62 4.2.1. BİNOM DAĞILIMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62 4.2.2. POISSON DAĞILIMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66 4.2.3. NORMAL DAĞILIM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .70 4.2.3.1. NORMAL DAĞILIMIN ÖZELLİKLERİ . . . . . . . . . . . . . . . . .71 4.2.3.2. NORMAL EĞRİNİN STANDARDİZASYONU . . . . . . . . . .73 4.2.3.3. NORMAL DAĞILIMA İLİŞKİN UYGULAMALAR . . . . . . . .74
Bölüm 5. Kuramsal Örnekleme Dağılımı . . . . . . . . . . . . . . . . . . . .79 5.1. ÖRNEKLEME DAĞILIMI VE STANDART HATA . . . . . . . . . . . . . . . .79 5.2. KURAMSAL ÖRNEKLEME DAĞILIMININ ÖZELLİKLERİ
(MERKEZİ SINIR TEOREMİ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .81
Bölüm 6. Örnekleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .87 6.1. RASTLANTISAL ÖRNEKLEME (OLASILIKLI ÖRNEKLEME) . . . . . .88 6.1.1. BASİT RASTLANTISAL ÖRNEKLEME . . . . . . . . . . . . . . . . . . .89 6.1.1.1. KURA YÖNTEMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .89 6.1.1.2. RASTLANTISAL SAYILAR YÖNTEMİ . . . . . . . . . . . . . . .89 6.1.1.3. SİSTEMATİK ÖRNEKLEME . . . . . . . . . . . . . . . . . . . . . . .90 6.1.2. KATMANLI ÖRNEKLEME . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91 6.1.3. KÜME ÖRNEKLEME . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91 6.1.4. OLASILIKLI ALAN ÖRNEKLEMESİ . . . . . . . . . . . . . . . . . . . . .92 6.2. YARGISAL ÖRNEKLEME . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92
Bölüm 7. Örneklem Büyüklüğü . . . . . . . . . . . . . . . . . . . . . . . . . . . .93 7.1. ANAYIĞIN ORTALAMASININ (μ) KESTİRİLMESİNDE ÖRNEKLEM BÜYÜKLÜĞÜ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94
viii
7.2. ANAYIĞIN ORANININ (P) KESTİRİLMESİNDE
ÖRNEKLEM BÜYÜKLÜĞÜ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .96 7.3. KONTROL VE DENEY GRUPLARINA İLİŞKİN, ORTALAMALARIN ( χ 1 , χ2 ) KARŞILAŞTIRILMASINDA
ÖRNEKLEM BÜYÜKLÜĞÜ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .98 7.4. KONTROL VE DENEY GRUPLARINA İLİŞKİN, BAŞARI
ORANLARININ (p1,p2) KARŞILAŞTIRILMASINDA ÖRNEKLEM BÜYÜKLÜĞÜ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .99
Bölüm 8. Ortalamaların Karşılaştırılması . . . . . . . . . . . . . . . . . . .101 8.1. KESTİRİM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .101 8.1.1. ORTALAMALARA İLİŞKİN KESTİRİM (GENELLEME) . . . . . . .101 8.1.2. STUDENT (t) DAĞILIMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .102 8.2.VARSAYIMLARIN KURULMASI VE SINANMASI
(HİPOTEZ TESTLERİ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .106 8.2.1. ÖRNEKLEM ORTALAMASI İLE ANAYIĞIN
ORTALAMASININ KARŞILAŞTIRILMASI . . . . . . . . . . . . . . . . .106 8.2.1.1. VARSAYIMLARIN (HİPOTEZLERİN) KURULMASI . . . . . .106 8.2.1.2. VARSAYIM SINAMASINDA KULLANILACAK
TESTİN SEÇİMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .109 8.2.1.3. GÜVEN DÜZEYİNİN SEÇİMİ . . . . . . . . . . . . . . . . . . . . . . .110 8.2.2. İKİ ÖRNEKLEM ORTALAMASININ
KARŞILAŞTIRILMASI
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .112
8.2.2.1. VARYANSLARIN EŞİTLİĞİNİN SINANMASI (F) TESTİ . .114 8.2.3. EŞLENDİRİLMİŞ SERİLERDE FARKIN ANLAMLILIĞININ
SINANMASI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .117
Bölüm 9. Oranların Karşılaştırılması . . . . . . . . . . . . . . . . . . . . . . .121 9.1. ORANLARA İLİŞKİN GENELLEME . . . . . . . . . . . . . . . . . . . . . . . . .121 9.2. ÖRNEKLEM ORANI İLE ANAYIĞIN ORANININ
KARŞILAŞTIRILMASI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .122 9.3. İKİ ÖRNEKLEM ORANININ KARŞILAŞTIRILMASI . . . . . . . . . . . . .124
Bölüm 10. Ki – Kare Testlerinin Kullanılması . . . . . . . . . . . . . . . .127 10.1. İKİ VEYA DAHA ÇOK BAĞIMSIZ GRUPTA,
NİTEL DEĞİŞKENLERİN KARŞILAŞTIRILMASI . . . . . . . . . . . . . . .127 10.1.1. YATES DÜZELTİMLİ Kİ-KARE TESTİ . . . . . . . . . . . . . . . . . . .130 10.1.2. FISHER KESİN Kİ-KARE ANALİZİ . . . . . . . . . . . . . . . . . . . . . .130 10.2. İKİ NİTEL DEĞİŞKEN ARASINDA İLİŞKİ
ARANMASI VE SINANMASINDA Kİ-KARE TESTİ . . . . . . . . . . . . .138 10.3. DENEYSEL BİR DAĞILIMIN KURAMSAL BİR
DAĞILIMA UYGUNLUĞUNUN SINANMASI . . . . . . . . . . . . . . . . . .140 ix
Bölüm 11. Korelasyon ve Regresyon . . . . . . . . . . . . . . . . . . . . . .151 11.1. REGRESYON DOĞRUSUNUN EN KÜÇÜK
KARELER YÖNTEMİ İLE ELDE EDİLMESİ . . . . . . . . . . . . . . . . . .155 11.2. BELİRLEME KATSAYISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .156 11.3. PEARSON-BRAVAIS KORELASYON KATSAYISI . . . . . . . . . . . . .157 11.3.1. KORELASYON KATSAYISININ
ANLAMLILIĞININ SINANMASI . . . . . . . . . . . . . . . . . . . . . . . . .157 11.4. REGRESYON KATSAYILARI İLE KORELASYON
KATSAYISI ARASINDAKİ İLİŞKİ . . . . . . . . . . . . . . . . . . . . . . . . . . .158 11.5. SPEARMAN SIRA FARKI İLİŞKİ KATSAYISI . . . . . . . . . . . . . . . . .163 11.5.1. rs'NİN ANLAMLILIĞININ SINANMASI . . . . . . . . . . . . . . . . . . .164 11.6. KISMİ KORELASYON KATSAYISI . . . . . . . . . . . . . . . . . . . . . . . . .166 11.7. ÇOKLU REGRESYON VE KORELASYON . . . . . . . . . . . . . . . . . . .167 11.7.1. ÇOKLU KORELASYON KATSAYISININ
ANLAMLILIĞININ SINANMASI . . . . . . . . . . . . . . . . . . . . . . . .168
Bölüm 12. Tek Yönlü Varyans Analizi (Model 1) . . . . . . . . . . . . . .173 12.1. VARYANS ANALİZİ MODELİNİN BİLEŞENLERİ . . . . . . . . . . . . . . .173 12.2. TOPLAM VARYANSIN AYRIŞTIRILMASI . . . . . . . . . . . . . . . . . . . .175 12.3. ÇOKLU KARŞILAŞTIRMA
(EN KÜÇÜK ÖNEMLİ FARK (LSD) YÖNTEMİ) . . . . . . . . . . . . . . . . . . . .177
Bölüm 13. Parametrik Olmayan Testler . . . . . . . . . . . . . . . . . . . .181 (Sıra İstatistik Testleri) 13.1. MANN WHITNEY U TESTİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .181 13.2. WILCOXON İŞARETLİ SIRA TESTİ . . . . . . . . . . . . . . . . . . . . . . . .184
Bölüm 14. Araştırma Planlanması . . . . . . . . . . . . . . . . . . . . . . . . .187 14.1. ARAŞTIRMA TİPLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .187 14.1.1. VAKA SERİLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .188 14.1.2. KESİTSEL ARAŞTIRMALAR . . . . . . . . . . . . . . . . . . . . . . . . . .188 14.1.3. KOHORT TİPİ ARAŞTIRMALAR . . . . . . . . . . . . . . . . . . . . . . .189 14.1.3.1. KOHORT TİPİ ARAŞTIRMALARDA RİSK ÖLÇÜTLERİ .190 14.1.4. VAKA KONTROL ARAŞTIRMALARI . . . . . . . . . . . . . . . . . . . .195 14.1.4.1. VAKA KONTROL ARAŞTIRMALARINDA
RİSK ÖLÇÜTLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .196 . . . . . . . . . . . . . .198 . . . . . . . . . . . . . . .199 . . . . . . . . . . . . . . .200 . . . . . . . . . . . . . . .200
14.1.5. PARALEL KONTROLLÜ KLİNİK ÇALIŞMA 14.1.6. DIŞ KONTROLLÜ KLİNİK ÇALIŞMA . . . . . 14.1.7. ÇAPRAZ KONTROLLÜ KLİNİK ÇALIŞMA . 14.2. RASTLANTISALLIK (RANDOMİZASYON) . . . .
x
14.3. KÖRLEME . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202
Bölüm 15. Tanı Testlerinin Değerlendirilmesi . . . . . . . . . . . . . . . .203 15.1. TANI TESTLERİ DEĞERLENDİRME
ÖLÇÜTLERİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .203 15.2. TANI KARAKTERİSTİĞİ EĞRİSİ (ROC) . . . . . . . . . . . . . . . . . . . . .209
Bölüm 16. Sağkalım (Sürvi Analizi) . . . . . . . . . . . . . . . . . . . . . . .221 16.1. 16.2. 16.3. 16.4. 16.5. 16.6.
SAĞKALIM ANALİZİNDE AMAÇ . . . . . . . . . . . . . . . . . . . . . . . . . . .221 SAĞKALIM ANALİZİNDE KARŞILAŞILAN PROBLEMLER . . . . . .222 SONLANMA İLE İLGİLİ TANIMLAR . . . . . . . . . . . . . . . . . . . . . . . . .222 SAĞKALIM ANALİZİ SONUÇLARININ SUNUMU . . . . . . . . . . . . . .223 KAPLAN–MEIER YÖNTEMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .224 YAŞAM TABLOSU YÖNTEMİ . . . . . . . . . . . . . . . . . . . . . . . . . . . . .232
Kaynakça . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .235 İstatistik Tabloları . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .236 Tablo Tablo Tablo Tablo
I. Rastlantısal Sayılar Tablosu . . . . . . . . . . . . . . . . . . . . . . . . . . . . .237 II. Poisson Olasılıkları . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .238 III. Standart Normal Eğri Alanları . . . . . . . . . . . . . . . . . . . . . . . . . .239 IV. Çeşitli Serbestlik Derecesi (s.d.) Ve (iki yönlü) Olasılık
Tablo Tablo Tablo Tablo Tablo Tablo
Va. α= 0.05 İçin F tablosu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .241 Vb. α= 0.01 İçin F tablosu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .242 VI. Ki-Kare Tablosu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .243 VII. Örneklem Oranlarına Ait % 95 Güven Aralıkları . . . . . . . . . . . .244 VIII. Örneklem Oranlarına Ait % 99 Güven Aralıkları . . . . . . . . . . .244 IX. 0.05 ve 0.01 Anlam Düzeylerine Karşılık Gelen
Değerlerine Karşılık Gelen t Tablosu . . . . . . . . . . . . . . . . . . . .240
Spearman Sıra Farkı İlişki Katsayısının Alt Sınırları . . . . . . . . .245 Tablo X. (iki yönlü) 0.05 Anlamlılık İçin Kritik U Değerleri . . . . . . . . . . . . .245 Tablo XI. (iki yönlü) 0.01 Anlamlılık İçin Kritik U Değerleri . . . . . . . . . . . .246 Tablo XII. Wilcoxon İşaretli Sıra Testinde Kritik T Değerleri . . . . . . . . . . .247
Ek 1. Ölçüm Düzeyleri ve Geçerli İstatistiksel İşlemler Tablosu . . . . .249 Ek 2. Kendimizi Sınayalım . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .251 2.1. Bölüm 1-4’e ilişkin sorular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .251 2.2. Bölüm 5-16’ya ilişkin sorular . . . . . . . . . . . . . . . . . . . . . . . . . . . . .273 Dizin
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .309
xi
xii
Bölüm 1
Tanımlar, Bilim Dili, Ölçüm Düzeyleri
1.1 . TANIMLAR İstatistik kelimesinin Latincede “devlet adamı” manasına gelen “Statista” kelimesinden ya da “devlet” anlamına gelen “status” kelimesinden türediği kabul edilir. Günümüzde istatistik kelimesi uluslararası bir terim olup sadece yazılış ve söyleyiş biçiminde farklılıklar gösterir ((İng.) Statistic, (Alm.) Statistik, (Fra.) Statistique, (İta.) Statistica). Bizde, Cumhuriyet’ten önce ihsa’iyyat tabiri kullanılmış, Cumhuriyet döneminde ise istatistik kelimesi dilimize yerleşmiştir. İstatistik kelimesi iki anlamda kullanılmaktadır. 1. İstatistik; deneklerle ilgili sayısal veriler veya bu sayısal verilerden hesap sonucu elde edilmiş ortalamalar, yüzdelik değerler, varyans, oransal değerler,…gibi değerlerdir. 2. İstatistik; veri toplama, özetleme, sunma ve bu verilerin çözümlenmesi ile neden–sonuç ilişkilerinin elde edilmesi, çeşitli alternatif kararların sınanması ile ilgili yöntemleri geliştiren bir bilim dalıdır. 1
İstatistik bilimi ile ilgili çeşitli tanımları verebiliriz. 1. İstatistik, sayı ile belirlenebilen yığın olaylarını özetlemek, ölçmek, tartmak, sınıflamak, karşılaştırmak ve özelliklerini saptayarak nedenlerini ve aralarındaki ilişkiyi bulmaya yardımcı olan bir bilim dalıdır. 2. Sayısal kümelerin ve bunlar arasındaki bağıntıların incelenmesine istatistik adı verilir. 3. İstatistik, yeterli derecede bilinmeyen bütünler hakkında olası bilgi sağlama yoludur. 4. İstatistik, toplumdaki olaylar hakkında, daha az sayıda veri toplayarak en az maliyetle, en kısa zamanda ve doğruluk derecesi yüksek bilimsel sonuçlara ulaşılması ve uygun kararlar alınması için teknikler geliştiren bir bilim dalıdır. İstatistik bilimi iki ana bölüme ayrılır. 1. Matematiksel İstatistik 2. Uygulamalı İstatistik Matematiksel İstatistik: İstatistik teorisinin matematiksel temellerini kuran, yeni kuramsal yaklaşımlarla teknikler üreten bir istatistik bilim dalıdır. Uygulamalı İstatistik: Matematiksel istatistiğin geliştirdiği teorileri ve teknikleri çeşitli alanlarda uygulayan, bu alanlardaki işleyişlerini kontrol eden ve bu tekniklerin uygulama alanlarına özgü uyarlamalar yapan, yeni teknikler geliştiren bir istatistik bilim dalıdır. Günümüzde Uygulamalı İstatistik, tıp, diş hekimliği, biyoloji, eczacılık, sosyoloji, psikoloji, veterinerlik, mühendislik, işletme,… gibi pek çok bilim dalında uygulama alanı bulmaktadır. Biyoistatistik uygulamalı bir istatistik dalı olup sağlık bilimleri alanında istatistik uygulamalarını içermektedir. Biyoistatistik: Matematik–istatistik tekniklerin tıp ve sağlık bilimlerinde uygulamalarını içeren, bu alana özgü uyarlamalar yapan, yeni teknikler üreten bir bilim dalıdır. 2
Biyoistatistik bilimi yığın olaylarını inceler ve bunlara ilişkin genel bağıntılar elde etmeye çalışır. Yığın olay: Bazı özellikleri ortak olan, ancak bireysel farklılıklar gösteren birimler topluluğunu ifade eder. Tipik olay: Bu çeşit olaylarda her birim diğeri ile özdeştir. Bu olaylardan birinin gözleme tabi tutulması diğerlerinin hepsini anlamak için yeterli olur. 1.2 . BİLİM DİLİ Bilimsel bir araştırmanın her aşamasında istatistik yöntem bilimi tekniklerini kullanmak kaçınılmazdır. Bilimsel araştırmanın aşamaları: 1. Amacın belirlenmesi (gözlem yapma, konu seçimi, hipotezlerin kurulması). 2. Planlama (yazılı bir protokolün hazırlanması, sorunun tanımı, çeşitli kaynaklara göre konunun önemi, sınanması düşünülen hipotezler, bağımlı ve bağımsız değişkenlerin tanımlanması, zorunlu olan ve olmayan kısıtlamalar, kullanılan kavramların tanımı, araştırmanın yönetimi, araç gereçler, gerekirse ön uygulama ile süre ve olanakların belirlenmesi,…). 3. Uygulama (verilerin toplanması). 4. Veri analizi (tanımlayıcı istatistikler, hipotez testlerinin sınanması). 5. Sonuçların yorumlanması ve raporun yazılması. Bu anlamda, istatistik, bilimsel araştırmalarda kullanılan ortak bir bilim dili olarak kabul edilir.
1.3.
ÖLÇÜM DÜZEYLERİ
Ölçüme sayı sistemi açısından bakıldığında, kullanılan sayıların taşıdığı özellikler ve olanak verdiği işlemlerden ötürü ölçekler arasında önemli farklılıklar vardır. 3
Ölçek türlerini birbirinden ayıran sayı sistemine ait özellikler şunlardır. 1. Gerçek sayılar birbirleriyle kesin bir sıra ilişkisi içindedir. (sıra özelliği). 2. Her gerçek sayı arasındaki uzaklık eşittir (aralık özelliği). 3. Gerçek sayılar sıfır noktasının belirlediği bir başlangıç noktasına sahiptir (başlangıç noktası, oran özelliği). Araştırmada incelenen bir özelliğin (değişkenin) ölçüm düzeyi; 1. sınıflayıcı (nominal), 2. sıralayıcı (ordinal, ranking), 3. aralıklı (interval), 4. oransal (ratio) ölçüm düzeylerinden herhangi birinde olabilir. Sınıflayıcı ölçüm düzeyi (nominal) Birimler çeşitli kategorilere göre sınıflanır. Bu ölçüm düzeyinde sıra, aralık ve oran özellikleri yoktur. Kan grubu, cinsiyet, göz rengi, tümör yerleşim yeri gibi değişkenler sınıflamalı ölçüm düzeyinde incelenir. Sıralayıcı ölçüm düzeyi (ordinal, ranking) Bu ölçüm düzeyinde sadece sıra özelliği vardır. Ağrı skoru, hastalık evresi gibi değişkenler sıralayıcı ölçüm düzeyine örnek gösterilir. Aralıklı ölçüm düzeyi (interval) Aralıklı ölçüm düzeyinde sadece sıra ve aralık özellikleri vardır. Hastanın ateşi değişkeni aralıklı ölçüm düzeyinde incelenir. Oransal ölçüm düzeyi (ratio) Sıra, aralık ve oran özelliklerinin tamamı vardır. 4
Uzunluk, zaman, ağırlık, hacim gibi ölçüme dayalı diğer tüm değişkenleri oransal ölçüm düzeyinde inceleyebiliriz. Sınıflayıcı ve sıralayıcı ölçüm düzeyinde incelenen değişkenleri nitel değişkenler, aralıklı ve oransal ölçüm düzeyindeki değişkenleri ise nicel değişkenler olarak adlandırabiliriz. Çeşitli ölçüm düzeylerinde geçerli olan istatistik işlemler ve sınama testleri aşağıdaki tabloda (Tablo 1) verilmektedir. Tablo 1. Ölçüm düzeyleri ve geçerli istatistik işlemler Ölçüm düzeyleri
Geçerli tanımlayıcı istatistikler
Sınıflayıcı (nominal)
Tepe değer (mod) Sıklık dağılımı (yukarıdakilere ek olarak) Ortanca Yüzdelik Sıra ilişki katsayısı
Sıralayıcı (ordinal)
Aralıklı veya oransal (interval, ratio) (normal dağılım geçerli ise)
(yukarıdakilere ek olarak) Aritmetik ortalama Standart sapma Korelasyon Regresyon
5
Geçerli sınama testleri Parametrik olmayan testler
Parametrik testler
6
Bölüm 2
Biyoistatistik VerilerinVerilerin Sunulması Sunumu
2.1. TABLO SUNUM İncelenen bir özelliğe (değişkene) ait çok sayıda gözlem değerinin (ham verinin) sadece liste halinde sunulması değişkenle ilgili açıklayıcı bilgi vermemektedir. Değişkenlerin tablolarla özetlenmesiyle gözlemlerle ilgili daha fazla bilgiye sahip oluruz. Aralıklı veya oransal ölçüm düzeyinde incelenen bir değişken için önce dağılım aralığı (en büyük değer–en küçük değer) hesaplanır. Belirlenen dağılım aralığı öngörülen sınıf sayısına (en az 5, en fazla 15) bölünerek sınıf genişliği hesaplanır. Uygun bir sunum için sınıf sayısının 10 civarında olması önerilir. Daha sonra, her sınıfa karşılık gelen gözlem sayısı çetele yöntemiyle (veya sayma yöntemiyle) belirlenir. Sınıf sayısının 10 olduğunu varsayarsak sıklık tablosu aşağıdaki gibi elde edilir (Tablo 1). 7
Tablo 1. Sıklık tablosu. Sınıflar Çetele 1.sınıf ........... 2.sınıf ........... 3.sınıf ........... 4.sınıf ........... 5.sınıf ........... 6.sınıf ........... 7.sınıf ........... 8.sınıf ........... 9.sınıf ........... 10.sınıf ........... Toplam
(Salt sıklık) fi f1 f2 f3 f4 f5 f6 f7 f8 f9 f10 n
Sıklık tablosuna yüzde sıklık, birikimli sıklık ve yüzde birikimli sıklık sütunları ilave edilerek tablonun daha açıklayıcı olması sağlanır. Yüzde sıklıklar salt sıklıkların toplam denek sayısına bölünmesiyle elde edilir. (Tablo 2). Tablo 2. Salt, birikimli ve yüzde sıklıklar. Sınıflar Salt sıklık Yüzde sıklık Birikimli sıklık (Yüzde birikimli sıklık) %Fi fi %fi Fi 1.sınıf f1 % f1 F1 % F1 2.sınıf f2 % f2 F2 % F2 3.sınıf f3 % f3 F3 % F3 4.sınıf f4 % f4 F4 % F4 5.sınıf f5 % f5 F5 % F5 6.sınıf f6 % f6 F6 % F6 7.sınıf f7 % f7 F7 % F7 8.sınıf f8 % f8 F8 % F8 9.sınıf f9 % f9 F9 % F9 10.sınıf f10 % f10 n 1.000 Toplam n 1.000
Sınıflayıcı veya sıralayıcı ölçüm düzeyinde incelenen bir değişkene ait sıklık tablosunda, sınıflar yerine, değişkene ait ölçülen kategorik değerler veya skorlar yer alır.
8
Örnek 1. 60 kişilik bir çalışma grubunda açlık kan şekeri ve sistolik kan basıncı değişkenleri ölçülmüştür. Bu ölçümlerle birlikte kişilerin cinsiyet bilgileri ve sigara içip içmediklerine ait bilgiler de toplanmıştır. 60 kişiye ait verilerin aşağıdaki gibi listelendiğini varsayalım (Tablo 3). Tablo 3. 60 Kişide cinsiyet, sigara, kan şekeri ve kan basıncı bilgileri. Denek Açlık kan no Cinsiyet Sigara şekeri
Sistolik Açlık kan Denek kan basıncı no Cinsiyet Sigara şekeri
Sistolik kan basıncı
1
1
1
95
110
31
2
1
116
127
2
1
2
99
122
32
2
1
98
118
3
1
2
87
124
33
2
1
89
125
4
1
2
106
106
34
2
1
86
120
5
1
2
105
117
35
2
2
105
119
6
1
2
116
118
36
2
2
100
125
7
1
2
95
115
37
2
1
104
123
8 9
1 1
1 1
96 104
121 111
38 39
2 2
1 1
99 87
120 128
10 11
1 1
1 2
111 85
125 118
40 41
2 2
2 2
100 101
119 120
12
1
2
108
108
42
2
2
110
120
13
1
2
91
111
43
2
1
98
121
14
1
2
102
119
44
2
2
98
118
15
1
2
96
115
45
2
1
117
120
16
1
1
106
120
46
2
1
101
118
17
1
2
96
117
47
2
1
103
121
18
1
1
93
126
48
2
1
106
118
19
1
1
100
119
49
2
1
102
118
20
1
2
95
113
50
2
1
99
120
21
1
2
96
116
51
2
1
87
107
22
1
2
101
118
52
2
1
104
112
23
1
2
98
124
53
2
2
94
132
24
1
2
113
120
54
2
1
95
130
25
1
2
106
114
55
2
1
106
114
26
1
2
100
133
56
2
1
106
119
27
1
2
113
120
57
2
1
94
107
28
1
1
89
116
58
2
1
90
108
29 30
1 1
2 2
107 89
122 119
59 60
2 2
1 2
98 96
132 132
( Cinsiyet : 1 = Kadın 2= Erkek ; Sigara : 1 = İçiyor 2 = İçmiyor )
9
Açlık kan şekeri değişkenine ait sıklık tablosunu oluşturmak isteyelim. Açlık kan şekerine ait en küçük değer 85, en büyük değer ise 117 ve dağılım aralığı 117–85=32 birimdir. Sınıf sayısını 9 kabul edersek sınıf genişliği (32/9)=3.56 ≅ 4 olur. Buna göre sıklık tablosu (’den az) özelliği kullanılarak aşağıdaki gibi elde edilir (Tablo 4). Tablo 4. Açlık kan şekeri sıklık tablosu. Salt (Sınıf gerçek sınırları) sıklık Sınıflar Çetele fi 85 - 89 'den az ///// 5 89 - 93 'den az ///// 5 93 - 97 'den az ///// ///// // 12 97 - 101 'den az ///// ///// // 12 101 - 105 'den az ///// //// 9 105 - 109 'den az ///// ///// 10 109 - 113 'den az // 2 113 - 117 'den az //// 4 117 - 121 'den az / 1 Toplam 60
Yüzde sıklık %fi 0,083 0,083 0,200 0,200 0,150 0,167 0,033 0,067 0,017
Birikimli sıklık Fi 5 10 22 34 43 53 55 59 60
Yüzde birikimli sıklık %Fi 0,083 0,167 0,367 0,567 0,717 0,883 0,917 0,983 1,000
Sıklık tablosunu (’den az) özelliğini kullanmadan da aşağıdaki gibi oluşturabiliriz (Tablo 5). Tablo 5. Açlık kan şekeri sıklık tablosu. (Sınıf ölçü sınırları) Sınıflar 85 - 88 89 - 92 93 - 96 97 - 100
Çetele ///// ///// ///// ///// // ///// ///// //
fi 5 5 12 12
%fi 0,083 0,083 0,200 0,200
Fi 5 10 22 34
%Fi 0,083 0,167 0,367 0,567
101 - 104
///// ////
9
0,150
43
0,717
105 - 108
///// /////
10
0,167
53
0,883
109 - 112
//
2
0,033
55
0,917
113 - 116
////
4
0,067
59
0,983
117 - 120 Toplam
/
1 60
0,017
60
1,000
10
Sınıf gerçek sınırları arasındaki orta değerler sınıf değerleri olarak kabul edilir. Bir önceki tabloya ait sınıf ölçü değerleri, sınıf gerçek sınırları ve sınıf değerleri aşağıdaki gibidir (Tablo 6). Tablo 6. Sınıf sınırları. (Sınıf gerçek sınırları) Sınıflar
(Sınıf ölçü sınırları) Sınıflar
Sınıf değerleri
84.5 - 88.5’den az
85 - 88
86.5
88.5 - 92.5’den az
89 - 92
90.5
92.5 - 96.5’en az
93 - 96
94.5
96.5 – 100.5’den az
97 - 100
98.5
100.5 – 104.5’den az
101 - 104
102.5
104.5 – 108.5’den az
105 - 108
106.5
108.5 – 112.5’den az
109 - 112
110.5
112.5 – 116.5’den az
113 - 116
114.5
116.5 – 120.5’den az
117 - 120
118.5
Cinsiyet değişkenine ait sıklık tablosu (Tablo 7) ve sigara içmenin cinsiyete göre dağılışı (Tablo 8) aşağıda verilmektedir. Tablo 7. Cinsiyet dağılımı. Cinsiyet Kadın Erkek Toplam
Salt sıklık n 30 30 60
Yüzde sıklık % 0.50 0.50 1.00
Tablo 8. Cinsiyete göre sigara içme durumu.
Kadın Erkek Toplam
Sigara içiyor n % 8 %26.67 22 %73.33 30 %50.00
Sigara içmiyor n % 22 %73.33 8 %26.67 30 %50.00 11
Toplam n 30 30 60
2.2. GRAFİK SUNUM Araştırmaların istatistiksel değerlendirilmesi sonucu elde edilen veriler kullanılarak, incelenen değişkenlerin kendi içindeki değişmeleri veya değişkenler arasındaki ilişkilerin karşılaştırmalı olarak çeşitli geometrik şekil veya resimlerle ifade edilmesine grafik gösterim diyoruz. Çizilecek grafiğin şekli incelenen değişkeni veya değişkenleri ayrıntılı bir şekilde canlandırabilmeli ve grafik herkes tarafından kolayca anlaşılabilmelidir. İstatistik incelemelerde elde edilen sayısal verinin (istatistik tabloların) yanında bu sayısal veriye ait grafiklerin verilmesinin yararlarını aşağıdaki gibi sıralayabiliriz. 1. İstatistik tabloları, grafik çizimleri ile herkesin kolayca anlayabileceği hale gelir. 2. Olayların karşılaştırılması grafiklerde daha kolaydır. 3. Grafik bilgilerin akılda tutulması daha kolaydır. 4. Grafik yardımıyla ara değer bulma (interpolasyon) işlemi yapılarak olaylarla ilgili eksik bilgiler tamamlanabilir. 5. Grafik sunum okuyucunun konu üzerindeki ilgisini arttırır. Grafik tiplerini iki ayrı kısımda inceleyebiliriz.
2.2.1. KARTOGRAMLAR (HARİTALAR) Bir değişkene ait değerlerin (yoğunlukların) çeşitli yerlere göre dağılışının harita üzerinde gösterilmesine kartogram denir. Harita üzerinde her bölgeye ait değerler özel işaretlerle (çeşitli taramalar, sık veya seyrek noktalar, çeşitli renkler, aynı rengin çeşitli tonları) gösterilir. Şekil 1'de verilen kartogram kalp hastalıklarına ilişkin ölüm hızının illere göre dağılımını göstermektedir.
Şekil 1. Kalp hastalıklarına ilişkin ölüm hızlarının illere göre dağılımı (1985- 1988). 12
2.2.2. DİYAGRAMLAR İstatistikte grafik ile diyagram kelimesi genellikle birbiri yerine kullanılmaktadır. Bundan sonraki bölümlerde grafik kelimesi tek başına kullanıldığında diyagram ifade edilecektir. İncelenen değişkene veya değişkenlere ait sonuçları temsil etmek için çeşitli geometrik şekillerle veya resimlerle yapılan çizimlere grafikler diyoruz. Çizilecek grafik türünün belirlenmesinde grafiği çizilecek değişken veya değişkenlerle ilgili olarak aşağıdaki sorulara cevap vermeliyiz. 1. Değişken hangi ölçüm düzeyinde ölçülmüştür? Sınıflayıcı veya sıralayıcı (nitel) ölçüm düzeyinde incelenen bir değişken için çubuk grafikleri ve daire dilimleri grafiği kullanılır. Aralıklı ve oransal (nicel) ölçüm düzeyinde ise histogram, çizgi grafikleri ve eğrisel grafikler kullanılır. 2. Çizilecek grafik kaç boyutlu olmalıdır? Grafikler genellikle iki boyutlu olarak çizilir. Grafiklere üçüncü boyut (derinlik) ilave edilerek grafiklerin algılanması kolaylaşır. 3. Kullanılacak eksen türü ne olmalıdır? Eğer seri terimleri arasındaki mutlak farklar inceleniyorsa doğrusal ölçülü eksen, seri terimleri arasındaki artış ya da azalış oranları karşılaştırılmak isteniyorsa logaritmik ölçü eksen kullanılır. 4. İncelenen değişkene ait hangi sıklık türü kullanılacak? Genellikle grafiklerde salt ve yüzdeli sıklıklar kullanılır. Eğer sınıf genişlikleri farklı olan serilerin karşılaştırılması isteniyorsa, birikimli seri grafikleri kullanılır. Sık kullanılan grafik türleri aşağıda verilmektedir. 1. Çubuk grafikler. 2. Daire dilimleri grafiği. 3. Histogram. 13
4. Çizgi grafikleri. 5. Eğrisel grafikler. 6. Yarı logaritmalı grafikler.
2.2.2.1.
ÇUBUK GRAFİKLER
Astımlı hastalarda sigara içme sıklığına ilişkin bilgiler aşağıda verilmektedir. (Tablo 9). Grafiği çizilecek değişken (astımlı hastalarda sigara içme durumu) sınıflamalı ölçüm düzeyinde incelendiğinden çubuk grafik türünü kullanmak uygun olur. Şekil 2'de verilen çubuk diyagramında her çubuğun genişliği birbirine eşittir. Aynı grafiğe derinlik boyutu ilave edilerek, grafik, üç boyutlu olarak da çizilebilir (Şekil 3). Tablo 9. Astımlı Hastalarda Sigara İçme Sıklığı Sigara içme durumu Hiç sigara içmemiş Halen sigara içiyor Daha önce sigara içmiş Toplam
Yüzde (%) 73.46 11.39 15.15 100.00
(Kaynak: Yildiz, F; Dursun, AB ; Disci, R PASTE Study Grp :”Prevalence of asthmatic smokers: Turkish experience (PASTE Study)”CLINICAL RESPIRATORY JOURNAL Volume: 8 Issue: 3 Pages: 350-356 DOI: 10.1111/crj.12079 Published: JUL 2014)
Şekil 2. Astımlı hastalarda sigara içme sıklığı. 14
Şekil 3. Astımlı hastalarda sigara içme sıklığı. Astımlı hastalarda sigara içme sıklığının bölgelere göre dağılımına (Tablo 10) ilişkin grafiği Şekil 4'deki gibi çizebiliriz. Aynı grafik üzerinde 2 ya da daha çok değişkeni birlikte incelemek mümkündür. Tablo 10. Astımlı hastalarda sigara içme sıklığının bölgelere göre dağılımı Bölgeler Doğu Anadolu Güney Doğu Anadolu Karadeniz Akdeniz Ege İç Anadolu Marmara
Hiç sigara içmemiş % 78 81 82 68 78 75 66
Halen içiyor veya daha önce içmiş bırakmış % 22 19 18 32 22 25 34
(Kaynak: Yildiz, F; Dursun, AB; Disci, R PASTE Study Grp :”Prevalence of asthmatic smokers: Turkish experience (PASTE Study) ”CLINICAL RESPIRATORY JOURNAL Volume: 8 Issue: 3 Pages: 350-356 DOI: 10.1111/crj.12079 Published: JUL 2014
15
Şekil 4. Astımlı hastalarda sigara içme sıklığının bölgelere göre dağılımı. Yine, 100.000 doğumda anne ölüm oranı değişkeninin uluslar arası karşılaştırmasını da (Tablo 11) çubuk grafikleri ile gösterebiliriz (Şekil 5).
Tablo 11. Anne Ölüm Oranı Uluslararası Karşılaştırması, (100.000 Canlı Doğumda), 2010 Dünya Orta- Üst Gelir Grubu Ülkeler DSÖ Avrupa Bölgesi Türkiye Üst Gelir Grubu Ülkeler
210.0 53.0 20.0 15.4 14.0
(Kaynak: Türkiye Halk Sağlığı Kurumu, DSÖ World Health Statistics 2013 Not: Türkiye verisi 2012 yılına aittir.
16
Şekil 5. Anne Ölüm Oranı Uluslararası Karşılaştırması, (100.000 Canlı Doğumda), 2010
2.2.2.2.
DAİRE DİLİMLERİ GRAFİĞİ
Çubuk grafikleri bölümünde grafiği çizilen astımlı hastalarda sigara içme durumu” değişkeni için daire dilimleri grafik türünü de (Şekil 6.) kullanabiliriz. İncelenen değişkene ait yüzde sıklık değerlerini kullanarak daire dilimlere ayrılır. Örneğin, hiç sigara içmeyenleri göstermek için % 74 sıklık değerine karşılık gelen daire dilimi için % 74 x 360 = 266.40 derecelik bir pay ayrılır.
Şekil 6. Astımlı hastalarda sigara içme sıklığı. 17
2.2.2.3. HİSTOGRAM 184 öğrencide ölçülen boy değişkenine ilişkin değerler Tablo 12'de verilmektedir. Boy değişkeni oransal ölçüm düzeyinde incelenen bir değişkendir. Yatay eksende boy değişkeni, dikey eksende sıklık değerleri (salt ya da yüzdeli sıklıklar) kullanılarak histogram çizilir (Şekil 7). Histogramda çubuk genişlikleri sınıf genişliklerine karşılık gelir. Çubukların üst orta noktaları birleştirilerek histogram grafiği, sıklık çokgeni veya sıklık eğrisine dönüştürülebilir (Şekil 8). Tablo 12. Öğrencilerin boy değerleri. Sınıflar
Sınıf Değeri
Salt Sıklık
147,5 - 152,5 'den az
150
4
152,5 - 157,5 'den az
155
12
157,5 - 162,5 'den az
160
19
162,5 - 167,5 'den az
165
35
167,5 - 172,5 'den az
170
46
172,5 - 177,5 'den az
175
38
177,5 - 182,5 'den az
180
19
182,5 - 187,5 'den az
185
8
187,5 - 192,5 'den az Toplam
190
3 184
Şekil 7. Öğrencilerin boy değerleri. 18
Şekil 8. Öğrencilerin boy değerleri. Histogram grafik türü kullanılarak nüfusun yaşa ve cinsiyete göre dağılışının incelendiği özel grafik türüne nüfus piramidi denir. 2013 Türkiye nüfusunun yaşa ve cinsiyete göre dağılışına ilişkin nüfus piramidi Şekil 9'da verilmektedir. Yatay eksende salt nüfus (ya da yüzdeli sıklık), dikey eksende ise yaş değerleri yer almaktadır. Piramidin sol tarafı erkeklere ait bilgileri, sağ tarafı ise kadınlara ait bilgileri içerir. Adrese dayalı nüfus kayıt sistemi sonuçlarına göre, nüfusun cinsiyete göre dağılışı aşağıda verilmektedir. (Tablo 13.) Tablo 13. 31 Aralık 2013 tarihi itibarıyla Türkiye nüfusunun cinsiyete göre dağılışı Erkek Kadın Toplam
38.473.360 38.194.504 76.667.864
% 50.2 % 49.8
Kaynak : Türkiye İstatistik Kurumu, Haber Bülteni, Sayı: 15974 - 29 Ocak 2014
19
31 Aralık 2013 tarihi itibarıyla Türkiye nüfusu 76 667 864’tür. Erkek nüfusun oranı %50,2 (38 473 360 kişi), kadın nüfusun oranı ise %49,8 (38 194 504 kişi)‘dir.
Şekil 9. 2013 yılı Türkiye nüfus piramidi. Kaynak : Türkiye İstatistik Kurumu, Haber Bülteni, Sayı: 15974 - 29 Ocak 2014
2.2.2.4. ÇİZGİ GRAFİKLER 6-11 yaş grubu çocuklarda ortalama sistolik kan basıncı değerlerinin yaşa ve cinsiyete göre dağılımına (Tablo 14) ilişkin çizgi (doğru) grafiği Şekil 10'da verilmektedir. Yatay eksende yaş, dikey eksende ise sistolik kan basıncı değerleri yer almaktadır. Her iki değişken oransal ölçüm düzeyinde incelenmiştir.
20
Tablo 14. 6-11 yaş çocuklarda ortalama sistolik kan basıncı değerleri (mm-Hg) . Yaş
Ortalama Kan Basıncı (mm-Hg) Kız Erkek
6
103,4
102,4
7
103,8
103,0
8
106,9
105,9
9
107,8
105,3
10
110,9
107,6
11
114,1
108,1
(Kaynak: Kıyak, M., Dişçi, R., Ertem, G.: “İlkokul çocuklarında kan basıncı araştırması”, Tıp Fak Mec., 48,386-393, (1985))
Şekil 10. 6-11 Yaş çocuklarda ortalama sistolik kan basıncı değerleri (mm-Hg) Yine, 1987-1991 döneminde, İstanbul Tıp Fakültesi'nden taburcu olan hastaların yıllara ve cinsiyete göre dağılımı Tablo 15’de verilmektedir. 21
Dağılımı gösteren çizgi grafiğinin (Şekil 11) yatay ekseninde yer alan süre değişkeni oransal ölçüm düzeyinde incelenen bir değişkendir. Dikey eksende ise, salt sıklıklar kullanılmıştır. Bu tür grafiklere zaman grafiği adı da verilir. Tablo 15. 1987-1991 Yıllarında İstanbul Tıp Fakültesi’nden taburcu olan hastaların cinsiyete göre dağılımı. Taburcu olan hastalar Yıllar
Erkek
Kadın
1987
13450
17638
1988
13113
15126
1989
13336
13535
1990
14796
15240
1991
13571
14565
Şekil 11.1987-1991 Yıllarında İstanbul Tıp Fakültesi'nden taburcu olan hastaların cinsiyete göre dağılımı.
22
1 yaşından küçük çocuk ölümlerinin kaç aylıkken öldüklerini (Tablo 16) göstermek için de çizgi grafik türünü kullanabiliriz (Şekil 12). Tablo 16. Bir yaşından küçük çocuk ölümlerinin kaç aylıkken öldüklerine göre dağılım (1988). Ay 1 2 3 4 5 6 7 8 9 10 11
Ölüm sayısı 12855 1537 871 501 400 398 545 624 766 723 734
(Kaynak : D.İ.E., İl ve ilçe merkezlerinde ölüm istatistikler (1988), sayfa:78.)
Şekil 12. Bir yaşından küçük çocuk ölümlerinin kaç aylıkken öldüklerine göre dağılımı (1988). 23
2.2.2.5. EĞRİSEL GRAFİKLER Çizgi grafik türünde yatay eksende yer alan değişken daha sık aralıklarla incelendiğinde çizgi grafiği eğrisel grafiğe dönüşür. 0-11 yaş erkek çocuklarının 3., 50. ve 97. boy persantil değerlerine (Tablo 17) ilişkin grafik, eğrisel grafik türü ile gösterilebilir (Şekil 13). Tablo 17. 0-11 yaş erkek çocuklarda 3., 50. ve 97. boy persantil değerleri (cm). Yaş
3.Persantil
50.Persantil
97.Persantil
Yeni doğan
48,1
51,0
53,9
3 ay
55,5
61,0
66,5
6 ay
60,9
67,0
73,0
9 ay
65,3
71,0
76,6
1 yaş
69,4
76,0
82,5
1 Y. 6 ay
71,4
79,0
86,5
2 yaş
76,0
84,0
91,9
2 Y. 6 ay
77,3
86,0
94,6
3 Yaş
79,6
90,0
100,2
3 Y. 6 ay
88,5
95,0
101,5
4 yaş
88,9
98,0
107,0
5 yaş
93,1
104,0
114,7
6 yaş
106,6
117,0
127,3
7 yaş
110,9
121,0
131,0
8 yaş
114,5
126,0
137,4
9 yaş
118,5
132,0
145,3
10 yaş
124,6
137,0
149,2
11 yaş
128,5
140,0
151,3
(Kaynak : Dişçi, R., Irmak, Y.: “0-11 Yaş Grubundaki Çocuklarda Tartı ve Boy Değişkenlerine İlişkin Persantil Değerlerinin Elde Edilmesinde Monte-Carlo Yönteminin Kullanılması”, Tıp Fak Mecm., 49:223-230, (1986).)
24
Şekil 13. 0 - 11 yaş erkek çocuklarda 3., 50. ve 97. boy persantil eğrileri.
2.2.2.6. YARI LOGARİTMALI GRAFİKLER X ve Y değişkenlerinin 10 günlük ölçüm değerleri Tablo 18'de verilmektedir. Tablo 18'den de görüleceği gibi X değeri günlük ortalama % 22'lik bir artışla, Y değerleri ise %35'lik bir artışla artmaktadır. X ve Y değerleri karşılaştırıldığında incelemede esas olan X ve Y değişkenlerine ait mutlak değerler ise dikey eksende doğrusal ölçü kullanılır (Şekil 14). X ve Y değişkenlerinin günlük artış hızları karşılaştırılmak isteniyorsa, dikey eksende doğrusal ölçek yerine logaritmik ölçek kullanılır (Şekil 15). Şekil 15 incelendiğinde Y değişkeninin X'e göre daha fazla arttığı açıkça görülmektedir. Şekil 14'de ise hangi değişkenin daha fazla arttığı (ya da azaldığı) belli değildir.
25
Tablo 18. X ve Y değişkenlerinin 10 günlük ölçüm değerleri. Gün
x
y
Log(x)
Log(y)
1
100,00
20,00
2,00
1,30
2
122,00
27,00
2,09
1,43
3
148,84
36,45
2,17
1,56
4
181,58
49,21
2,26
1,69
5
221,53
66,43
2,35
1,82
6
270,27
89,68
2,43
1,95
7
329,73
121,07
2,52
2,08
8
402,27
163,44
2,60
2,21
9
490,77
220,65
2,69
2,34
10
598,74
297,87
2,78
2,47
Şekil 14. X ve Y değişkenlerinin 10 günlük ölçüm değerleri (dikey eksen doğrusal ölçekli). 26
Şekil 15. X ve Y değişkenlerinin 10 günlük ölçüm değerleri (dikey eksen logaritmik ölçekli).
27
Bölüm 3
Tanımlayıcı İstatistikler
Araştırmada incelenen bir değişkene ait tüm verileri özetleyen tipik değerlere toplanma ölçüleri (merkezi eğilim) denir. Gözlem veya ölçüm değerlerinin ortalamadan ne kadar uzaklaştıkları, diğer bir ifadeyle, ortalamaya ne kadar yaklaştıkları, ölçüm değerlerinin hangi aralıkta yer aldıkları dağılım (saçılma) ölçüleri ile belirlenir. Anayığının tamamının incelenmesi veya gözleme tabi tutulması ile elde edilen verilere ait toplanma ve dağılım ölçülerine parametre, anayığın yerine, anayığını temsil ettiği düşünülen örnekleme ait toplanma ve dağılım ölçülerine ise istatistik adını veriyoruz. İstatistikler parametrelerin kestirim (tahmin) değerleridir.
3.1. TOPLANMA ÖLÇÜLERİ 3.1.1. ARİTMETİK ORTALAMA Gözlemlerin
sayısal
değerlerinin
toplamının
gözlem
sayısına
bölünmesiyle elde edilir. İncelenen grup örneklem ise aritmetik ortalama x (veya m ) simgesi ile, anayığın (evren) ise
µ simgesi ile gösterilir.
Basit serilerde aritmetik ortalama aşağıdaki ifade ile hesaplanır. n
!x
N
(örneklem için) x =
i =1
n
!x
i
i
, (anayığın için ) µ = 29
i =1
N
Formüllerde yer alan simgelerin açıklanması :
x ,
µ ! xi
: Aritmetik ortalama. : Toplama simgesi. : X değişkeninin i. gözlem değeri.
n : Örneklem birim sayısı. N : Anayığın birim sayısı. Örnek 1. 13 kişilik bir örneklem grubunda sistolik kan basıncı değerleri ölçülmüştür (Tablo 1). Elde edilen basit seride aritmetik ortalamayı hesaplayınız. Tablo 1. 13 Kişide sistolik kan basıncı değerleri
xi
Denek no 1 2 3 4 5 6 7 8 9 10 11 12 13
127 118 125 120 119 125 123 120 128 119 120 120 121
Çözüm : n = 13 13
!x
i
= (127 + 118 + … + 121) = 1585
i =1
30
n
x=
13
! xi
!x
i
i =1
i =1
=
n
13
=
1585 = 121.92 13
Sınıflanmış–gruplanmış serilerde aritmetik ortalama aşağıdaki ifade ile hesaplanır. k
x=
!
fi xi
i =1 k
!
fi
i =1
Burada k = sınıf sayısını, f i
ise sınıf sıklığını göstermektedir. Sınıf k
sıklıklarının toplamı örneklemdeki toplam denek sayısını verir
!f
i
=n
i =1
k
İncelenen grup anayığın ise
!f
i
= N ’dir.
i =1
Örnek 2 . 340 kişilik bir örneklem grubunda, X dersine ait sınav sonuçları sınıflanmış sıklık serisi ile verilmektedir (Tablo 2). Aritmetik ortalamayı hesaplayınız. Tablo 2. 340 kişilik örneklemde (X) dersi sınav sonuçları Sınıflar (’den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam 31
fi 3 12 35 45 110 45 35 30 15 10 340
Çözüm : Sınıf gerçek sınırları arasındaki orta değerler hesaplanarak sınıf değerleri ( xi ) ve sınıf değerleri ile sınıf sıklıkları çarpılarak
10
!
f i xi değeri hesaplanır
i =1
(Tablo 3). Tablo 3. Sınıflar (’den az)
xi
fi
f i xi
0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam
5 15 25 35 45 55 65 75 85 95
3 12 35 45 110 45 35 30 15 10 340
15 180 875 1575 4950 2475 2275 2250 1275 950 16820
k
!fx i
x=
i
i =1 k
!f
i
i =1
10
!f
i
= 340
i =1
x
=
16820 = 49.47 340 32
Aritmetik ortalamanın özellikleri : 1. Gözlem değerlerinin aritmetik ortalamadan sapmalarının toplamı sıfıra eşittir. n
" (x
i
! x) = 0
i =1
2. Gözlem değerleri ile aritmetik ortalama arasındaki farkların karelerinin toplamı minimumdur.
"d ! R için "d ! R için 3. a ve b ! R olmak üzere, yi = a ! xi + b serisinde aritmetik ortalama y = a ! x + b ifadesi ile hesaplanır. Başlangıç noktası ölçek değişimi yöntemi ile aritmetik ortalamanın hesabı :
xi ! x 0 dönüşümü ile elde edilen d i serisinde aritmetik ortalama ( d ) h hesaplanır. Buradan, x = h ! d + x0 ifadesi ile de X serisinin aritmetik ortalaması hesaplanır.
x0 (başlangıç değeri) olarak sıklığı en fazla olan sınıf değeri, h (ölçek değeri) olarak ise sınıf genişliği alınır. Örnek 2’ de verilen sınıflanmış serinin aritmetik ortalamasını başlangıç noktası ve ölçek değişimi yöntemiyle hesaplayalım. Başlangıç noktası, sıklığı en fazla olan sınıf değeri x 0 = 45 ve ölçek değeri olarak da sınıf genişliği h=10 alınarak elde edilen
di =
xi ! x 0 x ! 45 = i h 10
serisinin aritmetik ortalaması hesaplanır
(Tablo 4). 33
Tablo 4. (d) serisinde ortalamaya ilişkin işlemler. Sınıflar (‘den az)
xi
0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam
5 15 25 35 45 55 65 75 85 95
di =
xi ! x 0 h -4 -3 -2 -1 0 1 2 3 4 5
fi
fi di
3 12 35 45 110 45 35 30 15 10 340
-12 -36 -70 -45 0 45 70 90 60 50 152
10
d =
!f
i di
i =1 k 10
!f
= i
152 = 0.4471 340
i =1
x = h d + x0 = (10) (0.4471) + 45
x = 49.471 bulunur. 3.1.2. ORTANCA (MEDYAN) Basit seride ortanca değerinin hesaplanması : Seri terimlerini artan ya da azalan sırada sıraya dizdiğimizde, seriyi terim 0 sayısı açısından iki eşit kısma bölen değerdir. Q2 , x veya Med simgelerinden biri ile gösterilir. n +1 n Basit sıralı seride n tek ise , ’inci terim, n çift ise ’inci terim ile 2 2 n+2 ’inci terimin aritmetik ortalaması serinin ortanca değerini verir. 2
34
Örnek 1’de verilen basit seride ortanca değerini hesaplamak istersek, ilk olarak seri değerlerini artan sırada sıralamamız gerekir. Sıralama aşağıdaki gibi yapılır (Tablo 5). Tablo 5. Sıralı (x) değerleri. Denek no 1 2 3 4 5 6 7 8 9 10 11 12 13
n = 13 olduğundan
xi
Denek no 2 5 10 4 8 11 12 13 7 3 6 1 9
127 118 125 120 119 125 123 120 128 119 120 120 121
(Sıralı)
xi
118 119 119 120 120 120 120 121 123 125 125 127 128
n +1 13 + 1 = 7’inci terim olan 120 değeri = 2 2
ortanca değeridir . Q2 = 120
Sınıflanmış-gruplanmış serilerde ortaca değerinin hesaplanması : Sınıflanmış bir seride birikimli sıklıklar hesaplanır ve ortanca değerini içeren sınıf aralığı belirlenir. Daha sonra aşağıdaki ifade ile ortanca değeri hesaplanır.
n "F Q2 = l + 2 !i f Formülde yer alan simgeler : l : ortanca sınıfının gerçek alt sınırı. F : l’den küçük terim sayısı. 35
f : Ortanca sınıfının sıklığı. i : Ortanca sınıfının genişliği. Örnek 2’de verilen sınıflanmış seride ortanca değerini aşağıdaki gibi hesaplarız (Tablo 6). Önce birikimli sıklıklar hesaplanır ve ortanca sınıf belirlenir ( n=340 ve (n/2)=170). Basit bir seriyi inceliyor olsaydık, 170’inci ve 171’inci terimlerin aritmetik ortalamasını almamız gerekirdi. Ortanca sınıfının 40–50 sınıfı olduğu açıkça görülmektedir. Tablo 6. Sınıflar (’den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam
xi 5 15 25 35 45 55 65 75 85 95
fi 3 12 35 45 110 45 35 30 15 10 340
Fi 3 15 50 95 205 250 285 315 330 340
Ortanca sınıfının gerçek alt sınırı (l) 40, l’den küçük terim sayısı (F) 95 ve sınıf genişliği (i) 10’dur. Buna göre ortanca değeri,
n 340 "F " 95 2 2 Q2 = l + ! i = 40 + ! 10 f 110
Q2 = 46.818 bulunur. Seri terimlerini 4 eşit kısma ayıran değerlere çeyreklik, 10 eşit kısma ayıran değerlere ondalık ve 100 eşit kısma ayıran değerlere yüzdelik (persan36
til) değerleri adı verilir. 2. çeyreklik, 5. ondalık ve 50. persantil değerleri ortanca değerine karşılık gelir. Çeyrekliklerin, ondalık değerlerin ve persantil değerlerinin hesaplanmasında izlenen yol ortancanın hesabındaki gibidir. 1. çeyreklik Q1 , 2. çeyreklik Q2 ve 3.çeyreklik Q3 simgeleri ile gösterilir. Örnek 1’de verilen basit seride Q1 ve Q3 değerlerini hesaplayalım. n = 13 , (n/4) = (13/4) = 3.25 , 4. terim Q1 değerine karşılık gelir.
Q1 = 120 . n = 13 , (3n/4) = (39/4) = 9.75 , 10.terim Q3 değerine karşılık gelir.
Q3 = 125. Örnek 2’de verilen sınıflanmış seride Q1 ve Q3 değerlerini hesaplayalım. n=340, (n/4) = (340/4) = 85, 85. ve 86. terimlerin ortalaması Q1 değerini verecektir. Q1 sınıfı 30 – 40 olarak belirlenir. Buna göre Q1 değeri aşağıdaki ifade ile hesaplanır.
n 340 "F " 50 4 4 Q1 = l + ! i = 30 + ! 10 f 45 Q1 = 37.78 n=340, (3n/4) = (1020/4) = 255, 255. ve 256. terimlerin aritmetik ortalaması Q3 değerini verir. Q3 sınıfı 60 – 70 sınıfıdır. Buna göre Q3 değeri aşağıdaki gibi hesaplanır.
3n 1020 "F " 250 4 4 Q3 = l + ! i = 60 + ! 10 f 35 Q3 =61.43
37
Ortancanın özellikleri : 1. Ortanca, serideki değerlerin tümüne bağlı değildir. 2. Ortanca, serideki uç anormal değerlerden etkilenmez. 3. Sıralamalı ölçüm düzeyinde ortalama olarak ortanca değeri kullanılır. 4. Ortancanın cebirsel yapısı zayıftır. n
5.
!x
i
" Q2 = minimum.
i =1
6. İncelenen seride değişkenlik düzeyi yüksek ise aritmetik ortalama yerine ortanca kullanılır.
3.1.3. TEPE DEĞER (MOD) ^
Seride en sık tekrarlanan değere tepe değer denir ve X ile gösterilir. Örnek 1’de verilen basit seride en sık tekrarlanan değer 120’dir. Mod = 120 Sınıflanmış seride önce mod sınıfı belirlenir ve aşağıdaki ifade ile mod değeri hesaplanır.
Mod = l +
"1 !i "1 + " 2
l : Mod sınıfının gerçek alt sınırı.
! 1 : Mod sınıfı sıklığı – bir önceki sınıf sıklığı. ! 2 : Mod sınıfı sıklığı – bir sonraki sınıf sıklığı. Örnek 2’de verilen sınıflanmış sıklık serisinde mod değeri aşağıdaki gibi hesaplanır. 38
Sıklığı en fazla olan 40 – 50 sınıf mod sınıfıdır.
Mod = l +
"1 (110 " 45) ! i = 40 + ! 10 "1 + " 2 (110 " 45) + (110 " 45)
Mod = 45 İncelenen seride birden çok mod varsa, serinin homojen olup olmadığı kontrol edilir. Seri homojen ise sınıf genişlikleri değiştirilip tekrar sınıflama yapılır. U , J, ve ters J eğrilerinde mod hesaplanmaz. Mod değeri tek maksimumlu serilerde hesaplanır. Mod değerinin cebirsel yapısı zayıftır ve ortalamalar içerisinde en az duyarlı olanıdır.
3.1.4. GEOMETRİK ORTALAMA Seri terimleri geometrik olarak artıyor ya da azalıyorsa, aritmetik ortalama yerine geometrik ortalama kullanılır. Geometrik ortalama seri terimlerinin çarpımının toplam gözlem sayısı derecesinde kökünün alınmasıyla elde edilir. Geometrik ortalama G.O. simgesiyle gösterilir.
G.O. = n x1 x 2 L x n Geometrik ortalamayı logaritmanın özelliklerini kullanarak aşağıdaki gibi de hesaplayabiliriz. n
1 log(G.O.) = (log x1 + log x 2 + L + log x n ) = n
! log x
i
i =1
n
G.O. = Antilog(log(G.O.)) Örnek 3. Bir yığında 1. günde 0.10, 2. günde 0.12 ve 3. günde 0.15’lik bir artış varsa, incelenen yığında günlük ortalama artış hızı kaçtır ? Çözüm :
G.O. = n x1 x 2 L x n G.O. =
3
=
3
(0.10) ! (0.12) ! (0.15)
0.0018 = 0.121644 39
3.1.5. AĞIRLIKLI ORTALAMA X değişkeninin aynı anayığından rastlantısal olarak seçilmiş farklı büyüklükteki örneklemlerde ölçüldüğünü ve her bir örnekleme ait ortalamaların aşağıdaki şekilde hesaplandığını varsayalım.
x1 , x 2 L x k Ağırlıklı ortalama aşağıdaki ifade ile hesaplanır. k
!n
i
x=
" xi
i =1
k
!n
i
i =1
3.2. DAĞILIM (SAÇILMA) ÖLÇÜLERİ 3.2.1. YAYILMA GENİŞLİĞİ (AÇIKLIK, RANGE) Serideki terimlerin tümüne bağlı olmayan bir değişkenlik ölçüsüdür. Yayılma genişliği en büyük değerden en küçük değer çıkarılarak elde edilir. Yayılma genişliği = en büyük değer – en küçük değer Sıralı seride, yayılma genişliği = x n ! x1 Sınıflanmış seride, yayılma genişliği = son sınıf değeri – ilk sınıf değeri Örnek 1’ de, yayılma genişliği = 128 – 118 = 10, Örnek 2’de , yayılma genişliği = 95 – 5 = 90’dır.
3.2.2 . ÇEYREKLER ARASI YARI GENİŞLİK (ÇEYREK SAPMA) Çeyrekler arası yarı genişlik Q simgesi ile gösterilir ve aşağıdaki ifade ile hesaplanır.
Q=
Q3 ! Q1 . 2 40
Seride, aritmetik ortalama yerine ortanca hesaplamak daha uygun ise, değişkenlik ölçüsü olarak, standart sapma yerine çeyrekler arası yarı genişlik kullanılır. Örnek 1’de çeyrekler arası yarı genişlik,
Q=
Q3 ! Q1 125 ! 120 = = 2.5 , 2 2
Örnek 2’de ise,
Q=
Q3 ! Q1 61.43 ! 37.78 = = 11.825 olarak hesaplanır. 2 2
3.2.3. ORTALAMA MUTLAK SAPMA Seri terimlerinin tümüne bağlı olarak hesaplanan bir dağılım ölçüsüdür. Ortalama mutlak sapma em simgesi ile gösterilir ve terimlerin ortalamadan olan mutlak sapmalarının aritmetik ortalaması olarak hesaplanır. Sık kullanılan bir değişkenlik ölçüsü değildir. Ortalama mutlak sapma basit serilerde ve sınıflanmış serilerde aşağıdaki ifadelerle hesaplanır. n
em =
!x
i
n k
em =
"x
i =1
!f
i
xi " x
i =1
k
!f
i
i =1
Örnek 1’de verilen basit seride ortalama mutlak sapma aşağıdaki gibi hesaplanır (Tablo 7) 41
Tablo 7. Ortalama mutlak sapmanın hesaplanması ( x =121.92). Denek no
xi
xi ! x
1 2 3 4 5 6 7 8 9 10 11 12 13 Toplam
127 118 125 120 119 125 123 120 128 119 120 120 121
5,08 3,92 3,08 1,92 2,92 3,08 1,08 1,92 6,08 2,92 1,92 1,92 0,92 36,76
n
!x
13
"x
i =1
em = em =
i
i
=
n
!x
" 121,92
i =1
13
36,76 = 2,83 13
3.2.4. VARYANS Seri terimlerinin ortalamadan sapmalarının karelerinin aritmetik ortalaması olarak hesaplanır. Cebirsel işlemlere uygunluğu nedeniyle tüm istatistik analizlerde, değişkenlik ölçüsü olarak varyans değeri kullanılır. Varyans, anayığında hesaplandıysa ! 2 , örneklemde ise s ve aşağıdaki ifadelerden biri ile hesaplanır. Basit serilerde, n
n
2
s =
" ( x ! x)
n
2
i =1
(n ! 1)
"x
i
i
veya s 2 =
2
!
(" xi ) 2 i =1
i =1
(n ! 1) 42
n
2
ile gösterilir
N
N
#2 =
N
! ( xi " µ )2
!x
i
i =1
veya
N
#2 =
2
"
(! xi ) 2 i =1
N
i =1
N
Sınıflanmış serilerde ise, k
k
" f ( x ! x) i
s2 =
i
k
2
i =1
(n ! 1)
"fx
i i
2
veya s =
2
!
(" fi xi ) 2 i =1
n
i =1
(n ! 1) k
k
k
! f (x " µ) i
#2 =
2
i =1
N
!fx
i i
i
#2 =
veya
2
"
(! fi xi ) 2
i =1
i =1
N
N
ifadeleri kullanılır. Varyansın özellikleri : 1. k ! R sabit sayısı için 2. k ! R sabit sayısı için
!
!
2
2
x+k
2 k "x
=! x
( )!
= k2
2 x
3. Tchebycheff teoremi : k ≥ 1 ve n sayıda gözlemden oluşan bir seride,
& %
gözlemlerin en az $1 '
1 # ! kadarı, ortalamadan k standart sapma uzaklıkta k2 "
yer alır. Örnek 1’de verilen basit seride varyansı aşağıdaki gibi hesaplayabiliriz (Tablo 8) ( x =121.92).
43
Tablo 8. Varyans değerinin hesaplanması Denek no
xi
1 2 3 4 5 6 7 8 9 10 11 12 13 Toplam
127 118 125 120 119 125 123 120 128 119 120 120 121 1585
5,08 -3,92 3,08 -1,92 -2,92 3,08 1,08 -1,92 6,08 -2,92 -1,92 -1,92 -0,92 0
130.92 13 – 1
= 10.91
n
s2 =
" (x
i
! x) 2
i =1
(n ! 1)
=
25,8064 15,3664 9,4864 3,6864 8,5264 9,4864 1,1664 3,6864 36,9664 8,5264 3,6864 3,6864 0,8464 130.9232
Varyansı farklı bir ifadeyle de hesaplayabiliriz (Tablo 9) Tablo 9. Denek no
xi
xi2
1 2 3 4 5 6 7 8 9 10 11 12 13 Toplam
127 118 125 120 119 125 123 120 128 119 120 120 121 1585
16129 13924 15625 14400 14161 15625 15129 14400 16384 14161 14400 14400 14641 193379
44
n
s2 =
n
(" xi ) 2
i =1
n
" xi2 !
i =1
=
( n ! 1)
193379 !
(1585)2 13
=
(13 ! 1)
130.92 13 – 1
= 10.91
Örnek 2’de verilen sınıflanmış seride varyansı aşağıdaki gibi hesaplarız (Tablo 10). Tablo 10. Varyans değerinin hesaplanması ( x = 49.47). Sınıflar (’den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam k
" f ( x ! x) i
s2 =
i
i =1
(n ! 1)
xi
fi
5 15 25 35 45 55 65 75 85 95
3 12 35 45 110 45 35 30 15 10 340
-44,47 -34,47 -24,47 -14,47 -4,47 5,53 15,53 25,53 35,53 45,53
5932,7427 14258,1708 20957,3315 9422,1405 2197,8990 1376,1405 8441,3315 19553,4270 18935,7135 20729,8090 121804,7060
2
=
121804.7060 = 359.31 (340 ! 1)
Varyansın farklı yolla hesaplanması (Tablo 11). Tablo 11. Sınıflar (’den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Toplam
xi
fi
f i xi
5 15 25 35 45 55 65 75 85 95
3 12 35 45 110 45 35 30 15 10 340
15 180 875 1575 4950 2475 2275 2250 1275 950 16820
45
fi
x
2 i
75 2700 21875 55125 222750 136125 147875 168750 108375 90250 953900
k
k
"fx
i i
s2 =
2
!
(" fi xi ) 2 i =1
n
i =1
(n ! 1)
=
953900 !
(16820)2
340 (340 ! 1)
=
121804.7060 (340 ! 1)
s = 359.31 2
Başlangıç noktası ve ölçek değişimi yöntemi ile varyansın hesaplanması.
xi ! x 0 dönüşümü ile d i serisi elde edilir. d i serisinin varyansı h 2 2 2 ise (Tablo 12), X serisinin varyansı, s x = h ! s d ifadesi ile hesaplanır. di =
s
2 d
Tablo 12. d i serisinin varyansı Sınıflar (’den az)
xi
0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100
5 15 25 35 45 55 65 75 85 95
di =
xi ! x 0 h -4 -3 -2 -1 0 1 2 3 4 5
Toplam
s
2 d
s
2 x
1286 ! =
(152)2 340
(340 ! 1)
= 3.5931
2
= h 2 ! s d = (10)2 ! (3.5931)=359.31 46
fi
fi di
2
fi d i
3 12 35 45 110 45 35 30 15 10
-12 -36 -70 -45 0 45 70 90 60 50
48 108 140 45 0 45 140 270 240 250
340
152
1286
3.2.5. STANDART SAPMA Varyans değerinin pozitif kareköküdür. En sık kullanılan değişkenlik ölçüsüdür ve örneklemde s , anayığında ! simgeleri ile gösterilir.
s = s2 , ! = ! 2 Örnek 1’de , s =
10,91 = 3.30,
Örnek 2’de , s=
359,31 = 18.96 olarak hesaplanır.
Bilimsel çalışmalarda standart sapma ve aritmetik ortalama aşağıdaki şekilde kullanılır.
x ± s (n ) Örnek 1 için ; 121.92± 3.30 (n=13).
3.2.6. DEĞİŞİM KATSAYISI (VARYASYON KATSAYISI) Standart sapma değerinin aritmetik ortalamaya göre yüzde büyüklüğünü ifade eder ve D.k. simgesi ile gösterilir. Değişim katsayısı aşağıdaki ifade ile hesaplanır.
D.k . =
s ! 100 x
Örnek 1. için, D.k . =
s 3.21 ! 100 = 3.30 ! 100 =2.71, 121.92 x
Örnek 2 için ise, D.k . =
s 18.96 ! 100 = ! 100 = 38.33 şeklinde 49.47 x
hesaplanır. 47
Bölüm 4
Olasılık ve Kuramsal Dağılımlar
İstatistik yöntemlerle ele aldığımız yığınlarda (topluluklarda), birimlerin (deneklerin) taşıdığı ve bir denekten diğerine farklılık gösterdiği özelliklerine, daha önce de gördüğümüz gibi, bu değişimlerden dolayı “değişken” adını veriyoruz. Bu değişkenlik, incelenen toplulukları oluşturan birimler arasında var olan biyolojik farklılıklardan kaynaklanabileceği gibi, ölçüm hatalarından da doğabilir. Rastlantısal olarak seçilmiş deneklerden oluşan bir çalışmadaki değişkene “rastlantısal değişken” adı verilir. Özelliklerin aldığı değerleri (yaş, kan basıncı ...) sıklık dağılımları ile göstermek mümkündür. Rastlantısal değişkene ilişkin değerleri özetleyen sıklık dağılımına “olasılık dağılımı” adı verilir. İstatistikte pek çok kuramsal olasılık dağılımı vardır. Bu bölümde, tıpta en sık karşılaşılan, Binom, Poisson ve Normal (Gaussian) dağılımları inceleyeceğiz. Bunlardan Binom ve Poisson dağılımları kesikli (discrete), Normal dağılım ise süreklidir. Binom ve Poisson dağılımlarında X rastlantısal değişkeni sadece tam sayı değerlerini (0,1,2,3,4,..), normal dağılımda ise, tanım aralığında her değeri alır. Kuramsal dağılımlar konusuna geçmeden önce olasılık kavramını ve temel olasılık kurallarını açıklayalım.
49
4.1.
OLASILIK
İstatistik, sadece verileri uygun ve standart ölçülerle betimlemekle kalmaz, aynı zamanda, bilinen verilere dayanarak, bir anayığının bilinmeyen karakteristiklerine (parametrelerine) ilişkin yargılarda da bulunmaya olanak sağlar (bir anayığından alınmış örnekten elde edilen ortalama ya da varyans gibi istatistiklerin, adı geçen anayığındaki aynı karakteristikleri kestirmek için kullanılabilmesi gibi). Nitekim, istatistiğin çağdaş bilimsel araştırmadaki yeri tanımlanırken, istatistik yöntemlerinin sonuç işlevinin de, tümevarımla yeni bilgi üretmek olduğu vurgulanmıştır. İşte bu çıkarımsal sıçrama, diğer bir deyişle, betimleyici istatistikten tümevarım istatistiğine geçiş, olasılık hesabına dayanarak gerçekleştirilebilmektedir. Bir belirsizlik öğesi içeren her durumda söz konusu olabilecek “olasılık” kavramı, değişik yaklaşımlarla çeşitli biçimlerde tanımlanabilmektedir. Bu yaklaşımlardan başlıcaları “öznelcilik” (sübjektivizm) ve “nesnelcilik” (objektivizm) dir. Nesnelci yaklaşıma göre, olasılık, incelenen bir olayın göreli sıklığı ya da tüm olanaklı durumlar içinde belirme oranından hareketle tanımlanırken, öznelciliğe göre olasılık, bir “inanç derecesi”’ ni ifade eder, diğer bir deyişle, bir olayın gerçekleşeceğine olan kişisel inanç düzeyidir. Bir olayın aynı koşullar altında, değişik şekillerde ortaya çıkması sırasında kaydedilen “başarı” durumları sayısının olanaklı durumlar sayısına bölünmesiyle elde edilen değere, o başarılı durum veya durumların olasılık değeri adı verilir . Olasılık, “deney öncesi” ve “deney sonrası” olmak üzere iki ayrı yaklaşımla incelenebilir.
4.1.1. DENEY ÖNCESİ OLASILIK Eğer istenilen durumları “başarı” olarak nitelendirirsek, “başarı” olarak kabul edilen olayın olasılığını aşağıdaki ifade ile hesaplarız. “başarı” sayısı p = olanaklı durumlar sayısı Burada p simgesi “başarı” durumunun olasılık değerini göstermektedir. 50
Bir yazı - tura oyununda yazı gelmesi sonucunu “başarı” sayarsak, istenilen durum sayısı 1, olanaklı durumlar sayısı ise 2 olur. Dolayısıyla, burada yazı gelme olasılığı, 1 p = = 0.50 değerine eşit olur. 2
4.1.2. DENEYSEL OLASILIK Bu yaklaşımda, bir olayın olasılığı, o olayın gözlemlenen sıklığından yola çıkılarak yapılan bir genellemeyle elde edilir. (n) sayıdaki bağımsız deneme sonucunda, “olumlu” sayılan, ya da “başarı” olarak tanımlanan durumların sayısı ( r ) ise, (r / n ) oranı incelenen olayın göreli sıklığını gösterir. Deneme sayısının sonsuza doğru büyümesi halinde de, olayın göreli sıklığı, olayın olasılığına dönüşür. n →∞ ise , ( r / n ) → p Yazı-tura denemesini sırasıyla n = 1, 2, 5, 10, 50, 100, 500, 1000 deneme sayısı için gerçekleştirdiğimizi düşünelim. Burada “başarı” olarak yazı gelmesini kabul edersek, her deneme sayısına karşılık gelen yazı gelme oranı (“başarı” oranı) ( r / n ) ifadesi ile hesaplanır. n deneme sayısına karşılık gelen ( r / n ) başarı oranlarını Tablo 1'de görebiliriz. Tablo 1. n denemede ‘yazı’gelme oranı. Deneme Sayısı (n) 1 2 5 10 50 100 500 1000
Başarı Sayısı (r) 1 1 2 6 24 52 245 505
51
Başarı Oranı (r/n) 1.000 0.500 0.400 0.600 0.480 0.520 0.490 0.505
Yazı - tura deneyinde yazı gelmesi olayının gerçek olasılığı p = 0.50 'dir. Tablo 1'den de görüldüğü gibi ( r / n ) oranının 0.50 'ye yaklaşması için deneme sayısı n' in yeterince büyük olması gerekir. (r / n) ve p arasındaki ilişkiyi Şekil 1'de görebiliriz.
Şekil 1. ( r / n ) ve p arasındaki ilişki (n → ∞ ise , ( r / n ) → p 'dir)
4.1.3. OLASILIĞIN ÖZELLİKLERİ Olasılık değeri daima pozitiftir ve 0 ile 1 arasında değerler alır. (0≤p≤1) Eğer “başarı” olarak kabul edilen olay her denemede ortaya çıkıyorsa olayın olasılığı 1'e, denemelerin hiç birinde ortaya çıkmıyorsa 0'a eşittir. Bir olayın gerçekleşme olasılığı (p) ile gerçekleşmeme olasılığının (q) toplamı 1’e eşittir. r p = , n
n-r q = olduğuna göre, p + q = 1 olur. n 52
Yukarıda yazı-tura örneğinde “başarı” ya da beklenen olay, alt olaylara ayrılması olanaklı olmayan, yalın bir olaydır. Oysa, pek çok durumda, gerçekleşmesi beklenen olay, birden çok yalın olaydan oluşur. Örneğin, bir öğrencinin Biyoistatistik sınavından “pekiyi” ya da “iyi” alması, bir oyunda atılan iki zarda 5 ve 6 çıkması, öğrencimizin Biyoistatistik ve Biyofizik derslerinden pekiyi alması gibi. Bu örneklerde olduğu gibi, birden çok yalın olaydan oluşmuş birleşik olayların gerçekleşme olasılığına birleşik olasılık denir.
4.1.4. BİRLEŞİK OLAYLARDA OLASILIK KURALLAR 4.1.4.1 BAĞDAŞMAYAN OLAYLAR (ÖZEL TOPLAMA KURALI) Bu kural, bağdaşmayan yani birlikte gerçekleşmesi olanaksız olaylar için geçerlidir. Bağdaşmayan iki olayı (A) ve (B) ile gösterirsek A veya B'nin gerçekleşmesi olasılığı, A' nın olasılığı ile B'nin olasılığının toplamına eşittir. P ( A veya B ) = P(A) + P(B) Aynı kuralı ikiden fazla ayrık olay (birbirleriyle kesişmeyen) için de uygulayabiliriz. Örneğin (A), (B), ve (C), ayrık 3 olay ise A veya B veya C' nin gerçekleşmesi olasılığı P ( A veya B veya C ) = P(A) + P(B) + P(C) ifadesi ile hesaplanır. Konunun daha iyi anlaşılabilmesi için yazı - tura, 52'lik desteden kağıt çekilmesi ve zar örneklerini tıbbi örneklerle birlikte vereceğiz. Örnek 1. Zar bir kez atılırsa 1'li veya 2'li yüzün ortaya çıkması olasılığı kaça eşittir? Çözüm : 1 1 1 P ( “1” veya “2” ) = + = 6 6 3 53
Örnek 2. İki zar birlikte atıldığında zarların üst yüzlerinin toplamının “7” veya “12” çıkma olasılığı kaça eşittir? Çözüm : 6 1 7 P ( “7” veya “12” ) = + = 36 36 36 Örnek 3. Bir toplumda kan gruplarının görülme sıklığı (olasılığı) Tablo 2'de verilmektedir. Tablo 2. Toplumda kan gruplarının dağılımı. Kan Grubu A B O AB Toplam
Kadın
Olasılıklar Erkek
Toplam
0.225 0.060 0.200 0.015 0.500
0.225 0.060 0.200 0.015 0.500
0.450 0.120 0.400 0.030 1.000
Bu toplumdan rastgele seçilen bir kişinin kan grubunun (A) veya (B) olması olasılığı kaça eşittir? Çözüm : Belli bir kişide A ve B kan gruplarının birlikte varolması olanaklı değildir. Yani A ve B ayrık iki olaydır. A veya B'nin gerçekleşme olasılığını hesaplamak için özel toplama kuralını uygulayabiliriz. P ( A kan g. veya B kan g. ) = P(A kan g.) + P(B kan g.) = 0.450 + 0.120 = 0.570 4.1.4.2. BAĞDAŞAN OLAYLAR (GENEL TOPLAMA KURALI) Bu kural bağdaşabilen, yani birlikte gerçekleşmesine olanak bulunan olaylar için geçerlidir. A ve B bağdaşabilen iki olay ise, A veya B 'nin gerçekleşme olasılığı 54
P ( A veya B ) = P(A) + P(B) – P ( A ve B ) ifadesi ile hesaplanır. Burada, P ( A ve B ) iki olayın birlikte gerçekleşme olasılığıdır. Aynı kuralı 2'den fazla bağdaşan olay için uygularsak, A veya B veya C' nin gerçekleşmesi olasılığını, P( A veya B veya C) = P(A) + P(B) + P(C) – P(A ve B) – P(A ve C) – P( B ve C) + P(A ve B ve C) ifadesi ile hesaplarız. Örnek 4. 52'lik bir desteden rastgele seçilen bir kağıdın siyah renkli veya 2'li bir kağıt olma olasılığı kaça eşittir? Çözüm : Simgesel olarak A ile siyah renkli kağıdı ve B ile 2'li kağıdı temsil ettiğimizi düşünelim. A ve B olayları bağdaşan olaylar olduğundan, A veya B olayının gerçekleşmesi olasılığını genel toplama kuralı ile hesaplayabiliriz. P ( A veya B ) = P(A) + P(B) – P ( A ve B ) = (26/52) + (4/52) – (2/52) = (28/52) = 0.5385 Örnek 5. Tablo 2'de toplumda kan gruplarının dağılımı verilmişti. Bu toplumdan rastgele seçilen bir kişinin cinsiyetinin erkek veya kan grubunun A olması olasılığı kaça eşittir? Çözüm : Bir kişi aynı anda cinsiyet bakımından erkek, kan grubu bakımından da (A) olabilir. Bu nedenle bu iki olay bağdaşmaktadır (yani bunlar ayrık iki olay değildir ). Bu toplumdan rastgele seçilen bir kişinin erkek veya A kan grubuna sahip bir kişi olma olasılığı P(erkek veya A kan g.) = P(erkek) + P(A kan g.) –P(erkek ve A kan g.) = 0.50 + 0.45 – 0.225 = 0.725 değerine eşit olur.
55
4.1.4.3. BAĞIMSIZ OLAYLAR (ÖZEL ÇARPMA KURALI) Bu kural birbirinden bağımsız olaylar için geçerlidir. İki olaydan birinin gerçekleşmesi veya gerçekleşmemesi ikinci olayın olasılığını etkilemiyorsa olayların bağımsız olduğundan söz edilir. A ve B'nin birlikte gerçekleşmesi olasılığı aşağıdaki ifade ile hesaplanır. P ( A ve B ) = P(A) · P(B) 2' den fazla bağımsız olay için olasılığı aşağıdaki ifade ile hesaplarız. P(A ve B ve C ve ...) = P(A) · P(B) · P(C) · ... Örnek 6. Bir para iki kez fırlatılmaktadır. Paranın iki atışta da yazı gelme olasılığı kaça eşittir ? P(1.yazı ve 2.yazı) = P(1.yazı) · P(2.yazı) = (1/2) · (1/2) = 1/4 = 0.25 Örnek 7. Toplumda kan gruplarının dağılımına ilişkin verilen bilgiden (Tablo 2.) yararlanarak, toplumdan rastgele seçilen bir kişinin cinsiyetinin kadın ve kan grubunun A olması olasılığı kaça eşittir? Çözüm : Cinsiyet ve kan grubu değişkenleri bağımsızdır. Yani, rastgele seçilen bir kişinin cinsiyetinin kadın olması ile kan grubunun A olması arasında bir ilişki yoktur. Kişinin cinsiyetinin kadın olması olayının olasılığı A kan grubu olayının olasılığını ( olumlu ya da olumsuz ) etkilememektedir. Rastgele seçilen bir kişinin kadın ve A kan grubuna sahip bir kişi olması olasılığı, P(kadın ve A kan g.) = P(kadın) · P(A kan g.) = 0.50 · 0.45 = 0.225 değerine eşit olur. 4.1.4.4. BAĞIMLI OLAYLAR (GENEL ÇARPMA KURALI) Genel çarpma kuralı bağımlı olaylarda uygulanır. A ve B olaylarının birlikte gerçekleşme olasılığını aşağıdaki ifadelerden biri ile hesaplarız. 56
P ( A ve B ) = P(A) · PA (B) veya P ( A ve B ) = P(B) · PB(A) Burada PA (B) simgesi, A olayı olduktan sonra B olayının gerçekleşme olasılığını gösterir. Literatürde PA (B) simgesi yerine P(B|A) simgesi de kullanılmaktadır. Örnek 8. 52'lik bir desteden iadesiz olarak arka arkaya iki kağıt çekiliyor. Her iki kağıdın da birli olma olasılığı kaçtır? Çözüm: A olayı olarak rastgele seçilen birinci kağıdın 1'li olmasını, B olayı olarak da, yine rastgele seçilen 2'inci kağıdın birli olmasını kabul edelim. Kağıt seçimi iadesiz olduğundan A olayının olması ya da olmaması B olayının gerçekleşme olasılığını etkilemektedir. A ve B olayları bağımlı olaylardır. A ve B olaylarının birlikte geçekleşme olasılığı P ( A ve B ) = P(A) · PA (B) = (4/52) · (3/51) = 0.0045 değerine eşit olur. Örnek 9. Aşağıdaki tabloda (Tablo 3) 1000 kişilik bir örneklem grubunda bireylerin sigara içip-içmeme ile cinsiyete göre dağılımları verilmektedir. Tablo 3. Bin kişide cinsiyet ve sigara dağılımı. Cinsiyet Kadın Erkek Toplam
Sigara içen 100 350 450
Sigara içmeyen 400 150 550
Toplam 500 500 1000
Bu gruptan rastgele seçilen bir kişinin sigara içen ve cinsiyetinin erkek olması olasılığı kaça eşittir? Çözüm: Cinsiyet ile sigara içme değişkenleri Tablo 3'den de görüldüğü gibi bağımlı değişkenlerdir. Kişinin cinsiyeti sigara içme olayını etkilemektedir. 57
Simgesel olarak erkek cinsiyeti E ile, sigara içmeyi de S+ ile gösterirsek, bu gruptan rastgele seçilen bir kişinin (E) ve (S+) bir kişi olma olasılığı aşağıdaki ifadeyle hesaplanır. P ( E ve S+ ) = P(E) · PE (S+) = (500/1000) · (350/500) = 0.35 Örnek 10. Bir zar iki kez atıldığında en fazla 1 kez 5'li çıkma olasılığı kaça eşittir? Çözüm : İki atış birbirinden bağımsızdır. 5'li çıkma olayını “başarı” sayarsak, iki ayrı atışta 5'li ya hiç gelmeyebilir ( burada başarı sayısı r = 0 ), ya bir kez (r = 1 ), ya da 2 kez ( r = 2 ) gelebilir. Soruda “en fazla bir kez 5'li çıkma” olasılığı sorulduğuna göre, başarı sayısı r' nin 0 veya 1 olması gerekmektedir. P(en fazla 1 kez 5'li) olasılığı ile, P ((r=0) veya (r=1)) olasılığı birbirine eşittir. P(r=0) = P(0 kez 5'li) ve P(r=1) = P(1 kez 5'li) olasılıklarını aşağıdaki şemadan hesaplayabiliriz.
P(r=0) = P((1.atışta 5'li değil) ve (2.atışta 5'li değil)) = (5/6) · (5/6) = 25/36 P(r=1) = P((1.atışta 5'li ve 2.atışta 5'li değil) veya (1.atışta 5'li değil ve 2.atışta 5'li)) 58
P(r=1) = (1/6) · (5/6) + (5/6) · (1/6) = 10/36 P((r=0) veya (r=1)) = P(r=0) + P(r=1) = (25/36) + (10/36) = 35 / 36 = 0.9722 Soruda zar 2 kez ( bağımsız deneme sayısı ) atılmaktadır. Eğer, n kez bağımsız deneme yapılsaydı ve bu n denemede x kez başarı elde etme olasılığını arasaydık, yukarıdaki örnekte olduğu gibi ağaç diyagramı çizip, diyagram üzerinden olasılığı hesaplamamız gerekirdi. Aynı sorunun yanıtını, biraz ileride göreceğimiz gibi, kuramsal bölünmelere ilişkin ifadeleri kullanarak da hesaplamak olanaklıdır.
4.1.5. ÖZEL BİR UYGULAMA ALANI (TANI TESTLERİNİN DEĞERLENDİRİLMESİ) Bir hastalığa tutulduğundan kuşku duyulan bir kişiye, belli bir tanı testi uygulandığında, ortaya çıkacak sonuçları dört ayrı grupta ele almak olanaklıdır. Gerçekten de, aşağıdaki tablodan izleneceği gibi, uygulanan tanı testinin olası iki doğru, iki de yanlış sonucu olabilir. Tablo 4. Kişinin gerçek durumuna göre test sonuçları. Test Uygulanan Kişinin Gerçek Durumu Önerilen Yeni Tanı Testi Sonucu
Hasta (+)
Hasta Değil (–)
Pozitif (+)
Doğru Sonuç (Doğru Pozitif)
Yanlış Sonuç (Yanlış Pozitif)
Negatif (–)
Yanlış Sonuç (Yanlış Negatif)
Doğru Sonuç (Doğru Negatif)
Dolayısıyla, bir tanı testinin geçerliliği iki ayrı açıdan değerlendirilebilir. Bunlardan ilki, testin duyarlılığıdır. Duyarlılık, uygulanan tanı testinin doğru pozitif verme olasılığını, diğer bir deyişle, testin uygulandığı toplulukta, “doğru pozitif” sonuçların, gerçekten hasta olan kişilere oranını verir. Bir tanı testinin duyarlılığı yüksekse, buna bağlı olarak, yanlış negatif sonuç verme olasılığı 59
düşük olur. Örneğin, belli bir tanı testinin duyarlılığı % 88 ise, söz konusu test, gerçekten hasta olan (100) kişiden (88)' ine doğru tanı, yani “hasta” tanısı koyuyor demektir. Tanı testlerinin geçerliliğine ilişkin ikinci özellik, seçiciliktir. Seçicilik, kullanılan testin, sağlam kişilerin yüzde kaçına doğru tanı koyduğunu ifade eder. Örneğin, seçiciliği % 95 olan bir test, (100) sağlıklı insanın 95' ine “doğru negatif” tanısı, “sağlıklı” tanısı koyuyor demektir. Örnek 11 : Kesin akciğer tüberkülozu olduğu bilinen 50 kişiyi de kapsayan (1550) kişilik bir toplulukta akciğer filmleri çekilmiş ve filmler incelenen topluluğu tanımayan uzmanlarca değerlendirilmiştir. Değerlendirme sonuçları Tablo 5’te verilmektedir. Akciğer tüberkülozu tanısı koymak üzere kullanılan röntgen filmlerinin duyarlılık ve seçiciliğini hesaplayınız. Tablo 5. Akciğer filmi değerlendirmesinde sonuçlar Değerlendirme Sonucu Hasta Sağlam Toplam
Gerçek Durum Hasta 36 14 50
Gerçek Durum Sağlam 44 1456 1500
Toplam 80 1470 1550
İncelenen testin duyarlılığı, 36 P( test+ | hasta ) = = % 72 50 testin seçiciliği, 1456 P( test – | sağlam ) = = % 97.1 1500 olarak hesaplanır. Bir tanı testinin pozitif prediktif değeri, test sonucunun pozitif çıktığı kişilerin yüzde kaçının gerçekten hasta olduğunu gösterir. (doğru pozitifler) P.D+ = x 100 tüm pozitifler 60
Aynı şekilde, bir testin negatif prediktif değeri de, negatif sonuçların yüzde kaçının gerçekten sağlam kişilere ait olduğunu ifade eder. (doğru negatifler) P.D- = x 100 tüm negatifler
4.1.5.1. BAYES TEOREMİ Bir koşullu olasılık olarak, pozitif sonuç veren bir tanı testinin prediktif değeri bayes formülüyle hesaplanabilir. P(test+ | hasta) · P(hasta)
P(hasta | test+) = P(test+ | hasta) · P(hasta) + P(test+ | sağlam) · P(sağlam)
Yukarıdaki formülü “duyarlılık” ve “seçicilik” terimleriyle yazarsak : duyarlılık · prevalans
P(hasta | test+) = duyarlılık · prevalans + (1 - seçicilik) · (1-prevalans)
Bir hastalığın toplum içindeki yaygınlığı, ya da göreliği sıklığı olan prevalans değeri, hastalığın olasılığı olarak ifade edilir. Tablo 5' deki örnekte, akciğer tüberkülozu prevalans değerinin 0.01 olduğu varsayılırsa, (0.72) · (0.01) P(hasta | test+) = = 0.20 (0.72) · (0.01) + (0.029) · (0.99) Dolayısıyla, pozitif sonuç veren akciğer filmlerinin % 20' sinin gerçek hastalara ait olduğu söylenebilir. Aynı biçimde, negatif sonuç vermiş bir tanı testinin prediktif değerini hesaplamak için de, seçicilik · (1 - prevalans)
P(sağlam | test-) = seçicilik · (1 – prevalans)+ (1 – duyarlılık) · prevalans
formülü kullanılır. 61
4.2.KURAMSAL DAĞILIMLAR Yukarıda gördüğümüz olasılıkla ilgili basit kurallar ve gereğinde ağaç diyagramlarıyla, (n) bağımsız denemede (x) kez “başarı” elde etme olasılıkları hesaplanabilmekle birlikte, deneme sayısının büyümesiyle bu yaklaşımlar yetersiz kalmaya başlar. Bu durumlarda, tüm olanaklı sonuçların olasılığını hesaplamak için kuramsal olasılık dağılımları kullanılır. 4.2.1. BİNOM DAĞILIMI Bir değişkenin A ve B simgeleri ile gösterilen sadece iki değeri alabildiğini varsayalım (evet / hayır; pozitif / negatif; sağ / ölü; kadın /erkek gibi...). (A)'nın olasılığını p (ya da π), (A)'nın gerçekleşmediği (B) durumunun olasılığını da (1-p) (ya da 1-π) olarak gösterelim. Böyle bir durumda, (A) ya da (B)'nin ortaya çıkabileceği deneme, birbirinden bağımsız olarak (yani, (p) ve (q) her bir denemede sabit) tekrarlanırsa, (A)'nın bağımsız (n) denemede (x) kez gerçekleşme olasılığı Binom dağılımıyla hesaplanır. Binom dağılımının temel kuralları 17. yüzyılda yaşamış İsviçre'li matematikçi Jacob Bernouilli tarafından konmuştur. Bernouilli'nin 1713'de yayınlanan kitabı, genel olarak, olasılık konusundaki ilk yapıt sayılır. Günümüzde de, Binom dağılımına uyan her denemeye “Bernouilli denemesi” ve bu türden denemelerden oluşan süreçlere de Bernouilli süreci adı verilmektedir. Yukarıda belirtilen koşullarda, n bağımsız denemede tam x kez başarı elde etme olasılığını, binom dağılımının aşağıda verilen ifadesiyle hesaplarız. n! P(x) = px.qn-x x! (n-x)! Burada, n : birbirinden bağımsız deneme sayısı, x : “başarı” sayısı, p : “başarı” sayılan (A olayının) sonucun tek bir denemede gerçekleşme olasılığı, q : “başarı” sonucunun tek bir denemede gerçekleşmeme olasılığını göstermektedir. 62
“Başarı” sayıları 0 ile n arasındaki tam sayılardır. Binom dağılımının ortalaması µ = (n · p)'ye varyansı σ2 = (n · p · q)' ya eşittir. Olasılığın daima 0 ile 1 arasında olduğunu ve n
( p + q ) n =1= ! x =0
n! p x # q n" x x!#(n " x)!
özelliğinin
gerçeklendiğini
de
hatırlayalım. Örnek 12. Bir paranın 5 kez fırlatıldığını varsayalım. Bu 5 denemede tam 4 kez yazı çıkma olasılığı kaça eşittir? Çözüm: Bu örnekte “yazı gelmesi” “başarı” sayıldığına ve deneme sayısı 5 olduğuna göre, başarı sayısı (x) = 4, başarı sonucunun bir denemede ortaya çıkması olasılığı (p) = 0.5 ve başarı sonucunun bir denemede ortaya çıkmaması olasılığı da (q) = 0.5'dir. Tam 4 kez yazı çıkma olasılığı aşağıdaki şekilde hesaplanır. n! P(x) = px.qn-x x! (n-x)! 5! P(4) = (1/2)4(1/2) 5- 4; (5!=120 , 4!=24 , 0! = 1) 4! (5-4)! 120 P(4) = (1/16)(1/2) (24)(1) P(4) = (5/32) P(4) = 0.15625 Örnek 13. Eğer 5 yazı - tura denemesinde en az 3 yazı çıkma olasılığını hesaplamak istersek, başarı sayısı sırasıyla 3, 4 ve 5 olacaktır.
63
P(en az 3 yazı) = P(3) + P(4) + P(5) 5! 5! 5! = (1/2)3(1/2)2 + (1/2)4(1/2)1 + (1/2)5(1/2)0 3! 2! 4! 1! 5! 0! = (10/32) + (5/32) + (1/32) = (16/32) = 0.5 Örnek 14. Belli bir kanser türünde bir hastanın tedaviden sonra 10 yıl yaşama olasılığının 0.63 olduğunu varsayalım. Söz konusu kanser türüne yakalanan 12 hastanın tümünün de tedaviden sonra 10 yıl yaşama olasılığı kaça eşittir? Çözüm : Birbirinden bağımsız deneme sayısını 12, “başarı” olarak da bir hastanın tedaviden sonra 10 yıl yaşamasını kabul edersek, başarı sayısı 12, başarının bir denemede ortaya çıkma olasılığı 0.63 ve başarının bir denemede ortaya çıkmama olasılığı ise 0.37 (q = 1-0.63)'dir. 12! P(12) = (0.63)12(0.37)0 12! (12-12)! = 0.0039 n = 12 ve p = 0.63 olduğunda sırasıyla x = 0,1,2...12 başarı sayıları için olasılıklar Tablo 6'da verilmiştir. Yine bu olasılıklara ilişkin grafik Şekil 2'de izlenebilir. Binom dağılımında, ortalama = (n · p)' idi. Örneğimizde ortalama (12)· (0.63) = 7.56'dir. Yani, 12 hastanın ortalama olarak 7.56' sının tedaviden sonra 10 yıl yaşaması beklenir. Standart sapma ise, σ=
(n ! p ! q )= (12)! (0.63)! (0.37 )
σ = 1.6725 değerine eşittir.
64
Tablo 6. n=12, p=0.63 parametreli Binom dağılımı için olasılıklar. X 0 1 2 3 4 5 6 7 8 9 10 11 12
n! x! (n-x)! 1 12 66 220 495 792 924 792 495 220 66 12 1
px
qn-x
P(x)
1.00000 0.63000 0.39690 0.25005 0.15753 0.09924 0.06252 0.03939 0.02482 0.01563 0.00985 0.00621 0.00391
0.00001 0.00002 0.00005 0.00013 0.00035 0.00095 0.00257 0.00693 0.01874 0.05065 0.13690 0.37000 1.00000
0.00001 0.00013 0.00126 0.00715 0.02739 0.07462 0.14823 0.21633 0.23022 0.17422 0.08899 0.02755 0.00391
Yığışımlı P(x) 0.00001 0.00014 0.00140 0.00855 0.03594 0.11056 0.25878 0.47511 0.70533 0.87955 0.96854 0.99609 1.00000
Şekil 2. n=12, p=0.63 parametreli Binom dağılımı Örnek 15. Bir laboratuvarda üretilen aşıların % 15'inin içerdiği etkili maddenin standardın altında kaldığını varsayarsak, bu laboratuvarda üretilen aşılardan rastgele seçilen 8 aşı arasından en az bir tanesinin standardın altında kalma olasılığı kaça eşittir? Çözüm : “Başarı” olarak, rastgele seçilen bir aşının standardın altında kalmasını kabul edersek, problemimizde başarı sayısı 1 veya 2 veya 3 ...veya 8 65
olacaktır. Buna göre 8 aşıdan en az bir tanesinin standardın altında kalma olasılığı P(x=1 veya x=2 veya ... x=8) = P(1) + P(2) + ... + P(8) olur. P(0) + P(1) + P(2) + ... + P(8) = 1 eşitliğini kullanırsak, P(x≥1) = 1 - P(0) 8! = 1 - (0.15)0 (0.85)8-0 0! (8-0)! = 1 - 0.2724 = 0.7276 Örnek 16. Belli bir hastalığa tutulmuş bir kişinin 3 ayrı uzman tarafından incelendiğini ve uzmanlardan herbirinin hastalığa doğru tanı koyma olasılığının %90 olduğunu varsayalım. 3 ayrı incelemede 3 doğru tanıya ulaşma olasılığı kaça eşittir? Çözüm : 3! P(x=3) = (0.90)3 (0.10)3-3 3! (3-3)! = 0.729
4.2.2. POISSON DAĞILIMI Eğer, birbirinden bağımsız deneme sayısı (n) yeteri kadar büyük ve olayın “başarı” olarak kabul edilen sonucunun bir denemede ortaya çıkması olasılığı (p) 0.05'den küçük değerler alıyorsa ( yani, n → ∞ ve p → 0 veya n → ∞ ve q → 0), bu durumda Binom dağılımı Poisson dağılımına dönüşür. Poisson dağılımına, incelenen olayın olasılığının küçüklüğünden dolayı nadir olaylar dağılımı da denir.
66
(n) denemede (x) sayıda “başarı” elde etme olasılığı Poisson dağılımının genel ifadesi olan
P( x) = e ! µ
µx formülü ile hesaplanır. x!
Burada; e : sabit bir sayı ( e= 2.718 ), µ : np ( dağılımın ortalaması, x), p : "başarı" sonucun bir denemede gerçekleşme olasılığı, x : aranan başarı sayısıdır ( x = 0 veya 1 veya 2 ... veya n ). Poisson dağılımında ortalama ve varyans n · p'ye eşittir. µ = σ2 = n · p Bazı x ve µ değerleri için poisson olasılıkları Tablo II’de verilmektedir. Örnek 17. Bir toplumda her 8000 kişiden birinin belli bir kalıtsal hastalık taşıdığını varsayalım. 30000 nüfuslu bir yerleşim yerinde yapılacak taramada bu hastalık belirtisini taşıyan en fazla 1 kişiye rastlama olasılığı kaça eşittir? Çözüm : n = 30000, p = 1/8000 ve x = 0 veya 1'dir. Buna göre, µ =n·p = 30000 (1/8000) = 3.75 ve P(en fazla bir kişide kalıtsal hastalık) = P(x=0 veya x=1) = P(x=0) + P(x=1). (3.75)0 (3.75)1 P(x<=1) = e-3.75 + e-3.75 0! 1! = 0.0235 + 0.0882 = 0.1117 Örnek 18. Bir yol kavşağında bir haftada meydana gelen ortalama kaza sayısı 3'tür. Belli bir hafta içinde söz konusu kavşakta tam 5 kaza olma olasılığını hesaplayınız.
67
Çözüm : Bir hafta içinde söz konusu kavşaktan çok sayıda aracın geçtiğini ve bir aracın kaza yapma olasılığının oldukça küçük olduğunu ( p< 0.05) kabul edebiliriz. "Başarı" olarak bir aracın kaza yapmasını kabul edersek başarı sayısı 5 olur. 35 -3 P(x=5) = e 5! = 0.1008 Örnek 19. Her yıl ortalama olarak 2000 maden işçisi arasından 2 kişi kaza sonucu hayatını kaybederse, 800 maden işçisinin çalıştığı bir maden ocağında, bir yıl içinde kaza sonucu ölüm olmaması olasılığını bulunuz. Çözüm : Bir maden işçisinin bir yıl içinde kaza sonucu hayatını kaybetmesi olasılığı p= 2 / 2000 , 800 kişilik maden ocağında ortalama değer ( x ), m = n.p = 800x(2/2000) = 0.8 , (0.8)0 -0.8 P(x=0) = e 0! = 0.4493 Örnek 20. Çok sulandırılmış bir eriyiğin mikroskop altında incelenmesinde, 50 sayım karesinde gözlenen hücre sayısının dağılımı aşağıdaki gibi bulunmuştur. Hücre sayısı (xi) Kare sayısı (fi) 0 17 1 21 2 8 3 3 4 1 50 68
Poisson dağılımını kullanarak sıklıkları hesaplarsak, karelerin kaç tanesinde hücre sayısının en az iki olması beklenir? Çözüm : Herhangi bir karede bir hücre gözlenmesini “başarı” sayarsak, başarı sayıları sırasıyla x=2,3,4,5,...,50 olur. Verilen sıklık dağılımında önce aritmetik ortalama hesaplanır. ∑ fi(xi) 50 m = np = = = 1 ∑ fi 50 Burada, n birbirinden bağımsız deneme sayısı (kare sayısı) ve p başarı sonucun bir denemede ortaya çıkma olasığıdır (n=50, p=1/50). P(x>=2) = P(x=2) + P(x=3) + ... + P(x=50) = 1 – [ P(x=0) + P(x=1) ] 10 11 -1 = 1 – [ e + e ] 0! 1! = 1 – 2e-1 = 0.2642 -1
Bir karede 2 veya daha çok hücre gözlenme olasılığı 0.2642 ise, 50 karede bu özelliğin gerçeklendiği ( bir karede 2 veya daha fazla hücre olması) kare sayısının 50 x 0.2642 = 13.21 ~ 13 olması beklenir. Örnek 21. Belirli bir ilacın, yan etki yaratma olasılığının 0.002 olduğu ileri sürülmektedir. Bu ilacın 1000 kişide denenmesi halinde, sırasıyla, a) tam iki kişide, b) en fazla iki kişide ve c) ikiden fazla kişide yan etki görülme olasılığını hesaplayınız. Çözüm : Bu verilere göre, 1000 kişi içinde ortalama olarak m = np = 1000·(2/1000) = 2 kişide yan etki görülmesi beklenir. 69
22 a) P(x=2) = e = 0.27066 2! -2
b) P(x ≤ 2) = P(x=0) + P(x=1) + P(x=2) 20 21 22 -2 -2 = e + e + e 0! 1! 2! -2
= 0.13533 + 0.27066 + 0.27066 = 0.67665 c) P(x>2) = P(x=3) + P(x=4) + ... + P(x=1000) = 1 – ( P(x=0) + P(x=1) + P(x=2) ) = 1 - 0.67665 = 0.32335
4.2.3. NORMAL DAĞILIM Yukarıda, (p)’nin çok küçük ve (n) sonsuza doğru büyüdüğünde, binom dağılımının poisson dağılımına dönüştüğüne değinmiştik. (p) ve (q) değerlerinin birbirine yakın olduğu durumlardaysa, binomun normal dağılım, ya da Laplace - Gauss Dağılımı’na dönüştüğü gösterilebilir. İstatistik kuramında merkezi bir önem taşıyan ve çok sayıda uygulama alanı bulunan bu dağılımı, ilk kez Abraham Demoivre bulmuş ve 1733’ de yaptığı yayında tanımlamış olmakla birlikte, normal dağılımın bilimsel özellikleri ve ilkeleri her ikisi de matematikçi ve astronom olan Fransız Pierre Simon Laplace ve Alman Carl Friedrich Gauss tarafından konmuştur. Bir çok istatistikçi, “normal” sözcüğünün yol açabileceği yanlış anlamalardan kaçınmak için, “Normal Dağılım” ifadesi yerine “Laplace - Gauss Dağılımı” ifadesini tercih etmiştir. Bizim burada “Normal Dağılım” ifadesini kullanmamızın nedeni, bu ifadenin tıp literatüründe yaygın biçimde yerleşmiş olmasıdır.
70
Belli bir fizik ölçümü (ısı, uzaklık, vs.) sabit koşullarda ve sistematik hata yapılmaksızın çok kez yinelendiğinde, yapılan ölçüm hatalarının da normal dağılıma yaklaştığı bilinmektedir. Nitekim, normal eğriye bazen “hatalar eğrisi” adı da verilmektedir. Aşağıda çeşitli örneklerini göreceğimiz gibi, aynı cinsten yapıdaki topluluklarda, biyolojik değişkenlerin belli bir bölümü (boy, kan parametreleri, bazı fizyolojik parametreler, v.s. ) normal dağılıma uygunluk gösterir. 4.2.3.1 NORMAL DAĞILIMIN ÖZELLİKLERİ a) İncelenen rastlantısal değişken tanım aralığında tüm değerleri alabilir, diğer bir deyişle, normal dağılım süreklidir. b) Normal dağılımın olasılık yoğunluk fonksiyonu aşağıdaki gibi gösterilir.
Y = f ( x) =
1 e * ) 2(
1 & x'µ # ' $ ! 2% * "
2
Burada, x : incelenen sürekli değişken ( rastlantısal değişken), µ : dağılımın ortalaması, σ : dağılımın standart sapmasıdır. Kısaca, normal eğri olarak da bilinen ve (x = µ) eksenine göre simetrik olan normal dağılım eğrisi aşağıdaki gibidir (Şekil 3).
Şekil 3. Normal Dağılım Eğrisi. 71
c) Yukarıdaki ifadeden de görüldüğü gibi, normal dağılım, µ ve σ değerleriyle belirlenir. ç) -∞’dan + ∞’a uzanan ve simetrik olan normal eğriyle, (x) ekseni arasında kalan alan, 1’ e eşittir.
!
+"
#"
f ( x)dx = 1
Normal eğri ile x ekseni arasında kalan alanın % 100'e eşit olduğunu düşünürsek, x değişkeninin µ ile (µ + 1σ ) aralığında değerler alması olasılığı % 34.13 ve yine µ ile ( µ - 1σ ) aralığında değerler alması olasılığı % 34.13'e eşittir. Dolayısıyla, x değişkeninin (µ - 1σ ) ile (µ + 1σ ) arasında yer alması olasılığı % 68.26’dır. Aynı şekilde, (x)’ in (µ - 2σ) ile (µ + 2σ) arasında değerler alma olasılığı % 95.45 ve (µ - 3σ) ile (µ + 3σ) arasında değerler alma olasılığı da % 99.73'e eşittir (Şekil 4).
Şekil 4 . Normal eğrinin özellikleri. µ +1#
"µ
!1#
µ + 2#
"µ
! 2#
f ( x ) dx = P ((µ ! 1# ) < x < (µ + 1# )) = 0.6826 f ( x) dx = P ((µ ! 2# ) < x < (µ + 2# )) = 0.9545
72
µ +3#
"µ
!3#
f ( x) dx = P ((µ ! 3# ) < x < (µ + 3# )) = 0.9973
Tam simetrik olmayan (sağa veya sola eğik ) ve tek tepeli dağılım gösteren bir çok biyolojik değişkene ilişkin verilerin normal dağılıma dönüştürülmesi gerekebilir. Bu dönüşümü gerçekleştirmenin en basit ve yaygın yolu, gözlemsel verilerin yerine, bunların logaritmalarını kullanmaktır. 4.2.3.2.
NORMAL EĞRİNİN STANDARDİZASYONU
Dağılımın parametre ( µ , ! ) değerleri ve ifade edildikleri ölçü birimleri ne olurlarsa olsunlar, her normal dağılım, yukarıda belirtilen (a), (b), (c) ve (ç) şıklarında verilen özelliklere sahiptir. Bu ilginç özelliklere sahip normal dağılım, gerçek yaşamda pratik bir yoldan kullanılabilmesi, karşılaştırmalı uygulamalarda yararlı olabilmesi için standardize edilir. Bu standardizasyon işlemi, normal dağılımla incelenen (x) değişkeninde başlangıç noktası ve ölçek değişimi yapılarak gerçekleştirilir.
"i =
xi # µ !
dönüşümü ile x yerine ! değişkeni incelenir.
Yapılan işlemlerden dolayı, ! değişkeninin dağılımının ortalaması (0)’ a, standart sapmasıysa (1)’ e eşit olur ve dağılımın eğrisi normal eğriyle temsil edilir (Şekil 5).
Şekil 5. Standart normal eğri. 73
Standart normal dağılımın olasılık yoğunluk fonksiyonu aşağıdaki gibidir.
f (! ) =
1 2#
e
1 " !2 2
Standart normal dağılımda da, gözlemlerimizin % 68.26'sı –1 < ! < +1 aralığında, % 95.45'i –2 < ! < +2 aralığında, % 99.73'ü ise –3 < ! < +3 aralığında yer alacaktır.
"
+1
!1
"
+2
!2
"
+3
!3
f (# ) d# = P (! 1 < # < +1) = 0.6826 f (# ) d# = P (! 2 < # < +2 ) = 0.9545 f (# ) d# = P (! 3 < # < +3) = 0.9973
Tablo III'de standart normal değişkenin 0 ile çeşitli uzaklıklardaki standart sapma değerleri arasında kalması olasılıkları verilmektedir. 4.2.3.3.
NORMAL DAĞILIMA İLİŞKİN UYGULAMALAR
Uygulamalı çalışmalarımızda ele aldığımız grupların anayığın olmayıp, örneklemlerden ibaret oldukları gözönüne alınırak µ yerine x ve σ yerine s değerlerini kullanmamız uygun olur. Standart normal değişkeni elde ederken
"i =
xi ! x dönüşümünden yararlanacağız. s
Örnek 22. Bir araştırmada, 6 - 11 yaş grubu erkek çocuklarında sistolik kan basıncı ortalaması 107.3 mm-Hg ve standart sapması 8.7 mm-Hg bulunmuştur. Bu bilgileri kullanarak, aynı yaş grubunda incelemeye alınacak 200 erkek öğrencinin kaçında kan basıncı değerinin 107.3 ile 115 mm-Hg değerleri arasında kalması beklenir? 74
Çözüm : X rastlantısal değişkeninin (sistolik kan basıncı) µ=107.3 ve σ =8.7 parametreli normal dağılıma uygunluk gösterdiğini varsayalım. Normal eğri ile x ekseni arasındaki alanın % 100'e eşit olduğunu düşünürsek, burada sorulan, taralı alanın kaç olduğudur (Şekil 6.). Diğer bir ifade ile, rastlantısal olarak seçilen bir öğrencinin kan basıncı değerinin 107.3 ile 115 arasında kalma olasılığının kaça eşit olduğudur. Bu olasılık değeri hesaplandıktan sonra bu değerin toplam denek sayısıyla çarpılmasından elde edilen sayı, bize incelenen grupta söz konusu aralıkta olması gereken öğrenci sayısını verecektir. x1 = 107.3'e karşılık gelen
"1 =
x1 ! x 107.3 ! 107.3 = =0 s 8.7
x2 = 115'e karşılık gelen
"2 =
x 2 ! x 115 ! 107.3 = = 0.89 s 8.7
Şekil 6. ! 1 = 0 İle ! 2 = 0.89 arasındaki normal alan
! 1 = 0 ile ! 2 = 0.89 arasındaki alan değeri Tablo III'den bulunur. Bu değer 0.3133’e eşittir. 75
İncelenen grupta toplam denek sayısı n = 200 olduğundan, bu grupta, (200 · 0.3133) = 62.6 öğrencide kan basıncı değerinin 107.3 ile 115 mm-Hg arasında kalması beklenir. Örnek 23. 350 öğrenciye ait zeka puanlarının bölünmesi normal dağılıma uymaktadır. Dağılımın aritmetik ortalaması 100.6 ve standart sapması 12.5 ise, a) Zeka puanı 90 - 118 arasında kalan kaç kişi vardır? b) Zeka puanı 110'dan düşük kaç kişi vardır? Çözüm : a) x1 = 90 ve x2 = 118 değerlerine karşılık gelen standart değerler aşağıdaki şekilde hesaplanır.
ile
!
"1 =
x1 ! x 90 ! 100.6 = = !0.85 s 12.5
"2 =
x 2 ! x 118 ! 100.6 = = 1.39 s 12.5
X rastlantısal değişkeninin ( zeka puanı) 90 - 118 arasında kalma olasılığı değişkeninin –0.85 - 1.39 arasında kalma olasılığı birbirine eşittir.
Tablo III'de verilen standart normal eğrinin ! = 0 eksenine göre simetrik olması özelliğini kullanarak, 0 ile ! 1 ve - ! 1 ile 0 arasındaki alan değerlerinin aynı olduğunu söyleyebiliriz. Buna göre, 0 ile 1.39'a karşılık gelen olasılık 0.4177 ve -0.85 ile 0'a karşılık gelen olasılık da 0.3023 değerine eşittir. ! değişkeninin -0.85 ile 1.39 arasında kalma olasılığı, ! değişkeninin -0.85 ile 0 ve 0 ile 1.39 arasında kalma olasılıklarının toplamına eşittir. P( 90 < x < 118 ) = P(-0.85 < ! < 1.39) = P(-0.85 < ! < 0) + P(0< ! <1.39) = P(0< ! <0.85) + P(0< ! <1.39) = 0.3023 + 0.4177 = 0.72
76
350 kişi arasında zeka puanı 90 - 118 arasında olanların sayısının (350 · 0.72) = 252 kişi olması beklenir. b) x1 = 110 değerine karşılık gelen standart değer 110 - 100.6 ! 1 = = 0.75 . 12.5
Şekil 7.
! <0.75
için Normal alan.
Şekil 7'den de görüldüğü gibi, P(x<110) = P( ! <0.75) = P( ! <0) + P(0< yazabiliriz.
!
<0.75) eşitliğini
! <0 ile toplam alanın yarısı belirtildiğinden P( ! <0) = 0.50 ve Tablo III kullanılarak P(0< ! <0.75) = 0.2734 bulunur. Buna göre, P(x<110) = 0.50 + 0.2734 = 0.7734
77
(350·0.7734)=271 öğrencide zeka puanının 110'nun altında kalması beklenir. Örnek 24. Bir sınavda ortalama not 70 ve standart sapma 8'dir. Yüksek not alan öğrencilerin % 15'ine "A" derecesi verilecektir. "A" alabilmek için bir öğrencinin alması gereken en düşük not kaç olmalıdır? ( Notların bölünmesinin normal olduğu varsayılmaktadır). Çözüm : Standart normal eğrinin sağ tarafındaki % 15'lik uç alana (Şekil 8.) karşılık gelen standart değer, yani P(0< ε< ! 1 ) = 0.50 - 0.15 = 0.35 ifadesini gerçekleyen ! 1 değeri Tabol III.'den 1.04 olarak bulunur.
Şekil 8.
"1 =
x1 ! x ifadesi kullanılarak, s
x1 = (1.04) · (8) + 70 = 78.32 bulunur.
78
Bölüm 5
Kuramsal Örnekleme Dağılımı
5.1. ÖRNEKLEME DAĞILIMI VE STANDART HATA Daha önce de bir kaç kez vurguladığımız gibi, İstatistik Yöntembilim’ in sonul amacı, sınırlı gruplar ya da toplulukların incelenmesinden hareketle, tümevarımla anayığına genelleme yapabilmektir. Anayığının kestirmek istediğimiz parametresi, ortalama, standart sapma, belli bir persantil (yüzdelik) değeri, v.s... olabilir. Anayığının kestirmek istediğimiz parametresinin ( µ ) olduğunu varsayalım. Bu kestirim için hareket noktamız anayığından seçilmiş bir örnekten hesaplanan aritmetik ortalamamız ( x ) olacaktır. Acaba, örneğimizin ortalaması olan ( x ) asıl hedefimiz olan anayığın ortalaması ( µ )’yü ne derecede temsil edebilir? Bu soruyu bir başka biçimde de ifade edebiliriz. (n) birimden oluşan örneğimiz yerine, anayığından bir diğer (n) birimden oluşan ikinci bir örnek seçseydik, bu örneğin ortalaması, ilk örneğimizin ortalamasına eşit olacak mıydı? Dahası, bu işlem bir kaç kez yinelenmiş olsaydı, (n) büyüklüğündeki bu farklı örneklemlerin ortalamaları birbirlerinden ne derecede farklı olacaklardı? Kuşkusuz, gerçek yaşamda yapılan araştırmalarda, belli bir anayığının ortalamasını kestirmek için bu anayığından tek bir örnek seçmek yeterlidir. Yalnızca tek bir örneklem ortalamasından, anayığın ortalamasına genelleme 79
yapmanın sağlıklı bir yolunu bulmak amacıyla, belli bir anayığından (n) büyüklüğünde bir çok örneğin seçilip, bu örneklerin ortalamalarının nasıl bir dağılım gösterdiğini incelemek isteyelim. (N) birimden oluşan ve ortalaması (µ = 120.93) ve standart sapması ( ! = 8.49) olan bir anayığından iadeli olarak (n=10)’ar birimlik 40 örnek çektiğimizi ve bu örneklemlerde de aşağıdaki aritmetik ortalamaları bulduğumuzu varsayalım (Tablo 1) Tablo 1. n=10 olan 40 ayrı örnekte ortalamalar Örnek no 1 2 3 4 5 6 7 8 9 10
xi 120,50 123,21 122,40 119,42 120,73 120,61 119,87 120,70 119,39 118,51
Örnek no 11 12 13 14 15 16 17 18 19 20
Örnek no 21 22 23 24 25 26 27 28 29 30
xi 122,93 118,85 117,87 127,01 121,96 119,93 122,27 117,53 120,07 122,78
xi 116,46 124,18 120,57 117,37 124,67 119,64 115,80 120,20 117,88 118,85
Örnek no 31 32 33 34 35 36 37 38 39 40
xi 125,63 120,13 122,18 124,71 122,15 123,40 121,92 120,62 121,19 122,99
Bu örnek ortalamalarının meydana getirdiği dağılıma “deneysel örnekleme dağılımı” adı verilir (Şekil 1).
Şekil 1 . Deneysel örnekleme dağılımı
80
Aynı işlemlerin sınırsız sayıda birimden oluşan bir anayığından çekilebilecek tüm (n) büyüklüğündeki örnekler üzerinde yapıldığı varsayıldığında, “deneysel örnekleme dağılımı”nın yerini “kuramsal örnekleme dağılımı” alır. Dolayısıyla, “kuramsal örnekleme dağılımı”, bir anayığından alınabilecek (n) büyüklüğündeki tüm örneklemlerin ortalamalarının oluşturduğu dağılımdır. Bu türden bir dağılım, bir anayığından çekilebilecek sabit büyüklükteki örneklemlerde belli ortalama değerlerin belirme olasılığının kaça eşit olduğunu gösterir. Ortalama için olduğu gibi, anayığının standart sapması, ya da belli bir özelliğin oranı gibi parametreler için de kuramsal örnekleme dağılımları oluşturulabilir. Kuramsal örnekleme dağılımının standart sapmasına “standart hata” adı verilir. Standart hata, standart sapmayla karıştırılmamalıdır. Gerçekten, standart sapma, bir anayığındaki ( ! ) ya da bu anayığından alınmış belli bir örnekteki birimlere ilişkin gözlem sonuçları arasındaki değişkenliği ölçer. Standart hata ise, anayığından alınmış (n) büyüklüğündeki örneklerin ortalamaları arasındaki değişkenliğin ölçüsüdür. Diğer bir deyişle, standart hata, bulunan ortalama değerlerin bir örnekten diğerine ne derecede farklılık gösterebileceğini ifade eder.
5.2. KURAMSAL ÖRNEKLEME DAĞILIMININ ÖZELLİKLERİ (MERKEZİ SINIR TEOREMİ) Aritmetik ortalaması ( µ ) ve standart sapması ( ! ) olan bir anayığından alınan (n) büyüklüğündeki örneklerin ortalamalarının oluşturduğu kuramsal örnekleme dağılımının ortalaması µ ’ye, standart sapmasıysa (standart hata)
! ’e eşittir. n (n) büyüdükçe ( n " ! ) kuramsal örnekleme dağılımı normal eğriye yaklaşır. Pratikte, n ≥ 30 olması normal dağılıma yeterli bir yaklaşım sağlamaktadır (Şekil 2).
81
Şekil 2. Ortalamalara ilişkin kuramsal örnekleme dağılımı Anayığının sınırlı sayıda birim içermesi durumunda (veya örnekleme işlemi iadesiz yapılıyorsa), kuramsal örnekleme dağılımının ortalaması µ ’ ye, standart sapmasıysa,
# " n
(N ! n ) ’ye eşittir. (N ! 1)
Oranlara ilişkin kuramsal örnekleme dağılımında oranların ortalaması ve standart hata aşağıdaki ifadelerle belirlenir. Anayığın çok sayıda birim içeriyorsa ( N → ∞ ) (veya örnekleme işlemi iadeli yapılıyorsa)
x pi = P
ve (standart hata) s pi =
(P ! Q ) n
ifadeleriyle,
anayığın sınırlı sayıda birim içeriyorsa (veya örnekleme işlemi iadesiz yapılıyorsa) 82
x pi = P
ve (standart hata) s pi =
(P ! Q ) (N ! n ) ifadeleriyn
( N ! 1)
le hesaplanır. Burada;
x pi
: oranlara ilişkin kuramsal örnekleme dağılımında aritmetik ortalamayı,
s pi
: standart hatayı,
P : anayığına ilişkin incelenen olayda "başarı" olarak nitelendirilen sonucun olasılığını, Q : 1–P “başarı” sonucunun gerçekleşmeme olasılığını göstermektedir. Bu eşitliklerin gerçeklendiğini bir örnek üzerinde gösterelim. Örnek 1. Bir anayığının ( 1, 2, 3, 4, 5 ) sayılarından oluştuğunu varsayalım. Bu anayığından örneklem uzunluğu n = 2 olan tüm örneklemlerin seçildiğini düşünürsek, a) anayığının aritmetik ortalamasını, b) anayığının standart sapmasını, c) kuramsal örnekleme dağılımının aritmetik ortalamasını (iadeli seçim), d) standart hatayı (iadeli seçim), e) kuramsal örnekleme dağılımının aritmetik ortalamasını (iadesiz seçim), f) standart hatayı (iadesiz seçim) hesaplayınız. Çözüm : N
!x
i
a)
µ=
i =1
N
=
15 =3 5
83
N
b) # =
! (x
2
i
" µ)
10 = 1.4142 5
=
i =1
N
c) iadeli olarak n=2 uzunluklu tüm örneklemleri aşağıdaki gibi seçebiliriz. (1,1) (2,1) (3,1) (4,1) (5,1) (1,2) (2,2) (3,2) (4,2) (5,2) (1,3) (2,3) (3,3) (4,3) (5,3) (1,4) (2,4) (3,4) (4,4) (5,4) (1,5) (2,5) (3,5) (4,5) (5,5) Bu örneklemlerde ortalama değerler aşağıda verilmektedir. 1.0 1.5 2.0 2.5 3.0 1.5 2.0 2.5 3.0 3.5 2.0 2.5 3.0 3.5 4.0 2.5 3.0 3.5 4.0 4.5 3.0 3.5 4.0 4.5 5.0 25
x xi =
!x
i
i =1
=
25
75 =3=µ 25
25
# (x d) s x i =
i
"µ
i =1
25
2
) =
25 ! =1= 25 n
e) iadesiz olarak seçilen n=2 uzunluklu tüm örneklemler ve bu örneklemlerdeki aritmetik ortalamalar aşağıda verilmektedir. örneklemler (1,2) (2,3) (3,4) (4,5) (1,3) (2,4) (3,5) (1,4) (2,5) (1,5)
ortalamalar 1.5 2.5 3.5 4.5 2.0 3.0 4.0 2.5 3.5 3.0
84
10
x xi =
!x
i
i =1
=
10
30 =3=µ 10
f) 10
# (x s xi =
i
!µ
i =1
10
2
) =
7.5 $ = 0.866 = " 10 n
(N ! n ) (N ! 1)
Örnek 2. Bir anayığının ( 1, 2, 3, 4, 5 ) sayılarından oluştuğunu ve incelenen olayda 1, 2, ve 3 değerlerinin çıkmasını "başarı" olarak kabul edelim. Örneklem uzunluğu n = 2 olan tüm örneklerin seçildiğini düşünürsek, a) anayığında başarı oranını, b) kuramsal örnekleme dağılımında oranların aritmetik ortalamasını (iadeli seçim), c) standart hatayı (iadeli seçim), d) kuramsal örnekleme dağılımında oranların aritmetik ortalamasını (iadesiz seçim), e) standart hatayı (iadesiz seçim) hesaplayınız. Çözüm : "başarı" sayısı 3 a) P = = = 0.60 olanaklı durumlar sayısı 5 b) iadeli olarak seçilen n=2 uzunluklu örneklemlerde (Örnek 1) "başarı" oranları aşağıda verilmektedir. 1.0 1.0 1.0 0.5 0.5
1.0 1.0 1.0 0.5 0.5
1.0 1.0 1.0 0.5 0.5
0.5 0.5 0.5 0.0 0.0
0.5 0.5 0.5 0.0 0.0
85
25
x pi =
!p
i
i =1
25
=
15 = 0.60 = P 25
25
c)
s pi =
# (p
2
i
" P)
i =1
3 = 0.3464 = 25
=
25
P !Q n
d) iadesiz olarak seçilen n=2 uzunluklu örneklemlerde (Örnek 1.) "başarı" oranları aşağıda verilmektedir. 1.0 1.0 0.5 0.0 1.0 0.5 0.5 0.5 0.5 0.5 10
x pi =
!p
=
10 10
e) s pi =
i
i =1
# (p
6 = 0.60 = P 10 2
i
! P)
i =1
10
=
0.9 = 0.3 = 10
86
P "Q " n
(N ! n ) (N ! 1)
Bölüm 6
Örnekleme
Anayığının (evrenin) bütün birimleri yerine, bazı kurallara göre seçilen birimlerin oluşturduğu, temsil gücüne sahip bir alt grubun gözleme tabi tutulması, incelenmesi ve elde edilen sonuçların anayığına genellenmesine “örnekleme” denir. Örnekleme tekniği, bir araştırmayı geniş ve gereksiz bir bilgi yükünden kurtararak zaman, para, eleman ve malzeme tasarrufu sağlar. Örnekleme bu ölçüde yararlı bir teknik olmakla birlikte, riski yüksek ve gelişigüzel kullanılması sakıncalı bir işlemdir. Bir örnekten (örneklem) elde edilen sonuçların, örneğin içinden seçildiği anayığına genelleştirilebilmesi için, örneği oluşturan birimlerin anayığının karakteristiklerini yansıtacak özellikte olması gerekir. Temsil gücüne sahip olmayan bir örneğe dayanılarak yapılacak bir genellemede önemli sapmalar ve yanılgıların olması kaçınılmazdır. Bu nedenle, örnekleme işlemi yapılırken belli kurallara uymaya ve belli koşulları gerçekleştirmeye özen gösterilmelidir. 87
Örnekleme yöntemlerini aşağıdaki gibi sınıflayabiliriz. Örnekleme Yargısal örnekleme
Rastlantısal örnekleme (olasılıklı örnekleme)
Basit rastlantısal örnekleme Kura Yöntemi Rastlantısal sayılar yöntemi
Sistematik örnekleme yöntemi
Katmanlı örnekleme Orantılı katmanlı örnekleme
Orantısız katmanlı örnekleme
Küme örnekleme Olasılıklı alan örnekleme
Şekil 1. Örnekleme türleri.
6.1. RASTLANTISAL ÖRNEKLEME (OLASILIKLI ÖRNEKLEME) Birimlerin örneğe seçilme işleminin olasılık kurallarıyla yapıldığı bir örnekleme türüdür. Rastlantısal örneklemede anayığındaki her birimin örneğe seçilme olasılığı birbirine eşittir. 88
6.1.1. BASİT RASTLANTISAL ÖRNEKLEME Basit rastlantısal örnekleme yapabilmek için anayığının kuramsal ya da kavramsal olarak tanımlanmış olması yeterli değildir. Anayığının somut olarak tanımlanması veya anayığın birimlerine ait bir listesinin olması gerekir (muhtarlık kayıtları, seçmen kütükleri, telefon rehberi, ...) . Örnekleme işlemine geçmeden önce, liste üzerinde her birim numaralandırılır. 6.1.1.1. KURA YÖNTEMİ Anayığını oluşturan (N) sayıda birimin numaraları bir torbaya konarak karıştırılır ve bu torbadan örnek büyüklüğü (n) kadar birim seçilir. Örnek 1. Belli bir dönemde, (X) hastalığı nedeniyle hastaneye başvuran hastaların durumlarının incelendiği bir araştırmayı ele alalım. Belirtilen dönemde (X) nedeniyle hastaneye başvuran tüm hastalar anayığını oluşturur. Burada, hasta sayısının (N) çok büyük olduğunu ve tümünün incelenmesinin zaman, para, malzeme ve eleman açısından güç olduğunu kabul edersek, tüm hastaların incelenmesi yerine, bu anayığından, kura yöntemiyle örneklem büyüklüğü (n) kadar hastanın seçilerek incelenmesi yeterli olur. Bunun için tüm hastalara birer numara (protokol numarası) verilir ve numaralar fişlere kaydedilir. Bütün fişler bir torbaya konduktan sonra torba karıştırılır ve içinden (n) tanesi rastlantısal olarak seçilir. Burada anayığındaki her birimin örnekleme girme olasılığı birbirine eşittir. 6.1.1.2.
RASTLANTISAL SAYILAR YÖNTEMİ
Örnekleme işlemi için rastlantısal sayılardan oluşan tablo (Tablo I) kullanılır. Basit olarak rastlantısal sayılar tablosunu şu şekilde oluşturabiliriz. 0,1,2, … ,9 rakamları bir torbaya konur ve torbadan (iadeli) rastlantısal olarak bir rakam seçilir. Bu işlem çok kez tekrarlandığında, istenilen basamakta ve istenilen miktarda rastlantısal sayı elde edilir. Bu şekilde elde edilen rastlantısal sayıların oluşturduğu tabloya rastlantısal sayılar tablosu diyoruz. Bilgisayar kullanımının yoğun olduğu günümüzde, rastlantısal sayılar dizisi çok kısa zamanda elde edilebilmektedir Tablo I’de verilen rastlantısal sayılar tablosu, EXCEL bilgisayar programındaki “S_SAYI_ÜRET” fonksiyonu kullanılarak oluşturulmuştur. 89
Anayığındaki birimler 1’den N’e kadar numaralandırılır. Seçim işlemi için, rastlantısal sayılar tablosundaki l basamaklı (N’in basamak sayısı) rastlantısal sayılar kullanılır. Tablodan rastlantısal olarak seçilen satır ve sütuna karşılık gelen sayı başlangıç sayısı olarak seçilir. Daha sonra, yukarıdan aşağıya veya soldan sağa hareketle rastlantısal sayı seçmeye devam edilir. Seçilen rastlantısal sayı tekrar ettiyse veya bu sayıya karşılık gelen birim anayığında yoksa, bu sayı göz önüne alınmaz. Bu işleme örnek oluşturuluncaya kadar devam edilir. Örnek 2. N=9550 olan bir anayığından n=10 birimlik bir örneklemi rastlantısal sayılar tablosunu kullanarak oluşturmak isteyelim. Anayığındaki birimler 1’den 9550’ye kadar numaralandırılarak liste oluşturulur. Rastlantısal sayılar tablosundan kurayla satır sayısını 4 ve sütün sayısını 5 olarak seçelim. Tabloda, 4. satır ve 5. sütuna karşılık gelen başlangıç sayısı belirlenir (79247). Bu sayının sağa bitişik 4 basamağın (l=4) oluşturduğu 9247 numaralı birim örneklemin ilk birimi olacaktır. Yukarıdan aşağıya devam ederek, örneklemi oluşturan birimler aşağıdaki gibi belirlenir. 9247 2339 1876 4331 2734 8932 2492 5547 4876 1598 6.1.1.3.
k=
N n
SİSTEMATİK ÖRNEKLEME ifadesi ile örneklemi oluşturacak birimler arasındaki uzaklık
hesaplanır. 1 ile k arasından rastlantısal olarak bir tam sayı (a) seçilir. Daha sonra, (a)’dan başlayarak k’lı aralıklarla birimleri seçerek örneklem oluşturulur. Örnek 3. N=900 birimden oluşan bir anayığından n=15 birimlik bir örneklemi sistematik örnekleme yöntemiyle oluşturalım. Birimler arası uzaklık k =
N 900 = 60 ve a ! [1,60] olacak = n 15
şekilde rastlantısal olarak seçilir. a=20 olsun. 20’den başlayarak 60’arlık aralıklarla seçilen birimler örneklemi oluşturur. 20, 80, 140, 200, 260, 320, 380, 440, 500, 560, 620, 680, 740, 800, 860
90
6.1.2. KATMANLI ÖRNEKLEME Örneklemi teşkil etmeden önce, anayığın bazı katman ve sınıflara ayrılır ve örneklem bu katmanlardan rastlantısal olarak seçilir. Örneğin, ilköğrenim çağındaki öğrencilerin sağlık durumlarını araştırmak amacıyla yapılacak bir araştırmada , öğrencileri katmanlara ayırmak üzere, cinsiyet, yaş, sosyo-ekonomik durum gibi ölçütler kullanılabilir. Katmanlı bir örneklemede bölme ölçütlerinin saptanmasından sonra yapılacak ilk iş, her gruptan örnekleme girecek birimlerin seçilmesidir. Bunun için, önce anayığın birimlerinin bu ölçütlere göre dağılımı elde edilir. Daha sonra alt grupların her biri bir anayığın gibi ele alınarak basit rastlantısal örnekleme işlemiyle öngörülen sayıda birim seçilir. Orantılı katmanlı örneklemede, katmanın anayığın içindeki yeriyle orantılı olacak şekilde birim seçilir. Orantısız katmanlı örneklemede ise, katmanın anayığın içindeki oransal büyüklüğüne bakılmaksızın eşit sayıda birim seçilir. Orantısız katmanlı örnekleme yöntemiyle oluşturulan bir örneklemden elde edilen sonuçlar, katmanların anayığın içindeki oransal büyüklükleriyle ağırlıklandırıldıktan sonra anayığına genellenebilir.
6.1.3. KÜME ÖRNEKLEME Bu örneklemede seçilen birimler, anayığındaki birimlerin kendiliğinden içinde yer aldıkları kümelerdir. Anayığın birimlerini oluşturan kümeler ilk örnekleme birimleri sayılarak, bunlar arasından rastlantısal yolla seçilen kümeler alınır ve genellikle bu kümelerin tam sayımına başvurulur. Anayığını oluşturan birimlerin tam bir listesini elde edemiyorsak küme örnekleme yöntemi kullanılır. Örneğin belli bir bölgede ilköğrenim çağındaki öğrencilerin sağlık durumlarını araştırmak amacıyla yapılacak bir küme örneklemesinde, ilk olarak, bölgede yer alan ilköğretim kurumlarının listesi oluşturulur. Listede yer alan okullar birer birim (küme) olarak ele alınır ve bu listeden öngörülen sayıda okul (küme) basit rastlantısal örnekleme yöntemiyle seçilir. Seçilen her küme tam sayım yöntemiyle incelenir.
91
6.1.4. OLASILIKLI ALAN ÖRNEKLEMESİ Anayığın birimlerini içinde bulundukları yerleşim düzenine göre kümelendiren bir tekniktir. Bir alanın coğrafi bakımından bir bölgeyi (bir ülkeyi) temsil ettiğini düşünelim. Toplam alan alt alanlara ayrılır. Ayrılan bu alanlardan bir kısmı veya biri rastlantısal olarak seçilir ve aynı işleme zincirleme bir şekilde son birime ulaşılana kadar devam edilir. Örneğin belli bir coğrafi alan (n) sayıda alt alana ayrılır. Her bir alt alandaki yerleşim birimleri listelenir. Rastlantısal olarak seçilen yerleşim birimlerine ilk örnekleme birimi adı verilir. Daha sonra seçilmiş yerleşim birimleri daha alt alanlara, bloklara ayrılarak her alandan birimler rastlantısal olarak seçilir.
6.2. YARGISAL ÖRNEKLEME Bu örnekleme tipinde, araştırmacının kişisel bilgi ve görüşlerine göre bazı birimlerin anayığını temsil edebilecekleri düşünülür ve bu birimler seçilerek örneklem oluşturulur.
92
Bölüm 7
Örneklem Büyüklüğü
Pek çok araştırmada, anayığına ilişkin parametrelerin (anayığın aritmetik ortalaması (µ ) veya anayığın oranı (P)) tahmin edilmesi veya aynı değişkenin incelendiği farklı örneklemlerden elde edilen istatistiklerin karşılaştırılması amaçlanır. Doğru bir tahmin (kestirim) yapabilmek için, üzerinde araştırma yapılacak çalışma grubunun (örneklemin) en az kaç birim içermesi gerektiği hesaplanarak belirlenmelidir. Örneklem büyüklüğünün (n) hesaplanmasında, araştırmacının öncelikle örneklem istatistikleri ile anayığın parametreleri arasındaki farkın (kabul edilebilir örnekleme hatası) en fazla hangi değeri alabileceğini belirlemesi gerekir. Kestirim gücü yüksek, duyarlı sonuçlar elde edebilmek için kabul edilebilir örnekleme hatası olabildiğince düşük tutulmalıdır. Yapılacak çalışmada, kabul edilebilir örnekleme hatasının düşük tutulabilmesi, örneklem büyüklüğünün arttırılması ile sağlanabilir. Diğer taraftan, örneklem büyüklüğünün artması, çalışma olanaklarını zorlayacağından, araş93
tırmacı çalışma koşulları ile araştırma sonuçlarının duyarlılığı arasında bir denge kurmak durumundadır. Farklı uygulamalar için, örneklem büyüklüğünün (n) hesaplanmasında kullanılan ifadeler aşağıda verilmektedir. Hesaplamalarda göz önüne alınan örneklemlerin basit rastlantısal örneklemler olduğu kabul edilecektir.
7.1. ANAYIĞIN ORTALAMASININ (µ ) KESTİRİLMESİNDE ÖRNEKLEM BÜYÜKLÜĞÜ Burada, tahmin edilmek istenen anayığın ortalaması (µ ) ile örneklem ortalaması ( x ) arasındaki farkın, önceden belirlenen bir değeri belli bir olasılıkla aşmaması istenir. Bu ifadeyi olasılık simgeleriyle aşağıdaki gibi yazarız.
(
)
P | x " µ |< d = 1 " ! Yukarıda verilen ifadede, (d) öngörülen kabul edilebilir örnekleme hatasını, (1-α) güven düzeyini ve α simgesi yanılma düzeyini göstermektedir. Güven düzeyi olarak genellikle % 95, % 99 ve % 99.9 düzeyleri seçilir. Bu güven düzeylerine karşılık gelen yanılma düzeyleri, sırasıyla 0.05, 0.01 ve 0.001’dir. Ortalamalara ilişkin kuramsal örnekleme dağılımının, ortalaması (µ ) ve standart sapması (standart hata) (
! ) olan normal dağılıma sahip olduğu göz n
önüne alındığında, yukarıda verilen eşitliği sağlayan örneklem büyüklüğü (n) değerini (anayığın birim sayısı çok büyük ise) aşağıdaki ifade ile hesaplarız. 2
"# $! 2 n= d2 Anayığın birim sayısı (N) çok büyük değilse, (n) aşağıdaki gibi hesaplanır.
94
2
n=
$% "# 2 " N 2 $ % " # 2 + d 2 " (N ! 1)
n > 0.05 ise, hesapladığımız n değerini n0 değerine eşitleyerek, N aşağıdaki ifadeyle (n) hesaplanır.
n=
n0 n 1+ 0 N
Örnek 1. Kurşun elementinin neden olduğu çevre kirliliğinin toplum üzerinde etkisini araştırmak için, toplumda kan kurşun düzeyini tahmin etmek isteyelim. % 95 Güven düzeyinde oluşturulacak bir basit rastlantısal örneklemde, (µ ) ile ( x ) arasındaki farkın d= 2 µg/100 ml değerini aşmaması için örneklem büyüklüğü kaç olmalıdır? Çözüm : Kabul edilebilir örnekleme hatası d= 2 µg/100ml , güven düzeyi (1-α) = 0.95 ve yanılma düzeyi α =0.05’dir. Normal alanlar tablosu (Tablo III) ve t tablosundan (Tablo IV) α =0.05 değerine karşılık gelen standart normal değer ! 0.05 = 1.96 alınır. Kan kurşun düzeyinin anayığındaki varyansının kestirim değeri, daha önce yapılmış olan çalışmalardan (literatürden) veya yapılacak ön çalışmadan, ! 2 = 144 µg/100ml olarak elde edilir. Anayığın birim sayısının (toplumdaki kişi sayısının) çok büyük olduğu kabul edilirse, örneklem büyüklüğünü aşağıdaki ifade ile hesaplarız.
2
"# $! 2 n= d2
=
(1.96)2 ! (144) = 139 (2)2
95
7.2. ANAYIĞIN ORANININ (P) KESTİRİLMESİNDE ÖRNEKLEM BÜYÜKLÜĞÜ Tahmin edilmek istenen anayığın oranı (P) ile örneklem oranı p 0 arasındaki farkın, önceden belirlenen bir değeri belli bir olasılıkla aşmaması isteniyorsa ( P (| P " p 0 |< d ) = (1 " ! )), örneklem büyüklüğünü (n), ( N " ! için) aşağıdaki ifade ile hesaplarız. 2
# ! P !Q n= " 2 d Burada, P : anayığına ait oran değerini (bu oran genellikle bir hastalığın toplumda görülme sıklığını (prevalans) göstermek için kullanılır), Q = 1- P , d : kabul edilebilir örnekleme hatasını,
" ! : α değerine karşılık gelen standart normal değeri göstermektedir. N çok büyük değilse, n aşağıdaki ifade ile hesaplanır. 2
n=
$# " P " Q " N 2
$ # " P " Q + d 2 " (N ! 1)
n0 n > 0.05 ise, n = ifadesi ile düzeltme yapılır. n N 1+ 0 N
Aşağıdaki tabloda α =0.05 için çeşitli P ve d değerlerine karşılık gelen n değerleri verilmektedir. 96
Tablo 1. α =0.05 için örneklem büyüklükleri. P d
0,05 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,15 0,20 0,25 0,30
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1825 3458 457 865 203 385 115 217 73 139 51 97 38 71 29 55 23 43 19 35 9 16 5 9 -6 ---
6147 1537 683 385 246 171 126 97 76 62 28 16 10 7
8068 2017 897 505 323 225 165 127 100 81 36 21 13 9
9220 2305 1025 577 369 257 189 145 114 93 41 24 15 11
9604 9220 2401 2305 1068 1025 601 577 385 369 267 257 196 189 151 145 119 114 97 93 43 41 25 24 16 15 11 11
8068 2017 897 505 323 225 165 127 100 81 36 21 13 9
6147 1537 683 385 246 171 126 97 76 62 28 16 10 7
3458 865 385 217 139 97 71 55 43 35 16 9 6 --
(d: kabul edilebilir örnekleme hatası , P : anayığın tahmini oranı)
Örnek 2. Bir hastalığın toplumda görülme sıklığının (prevalans) 0.10 civarında olduğunu varsayalım. Söz konusu hastalığın prevalansını belirlemek amacıyla bir alan araştırması yapılmak istenmektedir. Yapılacak araştırmada, % 95 güvenle, kabul edilebilir örnekleme hatasının 0.01 değerini aşmaması isteniyorsa, örneklem büyüklüğü kaç olmalıdır? Çözüm : P = 0.10 , Q = 1-0.10 = 0.90 ve α =0.05 için ! 0.05 = 1.96’dır. 2
# ! P ! Q (1.96) 2 ! (0.10) ! (0.90) n= " 2 = = 3458 d (0.01) 2 97
7.3. KONTROL VE DENEY GRUPLARINA İLİŞKİN, ORTALAMALARIN ( x1 , x 2 ) KARŞILAŞTIRILMASINDA ÖRNEKLEM BÜYÜKLÜĞÜ İki ayrı örneklemden elde edilen aritmetik ortalamaların karşılaştırılması söz konusudur. İki örneklem ortalamasının istatistiksel karşılaştırmasında yapılacak işlemler (hipotezlerin kurulması, sınanması, tip I hata(α) ve tip II hata (β)) daha sonraki bölümlerde ayrıntılı olarak açıklanacaktır. Klinik araştırmalarda, genellikle, bir gruba etkin madde (etkisi araştırılmak istenen madde, veya yöntem) uygulanırken, diğer gruba plasebo (etkisiz madde veya geleneksel yöntem,..) uygulanır. Etkisi araştırılan maddenin uygulandığı gruba deney grubu, plasebo grubuna ise kontrol grubu adı verilir. Burada, kontrol grubundaki aritmetik ortalama ( x 1 ) ile deney grubundaki aritmetik ortalama ( x 2 ) arasındaki mutlak farkın
x1 ! x 2 ,
önceden belirlenen bir değeri belirli olasılıkla aşmaması istenir. Her bir grup için gerekli denek sayısı aşağıdaki ifade ile hesaplanır.
Yukarıdaki ifadede, d : kabul edilebilir örnekleme hatasını, ! 2 : anayığın varyansını, " ! , " ! : tip I hata(α) ve tip II hata (β) (veya testin gücü =(1- β)) için, standart normal değerleri göstermektedir. Hesaplamalarda, genellikle, (α = 0.05) ve (β = 0.10 veya β =0.20) alınır. Tablo III (Normal Alanlar Tablosu) ve Tablo IV (t tablosu) incelendiğinde, (iki-yönlü) α = 0.05 için " ! =1.96, (tekyönlü) β = 0.10 için " ! =1.28 ve (tek-yönlü) β=0.20 için " ! =0.84 değerleri elde edilir.
98
Örnek 3. Yeni geliştirilen bir (A) maddesinin, sistolik kan basıncını düşürmekte (veya kontrol altına almakta) etkili olduğu iddia edilmektedir. Bu iddianın doğruluğunu sınamak amacıyla planlanan klinik bir çalışmada, (A) maddesi deney grubunda, plasebo ise kontrol grubunda uygulanacaktır. Deney grubu ile kontrol grubu ortalamaları arasındaki farkın (istatistiksel olarak anlamlı kabul edilebilecek fark) en az d=10 mm-Hg olması için grupların büyüklükleri kaç olmalıdır? Çözüm : (α = 0.05) ve (β = 0.10) için standart normal değerler sırasıyla (ikiyönlü) " ! = 1.96 ve (tek yönlü) " ! = 1.28 değerleri Tablo III ve IV’den okunur. Kan basıncına ait anayığın varyansının ! 2 (varyansın kestirimi literatür bilgisi veya yapılacak ön çalışmadan elde edilir) 64 olduğunu varsayarsak, kontrol ve deney gruplarına almamız gereken denek sayısını aşağıdaki gibi hesaplarız.
2 ( 1.96 + 1.28) ! 64 n = 2!
10 2
Her bir grup için n = 14 bulunur. Çalışmada kabul edilebilir örnekleme hatasını daha küçük belirlersek örneklem büyüklüğünün artacağı açıktır. Örneğin, kabul edilebilir örnekleme hatasını d = 5 mm-Hg alırsak, her bir grup için, n = 54 hesaplanır.
7.4. KONTROL VE DENEY GRUPLARINA İLİŞKİN, BAŞARI ORANLARININ ( p1 , p 2 ) KARŞILAŞTIRILMASINDA ÖRNEKLEM BÜYÜKLÜĞÜ Kontrol grubundaki başarı oranı ( p1 ) ile deney grubundaki başarı oranı ( p 2 ) arasındaki mutlak farkın
(p
1
! p2 ), önceden belirlenen bir değeri belirli 99
olasılıkla aşmaması için gerekli olan denek sayısının hesaplanması amaçlanır. Her bir grup için gerekli denek sayısını aşağıdaki ifade ile hesaplarız.
(% n= P=
" 2 " P " (1 ! P ) +% # " p1 " (1 ! p1 )+ p2 " (1 ! p2 )
$"
)2
(p1 ! p2 )2
(p1 + p2 ) 2
Örnek 4. Plaseboya göre etkinliği araştırılan bir maddenin (bir yöntemin) deney gruplarındaki başarı oranının p 2 =0.60 ve plasebonun kullanıldığı kontrol grubundaki başarı oranının ise, p1 =0.40 olacağını öngörelim. 0.05 yanılma düzeyinde (α = 0.05) ve 0.90 güçte (β= 0.10), gruplara alınması gereken denek sayıları aşağıdaki gibi hesaplanır. Çözüm :
P=
(p1 + p2 ) 2
(0.40+0.60) = 0.50 veve 2
(α = 0.05) ve (β = 0.10) için standart normal değerler sırasıyla, (ikiyönlü) " ! = 1.96 ve (tek yönlü) " ! = 1.28 değerleri Tablo III ve IV’den alınır.
(% n=
$"
" 2 " P " (1 ! P ) +% # " p1 " (1 ! p1 )+ p2 " (1 ! p2 )
(1.96 " n=
)2
(p1 ! p2 )2 2 " 0.50 " (1 ! 0.50) + 1.28 " 0.40 " (1 ! 0.40)+ 0.60 " (1 ! 0.60)
(0.40 ! 0.60)2
Her bir grup için, n = 130 elde edilir.
100
)2
Bölüm 8
Ortalamaların Karşılaştırılması
Kuramsal örnekleme dağılımı ve taşıdığı özellikler bize, örneklemlere ilişkin hesapladığımız çeşitli ortalama ve oranlardan hareketle genellemelere ulaşma olanağını vermektedir. Bu genelleme işlemlerini iki ayrı başlık altında inceleyeceğiz : 1. Parametrelerin kestirimi (genelleme). 2. Varsayımların sınanması (hipotez testleri).
8.1. KESTİRİM Burada tikel’den tümel’e giden bir yaklaşımla anayığından seçilmiş bir örneğe ait ortalama veya orandan hareketle, anayığındaki adı geçen parametrelerin değeri kestirilmektedir. Aşağıda ortalamaya ilişkin genelleme işlemleri anlatılmaktadır. Oranlara ilşkin genelleme işlemleri, “oranların karşılaştırılması” bölümünde ayrıntılı olarak incelenecektir. 8.1.1. ORTALAMALARA İLİŞKİN KESTİRİM (GENELLEME) Bir örneklemde hesaplanan ortalama değerden hareketle, anayığın ortalaması kestirilirken, bir örnekten diğerine varolduğunu bildiğimiz değişkenlik hesaba katılarak, kestirim “güven aralığı” adı verilen belli bir aralık içinde yapılır. 101
Ortalamanın kuramsal örnekleme dağılımının normal eğriye uyduğunu, normal eğri altındaki toplam alanın % 95’ inin de ( ! = -1.96) ile ( ! = +1.96) sınırları arasında kaldığını bildiğimize göre, anayığın ortalaması olan ( µ )’nün, %95 olasılıkla içinde yer alacağı sınırları (güven aralığımızın sınırları) şöyle ifade edebiliriz. P(( x - 1.96·(
! ! )) ≤ µ ≤ ( x + 1.96·( ))) = 0.95 n n
Dolayısıyla, ( x - 1.96·(
! ! )) ve ( x + 1.96·( )) noktaları, anayığın n n
ortalamasının içinde yer aldığı % 95’lik güven aralığının alt ve üst sınırlarını belirler. Aradığımız anayığın ortalaması, % 95 olasılıkla ( x ± 1.96·(
! )) n
aralığının içinde yer alır. n < 30 ise, incelenen değişkenin anayığındaki dağılımının normal olması koşulu ile, güven aralığı aşağıdaki ifade ile belirlenir. ( x - t·(
s s )) ≤ µ ≤ ( x + t·( )) n n
Burada t, (n-1) serbestlik derecesi ve verilen güven düzeyine karşılık gelen Student't dağılımına ilişkin değerdir. 8.1.2. STUDENT (t) DAĞILIMI Standart normal eğriye benzeyen bu olasılık dağılımı ( Şekil 1 ) küçük örneklere ait ortalamaların dağılımını inceleyen William Sealey Gosset (Guinness bira fabrikasında çalışan Gosset, bu firmanın, çalışanlarına yayın yapma izni vermemesinden dolayı, bilimsel çalışmalarını “Student” takma adıyla yayınlamak zorunda kalmıştır) isimli bir İngiliz araştırmacı tarafından 1908’ de tanımlanmıştır.
102
Şekil 1. Serbestlik derecesi 1,2,5,10,20 ve 50 için Student’t dağılım eğrileri ve Standart Normal Dağılım eğrisi Gosset’ in gözlemlerine göre, örnek uzunluğu (n) kaça eşit olursa olsun, dağılımı normal eğriye uyan bir anayığına ait ortalamanın örnekleme dağılımı, anayığının standart sapması olan (σ)’nın değerinin bilinmesi durumunda, normal eğriye uyar. Bununla birlikte, (σ)’nın değerinin bilinmediği durumlarda, (σ)’yı kestirmek için örneğin standart sapması olan (s) kullanılmaktadır. Örneklemin yeterince büyük olduğu (n ≥ 30) durumlarda herhangi bir sorun yaratmayan bu yaklaşım “küçük” (n < 30) örneklerde uygun düşmemektedir. Gerçekten de, bu durumlarda, “kritik oran”’ın dağılımı, normal eğriye uymamaktadır. Ortaya çıkan bu dağılım Gosset tarafından (t) dağılımı olarak adlandırılmıştır. Kritik oran, t =
x!µ s n
( t )’nin dağılımı da, standart normal eğri ( ! ) gibi, ortalaması (0) olan simetrik bir eğridir; ne var ki, bu dağılımın standart sapması, ( (t) dağılımının standart sapması, (n) büyüdükçe, (1)’e yaklaşır.) “serbestlik derecesi” adı verilen bir parametreye bağımlıdır. Bu parametrenin tüm yönleriyle ayrıntılı 103
olarak ele alınarak açıklanması bu kitabın kapsamını aşacağından, burada serbestlik derecesinin yalnızca pratik kullanımda hesaplanması üzerinde duracağız. Uygulamada, tek bir örnekle çalışıldığında, s.d. (serbestlik derecesi) (n1) olacaktır. Serbestlik derecesi kavramına bir diğer yaklaşım ileride ki-kare bölümünde görülecektir. Student - t dağılımının çeşitli serbestlik dereceleri ve güven düzeylerine karşılık gelen değerleri Tablo IV’ de verilmektedir. Örnek 1. 6 - 11 yaş grubu 302 kız öğrencinin kan basıncı değerleri ölçülmüş ve aşağıdaki sonuçlar elde edilmiştir.
x = 107.3 mm-Hg, s = 8.7 mm-Hg, n = 302 Bu değerlere göre anayığın ortalaması µ ' nün güven aralığını, sırasıyla %95, %99 ve %99.9 güven düzeyleri için belirleyiniz. Çözüm : n = 302 >30 olduğundan güvenirlik aralıklarını aşağıdaki ifade ile hesaplayabiliriz. Anayığın varyansı bilinmediğinden, σ yerine s değerini kullanıyoruz. ( x - ! ·(
s s )) ≤ µ ≤ ( x + ! ·( )) n n
%95'e karşılık gelen standart normal değer 1.96, %99'a karşılık gelen değer 2.58 ve %99.9 için ε değeri 3.29'a eşittir (Tablo IV). %95 için; (107.3 - 1.96 ·
8.7 8.7 ≤ µ ≤ 107.3 + 1.96 · ) 302 302
106.32 ≤ µ ≤ 108.28 %99 için; ( 107.3 - 2.58 ·
8.7 8.7 ≤ µ ≤ 107.3 + 2.58 · ) 302 302
106.01 ≤ µ ≤ 108.59 104
8.7 8.7 ≤ µ ≤ 107.3 + 3.29 · ) 302 302
%99.9 için; ( 107.3 - 3.29 ·
105.65 ≤ µ ≤ 108.95 Örnek 2. Bir önceki örnekte elde edilen değerlerin ( x = 107.3, s = 8.7) 25 birimlik bir örneklemden elde edildiğini varsayarsak µ 'nün güven aralığını, sırasıyla, %95, %99 ve %99.9 güven düzeyleri için hesaplayınız. Çözüm : n = 25 < 30 olduğundan güvenirlik aralıklarını aşağıdaki ifade ile hesaplayabiliriz. ( x - t·(
s s )) ≤ µ ≤ ( x + t·( )) n n
s.d. = n - 1 = 25 - 1 = 24 ve %95 güven düzeyine karşılık gelen student't değeri (Tablo IV) 2.064, %99 için 2.797, %99.9 için 3.745'dir. %95 için; (107.3 - 2.064 !
8.7 8.7 ! µ ! 107.3 + 2.064 ! ) 25 25
103.71 ! µ ! 110.89 %99 için; (107.3 - 2.797 !
8.7 8.7 ! µ ! 107.3 + 2.797 ! ) 25 25
102.43 ! µ ! 112.17 %99.9 için; (107.3 - 3.745 !
8.7 8.7 ! µ ! 107.3 + 3.745 ! ) 25 25
100.78 ! µ ! 113.82
105
8.2. VARSAYIMLARIN KURULMASI VE SINANMASI (HİPOTEZ TESTLERİ) Varsayım, olaylar arasında ilişkiler kurmak, ya da olayları belli nedenlere bağlamak üzere tasarlanan ve geçerli sayılan bir önermedir. Biyoistatistik bağlamında bir varsayımın, örneklemlerde elde edilen istatistik değerler ve anayığındaki parametreler konusunda tasarlanan bir önerme olduğu söylenebilir. Biyoistatistikte; varsayım testlerine, farklı örneklemlere ilişkin istatistik ölçülerin, kendi aralarında, ya da bunlarla anayığın parametrelerinin karşılaştırılması amacıyla başvurulur. Varsayımların kurulmasına ilişkin işlemleri, örneklem ortalaması ile anayığın ortalamasının karşılaştırılmasına yönelik olarak, aşağıdaki gibi açıklayabiliriz. Hipotez testlerinin daha kolay anlaşılabilmesi için parametrelere ait simgelerin yerine istatistiklere ait simgeler kullanıldı.
8.2.1. ÖRNEKLEM ORTALAMASI İLE ANAYIĞIN ORTALAMASININ KARŞILAŞTIRILMASI 8.2.1.1. VARSAYIMLARIN (HİPOTEZLERİN) KURULMASI Karşılaştırmalara yönelik araştırmalarda, H o ve H1 ile simgelenen iki ayrı varsayımın önerilmesi söz konusudur: a) Sıfır varsayımı (farksızlık varsayımı) ( H o ) Bu varsayım, karşılaştırmak istediğimiz değerler arasındaki farkın aslında (0) olduğunu, uygulamada sıfırdan farklıysa, bu farkın yalnızca rastlantısal olduğunu ileri sürer. Örneğin, bir anayığın ortalamasıyla ( µ ) bir örneklem ortalamasını ( x ) karşılaştırmak istediğimizi düşünelim: Bu durumda,
H 0 : x = µ ya da
H0 : | x ! µ | = 0
biçiminde ifade edilir. Burada ilginç bir nokta, araştırmacıların sıfır varsayımlarını, genellikle, reddedebilecekleri beklentisiyle kurmalarıdır. 106
Araştırma sürecinde H o ’ın reddedilmesi, ( H1 ) simgesiyle gösterilen alternatif varsayımın kabulü anlamına gelecektir. b) Alternatif varsayım ( H1 )
H1 : x ! µ ya da
H1 : | x ! µ | ! 0 olarak ifade edilir.
Varsayımın sınanması sonucunda, araştırmacı H o ’ı ya doğru bularak karşılaştırılan iki değer arasında gerçek bir fark olmadığını kabul edecek, ya da H o ’ı reddederek incelenen değerler arasındaki farkın salt rastlantısal olmayacak derecede büyük olduğunu ileri sürecektir. H1 sıfır varsayımını kabul etmeyen bir varsayımdır. Sıfır varsayımının reddi, H1 ’in kabulü anlamına gelmekle birlikte, H 0 ’ın reddedilmemesi, “kabul edilmesi” anlamına gelmez. Gerçekten de, ( H 0 )’ın reddini sağlayacak daha iyi düzenlenmiş bir araştırmanın yapılmasının her zaman olanaklı olduğu söylenebilir. Konu biraz daha yakından incelendiğinde, H 0 ’ın sınanmasının aslında iki değil, dört sonuçtan birini doğuracağı görülür. Aşağıdaki şemadan da açıkça anlaşılacağı gibi araştırmacı bu durumlardan ikisinde doğru, diğer ikisindeyse yanlış bir sonuca ulaşmış olacaktır (Tablo 1).
Tablo 1. Varsayım sınamanın olası sonuçları Varsayım testinin sonuçları
Gerçek durum Fark var Fark yok
Fark var, H 0 red
Doğru sonuç
1. tür hata
Fark yok, H 0 kabul
2. tür hata
Doğru sonuç
107
Belli bir sıfır varsayımını sınayan araştırmacının düşebileceği, “1. ve 2. tür hatalar” olarak adlandırılan yanılgıların, gerek rastlantısal anlamı, gerekse yol açabileceği bilimsel ve pratik sonuçlar birbirinden farklıdır. Konuyu bir örnekle somutlaştırmaya çalışalım: Belli bir kanser türünde kullanılmakta olan standart ilaç tedavisinde, hastaların ortalama sağkalım süresinin ( µ ) 5.1 yıl olduğunu, buna karşılık bu kanser türüne yakalanmış hastalardan oluşan bir örneklem grubuna uygulanan yeni bir ilaç tedavisinde ortalama sağkalım süresinin ( x ) 6.8 yıl olarak hesaplandığını düşünelim. Burada,
H 0 : | 6.8 - 5.1 | = 0 olarak ifade edilen sıfır varsayımının, aslında doğru olduğunda reddedilmesi, hastaların gereksiz yere denenmiş bir tedaviden ayrılarak yeni bir tedavinin etkilemine sokulmaları sonucunu doğurabilir. Öte yanda, aslında yanlış olan bir sıfır varsayımının reddedilmemesi (2. tür hata) hastaların yaşam sürelerini uzatacak olan bir tedaviden yoksun bırakılmalarına yol açacaktır. 1. tür hatanın olasılığı ( α ), 2. tür hatanın olasılığıysa, (β ) simgesiyle gösterilir. Varsayım sınamasında bir diğer önemli tanım, “güç” kavramıdır. Güç, doğru olmayan bir sıfır varsayımını red ( ya da doğru olan alternatif varsayımı kabul) olasılığıdır. Diğer bir anlatımla, bir testin gücü, gerçekte var olan bir farkı yakalayabilme yetisini ifade eder. Güç, ( 1- β) olarak hesaplanır. İşlenen konu ve kavramlarla tanı testleri bölümünde gördüğümüz duyarlılık ve seçicilik kavramları arasında kurulacak bir koşutlukla daha iyi anlaşılabilir. Anlamlı olmayan bir farkı var gösteren 1. tür hatayla, sağlam kişiye hasta tanısı koyan bir yanlış pozitif test arasında olduğu gibi, anlamlı bir farkı yok sayan 2. tür hatayla, aslında var olan bir hastalığı yakalayamayan yanlış - negatif test arasında da benzerlik vardır. Öte yandan, bir istatistik testin gücü de tanı testinin var olan bir hastalığı yakalama olasılığı olan duyarlılığına benzetilebilir. Gerek sıfır varsayımı, gerekse alternatif varsayım, yukarda verildiği biçimde ifade edildiğinde, farkları değerlendirecek test iki yönlü kurulacak 108
demektir. Diğer bir deyişle, ( x ) ve ( µ ) arasındaki farkın eksi ya da artı yönde, yeterince büyük olması, sıfır varsayımını reddetmek için yeterlidir. Varsayımın sınanmasında kullanılan testin tek yönlü olarak değerlendirilmesindeyse H 0 ve H1 aşağıdaki gibi kullanılr.
H0 : x = µ
; H1 : x > µ
veya
H0 : x = µ
; H1 : x < µ
Kolayca görüleceği gibi, kullanılan testin tek mi ya da iki yönlü mü olduğunu alternatif varsayım gösterir. Sağlık bilimlerinde yapılan araştırmalarda sık sık beklenmedik (önceden kestirilemeyen) ters tepkilerin ortaya çıkması olası olduğundan, bu araştırmalarda, testler genellikle iki yönlü olarak değerlendirilir. 8.2.1.2. VARSAYIM SINAMASINDA KULLANILACAK TESTİN SEÇİMİ Bir örneklem ortalamasıyla, anayığın ortalaması arasındaki farkın sınanmasında, n ≥ 30 ise ve anayığın standart sapması biliniyorsa,
"=
|x#µ| formülü kullanılır. ! n
( ! )‘nın değerinin bilinmediği durumlarda, normal eğri yerine Student-t dağılımını kullanmak daha uygun olur.
t=
|x!µ| ifadesi, (n - 1)’ e eşit serbestlik derecesinde kullanılır. s n
109
8.2.1.3. GÜVEN DÜZEYİNİN SEÇİMİ İstatistik testin uygulanmasından önce seçilen, ve aslında geçerli olan bir sıfır varsayımının yanlışlıkla reddedilme olasılığını ölçen güven düzeyi ( ! ) ile gösterilir. Ulaşılacak sonuçların geçerli olabilmesi için, ( ! )’nın olabildiğince küçük olması gerektiğine kuşku yoktur. Bu konuda, yaygın bir kabule uyarak, ( ! ) için (0.05), (0.01), ya da (0.001) değerleri kullanılır. Yayınlanan bilimsel çalışmalarda sürekli olarak verilen (p) değerine gelince, bu değer, sıfır varsayımının doğru olması durumunda, gözlenen farka eşit, ya da ondan daha büyük bir farkın doğmasının, diğer bir deyişle, gözlenen farkın salt rastlantısal değerlere bağlı olmasının olasılığını verir. (p) değeri teste ilişkin tüm işlemler tamamlandıktan sonra hesaplanır; ve eğer p < ! ise, ( H o ) reddedilir. Varsayımlarımızın tek yönlü olarak kurulması durumunda, hesaplanan (p) değeri ikiye bölünerek yorumlanır. Bilindiği gibi; her test istatistiğinin belli bir dağılımı vardır. Bu dağılımın alanı, varsayımın kabul ve red bölgelerinden oluşur. Aşağıda verilen Şekil 2‘den, standart normal dağılımın ! = 0.05 için kabul ve red alanları izlenebilir.
Şekil 2 Testin iki yönlü kullanımı. 110
Şekil 3. Testin tek yönlü kullanımı (daha büyük değerlere doğru).
Şekil 4. Testin tek yönlü kullanımı (daha küçük değerlere doğru). 111
Örnek 3. Bir toplumda menarş yaşının 13 olduğu bilinmektedir. 872 kişide gerçekleştirilen bir anket çalışması sonucunda menarş yaşı ortalamasının 12.875 ve standart sapmasının ise 1.012 yıl olduğu tespit edilmiştir. Elde edilen örneklem ortalaması ile anayığın ortalaması arasındaki farkın anlamlı olup olmadığını sınayınız. Çözüm: Başlangıç (sıfır) ve alternatif hipotezlerimiz aşağıdaki gibidir.
H0 : x = µ
H1 : x ! µ n = 872 > 30 olduğundan ! testini kullanabiliriz.
!=
12.875 ! 13 |x"µ| = = 3.64 s 1.012 n 872
Hesapladığımız ! = 3.64 değeri 1.96'dan büyük olduğundan, yani hesaplanan standart normal değer red bölgesine girdiğinden (Şekil 2.) örneklem ortalaması ile anayığın ortalaması arasındaki farkın istatistiksel olarak anlamlı olduğuna, daha ayrıntılı bir incelemeyle, ! = 3.64>3.29 olduğundan farkın çok ileri derecede anlamlı olduğuna karar veririz ( diğer bir ifade ile H1 hipotezi kabul edilir).
8.2.2. İKİ ÖRNEKLEM ORTALAMASININ KARŞILAŞTIRILMASI Birbirinden ayrı ve bağımsız iki örneklem grubunda yapılmış gözlemlerin ortalamalarını karşılaştırmak istediğimiz durumlarda, sıfır varsayımı ve alternatif varsayım aşağıdaki gibi kurulur.
H 0 : x1 = x 2
veya
H 0 : x1 ! x 2 = 0
H1 : x1 ! x 2
veya
H1 : x1 " x 2 ! 0
112
İki ortalama arasındaki farkın istatistiksel olarak anlamlı sayılacak kadar büyük olup olmadığına, eğer, n1 ≥ 30 ve n2 ≥ 30 ise,
(=
x1 ' x 2 & s12 s2 2 # $ ! $n + n ! 1 2 % "
ifadesini kullanarak karar veririz. Eğer n1 ve n2 ’den biri veya her ikisi < 30 ise, normal dağılım yerine,
t=
x1 ' x 2 & s2 s2 # $$ + !! % n1 n2 "
; s.d.= n1 + n2 -2
ifadesi kullanılır. Burada s 2 değeri iki örneklem grubuna ilişkin ortak varyanstır ve bu değeri aşağıdaki ifade ile hesaplarız. 2
s2 =
(n1 ! 1) " s1 + (n2 ! 1) " s2 (n1 + n2 ! 2)
2
(t) testinden iki bağımsız örneklem grubuna ait ortalamalar arasındaki farkı değerlendirmede yararlanabilmek için bazı koşulların varlığı aranır. (t) testinin kullanılabilmesi için, (a) her iki örneklem grubunda dağılımın normal eğriye uyması, (b) varyansların ya da standart sapmaların eşit olması, (c) incelenen iki gruptaki gözlemlerin birbirinden bağımsız olması gerekir. 113
(b) koşulunun gerekçesini, iki örneklem ortalamasının aslında eşit olduğunu, diğer bir anlatımla, iki örneklemin de aynı ana yığından alınmış olduğunu ifade eden sıfır varsayımında aramak gerekir. Bununla birlikte, (t) testi üzerinde yapılmış olan matematiksel incelemeler, iki örneklem grubundaki gözlem sayısının eşit olması durumunda varyansların eşitliği koşulundan vazgeçilebileceğini göstermiştir. n1 ≠ n2 olduğu durumlarda, (t) testini kullanmadan önce iki grubun varyanslarının eşit olup olmadığı sınanmalıdır. Bu amaçla, ilerde göreceğimiz (F) testi kullanılır. (c)’de dile getirilen “bağımsızlık” koşuluna gelince, bu koşul örneklemlerden birinde yer alan gözlemlerin değerlerinin ikinci örneklemdeki değerler konusunda herhangi bir bilgi vermemesi anlamına gelir. Bağımsızlığı belli bir istatistik testle sınamak olanağı olmadığından bu koşulun, araştırmanın tasarlanması ve yürütülmesi sırasında sağlanması gerekir. Yukarıda formülü verilen ortak varyans, karşılaştırılan iki örnek varyansının ağırlıklı ortalamasından ibarettir. İki bağımsız örneklem ortalaması arasındaki farkın değerlendirilmesinde, (t) testinin ön koşullarından biri ya da birkaçının var olmaması durumunda, ileride göreceğimiz parametresiz testlerden biri kullanılmalıdır. 8.2.2.1. VARYANSLARIN EŞİTLİĞİNİN SINANMASI (F) TESTİ Bu test, eşitlikleri sınanmak istenen iki varyansın birbirine olan oranının, kuramsal (F) dağılımındaki ilgili kritik değerle karşılaştırılması yoluyla uygulanır. Payda iki varyanstan daha büyük olanın yer aldığı (F) oranının Tablo Va’da verilen kritik değerden (Tablo Va’da ! = 0.05 , ve (n1 -1), (n2 -1) serbestlik derecelerine karşılık gelen değer) yüksek çıkması, varyansların eşitliği varsayımının reddine yol açar. Demek ki burada,
H 0 : !1 = ! 2
2
2
H1 : ! 21 " ! 2
2
114
2
olarak ifade edilmekte, ve F =
s1 formülüyle hesaplanmakta bulunan (F) 2 s2
değeri, (n1 -1) ve (n2 -1) serbestlik derecelerinde yorumlanmaktadır. Örnek 4. Standart sapmanın, 20 kişiden oluşan kontrol grubunda 13 ve 10 kişiden oluşan deney grubunda 11 olarak ölçüldüğünü varsayalım. Gruplardaki varyanslar istatistiksel olarak birbirinden anlamlı derecede farklı mıdır? Çözüm : Varyansların eşitliğinin sınanmasına ilişkin hipotezlerimizi aşağıdaki gibi ifade ederiz.
H 0 : !1 = ! 2
2
2
H1 : ! 21 " ! 2
2
2
Hipotezleri sınamak için, F =
132 s1 = = 2.95 oranı hesaplanır. 2 112 s2
Hesaplanan F=1.40 değeri, α=0.05, (n1-1)=(20-1)=19 ve (n2-1)=(101)=9 serbestlik derecelerine karşılık gelen kritik F = 2.95 değerinden (Tablo V a.) küçük olduğundan H 0 hipotezini kabul ederiz. Diğer bir ifadeyle grup varyanslarının eşit olduğunu veya varyanslar arasındaki farkın rastlantısal olduğunu söyleyebiliriz. Örnek 5. Ülkemizde 18 - 30 yaş grubu 189 denekte yapılan bir araştırmada günlük ortalama uyku süresinin 7.28 saat ve standart sapmasının ise 1.38 saat olduğu tespit edilmiştir. Diğer bir ülkede, aynı yaş grubunda 120 denekte yapılan bir araştırmada günlük ortalama uyku süresi 7.05 saat ve standart sapma 0.50 saat bulunmuştur. Elde edilen bu iki ortalama birbirinden istatistiksel olarak anlamlı derecede farklı mıdır? Çözüm : n1 = 189, n2 = 120,
x1 = 7.28, s1 = 1.38 x 2 = 7.05, s2 = 0.50 115
Hipotezler:
H 0 : x1 = x 2
H1 : x1 ! x 2 n1 = 189 ve n2 = 120 > 30 olduğundan hipotezlerimizi sınamak için ( ! ) epsilon testini kullanacağız.
(=
x1 ' x 2 & s12 s2 2 # $ ! $n + n ! 2 " % 1
=
7.28 ' 7.05 & 1.382 0.50 2 # $$ ! + 120 !" % 189
= 2.09
Hesaplanan ! değeri ( 2.09 ), 0.05 anlam düzeyine karşılık gelen standart normal değerden ( 1.96 ) büyük olduğundan iki ortalama arasındaki fark istatistiksel olarak anlamlıdır ( p < 0.05 , H1 kabul). Örnek 6. 20 kız öğrencide yapılan bir araştırmada sistolik kan basıncı (SKB) değeri 108 mm-Hg, standart sapma 7.5 mm-Hg bulunmuştur. Yine, aynı yaş grubunda 25 erkek öğrencide yapılan araştırmada ortalama 105 mm-Hg ve standart sapma 6 mm-Hg bulunmuştur. Söz konusu yaş grubu kız ve erkeklerde SKB değerlerinin aynı olduğunu söyleyebilir miyiz ( iki ortalama arasındaki fark istatistiksel olarak anlamlı mıdır)? Çözüm : n1 = 20, n2 = 25,
x1 = 108, s1 = 7.5 x 2 = 105, s2 = 6
Hipotezler:
H 0 : x1 = x 2
H1 : x1 ! x 2 n1 = 20 ve n2 = 25 < 30 olduğundan hiptezlerin sınanmasında Student't testini kullanacağız. 116
t=
x1 ' x 2 & s2 s2 # $$ + !! % n1 n2 "
; s.d.= n1 + n2 -2
Ortak varyans aşağıdaki gibi hesaplanır.
2
s2 =
(n1 ! 1) " s1 + (n2 ! 1) " s2 (n1 + n2 ! 2)
2
(20 ! 1) " (7.52 ) + (25 ! 1) " (6 2 ) s = =44.95 (20 + 25 ! 2) 2
t=
108 ' 105 & 44.95 44.95 # + $ ! 25 " % 20
=
3 = 1.49 2.0113
(Serbestlik derecesi) s.d. = 20 + 25 - 2 = 43 Hesaplanan t değeri (1.49), p = 0.05 ve s.d. = 43'e karşılık gelen kuramsal student't değerinden (2.02) küçük olduğundan, iki ortalama arasındaki farkın istatistiksel olarak anlamlı olmadığına karar veririz ( p > 0.05, H0 kabul). Serbestlik derecesi 30 'dan büyük olan değerlerde Student't dağılımı ile Standart Normal Dağılım uygunluk göstermektedir (Tablo III veTablo IV ).
8.2.3. EŞLENDİRİLMİŞ SERİLERDE FARKIN ANLAMLILIĞININ SINANMASI Yukarıda, ortalamaları karşılaştırılan iki örneklem grubunun birbirinden tümüyle bağımsız oldukları durumlarda yapılacak işlemleri gözden geçirdik. İki gruptaki gözlemlerin birbirinden bağımsız olmadığı durumlarda “eşlenmiş” 117
örneklem gruplarından söz edilir. Burada, tek bir örneklem grubu üzerinde iki kez gözlem yapılır. Genellikle, örneklemlerden biri etkisi ölçülmek istenen bir tedavi (ya da bir müdahele) öncesi yapılan gözlem sonuçlarından, ikincisi ise, söz konusu müdahele sonrasına ait sonuçlardan oluşur. Eşlendirilmiş seriler, “önce” ve “sonra” serileri olarak da adlandırılır. Aynı denekte ikiden çok gözlemin yapıldığı denemelerin incelendiği tekrarlı ölçümlerde varyans analizi konusu, kitabın kapsamı dışında tutulmuştur. Bu türden bir araştırma tasarımı, özellikle, bireysel değişkenliğin çok yüksek olabildiği biyolojik özelliklerin ele alındığı tıp araştırmalarının gereklerine uygun düşmektedir. Gerçekten de, bu durumlarda bazen, aynı grup içinde yer alan bireyler arasındaki farklar, iki grup arasındaki ortalama farkı çok aşabilmektedir. Hipotezlerimiz,
H0 : x = 0
H1 : x ! 0 şeklinde yazılır. Burada, x , farklar serisinin aritmetik ortalamasıdır. (Eşlenmiş çiftler serisinde) n ≥ 30 ise,
!=
x ifadesi ile s n
n < 30 ise,
t=
x s n
; s.d. = n -1 ifadesi ile,
hangi hipotezin kabul edileceğine karar verilir. Gerek normal dağılımın, gerekse (t) dağılımının eşlenmiş gruplarda kullanımı da gözlemlerin dağılımının normal olması koşuluyla geçerlidir.
118
Örnek 7. Aşağıda 20 kişide, Pazartesi-Cuma ve Cumartesi-Pazar günlerine ilişkin günlük ortalama uyku süreleri verilmiştir (Tablo 2). PazartesiCuma ve Cumartesi-Pazar günlük ortalama uyku süreleri arasındaki farkın istatistiksel olarak anlamlı olup olmadığını sınayınız. Tablo 2. Deneklere İlişkin Ortalama Uyku Süreleri Denek no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Pazartesi-Cuma 7.10 6.50 7.40 8.00 6.95 7.10 7.13 7.55 8.90 7.00 7.00 8.40 7.10 6.95 7.10 7.30 8.00 5.30 6.10 7.40
Cumartesi-Pazar 7.40 7.00 7.80 9.10 7.30 7.00 8.05 7.50 8.30 7.15 7.90 8.30 7.85 8.10 7.30 7.90 8.00 6.00 6.40 8.20
Fark (xi) 0.30 0.50 0.40 1.10 0.35 -0.10 0.92 -0.05 -0.60 0.15 0.90 -0.10 0.75 1.15 0.20 0.60 0.00 0.70 0.30 0.80
Çözüm : Burada, bir denekte elde edilen iki ayrı zamana ilişkin ölçüm değerlerinin karşılaştırılması söz konusudur. n=20 < 30 olduğundan aradaki farkın anlamlı olup olmadığını eşlendirilmiş serilerde Student't testi ile sınayacağız. İki ölçüm arasındaki fark serisinde aritmetik ortalama 0.4135 ve standart sapma 0.4576 olarak hesaplanır. Hipotezler:
H0 : x = 0 119
H1 : x ! 0 t değeri ve serbestlik derecesi,
t=
0.3935 x = 0.4532 s 20 n
= 4.04 ; s.d. = n - 1 = 20 - 1 = 19
olarak hesaplanır. Hesaplanan t değeri (4.04), s.d.=19 ve p = 0.05 anlam düzeyine karşılık gelen kuramsal Student' t değerinden (kritik değer) (2.093, Tablo IV )büyük olduğundan H1 hipotezini kabul ederiz. Yani, Pazartesi-Cuma ile CumartesiPazar günlerine karşılık gelen ortalama uyku süreleri arasındaki fark (0.4135 saat ) istatistiksel olarak anlamlıdır.
120
Bölüm 9
Oranların Karşılaştırılması
9.1.
ORANLARA İLİŞKİN GENELLEME
n·P ve n·Q'nun 5'den büyük olması örneklemin yeteri kadar büyük olduğunu gösterir. Oranlara ilişkin kuramsal örnekleme dağılımının özellikleri dikkate alındığında, n·P ve n·Q ≥ 5 ise, anayığına ilişkin P' nin güven aralığı aşağıdaki ifade ile belirlenir.
p0 " # !
po ! qo ! P ! p0 + " ! n
po ! qo n
Burada, p o : incelenen değişkenin (özelliğin, “başarı” sonucunun) örneklem içindeki oranı, q o : 1 - p o değerini temsil etmektedir. Eğer n·P ve n·Q 'dan biri 5'den küçük ise P' nin çeşitli güven düzeylerine karşılık gelen güven sınırları Tablo VII ve Tablo VIII' de verilmektedir. Örnek 1. 100000 birimli bir anayığından çekilen 350 birimlik basit rastlantılı bir örneklemde aranılan özelliğin oranı p o =0.65 olarak bulunmuştur. Anayığına ilişkin P oranının güven aralığını 0.01 yanılma (anlam) düzeyinde belirleyiniz. 121
Çözüm : 0.01 yanılma düzeyine karşılık gelen standart normal değer 2.58'dir. P' nin tahmin değeri olarak 0.65 değerini alırsak 350 x 0.65 , ve 350 x 0.35 > 5 olduğundan örneklemimiz yeteri kadar büyüktür. Anayığının yeterince büyük olduğunu varsayarsak, güven aralığını aşağıdaki ifade ile hesaplarız.
p0 " # !
po ! qo ! P ! p0 + " ! n
0.65 ± (2.58) !
po ! qo n
(0.65) ! (0.35) 350
0.65 ± (2.58)·(0.0255) 0.5842 < P < 0.7158
9.2. ÖRNEKLEM ORANI İLE ANAYIĞIN ORANININ KARŞILAŞTIRILMASI Hipotezlerimizi aşağıdaki gibi kurarız.
H 0 : po = P H1 : po ! P veya,
H 0 :| po ! P |= 0 (fark rastlantısal ) H1 :| po " P |! 0 (fark istatistiksel olarak anlamlı, rastlantısal nedenlerin yanında, farkı ortaya çıkaran belirli bir neden var). Ho hipotezi örneklemin P oranına sahip bir anayığından çekildiğini, H1 ise örneklemin P'den farklı bir değere sahip bir anayığından çekildiğini gösterir. n·P ve n·Q ≥ 5 ise,
122
#=
| po " P | P !Q n
ifadesi ile, kabul edilen anlam düzeyine göre H 0 veya H1 hipotezlerinden birini kabul ederiz. Anlam düzeyini 0.05 kabul edersek, ! ≥1.96 ise H1 , ! < 1.96 ise H 0 hipotezini kabul ederiz. Örnek 2. Yeni bir ilacın bir çeşit alerjiyi iyileştirmede 0.60 etkili olduğu ileri sürülmektedir. İlaç, alerjisi olan 100 kişilik bir hasta grubuna verilmiş ve uygulama sonucunda 55 kişinin iyileşmiş olduğu görülmüştür. İddia edildiği gibi, ilacın 0.60 etkili olduğunu söyleyebilir miyiz? Çözüm : 100 kişilik örneklemde aranılan özelliğin oranı (iyileşenlerin oranı)
p0 =
55 = 0.55 100
(P = 0.60) değerini anayığın oranı olarak kabul edersek, |0.60-0.55|=0.05 farkının istatistiksel olarak anlamlı olup olmadığını,diğer bir ifade ile 100 kişilik örneklemin P=0.60 oranına sahip bir anayığından alınıp alınmadığını sınamak istiyoruz. 100 x 0.60 ve 100 x 0.40 > 5 olduğundan örneklemimiz yeteri kadar büyük kabul edilir. Hipotezlerimiz ve sınama işlemlerimiz aşağıdaki gibidir.
H 0 : po = P H1 : po ! P #=
| 0.55 " 0.60 | | po " P | = = 1.02 (0.60) ! (0.40) P !Q n 100
Hesapladığımız ! değeri 1.96'dan küçük olduğundan H 0 hipotezini kabul ederiz (p>0.05). 123
9.3.
İKİ ÖRNEKLEM ORANININ KARŞILAŞTIRILMASI
Burada, birbirinden bağımsız, n1 ve n2 büyüklüğüne sahip iki örnekleme (kontrol ve deney gruplarında) ait ‘başarı’ oranlarının karşılaştırılması amaçlanır. Gruplara ait başarı oranları aşağıdaki gibi hesaplanır.
p1 =
d d1 , p2 = 2 , n1 n2
d1 ve d2, sırasıyla, n1 ve n2 uzunluklu örneklemlerde, incelenen değişkende aranılan özelliği gerçekleyen denek sayılarını (“başarı sayılarını”) göstermektedir. Hipotezlerimiz aşağıdaki gibidir.
H 0 : Karşılaştırılan iki örneklem oranı arasındaki fark rastlantısaldır. Her iki örneklem aynı orana sahip anayığından çekilmiştir. H1 : İki örneklem oranı arasındaki fark istatistiksel olarak anlamlıdır. Söz konusu fark rastlantısal nedenlerin yanında belirli bir nedenden ileri gelmektedir. Örneklemler, farklı oranlara sahip farklı anayığınlardan çekilmiştir. Simgesel olarak gösterecek olursak, hipotezlerimizi aşağıdaki gibi ifade edebiliriz.
H 0 : p1 = p2 (veya, H 0 :| p1 ! p2 |= 0 )
H1 : p1 ! p2 ( veya, H1 :| p1 " p2 |! 0 ).
P=
d1 + d 2 ifadesi ile anayığına ilişkin oran tahmin edilir. n1 + n2
n1·P, n1·Q, n2·P ve n2·Q ≥ 5 ise hipotezlerimizi aşağıdaki ifade ile sınarız.
124
#=
| p1 " p2 | P !Q P !Q + n1 n2
0.05 yanılma düzeyinde ! ≥1.96 ise H1, ! <1.96 ise, Ho hipotezini kabul ederiz. Hipotezlerin sınanmasında, daha ileride incelenecek olan, ki-kare ( ! 2 ) testleri de kullanılmaktadır. Örnek 3. Yeni bir ilaç (etkin madde, yeni tedavi yöntemi) 450 hastalık bir gruba (deney grubu) uygulanmış ve 45 hastada yan etki (istenmeyen etki) görülmüştür. 700 kişilik kontrol grubunda (plasebo grubu) ise, 60 hastada yan etki görülmüştür. Her iki grupta yan etki görülme oranlarının aynı seviyede olduğunu söyleyebilir miyiz? Çözüm : Deney grubu, n1 = 450 , (yan etki görülen hasta sayısı) d1 = 45 Kontrol grubu, n2 = 700 , (yan etki görülen hasta sayısı) d 2 = 60 Hipotezlerimizi aşağıdaki gibi oluştururuz.
H 0 : p1 = p2
H1 : p1 ! p2
p1 =
d 60 45 d1 = = 0.10 , p2 = 2 = = 0.0857 n1 450 n2 700
P=
d1 + d 2 45 + 60 = = 0.0913 n1 + n2 450 + 700
Q = 1 - P= 1 - 0.0913 = 0.9087 değerleri hesaplanır.
125
450 x 0.0913, 450 x 0.9087, 700 x 0.0913 ve 700 x 0.9087 > 5 olduğundan örneklemlerin yeteri kadar büyük olduğunu kabul ederiz. Hipotezlerimizi aşağıdaki ifade ile sınarız. #=
| p1 " p2 | = P !Q P !Q + n1 n2
| 0.10 " 0.0857 | = =0.0.8217 7921 (0.0913) ! (0.9087) (0.0913) ! (0.9087) + 400 700 450
0.8217<1.96 olduğundan H 0 hipotezini kabul ederiz (p>0.05). İki grupta yan etki oranlarının aynı olduğunu, aradaki farkın rastlantısal nedenlerden kaynaklandığını söyleyebiliriz.
126
Bölüm 10
Ki-Kare Testlerinin Kullanılması
İki ya da daha çok bağımsız grupta nitel değişkenlerin (sınıflayıcı ve sıralayıcı ölçüm düzeyinde incelenen değişkenler) karşılaştırılmasında, iki nitel değişken arasındaki ilişkinin anlamlılığının sınanmasında ve deneysel bir dağılımın kuramsal bir dağılıma uygunluğunun sınanmasında ki-kare (Chi- square, χ 2 ) testleri kullanılır.
10.1. İKİ VEYA DAHA ÇOK BAĞIMSIZ GRUPTA, NİTEL DEĞİŞKENLERİN KARŞILAŞTIRILMASI Testin daha kolay anlaşılabilmesi için iki sonucu olan nitel bir değişkeni birbirinden bağımsız iki ayrı grupta (deney ve kontrol grubu) incelediğimizi ve iki grupta elde edilen sonuçları karşılaştırmak istediğimizi düşünelim. Gözlem sonuçlarını 2 x 2 tablosunda aşağıdaki gibi sunabiliriz. Tablo 1. Deney ve kontrol grubunda elde edilen gözlem sonuçları. Gruplar Deney grubu Kontrol grubu Toplam
X nitel değişkeni sonucu (+) (-) a b c d a+c b+d
127
Toplam a+b c+d a+b+c+d
Hipotezlerimizi aşağıdaki gibi oluştururuz.
H 0 : Birbirinden bağımsız iki gruptan elde edilen x değişkenine ilişkin sonuçlar arasında bir fark yoktur. İki grup x değişkeni açısından homojendir. İki grup arasındaki fark rastlantısaldır.
H1 : İki gruba ilişkin sonuçlar arasındaki fark istatistiksel olarak anlamlıdır. İki grup, x değişkeni açısından homojen değildir. Eğer H 0 hipotezinin doğru olduğunu kabul edersek, yani x' in (+) olması her iki grupta aynı oranda ise, a, b, c, d gözlemsel sıklıklarına karşılık gelen a´, b´, c´, d´ kuramsal sıklıkları aşağıdaki gibi hesaplarız. (a+b+c+d) kişiden rastgele seçilen bir kişinin (deneğin) deney grubundan olması olasılığı (a+b)/(a+b+c+d) değerine ve yine (a+b+c+d) kişiden rastgele seçilen bir kişide x değişkenin (+) olması olasılığı (a+c)/(a+b+c+d) değerine eşittir. H 0 hipotezi gerçekte doğru ise (a+b+c+d) kişiden rastgele seçilen bir kişinin hem deney grubundan olması hem de x' in sonucunun (+) olması olasılığı
( a + b) (a + c) ⋅ (a + b + c + d ) (a + b + c + d )
değerine eşittir.
(a+b+c+d) kişide bu özelliğe (seçilen kişinin hem deney grubundan olması hem de x'in (+) olması) sahip olanların sayısının (kuramsal sıklık)
a' =
( a + b) (a + c) ⋅ ⋅ (a + b + c + d ) (a + b + c + d ) (a + b + c + d )
a' =
( a + b) ⋅ ( a + c ) (a + b + c + d )
değerine eşit olması beklenir. Pratik olarak a´ kuramsal sıklık değeri a'ya ait kenar toplamlarının çarpımının ana toplama bölünmesiyle elde edilir. Benzer şekilde b´, c´ ve d´ sıklıklarını aşağıdaki gibi hesaplarız.
128
b' =
(a + b) ⋅ (b + d ) (c + d ) ⋅ ( a + c ) (c + d ) ⋅ (b + d ) , c' = ve d ' = (a + b + c + d ) (a + b + c + d ) (a + b + c + d )
a ' , b ' , c ' ve d ' kuramsal sıklıkları 5'den büyük ise hipotezlerimizi aşağıda verilen, ki - kare testi ile sınarız.
χ2 =
(a − a ' ) 2 (b − b ' ) 2 (c − c ' ) 2 (d − d ' ) 2 + + + a' b' c' d'
veya kısaca,
χ2 =
(a ⋅ d − b ⋅ c) 2 ⋅ (a + b + c + d ) (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d )
Hesapladığımız ki - kare değeri (s-1) x (c-1) serbestlik derecesi ve kabul edilen anlam düzeyine ( α ) karşılık gelen kuramsal ki - kare değerinden büyük ise H1 hipotezini, küçükse H 0 hipotezini kabul ederiz. İncelediğimiz örnekte (satır sayısı) s=2 ve (kolon sayısı) c=2 olduğundan (serbestlik derecesi) s.d.=(2-1)·(2-1) =1 değerine eşittir. Karşılaştırılan grup sayısı 2'den çok ve/veya x nitel değişkeninin aldığı değerler 2'den çok ise, yani s x c tablosunun incelenmesi söz konusu ise ki - kare ifadesini aşağıdaki şekilde yazarız. 2
s
c
χ = ∑∑ i =1 j =1
'
( f ij − f ij ) 2 f ij
'
Burada, (serbestlik derecesi) s.d. = (s - 1) x (c - 1),
f ij : i. satır ve j. kolondaki gözlemsel sıklık değeri ' f ij :i. satır ve j. kolondaki kuramsal sıklık değeridir
s.d. ≥ 2 olduğunda, beklenen sıklıkları 5'den küçük olan hücre sayısı, toplam hücre sayısının % 20 'sinden az ve beklenen sıklıklar 1'den büyük ise hipotezlerin sınanmasında ki - kare testi kullanılır. Bu gerçekleşmiyorsa komşu sınıflar birleştirilerek analize devam edilir. 129
10.1.1. YATES DÜZELTİM Lİ Kİ-KARE TESTİ s.d.= 1 ve kuramsal sıklıklardan biri, 3 ile 5 arasında ise, hipotezlerin sınanmasında Yates düzeltimli ki - kare ifadesi kullanılır.
2
(a + b + c + d ) 2 ) ⋅ (a + b + c + d ) 2 ve s.d.=1 (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d )
(| a ⋅ d − b ⋅ c | −
χy = veya, 2
2
2
χ y = ∑∑
'
(| f ij − f ij | −0.5) 2 f ij
i =1 j =1
'
ve s.d.=1
Kuramsal (beklenen) sıklıklar ile gözlemsel sıklıklar arasındaki farklardan biri 0.5'den küçük ise
χ y 2 = 0 olur.
10.1.2. FISHER KESİN Kİ-KARE ANALİZİ s.d.= 1 ve kuramsal sıklıklardan en az biri 3'den küçük ise hipotezlerimizi Fisher Kesin Ki - Kare analizi ile sınarız. Kenar toplamlarının aynı kalması şartı ile en küçük gözlemsel sıklık bir eksiltilerek diğer hücrelerdeki değerler değiştirilir. Bu işleme en küçük gözlemsel sıklık 0 olana kadar devam edilir. Her bir tablo için aşağıdaki ifade ile olasılık değerleri hesaplanır. Elde edilen olasılık değerlerinin toplamı bize yanılma düzeyini verecektir. Yanılma düzeyi 0.05'den küçük veya eşit ise H1 hipotezini kabul ederiz.
pi =
(a + b)!⋅(c + d )!⋅(a + c)!⋅(b + d )! (a + b + c + d )!⋅a!⋅b!⋅c!⋅d! k
(anlam düzeyi ) p =
∑p
i
(k: tablo sayısı)
i =1
Örnek 1. Rastlantısal olarak eşleştirilmiş iki ayrı hasta grubundan birine (deney grubu) yeni bir tedavi yöntemi, diğerine (kontrol grubu) ise plasebo uygu130
lanmıştır. Sonuçlar aşağıdaki çizelgede verilmektedir. Yeni tedavi yönteminin etkili olduğunu söyleyebilir miyiz? Tablo 2. Deney ve kontrol grubunda elde edilen tedavi sonuçları. Gruplar Deney grubu Kontrol grubu Toplam
Tedavi sonucu (+) (-) 85 15 62 38 147 53
Toplam 100 100 200
Çözüm : Hipotezlerimizi aşağıdaki gibi yazarız.
H 0 : Deney ve kontrol grubunda elde edilen sonuçlar arasındaki fark rastlantısaldır. Tedavi yönteminin etkisi istatistiksel olarak anlamlı değildir.
H1 : İki gruba ilişkin sonuçlar arasındaki fark istatistiksel olarak anlamlıdır, tedavi etkilidir. İki grup arasında bir fark yoksa, yani H 0 hipotezi doğru ise beklenen sıklıkları aşağıdaki gibi hesaplarız.
a' =
147⋅100 ' 53⋅100 ' 147⋅100 53⋅100 ,b= , c= , d'= 200 200 200 200
a ' = 73.5 , b ' = 26.5 , c ' = 73.5 ve d ' = 26.5 'dir. s.d.= 1 ve kuramsal sıklıkların her biri 5'den büyük olduğundan ki - kare değerini aşağıdaki ifade ile hesaplarız.
χ2 =
(85 − 73.5) 2 (15 − 26.5) 2 (62 − 73.5) 2 (38 − 26.5) 2 + + + 73.5 26.5 73.5 26.5
χ 2 = 13.58 , s.d.= (2 - 1)(2 -1) = 1
131
Hesaplanan χ 2 değeri, p = 0.05 ve s.d.= 1'e karşılık gelen kuramsal χ 2 değerinden (3.841) (Tablo VI) büyük olduğundan H1 hipotezini kabul ederiz (p < 0.05). Daha ayrıntılı bir inceleme ile hesaplanan ki-kare değeri s.d.= 1 ve p=0.001'e karşılık gelen kuramsal ki-kare değerinden de (10.828) büyük oldu-ğundan anlam düzeyinin p < 0.001 olduğuna karar verilir.
χ 2 değerini, beklenen sıklıkları hesaplamadan, aşağıdaki ifadeden de hesaplayabiliriz.
(a ⋅ d − b ⋅ c) 2 ⋅ (a + b + c + d ) (85 ⋅ 38 − 15 ⋅ 62) 2 ⋅ 200 = χ = 100 ⋅ 100 ⋅ 147 ⋅ 53 (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d ) 2
χ 2 = 13.58 Örnek 2. 38 deney hayvanında bir bakteri türünün aşılandığını ve bu hayvanlardan bir bölümüne vitamin sağıltımı uygulanırken, diğerine vitamin verilmediğini varsayalım. Aşağıdaki çizelgede görüldüğü gibi, deney sonucu bir kısmı ölen bir kısmı da sağ kalan bu hayvanlarda vitamin sağıltımının etkili olup olmadığını araştırınız. Tablo 3. Deney sonuçları. Gruplar Vitamin alan Vitamin almayan Toplam
Deney sonucu Sağ Ölü 5 14 3 16 8 30
Toplam 19 19 38
Çözüm : H 0 : Vitamin tedavisi etkili değil.
H1 : Vitamin tedavisi etkili.
Kuramsal sıklıklar aşağıdaki gibi hesaplanır.
a' =
8 ⋅ 19 30 ⋅ 19 8 ⋅ 19 30 ⋅ 19 = 4, b ' = = 15 , c ' = = 4, ve d ' = = 15 38 38 38 38 132
s.d.= 1 ve kuramsal sıklıklardan en az biri 5'den küçük olduğundan hipotezlerimizi Yates düzeltimli ki - kare testi ile sınarız.
χ y2 =
(| 5 − 4 | −0.5) 2 (| 14 − 15 | −0.5) 2 (| 3 − 4 | −0.5) 2 (| 16 − 15 | −0.5) 2 + + + 4 15 4 15
χ y 2 = 0.1583 Hesaplanan Yates düzeltimli ki - kare değeri, s.d.= 1 ve p=0.05 yanılma düzeyine karşılık gelen kuramsal ki-kare değerinden (3.841) (Tablo VI) küçük olduğundan H 0 hipotezini kabul ederiz (p > 0.05). Yates düzeltimli ki-kare değerini aşağıdaki ifadeden de hesaplayabiliriz.
2
38 2 (a + b + c + d ) 2 ) ⋅ (a + b + c + d ) (| 5 ⋅16 − 14 ⋅ 3 | − ) ⋅ 38 2 2 = 19 ⋅19 ⋅ 8 ⋅ 30 (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d )
(| a ⋅ d − b ⋅ c | −
χy =
χ y 2 = 0.1583 Örnek 3. Hazırlanan koruyucu bir aşının etkinliğini ölçmek amacı ile bir araştırma yapılmıştır. Veriler aşağıdaki tabloda özetlenmiştir. Aşının etkili olup olmadığını sınayınız. Tablo 4. Deney sonuçları. Gruplar Deney grubu (aşılanan) Kontrol grubu (aşılanmayan) Toplam
Hastalıktan kurtulanlar 7
Hastalananlar
Toplam
1
8
10
8
18
17
9
26
Çözüm : H 0 : Aşı etkili değildir. Söz konusu fark rastlantısaldır.
H1 : Aşı etkilidir. Fark istatistiksel olarak anlamlıdır. 133
Kuramsal sıklıklar;
a ' = 5.23 , b ' = 2.77 , c ' = 11.77 ve d ' = 6.23 'dır. S.d. = 1 ve kuramsal sıklıklardan biri ( b ' = 2.77) 3'den küçük olduğundan hipotezlerimizi Fisher Kesin Ki-Kare Analizi ile sınarız. Kenar toplamları değişmeyecek şekilde gözlemsel sıklığı en küçük olan hücredeki sıklığı 1 eksilterek yeni tablolar elde ediyoruz. Bu işleme en küçük sıklık sıfır olana kadar devam ediyoruz. 1.Tablo
7 10 17
1 8 9
8 18 26
2.Tablo
8 9 17
0 9 9
8 18 26
1. ve 2. tablolar için olasılık değerlerini aşağıdaki gibi hesaplarız.
pi =
(a + b)!⋅(c + d )!⋅(a + c)!⋅(b + d )! (a + b + c + d )!⋅a!⋅b!⋅c!⋅d!
p1 =
8!⋅18!⋅17!⋅9! = 0.1120 26!⋅7!⋅1!⋅10!⋅8!
p2 =
8!⋅18!⋅17!⋅9! = 0.0156 ve anlam düzeyi 26!⋅8!⋅0!⋅9!⋅9!
p = p1 + p2 = 0.1120 + 0.0156 = 0.1276 > 0.05 olduğundan H 0 hipotezini kabul ederiz (aşı etkili değil). Örnek 4. Değişik sosyo-ekonomik düzeye (S.E.D.) sahip gruplarda, 818 öğrencide yapılan bir anket çalışmasında öğrencilerin yeterli ve dengeli beslenme durumlarını gösteren bilgiler aşağıdaki tabloda verilmektedir. Gruplara ilişkin yeterli ve dengeli beslenme oranları arasında anlamlı bir fark var mıdır?
134
Tablo 5. Değişik sosyo-ekonomik gruplarda yeterli ve dengeli beslenme durumu. Yeterli ve dengeli beslenen Salt Yüzde 94 83.9 149 87.6 110 92.4 173 94.0 224 96.1 750 91.7
Gruplar S.E.D.= 1 S.E.D.= 2 S.E.D.= 3 S.E.D.= 4 S.E.D.= 5 Toplam
Yetersiz ve dengesiz beslenen Salt Yüzde 18 16.1 21 12.4 9 7.6 11 6.0 9 3.9 68 8.3
Toplam 112 170 119 184 233 818
Çözüm : Hipotezler aşağıdaki gibi yazılır.
H 0 : Gruplar arasında beslenme açısından bir fark yoktur. Gruplar beslenme açısından homojendir.
H1 : Gruplar arasından en az bir tanesi diğerlerinden farklıdır. Gruplar beslenme açısından homojen değildir. Beklenen sıklıkları hesaplarsak aşağıdaki tabloyu elde ederiz. Tablo 6. Değişik sosyo - ekonomik gruplarda yeterli ve dengeli beslenme durumuna ilişkin beklenen sıklıklar. Gruplar S.E.D.= 1 S.E.D.= 2 S.E.D.= 3 S.E.D.= 4 S.E.D.= 5 Toplam
Yeterli ve dengeli beslenen Salt Yüzde 102.69 91.7 155.87 91.7 109.11 91.7 168.70 91.7 213.63 91.7 750 91.7
Yetersiz ve dengesiz beslenen Salt Yüzde 9.31 8.3 14.13 8.3 9.89 8.3 15.30 8.3 19.37 8.3 68 8.3
Toplam 112 170 119 184 233 818
(Serbestlik derecesi) s.d. = (s - 1)(c - 1) = (5 - 1)(2 - 1)= 4 Tablo VI'da 10 hücre bulunmaktadır ve bu hücrelerin hiçbirinde beklenen sıklıklar 5'den küçük değildir. Bu nedenle hipotezleri sınamada ki - kare testini kullanabiliriz. Satır veya kolonlar üzerinde birleştirmeler yaparak tabloyu yeniden oluşturmaya gerek yoktur. 135
χ
2
5
=
2
∑∑ i =1 j =1
χ 2=
'
( fij − fij )2 fij
'
(94 − 102.69)2 (18 − 9.31) 2 + + 102.69 9.31
+
(9 − 19.37) 2 19.37
χ 2 = 19.95 Hesaplanan ki-kare değeri (19.95), s.d.= 4 ve p=0.001'e karşılık gelen kuramsal ki-kare değerinden (18.467) büyük olduğundan H1 hipotezini kabul ederiz (p < 0.001). Hangi grupların birbirinden farklı olduğunu sınamak için sırasıyla, en büyük farkı doğuran gruplar ikişer ikişer seçilerek karşılaştırılır. Örnek 5. Birbirinden bağımsız üç farklı grupta X etkeninin incelendiğini ve sonuçların aşağıdaki çizelgede verildiğini varsayalım. Grupların X etkeni açısından homojen olup olmadığını sınayınız. Tablo 7. Üç gruba ilişkin gözlem sonuçları. Gruplar Grup 1 Grup 2 Grup 3 Toplam
Çok kötü 5 3 4 12
Kötü 8 6 2 16
Normal 18 10 4 32
İyi 4 4 4 12
Çok iyi 2 2 2 6
Toplam 37 25 16 78
Çözüm : Hipotezler aşağıdaki gibi kurulur.
H 0 : Gruplar X etkeni açısından homojendir. Söz konusu rastlantısaldır.
H1 : Gruplar X etkeni açısından homojen değildir. Kuramsal sıklıklar hesaplanarak Tablo 8' elde edilir.
136
farklar
Tablo 8. Üç gruba ilişkin kuramsal sıklıklar. Gruplar Grup 1 Grup 2 Grup 3 Toplam
Çok kötü 5.69 3.85 2.46 12
Kötü 7.59 5.13 3.28 16
Normal 15.18 10.26 6.56 32
İyi 5.69 3.85 2.46 12
Çok iyi 2.85 1.92 1.23 6
Toplam 37 25 16 78
Toplam 15 hücrenin 8'inde (% 53.3) kuramsal sıklıklar 5'den küçüktür (Tablo 8). Ki - kare testini kullanabilmemiz için tabloyu yeniden düzenlememiz gerekir. Tablo 7' de 1. ile 2. ve 4. ile 5. kolonlar birleştirilerek tablo yeniden düzenlenir (Tablo 9). Tablo 9. Tablo 7' nin yeniden düzenlenmiş hali. Gruplar Grup 1 Grup 2 Grup 3 Toplam
Çok kötü ve kötü 13 9 6 28
Normal 18 10 4 32
Çok iyi ve iyi 6 6 6 18
Toplam 37 25 16 78
Tablo 9' a ilişkin kuramsal sıklıklar Tablo 10' da verilmektedir. Tablo 10. Yeniden düzenlenen verilere ilişkin kuramsal değerler. Gruplar Grup 1 Grup 2 Grup 3 Toplam
Çok kötü ve kötü 13.28 8.97 5.74 28
Normal 15.18 10.26 6.56 32
Çok iyi ve iyi 8.54 5.77 3.69 18
Toplam 37 25 16 78
Toplam 9 hücrenin sadece 1'inde (%11.11) kuramsal sıklık 5'den küçüktür. %11.11<%20 olduğundan hipotezlerimizi ki-kare testi ile sınayabiliriz. 2
3
3
χ = ∑∑ i =1 j =1
'
( fij − fij )2 fij
'
137
χ 2=
(13 − 13.28) 2 (18 − 15.18) 2 + + 13.28 15.18
+
(6 − 3.69) 2 3.69
χ 2 = 3.7579 s.d. = (s - 1) x (c - 1) = (3 - 1)(3 - 1) = 4 Hesaplanan
χ 2 değeri (3.7579), s.d.=4 ve p=0.05'e karşılık gelen kuramsal
χ 2 değerinden (9.488) küçük olduğundan H 0 hipotezi kabul edilir (p > 0.05). 10.2. İKİ NİTEL DEĞİŞKEN ARASINDA İLİŞKİ ARANMASI VE SINANMASINDA Kİ-KARE TESTİ Korelasyon ve regresyon konusunun incelendiği bölümden, sıralamalı ölçüm düzeyinde incelenen iki değişken arasındaki ilişkinin Spearman sıra ilişki katsayısı ile ölçüldüğünü biliyoruz. Eğer tekrar eden terim sayısı çok ise ve aralarında ilişki aranan değişkenlerden biri veya ikisi sınıflamalı ölçüm düzeyinde incelendiyse değişkenler arasında anlamlı bir ilişki olup olmadığını ki - kare testi ile sınarız. Hipotezlerimizi aşağıdaki gibi oluştururuz.
H 0 : X değişkeni ile Y değişkeni arasındaki ilişki rastlantısaldır. X ile Y bağımsızdır.
H1 : X ile Y arasındaki ilişki istatistiksel olarak anlamlıdır. Hipotezlerin sınanmasında, yukarıda verilen, iki ya da daha çok grupta nitel değişkenlerin karşılaştırılmasına ilişkin tüm ki - kare yöntemleri geçerlidir. X değişkenini grup değişkeni olarak ele aldığımızı varsayarsak, X'i sınıflayıcı ölçüm düzeyinde incelenen bir değişken olarak kabul edebiliriz. X ile Y arasındaki ilişkinin gücünü kontenjans katsayısı (cc) ile ölçeriz.
cc =
χ2 N + χ2
Kontenjans katsayısının alabileceği maksimum değer aşağıdaki ifade ile hesaplanır. 138
ccmax . =
e −1 e
Burada e satır veya kolonlardan az olanını göstermektedir. Örneğin 2x2 tablosunda cc'nin maksimum değeri,
ccmax . =
2 −1 = 0.707 değerine eşittir. 2
Örnek 6. Aşağıdaki çizelgede 500 kişilik bir grupta sigara içmenin cinsiyete göre dağılımı verilmektedir. Cinsiyet ile sigara içme arasında bir ilişki var mıdır?
Tablo 11. Sigara içenlerin cinsiyete göre dağılımı. Cinsiyet Kadın Erkek Toplam
Sigara içen 12 220 232
Sigara içmeyen 88 180 268
Toplam 100 400 500
Çözüm : Cinsiyet değişkenini X ile, sigara içme durumunu da Y ile gösterirsek, hipotezlerimizi aşağıdaki gibi kurarız.
H 0 : Cinsiyet ile sigara içme bağımsızdır.
H1 : Cinsiyet ile sigara içme arasındaki ilişki anlamlıdır. Kuramsal sıklıkları hesaplarsak,
a ' = 46.4 , b ' = 53.6 , c ' = 185.6, ve d ' = 214.4 bulunur. s.d.=1 ve kuramsal sıklıklardan hiç biri 5'den küçük değildir.
(12 ⋅ 180 − 88 ⋅ 220) 2 ⋅ 500 (a ⋅ d − b ⋅ c) 2 ⋅ (a + b + c + d ) = χ = 100 ⋅ 400 ⋅ 232 ⋅ 268 (a + b) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d ) 2
139
χ 2 = 59.476 Hesaplanan ki-kare (59.476) değeri, s.d.=1 ve p=0.001 'e karşılık gelen kuramsal ki-kare (10.828) değerinden büyük olduğundan H1 hipotezi kabul edilir (p<0.001). Kontenjans katsayısı cc aşağıdaki ifade ile hesaplanır.
χ2 cc = N + χ2
59.476 = 0.326 500 + 59.476
10.3. DENEYSEL BİR DAĞILIMIN KURAMSAL BİR DAĞILIMA UYGUNLUĞUNUN SINANMASI Burada gözleme dayalı deneysel bir dağılımın kuramsal bir dağılıma uygunluğunun sınanması söz konusudur. Hipotezler aşağıdaki gibi kurulur.
H 0 : Deneysel dağılım kuramsal dağılıma uygunluk göstermektedir. Söz konusu farklar rastlantısaldır.
H1 : Deneysel dağılım kuramsal dağılıma uygunluk göstermemektedir. Aradaki farklar istatistiksel olarak anlamlıdır. Tıpta sıklıkla karşılaşılan kuramsal dağılımlar arasında Düzgün, Binom, Poisson ve Normal dağılımları gösterebiliriz. '
f i ile gözlemsel sıklığı, f i ile kuramsal sıklığı gösterirsek hipotezlerimizi aşağıda verilen ki-kare ifadesi ile sınarız. '
( f − f )2 χ = ∑ i ' i , s.d.=k – s - 1 fi i =1 2
k
Burada; k : sınıf sayısı,
140
s : kuramsal sıklıkları hesaplarken kullandığımız gözleme dayalı parametre sayısıdır. Ki-kare uygunluk testinin kullanılabilmesi için örneklem uzunluğunun (denek sayısının) en az 50 olması gerekir. Örneklem uzunluğu 50'den küçük ise uygunluk sınamasında Kolmogorov - Smirnov testi uygulanır. Kuramsal sıklığı 5'den küçük olan sınıflar varsa, komşu sınıflar birleştirilerek analize devam edilir. Örnek 7. (Deneysel dağılımın Binom dağılımına uygunluğunun sınanması) 4 çocuklu 320 ailede yapılan bir araştırmada ailelerin sahip oldukları kız ve erkek çocuklarına göre dağılımı aşağıda verilmektedir. Elde edilen deneysel dağılımın p=0.50 parametreli (kız ve erkek çocuğu doğumlarının olasılıkları birbirine eşit) binom dağılımına uygunluğunu sınayınız. Tablo 12. 4 çocuklu 320 ailenin çocukların cinsiyetine göre dağılımı. Kız ve erkek çocuk sayısı 0 K, 4 E 1 K, 3 E 2 K, 2 E 3 K, 1 E 4 K, 0 E Toplam
Aile sayısı 14 70 125 85 26 320
Çözüm : Hipotezleri aşağıdaki gibi oluştururuz.
H 0 : Deneysel dağılım p=0.5 parametreli Binom dağılımına
uygunluk
göstermektedir. Aradaki farklılık rastlantısaldır.
H1 : Deneysel dağılım kuramsal dağılıma uymamaktadır. Farklar istatistiksel
olarak anlamlıdır.
Başarı olarak kız çocuğuna sahip olmayı varsayarsak, birbirinden bağımsız 4 denemede sırasıyla, 0, 1, 2, 3 ve 4 kız çocuğuna sahip olma olasılıklarını binom dağılımından hesaplarız. Bu olasılıkları 320 ile çarparak beklenen sıklıklar hesaplanır. x=0 için (yani 0 kız, 4 erkek) çocuğuna sahip olma kuramsal olasılığını ve kuramsal sıklığını aşağıdaki gibi hesaplarız. 141
P(0) =
4! 1 ⋅ (0.5)0 ⋅ (0.5) 4 − 0 = 0!⋅(4 − 0)! 16
'
f1 = n ⋅ P(0) = 320 ⋅
1 = 20 16
1. sınıfa karşılık gelen ki-kare değerini de aşağıdaki ifade ile hesaplarız. '
( f1 − f1 ) 2 (14 − 20) 2 χ1 = = = 1.80 ' 20 f1 2
5 sınıf için (i=1,2,3,4,5 veya x=0,1,2,3,4) işlemleri tekrarlarsak Tablo 13'ü elde ederiz. Tablo 13. Kuramsal olasılıklar, kuramsal sıklıklar ve Ki-kare değerleri Kız ve erkek çocuk sayısı 0 K, 4 E 1 K, 3 E 2 K, 2 E 3 K, 1 E 4 K, 0 E Toplam
Kuramsal Olasılık
Kuramsal Sıklık
Gözlenen Sıklık
Ki-Kare
P(x)
f i = n ⋅ P( x)
fi
χ2
1/16 4/16 6/16 4/16 1/16 16/16
20 80 120 80 20 320
14 70 125 85 26 320
1.80 1.25 0.21 0.31 1.80 5.37
'
'
( fi − fi )2 χ =∑ = 5.37 ' fi i =1 2
5
s.d. = k - s - 1 = 5 - 0 - 1 = 4 (kuramsal sıklıkları hesaplarken kullandığımız p=0.50 parametresi gözlem sonucu elde edilen bir değer olmadığından s = 0 alınır.) Hesaplanan ki-kare değeri (5.37), s.d.=4 ve (anlam düzeyi) p=0.05'e karşılık gelen kuramsal ki-kare değerinden (9.488) küçük olduğundan H 0 hipotezi kabul edilir. Deneysel dağılım binom dağılımına uymaktadır. 142
Örnek 8. (Deneysel dağılımın Poisson dağılıma uygunluğunun sınanması) Çok sulandırılmış bir eriyiğin mikroskop altında incelenmesinde, 50 sayım karesinde gözlenen hücre sayısının dağılımı aşağıdaki gibi bulunmuştur. Elde edilen dağılımın Poisson dağılımına uygunluğunu sınayınız. Tablo 14-a. Gözlem sonuçları. Hücre sayısı (başarı sayısı)
Kare sayısı gözlenen sıklık
xi
fi
0 1 2 3 4 veya daha çok Toplam
17 21 8 3 1 50
Çözüm : Hipotezler aşağıdaki gibi kurulur.
H 0 : Elde edilen deneysel dağılım poisson dağılımına uymaktadır (poisson dağılımının parametresi deneysel dağılımdan hesaplanacaktır). Fark rastlantısaldır.
H1 : Deneysel dağılım poisson dağılımına uymamaktadır. Kuramsal sıklıkları hesaplarken kullanacağımız parametre m deneysel dağılımdan hesaplanır.
(x ) , m =
∑ f ⋅x ∑f i
i
i
=
50 =1 50
Başarı olarak bir sayım karesinde bir hücre olmasını kabul edersek xi = 0, 1, 2, 3, 4, ... , 50 için kuramsal olasılıkları ,kuramsal sıklıkları ve ki-kare değerlerini aşağıdaki gibi hesaplarız (Tablo 14-b).
143
Tablo 14 -b Kuramsal sıklıklar. Başarı sayısı
Kuramsal olasılık
Kuramsal sıklık
xi
P(x)
f i = n ⋅ P( x)
'
10 = 0.3679 0! 1 −1 1 e ⋅ = 0.3679 1! 2 −1 1 e ⋅ = 0.1839 2! 13 e−1 ⋅ = 0.0613 3!
e −1 ⋅
0 1 2 3
18.395 18.395 9.195 3.065
4+
0.0190
0.950
Toplam
1.0000
50.000
Tablo 14 b'den de görüldüğü gibi, 4. ve 5. sınıflarda kuramsal sıklıklar 5'den küçüktür. Bu sınıflar 3. sınıf ile birleştirilerek analize devam edilir. (Tablo15). Tablo 15. Ki-kare değerleri Başarı sayısı
xi 0 1 2+ Toplam
Kuramsal sıklık
Ki-Kare
f i = n ⋅ P( x)
fi
χ2
18.395 18.395 13.210 50.000
17 21 12 50
0.1058 0.3689 0.1108 0.5855
'
3
( fi − fi )2
i =1
fi
χ2 = ∑
Gözlemsel sıklık
'
'
= 0.5855
s.d. = k - s - 1 = 3 - 1 - 1 = 1 (kuramsal sıklıkları hesaplarken kullandığımız m =1 parametresi gözlem sonucu elde edilen bir değer olduğundan s = 1 alınır.) 144
Hesaplanan ki-kare değeri (0.5855), s.d.=1 ve (anlam düzeyi) p=0.05'e karşılık gelen kuramsal ki-kare değerinden (3.841) küçük olduğundan H 0 hipotezi kabul edilir (p>0.05). Deneysel dağılım poisson dağılımına uymaktadır. Örnek 9. (Deneysel dağılımın normal dağılıma uygunluğunun sınanması) 1995-1996 Öğretim yılı, Istanbul Tıp Fakültesi 1.sınıf öğrencilerinin boy dağılımı aşağıdaki gibidir. Elde edilen deneysel dağılımın normal dağılıma uygunluğunu sınayınız. Tablo 16. Boy değişkenine ilişkin deneysel dağılım. Boy (x) 'den az
Gözlemsel sıklık
160 - 162 162 - 164 164 - 166 166 - 168 168 - 170 170 - 172 172 - 174 174 - 176 176 - 178 178 - 180 180 - 182 182 - 184 184 - 186 186 - 188 188 - 190 190 - 192 192 - 194 Toplam
fi
0 4 6 1 7 24 19 21 22 15 15 10 6 7 1 2 0 160
Çözüm :
H 0 : Boy dağılımı normal dağılıma uygunluk göstermektedir.
H1 : Boy dağılımı normal dağılıma uygunluk göstermemektedir.
Kuramsal sıklıkları hesaplarken kullanacağımız normal dağılımın parametresi olan aritmetik ortalamayı, ham verileri kullanarak, aşağıdaki gibi hesaplarız. 145
x=∑ n
xi
=
28084 = 175.525 cm. ve s = 5.9070 cm.’dir. 160
Aritmetik ortalama ve standart sapmayı, ham veriler yerine sınıflanmış tablodan hesaplasaydık, sınflama nedeniyle farklı sonuçlar bulacaktık. ( x = 176.075 ve s = 5.9299) Boy değişkeninin (x), 160-162 aralığında olması olasılığını aşağıdaki gibi hesaplarız. P(160 < x < 162) = P(
ε 1 ve ε 2 ’yi ε i =
ε1 < ε < ε 2 ) = ?
xi − x ifadesinden hesaplarsak s
ε 1 = -2.63 ve ε 2 = -2.29 bulunur. Normal alanlar tablosundan yararlanarak ( Tablo III), P(160 < x < 162) = P(-2.63 < ε < -2.29) = 0.0067 değeri hesaplanır. 160 öğrenciden (160)·(0.0067)=1.072'sinin boylarının 160-162 cm arasında olması beklenir. Diğer aralıklar için kuramsal sıklıkların hesaplanma-sında aynı yol izlenir (Tablo 17). Tablo 17. Kuramsal olasılıklar ve sıklıklar. Boy (x)'den az 160 - 162 162 - 164 164 - 166 166 - 168 168 - 170 170 - 172 172 - 174 174 - 176 176 - 178 178 - 180 180 - 182 182 - 184 184 - 186 186 - 188 188 - 190 190 - 192 192 - 194 Toplam
Kuramsal olasılık 0.0067 0.0146 0.0281 0.0483 0.0716 0.1006 0.1232 0.1344 0.1309 0.1136 0.0880 0.0593 0.0380 0.0209 0.0103 0.0045 0.0018 0.9948
146
Kuramsal sıklık 1.072 2.336 4.496 7.728 11.456 16.096 19.712 21.504 20.944 18.176 14.080 9.488 6.08 3.344 1.648 0.720 0.288 159.168
Tablo 17'den de görüldüğü gibi ilk üç sınıf ile son dört sınıfın kuramsal sıklıkları 5'den küçüktür. Bu sınıflar birleştirilerek analize devam edilir. Gözlemsel ve kuramsal sıklıklar ve bunlara ilişkin ki-kare değerleri Tablo 18'de verilmektedir. Tablo 18. Ki-kare değerleri. Boy (x)'den az
Gözlemsel sıklık
160 - 166 166 - 168 168 - 170 170 - 172 172 - 174 174 - 176 176 - 178 178 - 180 180 - 182 182 - 184 184 - 186 186 - 194
10 1 7 24 19 21 22 15 15 10 6 10
Toplam
160
fi
Kuramsal sıklık 7.904 7.728 11.456 16.112 19.696 21.520 20.944 18.176 14.064 9.728 5.840 6.052 159.220
'
f1
Ki-kare
χ2
0.5558 5.8574 1.7332 3.8813 0.0257 0.0118 0.0532 0.5550 0.0601 0.0276 0.0011 2.6667
15.4289
s.d. = k - s - 1 = 12 - 1 - 1 = 10 (kuramsal sıklıkları hesaplarken kullandığımız aritmetik ortalama (175.525) gözlem sonucu elde edilen bir değer olduğundan s =1 alınır.) Hesaplanan ki-kare değeri (15.4289), s.d.=10 ve (anlam düzeyi) p=0.05'e karşılık gelen kuramsal ki-kare değerinden (18.307) küçük olduğundan H 0 hipotezi kabul edilir (p > 0.05). Deneysel dağılım normal dağılıma uymaktadır. Örnek 10. (Deneysel dağılımın düzgün dağılıma uygunluğunun sınan-ması) Bir A yerleşim yerinde 1991 yılında meydana gelen doğumların aylara göre dağılışı aşağıdaki tabloda verilmektedir. Aylara göre doğum sayıları arasında bir fark olup olmadığını, diğer bir deyişle, doğumların aylara göre dağılışının düzgün dağılıma uyup uymadığını sınayınız.
147
Tablo 19. A Yerleşim yerinde, 996 doğumun aylara göre dağılışı. Aylar 1 2 3 4 5 6 7 8 9 10 11 12 Toplam
Doğum sayısı (gözlemsel sıklık) 75 86 90 64 78 83 82 86 90 92 78 92 996
Çözüm : H 0 : Deneysel dağılım düzgün dağılıma uymaktadır.
H1 : Deneysel dağılım düzgün dağılıma uymamaktadır. H 0 hipotezi altında, bir doğumun herhangi bir ayda olması olasılığı (1/12)'ye ve herhangi bir ayda beklenen doğum sıklığı (996)·(1/12) = 83' e eşittir. Beklenen sıklıklar ve ki-kare değerleri aşağıdaki tabloda (Tablo 20) verilmektedir. Tablo 20. Beklenen Sıklıklar ve Ki-Kare Değerleri. Aylar 1 2 3 4 5 6 7 8 9 10 11 12 Toplam
Doğum sayısı (gözlemsel sıklık)
Doğum sayısı
fi
(beklenen sıklık) 83 83 83 83 83 83 83 83 83 83 83 83 996
75 86 90 64 78 83 82 86 90 92 78 92 996 148
Ki-kare ' 1
f
χ2 0.7711 0.1084 0.5904 4.3494 0.3012 0.0000 0.0120 0.1084 0.5904 0.9759 0.3012 0.9759 9.0843
12
χ2 = ∑ i =1
'
( fi − fi )2 = 9.0843 ' fi
s.d. = k - s - 1 = 12 - 0 - 1 = 11 (kuramsal sıklıkları hesaplarken kullandığımız (1/12) olasılık değeri kuramsal bir değer olduğundan s = 0 alınır.) Hesaplanan ki-kare değeri (9.0843), s.d.=11 ve (anlam düzeyi) p=0.05'e karşılık gelen kuramsal ki-kare değerinden (19.675) küçük olduğundan H 0 hipotezi kabul edilir (p>0.05). Deneysel dağılım düzgün dağılıma uymaktadır.
149
Bölüm 11
Korelasyon ve Regresyon
Gerek günlük yaşantımız süresince, gerekse bilimsel incelemelerde karşılaştığımız sorulardan pek çoğu, iki ya da daha çok değişken arasında bir ilişki olup olmadığının aranması ile ilgilidir. Örneğin, kişilerin boy uzunlukları ile ağırlıkları arasındaki ilişkiyi, yine, bir bölgedeki trafik kazalarının sayısı ile mevsimsel özellikler arasındaki ilişkileri incelemek isteyebiliriz. Değişkenler arasındaki ilişkiyi araştırmak genellikle iki tür amaç için gereklidir. 1. Bir değişkene ilişkin bilgi ya da ölçümlerden hareketle diğer değişken üzerindeki ölçümü ne derece doğrulukla tahmin edebiliriz. Burada, bir tür davranış ya da özelliği, diğer türden davranış ya da özelliklerden tahmin etmek söz konusudur. Örneğin, kişinin zeka düzeyi ile okul başarısı arasında yüksek derecede bir ilişki varsa, zeka düzeyi yüksek olan bir kişinin okul başarısını "yeter" sayılabilecek bir doğruluk derecesinde tahmin etmek mümkündür. 151
2. Değişkenler üzerinde gözlenen farklılıklar ne dereceye kadar açıklayıcı bazı değişkenlere bağlıdır. Bu durumda bireyleri ya da denekleri değişken üzerinde farklı yapan etmenleri saptamak söz konusudur. Örneğin, çocuklarda kan basıncı değerlerindeki değişimin ne derecede çocukların boylarına, ağırlıklarına, baş ve boyun çevrelerine bağlı olduğunu saptamaya çalışmak. Korelasyon çözümlemesi, iki ya da daha çok sayıda değişken arasındaki ilişkiyi göstermek için kullanılır. İlişkinin derecesi, korelasyon katsayısı (ilişki katsayısı) olarak ifade edilen bir sayı ile belirtilir. Yine, iki ya da daha çok değişken arasındaki bağıntının şeklini ifade etmek için regresyon çözümlemesi kullanılır. Değişkenler arasındaki ilişki değişik şekillerde olabilir. Eğer ilişkiyi birinci dereceden bir matematiksel eşitlikle (doğru denklemi) ifade etme olanağı varsa, bu durumda ilişki doğrusaldır denir (Şekil 1). Diğer taraftan, değişkenler arasındaki ilişkiyi birinci dereceden bir matematiksel eşitlikle gösterme olanağı yoksa, bu durumda ilişki doğrusal değildir, ya da doğrusal olmayan bir ilişki vardır denir. Doğrusal olmayan ilişki, doğru denklemi dışında daha üst dereceden eşitliklerden biri ile ifade edilir (Şekil 2). Y 8
7
6
5
4
3
2 0
1
2
3
4
5
6
7
X
Şekil 1. Doğrusal ilişki
152
Y 600
500
400
300
200
100
0 1
2
3
4
5
6
7
X
Şekil 2. Doğrusal olmayan ilişki
Değişkenler arasındaki ilişkiyi saptarken ilişkinin biçimine (doğrusal olup olmayışına) göre farklı eşitlikler kullanmamız gerekir. Değişkenler arasındaki ilişkinin belirlenmesinde kullanılan teknik, ilişkinin biçimine göre değiştiği gibi, aralarında ilişki aranan değişken sayısına ve bu değişkenlerin ölçüm düzeylerine göre de değişir. İki değişken arasındaki ilişkiyi saptamada kullanılan korelasyon tekniklerine basit korelasyon teknikleri, değişken sayısı üç ya da daha çok ise çoklu korelasyon teknikleri ve bazı değişkenlerin etkisinin sabit tutulduğu durumlarda kullanılan tekniklere de kısmi korelasyon teknikleri adı verilir. Sürekli iki değişken (aralıklı veya oransal ölçüm düzeyinde incelenen) arasındaki ilişki değerini gösteren katsayıya "Pearson - Bravais momentler çarpımı ilişki katsayısı" denir. Tıpta tek başına ilişki katsayısı denilince bu katsayıdan söz edilir ve katsayı r simgesi ile gösterilir. Pearson - Bravais korelasyon katsayısı r, +1 ile -1 arasında değerler alır. Değişkenlerin her ikisi aynı yönde değişme gösteriyorsa r 'nin işareti pozitif, değişkenlerden biri bir yönde diğeri ters yönde değişiyorsa ( yani, biri azalırken diğeri çoğalıyorsa) r 'nin işareti negatiftir. Değişkenler arasında ne pozitif ne de negatif yönde birlikte bir değişme yoksa korelasyon katsayısı sıfırdır. Korelasyon katsayısının sıfır oluşu değişkenler arasında bir ilişkinin olmadığını gösterir. Korelasyon katsayısının mutlak değeri ilişkinin gücünü, işareti ise ilişkinin yönünü belirler. Örneğin, korelasyon katsayıları +0.95 ile -0.95 aynı derecede bir ilişkiyi gösterir. Birinci de ilişkinin yönü pozitif, ikinci de ise negatiftir. 153
İki yönlü değişim tablosunda noktaların oluşturduğu şekil (Serpilme Diyagramı) bir doğruya yaklaştıkça r 'nin değeri +1 ya da -1'e yaklaşır. Serpilme diyagramı bir daire şeklini aldıkça r 'nin mutlak değeri düşer ve en yaygın halde sıfır olur. Şekil 3 ve Şekil 4'de çeşitli serpilme diyagramları ve bunlara ait korelasyon katsayıları verilmektedir.
Şekil 3.
Şekil 4.
154
11.1. REGRESYON DOĞRUSUNUN EN KÜÇÜK KARELER YÖNTEMİ İLE ELDE EDİLMESİ Şekil 5'te n tane ( x, y ) gözlem çiftine ait serpilme diyagramı ve n gözlemi temsil ettiğini düşündüğümüz bir doğru parçası verilmektedir. Serpilme diyagramında n gözlemi temsil etmek amacı ile pek çok doğru çizilebilir. Amacımız bu doğrular arasından temsil gücü en fazla olan doğruyu belirlemektir.
Şekil 5. y 'nin x 'e göre regresyon doğrusu.
y = a + b ⋅ x ifadesi ile verilen doğruya " y 'nin x 'e göre regresyon doğrusu" adı verilir. Burada a değeri regresyon sabiti, b ise regresyon ' katsayısıdır. xi değerlerine karşılık gelen kuramsal yi değerlerinin yi' = a + b ⋅ xi ifadesinden hesaplandığını düşünürsek, n
n
i =1
i =1
∑ ( yi' − yi )2 = ∑ (a + b ⋅ xi − yi )2 ifadesini en küçük yapan regresyon sabiti ( a ) ve regresyon katsayısı ( b ) aşağıdaki şekilde hesaplanır.
155
( x )⋅( y ) ∑ (x ⋅ y ) − ∑ n ∑ b= ( x) ∑x − ∑ i
i
i
i
2
i = 1,2, , n
i
2 i
n
a = y −b⋅x = ∑ n
yi
−b⋅ ∑ n
xi
11.2. BELİRLEME KATSAYISI Belirleme katsayısı, y 'deki değişkenliğin yüzde kaçının x 'e bağlı olduğunu gösterir ve d y ⋅ x simgesi ile gösterilir.
y 'deki toplam değişkenliği, açıklanan ve açıklanmayan değişkenlik şeklinde gösterebiliriz. Toplam değişkenlik = açıklanan değişkenlik + açıklanmayan değişkenlik
s y2 = s yk2 + s yx2
, daha açık bir ifade ile,
− y ) 2 ∑ ( yi' − y ) 2 ∑ ( yi − yi' ) 2 = + şeklinde yazabiliriz. n −1 n −1 n −1 ' yi kuramsal değerlerinin yi' = a + b ⋅ xi eşitliğinden elde edildiğini
∑(y
i
hatırlayalım. Buradan belirleme katsayısı ( d y ⋅ x ) aşağıdaki ifade ile hesaplanır.
d y⋅x =
2 s yk
s y2
=1 −
s yx2 s y2 2
Belirleme katsayısı korelasyon katsayısının karesine eşittir ( d y ⋅ x = r ). Belirleme katsayısının 1'e eşit olması y 'deki tüm değişkenliğin x ile açıklanabildiğini gösterir. Bu durumda r 'nin mutlak değeri 1'e eşit olur. İlişkinin yönünü belirlemek için serpilme diyagramına bakmamız gerekir.
156
11.3. PEARSON-BRAVAIS KORELASYON KATSAYISI Pearson - Bravais momentler çarpımı korelasyon katsayısı aşağıdaki ifadelerden biri ile hesaplanabilir.
r=
∑ ((x − x) ⋅ ( y − y)) ∑ ( x − x) ⋅ ∑ ( y − y ) i
i
2
i
, i = 1,2,
2
,n
i
veya,
( x )⋅( y ) ∑ (x ⋅ y ) − ∑ n ∑ ( x) ( y) (∑ x − ∑ ) ⋅ (∑ y − ∑ i
r=
i
i
i
2
2 i
i
n
2 i
i
n
, i = 1,2,
2
,n
)
11.3.1. KORELASYON KATSAYISININ ANLAM LILIĞININ SINANM ASI Başlangıç hipotezimizi incelenen iki değişkenin birbirinden bağımsız olduğu ( r = 0 ), alternatif hipotezi ise iki değişkenin birbiriyle ilişkili olduğu şeklinde kurarız.
H0: r = 0 H1 : r ≠ 0 Hipotezleri sınamada Student't testini kullanırız.
t=
r (1 − r 2 )
⋅ ( n − 2)
(Serbestlik derecesi) s.d. = n - 2 Hesapladığımız t değeri, (n-2) serbestlik dereceli ve kabul edilen anlam düzeyine karşılık gelen kuramsal t değerine (Tablo IV) eşit veya büyükse H1 hipotezini, küçükse H 0 hipotezini kabul ederiz.
157
11.4. REGRESYON KATSAYILARI İLE KORELASYON KATSAYISI ARASINDAKİ İLİŞKİ y 'nin x 'e göre regresyon doğrusunu y = a + b ⋅ x ve x 'in y 'ye göre regresyon doğrusunu x = a ' + b' ⋅ y ifadesi ile gösterirsek
r 2 = b ⋅ b ' ve r = b ⋅ b'
eşitliklerini yazabiliriz.
Örnek 1. Aşağıda yeni doğan 15 kız çocuğuna ait boy ( x ) ve ağırlık ( y ) değerleri verilmektedir. x ve y arasındaki serpilme diyagramını çizerek, y 'nin x 'e göre regresyon doğrusu denklemini, x ve y arasındaki Pearson Bravais momentler çarpımı korelasyon katsayısını ( r ) ve belirleme katsayısını ( d y ⋅ x ) hesaplayınız. Tablo 1. 15 yeni doğan kız çocuğunda boy ve ağırlık değerleri. Boy (cm)
xi
Ağırlık (Kg)
50.0 50.5 50.0 51.0 53.0 48.0 49.5 46.0 49.0 50.0 51.0 50.0 51.0 51.5 48.5
yi
3.2 3.3 3.1 3.5 4.0 2.9 2.8 2.6 3.2 3.3 3.2 3.1 3.2 3.0 2.9
Çözüm : Boy ( x ) ve ağırlık ( y ) değişkenlerine ilişkin serpilme diyagramı aşağıdaki gibi çizilir ( Şekil 6).
158
Şekil 6. Boy ( x ) ve ağırlık ( y ) değişkenlerine ilişkin serpilme diyagramı.
15 yeni doğan kız çocuğuna ilişkin x 2 , y 2 , ve x ⋅ y değerlerini ve toplamlarını hesaplarız (Tablo 2). Tablo 2. Denek No
i
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Toplam
Boy
Ağırlık
xi
yi
xi2
50.00 50.50 50.00 51.00 53.00 48.00 49.50 46.00 49.00 50.00 51.00 50.00 51.00 51.50 48.50 749.00
3.20 3.30 3.10 3.50 4.00 2.90 2.80 2.60 3.20 3.30 3.20 3.10 3.20 3.00 2.90 47.30
2500.00 2550.25 2500.00 2601.00 2809.00 2304.00 2450.25 2116.00 2401.00 2500.00 2601.00 2500.00 2601.00 2652.25 2352.25 37438.00
159
yi2
xi ⋅ yi
10.24 10.89 9.61 12.25 16.00 8.41 7.84 6.76 10.24 10.89 10.24 9.61 10.24 9.00 8.41 150.63
160.00 166.65 155.00 178.50 212.00 139.20 138.60 119.60 156.80 165.00 163.20 155.00 163.20 154.50 140.65 2367.90
Regresyon sabiti ( a ) ve regresyon katsayısı ( b )'yi aşağıdaki ifade ile hesaplarız.
( x )⋅( y ) ∑ (x ⋅ y ) − ∑ n ∑ b= ( x) ∑x − ∑ i
i
i
i
i = 1,2, , n
2
2 i
b=
i
n
749.00 ⋅ 47.30 15 = 0.15958 7492 37438.00 − 15
2367.90 −
y x a = y −b⋅ x = ∑ i −b⋅ ∑ i n n
a=
47.30 749.00 –4.81503 − (0.15958) ⋅ = −4.81494 bulunur. 15 15
Serpilme diyagramını temsil eden en küçük kareler doğrusu aşağıdaki gibi belirtilir. y = – 4.81503 + 0.15958⋅x a ve b 'yi aşağıdaki ifadelerden de hesaplayabiliriz.
y = a + b ⋅ x eşitliğinin her iki tarafında toplama işlemini yaparsak (1), eşitliğin her iki tarafının x ile çarparak toplamları alırsak (2) eşitliklerini elde ederiz.
∑ y = n⋅ a + b⋅∑x
(1) 2
∑ ( x ⋅ y ) = (∑ x ) ⋅ a + b ⋅ (∑ x ) 47.30 = 15 ⋅ a + b ⋅ 749.00 2367.90 = 749.00 ⋅ a + b ⋅ 37438.00
160
(2)
(1) ve (2) eşitliklerinin (iki bilinmeyenli denklemler) çözümlenmesiyle
a = -4.81503 , b = 0.15958 değerleri elde edilir. Belirleme katsayısı ( d y ⋅ x ) ve korelasyon katsayısı r ’nin hesaplanması. '
yi tahmin (kuramsal) değerlerini y = –4.81503 + 0.15958⋅x ifadesinden hesaplarız. Örneğin, x1 = 50 cm'ye karşılık gelen tahmini ağırlık değeri y1’ = –4.81503 + 0.15958⋅50 = 3.16397 Kg elde edilir. x1 ' e karşılık gelen yi gözlem değerimiz 3.2 Kg idi. Toplam değişkenliği, açıklanan ve açıklanmayan değişkenliği aşağıdaki ifadelerle hesaplarız. Sonuçlar Tablo 3'de verilmektedir.
47.30 =3.153333 ve 15
y=
− y ) 2 ∑ ( yi' − y ) 2 ∑ ( yi − yi' ) 2 = + yazabiliriz. n −1 n −1 n −1
∑(y
i
Tablo 3. Toplam, açıklanan ve açıklanmayan değişkenlik.
xi
yi
yi'
( yi − y)2
( yi' − y)2
( yi − yi' ) 2
50.00 50.50 50.00 51.00 53.00 48.00 49.50 46.00 49.00 50.00 51.00 50.00 51.00 51.50 48.50 Toplam
3.20 3.30 3.10 3.50 4.00 2.90 2.80 2.60 3.20 3.30 3.20 3.10 3.20 3.00 2.90
3.1640 3.2438 3.1640 3.3236 3.6427 2.8448 3.0842 2.5257 3.0044 3.1640 3.3236 3.1640 3.3236 3.4033 2.9246
0.0022 0.0215 0.0028 0.1202 0.7168 0.0642 0.1248 0.3062 0.0022 0.0215 0.0022 0.0028 0.0022 0.0235 0.0642 1.4773
0.0001 0.0082 0.0001 0.0290 0.2395 0.0952 0.0048 0.3940 0.0222 0.0001 0.0290 0.0001 0.0290 0.0625 0.0523 0.9660
0.0013 0.0032 0.0041 0.0311 0.1277 0.0030 0.0808 0.0055 0.0383 0.0185 0.0153 0.0041 0.0153 0.1627 0.0006 0.5114
161
0.9660 d y ⋅ x = 2 = 15 − 1 = 0.6539 s y 1.4773 15 − 1 2 s yk
r = d y⋅x = 0.6539 = 0.8086 (İlişkinin yönünün pozitif olduğuna serpilme diyagramından karar verilir.)
d y ⋅ x ve r 'yi aşağıdaki ifadelerle de hesaplayabiliriz. 0.5114 d y ⋅ x = 1 − 2 = 1 − 15 − 1 = 0.6539 1.4773 sy 15 − 1
s yx2
( x )⋅( y ) ∑ (x ⋅ y ) − ∑ n ∑ ( x) ( y) (∑ x − ∑ ) ⋅ (∑ y − ∑ i
r=
i
i
i
2
2 i
i
n
2 i
i
n
, i = 1,2,
2
)
749.00 ⋅ 47.30 15 r= 2 749 47.30 2 (37438.00 − ) ⋅ (150.63 − ) 15 15 2367.90 −
r = 0.8086 bulunur. r ’ nin anlamlılığının sınanması. Hipotezler, H 0 : r = 0 ve H1 : r ≠ 0 şeklinde kurulur.
162
,n
t=
r 2
(1 − r )
⋅ ( n − 2) =
0.8086 (1 − 0.8086 2 )
⋅ (15 − 2) ,
t = 4.96
(Serbestlik derecesi) s.d. = n - 2 = 13 ve p=0.001'e karşılık gelen kuramsal t değeri 4.221 hesapladığımız t değerinden küçük olduğundan H1 hipotezini kabul ederiz (p<0.001). Boy ve ağırlık arasındaki ilişki istatistiksel olarak anlamlıdır.
11.5. SPEARMAN SIRA FARKI İLİŞKİ KATSAYISI Eğer, incelenen değişkenler normal dağılıma sahip değilse, değişkenler sadece sıralamalı ölçüm düzeyinde incelendiyse Pearson - Bravais momentler çarpımı korelasyon katsayısı yerine Spearman sıra farkı ilişki katsayısı hesaplanır. Yine, incelenen seride terim sayısı çok az ise veya normal dağılım koşulu gerçekleşmiyorsa, seri terimleri artan ( veya azalan) sırada sıraya dizilir ve x ve y 'ye ilişkin sıra numaraları üzerinde ilişki aranır. x ve y 'ye ilişkin ölçüm değerlerine sıra numaraları verildiğinde eşit değerlerin her birine, karşılık gelen sıra numaralarının aritmetik ortalaması sıra numarası olarak verilir. Spearman sıra farkı ilişki katsayısı rs simgesi ile gösterilir. rs 'yi aşağıdaki ifade ile hesaplayabiliriz.
rs =
Tx + Ty − ∑ di2 2 ⋅ Tx ⋅ Ty
Burada ;
n3 − n − STx Tx = 12
Ty =
n3 − n − STy 12
STx = ∑ (t 3 − t ) , ST y = ∑ (t 3 − t ) ( t , seride aynı değerleri alan eleman sayısı).
163
Eğer STx ve ST y = 0 ise,
n3 − n n3 − n + − ∑ di2 6⋅ d2 12 rs = 12 = 1 − 3∑ i n −n n3 − n n3 − n 2⋅ ⋅ 12 12
11.5.1.
rs 'NİN
olur.
ANLAM LILIĞININ SINANM ASI
Hipotezler: H 0 : rs = 0 ve H1 : rs ≠ 0 n > 10 ise, hipotezler Student't testi ile sınanır ( r 'nin sınanmasında olduğu gibi). n ≤ 10 ise, hipotezlerin sınanmasında Tablo IX kullanılır. Örnek 2. 10 hastaya x ve y testleri uygulanmış ve aşağıdaki sonuçlar elde edilmiştir. x ve y testlerinde değerlendirme 1-8 arasındaki derecelendirmeye göre yapılmıştır ( 1 = en kötü,..., 8 = en iyi). x ve y testleri arasındaki spearman sıra farkı ilişki katsayısını hesaplayınız. x:
1, 3, 5, 6, 4, 6, 1, 2, 4, 4,
y : 1, 3, 6, 7, 5, 8, 2, 3, 4, 3,
Çözüm :
x ve y değerleri sıraya konarak her bir değere sıra numarası verilir. x serisinde 1 değeri iki kez tekrarlandığından, sıra numarası olarak 1 ve 2 'nin aritmetik ortalaması 1.5 değeri verilir. 2' ye karşılık gelen sıra numarası 3, 3 değerine karşılık gelen sıra numarası 4, 4 değerine karşılık gelen sıra numarası olarak, 3 kez tekrarlandığından, 5,6 ve 7 'nin aritmetik ortalaması olan 6 değeri verilir. x , y değerlerine karşılık gelen sıra numaraları, sıra numaraları arasındaki farklar ve farkların kareleri aşağıdaki tabloda verilmektedir.
164
Tablo 4.
x
sıra( x )
y
sıra(
1.5 4 8 9.5 6 9.5 1.5 3 6 6
1 3 6 7 5 8 2 3 4 3
1 4 8 9 7 10 2 4 6 4
1 3 5 6 4 6 1 2 4 4 Toplam
y)
d i =sıra( x )-sıra( y ) 0.5 0 0 0.5 -1 -0.5 -0.5 -1 0 2
d i2 0.25 0 0 0.25 1 0.25 0.25 1 0 4 7
STx = ∑ (t 3 − t ) = { ( 2³-2) + (3³-3) + (2³-2) } = 36 , ST y =
∑ (t
3
− t ) = (3³-3) = 24,
n3 − n − STx 1000 − 10 − 36 = = 79.5 Tx = 12 12 Ty =
rs =
n3 − n − STy 1000 − 10 − 24 = = 80.5 12 12
Tx + Ty − ∑ di2 2 ⋅ Tx ⋅ Ty
=
79.5 + 80.5 − 7 2 ⋅ 79.5 ⋅ 80.5
rs = 0.95625 rs 'nin anlamlılığının sınanması. Hipotezler H 0 : rs = 0 ve H1 : rs ≠ 0 , n=10 olduğu için hipotezlerin sınanmasında Tablo IX' u kullanabiliriz. p=0.01 için rs 'nin alabileceği en küçük değer 0.79'dur ( Tablo IX) 0.95625 > 0.79 olduğundan yanılma düzeyimiz p<0.01 165
olur, diğer bir ifadeyle H1 hipotezini kabul ederiz. x ve y arasındaki ilişki istatistiksel olarak anlamlıdır. Örnek 3. 5 öğrencide x ve y değişkenleri incelenmiş ve aşağıdaki değerler elde edilmiştir. x ve y arasındaki Spearman sıra farkı ilişki katsayısını hesaplayınız.
x : 85, 60, 73, 40, 90 y : 93, 75, 65, 50, 80 Çözüm : x ve y serilerinde ölçüm değerlerine karşılık gelen sıra numaraları, sıra numaraları arasındaki farklar ve farkların kareleri hesaplanır (Tablo 5). Tablo 5. Öğrencinin adı
x
y
sıra( x )
A B C D E Toplam
85 60 73 40 90
93 75 65 50 80
4 2 3 1 5
sıra(
y)
5 3 2 1 4
di
d i2
-1 -1 1 0 1
1 1 1 0 1 4
x ve y 'de tekrarlayan değerler olmadığından STx ve ST y değerleri sıfıra eşittir.
rs == 1 −
6 ⋅ ∑ di2 3
n −n
=1−
6⋅4 = 0.80 125 − 5
n=5 ve p = 0.05 için rs 'nin alt sınırı 1'dir (Tablo IX). 0.80 < 1 olduğundan
H 0 : rs = 0 hipotezini kabul ederiz. Diğer bir ifade ile, x ve y değişkenleri arasındaki sıra farkı ilişki katsayısı istatistiksel olarak anlamlı değildir ( p > 0.05).
11.6. KISMİ KORELASYON KATSAYISI
x , y , z değişkenleri arasındaki ilişkiyi incelemek isteyelim. z değişkeni x ve y değişkenini etkiliyorsa, x ve y arasındaki korelasyonu hesaplarken z 'nin x ve y üzerindeki etkisinin giderilmesi gerekir. Bu durumda, x ve y
166
arasında hesaplanan korelasyon katsayısına kısmi korelasyon katsayısı denir ve rxy / z simgesi ile gösterilir. Kısmi korelasyon katsayısı aşağıdaki ifade ile hesaplanır.
rxy / z =
rxy − rxz ⋅ ryz (1 − rxz2 ) ⋅ (1 − ryz2 )
Burada, rxy , x ve y arasındaki, rxz , x ve z arasındaki ve ryz , y ve z arasındaki basit korelasyonu (Pearson momentler çarpımı korelasyon katsayısı) göstermektedir. Aynı şekilde, x 'in y ve z üzerindeki etkisinin giderildiği durumda y ve z arasındaki kısmi korelasyon katsayısı ve y 'nin x ve z üzerindeki etkisinin giderildiği durumda x ve z arasındaki kısmi korelasyon katsayısını aşağıdaki ifadelerle hesaplarız. Etkisini gidermek istediğimiz değişken sayısı kısmi korelasyon katsayısının derecesini belirler. rxy/z, ryz/x ve rxz/y 1.dereceden kısmi korelasyon katsayılarıdır.
ryz / x =
rxz / y =
ryz − ryx ⋅ rzx (1 − ryx2 ) ⋅ (1 − rzx2 ) rxz − rxy ⋅ rzy (1 − rxy2 ) ⋅ (1 − rzy2 )
11.7. ÇOKLU REGRESYON VE KORELASYON y 'yi açıklanan değişken (bağımlı değişken), x ve z 'yi açıklayıcı değişkenler (bağımsız değişkenler) olarak kabul edersek y 'nin x 'e ve z 'ye göre regresyon denklemini hesaplayabiliriz.
en
küçük
kareler
167
yöntemi
ile
aşağıdaki
şekilde
y 'nin x 'e ve z 'ye göre regresyon denklemini aşağıdaki ifade ile gösterelim.
y =b0 +b1 ⋅ x + b2 ⋅ z Burada, b0 regresyon sabiti, b1 ve b2 regresyon katsayılarıdır.
i . gözleme karşılık gelen kuramsal
yi' değerini
yi' =b 0 +b1 ⋅ x + b2 ⋅ z
ifadesi ile hesaplarız. ' i
2
∑ ( y − y ) = ∑ (b
0
i
+ b1 ⋅ x i + b2 ⋅ zi − yi ) 2 ifadesini
en küçük yapan b0 sabiti, b1 ve b2 regresyon katsayılarını aşağıda verilen normal denklemleri çözerek hesaplarız. Normal denklemler.
∑ y = n ⋅ b + ( ∑ x ) ⋅ b + (∑ z ) ⋅ b ∑ ( x ⋅ y) = (∑ x) ⋅ b + (∑ x ) ⋅ b + (∑ ( x ⋅ z)) ⋅ b ∑ ( y ⋅ z) = (∑ z) ⋅ b + (∑ x ⋅ z) ⋅ b + (∑ ( z )) ⋅ b 0
1
(1)
2
2
0
1
2
2
0
1
2
(2) (3)
x , y , z arasındaki çoklu korelasyon katsayısını da aşağıdaki ifade ile hesaplarız. Çoklu korelasyon katsayısı ry . xz simgesi ile gösterilir. Burada y açıklanan değişken, x ve z açıklayıcı değişkenlerdir.
ry. xz =
ryx2 + ryz2 − 2 ⋅ ryx ⋅ ryz ⋅ rxz 1 − rxz2
11.7.1. ÇOKLU KORELASYON KATSAYISININ ANLAM LILIĞININ SINANM ASI Çoklu korelasyon katsayısı F testi ile sınanır. Hipotezler H 0 : ry . xz = 0 ve H1 : ry . xz ≠ 0 şeklinde kurulur. 168
F=
ry2. xz ⋅ (n − k ) (1 − ry2. xz ) ⋅ (k − 1)
Burada, k incelenen değişken sayısıdır. Hesaplanan F değeri (n -k) ve (k -l) serbestlik dereceli kuramsal F değeri (Tablo V) ile karşılaştırılarak H 0 veya H1 hipotezi kabul edilir. Örnek 4. 6-11 yaş grubu 12 çocukta ölçülen kan basıncı ( y ), ağırlık ( x ) ve boy ( z ) değerleri aşağıda (Tablo 6) verilmektedir. Basit, kısmi ve çoklu korelasyon katsayılarını ve y 'nin x 'e ve z 'ye göre regresyon denklemini en küçük kareler yöntemi ile hesaplayınız. Tablo 6. Kan basıncı, ağırlık ve boy değerleri Denek No
Kan basıncı
Ağırlık
Boy
1 2 3 4 5 6 7 8 9 10 11 12 Toplam
102.40 103.00 105.90 105.30 107.60 108.10 96.40 97.10 95.80 98.80 99.70 102.00 1222.10
21.10 22.00 25.60 27.70 30.10 32.10 19.10 20.20 22.40 24.90 26.60 29.60 301.40
117.00 121.00 126.00 132.00 137.00 140.00 113.00 117.00 122.00 127.00 133.00 136.00 1521.00
x
y
z
Çözüm :
x 2 , y 2 , z 2 , ( x ⋅ y ), ( x ⋅ z ) ve ( y ⋅ z ) değerleri hesaplanarak toplamlar alınır (Tablo 7).
169
Tablo 7.
y2
x2
z2
(x⋅z)
10485.76 10609.00 11214.81 11088.09 11577.76 11685.61 9292.96 9428.41 9177.64 9761.44 9940.09 10404.00 124665.57
445.21 484.00 655.36 767.29 906.01 1030.41 364.81 408.04 501.76 620.01 707.56 876.16 7766.62
13689.00 14641.00 15876.00 17424.00 18769.00 19600.00 12769.00 13689.00 14884.00 16129.00 17689.00 18496.00 193655.00
2468.70 2662.00 3225.60 3656.40 4123.70 4494.00 2158.30 2363.40 2732.80 3162.30 3537.80 4025.60 38610.60
Basit korelasyonlar.
rxy = 0.738
rxz = 0.988
170
(x⋅
y)
2160.64 2266.00 2711.04 2916.81 3238.76 3470.01 1841.24 1961.42 2145.92 2460.12 2652.02 3019.20 30843.18
(
y⋅z)
11980.80 12463.00 13343.40 13899.60 14741.20 15134.00 10893.20 11360.70 11687.60 12547.60 13260.10 13872.00 155183.20
1222.10 ⋅1521.00 12 ryz = 2 1222.10 1521.00 2 (124665.57 − ) ⋅ (193655.00 − ) 12 12 ryz = 0.669 155183.20 −
Kısmi korelasyon katsayıları.
rxy / z =
rxy − rxz ⋅ ryz (1 − rxz2 ) ⋅ (1 − ryz2 )
=
0.738 − 0.988 ⋅ 0.669 (1 − 0.9882 ) ⋅ (1 − 0.6692 )
rxy / z = 0.671 ryz / x =
ryz − ryx ⋅ rzx (1 − ryx2 ) ⋅ (1 − rzx2 )
=
0.669 − 0.738 ⋅ 0.988 (1 − 0.7382 ) ⋅ (1 − 0.9882 )
ryz / x = -0.577 rxz / y =
rxz − rxy ⋅ rzy (1 − rxy2 ) ⋅ (1 − rzy2 )
=
0.988 − 0.738 ⋅ 0.669 (1 − 0.7382 ) ⋅ (1 − 0.6692 )
rxz / y = 0.985 Çoklu korelasyon katsayısı.
ry. xz = ry. xz =
ryx2 + ryz2 − 2 ⋅ ryx ⋅ ryz ⋅ rxz 1 − rxz2 0.7382 + 0.6692 − 2 ⋅ 0.738 ⋅ 0.669 ⋅ 0.988 1 − 0.9882
ry . xz = 0.8344 ry . xz 'nin anlamlılığının sınanması.
171
F=
ry2. xz ⋅ (n − k ) (1 − ry2. xz ) ⋅ (k − 1)
=
2 2 0.83869 (12 –− 3) 3) 0.8344 ⋅ ⋅(12 ==10 .67 10.31 22 (1 (1 –− 0.8344 0.83869 ⋅) ⋅(3(3–−1) 1)
Hesaplanan F değeri, 0.05 yanılma düzeyi ve (12 - 3) ve (3 - 1) serbestlik derecelerine karşılık gelen kuramsal F = 4.26 değerinden (Tablo Va) büyük olduğundan H1 : ry . xz ≠ 0 hipotezi kabul edilir. Belirleme katsayısı d y. xz = ry2. xz = 0.6962'dir. Yani, y 'deki değişkenliğin % 69.62'sini x ve z değişkenleri ile açıklamak mümkündür.
y 'nin x 'e ve z 'ye göre regresyon denklemi. (1) 1222.10 = 12 ⋅ b0 + 301.40 ⋅ b1 + 1521.0 ⋅ b2 (2) 30843.18 = 301.4 ⋅ b0 + 7766.62 ⋅ b1 + 38610.60 ⋅ b2 155183.20 = 1521.0 ⋅ b0 + 38610.60 ⋅ b1 + 193655.00 ⋅ b2 (3) (1), (2) ve (3) nolu denklemlerin çözümlenmesi ile b0 = 177.20563, b1 = 3.38111, b2 = - 1.26459 değerleri bulunur. Regresyon denklemini aşağıdaki gibi yazarız.
y = 177.21 + 3.38 ⋅ x − 1.26 ⋅ z
172
Bölüm 12
Tek Yönlü Varyans Analizi (Model 1)
12.1. VARYANS ANALİZİ MODELİNİN BİLEŞENLERİ İki ya da daha fazla gruba ilişkin, aritmetik ortalamaların karşılaştırılmasında varyans analizi yöntemi kullanılır. Tek yönlü varyans analizinde örneklerin (deneklerin) gruplara rastgele dağıldığı varsayılır. Modelde, deney sonucunda elde edilen bir cevabı (bir gözlemi, bir ölçüm değerini) etkileyen üç ana bileşen vardır.
xij = µ + " i + ! ij Burada,
xij = deney sonucu elde edilen ölçüm değerleri ( i .grupta j .ölçüm değeri)
i = 1,2,...,k (grup sayısı) ve j = 1,2,...,n (deneme sayısı)
µ = anayığın ortalaması 173
! i = i . grubun deneye etkisi ! ij = örnekleme hatası (rastlantısal hata). Her bir grupta gözlem sayısının eşit olduğunu varsayarsak, k grupta elde edilen sonuçları aşağıdaki gibi (Tablo 1) gösterebiliriz. Tablo 1. k Gruba ilişkin gözlem sonuçları
Grup sayısı( i )
1
Gözlem sayısı ( j ) 2 3 ....
Ortalama n
x11 x21 x31
x12 x22 x32
x13
....
x23
....
x2 n
x33
....
x3n
xi x1 . x2. x3.
. . .
. . .
. . .
. . .
. . .
. . .
. . .
k
xk1
xk 2
xk 3
....
xkn
xk .
1 2 3
Toplam
x1n
x..
Tek yönlü varyans analizinin varsayımları aşağıda verilmektedir. 1. Modelde yer alan grup etkileri toplanma özelliğine sahiptir. k
!"
i
=0
i =1
2. Hata terimleri ( ! ij ) ortalaması sıfır olan normal dağılıma sahiptir.
174
3. Hata terimleri birbirinden bağımsızdır ve rastlantısal olarak ortaya çıkmaktadır. Tek yönlü varyans analizinde hipotezleri aşağıdaki gibi kurarız.
H 0 : xi = x j , (i ! j ) (grup ortalamaları arasındaki farklar rastlantısaldır).
H 1 : En az iki grup ortalaması birbirinden farklıdır. 12.2. TOPLAM VARYANSIN AYRIŞTIRILMASI Bütün grupların birleştirilmesi ile elde edilen ana grubun ortalamasını (anayığın ortalaması µ 'nün tahminini) x.. ile ve i . grubun ortalamasını x i. ile gösterirsek ( xij ! µ ) farkını aşağıdaki şekilde iki kısma ayırabiliriz. ( xij - x.. ) = ( xij - x i . ) + ( x i . - x.. ) Her iki tarafın karesini alıp toplama işlemini yaparsak aşağıdaki sonucu elde ederiz. k
n
!! ( xij " x..)2 = i =1 j =1
k
k
n
!! ( xij " xi .)2 + n # ! ( xi . " x..)2 i =1
i =1 j =1
+ 2#
k
n
!! (( x
ij
" x i .) # ( x i . " x..)
i =1 j =1
Eşitliğin sağ tarafındaki son terim sıfıra eşit olduğundan k
n
!! ( xij " x..)2 = i =1 j =1
k
k
n
!! ( xij " xi .)2 + n # ! ( xi . " x..)2 i =1
i =1 j =1
ifadesini yazabiliriz. 175
Yukarıdaki eşitliğin sol ve sağ tarafındaki terimleri sözel olarak aşağıdaki şekilde ifade edebiliriz. k
n
!! ( x
ij
" x..) 2 : Genel kareler toplamı (G.K.T.) (toplam değişkenlik)
i =1 j =1 k
n
!! ( x
ij
" xi .) 2 : Gruplar içi kareler toplamı (G.I.K.T.)
i =1 j =1
(açıklanmayan değişkenlik, hata) k
n # ! ( xi . " x..) 2 : Gruplar arası kareler toplamı (G.A.K.T.) i =1
(açıklanan değişkenlik) G.K.T. = G.I.K.T. + G.A.K.T. Tek yönlü varyans analizi, k grupta n j gözlemi içeren bir deneyleme düzeninde genel değişimi gruplar arası ve gruplar içi değişime (hata) ayırmayı amaçlamaktadır. Varyans analizi sonucu elde edilen değişimler kaynaklarına göre bir tabloda gösterilir. Bu tabloya varyans analizi tablosu denir. Tablo 2. Varyans Analizi Tablosu Değişim kaynağı
Kareler toplamı
Serbestlik derecesi
Kareler ortalaması
Gruplar arası
G.A.K.T.
k !1
G.A.K.O.
Gruplar içi (Hata)
G.I.K.T.
N !k
G.I.K.O.
Toplam
G.K.T.
N-1 176
F
değeri
Anlam düzeyi
p=?
Burada,
N = n1 + n2 + L + nk (Gruplar arası kareler ortalaması) G. A.K .O. =
(Gruplar içi kareler ortalaması)
G.İ.K.O. G.Y.K .O. =
G. A.K .T . k !1
G .Y.K .T . G.İ.K.T. 'dir. N !k
G. A.K .O ifadesi ile hesaplanan F değeri, ( k ! 1 ) , ( N ! k ) serbestlik G .Y.K .O. G.İ.K.O.
derecelerine ve kabul edilen anlam düzeyine karşılık gelen kuramsal F değeri (Tablo V) ile karşılaştırılarak H 0 veya H1 hipotezlerinden biri kabul edilir.
Varyans analizi sonucu H1 hipotezini kabul edersek (yani en az iki grubun ortalaması birbirinden farklı ise) ortalamaları farklı olan grupları belirlememiz gerekir.
12.3. ÇOKLU KARŞILAŞTIRMA (EN KÜÇÜK ÖNEMLİ FARK (LSD) YÖNTEMİ) Gruplar eşit sayıda (n) denek içeriyorsa, ikişer ikişer tüm grupların ortalamaları arasındaki mutlak farklar hesaplanır. Hesaplanan farklar aşağıda ifadesi verilen kritik D değeri ile karşılaştırılır. Kiritik D değerine eşit veya daha büyük farkları oluşturan grupların ortalamalarının, kabul edilen anlam düzeyinde istatistiksel olarak anlamlı derecede farklı olduğuna karar verilir. Kritik D = t !
2!G .Y.K .O. G.İ.K.O. n
Burada, t değeri olarak, kabul edilen anlam düzeyi ve ( N ! k ) serbestlik derecesine karşılık gelen kuramsal t değeri alınır. Eğer gruplar eşit sayıda denek içermiyorsa, karşılaştırılan iki grup ortalamasına ilişkin kritik D değeri aşağıdaki gibi hesaplanır. 177
Kritik D = t !
G .Y.K .O. G .Y.K .O. G.İ.K.O. + G.İ.K.O. ni nj
Örnek 1. 4 Ayrı klinikten rastgele seçilen 40 hastanın klinikte kalış sürelerine ilişkin bilgiler aşağıda verilmektedir. Klinikte kalış süresi açısından klinikler arasında istatistiksel olarak anlamlı bir fark olup olmadığını sınayınız. Tablo 3. Dört ayrı klinikte hastaların kalış süreleri. Klinik adı 1 2 3 4
1
2
3
4
8 6 8 10
7 7 7 12
8 5 9 10
6 5 6 11
Hasta no 5 6 9 6 8 9
7 6 7 8
7
8
9
10
5 8 6 12
8 6 9 11
9 5 8 10
7 6 7 9
Çözüm : x1. x 2 . x 3 . x 4 . ile grup ortalamalarını (kliniklerde ortalama kalış sürelerini) ve x.. ile anayığın ortalamasını ( toplam 40 hastanın ortalama kalış süresi) gösterelim. Sonuçlar aşağıdaki tabloda verilmektedir. Tablo 4. Kliniklere İlişkin Ortalama Kalış Süreleri. Klinik adı 1 2 3 4 Toplam
Ortalama süre (gün) 7.400 6.000 7.500 10.200 7.775
Hipotezler:
H 0 : x1. = x 2 . = x3 . = x 4 .
H1 : En az iki klinik ortalaması birbirinden farklıdır. Genel kareler toplamı, gruplar arası kareler toplamı ve gruplar içi kareler toplamını aşağıdaki gibi hesaplarız. 178
4
10
"" ( x
ij
! 7.775) 2 = 140.975
(G.K.T.)
i =1 j =1
4
10 # ! ( xi . " 7.775) 2 = 92.475
(G.A.K.T.)
i =1
G.K.T. = G.I.K.T. + G.A.K.T. G.I.K.T. = 140.975 - 92.475 = 48.500 Varyans analizi tablosu aşağıdaki gibi kurulur. Tablo 5. Varyans analizi tablosu
F
Değişim kaynağı
Kareler toplamı
Serbestlik derecesi
Kareler ortalaması
değeri
Anlam düzeyi
Gruplar arası Gruplar içi (hata)
92.475
3
30.8250
22.8807
p < 0.001
48.500
36
1.3472
Toplam
140.975
39
Hesaplanan F değeri (22.8807), (3 ; 36) serbestlik dereceli ve p=0.001 anlam düzeyine karşılık gelen kuramsal F=6.7436 değerinden büyük olduğundan H1 hipotezi kabul edilir. Çoklu karşılaştırma: 0.05 anlam düzeyinde 36 serbestlik dereceli kuramsal t değeri 2.03 değerine eşittir (Student't tablosu). Kritik D = t !
2 !·GG.İ.K.O. .Y.K .O. 2 ! 1.3472 = 2.03 ! n 10 179
Kritik D = 1.0537 Grupların ikişerli mutlak farklarının kritik D değeri ile karşılaştırılması aşağıdaki gibidir. |G1 - G2| = | 7.40 - 6.00 | = 1.40 > 1.0537 |G1 - G3| = | 7.40 - 7.50 | = 0.10 < 1.0537 |G1 - G4| = | 7.40 - 10.2 | = 2.80 > 1.0537 |G2 - G3| = | 6.00 - 7.50 | = 1.50 > 1.0537 |G2 - G4| = | 6.00 - 10.2 | = 4.20 > 1.0537 |G3 - G4| = | 7.50 - 10.2 | = 2.70 > 1.0537
180
anlamlı anlamlı değil anlamlı anlamlı anlamlı anlamlı.
Bölüm 13
Parametrik Olmayan Testler (Sıra İstatistik Testleri)
Bu bölümde, “Mann-Whitney U testi” ve “Wicoxon işaretli sıra testi” incelenecektir. Literatürde, “parametrik olmayan istatistik yöntemler”, “sıra istatistik testleri” olarak da ifade edilir. (X) rastlantısal değişkeni normal dağılıma sahip değilse veya sıralamalı ölçüm düzeyinde incelendiyse, parametrik testler (bağımsız gruplarda (t) testi, eşlendirilmiş serilerde t testi, tek yönlü varyans analizi, … ) yerine parametrik olmayan istatistik testler kullanılır. Yine, parametrik olmayan testlerde, (X) değişkeninin değerleri yerine, (X)’in sıra değerleri ve karşılaştırmalarda aritmetik ortalamalar yerine ortancalar kullanılır. “Spearman sıra ilişki katsayısı” ile sıralamalı ölçüm düzeyinde incelenen iki değişken arasındaki ilişkinin incelenmesini “korelasyon ve regresyon” bölümünde görmüştük.
13.1. MANN WHITNEY U TESTİ (Wilcoxon Rank Sum Test) İki bağımsız örneklem grubuna ait aritmetik ortalamanın karşılaştırılmasında Student’t testinin (büyük örneklemlerde ! testi) kullanıldığını “Ortalamaların karşılaştırılması” bölümünde incelemiştik. Student’t testinin kullanılabilmesi için, incelenen (X) sürekli değişkenin aşağıda belirtilen koşulları sağlaması gerektiğini hatırlayalım. 181
(a) İncelenen (X) rastlantısal değişkeni her iki örneklem grubunda normal dağılıma sahip olmalı. (b) Her iki grupta varyanslar ya da standart sapmalar eşit olmalı. (c) Gözlemler, her iki grupta da birbirinden bağımsız olmalı. (d) Örneklemler basit rastlantısal örnekleme yöntemiyle seçilmiş olmalı. (e) (X) rastlantısal değişkeni sürekli olmalı. Grupların karşılaştırılmasında, incelenen (X) rastlantısal değişkeni normal dağılıma sahip değilse veya (X) değişkeni sıralamalı ölçüm düzeyinde incelendiyse, “bağımsız gruplarda (t) testi” yerine “Mann – Whitney U testi” kullanılır. Mann-Whitney U testinin kullanılabilmesi için de aşağıda belirtilen koşulların sağlanmış olması gerekir. (a) Ölçüm düzeyi en azından sıralamalı olmalı (b) Gözlemler, her iki grupta da birbirinden bağımsız olmalı. (c) Örneklemler basit rastlantısal örnekleme yöntemiyle seçilmiş olmalı. İki bağımsız grubun ortancalarının karşılaştırıldığı Mann – Whitney U testinde hipotezler aşağıdaki gibi kurulur.
H 0 : !1 = ! 2 H1 : !1 " ! 2 ( n1 ) ve ( n2 ) büyüklüklü örneklemler tek bir grup gibi göz önüne alınarak, (X) değişkenine ait gözlem değerleri küçükten büyüğe doğru sıraya dizilir. En küçük değere 1 sıra numarası, 2. büyük değere 2 sıra numarası, ... ve en büyük değere ( n1 + n2 ) sıra numarası verilir. (X)’in eşit değerleri için, karşılık gelen sıra değerlerinin aritmetik ortalaması kullanılır. 1. grupta sıra değerleri toplamı ( R1 ) ve 2. grupta sıra değerleri toplamı ( R2 ) ise, ( U1 ) ve ( U 2 ) değerleri aşağıdaki gibi hesaplanır. 182
n1 ! (n1 + 1) 2 n2 ! (n2 + 1) U 2 = R2 2 U test değeri olarak, U1 ve U 2 değerlerinden küçük olanı alınır. n1 ! 20 ve n2 ! 20 ise, hesaplanan U değeri Tablo X ve Tablo XI’de verilen kritik U değeri ile karşılaştırılarak, H 0 ve H1 hipotezlerinden hangisinin kabul edileceğine karar verilir. U hesap ! U kritik ise, H1 hipotezi kabul edilir.
U1 = R1 -
n1 > 20 veya n2 > 20 ise, hipotezler aşağıdaki ifade ile karşılaştırılır. n !n U" 1 2 2 != n1 + n2 + 1 n1 ! n2! ! 12 Normal alanlar tablosu (Tablo III) kullanılarak, hesaplanan ! test değerine karşılık gelen istatistiksel anlamlılık değeri (p) bulunur. Diğer bir ifadeyle, hesaplanan ! ! 1.96 ise, H1 hipotezi kabul edilir. Örnek 1. Kontrol ve deney gruplarında, (X) rastlantısal değişkeni ölçülmüş ve aşağıdaki sonuçlar elde edilmiştir. Kontrol ve deney gruplarına ait ortanca değerlerinin aynı olup olmadığını sınayınız.
Tablo 1. Kontrol ve deney gruplarında (X) sonuçları. Kontrol grubu 3 8 2 16 5
n1 = 5
Deney grubu 1 14 4 7 23 10
183
n2 = 6
Çözüm : 1.grupta ortanca !1 =5 ve 2. grupta ortanca ! 2 =8.5 olarak hesaplanır. (X) değerleri, hangi grupta olduklarına bakılmaksızın, sıraya konur ve her bir grup için, (X)’in sıra değerleri toplamları ( R1 , R2 ) hesaplanır (Tablo2). Tablo 2. (X)’e ait sıra değerleri. Kontrol grubu
Deney grubu
n1 = 5
n2 = 6
(X) 3 8 2 16 5
Sıra (X) 3 7 2 10 5
(X) 1 14 4 7 23 10
R1 =27
Sıra (X) 1 9 4 6 11 8 R2 =39
( U1 ) ve ( U 2 ) değerleri aşağıdaki gibi hesaplanır.
U1 = R1 -
n1 ! (n1 + 1) 5 ! (5 + 1) = 27 = 12 2 2
n2 ! (n2 + 1) 6 ! (6 + 1) = 39 = 18 2 2 Hesaplanan U = 12 değeri ( U1 ve U 2 ’den küçük olan) ! =0.05 için kritik U = 5 (Tablo X) değerinden büyük olduğundan H 0 : !1 = ! 2 hipotezi
U 2 = R2 -
kabul edilir.
13.2. WILCOXON İŞARETLİ SIRA TESTİ Eşlendirilmiş serilerde (“önce” ve “sonra” serilerinde), (X) rastlantısal değişkeni normal dağılıma sahip değilse veya (X) değişkeni sıralamalı ölçüm düzeyinde incelendiyse, “eşlendirilmiş serilerde (t) testi” yerine “Wilcoxon işaretli sıra testi ” kullanılır. 184
Bağımlı gruplarda, (X)’e ait ortanca değerlerinin farklılığı (diğer bir ifadeyle fark serisinde ortanca değerinin sıfıra eşit olup olmadığı) Wilcoxon işaretli sıra testi ile sınanır. Hipotezler aşağıdaki gibi kurulur.
H0 : ! = 0 H1 : " ! 0 (X)’in deney öncesi ve deney sonrası değerlerine ait fark serisi, küçükten büyüğe doğru sıraya konarak numaralandırılır. Sıraya konma ve numaralandırma işleminde farkın işareti göz önüne alınmaz. Daha sonra negatif farklara ait sıra numaraları toplamı ile pozitif farklara ait sıra numaraları toplamı hesaplanır. Farklar serisinde bir tane sıfır değeri varsa, bu gözlem değeri değerlendirmeden çıkarılır ve gözlem sayısı (n-1) olur. Farklar serisinde sıfır değerleri birden çok ise, yarısına (-), diğer yarısına da (+) işareti verilir. Negatif ve pozitif işaretli fark sayının küçük olanına ait sıra numaraları toplamı T hesaplanır.
n ! 20 ise, hesaplanan sıra numaraları toplamı Tablo XII’de verilen kritik değerle karşılaştırılarak gruplar arasındaki farklılığın anlamlılığı sınanır. n > 20 ise, gruplar arasındaki anlamlılık aşağıdaki ifade ile belirlenir.
T"
#=
n ! (n + 1) 4
1 ! n ! (n + 1) ! (2n + 1) 24
! ! 1.96 ise, H1 hipotezi kabul edilir. Örnek 2. Belli bir tedaviden önce ve sonra ölçülen (X) değerleri aşağıdaki tabloda (Tablo 3) verilmektedir. Fark serisine ait ortanca değerinin sıfıra eşit olup olmadığını ( tedavinin etkinliğini) sınayınız.
185
Tablo 3. Tedavi öncesi ve sonrası (X) değerleri. Tedavi öncesi 8 12 14 2 25 14 13 16 18 22
Tedavi sonrası 10 11 17 6 18 4 20 16 10 12
Çözüm : (X)’e ait fark serisi hesaplanır (Tablo 4). Negatif fark sayısı 5, pozitif farkların sayısı 4 ve sıfır fark sayısı 1’dir. Toplam gözlem çifti sayısı bir eksiltilir (n=10 – 1 = 9). Geriye kalan 9 fark değeri, işaret göz önüne alınmaksızın, sıraya konarak numaralandırılır. Daha sonra sıra numaralarına farkların işareti konur. İşaret sayısı az olan pozitif farklara ait işaretli sıra numaraları toplamı ( T =14) hesaplanır. Hesaplanan T =14 değeri, Tablo XII’de ! =0.05’e karşılık gelen kritik T =6 değerinden büyük olduğundan H 0 : ! = 0 hipotezi kabul edilir. Tablo 4. Tedavi öncesi ve sonrası farklara ait sıra numaraları Tedavi öncesi Tedavi sonrası 8 12 14 2 25 14 13 16 18 22
10 11 17 6 18 4 19 16 10 11
Farklar (X) +2 -1 +3 +4 -7 -10 +6 0 -8 -11 186
Sıra no
İşaretli sıra no
2 1 3 4 6 8 5 -7 9
+2 -1 +3 +4 -6 -8 +5 --7 -9
Bölüm 14
Araştırma Planlaması
Çalışma planlamasında ve istatistiksel çözümlemede yer alan önemli kavramları aşağıdaki gibi sıralayabiliriz. 1. Araştırma tipleri. 2. Rastlantısallık (randomizasyon). 3. Körleme. 4. Genelleme. 5. Güven aralığı. 6. Hipotez testleri, hipotezlerin sınanması. 7. p değeri. ................... Genelleme, güven aralığı, hipotezlerin kurulması, hipotez testleri “p değeri” kavramları daha önceki bölümlerde açıklanmıştı. Bu bölümde; araştırma tipleri, randomizasyon ve körleme kavramlarını açıklamaya çalışacağız.
14.1. ARAŞTIRMA TİPLERİ Araştırmaları, amaçlarına ya da yapılış tarzlarına göre aşağıdaki gibi sınıflayabiliriz. Gözlemsel / Deneysel Gözlemsel çalışmalarda bireylere (deneklere) bir işlem veya girişim yapılması söz konusu değildir. Bu tür çalışmalarda, sadece gözlem sonucu elde 187
edilen bireysel özellikler kaydedilir. Deneysel araştırmalarda ise bireylerin bir kısmına veya tümüne bir girişimde (tedavi,…) bulunulmakta ve girişim öncesi ve sonrası bireylerde ortaya çıkan değişiklikler kaydedilmektedir. Tanımlayıcı / Çözümleyici Tanımlayıcı araştırmalarda bireyleri tanımaya yönelik, çözümleyici araştırmalarda ise neden–sonuç ilişkilerini belirlemeye yönelik veriler toplanmaya çalışılır. Tanımlayıcı araştırmalarda “kim”, “nerede” ve “ne zaman” sorularına yanıt aranırken, çözümleyici araştırmalarda ise “neden”, “niçin” sorularına yanıt aranır. Tanımlayıcı araştırmalarla elde edilen verilere dayanılarak hipotezler kurulur. Kurulan bu hipotezlerin sınanması, şüphelenilen etyolojik neden ile hastalık arasında bir ilişkinin bulunup bulunmadığının araştırılması çözümleyici araştırmalarla gerçekleştirilir. Retrospektif / Prospektif Retrospektif araştırmalarda incelenen veriler araştırmanın başlama tarihinden önceki dönemle ilgilidir. Sağlıklı kişilerle hastalıklı kişilerin geçmişteki bilgileri karşılaştırılarak hastalık nedenleri araştırılır. Burada, klinikte tutulan hasta dosyalarının içeriği ve kalitesi çok önemlidir. Prospektif çalışmalarda ise, bireylerin ileriye dönük olarak izlenmesi ve bu izleme sonucunda ortaya çıkan değişikliklerin kaydedilmesi söz konusudur. Sağlık alanında sıklıkla kullanılan araştırma tipleri aşağıdaki gibidir. 14.1.1. VAKA SERİLERİ Hasta grubuna ait basit tanımlayıcı istatistikler elde edilir. İncelenen hastalıkla ilgili olarak, “kim”, “nerede” ve “ne zaman” sorularına yanıt aranır. Çalışmada elde edilen sonuçlara dayanılarak çeşitli hipotezler kurulur.
14.1.2. KESİTSEL ARAŞTIRMALAR Bu tür araştırmalarda bir olay çok kısa bir süre içerisinde anket veya genel tarama yöntemi ile incelenir. Gerekli veriler toplandıktan sonra neden– sonuç ilişkileri belirlenmeye çalışılır. Genellikle hastalıklara ait prevalans (hastalığın toplumda görülme sıklığı) değerleri bu tür çalışmalarla elde edilir (Şekil 1). 188
Şekil 1. Kesitsel araştırma
14.1.3. KOHORT TİPİ ARAŞTIRMALAR İzlemeye alınacak bireylerin oluşturduğu kohort, etkenle karşılaşacak ve karşılaşmayacak iki gruba rastlantısal olarak ayrılır. Her iki grup belirli bir süre izlenerek hastalık gelişimi ile ilgili bilgiler toplanır (Şekil 2).
Şekil 2. Kohort Çalışması. Bu tür araştırmalarda, hastalık insidansı (incelenen sürede, hastalık görülme sıklığı), göreceli risk oranı (relatif risk, (RR) ), etkene atfedilen risk 189
hesaplanabilir. Rastlantısal olarak oluşturulan gruplar, izlem altında olduklarından, bu tür araştırmalarda hastalık gelişimi ile ilgili daha doğru bilgi elde edilir. İzleme sonuçlarını aşağıdaki gibi, 2x2 tablosunda gösterebiliriz (Tablo 1). Tablo 1. Kohort araştırma tipinde sonuçlar. Hastalık gelişenler (D+)
Hastalık gelişmeyenler (D-)
Toplam
b
( a + b)
Etkene maruz kalanlar (E + ) Etkene maruz kalmayanlar (E -)
a c
d
(c + d )
Toplam
(a + c)
(b + d )
(a + b + c + d )
Etkene maruz kalan ve etkene maruz kalmayan gruplarda, ortaya çıkan hastalık insidansları karşılaştırılarak, etken ile hastalık arasında bir ilişkinin var olup olmadığı araştırılır. 14.1.3.1. KOHORT TİPİ ARAŞTIRMALARDA RİSK ÖLÇÜTLERİ Hastalık insidansı; incelenen süre içerisinde ortaya çıkan yeni olguların sıklığını gösterir. İzleme periyodunda ortaya çıkan olgular
I = Risk altındaki nüfus (izlenen hasta sayısı) Etkene maruz kalan grupta hastalık insidansı I E + = kalmayan grupta ise, I E ! =
a , etkene maruz a+b
c ile hesaplanır. c+d
Etken–hastalık arasındaki ilişki, etken varlığının hastalık oluşumuna katkısını gösteren risk değeri, “Relatif Risk” ( RR ) ile gösterilir. RR değeri, 190
etkene maruz kalan gruptaki hastalık insidansının, etkene maruz kalmayan gruptaki insidansa bölünmesiyle elde edilir. Etkene maruz kalan grubun insidansı
RR = Etkene maruz kalmayan grubun insidansı
RR =
I E+ I E!
a P( D + / E +) = = a+b c P ( D + / E !) c+d
RR ’in güven aralığı aşağıdaki ifade ile hesaplanır.
e
ln ( RR ) ±"
1 1 1 1 ! + ! a a +b c c + d
% 95 güven aralığı için ! değeri 1.96 , % 99 için 2.58 olarak alınır (Tablo III).
RR 'nin 1'e yakın değerler alması (“1” değerinin RR ’nin güven aralığı içinde yer alması) hastalık ile etken maruziyeti arasında bir ilişkinin istatistiksel olarak anlamlı olmadığını, RR 'nin 1'den küçük olması veya 1'den büyük olması ise hastalık ile maruziyet arasında bir ilişki olduğunu gösterir. RR , sadece kohort çalışmalarında veya deneysel çalışmalarda hesaplanabilir. Olgu-kontrol çalışmalarında insidans değeri hesaplanamadığından RR direkt olarak hesaplanamaz. Bu tür çalışmalarda RR ’nin tahmin değeri için OR değeri hesaplanır. Etken varlığı ile hastalık insidansları arasındaki ilişkileri göstermek için
RR ile birlikte “Etkene Atfedilen Risk” ( AR ) ve “Yüzde Etkene Atfedilen Risk” (% AR ) değerleri kullanılır. Hesaplamalarda, etkene maruz kalan grup yerine toplum değerlerini kullanırsak, “Toplumda Etkene Atfedilen Risk” ( TAR ) ve “Toplumda Yüzde Etkene Atfedilen Risk” ( %TAR ) değerlerini elde ederiz. 191
Etkene atfedilen risk ( AR ), etkene maruz kalan grubun insidansının ne kadarının etken ile açıklanabileceğini gösterir. Diğer bir ifade ile, etken ortadan kaldırıldığında hastalığın ne kadarının önlenebileceği anlaşılır. AR değerini aşağıdaki ifade ile hesaplarız.
AR = etkene maruz kalan grubun insidansı - etkene maruz kalmayan grubun insidansı veya, AR = I E + ! I E ! =P(D+ | E+) - P(D+ | E-)
AR değeri sadece kohort çalışmalarında hesaplanabilir. Etkene Atfedilen Yüzde Risk (% AR ) % AR , etkene atfedilen riskin etkene maruz grup insidansı içindeki oransal büyüklüğüdür.
% AR =
AR AR = I E + P( D + / E +)
Eğer RR ≥ 1 ise,
% AR =
RR ! 1 RR
Toplumda Etkene Atfedilen Risk ( TAR ) Toplumdaki hastalık insidansının ne kadarının açıklanabileceğini gösterir ve aşağıdaki ifade ile hesaplanır.
TAR = AR ! P( E +) Toplumda Yüzde Etkene Atfedilen Risk ( %TAR )
%TAR =
TAR AR ! P( E +) = P( D +) P( D +) 192
etken
ile
veya
%TAR =
P( E +) " ( RR ! 1) 1 + P( E +) " ( RR ! 1)
ifadesi ile hesaplanır. Örnek 1. (E) etkeni ile (D) hastalığı arasındaki ilişkiyi, etken varlığının hastalık gelişimi üzerindeki etkisini araştırmak amacıyla kohort tipi (prospektif, izlemeli, ileriye yönelik) bir araştırma planlanmıştır. Toplumda etkene maruziyet sıklığının P(E+) = 0.50 olduğu varsayımıyla, 200 kişilik bir kohort grubu rastlantısal olarak iki gruba ayrılmıştır. Her iki grup uygun bir süre izlem altında tutularak (D) hastalığının gelişip gelişmediğine bakılmıştır. Sonuçlar Tablo 2’de verilmektedir. Etken (E) ile ilgili hastalık (D) risklerini hesaplayınız. Tablo 2. Araştırma sonuçları.
Etkene maruz kalanlar (E + ) Etkene maruz kalmayanlar (E -) Toplam
Hastalık gelişenler (D+) 30
Hastalık gelişmeyenler (D-) 70
Toplam
10
90
100
40
160
200
100
Çözüm . Toplumda etkene maruziyet sıklığı, P(E+) = (D) hastalığı insidansı, P(D+)=
100 =0.50 200
40 =0.20 200
Etkene maruz kalan grupta hastalık insidansı, I E + =
193
a 30 = =0.30 a + b 100
Etkene
I E! =
maruz
kalmayan
grupta
hastalık
c 10 = =0.10 c + d 100
Relatif risk, RR =
I E + 0.30 = =3 I E ! 0.10
RR ’nin %95 güven aralığı ,
e
e
ln( RR ) ±"
1 1 1 1 ! + ! a a +b c c + d
ln( 3) ± (1.96 )
1 1 1 1 ! + ! 30 100 10 100
e ln(3)±(1.96 )!( 0.33665) (1.551 - 5.804) Etkene atfedilen risk, AR = I E + ! I E ! = 0.30 – 0.10 = 0.20 Etkene Atfedilen Yüzde Risk, (% AR )=
(Eğer RR =3 ≥ 1 ise, % AR =
AR 0.20 = = 0.67 I E + 0.30
RR ! 1 3 ! 1 = =0.67) RR 3
Toplumda Etkene Atfedilen Risk ( TAR ) = AR ! P ( E +) = (0.20) ! (0.50)
TAR = 0.10 194
insidansı,
Toplumda Yüzde Etkene Atfedilen Risk,
TAR AR ! P( E +) = P( D +) P( D +) (0.20) ! (0.50) 0.10 =0.50 , %TAR = = 0.50 %TAR = (0.20) 0.20
( %TAR )=
%TAR =
P( E +) " ( RR ! 1) (0.50) " (3 ! 1) = = 0.50 1 + P( E +) " ( RR ! 1) 1 + (0.50) " (3 ! 1)
14.1.4. VAKA KONTROL ARAŞTIRMALARI Vaka – kontrol araştırmalarında “geçmişte ne oldu ?” sorusuna yanıt aranır. Nedensellik ilişkisinin araştırıldığı bu araştırma tipinde, söz konusu hastalığı taşıyan (vaka grubu) ve taşımayan (kontrol grubu) iki grubun geçmiş bilgileri incelenir (Şekil 3). Araştırma veri tabanını, genellikle, klinikteki hasta dosyaları oluşturur. Araştırmanın yapılabilmesi için hastalık ve etkene ait bilgilerin, daha önceden, dosyalarda kaydedilmiş olması gerekir. Nadir görülen hastalıkların nedenlerinin araştırılmasında, uygun bir araştırma türüdür. Grupların karşılaştırılabilir olması için, her iki grubun hastalık varlığı dışındaki değişkenler açısından homojen (benzer) olması gerekir.
Şekil 3. Vaka kontrol çalışması. 195
Araştırma sonucunda elde edilen bulgular aşağıdaki gibi (Tablo 3) özetlenir. Tablo 3. Vaka – Kontrol araştırma sonuçları D+ (Olgular)
14.1.4.1.
D- (Kontroller)
Toplam
b
( a + b)
c
d
(c + d )
(a + c)
(b + d )
(a + b + c + d )
a
E+ (Etken var) E– (Etken yok) Toplam
VAKA KONTROL ARAŞTIRMALARINDA RİSK ÖLÇÜTLERİ
Olgu ve kontrol gruplarına ait, etkenin görülme sıklıkları karşılaştırılarak, hastalık ile etken arasındaki ilişkinin varlığı araştırılır. Etken görülme sıklığı, olgu grubunda
a , kontrol grubunda ise, a+c
b ile hesaplanır. b+d
Hastalık – etken arasındaki ilişki, etken varlığının hastalık oluşumuna katkısını gösteren risk değeri, “Göreli Orantı” gösterilir.
(Odds oranı, ( OR =
a!d )) ile b!c
Bir olayın (A) ve (B) ile gösterilen iki sonucu varsa, verilen bir sonuca ait Odds değeri aşağıdaki ifade ile hesaplanır.
O=
P( A) P( A) = 1 ! P( A) P( B)
A ile hastalık varlığını (olgular, D + ), B ile hastalık yokluğunu (kontroller, D ! ) gösterirsek, olgu-kontrol çalışma tipinde OR oranı aşağıdaki ifade ile hesaplanır.
OR =
OE + / D+ OE + / D! 196
Olgularda etken varlığına ait odds değeri (olasılık oranı) OR = Kontrollerde etken varlığına ait odds değeri (olasılık oranı)
a /(a + c) P( E + / D +) / P( E ! / D +) c /(a + c) a ! d = = OR = P( E + / D !) / P( E ! / D !) b /(b + d ) b ! c d /(b + d ) Hesaplanan OR değeri etken varlığının hastalık oluşumuna katkısını dolaylı olarak gösterir. Etkenin var olduğu grupta hastalık görülmesinin odds değeri (olasılık oranı), etkenin olmadığı gruba göre OR kat fazladır. OR değeri, kohort çalışmalarında hesaplanan RR ’in tahmin değeri olarak kullanılır.
OR ’in güven aralığı aşağıdaki ifade ile hesaplanır.
e
ln ( OR ) ±!
1 1 1 1 + + + a b c d
Örnek 2. Örnek 1’de verilen araştırmanın retrospektif (geriye dönük) olarak planlandığını varsayalım. 100 kişilik hasta grubu ile 100 kişilik kontrol grubunun geçmişteki bilgileri incelenerek etkene maruz kalıp kalmadıkları incelenmiştir. Sonuçlar Tablo 4’te verilmektedir. OR değerini hesaplayınız. Tablo 4. Araştırma sonuçları E + (Etken var) E - (Etken yok) Toplam
D+ (Olgular) 30 10 40
D- (Kontroller) 70 90 160
Toplam 100 100 200
Çözüm : Olgu grubunda etken görülme sıklığı P(E+|D+) = 197
30 a = = 0.75 a + c 40
Kontrol grubunda etken görülme sıklığı P(E+|D-) =
70 b = =0.44 b + d 160
Göreli Orantı (Odss oranı), OR =
a ! d 30 ! 90 = = 3.86 b ! c 70 ! 10
OR ’in % 95 güven aralığı,
e e
ln ( OR ) ±!
1 1 1 1 + + + a b c d
ln( 3.86 ) ± (1.96 )
1 1 1 1 + + + 30 70 10 90
e ln(3.86 )±(1.96 )!( 0.39841)
! 1.768 - 8.426
14.1.5. PARALEL KONTROLLÜ KLİNİK ÇALIŞMA Kliniğe gelen hastalardan uygun olanlar (çalışma protokolünde belirtilen kabul edilme kriterlerine uyan hastalar) rastlantısal olarak iki gruba (veya ikiden çok gruba) ayrılırlar. Bunlardan biri deney grubunu diğeri ise kontrol grubunu oluşturur (Şekil 4). Deney grubunda yeni bir ilaç veya tedavi yöntemi, kontrol grubunda ise plasebo veya geleneksel tedavi yöntemi uygulanır. Her iki grupta elde edilen tedavi sonuçları karşılaştırılarak ilaç (tedavi) etkinliği, yan etki varlığı, gibi sonuçlar değerlendirilir. Grupların karşılaştırılabilir olması için hastaların gruplara alınma işleminin rastlantısal (randomize) olması gerekir.
198
Yine, yan tutma ile oluşacak hataları (bias) en aza indirgeyebilmek için, hastaların hangi kolda yer aldıklarını, hem kendilerinin hem de uygulayıcıların (hekim, hemşire,…) bilmemeleri, gerekir (çift kör).
Şekil 4. Paralel kontrollü klinik çalışma. 14.1.6. DIŞ KONTROLLÜ KLİNİK ÇALIŞMA Bu tür çalışmalarda kontrol grubu yoktur. Karşılaştırma için, daha önce yapılmış çalışmaların sonuçları kullanılır (Şekil 5). Rastlantısallık ve körleme sağlanamadığından sağlıklı karşılaştırmalar yapmak oldukça güçtür.
Şekil 5. Dış kontrollü klinik çalışma 199
14.1.7. ÇAPRAZ KONTROLLÜ KLİNİK ÇALIŞMA Kabul edilme kriterlerine uyan hastalar, rastlantısal olarak deney ve kontrol gruplarına atanır. Her iki grupta, uygulamadan sonra uygun bir arınma süresi (geçiş dönemi) geçirilir. Daha sonra deney grubu kontrol, kontrol grubu da deney grubu olarak işlem görür (Şekil 6). Bireylerin hem deney hem de kontrol grubunda yer alması bireysel farklılıkların kontrol altında tutulmasını sağlar.
Şekil 6. Çapraz kontrollü klinik çalışma.
14.2.
RASTLANTISALLIK (RANDOMİZASYON)
Dahil edilme kriterlerini sağlayan bireylerin, eşit olasılıkla gruplara ayrıştırılmasına olanak sağlar. Randomizasyon için en sık başvurulan yöntem “rastlantısal sayılar” yöntemidir. Randomizasyon işlemi ile, grupların homojen (benzer) olması, dolayısıyla karşılaştırılabilir olması sağlanır. Örnek 3. Çalışma protokolünde belirtilen, dahil edilme kriterlerini sağlayan 20 bireyi kontrol ve deney gruplarına rastlantısal olarak atayınız. 200
Çözüm : Rastlantısal sayılar tablosunda (Tablo I) verilen sayıların (0,1) aralığında düzgün dağılıma sahip olduğunu hatırlayalım. Rastlantısal sayı 0.00000– 0.49999 arasında ise, “A” grubuna (kontrol grubu), 0.50000– 0.99999 arasında ise, “B” grubuna (deney grubu) atama yapılır. Rastlantısal sayının her iki aralıkta yer alması olasılığı birbirine eşittir. Dolayısıyla, bireyin gruplara atanması eşit olasılıkla yapılır. Grup sayısı üç ise aralık üçe, dört ise dörde bölünür. Başlangıç rastlantısal sayısı olarak, Tablo I ’de, 2. satır ve 3. sütuna karşılık gelen sayıyı ele alalım (32248). Bu sayı (0,1) aralığında 0.32248 olarak gösterilir. Sayı 0.00000-0.49999 arasında olduğundan 1. hasta “kontrol” grubuna atanır. Bir sonraki rastlantısal sayıyla atama işlemine devam edilir (Tablo 5). Tablo 5. Bireylerin gruplara atanması. Hasta no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Rastlantısal sayı 32248 25632 88736 29183 60758 65842 93100 25643 88310 38211 43221 87930 03438 58385 23898 59763 38820 50475 02568 96675 201
Grup Kontrol Kontrol Deney Kontrol Deney Deney Deney Kontrol Deney Kontrol Kontrol Deney Kontrol Deney Kontrol Deney Kontrol Deney Kontrol Deney
14.3.
KÖRLEME
Uygulayıcıların, bireylere hangi yöntemin uygulandığını bilmemesi, aynı şekilde, bireylerin de hangi grupta yer aldığını bilmemesine körleme diyoruz. Körleme (farkına vardırmama), yan tutmalardan oluşabilecek hataları önlemek amacıyla yapılır. Tablo 6. Körleme tipleri.
Denek
Tek kör
Çift kör
Üç kör
XXXXX
XXXXX
XXXXX
XXXXX
XXXXX
Uygulayıcı. Gözlemci Veri analizci, istatistikçi
XXXXX
Tek kör çalışmalarda, sadece, hastalar hangi grupta yer aldığını bilmemektedir. Çift kör çalışmalarda ise hastaların yanında, uygulayıcılar da hastaların hangi grupta yer aldığını bilmemektedir. Çalışma sonuçlarının istatistiksel değerlendirmesi aşamasında, veri analizci de hastaların hangi grupta yer aldığını bilmiyorsa üç kör çalışmadan söz edilir. Araştırma tipi, rastlantısallık ve körleme işlemlerine ilişkin bilgiler araştırma protokolünde mutlaka belirtilmelidir.
202
Bölüm 15
Tanı Testlerinin Değerlendirilmesi
Klinik çalışmalarda, özellikle saha taramalarında, riskli olmayan, ekonomik ve kullanımı basit tanı yöntemlerine ihtiyaç duyulur. Bir tanı testinin sonuçlarının değerlendirilmesi, ya tanı testinin gerçekten hasta olan ve olmayan kişilere uygulanmasıyla ya da gerçeği yansıttığı kabul edilen temel tanı testi sonucuna göre yapılır.
15.1. TANI TESTLERİ DEĞERLENDİRME ÖLÇÜTLERİ Tanı testinin değerlendirilmesinde genellikle aşağıda tanımlanan ölçütler kullanılır. Duyarlılık (sensitivity) : Hastalığın gerçekten var olduğu bilinen kişilerden yüzde kaçının önerilen yeni yöntemle tanınabildiğini gösterir. Seçicilik (özgüllük, özgü değer, specificity) : Hastalığı taşımayanların (sağlam olanların) yüzde kaçının önerilen yöntemle tanınabildiğini gösterir. Genel doğruluk (accuracy) : Hasta ve sağlam kişilerin yüzde kaçının önerilen yöntemle tanınabildiğini gösterir. Artı yorum gücü (positive predictive value) : Önerilen yöntemle artı bulguların ne oranda hastalık varlığını gösterdiğini (bilinen yönteme uyumu) belirtir. 203
Eksi yorum gücü (negative predictive value) : Önerilen yöntemle eksi bulguların ne oranda hastalık olmadığına işaret ettiğini gösterir. Deneklere ait test sonuçları ve gerçek duruma ait bilgiler (2 x 2) tablosunda (Tablo 1), aşağıdaki gibi özetlenebilir. Tablo 1. Gerçek durum ve test sonuçları. Test Sonucu (+)
Gerçek durum Hasta (+) Sağlam (-)
a c
(-)
( a + b) (c + d ) (a + b + c + d )
b d (b + d )
(a + c)
Toplam
Toplam
Test sonuçlarını doğru pozitif ( DP ), yanlış pozitif ( YP ), doğru negatif ( DN ) ve yanlış negatif ( YN ) simgeleriyle de gösterebiliriz (Tablo 2). Tablo 2. Gerçek durum ve test sonuçları. Test Sonucu (+) (-) Toplam
Gerçek durum Hasta (+) Sağlam (-)
Toplam
DP YP YN DN ( DP + YN ) (YP + DN )
( DP + YP) (YN + DN ) ( DP + YP + YN + DN )
Tanımlarımızı aşağıdaki gibi ifade edebiliriz.
DP a = a + c ( DP + YN ) DN d Seçicilik = = b + d (YP + DN ) Duyarlılık =
204
Toplam doğruluk =
a+d DP + DN = a + b + c + d DP + YP + YN + DN
Artı yorum gücü =
a DP = a + b DP + YP
Eksi yorum gücü =
d DN = c + d YN + DN
“Artı yorum gücü” ve “Eksi yorum gücü” değerlerinin kullanılabilmesi için, çalışmada elde edilen (hasta sayısı/toplam denek sayısı) yüzdesinin, hastalığın toplum içindeki görülme sıklığını (hastalığın prevalansını) temsil ediyor olması gerekir (Şekil 1).
Şekil 1. Hasta sayısının çalışma grupları ve toplum içindeki yeri. Prevalans değerini çalışma gruplarından veya toplum verilerinden aşağıdaki gibi hesaplarız.
205
( A) ile toplumdaki hasta sayısını ve (B) ile toplumdaki sağlam kişileri A gösterirsek, hastalığın toplumdaki prevalansı, P ( D + ) = ifadesi ile A+ B hesaplanır.
Prevalansı çalışma gruplarından hesaplamak istersek,
P( D +) =
a+c değerini hesaplarız. a+b+c+d
A prevalans değerinin, çalışma A+ B a+c gruplarından elde edilen prevalans değerine P ( D + ) = eşit a+b+c+d Toplum için geçerli olan, P ( D + ) =
olması gerekir.
Çalışmada, sadece duyarlılık ve özgüllük değerleri hesaplanmak isteniyorsa prevalans değerinin temsil edilme şartı aranmaz. Yine, prevalans değeri temsil edilmiyorsa ve “Artı yorum gücü” ve “Eksi yorum gücü” değerlerini kullanmak istiyorsak toplumdaki prevalans değerini de hesaba katarak, “Artı yorum gücü” ve “Eksi yorum gücü” değerlerini aşağıdaki ifadelerle hesaplayabiliriz (Bayes kuralı). duyarlılık · prevalans Artı yorum gücü = duyarlılık · prevalans + (1 - seçicilik) · (1-prevalans)
seçicilik · (1 - prevalans) Eksi yorum gücü = seçicilik· (1 – prevalans)+ (1 – duyarlılık)· prevalans
206
Örnek 1. (X) testinin meme kanseri için tanı değerlerini hesaplamak isteyelim. (X) testinin, meme kanserli 200 hastada ve meme kanseri olmayan 500 kadında uygulandığını ve elde edilen test sonuçlarının aşağıdaki tabloda (Tablo 3) özetlendiğini varsayalım. (X) testinin tanı değerlerini hesaplayınız. Tablo 3. (X) testi sonuçları. (X) Test Sonucu
Gerçek durum Meme kanseri Hasta (+) Sağlam (-) 190 75 10 425 200 500
(+) (-) Toplam
Toplam 265 435 700
Çözüm : Tanı değerleri : Duyarlılık =
Seçicilik =
DP a 190 = = = 0.95 a + c ( DP + YN ) 200
DN d 425 = = =0.85 b + d (YP + DN ) 500
Toplam doğruluk =
615 a+d DP + DN = = =0.879 a + b + c + d DP + YP + YN + DN 700
Elde edilen tanı yüzdeleri % 95 güven aralıkları ile birlikte verilmelidir (Tablo 4). Tablo 4. (X) testinin tanı değerleri. Duyarlılık Seçicilik Toplam doğruluk
% 95.0 85.0 87.9 207
% 95 Güven Aralığı 91.0 – 97.6 81.6 – 88.0 85.2 –90.2
Çalışma gruplarından elde edilen meme kanseri prevalans değerinin, ( P( D +) =
a+c 200 = = 0.286 ) a + b + c + d 700
toplum için geçerli olduğunu söyleyemeyiz. Toplumdaki prevalans değerinin geniş çaplı araştırmalara dayanılarak tahmin edilmesi gerekir. Toplumda meme kanseri prevalansının, P ( D + ) =0.01 olduğunu varsayalım. Bu durumda çalışma gruplarından elde edilecek “Artı yorum gücü” ve “Eksi yorum gücü” değerleri geçerli olmayacaktır. Artı yorum gücü !
a DP 190 = = = 0.717 a + b DP + YP 265
Eksi yorum gücü !
d DN 425 = = = 0.977 c + d YN + DN 435
Prevalans hesaplayabiliriz.
değerini
hesaba
katarak
yorum
gücü
değerlerini
duyarlılık · prevalans Artı yorum gücü = duyarlılık · prevalans + (1 - seçicilik) · (1-prevalans) (0.95) · (0.01) Artı yorum gücü = ———————————————— (0.95) · (0.01) + (1- (0.85)) · (1-(0.01)) Artı yorum gücü = 0.06 seçicilik · (1 - prevalans) Eksi yorum gücü = seçicilik · (1 – prevalans)+ (1 – duyarlılık) · prevalans 208
(0.85) · (1- (0.01)) Eksi yorum gücü = ————————————————— (0.85) · (1- (0.01)) + (1- (0.95)) · (0.01) Eksi yorum gücü = 0.999
15.2. TANI KARAKTERİSTİĞİ EĞRİSİ (ROC) Bu çözümleme yönteminde, belirli bir tanım aralığında sürekli değerler alan bir değişkenin (continuous variable, sürekli değişken) tanı testi olarak kullanımı amaçlanmaktadır. ROC (receiver operator characteristics curve) çözümleme yöntemini, MIA (melanom inhibating antigen) tümör marker değişkeninin (sürekli değişken) malin melanom tanısında kullanımına ilişkin bir örnek ile açıklamaya çalışalım. Örnek 2. Malin melanom tanısı konmuş 35 hastada ve sağlıklı 20 kişide (malin melanom hastası olmayan) MIA değerlerinin ölçüldüğünü ve elde edilen değerlerin aşağıdaki gibi özetlendiğini varsayalım.
Hasta grubu (Malin melanom hastaları) 55,0
11,0
15,0
20,0
17,0
10,0
13,0
57,5
11,0
15,5
22,5
93,0
10,0
14,0
8,0
11,5
17,0
23,0
57,0
11,0
15,0
9,0
11,5
17,5
27,5
17,5
38,0
19,0
10,0
12,0
17,5
36,3
18,0
46,5
95,0
Kontrol Grubu (Malin melanom hastası olmayan) 15,0
9,6
10,8
11,5
9,6
15,7
11,7
8,0
13,5
8,2
9,0
15,1
12,8
11,6
13,7
16,4
21,2
10,4
12,0
12,7
209
Hasta grubu ve kontrol grubuna ait değerler küçükten büyüğe sıraya dizilerek sıralı değerlerden oluşan tablolar elde edilir. Hasta grubu (Malin melanom hastaları) (Sıralı değerler) 8,0
9,0
10,0
10,0
10,0
11,0
11,0
11,0
11,5
11,5
12,0
13,0
14,0
15,0
15,0
15,5
17,0
17,0
17,5
17,5
17,5
18,0
19,0
20,0
22,5
23,0
27,5
36,3
38,0
46,5
55,0
57,0
57,5
93,0
95,0
Kontrol Grubu (Malin melanom hastası olmayan) (Sıralı değerler) 8,0
8,2
9,0
9,6
9,6
10,4
10,8
11,5
11,6
11,7
12,0
12,7
12,8
13,5
13,7
15,0
15,1
15,7
16,4
21,2
Hasta ve kontrol gruplarına ait tanımlayıcı istatistikler aşağıdaki gibi elde edilir. Hasta Grubu (n=35) ar.ort.=25.21, SD = 22.08, medyan = 17.00, min. = 8, maks.=95. Kontrol Grubu (n=20) ar.ort.=12.43, SD = 3.20, medyan = 11.85, min. = 8 . maks.=21.2 . Çeşitli “pozitiflik sınır değeri” (cut-off values, kesim değerleri) için duyarlılık ve (1 – seçicilik) değerleri hesaplanır. Hasta ve kontrol grupları birlikte ele alındığında, en küçük değer 8 , en büyük değer ise 95 bulunur. 8 ile 95 arasında en az 10 pozitiflik sınır değeri belirlenir. Örneğimiz için 8,10,12,14,16,18,20,25,30 ve 40 pozitiflik sınır değerlerini kullanalım. 210
Dikkat edilirse, kesim değerlerimiz 8 ile 20 arasında 2’şer artmakta, 20’den sonra ise 5’er artmaktadır. Bunun nedeni gözlemlerimizin büyük çoğunluğunun 8 ile 20 arasında yer almasıdır. Kesim değerlerinin sayısının artması ROC eğrisinin duyarlılığını artıracaktır. “Pozitiflik sınır değeri” (cut-off value) 16 için duyarlılık ve seçicilik değerlerini hesaplamak isteyelim. MIA ≥ 16 ise test sonucu pozitif (kişi hasta), aksine MIA < 16 ise test sonucu negatif (kişi sağlıklı) kabul edilecektir. Hasta grubunda 19 kişide, kontrol grubunda ise 2 kişide MIA ≥16’dır. 16 sınır değeri için; doğru pozitif, yanlış pozitif, yanlış negatif ve doğru negatif sayıları Tablo 5’te verilmektedir. Tablo 5. 16 sınır değeri için test sonuçları MIA Test Sonucu MIA ! 16 (+)
Gerçek durum Malin melanom Hasta (+) Sağlam (-)
Toplam
19
2
21
MIA <16 (-)
16
18
34
Toplam
35
20
55
19 = 0.543 35 18 Seçicilik = = 0.900 20 Duyarlılık =
(1 – seçicilik) = 1 – 0.90 = 0.100 16 sınır değeri için, “(1-seçicilik)” ve “duyarlılık” koordinat sisteminde (0.100 ; 0.543) noktası elde edilir. ROC eğrisinin çizileceği noktaları, diğer tüm sınır değerleri için benzer işlemleri tekrarlayarak elde ederiz. 211
Duyarlılık, (y) ekseninde ve (1–özgüllük) değerleri ise (x) ekseninde temsil edilir. Tüm sınır değerleri için elde edilen duyarlılık, özgüllük ve (1– özgüllük) değerleri aşağıdaki tabloda (Tablo 6) verilmektedir. Tablo 6. Çeşitli MIA pozitiflik sınır değerleri için tanı değerleri. MIA Pozitiflik Sınır Değeri (≥) 8 10 12 14 16 18 20 25 30 40
Duyarlılık DP % 35 100 33 94 25 71 23 66 19 54 14 40 12 34 9 26 8 23 6 17
Seçicilik DN % 0 0 5 25 10 50 15 75 18 90 19 95 19 95 20 100 20 100 20 100
(1-seçicilik) % 100 75 50 25 10 5 5 0 0 0
10 ayrı pozitiflik sınır değeri için elde edilen duyarlılık ve (1-seçicilik) koordinat değerlerini kullanarak ROC eğrisini çizeriz.
Şekil 2. MIA değişkeni için ROC eğrisi. MIA tümör marker değişkeninin tanı değerinin gücü (hasta ve sağlamı ayırt edebilme gücü) ROC eğrisinin altında kalan alan ile ifade edilir. 212
Alan değeri 1’e yaklaştıkça tanı değeri yükselir. % 100’lük tanı gücünde alan değeri 1’e eşit olur. Eğri altında kalan alan ve % 95 güven sınırları belirlenir. 0.50 değerinin (kuramsal farksızlık) güven sınırlarının dışında kalması durumunda, istatistiksel olarak anlamlı bir tanı değerinden bahsedebiliriz. En uygun pozitiflik sınır değeri, eğri üzerinde sol üst köşeye en yakın noktayı ((1-seçicilik);duy.) veren değerdir. Örneğimizde, en uygun MIA pozitiflik sınır değeri 14’tür. MIA ≥ 14 için elde edilen (0.25 ; 0.66) noktası, ROC eğrisi üzerinde sol üst köşeye en yakın olan noktadır. MIA değişkeninin ROC çözümlemesi SPSS programında yapıldığında eğri altında kalan alan aşağıdaki gibi elde edilir. 0.732 ± 0.067 (%95 G.A. : 0.601 – 0.863) Buna göre, MIA değişkeninin tanı değerinin istatistiksel olarak anlamlı olduğunu söyleriz. Örnek 3. PSA, kolesterol ve trigliserit değişkenlerinin prostat kanserindeki tanılarının ROC analizi ile incelenmesi ve birbirleriyle karşılaştırması amaçlanmaktadır. Söz konusu üç değişken 30 hasta ve 34 sağlam kişide ölçülmüştür. Ölçülen değerler Tablo 7 ve Tablo 8’de verilmektedir. PSA, kolesterol ve trigliserit değişkenlerinin prostat kanserindeki tanı değerlerini ROC analizi ile sınayınız.
213
Tablo 7. Prostat kanserli hastalarda PSA, kolesterol ve trigliserit deÄ&#x;erleri. Hasta no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
PSA 4,01 3,51 4,02 4,69 5,15 5,26 4,26 8,98 8,70 13,90 13,30 56,10 4,70 5,62 9,13 6,56 6,32 6,74 5,91 5,51 7,03 6,88 20,50 12,95 14,34 30,77 17,71 8,71 7,12 16,11
Kolesterol 276 188 214 218 193 194 192 252 245 191 269 255 190 187 175 229 248 203 191 201 167 142 218 196 137 168 222 221 268 236
214
Trigliserit 172 123 90 156 178 276 207 181 85 80 183 176 104 259 84 227 91 85 69 209 103 85 174 120 88 86 123 282 222 125
Tablo 8. Sağlıklı kişilerde PSA, kolesterol ve trigliserit değerleri. Hasta no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
PSA 1,28 1,47 3,70 3,27 2,18 0,16 2,54 4,01 3,66 2,34 0,94 3,61 3,50 0,54 2,10 1,93 3,59 2,88 3,02 0,36 0,55 0,62 0,90 2,09 2,10 1,06 1,56 0,39 2,88 1,93 1,08 0,81 2,15 2,09
Kolesterol 246 202 172 115 154 162 152 225 156 89 229 162 184 229 219 189 326 135 195 218 162 202 214 207 219 295 192 242 204 172 295 179 169 247
215
Trigliserit 121 166 189 142 88 96 74 81 144 68 228 79 99 129 153 96 202 126 158 186 62 60 98 170 153 286 68 215 87 95 296 168 205 223
Çözüm : SPSS programı kullanılarak yapılan ROC çözümlemesi sonuçları aşağıdaki tablolarda verilmektedir. PSA, kolesterol ve trigliserit değişkenlerine ait tanımlayıcı istatistikler aşağıda (Tablo 9) verilmektedir. Tablo 9. PSA, kolesterol ve trigliserit değişkenlerine ait tanımlayıcı istatistikler.
Ar.ort.
SD
n
medyan
Min.
Maks.
Hasta
PSA
10,82
10,46
n=30
6,96
3,51
56,10
Kontrol
PSA
1,98
1,14
n=34
2,09
0,16
4,01
Hasta
Kolesterol
209,53
35,82
n=30
202,00
137,00
276,00
Kontrol
Kolesterol
198,76
49,69
n=34
198,50
89,00
326,00
Hasta
Trigliserit
148,10
63,88
n=30
124,00
69,00
282,00
Kontrol
Trigliserit
141,50
63,10
n=34
135,50
60,00
296,00
Tablodan da görüldüğü gibi hasta ve kontrol grupları arasında sadece PSA değişkeni önemli bir farklılık göstermektedir. Çeşitli PSA sınır değerleri için (1-seçicilik) ve duyarlılık değerleri (SPSS programı kullanılarak) aşağıdaki gibi (Tablo 10) elde edilir. PSA pozitiflik sınır değerleri, ardışık PSA değerlerinin ortalaması alınarak belirlenmiş, ilk sınır değeri için en küçük değer bir eksiltilmiş, son sınır değer için en büyük değer bir arttırılmıştır.
216
Tablo 10. PSA için duyarlılık ve (1- seçicilik) değerleri PSA pozitiflik sınır değeri (≥)
Duyarlılık
(1-seçicilik)
-,8400 ,2600 ,3750 ,4650 ,5450 ,5850 ,7150 ,8550 ,9200 1,0000 1,0700 1,1800 1,3750 1,5150 1,7450 2,0100 2,0950 2,1250 2,1650 2,2600 2,4400 2,7100 2,9500 3,1450 3,3850 3,5050 3,5500 3,6000 3,6350 3,6800 3,8550 4,0150 4,1400 4,4750
1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 ,967 ,967 ,967 ,967 ,967 ,933 ,900 ,867
1,000 ,971 ,941 ,912 ,882 ,853 ,824 ,794 ,765 ,735 ,706 ,676 ,647 ,618 ,588 ,529 ,471 ,412 ,382 ,353 ,324 ,294 ,235 ,206 ,176 ,147 ,147 ,118 ,088 ,059 ,029 ,000 ,000 ,000
217
Tablo 10. Devamı 4,6950 4,9250 5,2050 5,3850 5,5650 5,7650 6,1150 6,4400 6,6500 6,8100 6,9550 7,0750 7,9100 8,7050 8,8450 9,0550 11,0400 13,1250 13,6000 14,1200 15,2250 16,9100 19,1050 25,6350 43,4350 57,1000
,833 ,800 ,767 ,733 ,700 ,667 ,633 ,600 ,567 ,533 ,500 ,467 ,433 ,400 ,367 ,333 ,300 ,267 ,233 ,200 ,167 ,133 ,100 ,067 ,033 ,000
,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Tablo 10’da verilen (1- seçicilik) ve duyarlılık değerlerine karşılık gelen ROC eğrisi aşağıdaki gibi çizilir.
218
Şekil 3. PSA değişkenine ilişkin ROC eğrisi. Eğri altında kalan alan 0.995 ± 0.006 (% 95 güven aralığı : 0.983 – 1.0) bulunur. Buna göre PSA değişkeninin prostat kanserini tanımada önemli olduğu kabul edilir. Aynı şekilde, kolesterol ve trigliserit değişkenleri için hesaplamalar yapılırsa ROC eğrilerini aşağıdaki gibi elde ederiz (Şekil 4).
Şekil 4. PSA, Kolesterol ve Trigliserit için ROC eğrileri. 219
Eğri altında kalan alanlar Tablo 11’de verilmektedir. Tablo 11. PSA, Kolesterol ve Trigliserit değişkenlerine ait eğri altında kalan alanlar. % 95 Güven aralığı
PSA
± S.E. 0.995 ± 0.006
Kolesterol
0.584 ± 0.072
0.444 – 0.725
Trigliserit
0.534 ± 0.073
0.390 – 0.677
Alan
0.983 – 1.000
Sonuç olarak, prostat kanseri tanısında sadece PSA değişkeninin tanı değerinin yüksek olduğunu söyleyebiliriz. Kolesterol ve trigliserit değişkenlerinin prostat kanserindeki tanı değerleri istatistiksel olarak anlamlı değildir. Her iki değişkende de 0.50 değeri güven aralığının içinde yer almaktadır. Prostat kanseri tanısında PSA’nın en uygun pozitiflik sınır değeri 3.86’dır. PSA ≥ 3.86 için, duyarlılık = 0.967, seçicilik = 0.971 ve (1-seçicilik) = 0.029 olarak hesaplanır. Eğri üzerinde (0.029 ; 0.967) noktası sol üst köşeye (tam tanı (0;1)) en yakın olan noktadır.
220
Bölüm 16
Sağkalım (Sürvi Analizi)
İleriye dönük (prospektif) izleme çalışmalarında sıklıkla kullanılan sağkalım çözümleme yöntemleri yaşam tablolarının özel bir uygulamasıdır. Sağkalım çözümleme yöntemleri olarak “Yaşam Tablosu” ve “KaplanMeier” yöntemlerini gösterebiliriz.
16.1. SAĞKALIM ANALİZİNDE AMAÇ Sağkalım çözümleme yönteminin amaçları aşağıda verilmektedir. 1. Tedaviden sonra hastaların beklenen yaşam sürelerinin kestirilmesi, genel sağkalım ve/veya hastalıksız sağkalım eğrilerinin elde edilmesi, 2. Tedavi edilenlerde ve edilmeyenlerde beklenen yaşam sürelerinin karşılaştırılmasıyla tedavi etkinliğinin ölçülmesi, iki farklı teknikle tedavi edilen hastalarda beklenen yaşam sürelerinin karşılaştırılmasıyla da hangi tedavi tekniğinin daha etkin olduğunun belirlenmesi, 3. Çeşitli konularda risk faktörlerinin belirlenmesi, 4. Hastalıkların doğal seyrinin incelenmesi.
221
16.2. SAĞKALIM ANALİZİNDE KARŞILAŞILAN PROBLEMLER İleriye dönük izleme çalışmalarında en sık karşılaşılan problemlerin başında, deneklerin araştırma periyodu süresince tam olarak izlenememesini ve uzun süren izlemelerde hastalara uygulanan tedavi yöntemlerindeki olası değişiklikleri gösterebiliriz. Çeşitli nedenlerden tam olarak izlenemeyen hastalar, izlendikleri süre kadarıyla çözümlemeye alınır. Hastaların tam olarak izlenememesinin nedenleri aşağıda verilmektedir. 1. Deneklerin diğer nedenlerden ölmesi. 2. Deneklerle işbirliğinin sona ermesi. 3. Deneğin bir başka bölgeye göç etmesi. 4. Bazı deneklerin araştırma periyodunun sonlarına doğru izlemeye alınması ve çalışmanın sona ermesi nedeni ile izlemenin eksik kalması. İzleme ile ilgili başlangıç zamanı, izleme süresi ve sonlanma zamanını aşağıdaki gibi gösterebiliriz (Şekil 1.).
16.3. SONLANMA İLE İLGİLİ TANIMLAR
Şekil 1. İzleme süreci. İzleme sonucunda “sonlanma” olarak, ölüm, nüks (hastalığın yinelenmesi), metastaz ve tedavi sonucunu gösteren herhangi bir olayı 222
inceleyebiliriz. Hastanın izlemeye alınmasından, “sonlanma” olarak kabul edilen sonucun gerçekleşmesine kadar geçen süreye izleme süresi diyoruz. Sağkalım çözümlemesinde sıklıkla kullanılan tanımlar aşağıdaki gibidir. 1. Genel Sağkalım (Overall survival): Başlangıçtan (randomizasyondan) ölüme kadar geçen süre. 2. Progresyonsuz veya hastalıksız sağkalım (Disease free survival (DFS), PFS): Randomizasyondan progresyon/nüks veya ölüme kadar geçen süre. 3. Progresyonsuz veya hastalıksız geçen süre (Disease free interval, DF) : Randomizasyondan progresyon veya nükse kadar geçen süre. 4. Tedavi sonucunu gösteren olayın gerçekleşmesine kadar geçen süre (time to event) : Başlangıçtan olayın gerçekleşmesine kadar geçen süre.
16.4. SAĞKALIM ANALİZİ SONUÇLARININ SUNUMU Sağkalım çözümlemesi sonuçlarının sunumu aşağıdaki gibi yapılır (Tablo 1). Tablo 1. Sağkalım analizi sonuçlarının sunumu. İzleme süresi Olay (sonuç) sıklığı Ortalama sağkalım süresi Medyan sağkalım süresi n. yılda birikimli sağkalım hızı (n. yıldaki birikimli sağkalım hızının verilebilmesi için, n. yılda halen en az 5 hastanın daha izlem altında olması gerekir) Sağkalım eğrilerinin istatistiksel karşılaştırması
Medyan izleme süresi (min. – maks.) Olay sayısı / hasta sayısı Ortalama sağkalım süresi ± standart hata (%95 Güven aralığı) Medyan sağkalım süresi ± standart hata (%95 GA) (n.yılda) R ± SE (%95 GA : …..)
(Log rank =… ; d.f.=….; p=….) 223
16.5. KAPLAN – MEIER YÖNTEMİ Kaplan-Meier sağkalım çözümleme yöntemini (product limit) bir örnek üzerinde açıklayalım. Örnek 1. (X) kanser türünde 12 hastaya ait (Y) tedavisinden sonraki izleme sonuçları aşağıdaki tabloda (Tablo 2) verilsin. Tablo 2. 12 Hastaya ait izlem bilgileri. HASTA İZLEME İZLEME ADI BAŞLANGICI SONU
İZLEME SONUCU
İZLEME SONUCU (Kod)
A
02.02.2009
08.03.2010 EX
1
B
28.08.2009
14.05.2013 EX
1
C
03.02.2010
03.12.2012 EX
1
Ç
19.06.2010
05.05.2013 KAYIP
2
D
02.07.2010
05.12.2013 EX
1
E
23.09.2010
24.01.2015 HAYATTA 3
F
03.05.2011
01.01.2013 EX
1
G
04.05.2012
09.07.2014 EX
1
H
26.05.2012
18.07.2012 EX
1
I
03.10.2012
08.09.2013 KAYIP
2
İ
29.04.2013
07.10.2013 KAYIP
2
J
23.05.2013
24.01.2015 HAYATTA 3
* : Bugünkü tarih : 24/01/2015
Çalışma periyodunun, Başlangıç tarihi : 02.02.2009 Bitiş tarihi : 24.01.2015 Kaplan-Meier yöntemini kullanarak, sağkalım ile ilgili hızları ve sağkalım eğrisini elde etmek isteyelim. 224
Çözüm: Her bir hasta için izleme süresini hesaplarız (Tablo 3) (Şekil 2, Şekil 3). İzleme süresi = Sonlanma tarihi – Başlangıç tarihi Tablo 3. 12 Hastaya ait izlem bilgileri. HASTA ADI A B C Ç D E F G H I İ J
İZLEME BAŞLANGICI 02.02.2009 28.08.2009 03.02.2010 19.06.2010 02.07.2010 23.09.2010 03.05.2011 04.05.2012 26.05.2012 03.10.2012 29.04.2013 23.05.2013
İZLEME SONU 08.03.2010 14.05.2013 03.12.2012 05.05.2013 05.12.2013 24.01.2015 01.01.2013 09.07.2014 17.07.2012 08.09.2013 04.10.2013 24.01.2015
İZLEME SÜRESİ (GÜN) 399 1355 1034 1051 1252 1584 609 796 52 340 158 611
İZLEME SÜRESİ (AY) 13,3 45,17 34,47 35,03 41,73 52,80 20,30 26,53 1,73 11,33 5,27 20,37
* : Bugünkü tarih : 24/1/2015
Şekil 2. Hastaların izlem süreleri.
225
İZLEME SONUCU EX EX EX KAYIP EX HAYATTA EX EX EX KAYIP KAYIP HAYATTA
İZLEME SONUCU (Kod) 1 1 1 2 1 3 1 1 1 2 2 3
Şekil 3. Hastaların izlem süreleri.
Hastaların izleme sürelerini küçükten büyüğe sıralayarak Tablo 3’ü yeniden düzenleriz. Sağkalım hesaplamalarında kullanılan simgeler aşağıda verilmektedir.
Dt : t anındaki izleme sonucu (sonlanma (olay) varsa 1, yoksa 0).
Lt : t anında, izleme altındaki hasta sayısı. D Qt : t anında, ölüm oranı ( t ). Lt Pt : t anında, sağkalım oranı (1- Qt ) Rt : başlangıçtan t anına kadar geçen süre için birikimli sağkalım hızı . Kaplan – Meier çözümleme yönteminde, her t sonlanma anı için Qt , Pt ve Rt değerleri hesaplanır. Başlangıçta izlenen hasta sayısı 12 iken, H hastası 1.73’üncü ayda ex olmuş ve izlenmekte olan hasta sayısı 11’e düşmüştür. 1.73’üncü ayda, ölüm oranı, Q1.73 =
1 = 0.083, 12
sağkalım oranı, P1.73 =1 – 0.083 = 0.917 226
birikimli sağkalım hızı, R1.73 = (1) ! (0.917) = 0.917 olarak hesaplanır. Başlangıçta birikimli sağkalım hızı, R0 =1’dir. 1.73’üncü ayda izlenmeye devam hasta sayısı 11 iken, 5.27’inci ve 11.33’üncü ayda birer hasta çeşitli nedenlerden izlemeden ayrılmıştır. 13.30’uncu ayda ise bir hasta ölmüştür. 13.30’uncu ayda ölüm oranı, Q13.30 =
1 = 0.111 , 9
sağkalım oranı, P13.30 =1 – 0.111 = 0.889 , birikimli sağkalım hızı, hesaplanır.
R13.30 = (0.917) ! (0.889) = 0.815
olarak
Her sonlanma anı için işlemlerimiz tamamlarsak aşağıdaki tabloyu elde ederiz (Tablo 4). Ortalama sağkalım süresi aşağıdaki ifade ile hesaplanır.
µ = t1 + R1 " (t 2 ! t1 ) + R2 " (t3 ! t 2 ) + L + Rn!1 " (t n ! t n!1 ) µ = 1.73 + (0.917) · (5.27 – 1.73) + (0.917) · (11.33 – 5.27)
+ L + (0.158) " (52.80 ! 45.17) Ortalama sağkalım süresi, µ =32.98 ay. Medyan sağkalım süresi, birikimli sağkalım hızının 0.50’ye eşit olduğu t süresi olarak hesaplanır. Tablo 4’ten, medyan sağkalım süresinin 34.47 ay olduğu görülür.
227
Tablo 4. Kaplan – Meier sağkalım çözümlemesi sonuçları. HASTA ADI
İZLEME SÜRESİ (AY)
H İ I A F J G C Ç D B E
t 0 1,73 5,27 11,33 13,30 20,30 20,37 26,53 34,47 35,03 41,73 45,17 52,80
İZLEME İZLEME SONUCU SONUCU
Dt EX. KAYIP KAYIP EX. EX. HAY. EX. EX. KAYIP EX. EX. HAY.
1 0 0 1 1 0 1 1 0 1 1 0
İZLEMEDEKİ KÜMÜLATİF ÖLÜM SAĞKALIM SAĞKALIM HASTA SAYISI OLASILIĞI OLASILIĞI OLASILIĞI
Lt 12 11 10 9 8 7 6 5 4 3 2 1
Qt 0,083 0,000 0,000 0,111 0,125 0,000 0,167 0,200 0,000 0,333 0,500 0,000
Pt
Rt
0,917 1,000 1,000 0,889 0,875 1,000 0,833 0,800 1,000 0,667 0,500 1,000
1,00 0,917 0,917 0,917 0,815 0,713 0,713 0,594 0,475 0,475 0,317 0,158 0,158
Sağkalım analizini SPSS istatistik analiz programı ile yaptığımızda analiz sonuçları aşağıdaki gibi elde edilir (Tablo 5). Tablo 5. Sağkalım çözümlemesi sonuçları. İzleme süresi Olay (sonuç) sıklığı Ortalama sağkalım süresi Medyan sağkalım süresi 2.yılda birikimli sağkalım hızı
Medyan izleme süresi (min. – maks.) 23.45 (1.70 – 52.80) Olay sayısı / hasta sayısı 7/12 Ortalama sağkalım süresi ± standart hata (%95 Güven aralığı) 32.98 ± 4.92 (23.30 – 42.58) Medyan sağkalım süresi ± standart hata (%95 GA) 34.47 ± 9.13 (16.58 – 52.35) (2.yılda) R ± SE % 71.30 ± % 14.14
228
3. yılda halen izlenmekte olan hasta sayısı (3) çok küçük olduğundan, burada birikimli sağkalım hızını veremiyoruz. Sağkalım eğrisi Şekil 4’te verilmektedir.
Şekil 4 Sağkalım eğrisi. Örnek 2 . Randomize paralel kontrollü klinik bir çalışmada, (A) kolunda 20 hasta (B) kolunda 15 hasta izlenmiştir. İzleme sonuçları aşağıdaki tabloda verilmektedir (Tablo 6.) (A) ve (B) kollarındaki sağkalım eğrilerini karşılaştırınız.
229
Tablo 6. (A) ve (B) kollarında izleme bilgileri.
HASTA NO 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20
A GRUBU İZLEME SURESİ (AY) 03 06 07 08 15 18 22 20 16 28 35 19 16 22 14 16 19 06 22 29
SONUÇ EX KAYIP HAYATTA EX KAYIP KAYIP EX EX EX KAYIP HAYATTA HAYATTA KAYIP HAYATTA EX EX KAYIP EX EX EX
230
HASTA NO 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
B GRUBU İZLEME SURESİ (AY) 01 03 28 16 17 22 12 11 10 19 12 09 04 06 03
SONUÇ EX EX EX KAYIP EX EX EX EX EX EX EX EX KAYIP EX EX
Çözüm : Her iki koldaki sağkalım analizi sonuçları, sağkalım eğrileri ve istatistiksel karşılaştırma sonuçları (SPSS) aşağıdaki gibi hesaplanır (Tablo 7) (Şekil 5). Tablo 7. (A) ve (B) kollarında sağkalım sonuçları. Medyan izleme (A) süresi (ay) (B) Olay (sonuç) (A) sıklığı (B) Ortalama (A) sağkalım süresi (B) (ay) Medyan sağkalım (A) süresi (B) 1.yılda birikimli (A) sağkalım hızı (B) Sağkalım eğrilerinin istatistiksel karşılaştırması
17 ( 3 – 35 ) 11 ( 1 – 28 ) 10 / 20 13 / 15 21.90 ± 2.49 ( 17.02 – 26.78) 12.65 ± 2.18 ( 8.37 – 16.93 ) 22.00 ± 1.47 ( 19.11 – 24.89 ) 12.00 ± 1.18 ( 9.68 – 14.32 ) % 84.4 ± % 8.3 % 36.4 ± % 12.9 Log- rank = 7.82 , s.d.=1, p=0.0052
Şekil 5. (A) ve (B) kollarına ait sağkalım eğrileri. 231
16.6. YAŞAM TABLOSU YÖNTEMİ Yaşam tablosu (Life table, actuarial) yönteminde, Kaplan Meier yönteminden farklı olarak, izleme periyodu eşit aralıklara bölünür. İzleme periyodu, incelenen verinin özelliğine göre, 3’er aylık, 6’şar aylık veya 1’er yıllık aralıklara bölünür ve elde edilen her aralık için sağkalım hesaplamaları yapılır. Çözümlemede kullanılan simgeler aşağıdaki gibi tanımlanır. Li : i . aralığın başında izlenmekte olan hasta sayısı,
Di : i. aralıkta, sonlanan (“olay” tanımına göre, ölen ve/veya nüks eden) hasta sayısı, U i : i. aralıkta çeşitli nedenlerle izlenemeyen (kayıp) hasta sayısı,
Ei : i. aralıkta risk altındaki hasta sayısı ( Ei = Li !
Ui ), 2
Di ), Ei Pi : i. aralıkta sağkalım hızı ( Pi = 1 - Qi ) Ri : başlangıçtan 1. aralığın sonuna kadar olan dönemde birikimli
Qi : i. aralıkta sonlanma hızı ( Qi =
i
sağkalım hızı ( Ri =
! P ). j
J =1
Örnek 3. (X) kanser türünde tedavi edilen 290 hasta 5 yıl süreyle izlenmiş ve izleme sonucunda elde edilen bilgiler Tablo 8’de özetlenmiştir. İzleme periyodunu 6’şar aylık aralıklara bölerek yaşam tablosu yöntemi ile sağkalım hızlarını ve sağkalım eğrisini elde etmek isteyelim. Tablo 8. 290 hastanın tedaviden sonraki izleme bilgileri. İzleme periyodu (i)
Periyodun başında izlenen
Ölen hasta
İzlenemeyen hasta
hasta sayısı ( Li )
sayısı( Di )
sayısı ( U i )
0- 6 6 - 12 12 - 18 18 - 24 24 - 30 30 - 36 36 - 42 42 - 48 48 - 54 54 - 60
290
40 15 5 10 0 0 3 0 2 0
55 60 35 30 15 0 0 0 0 0
232
Çözüm : 1. aralıkta ( 0 – 6 ay ) ölen hasta sayısı, D1 = 40, izlenemeyen hasta sayısı, U1 = 55 ‘tir. İzlenemeyen 55 hastanın yarısının, periyot süresince izlendikleri ve hayatta oldukları kabul edilir. Buna göre, 1. periyoda ait ölüm hızının hesaplanmasında risk altındaki hasta sayısı, E1 = L1 !
U1 ifadesi ile 2
hesaplanır.
E1 = 290 !
55 = 262.5 2
Yine, 1.aralığa ait ölüm hızını, sağkalım hızını ve birikimli sağkalım hızını aşağıdaki gibi hesaplarız.
40 D1 = 0.15 = E1 262.5 P1 = 1 ! Q1 = 1- 0.15 = 0.85
Q1 =
R1 = (1) ! (0.85) =0.85 ( R0 = 1 olduğunu hatırlayalım). 1. aralığın sonunda (2.aralığın başında) halen izlenmekte olan hasta sayısı, L2 = L1 ! D1 ! U1 = 290 – 40 – 55 = 195 olarak hesaplanır. Aynı şekilde diğer aralıklar için hesaplamalar yapılır (Tablo 9). Tablo 9. “Yaşam Tablosu” yöntemi ile elde edilen sağkalım sonuçları. (i)
( Li )
( Di )
(Ui )
( Ei )
( Qi )
( Pi )
( Ri )
0- 6 6 - 12 12 - 18 18 - 24 24 - 30 30 - 36 36 - 42 42 - 48 48 - 54 54 - 60
290 195 120 80 40 25 25 22 22 20
40 15 5 10 0 0 3 0 2 0
55 60 35 30 15 0 0 0 0 0
262.5 165.0 102.5 65.0 32.5 25.0 25.0 22.0 22.0 20.0
0.15 0.09 0.05 0.15 0.0 0.0 0.12 0.0 0.09 0.0
0.85 0.91 0.95 0.85 1.0 1.0 0.88 1.0 0.91 1.0
0.85 0.77 0.73 0.62 0.62 0.62 0.55 0.55 0.50 0.50
233
Sağkalım eğrisi aşağıdaki gibi çizilir (Şekil 6.)
Şekil 6. Sağkalım eğrisi
234
KAYNAKÇA •
Daniel, W.W. :"Applied Nonparametric Statistics", Houghton Mifflin Company, Boston, (1978).
•
Dixon, W.J.: "BMDP Statistical Software Manual", University of California Press, Berkeley, (1988).
•
Dupont, W.D.: "Statistical Modeling for Biomedical Researchers", Cambridge University Press, Cambridge, (2002).
•
Edwards, A.L.: "An Introduction to Linear regression and Correlation", W.H. Freemann and Company, New York, (1984)
•
Edwards, A.L.: "Multiple Regression and the Analysis of Variance and Covariance", W.H. Freemann and Company, New York, (1985)
•
Fould, R.F.: "Cancer Statistics", Adam Hilger Ltd, Bristol, (1983).
•
Ingelfinger, J.A., Mosteller, F., Thibodeau, L.A., Ware, J.H.: “Biostatistics in Clinical Medicine”, Macmillian Publishing Co., Inc., New York, (1987).
•
Glantz, S.A.: "Primer of Biostatistics",McGraw-Hill Inc., Newyork, (1997).
•
Johnson, R.A.: " Applied Multivariate Statistical Analysis", Prentice- Hall Inc.,London, (1982).
•
Kirkwood, B.R.: "Medical Statistics",BlackwellScientific Publications, London, (1988).
•
Kleinbaum, D.G., Klein, M.: "logistic Regression", Springer-Verlag Inc., New York, (2002).
•
Kleinbaum, D.G., Kupper, L.L., Morgenstern, H. :"Epidemiologic Resarch", Van Nostrand Reinhold Company, Newyork, (1982).
•
Knapp, R.G., Miller, M.C.: "Clinical Epidemiology and Biostatistics", Williams & Wilkins, Baltimore, (1992).
•
Lentner, C.:" Geigy Scientific Tables", Ciba-Geigy co., New Jersey, (1982).
•
Lwanga, S.K., Tye, C.Y., Ayeni, O.: " Teaching Health Statistics", World Health Organization, Geneva, (1999).
•
Mardia, K.V., Kent J.T., Bibby, J.M.: "Multivariate Analysis", Academic Press, Inc., London, (1979).
•
Motulsky, H. :"Intuitive Biostatistics",Oxford University Press Inc., Newyork, (1995).
•
Orkin, M., Drogin, R.: "Vital Statistics",McGraw-Hill Inc., New Delhi, (1975).
•
Papoulis, A.: "Probability, Random Variables, and Stochastic Processes", McGraw-Hill, Inc.,
•
Riffenburgh, R.H.: “Statistics in Medicine”, Elsevier Academic Pres Inc., San Diego, (2006).
•
Saunders B.D., Trapp, R.G.: "Basic and Clinical Biostatistics", Prentice-Hill International Inc.,
Tokyo, (1984)
London, (1990). •
Savitz, D.A.: “Interpreting epidemiologic Evidence”, Oxford University Press , Inc., New York, (2003).
•
Siegel, S.: "Nonparametric Statistics", McGraw-Hill Inc., New York, (1956).
•
Spiegel, M.R.: "Statistic", McGraw-Hill Inc., Newyork, (1972).
•
Weast, R.C. :"Handbook of Tables for Probability and Statistics", The Chemical Rubber Co., Ohio, (1968).
•
Yamane, T.: "Statistics", Harper & Row and John Weatherhill, Inc., Tokyo, (1969).
235
İstatistik Tabloları
236
Tablo I . Rastlantısal Sayılar Tablosu 22310
08115
50591
14063
10277
42518
54877
65494
41721
44152
64962
18302
32248
08832
77881
12576
59663
39812
98580
63047
74525
90277
25632
70283
00961
66462
64044
50861
21105
83148
59144
56620
88736
16939
79247
09890
54705
13309
04885
11562
15969
27227
29183
18722
02339
41304
27168
86456
27793
54470
35388
18728
60758
30592
71876
10531
28139
37752
17643
23368
06550
89378
65842
69393
04331
04694
10861
64757
25872
42893
56885
01099
93100
14483
72734
75735
66185
31520
39590
88170
85411
30159
25643
80382
58932
28266
67126
88798
31692
52791
96075
42844
88310
69652
62492
75843
23971
66843
41358
15783
48470
28841
38211
12510
75547
35748
20704
00316
94538
77910
55683
70901
43221
92688
94876
92636
03123
83203
13941
52255
27618
44778
87930
74260
71598
69915
70767
35337
42328
79577
90356
63459
03438
14682
88043
15905
52712
67756
04799
80089
58214
81093
58385
64335
65921
37061
43329
40765
58332
07252
85278
46630
23898
66814
73349
76916
98945
12865
75860
39628
66748
46854
59763
68087
45008
59263
99242
93145
77277
45153
79686
61607
38820
85460
74455
04262
24408
47845
03769
26412
99460
43775
50475
00301
20073
54904
46143
54044
79689
66003
45844
89955
02568
09337
86269
96749
79750
74966
25881
74057
46081
94606
96675
26161
60197
85688
87652
85256
61564
38845
62694
85472
40016
11588
58374
09079
46334
89989
39667
84497
87652
92940
24064
51159
85719
49916
96541
68192
05102
97506
35399
86685
28781
95673
27348
21605
28408
01833
74828
70611
53684
90349
08600
82024
99658
68485
59476
59588
03028
23813
00840
45311
69412
25508
58691
77749
04556
83419
99473
15599
15077
57395
34144
08358
17870
42741
57648
03033
74020
27223
34658
37601
86379
13872
08281
77474
29275
55550
58483
53784
56389
86731
06988
99874
30667
01437
38743
13370
08154
47250
86517
28698
67210
10045
86806
57474
78979
57979
57561
12595
68279
57074
10365
08865
81381
02434
95848
00409
16229
72929
60849
29838
71486
50593
58344
60629
26898
35278
19360
74438
62356
69336
33475
39660
55349
21379
15048
99652
49687
93915
79575
72337
46044
99509
82682
39131
35743
61662
25892
58356
02430
96548
44275
09064
62155
67291
70386
08091
73932
71968
(Rastlantısal sayılar tablosu EXCEL bilgisayar programındaki “S_SAYI_ÜRET” fonksiyonu kullanılarak oluşturulmuştur)
237
Tablo II. Poisson Olasılıkları Başarı Sayısı (x)
µ =np , P( x) = e µ
0
1
2
3
!µ
µx x!
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,09
0
----
0,9048
0,8187
0,7408
0,6703
0,6065
0,5488
0,4014
0,4493
0,4628
1
0,3679
0,3329
0,3012
0,2725
0,2466
0,2231
0,2019
0,5718
0,1653
0,3028
2
0,1353
0,1225
0,1108
0,1003
0,0907
0,0821
0,0743
0,7500
0,0608
0,1152
3
0,0498
0,0450
0,0408
0,0369
0,0334
0,0302
0,0273
0,8728
0,0224
0,0355
4
0,0183
0,0166
0,0150
0,0136
0,0123
0,0111
0,0101
0,9407
0,0082
0,0109
5
0,0067
0,0061
0,0055
0,0050
0,0045
0,0041
0,0037
0,9738
0,0030
0,0035
µ
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,09
0
0,0000
0,0905
0,1637
0,2222
0,2681
0,3033
0,3293
0,3476
0,3595
0,3659
1
0,3679
0,3662
0,3614
0,3543
0,3452
0,3347
0,3230
0,3106
0,2975
0,2842
2
0,2707
0,2572
0,2438
0,2306
0,2177
0,2052
0,1931
0,1815
0,1703
0,1596
3
0,1494
0,1397
0,1304
0,1217
0,1135
0,1057
0,0984
0,0915
0,0850
0,0789
4
0,0733
0,0679
0,0630
0,0583
0,0540
0,0500
0,0462
0,0427
0,0395
0,0365
5
0,0337
0,0311
0,0287
0,0265
0,0244
0,0225
0,0207
0,0191
0,0176
0,0162
µ
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,09
0
0,0000
0,0045
0,0164
0,0333
0,0536
0,0758
0,0988
0,1217
0,1438
0,1647
1
0,1839
0,2014
0,2169
0,2303
0,2417
0,2510
0,2584
0,2640
0,2678
0,2700
2
0,2707
0,2700
0,2681
0,2652
0,2613
0,2565
0,2510
0,2450
0,2384
0,2314
3
0,2240
0,2165
0,2087
0,2008
0,1929
0,1850
0,1771
0,1692
0,1615
0,1539
4
0,1465
0,1393
0,1323
0,1254
0,1188
0,1125
0,1063
0,1005
0,0948
0,0894
5
0,0842
0,0793
0,0746
0,0701
0,0659
0,0618
0,0580
0,0544
0,0509
0,0477
µ
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,09
0
0,0000
0,0002
0,0011
0,0033
0,0072
0,0126
0,0198
0,0284
0,0383
0,0494
1
0,0613
0,0738
0,0867
0,0998
0,1128
0,1255
0,1378
0,1496
0,1607
0,1710
2
0,1804
0,1890
0,1966
0,2033
0,2090
0,2138
0,2176
0,2205
0,2225
0,2237
3
0,2240
0,2237
0,2226
0,2209
0,2186
0,2158
0,2125
0,2087
0,2046
0,2001
4
0,1954
0,1904
0,1852
0,1798
0,1743
0,1687
0,1631
0,1574
0,1517
0,1460
5
0,1404
0,1348
0,1293
0,1239
0,1185
0,1133
0,1082
0,1033
0,0985
0,0938
(Poisson Olasılıkları tablosu EXCEL bilgisayar programındaki “POISSON” fonksiyonu kullanılarak oluşturulmuştur)
238
Tablo III. Standart Normal Eğri Alanları
!i
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,00000
0,00399
0,00798
0,01197
0,01595
0,01994
0,02392
0,02790
0,03188
0,03586
0,1
0,03983
0,04380
0,04776
0,05172
0,05567
0,05962
0,06356
0,06749
0,07142
0,07535
0,2
0,07926
0,08317
0,08706
0,09095
0,09483
0,09871
0,10257
0,10642
0,11026
0,11409
0,3
0,11791
0,12172
0,12552
0,12930
0,13307
0,13683
0,14058
0,14431
0,14803
0,15173
0,4
0,15542
0,15910
0,16276
0,16640
0,17003
0,17364
0,17724
0,18082
0,18439
0,18793
0,5
0,19146
0,19497
0,19847
0,20194
0,20540
0,20884
0,21226
0,21566
0,21904
0,22240
0,6
0,22575
0,22907
0,23237
0,23565
0,23891
0,24215
0,24537
0,24857
0,25175
0,25490
0,7
0,25804
0,26115
0,26424
0,26730
0,27035
0,27337
0,27637
0,27935
0,28230
0,28524
0,8
0,28814
0,29103
0,29389
0,29673
0,29955
0,30234
0,30511
0,30785
0,31057
0,31327
0,9
0,31594
0,31859
0,32121
0,32381
0,32639
0,32894
0,33147
0,33398
0,33646
0,33891
1,0
0,34134
0,34375
0,34614
0,34849
0,35083
0,35314
0,35543
0,35769
0,35993
0,36214
1,1
0,36433
0,36650
0,36864
0,37076
0,37286
0,37493
0,37698
0,37900
0,38100
0,38298
1,2
0,38493
0,38686
0,38877
0,39065
0,39251
0,39435
0,39617
0,39796
0,39973
0,40147
1,3
0,40320
0,40490
0,40658
0,40824
0,40988
0,41149
0,41309
0,41466
0,41621
0,41774
1,4
0,41924
0,42073
0,42220
0,42364
0,42507
0,42647
0,42785
0,42922
0,43056
0,43189
1,5
0,43319
0,43448
0,43574
0,43699
0,43822
0,43943
0,44062
0,44179
0,44295
0,44408
1,6
0,44520
0,44630
0,44738
0,44845
0,44950
0,45053
0,45154
0,45254
0,45352
0,45449
1,7
0,45543
0,45637
0,45728
0,45818
0,45907
0,45994
0,46080
0,46164
0,46246
0,46327
1,8
0,46407
0,46485
0,46562
0,46638
0,46712
0,46784
0,46856
0,46926
0,46995
0,47062
1,9
0,47128
0,47193
0,47257
0,47320
0,47381
0,47441
0,47500
0,47558
0,47615
0,47670
2,0
0,47725
0,47778
0,47831
0,47882
0,47932
0,47982
0,48030
0,48077
0,48124
0,48169
2,1
0,48214
0,48257
0,48300
0,48341
0,48382
0,48422
0,48461
0,48500
0,48537
0,48574
2,2
0,48610
0,48645
0,48679
0,48713
0,48745
0,48778
0,48809
0,48840
0,48870
0,48899
2,3
0,48928
0,48956
0,48983
0,49010
0,49036
0,49061
0,49086
0,49111
0,49134
0,49158
2,4
0,49180
0,49202
0,49224
0,49245
0,49266
0,49286
0,49305
0,49324
0,49343
0,49361
2,5
0,49379
0,49396
0,49413
0,49430
0,49446
0,49461
0,49477
0,49492
0,49506
0,49520
2,6
0,49534
0,49547
0,49560
0,49573
0,49585
0,49598
0,49609
0,49621
0,49632
0,49643
2,7
0,49653
0,49664
0,49674
0,49683
0,49693
0,49702
0,49711
0,49720
0,49728
0,49736
2,8
0,49744
0,49752
0,49760
0,49767
0,49774
0,49781
0,49788
0,49795
0,49801
0,49807
2,9
0,49813
0,49819
0,49825
0,49831
0,49836
0,49841
0,49846
0,49851
0,49856
0,49861
3,0
0,49865
0,49869
0,49874
0,49878
0,49882
0,49886
0,49889
0,49893
0,49896
0,49900
3,1
0,49903
0,49906
0,49910
0,49913
0,49916
0,49918
0,49921
0,49924
0,49926
0,49929
(Standart Normal Alanlar tablosu EXCEL bilgisayar programındaki “NORMSDAĞ” fonksiyonu kullanılarak oluşturulmuştur)
239
Tablo IV Çeşitli Serbestlik Derecesi (s.d.) Ve (iki yönlü) Olasılık Değerlerine Karşılık Gelen t Tablosu
(iki yönlü) Olasılık
Serbestlik Derecesi s.d. 1 2 3 4 5 6 7 8 9 10
0,50 1,0000 0,8165 0,7649 0,7407 0,7267 0,7176 0,7111 0,7064 0,7027 0,6998
0,20 3,0777 1,8856 1,6377 1,5332 1,4759 1,4398 1,4149 1,3968 1,3830 1,3722
0,10 6,3138 2,9200 2,3534 2,1318 2,0150 1,9432 1,8946 1,8595 1,8331 1,8125
0,05 12,7062 4,3027 3,1824 2,7764 2,5706 2,4469 2,3646 2,3060 2,2622 2,2281
0,02 31,8205 6,9646 4,5407 3,7469 3,3649 3,1427 2,9980 2,8965 2,8214 2,7638
0,01 63,6567 9,9248 5,8409 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693
0,001 636,6192 31,5991 12,9240 8,6103 6,8688 5,9588 5,4079 5,0413 4,7809 4,5869
11 12 13 14 15 16 17 18 19 20
0,6974 0,6955 0,6938 0,6924 0,6912 0,6901 0,6892 0,6884 0,6876 0,6870
1,3634 1,3562 1,3502 1,3450 1,3406 1,3368 1,3334 1,3304 1,3277 1,3253
1,7959 1,7823 1,7709 1,7613 1,7531 1,7459 1,7396 1,7341 1,7291 1,7247
2,2010 2,1788 2,1604 2,1448 2,1314 2,1199 2,1098 2,1009 2,0930 2,0860
2,7181 2,6810 2,6503 2,6245 2,6025 2,5835 2,5669 2,5524 2,5395 2,5280
3,1058 3,0545 3,0123 2,9768 2,9467 2,9208 2,8982 2,8784 2,8609 2,8453
4,4370 4,3178 4,2208 4,1405 4,0728 4,0150 3,9651 3,9216 3,8834 3,8495
21 22 23 24 25 26 27 28 29 30
0,6864 0,6858 0,6853 0,6848 0,6844 0,6840 0,6837 0,6834 0,6830 0,6828
1,3232 1,3212 1,3195 1,3178 1,3163 1,3150 1,3137 1,3125 1,3114 1,3104
1,7207 1,7171 1,7139 1,7109 1,7081 1,7056 1,7033 1,7011 1,6991 1,6973
2,0796 2,0739 2,0687 2,0639 2,0595 2,0555 2,0518 2,0484 2,0452 2,0423
2,5176 2,5083 2,4999 2,4922 2,4851 2,4786 2,4727 2,4671 2,4620 2,4573
2,8314 2,8188 2,8073 2,7969 2,7874 2,7787 2,7707 2,7633 2,7564 2,7500
3,8193 3,7921 3,7676 3,7454 3,7251 3,7066 3,6896 3,6739 3,6594 3,6460
40 50 60 70 80 90 100 1000
0,6807 0,6794 0,6786 0,6780 0,6776 0,6772 0,6770 0,6747
1,3031 1,2987 1,2958 1,2938 1,2922 1,2910 1,2901 1,2824
1,6839 1,6759 1,6706 1,6669 1,6641 1,6620 1,6602 1,6464
2,0211 2,0086 2,0003 1,9944 1,9901 1,9867 1,9840 1,9623
2,4233 2,4033 2,3901 2,3808 2,3739 2,3685 2,3642 2,3301
2,7045 2,6778 2,6603 2,6479 2,6387 2,6316 2,6259 2,5808
3,5510 3,4960 3,4602 3,4350 3,4163 3,4019 3,3905 3,3003
n"!
0,6745
1,2816
1,6449
1,9600
2,3263
2,5758
3,2905
(t tablosu EXCEL bilgisayar programındaki “TTERS” fonksiyonu kullanılarak oluşturulmuştur)
240
241
∞
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 40 50 100
(payda) s.d.
2
3
4
3,84
3,00
2,60
2,37
161,45 199,50 215,71 224,58 18,51 19,00 19,16 19,25 10,13 9,55 9,28 9,12 7,71 6,94 6,59 6,39 6,61 5,79 5,41 5,19 5,99 5,14 4,76 4,53 5,59 4,74 4,35 4,12 5,32 4,46 4,07 3,84 5,12 4,26 3,86 3,63 4,96 4,10 3,71 3,48 4,84 3,98 3,59 3,36 4,75 3,89 3,49 3,26 4,67 3,81 3,41 3,18 4,60 3,74 3,34 3,11 4,54 3,68 3,29 3,06 4,49 3,63 3,24 3,01 4,45 3,59 3,20 2,96 4,41 3,55 3,16 2,93 4,38 3,52 3,13 2,90 4,35 3,49 3,10 2,87 4,32 3,47 3,07 2,84 4,30 3,44 3,05 2,82 4,28 3,42 3,03 2,80 4,26 3,40 3,01 2,78 4,24 3,39 2,99 2,76 4,17 3,32 2,92 2,69 4,08 3,23 2,84 2,61 4,03 3,18 2,79 2,56 3,94 3,09 2,70 2,46
1
2,21
230,16 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2,68 2,66 2,64 2,62 2,60 2,53 2,45 2,40 2,31
5
6
2,10
233,99 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,42 2,34 2,29 2,19
Tablo V a. α=0.05 için F tablosu.
2,01
236,77 19,35 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54 2,51 2,49 2,46 2,44 2,42 2,40 2,33 2,25 2,20 2,10
7
1,94
238,88 19,37 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48 2,45 2,42 2,40 2,37 2,36 2,34 2,27 2,18 2,13 2,03
8
1,88
240,54 19,38 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,90 2,80 2,71 2,65 2,59 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,30 2,28 2,21 2,12 2,07 1,97
9
10
1,83
241,88 19,40 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,16 2,08 2,03 1,93
(pay) serbestlik derecesi
1,75
243,91 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,09 2,00 1,95 1,85
12
1,67
245,95 19,43 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,18 2,15 2,13 2,11 2,09 2,01 1,92 1,87 1,77
15
1,57
248,01 19,45 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 2,01 1,93 1,84 1,78 1,68
20
1,46
250,10 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,84 1,74 1,69 1,57
30
1,39
251,14 19,47 8,59 5,72 4,46 3,77 3,34 3,04 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 1,99 1,96 1,94 1,91 1,89 1,87 1,79 1,69 1,63 1,52
40
1,35
251,77 19,48 8,58 5,70 4,44 3,75 3,32 3,02 2,80 2,64 2,51 2,40 2,31 2,24 2,18 2,12 2,08 2,04 2,00 1,97 1,94 1,91 1,88 1,86 1,84 1,76 1,66 1,60 1,48
50
∞
1,24
1,00
253,04 254,31 19,49 19,50 8,55 8,53 5,66 5,63 4,41 4,37 3,71 3,67 3,27 3,23 2,97 2,93 2,76 2,71 2,59 2,54 2,46 2,40 2,35 2,30 2,26 2,21 2,19 2,13 2,12 2,07 2,07 2,01 2,02 1,96 1,98 1,92 1,94 1,88 1,91 1,84 1,88 1,81 1,85 1,78 1,82 1,76 1,80 1,73 1,78 1,71 1,70 1,62 1,59 1,51 1,52 1,44 1,39 1,28
100
F tablosu EXCEL bilgisayar programındaki “FTERS” fonksiyonu kullanılarak oluşturulmuştur)
242
∞
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 40 50 100
(payda) s.d.
2
3
6,63
4,61
3,78
4052,2 4999,5 5403,4 98,50 99,00 99,17 34,12 30,82 29,46 21,20 18,00 16,69 16,26 13,27 12,06 13,75 10,92 9,78 12,25 9,55 8,45 11,26 8,65 7,59 10,56 8,02 6,99 10,04 7,56 6,55 9,65 7,21 6,22 9,33 6,93 5,95 9,07 6,70 5,74 8,86 6,51 5,56 8,68 6,36 5,42 8,53 6,23 5,29 8,40 6,11 5,18 8,29 6,01 5,09 8,18 5,93 5,01 8,10 5,85 4,94 8,02 5,78 4,87 7,95 5,72 4,82 7,88 5,66 4,76 7,82 5,61 4,72 7,77 5,57 4,68 7,56 5,39 4,51 7,31 5,18 4,31 7,17 5,06 4,20 6,90 4,82 3,98
1
3,32
5624,6 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,21 5,04 4,89 4,77 4,67 4,58 4,50 4,43 4,37 4,31 4,26 4,22 4,18 4,02 3,83 3,72 3,51
4
3,02
5763,6 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,69 4,56 4,44 4,34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,85 3,70 3,51 3,41 3,21
5
6
2,80
5859,0 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,80 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 3,81 3,76 3,71 3,67 3,63 3,47 3,29 3,19 2,99
Tablo V b. α=0.01 için F tablosu.
2,64
5928,4 99,36 27,67 14,98 10,46 8,26 6,99 6,18 5,61 5,20 4,89 4,64 4,44 4,28 4,14 4,03 3,93 3,84 3,77 3,70 3,64 3,59 3,54 3,50 3,46 3,30 3,12 3,02 2,82
7
2,51
5981,1 99,37 27,49 14,80 10,29 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4,14 4,00 3,89 3,79 3,71 3,63 3,56 3,51 3,45 3,41 3,36 3,32 3,17 2,99 2,89 2,69
8
2,41
6022,5 99,39 27,35 14,66 10,16 7,98 6,72 5,91 5,35 4,94 4,63 4,39 4,19 4,03 3,89 3,78 3,68 3,60 3,52 3,46 3,40 3,35 3,30 3,26 3,22 3,07 2,89 2,78 2,59
9
10
2,32
6055,8 99,40 27,23 14,55 10,05 7,87 6,62 5,81 5,26 4,85 4,54 4,30 4,10 3,94 3,80 3,69 3,59 3,51 3,43 3,37 3,31 3,26 3,21 3,17 3,13 2,98 2,80 2,70 2,50
(pay) serbestlik derecesi
2,18
6106,3 99,42 27,05 14,37 9,89 7,72 6,47 5,67 5,11 4,71 4,40 4,16 3,96 3,80 3,67 3,55 3,46 3,37 3,30 3,23 3,17 3,12 3,07 3,03 2,99 2,84 2,66 2,56 2,37
12
2,04
6157,3 99,43 26,87 14,20 9,72 7,56 6,31 5,52 4,96 4,56 4,25 4,01 3,82 3,66 3,52 3,41 3,31 3,23 3,15 3,09 3,03 2,98 2,93 2,89 2,85 2,70 2,52 2,42 2,22
15
1,88
6208,7 99,45 26,69 14,02 9,55 7,40 6,16 5,36 4,81 4,41 4,10 3,86 3,66 3,51 3,37 3,26 3,16 3,08 3,00 2,94 2,88 2,83 2,78 2,74 2,70 2,55 2,37 2,27 2,07
20
1,70
6260,6 99,47 26,50 13,84 9,38 7,23 5,99 5,20 4,65 4,25 3,94 3,70 3,51 3,35 3,21 3,10 3,00 2,92 2,84 2,78 2,72 2,67 2,62 2,58 2,54 2,39 2,20 2,10 1,89
30
1,59
6286,8 99,47 26,41 13,75 9,29 7,14 5,91 5,12 4,57 4,17 3,86 3,62 3,43 3,27 3,13 3,02 2,92 2,84 2,76 2,69 2,64 2,58 2,54 2,49 2,45 2,30 2,11 2,01 1,80
40
1,52
6302,5 99,48 26,35 13,69 9,24 7,09 5,86 5,07 4,52 4,12 3,81 3,57 3,38 3,22 3,08 2,97 2,87 2,78 2,71 2,64 2,58 2,53 2,48 2,44 2,40 2,25 2,06 1,95 1,74
50
∞
1,36
1,00
6334,1 6365,9 99,49 99,50 26,24 26,13 13,58 13,46 9,13 9,02 6,99 6,88 5,75 5,65 4,96 4,86 4,41 4,31 4,01 3,91 3,71 3,60 3,47 3,36 3,27 3,17 3,11 3,00 2,98 2,87 2,86 2,75 2,76 2,65 2,68 2,57 2,60 2,49 2,54 2,42 2,48 2,36 2,42 2,31 2,37 2,26 2,33 2,21 2,29 2,17 2,13 2,01 1,94 1,80 1,82 1,68 1,60 1,43
100
F tablosu EXCEL bilgisayar programındaki “FTERS” fonksiyonu kullanılarak oluşturulmuştur)
Tablo VI . Ki-Kare Tablosu Serbestlik Derecesi s.d.
Olasılıklar 0,90
0,50
0,30
0,20
0,10
0,05
0,02
0,01
0,001
1
0,016
0,455
1,074
1,642
2,706
3,841
5,412
6,635
10,828
2
0,211
1,386
2,408
3,219
4,605
5,991
7,824
9,210
13,816
3
0,584
2,366
3,665
4,642
6,251
7,815
9,837
11,345
16,266
4
1,064
3,357
4,878
5,989
7,779
9,488
11,668
13,277
18,467
5
1,610
4,351
6,064
7,289
9,236
11,070
13,388
15,086
20,515
6
2,204
5,348
7,231
8,558
10,645
12,592
15,033
16,812
22,458
7
2,833
6,346
8,383
9,803
12,017
14,067
16,622
18,475
24,322
8
3,490
7,344
9,524
11,030
13,362
15,507
18,168
20,090
26,124
9
4,168
8,343
10,656
12,242
14,684
16,919
19,679
21,666
27,877
10
4,865
9,342
11,781
13,442
15,987
18,307
21,161
23,209
29,588
11
5,578
10,341
12,899
14,631
17,275
19,675
22,618
24,725
31,264
12
6,304
11,340
14,011
15,812
18,549
21,026
24,054
26,217
32,909
13
7,042
12,340
15,119
16,985
19,812
22,362
25,472
27,688
34,528
14
7,790
13,339
16,222
18,151
21,064
23,685
26,873
29,141
36,123
15
8,547
14,339
17,322
19,311
22,307
24,996
28,259
30,578
37,697
16
9,312
15,338
18,418
20,465
23,542
26,296
29,633
32,000
39,252
17
10,085
16,338
19,511
21,615
24,769
27,587
30,995
33,409
40,790
18
10,865
17,338
20,601
22,760
25,989
28,869
32,346
34,805
42,312
19
11,651
18,338
21,689
23,900
27,204
30,144
33,687
36,191
43,820
20
12,443
19,337
22,775
25,038
28,412
31,410
35,020
37,566
45,315
21
13,240
20,337
23,858
26,171
29,615
32,671
36,343
38,932
46,797
22
14,041
21,337
24,939
27,301
30,813
33,924
37,659
40,289
48,268
23
14,848
22,337
26,018
28,429
32,007
35,172
38,968
41,638
49,728
24
15,659
23,337
27,096
29,553
33,196
36,415
40,270
42,980
51,179
25
16,473
24,337
28,172
30,675
34,382
37,652
41,566
44,314
52,620
26
17,292
25,336
29,246
31,795
35,563
38,885
42,856
45,642
54,052
27
18,114
26,336
30,319
32,912
36,741
40,113
44,140
46,963
55,476
28
18,939
27,336
31,391
34,027
37,916
41,337
45,419
48,278
56,892
29
19,768
28,336
32,461
35,139
39,087
42,557
46,693
49,588
58,301
30
20,599
29,336
33,530
36,250
40,256
43,773
47,962
50,892
59,703
.(t tablosu EXCEL bilgisayar programındaki “KİKARETERS” fonksiyonu kullanılarak oluşturulmuştur)
243
244
1 - 17
1 - 15
1 - 14
1 - 13
1 - 12
2 - 12
2 - 11
40
50
60
70
80
90
100
10 20 30 40 50 60 70 80 90 100
(n)
0 - 20
30
9 - 24
8 - 24
8 - 25
8 - 26
7 - 27
6 - 28
6 - 30
5 - 33
3 - 38
1 - 50
0.15
14 - 27
13 - 29
12 - 30
11 - 31
11 - 32
10 - 34
9 - 36
8 - 39
6 - 44
3 - 56
0.20
17 - 35
16 - 35
16 - 36
15 - 37
15 - 38
14 - 39
13 - 41
11 - 44
9 - 49
5 - 60
0.25
Örneklem oranı
21 - 40
21 - 41
20 - 41
20 - 42
19 - 43
18 - 45
17 - 47
15 - 49
12 - 54
7 - 65
0.30
26 - 45
25 - 45
25 - 46
24 - 47
23 - 48
22 - 50
21 - 52
19 - 54
15 - 59
9 - 70
0.35
30 - 50
30 - 51
29 - 52
28 - 52
28 - 53
26 - 55
25 - 57
23 - 59
19 - 64
12 - 74
0.40
35 - 55
34 - 56
34 - 57
33 - 57
32 - 58
31 - 60
29 - 62
27 - 64
23 - 68
15 - 78
0.45
-
32 25 21 19 17 16 15 14 14
0 1 1 2 2 3 3 3 4 4
-
54 39 32 28 26 24 23 22 21 20
0.10 1 2 3 4 5 5 6 6 7 7
-
60 45 38 35 32 30 29 28 27 26
0.15 1 - 65 4 - 51 5 - 44 7 - 41 8 - 38 9 - 36 9 - 35 10 - 34 10 - 33 11 - 32
0.20 2 - 69 6 - 56 8 - 50 10 - 46 11 - 44 12 - 42 13 - 40 14 - 39 14 - 38 15 - 38
0.25
4 - 74 8 - 61 11 - 55 13 - 51 15 - 49 16 - 47 17 - 46 18 - 45 18 - 44 19 - 43
0.30
6 - 77 11 - 66 15 - 60 17 - 57 19 - 54 20 - 52 21 - 51 22 - 50 23 - 49 23 - 48
0.35 8 15 19 21 23 24 25 26 27 28
-
81 70 65 61 59 57 56 55 54 53
0.40 10 18 22 25 27 29 30 31 32 32
-
84 74 69 66 64 62 61 60 59 58
0.45
(Kaynak : “Geigy scientific tables”, Introduction to statistics statistical tables, Ciba-geigy limited, Editor : Cornelius Lentner, Basle, Switzerland. Sayfa :89-107.)
0 0 0 0 1 1 1 1 1
0.05
Örneklem oranı
Tablo VIII. Örneklem Oranlarına Ait % 99 Güven Aralıkları
(Kaynak : “Geigy scientific tables”, Introduction to statistics statistical tables, Ciba-geigy limited, Editor : Cornelius Lentner, Basle, Switzerland. Sayfa: 89-107.)
5 - 18
5 - 18
4 - 19
4 - 20
4 - 21
3 - 22
3 - 24
2 - 27
0 - 45
1 - 32
0 - 25
0.10
20
0.05
10
(n)
Tablo VII. Örneklem Oranlarına Ait % 95 Güven Aralıkları
13 22 26 28 32 63 34 35 36 37
-
87 78 74 71 68 67 66 65 64 63
0.50
40 - 60
39 - 61
39 - 61
38 - 62
37 - 63
36 - 64
34 - 66
31 - 69
27 - 73
19 - 81
0.50
Tablo IX. 0.05 ve 0.01 Anlam Düzeylerine Karşılık Gelen Spearman Sıra Farkı Ilişki Katsayısının Alt Sınırları.
n 5 6 7 8 9 10
p <= 0.05 1.00 0.89 0.79 0.74 0.68 0.65
p <= 0.01 --1.00 0.93 0.88 0.83 0.79
Tablo X. (iki yönlü) 0.05 Anlamlılık İçin Kritik U Değerleri
n2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
n1 1 2 3
0 0 0 1 1 1 1 2 2 2 3 3 3 4 0 4 0 4
0 0 1 2 2 3 3 4 5 5 6 7 7 8 9 9 10 11
4 0 1 2 3 4 5 6 7 8 9 10 11 12 14 15 16 17 18
5 0 1 2 4 5 6 8 9 11 12 13 15 16 18 19 20 22 23 25
6 0 2 3 5 7 8 10 12 14 16 17 19 21 23 25 26 28 30 32
7 0 2 4 6 8 11 13 15 17 19 21 24 26 28 30 33 35 37 39
8 1 3 5 8 10 13 15 18 20 23 26 28 31 33 36 39 41 44 47
9 1 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54
10 11 12 13 14 15 1 4 7 11 14 17 20 24 27 31 34 37 41 44 48 51 55 58 62
1 5 8 12 16 19 23 27 31 34 38 42 46 50 54 57 61 65 69
2 5 9 13 17 21 26 30 34 38 42 47 51 55 60 64 68 72 77
2 6 10 15 19 24 28 33 37 42 47 51 56 61 65 70 75 80 84
16
17
2 3 3 3 7 7 8 9 11 12 14 15 16 18 19 20 21 23 25 26 26 28 30 33 31 33 36 39 36 39 42 45 41 44 48 51 46 50 54 57 51 55 60 64 56 61 65 70 61 66 71 77 66 72 77 83 71 77 83 89 77 83 89 96 82 88 95 102 87 94 101 109 92 100 107 115
18
19
20
4 9 16 22 28 35 41 48 55 61 68 75 82 88 95 102 109 116 123
0 4 10 17 23 30 37 44 51 58 65 72 80 87 94 101 109 116 123 130
0 4 11 18 25 32 39 47 54 62 69 77 84 92 100 107 115 123 130 138
(Kaynak : Beyer, W.H.: “Handbook of tables for probability and statistics”, The chemical rubber co., 1966, sayfa : 406.)
245
Tablo XI. (iki yönlü) 0.01 Anlamlılık İçin Kritik U Değerleri
n2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
n1 1
2
0 0 0 0 0 0 1 1
3
0 0 1 1 1 2 2 2 3 3 4 4 4 5
4
0 1 1 2 3 3 4 5 5 6 7 7 8 9 9 10
5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
6
7
8
9
10
11
12
13
14
15
16
17
18
19
1 2 3 4 6 7 8 9 11 12 13 15 16 18 19 20 22
0 1 3 4 6 7 9 11 12 14 16 17 19 21 23 24 26 28
0 2 4 6 7 9 11 13 15 17 20 22 24 26 28 30 32 34
1 3 5 7 9 11 14 16 18 21 23 26 28 31 33 36 38 40
1 3 6 8 11 13 16 19 22 24 27 30 33 36 38 41 44 47
1 4 7 9 12 15 18 22 25 28 31 34 37 41 44 47 50 53
2 5 8 11 14 17 21 24 28 31 35 38 42 46 49 53 56 60
0 2 5 9 12 16 20 23 27 31 35 39 43 47 51 55 59 63 67
0 2 6 10 13 17 22 26 30 34 38 43 47 51 56 60 65 69 73
0 3 7 11 15 19 24 28 33 37 42 47 51 56 61 66 70 75 80
0 3 7 12 16 21 26 31 36 41 46 51 56 61 66 71 76 82 87
0 0 1 1 4 4 4 5 8 9 9 10 13 14 15 16 18 19 20 22 23 24 26 28 28 30 32 34 33 36 38 40 38 41 44 47 44 47 50 53 49 53 56 60 55 59 63 67 60 65 69 73 66 70 75 80 71 76 82 87 77 82 85 93 82 88 94 100 88 94 101 107 93 100 107 114
(Kaynak : Beyer, W.H.: “Handbook of tables for probability and statistics”, The chemical rubber co., 1966, sayfa : 407.)
246
20
Tablo XII Wilcoxon İşaretli Sıra Testinde Kritik T Değerleri. n 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
(iki yönlü)
! = 0.05
1 2 4 6 8 11 14 17 21 25 30 35 40 46 52
(iki yönlü)
! = 0.01
0 2 3 5 7 10 13 16 19 23 28 32 37
(Kaynak : Beyer, W.H.: “Handbook of tables for probability and statistics”, The chemical rubber co., 1966, sayfa : 400.)
247
249
Aralıklı veya oransal (Interval, ratio) (normal dağılım varsa )
Sıralayıcı (Ordinal)
Sınıflayıcı (Nominal)
Ölçüm düzeyleri
Mann-Whitney U (Bölüm 13)
bağımsız gruplarda Student ‘ t test (Bölüm 8)
(yukarıdakilere ek olarak) aritmetik ortalama varyans, standart sapma geometrik ortalama (oransal için) (Bölüm 3)
varyans analizi (Bölüm 12)
Kruskal Wallis test
eşlendirilmiş serilerde Student ‘t test (Bölüm 8)
Wicoxon işaretli sıra testi (Bölüm 13)
Tekrarlı ölçümlerde varyans analizi
Friedman test
Pearson Bravais ilişki katsayısı r, belirleme katsayısı r2 Kısmi ve çoklu korelasyon. Regresyon eşitliği. (Bölüm 11)
Spearman sıra farkı ilişki katsayısı rs (Bölüm 11)
Kontenjans Katsayısı (Bölüm 10) (kohort araştırmalarında.) RR, AR (vaka kontrol) OR (Bölüm 14)
Cochran Q testi
Mc-Nemar testi (sign test)
ki-kare testi (Bölüm 10)
ki-kare testleri (ki-kare, Yates’s ki-kare, Fisher kesin ki-kare) (Bölüm 10) (veya ε testi) (Bölüm 9)
sıklık dağılımı (Bölüm 2) tepe değer (mod) (Bölüm 3)
(yukarıdakilere ek olarak) ortanca (medyan) yüzdelik (persantil) (Bölüm 3)
İki değişken arasındaki ilişki
Birden çok tekrarlı ölçüm
Tek grup (önce / sonra)
Üç veya daha fazla bağımsız grup
Bağımsız iki grup
Geçerli tanımlayıcı istatistikler
Ek 1. Ölçüm düzeyleri ve geçerli istatistik işlemler tablosu
Ek 2 Kendimizi Sınayalım
Ek 2.1. Bölüm 1-4’e ilişkin sorular. Sorular : Soru 1-26 için verilen ifadelerden hangisi/hangileri doğrudur? 1.
I Yığın olayda her birim diğeri ile özdeştir. II Biyoistatistik bilimi yığın olayları inceler. III İstatistik bir belirsizlikte mantıklı kararlar alınmasını sağlayan yöntembilimdir. IV Bir sayısal verinin istatistik olması için veriye ilişkin olayın koşullara göre değişken olması gerekir. a) I
2.
I II III IV
d) II, III, IV
e) I, IV
b) II
c) I, II, IV
d) II, III, IV
e) IV
I Bir varsayım akla uygun ve kavramca açık olmalıdır. II Bir bilimsel araştırma amacına ulaşabilmek için bir plana uymak zorunda değildir. III Olaylar arasında nedensellik ilişkisi aramak varsayımın temel özelliklerinden biridir. IV Bir araştırma her zaman anayığın üzerinde yapılmalıdır. a) I
4.
c) II, IV
İstatistik, bilimsel araştırmalarda kullanılan ortak bir bilim dilidir. Bir varsayımın yanıtı kesin evet veya hayır olmamalıdır. Bir varsayımı kurmak için gözlem yapmaya gerek yoktur. Gözlem yapmanın olanaklı olmadığı olaylar için varsayım kurmanın yararı yoktur. a) I
3.
b) II
b) I, III
c) II, IV
d) III, IV
I
e) I, IV
İstatistik yeterli derecede bilinmeyen bütünler hakkında olası bilgi sağlama yoludur. II Biyoistatistik bilimi yığın olayları inceler ve bunlara ait genel bağıntılar elde etmeye çalışır. 251
III Verilerin toplanması bilimsel bir araştırmanın ilk adımıdır. IV Uygulamalı istatistik, istatistik teorisinin matematiksel temellerini kurar. a) I
5.
e) I, II
b) II
c) III
d) II, III, IV
e) IV
I Bilimsel araştırma, amaca uygun bilgiyi toplamak için tasarlanır. II İstatistik bilim dalı bir tümdengelim bilimidir. Bu nedenle mantıklı kararlar alma ve genelleme yapma olanağı verir. III Araştırma sorunu yeterince açık olmadıkça araştırma tasarımının aşamaları belirlenemez. IV Varsayımın; gözlenebilir, sınanabilir olaylara ilişkin olmasına gerek yoktur. b) II
c) II, IV
d) II, III, IV
e) Hiçbiri
I
Bir araştırmada, ne arandığını ve ne tür bilgiler sağlanacağını bilmek için bir varsayıma gerek vardır. II Neden değişkene bağlı olarak değiştiği düşünülen olaya bağımsız değişken denir. III Oransal ölçüm düzeyindeki bir değişkende sayılar arasındaki uzaklığın eşit olması gerekmez. IV Oransal bir ölçüm düzeyi gerçek bir sıfır noktasına sahip olmalıdır. a) I
8.
d) II, III, IV
İstatistik yeterli derecede bilinen bütünler hakkında olası bilgi sağlama yoludur. II Biyoistatistik bilimi tipik olayları inceler ve bunlara ait genel bağıntılar elde etmeye çalışır. III İstatistik bilimi tipik olayları inceler. IV Bir araştırma, ya bir durum saptama ya da bir ilişkiyi arama amacıyla yapılır.
a) I
7.
c) II, IV
I
a) I
6.
b) II
b) II
c) II, IV
d) II, III, IV
I
e) I, IV
Sıralayıcı ölçüm düzeyinde birimler arasındaki uzaklık birbirine eşittir. II Sıralamalı ölçüm düzeyinde sadece aralık özelliği vardır. 252
III Oransal ölçüm düzeyi sayı sisteminin tüm özelliklerini taşır. IV Nitel değişkenler sınıflayıcı ve sıralayıcı ölçüm düzeylerinde incelenirler. a) I
9.
I II III IV
b) II
c) III, IV
d) II, III, IV
e) I, IV
Sayı sistemi özelliklerini taşımalarına göre ölçüm düzeyleri 3 tanedir. Sıralamalı ölçüm düzeyinde sadece aralık özelliği vardır. Nitel değişkenler aralıklı ve oransal ölçüm düzeyinde incelenirler. Bir değişkenin sıralayıcı ölçüm düzeyinde incelenebilmesi için, sayı sisteminin sıra ve aralık özelliklerini taşıması gerekir. a) I
b) II
c) II, IV
d) II, III, IV
e) Hiçbiri
10. I
Verilerin gruplandırılmasında sınıf sayısı araştırmanın konusuna bağlı olarak değişir. II Verilerin (gözlem değerlerinin) gruplandırılmasında sınıf sayısının 13 olması şarttır. III % 95 birikimli yüzde sıklık değerine karşılık gelen gözlem değeri en küçük değerdir. IV Sınıflayıcı ölçüm düzeyinde incelenen değişkenler için grafik türü olarak histogram kullanılır. a) I
11. I II III IV
b) II
c) II, IV
d) I, II
e) I, IV
Grafikler, tabloları herkesin anlayabileceği hale getirir. Sürekli değişkenler tanım aralığında her değeri alabilirler. Parametreler, istatistiklerin tahmin değerleridir. X değişkenine ait tüm verileri özetleyen değerlere tipik değerler denir. a) I
b) II
c) II, IV
d) I, II, IV
12. I
e) I, IV
X serisinin aritmetik ortalaması 4 iken Y= 2X+5 serisinin aritmetik ortalaması 13 olur. II Varyans, gözlem değerlerinin aritmetik ortalamadan sapmalarının karelerinin aritmetik ortalamasıdır. III İncelenen bir seride değişkenlik düzeyi yüksek ise seriyi temsil etmek için varyans kullanılır. 253
IV Örnekleme ait toplanma ve dağılma ölçülerine istatistik adı verilir. a) I
b) II
c) II, IV
d) I, II, IV
e) IV
13. I Varyans, standart sapmanın pozitif kareköküdür. II Ortanca, serideki değerlerin tümüne bağlı değildir. III Sayısal verinin istatistik olabilmesi için gözlem sonucu elde edilmesi yeterlidir. IV X değişkeninin aritmetik ortalaması 5'e eşit ise, Y = X + 5 değişkeninin aritmetik ortalaması 6'ya eşit olur. a) I
14. I II III IV
b) II
c) II, IV
d) II, III
e) I, IV
Bütün X değerleri negatif ise varyans değeri negatif olur. Bir değişkene ait verileri özetleyen değerlere tipik değerler adı verilir. Standart sapma toplanma ölçüsü olarak kullanılır. Aritmetik ortalama, daima, gözlem değerlerinin orta noktasını gösterir. a) I
b) II
c) II, IV
d) II, III, IV
e) I, IV
15. I Gözlem değerlerinden en sık tekrarlanan değer mod değeridir. II Ortalamaların en duyarlısı mod, en duyarsızı aritmetik ortalamadır. III Eğer seri terimleri geometrik olarak artıyor yada azalıyorsa ortanca yerine aritmetik ortalama hesaplanır. IV Seri terimlerinin aritmetik ortalamadan ayrılışlarının karelerinin aritmetik ortalamasına varyans denir. a) I
b) II
c) II, IV
d) II, III, IV
16. I
e) I, IV
Değişim katsayısı, ortalamanın standart sapma içindeki yüzde büyüklüğüdür. II Anayığında hesaplanan toplanma ölçülerine istatistik adı verilir. III Gözlemlerin aritmetik ortalamadan olan farklarının toplamı minimumdur. IV Medyan sıralı bir serideki terimlerin ortasında yer alan değerdir. a) I
b) II
c) II, IV
d) IV
e) I, IV 254
17. I Seride en sık tekrarlanan değere tepe değer adı verilir. II Sıralamalı ölçüm düzeyinde incelenen bir değişken için aritmetik ortalama hesaplanır. III Medyan(Ortanca) serideki uç değerlerden etkilenmez. IV X serisinin varyansı 4 iken Y= 2X+ 5 serisinin varyansı 16 olur. a) I
18. I II III IV
d) I, III, IV
e) I, IV
b) II
c) II, IV
d) II, III, IV
e) I, IV
Bir istatistik seride mod bir değişkenlik ölçüsüdür. Geometrik ortalama bir dağılım ölçüsüdür. Parametreler, istatistiklerin tahmin değerleridir. Ortalama mutlak sapma bir toplanma ölçüsüdür. a) I
20. I II III IV
c) II, IV
Seride en sık tekrarlanan değere medyan adı verilir. Gözlemlerin aritmetik ortalamadan olan farklarının toplamı sıfırdır. Tepe değer sıralı bir serideki terimlerin ortasında yer alan değerdir. Anayığında hesaplanan toplanma ölçülerine parametre adı verilir. a) I
19. I II III IV
b) II
b) II
c) II, IV
d) II, III, IV
e) Hiçbiri
Olasılık değeri -1 ile +1 arasında değişir. A ve B bağımsız iki olay ise P(A ve B) = P(A) + P(B) A ve B Bağdaşmayan iki olay ise P(A veya B)= P(A) x P(B) A ve B bağımlı olaylar ise P(A ve B)=P(A) x P(B|A) a) I
b) II
c) II, IV
d) II, III, IV
e) IV
21. I
Bir denemede "başarı" olayının gerçekleşmesi olasılığı p=0.01 ve birbirinden bağımsız deneme sayısı (n) 200'e eşit ise P(X < 2) olasılığı Binom dağılımı kullanılarak hesaplanır. II Bir denemede "başarı" olayının gerçekleşmesi olasılığı p=0.50 ve birbirinden bağımsız deneme sayısı 5'e eşit ise P(X < 2) olasılığı Binom dağılımı kullanılarak hesaplanır. III Eğer iki olay bağımsız ise, bu iki olay kesinlikle bağdaşmazdır. IV Eğer iki olay bağımlı ise, A ve B olaylarının birlikte gerçekleşmesi olasılığı P(A ve B) = P(A) x P(B) ifadesi ile hesaplanır. a) I
b) II
c) II, IV
d) II, III, IV
255
e) I, IV
22. I Biyolojik değişkenler genellikle normal dağılıma sahiptir. II Binom dağılımında ortalama (n x p)’ye, varyans (n x p x q)’ya eşittir. III Poisson bölünmesinde ortalama değer varyans değerine eşittir. IV Bir toplumda boy değişkeninin ( X ) ortalaması 175 ve varyansı 100'e eşit olan normal dağılıma sahip olduğunu varsayalım. Bu toplumda P(X < 175) = 0.45 'tir. a) I, II, III
b) II
c) II, IV
d) II, III, IV
e) I, IV
23. I
Bir toplumda boy değişkeninin ( X ) ortalaması 175 ve varyansı 100'e eşit olan normal dağılıma sahip olduğunu varsayalım. Bu toplumda P(X < 185) = 0.8413’tir. II Bir toplumda boy değişkeninin ( X ) ortalaması 175 ve varyansı 100'e eşit olan normal dağılıma sahip olduğunu varsayalım. Bu toplumda P (X > 195) = 0.1587’dir. III Birleşik olaylarda başarı olasılığı -1≤p≤+1 arasında değişir. IV Bir toplumda boy değişkeninin ( X ) ortalaması 175 ve varyansı 100’e eşit olan normal dağılıma sahip olduğunu varsayalım. Bu toplumda P(X > 185) = 0.8413’tir. a) I
24. I II III IV
c) II, IV
d) II, III, IV
e) I, IV
Özel çarpma kuralı bağdaşmayan olaylar için geçerlidir. A ve B bağdaşmayan iki olay ise P(A ve B) = P(A).PA(B) A ve B bağımsız iki olay ise P(A ve B)=P(A). P(B) A ve B bağdaşan iki olay ise P(A veya B)= P(A)+P(B)-P(A ve B) a) I
25. I II III IV
b) II
b) II
c) III, IV
d) II, III, IV
e) I, IV
A ve B bağdaşan iki olay ise P(A veya B)=P(A)+P(B)-P(A ve B) A ve B bağımsız iki olay ise P(A ve B) = P(A) + P(B) A ve B bağdaşmayan iki olay ise P(A veya B)= P(A) x P(B) A ve B bağımlı olaylar ise P(A ve B)=P(A) x P(B\A) a) I
b) II
c) II, III
d) II, III, IV
e) I, IV
26. I Olasılık değeri 0 ile +1 arasında değerler alır. II Olasılık değerleri -1 ile 0 arasında değerler alır. 256
III A ve B ayrık iki olay ise P(A veya B)=P(A)+P(B) IV A ve B ayrık iki olay ise P(A veya B)=P(A)xP(B) a) I, III
b) II
c) II, IV
d) II, III, IV
e) I, IV
27. “Rastlantısal olarak seçilen deneklerde incelenen değişkene …………… değişken adı verilir” ifadesinde boş bırakılan yere uygun seçenek aşağıdakilerden hangisidir? a) Bağımlı
b) Bağımsız
c) Rastlantısal
d) Nitel
e) Nicel
28. Aşağıdaki değişkenlerden hangisi sınıflayıcı ölçüm düzeyinde incelenir? a) b) c) d) e)
Kan Grubu Bebek ölüm hızı Günlük sigara içme adedi Kolesterol değeri Yaş
29. Aralıklı ve sıralayıcı ölçüm düzeyinde ortak olan sayı sisteminin özellik/özellikleri nelerdir? a) Sıra ve aralık
b) Sıra ve oran
c) Sınıf ve sıra
d) Sıra
e) Sınıf
30. Nitel değişkenler hangi ölçüm düzeylerinde incelenirler? a) b) c) d) e)
Sınıflayıcı – Oransal Sıralayıcı – Sınıflayıcı Aralıklı – Oransal Sıralayıcı – Aralıklı Sınıflayıcı - Aralıklı
31. Aşağıdaki değişkenlerden hangisi oransal ölçüm düzeyinde incelenir? a) Kan Grubu b) Bebek ölüm hızı c) Sigara içme durumu (içmiyor/az/çok) 257
d) Hastanın eğitim düzeyi(ilk/orta/lise/yüksekokul) e) Saç rengi
32. Aşağıdaki değişkenlerden hangisi sınıflayıcı ölçüm düzeyinde incelenmez? a) b) c) d) e)
Göz rengi Sistolik kan basıncı Cinsiyet Kan Grubu Tümör yerleşim yeri
33. Oransal ve aralıklı ölçüm düzeyinde ortak olan sayı sisteminin özellikleri nelerdir? a) b) c) d) e)
Sıra ve aralık Sıra ve oran Sınıf, sıra ve aralık Sıra, aralık ve oran Sınıf ve oran
34. Aşağıdaki değişkenlerden hangisi oransal ölçüm düzeyinde incelenir? a) b) c) d) e)
Göz rengi Diastolik kan basıncı Cinsiyet Hastalık tanısı Tümör yerleşim yeri
35. Aşağıdakilerden hangisi/hangileri grafik sunumunun yararlarındandır? I. Tabloların kolay anlaşılmasını sağlamak II. Olayları karşılaştırmak III. Ara değer bulmak IV. Konu üzerindeki ilgiyi artırmak a) I
b) III
c) II ve III
d) II ve IV
258
e) I, II, III ve IV
36. Aşağıdaki grafik türlerinden hangisi/hangileri sınıflayıcı ölçüm düzeyinde incelenen bir değişken için çizilir? I. Çubuk grafik II. Çizgi grafik III. Daire dilimleri grafiği IV. Histogram a) II ve III
b) IV
c) I ve III
d) II, III ve IV
e) II ve IV
37. Aşağıdaki değişkenlerden hangisi/hangileri için sütun grafik türü kullanılabilir? I. Cinsiyet II. Kan grubu III. Yaş IV. Doğum şekli a) I
b) III
c) II ve III
d) I, II ve IV
e) I, II, III ve IV
38. Oransal ölçüm düzeyinde incelenen sürekli bir değişken için hangi grafik türünün (türlerinin) kullanılması uygun olur? I. Çubuk grafik II. Çizgi grafik III. Histogram IV. Daire dilimleri grafiği a) I
b) IV
c) II ve III
d) II, III ve IV
e) I ve IV
39. Oransal ve Aralıklı ölçüm düzeyinde incelenen değişkenler için aşağıdaki grafik türlerinden hangisi/hangilerinin kullanımı daha uygundur? I. Histogram II. Daire dilimleri grafiği III. Çizgi grafik IV. Çubuk grafik a) I
b) III
c) II ve IV
d) III ve IV
259
e) I ve III
40. Aşağıdaki değişkenlerden hangisi/hangileri için çizgi grafik türü kullanılmaz? I. Son canlı doğumun yapıldığı yer II. Yaşlara göre 5 yaş altı çocuklarda boy uzunluğu III. Gebelik sayısına göre hemoglobin değeri IV. İlköğretim okullarındaki cinsiyet dağılımı a) II ve III
b) II
c) I ve IV
d) II, III ve IV
e) II ve IV
41. Aşağıdaki değişkenlerden hangisi/hangileri için Daire dilimleri grafik türü kullanılabilir? I. Cinsiyet II. Kan grubu III. Yaş IV. Doğum şekli a) I
b) III
c) II ve III
d) I, II ve IV
e) I, II, III ve IV
42. Sınıflayıcı ölçüm düzeyinde incelenen kesikli bir değişken için hangi grafik türünün (türlerinin) kullanılması uygun olur? I. Çubuk grafik II. Çizgi grafik III. Histogram IV. Daire dilimleri grafiği a) I
b) IV
c) II ve III
d) II, III ve IV
e) I ve IV
43. Aşağıdakilerden hangisi/hangileri grafik sunumunun yararlarından değildir? I. Tabloların kolay anlaşılmasını sağlamak II. Olayları karşılaştırmak III. Ara değer bulmak IV. Konu üzerindeki ilgiyi artırmak a) I
b) III
c) II ve III
d) II ve IV 260
e) Hiçbiri
44. Histogram grafik türü aşağıdaki değişkenlerden hangisi için kullanılabilir? a) Eğitim düzeyi
b) Kan Grubu
c) Yaş
d) Doğum şekli
e) Cinsiyet
45. Aşağıdaki değişkenlerden hangisi/hangileri için çizgi grafik türü kullanılır? I. Son canlı doğumun yapıldığı yer II. Yaşlara göre boy uzunluğu III. Gebelik sayısına göre hemoglobin değeri IV. İlköğretim okullarındaki cinsiyet dağılımı a) II ve III
b) II
c) I ve IV
d) II, III ve IV
e) II ve IV
46. Aşağıda verilen sınıflanmış seride salt sıklık sütununa ait değerler hangileridir? Sınıflar (den az) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 a) b) c) d) e)
Çetele III IIIII IIIII III IIIII I IIII
3, 4, 7, 6, 4 3, 8, 16, 22, 26 11.5, 19.2, 30.8, 23.1, 15.4 11.5, 30.8, 61.5, 84.6, 100.0 3, 5, 8, 6, 4
47. Yukarıda verilen seride (soru 46) birikimli sıklık sütununa ait değerler hangileridir? a) b) c) d) e)
3, 8, 16, 22, 26 3, 4, 7, 6, 4 11.5, 19.2, 30.8, 23.1, 15.4 11.5, 30.8, 61.5, 84.6, 100.0 3, 5, 8, 6, 4
48. X serisinin aritmetik ortalaması 12, standart sapması 6’dır. Buna göre, Y = 2X - 2 serisinin aritmetik ortalaması kaça eşittir? a) 20
b) 22
c) 12
d) 6
e) 16 261
1 49. X serisinin aritmetik ortalaması 12, standart sapması 6’dır. Buna göre y= x +2 2 serisinin standart sapması kaça eşittir? a) 9
b) 3
c) 6
d) 36
e) 5
50. “Hesaplanan toplanma ve dağılma ölçüleri anayığına ait ise …………………, anayığından rastgele seçilmiş bir örnekleme ait ise …………… adını alır” ifadesinde boş bırakılan yerlere sırası ile uygun seçenek aşağıdakilerden hangisidir? a) b) c) d) e)
bağımlı değişken; bağımsız değişken toplum; örneklem istatistik; parametre parametre; istatistik bağımsız değişken; bağımlı değişken
Sınıflar (den az)
fi
80-88 88-96 96-104 104-112 112-120 120-128 128-136
6 11 18 24 15 9 4
Yukarıda verilen sınıflanmış seri için aşağıdaki 51 - 56 numaralı soruları yanıtlayınız. 51. Verilen serinin aritmetik ortalaması kaça eşittir? a) 106.80
b) 87
c) 107.20
d) 105.83
e) 132
52. Serinin yayılma genişliği kaça eşittir? a) 132
b) 48
c) 4.58
d) 106.83
e) 107.20
53. Serinin modu kaça eşittir? a) 106.83
b) 87
c) 108
d) 107.20 262
e) 11.45
54. Serinin medyanı kaça eşittir? a) 87
b) 107.20
c) 106.83
d) 12.23
e) 11.45
55. Serinin standart sapması kaça eşittir? a) 11.45
b) 458
c) 149.57
d) 106.83
e) 12.23
56. Serinin değişim katsayısı kaça eşittir? a) 12.23
b) 48
c) 87
d) 11.45
e) 106.83
57. Aşağıdakilerden hangisi ya da hangileri toplanma ölçüsüdür? I. Aritmetik Ortalama II. Medyan III. Varyans IV. Tepe Değer V. Değişim Katsayısı a) I , II ve IV
b) III ve V
c) II, IV ve V
d) III
58. Xi: 4, 5, 9, 7, 3 serisinde aritmetik ortalama kaça eşittir? a) 5.6
b) 21.2
c) 21
d) 25.4
e) 12.07
59. Xi: 4, 5, 9, 7, 3 serisinde standart sapma kaça eşittir? a) 5.6
b) 2.41
c) 2.1
d) 25.4
e) 12.07
60. Xi: 4, 5, 9, 7, 3 serisinde değişim katsayısı kaça eşittir? a) %40
b) %43
c) %46
d) %55
e) %15
61. Xi: 4, 5, 9, 7, 3 serisinde ortanca kaça eşittir? a) 5
b) 3
c) 9
d) 7
e) 4 263
e) II, III ve IV
62. Xi: 4, 5, 9, 7, 3 serisinde değişim aralığı kaça eşittir? a) 6
b) 2
c) 4
d) 3
e) 9
63. Xi: 4, 5, 9, 7, 3 serisinde varyans kaça eşittir? a) 5.8
b) 6.2
c) 2.1
d) 2.4
e) Hiçbiri
64. Xi: 4, 5, 9, 9, 7, 3 serisinde ortanca kaça eşit olur? a) med.=6
b) med.=7
c) med.=5
d) med.=9
e) med.=3
65. Xi: 4, 5, 9, 9, 7, 3 serisinde tepe değer kaça eşit olur? a) mod.= 3
b) mod.= 4
c) mod.= 9
d) mod.= 5
e) mod.= 7
66. Xi: 4, 5, 9, 9, 7, 3 serisinde aritmetik ortalama kaça eşit olur? a) 6.80
b) 7.65
c) 6.17
d) 6
e) 8
67. Xi: 4, 5, 9, 9, 7, 3 serisinde standart sapma kaça eşit olur? a) 4.80
b) 8
c) 2.56
d) 6
e); Hiçbiri
68. Xi: 4, 5, 9, 9, 7, 3 serisinde değişim katsayısı kaça eşit olur? a) %34
b) %42
c) %46
d) %51
e) Hiçbiri
69. Aşağıdakilerden hangisi ya da hangileri değişkenlik ölçüsüdür? I. Aritmetik Ortalama II. Medyan III. Varyans IV. Tepe Değer V. Değişim Katsayısı
264
a) I, II, ve IV
b) III ve IV
c) II, IV ve V
d) III ve V
e) II, III ve IV
70. X serisinin ortalaması 56, standart sapması 12 iken; Y=0.5X-3 serisinin ortalaması ve varyansı kaça eşit olur? a) b) c) d) e)
71. X serisinin ortalaması 28, standart sapması 6 iken; Y=0.5X-3 serisinin ortalaması ve standart sapması kaça eşit olur? a) b) c) d) e)
Bir çalışmada açlık kan şekeri değişkeni ölçülmüştür. Açlık kan şekeri değişkenine ait sıklık tablosu sınıflanmış seri şeklinde düzenlenmiştir 72 – 81 no.lu soruları aşağıda verilen sıklık tablosunu kullanarak cevaplayınız. Sınıflar (den az) mg/dl
fi
80-86 86-92 92-98 98-104 104-110 110-116 116-122
6 11 17 24 20 11 5
72. Açlık kan şekeri değerlerinin aritmetik ortalaması aşağıdakilerden hangisidir? a) 94
b) 101.25
c) 101
d) 102.23 265
e) 102.64
73. Açlık kan şekeri değerlerinin standart sapması aşağıdakilerden hangisidir? a) 9.31
b) 8.09
c) 36
d) 65.49
e) 86.71
74. Açlık kan şekeri değerlerinin medyan (ortanca) değeri aşağıdakilerden hangisidir? a) 101.82
b) 101
c) 102.64
d) 101.25
e) 104.14
75. Açlık kan şekeri değerlerinin modu (tepe değeri) aşağıdakilerden hangisidir? a) 101.82
b) 102.64
c) 104.14
d) 102.23
e) 101.25
76. Bu serideki bireylerin yüzde kaçının açlık kan şekeri değeri 98-104 mg/dl arasında değişir? a) 24
b) 25.53
c) 25
d) 51.55
e) 25.77
77. Açlık kan şekeri değeri 110 mg/dl nin altında olan kaç kişi vardır? a) 20
b) 78
c) 36
d) 29
e) 79
78. Çalışmadaki bireylerin yüzde kaçının açlık kan şekeri değeri 98mg/dl nin üzerindedir? a) 74.23
b) 51.55
c) 61.70
d) 63.83
e) 25.53
79. Açlık kan şekeri değişkeninin dağılım aralığı kaça eşittir? a) 9.22
b) 7.92
c) 36
d) 37
e) 5
80. Açlık kan şekeri değişkeninin değişim katsayısı kaça eşittir? a) 9.22
b) 7.92
c) 9.31
d) 8.09 266
e) 36
81. Açlık kan şekeri değişkeni için çeyrekler arası yarı genişlik değeri kaça eşittir? a) 5.49
b) 6.73
c) 13.46
d) 10.99
e) 94.29
82. Bir laboratuarda yapılan 40 tahlilden 38’i doğru sonuç vermektedir(kusursuzdur). Bu laboratuarda tahlil yaptıran 3 kişiden 3’ünün de doğru sonuç alması olasılığı kaça eşittir? a) 0.86
b) 0.01
c) 0.14
d) 0.95
e) 0.05
83. Bir hastanede doğan bebeklerin doğum ağırlıkları ortalaması 3050± 230 gr olarak hesaplanmıştır. Yılda 780 bebeğin doğduğu bu hastanede bebeklerin doğum ağırlıklarının 2500 gramın altında olması olasılığı kaça eşittir? a) 0.492
b) 0.50
c) 0.001
d) 0.008
e) 0.498
84. Bir kliniğin acil servisine haftada ortalama 4 gıda zehirlenmesi vakası gelmektedir. Buna göre bu kliniğe bir haftada 2 gıda zehirlenmesi vakası gelmesi olasılığı kaça eşittir? a) 0.436
b) 0.090
c) 0.147
d) 0.493
e) 0.856
85. Tedavide başarı şansı 0.70 olan bir hastalığa yakalanan 5 kişiden en az 3’ünün hastalıktan kurtulma olasılığı kaça eşittir? a) 0.31
b) 0.53
c) 0.69
d) 0.42
e) 0.84
86. Toplumda erkeklerde X hastalığı görülme sıklığı 0.003’tür. 2000 erkek için ölçüm yapıldığında en az 2 erkekte X hastalığı görülme olasılığı kaça eşit olur? a) 0.014
b) 0.036
c) 0.964
d) 0.877
267
e) 0.983
87 – 90 numaralı soruları yukarıda verilen grafiği dikkate alarak yanıtlayınız. 87. Sistolik kan basıncı (SKB) değerlerinin normal dağılım gösterdiği ön kabulü ile çalışmanın yapıldığı toplumdan rastlantısal olarak seçilen bir bireyin SKB’nın 90mmHg’nın altında çıkması olasılığı kaça eşit olur? a) 0.4987
b) 0.0013
c) 0.5013
d) 0.9987
e) 0.0120
88. 1000 kişilik bir toplumda kaç kişinin SKB 140mmHg’nın üzerinde olur? a) 477
b) 977
c) 23
d) 523
e) 48
89. Seçilen bir bireyin SKB’nın 90mmHg ile 150mmHg arasında olması olasılığı kaça eşit olur? a) 0.0013
b) 0.4987
c) 0.5013
d) 0.0026
e) 0.9973
90. SKB en yüksek olan bireylerin % 5’ine ilaç tedavisi uygulanacaktır. İlaç verilmesi için bireyin SKB’nın kaç olması gerekir? a) 121.3
b) 103.5
c) 165.5
d) 136.5
e) 145
91. Bir hastanenin acil yoğun bakım servisine(AYBS) günde ortalama 3 hasta yatırılmaktadır. Herhangi bir günde AYBS’ne 5 hasta yatırılması olasılığı kaça eşittir? a) 0.1008
b) 0.1404
c) 0.8992
d) 0.8596 268
e) 0.2240
92. A hastalığına yakalanma olasılığı 0.004 olarak bilinmektedir. 1000 kişinin yaşadığı bir kasabada en çok 2 kişinin bu hastalığa yakalanması olasılığı kaça eşit olur? a) 0.8536
b) 0.7621
c) 0.0902
d) 0.1464
e) 0.2379
93. Belli bir kanser türünde bir hastanın tedaviden sonra 5 yıl yaşama olasılığı 0.70 ise, söz konusu kanser türüne yakalanan 7 hastanın 5’nin tedaviden sonra 5 yıl yaşama olasılığı kaça eşittir? a) 0.6354
b) 0.0250
c) 0.3177
d) 0.1277
e) 0.6823
94. Belli bir grip türüne karşı uygulanan aşının yan etki gösterme olasılığı %10’dur. Aşı uygulanan 5 bireyden en az 1 tanesinde yan etki görülmesi olasılığı kaça eşit olur? a) 0.5905
b) 0.4095
c) 0.2952
d) 0.7048
e) 0.0591
Cinsiyet
Sigara İçen (S +)
Sigara İçmeyen (S - )
Toplam
Kadın Erkek Toplam
200 750 950
800 250 1050
1000 1000 2000
Yukarıdaki tabloyu kullanarak 95 – 97 numaralı soruları hesaplayınız. 95. Bu gruptan seçilen bir bireyin kadın veya sigara içmeyen bir birey olma olasılığı kaça eşittir? a) 0.5
b) 0.475
c) 0.1
d) 0.875
e) 0.625
96. Bu gruptan seçilen bir bireyin erkek ve sigara içen bir birey olma olasılığı kaça eşittir? a) 0.475
b) 0.625
c) 0.6
d) 0.375
269
e) 0.9
97. Bu gruptan seçilen bir bireyin erkek veya kadın olma olasılığı kaça eşittir? a) 0
b) 1
c) 0.5
d) 0.475
e) 0.525
98. Bir hastanenin acil ameliyathanesinde hafta sonlarında ortalama 4 hasta ameliyat edilmektedir. Her hangi bir hafta sonunda en az 3 hastanın ameliyat edilmesi olasılığı kaça eşit olur (poisson dağılımı)? a) 0.19
b) 0.90
c) 0.09
d) 0.76
e) Hiçbiri
99. Bir hastanenin acil ameliyathanesinde hafta sonlarında ortalama 1 hasta ameliyat edilmektedir. Her hangi bir hafta sonunda sadece 1 hastanın ameliyat edilmesi olasılığı kaça eşit olur (poisson dağılımı)? a) 0.00
b) 0.50
c) 0.19
d) 0.37
e) Hiçbiri
100. Nadir rastlanan bir metabolizma hastalığının görülme sıklığı 0.0001 olarak bilinmektedir. 20 000 kişinin yaşadığı bir bölgede 3 kişinin bu hastalığa yakalanması olasılığı kaça eşittir? a) 0.0498
b) 0.1353
c) 0.8196
d) 0.1804
270
e) 0.2241
Ek 2.1 Yanıtlar: 1d 2c 3b 4e 5e 6a 7e 8c 9e 10 a 11 d 12 d 13 d 14 b 15 e 16 d 17 d 18 c 19 e 20 e 21 b 22 a 23 a 24 c 25 e
26 a 27 c 28 a 29 d 30 b 31 b 32 b 33 a 34 b 35 e 36 c 37 d 38 c 39 e 40 c 41 d 42 e 43 e 44 c 45 a 46 e 47 a 48 b 49 b 50 d
51 a 52 b 53 d 54 c 55 e 56 d 57 a 58 a 59 b 60 b 61 a 62 a 63 a 64 a 65 c 66 c 67 c 68 b 69 d 70 a 71 c 72 c 73 a 74 d 75a
271
76 b 77 b 78 d 79 c 80 a 81 b 82 a 83 d 84 c 85 e 86 e 87 b 88 c 89 e 90 d 91 a 92 e 93 c 94 b 95 e 96 d 97 b 98 d 99 d 100 d
Ek 2 Kendimizi Sınayalım
Ek 2.2. Bölüm 5-16’ya ilişkin sorular. Sorular : Soru 1-25 için verilen ifadelerden hangisi/hangileri doğrudur? 1.
I
Standart hata hangi büyüklükte olursa olsun, örneklem istenilen büyüklükte olabilir. II Örneklem, anayığını temsil gücüne sahip olmalıdır. III Olasılıklı örnekleme yönteminde eşit şans ilkesi geçerlidir. IV Küme örnekleme yöntemi orantılı ve orantısız olmak üzere iki şekilde yapılır. a) I
2.
d) II, III, IV
e) I, IV
b) II
c) II, IV
d) II, III, IV
e) Hiçbiri
I Standart hatayı azaltmanın bir yolu denek sayısını arttırmaktır. II Örneklemden elde edilen standart sapmaların oluşturduğu dağılımın standart sapmasına standart hata adı verilir. III Kuramsal örnekleme dağılımının ortalaması örnek büyüdükçe anayığının ortalamasına yaklaşır. IV Gruplar, gerekli sayıda birim içermedikçe yeterli olma özelliğini taşıyamaz. a) I
4.
c) II, III
I Örnekleme anayığındaki tüm birimlerin sayılması işlemidir. II Yargısal örnekleme kullanılarak yapılan araştırmaların bilimsel geçerliliği daha fazladır. III Standart hata kuramsal örnekleme dağılımının ortalamasına eşittir. IV Olasılıklı örnekleme yöntemlerinin tümüne araştırma tasarımı denir. a) I
3.
b) II
b) I, III
c) II, IV
d) III, IV
e) I, II, IV
I Standart hata, kuramsal örnekleme dağılımının standart sapmasıdır. II Örneklem uzunluğunu arttırdığımızda, anayığın parametrelerini daha geniş bir aralıkta tahmin edebiliriz. 273
III Güven düzeyi arttırıldıkça (yanılma düzeyi düşürüldükçe) güven aralığının genişliği daralır. IV μ = 10 değerine sahip bir anayığından çekilen örneklemde her gözlem değeri, μ = 6 değerine sahip bir anayığından çekilen örneklemdeki gözlem değerlerinin her birinden büyüktür. a) I
5.
I II III IV
d) II, III, IV
e) I, II
b) I, III, IV
c) II, IV
d) III, IV
e) I, IV
I
Hipotez testlerinin uygulanması sırasında ortaya çıkabilecek iki tip hata vardır. II İstatistiksel hipotezler, örneklemlerin çekildiği toplum parametreleri ile ilgili önermelerdir. III Hipotez testlerinin çözümlenmesinde ilk adım test istatistiğinin belirlenmesidir. IV Hipotez testlerinin amacı, araştırıcıya, toplum hakkında bir karara varma konusunda yardımcı olmaktır. a) I
7.
c) II, IV
Hipotez testlerinin bir diğer adı önemlilik testleridir. Hipotezin yönünü H0 hipotezi belirler. Sıfır hipotezi, bir testte öne sürülen ve test edilmek istenen hipotezdir. Örneklem uzunluğunu arttırdığımızda, anayığın parametrelerini daha dar bir aralıkta tahmin edebiliriz. a) I
6.
b) II
b) I, III
c) II, IV
d) III, IV
e) I, II, IV
I
H1 hipotezi gerçekte doğru iken bu hipotezin kabul edilmesi testin gücü (1- β) olarak adlandırılır. II H0 hipotezi gerçekte doğru iken bu hipotezin reddedilmesi I. Tip hata (α) olarak adlandırılır. III H0 hipotezi gerçekte yanlış iken bu hipotezin reddedilmesi II. Tip hata (β) olarak adlandırılır. IV Hesapla bulunan test istatistiği değeri, teorik tablo değerinden küçük ise H1 hipotezi kabul edilir. a) I
b) I, II
c) II, IV
d) III, IV
274
e) I, II, IV
8.
I
H1 hipotezi gerçekte doğru iken bu hipotezin kabul edilmesi testin gücü (1- β) olarak adlandırılır. II Eğer H1 hipotezi 0.05 anlam düzeyinde rededildiyse, 0.01 anlam düzeyinde de reddedilir. III Araştırmalarda, istatistik test sonuçları sadece Ho'ın reddedilmesi durumunda belirtilir. IV Student't testinin kullanımında anayığındaki dağılım ile ilgili hiçbir varsayım göz önüne alınmaz. a) I
9.
b) II
c) II, IV
d) II, III, IV
e) I, II
I
İki yönlü bir test kullanıldığında, Ho hipotezi, test istatistiğinin pozitif yada negatif yöndeki uç değerleri için reddedilir. II Serbestlik derecesinin veya örneklem uzunluğunun büyük olduğu durumlarda Student't dağılımı normal dağılıma yaklaşır. III Eğer Ho tek yönlü bir test ile reddedildiyse, iki yönlü bir testte de aynı anlam düzeyi için reddedilir. IV 4 farklı grubun ortalamalarının karşılaştırılmasında Student't testi kullanılır. a) I
b) I, III
c) I, II
d) III, IV
e) I, IV
10. I
Parametrik testler, ölçüm düzeylerinin tümünde geçerli olarak kullanılabilir. II Eşlenmiş seriler yöntemi iki küçük ve bağımsız örneklemle hesaplanan oranları karşılaştırmak için kullanılır. III İki ayrı grubun ortalama değerlerinin karşılaştırılmasında “Eşlendirilmiş serilerde Student't” testi kullanılır. IV Ki-kare testleri sadece normal dağılma sahip veriler için kullanılır. a) I
b) II
c) II, IV
d) II, III, IV
e) Hiçbiri
11. I
2 x 2 tablosunda, Ki-kare testinin kullanılabilmesi için beklenen sıklıkların her birinin en az 5 'e eşit olması gerekir. II Yates'in düzeltmeli ki-kare, serbestlik derecesinin 2 'ye eşit olduğu durumlarda geçerlidir. III 5 farklı grubun ortalamalarının karşılaştırılmasında Ki-kare testi kullanılır. IV 3 x 9 çapraz tabloda serbestlik derecesinin değeri 27'ye eşittir. a) I
b) I, III
c) II, IV
d) III, IV 275
e) I, IV
12. I
s.d. = 2 ve kuramsal sıklıklardan biri 5'ten küçük olan çapraz tablolarda Yates'in ki-kare testi kullanılır. II X ve Y arasında negatif bir ilişki var ve en küçük kareler doğrusu (0,0) noktasından geçmektedir. Bu verilere göre, X = 1 gözlem değeri için Y'nin tahmin değeri negatiftir. III Korelasyon katsayısı -1 ve +1'den sıfıra doğru yaklaştıkça ilişkinin gücü azalır. IV Eğer bütün X değerleri negatif ve bütün Y değerleri pozitif ise r negatif olmak zorundadır. a) I
b) I, III
c) II, III
d) III, IV
e) I, IV
13. I Eğer r > 0 ise, X arttığında Y'de artar. II X ile Y arasındaki en küçük kareler doğrusu X'in (0, 27) aralığındaki değerleri için hesaplandıysa, bu doğru denklemini kullanarak X = 112 değeri için Y değerini tahmin edebiliriz. III Korelasyon katsayısı her değeri alabilir. IV Regresyon analizinde bağımsız değişken bir ya da daha çok değişken tarafından etkilenen değişkendir. a) I 14. I II III IV
b) II
c) II, IV
d) II, III, IV
e) I, II
Regresyon analizi sadece değişkenler arasındaki ilişkinin gücünü ölçer. Korelasyon katsayısı -1'den küçük +1'den büyük olamaz. Eğer r < 0 ise, X arttığında Y de artar. Belirleme katsayısı, bağımlı değişkendeki değişkenliğin bağımsız değişken tarafından açıklanan kısmını gösterir. a) I
b) I, III
c) II, IV
d) III, IV
e) I, IV
15. I
Bir tanı testinde duyarlılık, gerçekten sağlam olanların test sonucunda yüzde kaçının sağlam olduğunu gösterir. II Hastalığı taşımayanların yüzde kaçının önerilen yöntemle tanınabildiğini özgüllük değeri verir. III Bir bilimsel araştırma yalnızca nedensellik ilişkisi kurmayı amaçladığında bir plana dayanmak zorundadır. IV Çözümleyici araştırmalar, olaylar arasında neden-sonuç bağıntısı kurmak amacıyla planlanmaktadır. a) I
b) II
c) III, IV
d) II, IV
276
e) I, II
16. I
Deney ve denetim kümeleri arasındaki fark, deney kümesinin etkenin dışında bırakılmasıdır. II Tanımlayıcı araştırmalar olaylar arasında bir neden-sonuç ilişkisi kurmayı amaçlar. III Tanımlayıcı araştırmalar, bir anayığında ilgili özelliklerin ne sıklıkta gözlendiğini saptamak amacıyla planlanmaz. IV Bir araştırma tasarımında önce hangi konuda, kimler üzerinde çalışılacağına sonra ne tip bir araştırma yapılacağına karar verilir. a) I
b) I, III
c) II, IV
d) III, IV
e) IV
17. I
Bir araştırma tasarımında, araştırma tipinin saptanması önemli adımlardan biridir. II Deney ve denetim gruplarıyla çalışıldığında, kullanılan etkisiz maddeye placebo denir. III Vaka serilerinde hasta grubuna ait özelliklerin dağılımı incelenir. IV Vaka-kontrol araştırmaları prospektif araştırmalardır. a) I
b) II
c) II, IV
d) II, III, IV
e) I, II, III
18. I
Kohort araştırmalarında insidans belirlenemediğinden Relatif Risk (RR) değeri hesaplanamaz. II Odds Ratio (OR) değeri 1’den büyük çıkarsa etkenin hastalıktan koruyucu olduğu söylenir. III Vaka serileri, analitik çalışmalar için ön bilgi sağlarlar. IV Vaka- Kontrol araştırmaları deneysel araştırmalar içinde yer alırlar. a) I
b) I, III
c) II, IV
d) III
e) I, IV
19. I Paralel kontrollü klinik çalışmalarda gruplar randomize olmalıdır. II Kohort araştırmaları ileriye dönük izleme çalışmalarıdır. III Çapraz kontrollü klinik çalışmada, her denek hem deney hem de kontrol grubunda yer alır. IV Kesitsel araştırmalar, gözlemsel araştırma tipi içinde yer alırlar. a) I
b) I, III
c) II, IV
d) I, II, III, IV
277
e) I, IV
20. I II III IV
Vaka- Kontrol araştırmaları prospektif araştırmalar içinde yer alırlar. Gözlemsel araştırmalarda, araştırmacının müdahalesi yoktur. Kesitsel araştırmalar, prevalans araştırmaları olarak da adlandırılır. Analitik araştırmalarda neden-sonuç ilişkisi aranmaz. a) I
b) II
c) II, IV
d) II, III
e) I, II
21. I
Paralel kontrollü klinik çalışmalarda gruplar rastlantısal olarak oluşturulmalıdır. II Paralel kontrollü klinik araştırmalar daima üç kör çalışılmalıdır. III Çapraz kontrollü klinik çalışmada hasta sayısının daha yüksek tutulması gerekir. IV Kesitsel araştırmalarda prevalans hesaplanır. a) I
22. I II III IV
c) II, IV
d) III, IV
e) I, IV
Prospektif araştırmalarda izleme yapılır. Vaka serileri, betimleyici çalışmalar için ön bilgi sağlarlar. Vaka- Kontrol araştırmaları deneysel araştırmalar içinde yer alırlar. Dış kontrollü klinik çalışmalarda gruplar randomize olmalıdır. a) I
23. I II III IV
b) I, III
b) II
c) II, IV
d) II, III, IV
e) I, II
Vaka serilerinde randomizasyon yapılmaz. Kesitsel araştırmalar, insidans araştırmaları olarak da adlandırılır. Analitik araştırmalarda neden-sonuç ilişkisi aranmaz. Kesitsel araştırmalarda insidans hesaplanır. a) I
b) II
c) II, IV
d) II, III, IV
e) I, II
24. I Retrospektif araştırmalarda izleme yapılır. II Gözlemsel araştırmalarda, araştırmacının müdahalesi yoktur. III Çapraz kontrollü klinik çalışmada, her denek hem deney hem de kontrol grubunda yer alır. IV Paralel kontrollü klinik çalışmalarda gruplar rastlantısal olarak oluşturulmalıdır. a) I
b) I, III
c) II, IV
d) II, III, IV 278
e) I, IV
25. I
Retrospektif araştırmalarda incelenen veriler araştırmanın başlama tarihinden önceki dönemle ilgilidir. II Sağkalım analizinde deneklerin tamamı sonlanana kadar izlemeye devam edilir. III Sağkalım analizinin amaçlarından biri de hastalıkların doğal seyrinin incelenmesidir. IV Yaşam tablosu yönteminde her sonlanma anı için ölüm olasılığı hesaplanır. a) I
26.
b) I, III
29.
e) I, IV
b) 2985
c) 2991
d) 2999
e) 2994
6000 öğrencisi olan bir okulda yapılacak bir araştırma için 300 öğrenci sistematik örnekleme yöntemi kullanılarak örnekleme seçilecektir. Başlangıç değeri olarak 14 numaralı öğrenci alınır ise örnekleme alınacak son öğrencinin numarası kaç olur? a) 6000
28.
d) III, IV
3000 öğrencisi olan bir okulda yapılacak bir araştırma için 200 öğrenci sistematik örnekleme yöntemi kullanılarak örnekleme seçilecektir. Başlangıç değeri olarak 6 numaralı öğrenci alınır ise örnekleme alınacak son öğrencinin numarası kaç olur? a) 3000
27.
c) II, IV
b) 5968
c) 5949
d) 5986
e) 5994
Aritmetik ortalaması= 80, standart sapması 12 olan bir anayığından 36’şar birimlik örnekler çekilerek oluşturulan kuramsal örnekleme dağılımının aritmetik ortalaması ve standart hata kaça eşit olur? a)
b)
d)
e)
c)
Standart hatanın 5 olduğu bir kuramsal örnekleme dağılımında çekilen örneklerin büyüklükleri 36’şar birim ise, bu dağılıma ilişkin anayığının aritmetik ortalaması kaça eşit olur? a) 5.48
b) 30
c) 5
d) 36
e) Hiçbiri 279
30.
5000 birimlik bir anayığından 100’er birimlik örnekler çekilerek oluşturulan kuramsal örnekleme dağılımının standart sapması 1.188 ise anayığına ait varyans kaça eşit olur? a) 100
31.
d) 12
e) 1.41
(n) birim sayısı büyür (n) birim sayısı küçülür (n) birim sayısı değişmez (n) birim sayısı güvenlik düzeyinden bağımsızdır Hiçbiri
Bir bölgede hipertansiyonun başlangıç yaşını belirlemek amacıyla yapılan bir araştırmada 25’er kişilik gruplar halinde örneklemler oluşturuluyor. Elde edilen kuramsal örnekleme dağılımının standart sapması 4 olduğuna göre bu bölgedeki bireylerin yaşlarının standart sapması kaça eşit olur? a) 400
33.
c) 144
Örneklem büyüklüğü (n) saptanırken güvenlik düzeyi yüksek tutulduğunda aşağıdakilerden hangisi gerçekleşir? a) b) c) d) e)
32.
b) 50
b) 25
c) 20
d) 625
e) 4
Ortalaması μ= 120 mmHg, varyansı: σ 2 = 25 mmHg olan bir toplumdan 20’şer birimlik çekilerek oluşturulan kuramsal örnekleme dağılımının ortalaması ve standart hata kaça eşit olur? a)
= 125; SX = 1.12
b)
= 120; SX = 20
c)
= 20; SX = 1.12
d)
= 120; SX = 1.12
e)
= 125; SX = 1.2
280
34.
Aritmetik ortalaması= 100, standart sapması 20 olan bir anayığından 100’er birimlik örnekler çekilerek oluşturulan kuramsal örnekleme dağılımının aritmetik ortalaması ve standart hata kaça eşit olur? a) b) c) d) e)
35.
“ ……………………, örneklem istatistiklerine ait kuramsal örnekleme dağılımının değişkenlik ölçüsüdür” ifadesinde boş bırakılan yer için uygun seçeneği işaretleyiniz. a) Standart Hata d) Varyans
36.
b) Standart Sapma e) Güven Aralığı
c) Değişim katsayısı
“İki örneklem ortalaması karşılaştırıldığında, p anlamlılık düzeyi 0.05’ten küçük ise ……………… kabul edilir” ifadesinde boş bırakılan yer için uygun seçeneği işaretleyiniz. a) Yokluk hipotezi b) Farksızlık hipotezi d) Homojenlik hipotezi e) Alternatif hipotez
37.
Çocuklarda diabet sıklığının 0.30 olduğu tahmin ediliyor. Bu konuda yapılacak bir çalışma için örneklem büyüklüğünü 0.05 örnekleme hatası ile %95 güven düzeyinde hesaplayınız. a) 323
38.
c) Sıfır hipotezi
b) 165
c) 84
d) 461
e) 460
Hiperlipidemi hastalarında kolesterol değerinin varyansının 225 mg/dl olduğu kabul edildiğinde, 6 mg/dl lik örnekleme hatası ile %95 güven düzeyinde örnekleme en az kaç kişi alınması gerekir? a) 25
b) 250
c) 225
d) 38
e) 5403
281
39.
Çocuklarda alerjik astım sıklığının %11.4 olduğu kabul edilmektedir. Bu konuda yapılacak bir araştırmada %3 örnekleme hatası ile alerjik astım sıklığı belirlenmek istenmektedir. Bu amaçla %95 güven düzeyi için en az kaç kişi örnekleme alınmalıdır ? (1 - α = 0.95 ). a) 203
40.
e) 113
b) 336
c) 197
d) 657
e) 155
b) 55
c) 58
d) 61
e) 62
1200 kişinin yaşadığı bir kasabada, diabet hastaları üzerinde yapılacak bir araştırma için örneklem büyüklüğü belirlenmek istenmektedir. Bu amaçla açlık kan şekeri değerleri 4 birimlik bir sapma(kabul edilebilir örnekleme hatası) ile tahmin edilmek isteniyor. 20 mg/dl standart sapma ile gerekli örneklem büyüklüğünü %95 güven düzeyi için hesaplayınız (1 - α = 0.95 ). a) 89
43.
d) 412
800 kişinin yaşadığı bir kasabada, Hipertansiyon hastaları üzerinde yapılacak bir araştırma için örneklem büyüklüğü belirlenmek istenmektedir. Bu amaçla sistolik kan basıncı değerleri 3 birimlik bir sapma (kabul edilebilir örnekleme hatası) ile tahmin edilmek isteniyor. 12mmHg standart sapma ile gerekli örneklem büyüklüğünü %95 güven düzeyi için hesaplayınız (1 - α = 0.95). a) 54
42.
c) 2076
Van ili ve yöresinde, hipertansiyon prevelansı %19’dur. Bu bölgede hipertansiyon ile ilgili yapılacak bir araştırmada %3 hata ile hipertansiyon prevelansı belirlenmek istenmektedir. Bu amaçla %95 güven düzeyi için en az kaç kişi örnekleme alınmalıdır ? (1 - α = 0.95 ). a) 335
41.
b) 432
b) 88
c) 83
d) 82
e) 84
Kolesterol düzeyini saptamak amacıyla yapılacak bir araştırma için örneklem büyüklüğü hesaplanmak isteniyor. Standart sapmanın 50 mg/dL olduğu bilinmektedir. 15 birimlik örnekleme hatası ile %95 güven düzeyinde en az kaç kişi örnekleme alınmalıdır? (1 - α = 0.95 ). a) 640
b) 13
c) 43
d) 42
e) 426 282
44.
Ülkemizde Hepatit B virüsü(HBV) taşıyıcılığının %7 olduğu kabul edilmektedir. Bu konuda yapılacak bir araştırmada %3 örnekleme hatası ile HBV taşıyıcılığının sıklığı belirlenmek istenmektedir. Bu amaçla %95 güven düzeyi için en az kaç kişi örnekleme alınmalıdır ? (1 - α = 0.95 ). a) 142
45.
b) 278
b) 0.18 - 0.32 e) 0.21 - 0.29
c) 0.34 - 0.51
b) 64.32 – 65.68 e) 39.4 – 49.8
c) 43.92 – 45.28
484 sağlıklı bireylerde ölçülen albümin değeri ortalaması 48.6g/l, standart sapma ise 6.2’dir. Bu değerlere göre Albümin düzeyine ilişkin %95 güven aralığı sınırları aşağıdakilerden hangisidir? a) 42.40 – 54.80 d) 38.68 – 60.75
48.
e) 2778
65 yaş üstü 225 sağlıklı bireylerde ölçülen albümin değeri ortalaması 44.6g/l, standart sapma ise 5.2’dir. Bu değerlere göre Albümin düzeyine ilişkin %95 güven aralığı sınırları aşağıdakilerden hangisidir? a) 44.25 – 44.95 d) 44.55 – 44.64
47.
d) 897
Rehabilitasyon programı sonrasında, inme geçiren 160 hastanın 40’ında motor iyileşme olduğu görülmüştür. Buna göre inmeli olgularda motor iyileşmenin %95 güven düzeyindeki sınır değerleri (güven aralığı) aşağıdakilerden hangisidir? a) 0.14 - 0.76 d) 0.16 - 0.34
46.
c) 23
b) 48.57 – 48.63 e) 48.05 – 52.77
c) 48.05 – 49.15
Geçirdikleri cerrahi operasyon sonrasında yoğun bakım ünitesine alınan 100 hastada idrar yolu enfeksiyonu (İYE) gelişme sıklığı %34 olarak bulunmuştur. %5 yanılma düzeyinde İYE gelişme sıklığı için güven aralığı sınırları aşağıdakilerden hangisidir? a) 0.20 – 0.40 d) 0.21 – 0.47
b) 0.29 – 0.39 e) 0.25 - 0.43
283
c) 0.31 – 0.37
49
İntravasküler yoldan 20 cc’lik enjeksiyon uygulaması yapılan (A) ilacının analjezik etkisinin, böbreklerinde kalkül oluşumu olan 400 hastadaki üreter kanal akut ağrıları için ortalama 8 saat sürdüğü görülmüştür. Standart sapma ise 0.4 saattir. (A) ilacına ilişkin analjezik etkinin %95 güvenlik düzeyindeki ortalama sınır değerleri (güven aralığı) aşağıdakilerden hangisidir? a) 7.98 – 8.02 d) 5.05 – 6.05
50.
b) 0.23 – 0.33 e) 0.25 - 0.43
c) 0.19 – 0.33
Diyabet hastalarında “beslenmenin” açlık kan şekeri üzerine etkisini belirlemek amacı ile bir çalışma planlanmıştır. Bu amaç doğrultusunda 25 diabetik bireyin diyet öncesinde ve sonrasında açlık kan şekeri değerleri ölçülmüş olup, iki ölçüm arasındaki farkın ortalaması 10.4 ± 6.8 mg olarak bulunmuştur. Buna göre diabet hastalarında beslenmenin(diyetin) etkisinin olduğu söylenebilir mi? a) b) c) d) e)
52.
c) 7.92 – 8.08
Geçirdikleri cerrahi operasyon sonrasında yoğun bakım ünitesine alınan 140 hastada idrar yolu enfeksiyonu (İYE) gelişme sıklığı %26 olarak bulunmuştur. %5 yanılma düzeyinde İYE gelişme sıklığı için güven aralığı sınırları aşağıdakilerden hangisidir? a) 0.21 – 0.31 d) 0.21 – 0.47
51.
b) 7.96 – 8.04 e) 4.90 – 8.10
t=7.65, p>0.05 H0 kabul diyet etkin t=0.76, p<0.001 H0 kabul diyet etkin değil t=7.65, p<0.001 H1 kabul diyet etkin t=0.76, p<0.001 H1 kabul diyet etkin değil t=1.65, p>0.001 H1 kabul diyet etkin
Anemi hastalarının tedavisi için geliştirilen bir ilacın etkinliği araştırılıyor. 20 anemi hastasında tedavi öncesi hemoglobin değeri ortalaması 9 g/dl, standart sapması 1.4 g/dl olarak bulunmuştur. Tedavi sonrasında ise hemoglobin değeri ortalaması 13 g/dl, standart sapması 1.8 g/dl ‘dir. İlaç tedavisinin Anemi hastaları üzerinde etkili olup olmadığı araştırılmış ve yapılan hipotez testi sonucu t = 16.62 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur?
284
a) b) c) d) e)
53.
64 anemi hastasında tedavi öncesi ve sonrası hemoglobin değerleri farklarının ortalaması 4.7 g/dl, standart sapması 2.2 g/dl olarak bulunmuştur. Uygulanan tedavinin etkili olup olmadığını belirlemek amacı yapılan hipotez testi sonucu t = 17.09 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)
54.
p>0.05, H0 hipotezi kabul p<0.05, H0 hipotezi kabul p>0.05, H1 hipotezi kabul p<0.001, H1 hipotezi kabul p>0.01, H0 hipotezi kabul
Beslenme tipinin demir eksikliği üzerine etkisi incelenmek isteniyor. “A” tipi beslenen 25 bireyde hemoglobin değeri ortalaması 13 g/dl, standart sapması 4 g/dl; “B” tipi beslenen 20 bireyde ise hemoglobin değeri ortalaması 9 g/dl, standart sapması 2 g/dl ‘dir. Beslenme tipinin hemoglobin değeri üzerinde etkili olup olmadığı araştırılmış ve yapılan hipotez testi sonucu t = 4.08 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)
55.
p>0.05, H0 hipotezi kabul p<0.05, H0 hipotezi kabul p>0.05, H1 hipotezi kabul p>0.01, H0 hipotezi kabul p<0.05, H1 hipotezi kabul
p>0.05, H0 hipotezi kabul p<0.05, H0 hipotezi kabul p>0.05, H1 hipotezi kabul p>0.01, H0 hipotezi kabul p<0.05, H1 hipotezi kabul
Diabet hastalarında glukoz değerlerinin cinsiyete göre farklılık gösterip göstermediğini bulmak amacı ile yapılan bir çalışmada; 41 kadında glukoz değeri ortalaması ± standart sapması 145±20 mg/dl iken 61 erkek hastada 165±30 mg/dl olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur?
285
a) Varyanslar ortak, p>0.05, H1 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık gösterir. b) Varyanslar ortak, p>0.05, H0 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık gösterir. c) Varyanslar farklı, p>0.05, H0 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık göstermez. d) Varyanslar farklı, p>0.05, H1 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık gösterir. e) Varyanslar farklı, p<0.05, H1 hipotezi kabul, cinsiyete göre glukoz değerleri farklılık gösterir. 56.
49 anemi hastasında tedavi öncesi ve sonrası hemoglobin değerleri farklarının ortalaması 3.7 g/dl, standart sapması 1.6 g/dl olarak bulunmuştur. Uygulanan tedavinin etkili olup olmadığını belirlemek amacı yapılan hipotez testi sonucu t = 16.09 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)
57.
Kolesterol düzeyini düşürdüğü iddia edilen bir ilaç 36 hastada deneniyor. Hastaların kolesterol değerleri tedavi öncesi ve tedavi sonrasında ölçülmüştür. Alınan fark değerlerinin ortalaması(±standart sapması) 15±12 mmHg olarak hesaplanmıştır. Buna göre ilacın etkin olup olmadığı hakkında aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)
58.
p>0.05 , H0 hipotezi kabul p<0.05 , H0 hipotezi kabul p>0.05 , H1 hipotezi kabul p<0.01 , H1 hipotezi kabul p>0.01 , H0 hipotezi kabul
p>0.05 , H0 hipotezi kabul, ilaç etkin p<0.05, H0 hipotezi kabul, ilaç etkin değil p<0.05 , H1 hipotezi kabul, ilaç etkin p>0.001, H0 hipotezi kabul, ilaç etkin değil p>0.01, H0 hipotezi kabul, ilaç etkin
Yeni bir antibiyotiğin üst solunum yolu enfeksiyonunu(ÜSYE) dört günlük kullanım ile iyileştirmede 0.70 etkili olduğu ileri sürülmektedir. İlaç, ÜSYE olan 200 kişilik bir hasta grubuna verilmiş ve uygulama sonucunda 120 kişinin iyileştiği görülmüştür. İlacın 0.70 etkili olduğu söylenebilir mi? 286
a) b) c) d) e)
59.
Cinsiyetin bireylerin ağızdaki diş sayısı üzerine etkisi incelenmek isteniyor. Bu amaçla yapılan bir çalışmada 20 kadında ortalama diş sayısı 24, standart sapma 4; 25 erkekte ortalama 20, standart sapma 6 olarak bulunmuştur. Buna göre aşağıdaki seçeneklerden hangisi, cinsiyetin ağızdaki diş sayısı üzerinde etkili olup olmadığını göstermektedir? a) b) c) d) e)
60.
ε = 3.09, p<0.05 H1 kabul, ilacın etkinliği %70 değil ε = 3.09, p<0.05 H1 kabul, ilaç %70 etkin ε = 1.56, p>0.05 H0 kabul, ilaç %70 etkin ε = 1.56, p<0.05 H1 kabul, ilaç %70 etkin ε = 3.09, p>0.05 H0 kabul, ilacın etkinliği %70 değil
p>0.05, H1 hipotezi kabul p<0.05, H0 hipotezi kabul p>0.05, H0 hipotezi kabul p<0.05 , H1 hipotezi kabul p<0.01, H0 hipotezi kabul
Ankara ilinde yapılan genel bir tarama çalışmasında çocukların %35’inin obez olduğu bilinmektedir. Bu ildeki bir okulda ise 250 çocuğun 90’ının obez olduğu saptanmıştır. Bu okuldan elde edilen oranın toplum oranından farklı olup olmadığını sınamak istediğimizde, t değeri kaça eşit olur? a) 12.19
61.
b) 3.85
c) 0.33
d) 9.13
e) 2.04
Sağlıklı 30 bireyde açlık kan şekeri değeri ortalaması±standart sapması 80±10 mg, diabetik 25 bireyde ise 140±15 mg olarak ölçülmüştür. İki grup arasında açlık kan şekeri değeri bakımından istatistiksel olarak fark var mıdır? a) b) c) d) e)
t=17.1, p<0.001 H1 kabul fark var t=1.71, p<0.001 H0 kabul fark var t=17.71, p<0.001 H1 kabul fark var t=1.42, p<0.001 H1 kabul fark yok t=14.2, p>0.001 H1 kabul fark var
287
62.
1000 kişilik bir kümenin 320 kişisi erkektir. Kadınların yarısı hasta diğerleri sağlıklıdır. Erkeklerin ise 190 tanesi sağlıklıdır. Hasta olma açısından cinsiyetler arasında karşılaştırma hangi test ile yapılır? a) b) c) d) e)
63.
x2 Kolmogorov-Smirnov Fisher kesin olasılık testi Pearson r Regresyon analizi
Bir "A" tedavisi, kullanıldığı 90 olgunun 37’sinde başarılı, "B" tedavisi ise kullanıldığı 70 olgunun 34’ ünde başarılı olmuştur. Tedavilerin başarı durumunu kıyaslamak için hesaplanan ki-kare (X2) değeri kaçtır? a) 12.19
64.
b) 3.85
c) 0.89
d) 9.88
e) 2.04
Aynı hastalığın tedavisinde kullanılan 3 ilacın yan etkileri bakımından farklılık gösterip göstermediği araştırılmak isteniyor. Tabloda verilenler ışığında aşağıdaki ifadelerden hangisi doğrudur? Yan etki İlaç
Var
Yok
Toplam
A ilacı
60
110
170
B ilacı
40
90
130
C ilacı
80
120
200
Toplam
180
320
500
a) x2 = 2.97, p<0.05; H1 kabul, İlaçlar yan etkilerine göre farklılık gösterir. b) Fisher, p>0.05; H1 kabul, İlaçlar yan etkilerine göre farklılık gösterir. c) Fisher, p<0.05; H1 kabul, İlaçlar yan etkilerine göre farklılık göstermez. d) x2 = 2.97, p>0.05; H0 kabul, İlaçlar yan etkilerine göre farklılık göstermez. e) x2 = 9.7, p<0.05; H1 kabul, İlaçlar yan etkilerine göre farklılık gösterir.
288
65.
Trafik kazası sebebi ile acil servise getirilen çocuklardan yoğun bakıma alınanların, yaralanmalarının araç içi – araç dışı olmasına göre farklılık gösterip göstermediği araştırılmak isteniyor. Tabloda verilenler ışığında aşağıdaki ifadelerden hangisi doğrudur? Kaza Yeri Takip yeri
Araç İçi
Yoğun bakım
10
2
12
Acil Servis
1
4
5
Toplam
11
6
17
Araç Dışı
Toplam
a) x2 = 6.19, p<0.05; H1 kabul, Kaza yerine göre, takip yeri farklılık gösterir. b) x2 = 6.19, p>0.05; H1 kabul, Kaza yerine göre, takip yeri farklılık gösterir. c) Fisher, p>0.05; H1 kabul, Kaza yerine göre, takip yeri farklılık göstermez. d) x2 = 0.36, p>0.05; H0 kabul, Kaza yerine göre, takip yeri farklılık göstermez. e) Fisher, p<0.05; H1 kabul, Kaza yerine göre, takip yeri farklılık gösterir. 66.
Hipertansiyonlu bireylerde sigara içme sıklığının toplum sıklığından farklı olup olmadığına aşağıdaki test istatistiklerinden hangisi ile karar verilir? a)
d)
b)
c)
e)
289
67.
Çocuk hastalıkları kliniğine başvuran 40 hastada yüksek ateş ile birlikte idrar yolu enfeksiyonu (İYE) görülmesi sıklığı araştırılmış ve sonuçlar aşağıdaki tabloda verilmiştir. Buna göre çocuklarda yüksek ateş olup olmamasına göre İYE sıklığının değiştiği söylenebilir mi? Sonucu yorumlayınız. İdrar Yolu Enfeksiyonu Var
Yok
Toplam
10
4
14
8
18
26
Toplam 18
22
40
Yüksek Var Ateş
Yok
a) x2 = 6.08, p<0.05; H1 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkiler. b) x2 = 6.08, p>0.05; H0 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkilemez. c) x2 = 6.08, p<0.05; H1 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkilemez. d) Fisher, p=0.016; H0 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkiler. e) Fisher, p=0.016; H1 kabul, çocuklarda yüksek ateş olup olmaması İYE sıklığını etkilemez.
68.
55 yaş üstü bireylerde cinsiyete göre kemik erimesi görülme sıklığının değişip değişmediğini belirleyiniz.
Kemik Erimesi Cinsiyet
Var
Yok
Toplam
Kadın
48
32
80
Erkek
15
55
70
Toplam
63
87
150
290
a) x2 = 2.28, p>0.05; H0 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmektedir. b) x2 = 2.28, p>0.05; H1 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmemektedir. c) x2 = 22.8, p<0.05; H1 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmektedir. d) Fisher, p<0.05; H0 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmemektedir. e) Fisher, p>0.05; H0 kabul, cinsiyete göre kemik erimesi görülme sıklığı değişmektedir.
69.
Yaşa göre hipertansiyonun görülme sıklığının değişip değişmediğini belirleyiniz. Hipertansiyon Yaş Grubu
Var
Yok
Toplam
35-50
18
27
45
51-70
25
20
45
Toplam
43
47
90
a) x2 = 13.83, p<0.05; H1 kabul, Yaşa göre hipertansiyon sıklığı değişmektedir. b) x2 = 13.83, p>0.05; H0 kabul, Yaşa göre hipertansiyon sıklığı değişmemektedir. c) x2 = 2.18, p>0.05; H0 kabul, Yaşa göre hipertansiyon sıklığı değişmemektedir. d) Fisher, p<0.05; H0 kabul, Yaşa göre hipertansiyon sıklığı değişmemektedir. e) Fisher, p>0.05; H0 kabul, Yaşa göre hipertansiyon sıklığı değişmektedir.
291
70.
X ve Y değişkenleri için 64 kişide için hesaplanan pearson korelasyon katsayısı r= - 0,80 çıkmıştır. Bu sonuca göre aşağıdakilerden hangisi doğrudur? a) b) c) d) e)
71.
t=10.5, p>0.05, r anlamlı t=10.5, p<0.05, r anlamlı t=1.05, p<0.05, r anlamlı t=1.05, p>0.05, r anlamlı t=1.05, p>0.05, r anlamlı değil
Aşağıda 20 öğrenciye ilişkin verilerden elde edilen toplam değerleri yer almaktadır. Buna göre, (X) ile (Y) arasında bir ilişki olup olmadığını Pearson korelasyon katsayısını kullanarak hesaplayınız.
a) r = 0,28; p>0.05 d) r = 0.89; p<0.05 72.
b) 0.96
d) 0.58
e) Hiçbiri
b) r = -0.72; p<0.05 e) r = 0.72; p<0.05
c) r = -0.85; p<0.05
73 numaralı soruda verilen değerleri kullanarak (Y) deki değişimlerin yüzde kaçının (X) ile açıklandığını bulunuz. a) 0.72
75.
c) 0.79
Aşağıda 10 öğrenciye ilişkin verilerden elde edilen toplam değerleri yer almaktadır. Buna göre, (X) ile (Y) arasında bir ilişki olup olmadığını Pearson korelasyon katsayısını kullanarak hesaplayınız.
a) r = 0,58; p>0.05 d) r = 0.85; p<0.05 74.
c) r = -0.89; p<0.05
Yukarıdaki soruda (soru 71) verilen değerleri kullanarak (Y) deki değişimlerin yüzde kaçının (X) ile açıklandığını bulunuz. a) 0.08
73.
b) r = -0.98; p<0.05 e) r = 0.76; p<0.05
b) 0.85
c) 0.34
d) 0.58
e) Hiçbiri
73 numaralı soruda verilen değerleri kullanarak Y = a + bX regresyon denklemini kurunuz. 292
a) Y = 6.8 - 4.4X d) Y = 4.4X - 6.8
76.
b) Y = 6.8X + 4.4 e) Hiçbiri
İlacın dozu(mg) ile iyileşme süresi (saat) değerleri için regresyon denklemi “Süre = 36.35 – 0.25 x Doz” olarak elde edilmiştir. Bu denklemi gösteren grafik aşağıdakilerden hangisidir? a)
b)
37.00
35.00 34.00 0
5
10
0
5
10
e)
d) -36.00 -37.00 -36.00 -39.00
5
10
c)
0
5
10
-34.00 -34.50 -35.00 -35.50 -36.00 -36.50
36.50 36.00 37.50 37.00 36.50 36.00 0
10
5
Çocuklarda gece uykusu süresi ile algılama düzeyi arasında bir ilişki olup olmadığını araştırmak için yapılan bir çalışmada, 7 çocuğa ilişkin bulgular aşağıdaki gibi elde edilmiştir. Spearman sıra korelasyon katsayısını ( rs ) hesaplayınız (Tx ve Ty’ler hesaplamaya dahil edilmeyecektir). Uyku Süresi (saat) 6
7
8
9
5
4
6
Algılama Düzeyi
8
6
8
6
5
5
a) 0.69
78.
0 10.00 0.00 -10.00 -20.00 -30.00 -40.00
36.00
77.
c) Y = 6.8 + 4.4X
b) 0.64
7
c) 0.82
d) 0.18
e) 0.31
Aşağıda Ailevi Akdeniz ateşi “FMF” hastalığına sahip 10 bireyin Hemoglobin(Hb) ve Hematokrit(Htc) değerleri verilmektedir. Hb ve Htc değerleri arasında ilişki olup olmadığını Pearson korelasyon katsayısını (r) kullanarak bulunuz ve sonucu yorumlayınız. Hb (X) : 12 14 16 Htc (Y): 35 37 38 ∑x = 130 ∑y = 349
15 13 12 11 10 14 13 36 36 34 32 30 36 35 ∑x2 = 1720 ∑y2 = 12231 ∑xy = 4573 293
a) r = 0.92, p<0.05 d) r = 0.48, p<0.05
79.
b) r = 0.92, p>0.05 e) r = 0.48, p<0.05
Aşağıda verilen x ve y değişkenleri için Pearson korelasyon katsayısını hesaplayınız.
a) r=0.74; p<0.05 d) r=0.87; p<0.05
80.
x
y
51 30 24 56 68 74 35 76 93 33
43 34 28 68 70 87 36 68 92 64
b) r= -0.74; p>0.05 e) r=0.56;p<0.05
c) r= -0.87; p<0.05
79 numaralı soruda verilen tabloyu kullanarak regresyon denklemini hesaplayınız. a) Y = 0.84X – 13.44 d) X= 0.84Y+13.44
81.
c) r = 0.80, p<0.05
b) Y = 0.84X + 13.44 e) X= -0.84+13.44Y
c) Y= 13.44 – 0.84X
Çocuklarda gece uykusu süresi ile algılama düzeyi arasında bir ilişki olup olmadığını araştırmak için yapılan bir çalışmada, 11 çocuğa ilişkin bulgular aşağıdaki gibi elde edilmiştir. Spearman sıra korelasyon katsayısını ( rs ) hesaplayınız (Tx ve Ty’ler hesaplamaya dahil edilmeyecektir). Uyku Süresi (saat) 4 Algılama Düzeyi 3 a) 0.69
b) 0.64
5.5
6
6.5
7.5
8
5
7
8.5
10
9
5
6
7
6
10
4
9
8
7
9
c) 0.82
d) 0.79 294
e) 0.77
82.
“ ……………… , bağımlı değişkendeki değişimlerin yüzde kaçının bağımsız değişken tarafından açıklandığını gösterir” ifadesinde boş bırakılan yer için uygun seçeneği işaretleyiniz.” a) Korelasyon katsayısı b) Belirleme Katsayısı d) Değişim katsayısı e) Spearman katsayısı
83.
Aşağıda verilen x ve y değişkenleri için Pearson korelasyon katsayısını hesaplayınız.
a) r=0.68; p<0.05 d) r=0.74; p<0.05
84.
x
y
11 14 16 9 7 12 10 12 7 6
50 64 66 62 44 72 40 56 32 44
b) r= 0.74; p>0.05 e) r=0.86;p<0.05
c) r= 0.86; p>0.05
Aşağıdakilerden hangisi tanı testi değerlendirmesi özgün ölçütlerinden değildir? a) Duyarlılık b) Özgüllük d) Yalancı pozitif oranı e) Göreli risk oranı
85.
c) Regresyon katsayısı
c) Doğruluk oranı
Gerçekte hasta olduğu bilinen 60 kişinin 36’sına yeni bir yöntem ile hasta tanısı konurken, gerçekte sağlam olduğu bilinen 120 kişinin 30’una hasta tanısı konulmuştur. Buna göre yöntemin sırası ile duyarlılığı ve özgüllüğü kaça eşit olur? a) 0.75; 0.60
b) 0.51; 0.82
c) 0.60; 0.75 295
d) 0.82; 0.51
e) 0.60; 0.51
86. ALTIN STANDART Hasta TANI
Hasta
TESTİ Sağlam
Sağlam
268
65
83
314
Yukarıdaki tabloya göre tanı testinin “Negatif kestirim değeri” ve “Duyarlılığı” sırasıyla aşağıdakilerden hangisidir? a) 0.80 - 0.83 d) 0.76 -0.79
87.
b) 0.91
c) 0.66
d) 0.79
e) 0.89
100 gerçek hasta ve 100 gerçek sağlamın katıldığı bir çalışmada, üç tanı testi (A,B ve C) %100 doğru tanı koyan “altın standart”’a göre yeniden değerlendirildiğinde duyarlılıkları sırasıyla, %98, %92 ve %84’dir. Özgüllükleri ise sırasıyla %76, %89 ve %93’dir. En başarılı test hangisidir? a) C
89.
c) 0.83 – 0.96
Altın Standarda göre yarısının hasta olduğu 400 kişilik bir çalışmada tanı testinin özgüllüğü 0,78 ise genel doğruluk oranı en yüksek kaç olabilir? a) 0.95
88.
b) 0.83 – 0.80 e) 0.79 – 0.76
b) A
c) B
d) A=C
e) A=B
Bir hastalığa tanı koymada 5 farklı kan değerinden birine(A, B, C, D, E) bakarak karar verilmek isteniyor. Her bir kan parametresi için ROC eğrisi çizilerek eğri altında kalan alanlar aşağıdaki gibi bulunuyor. Buna göre hangi kan parametresi tanı koymada daha yüksek güce sahiptir? a) A: 0.58
b) B:0.68
c) C:0.82
296
d) D:0.50
e) E: 0.63
90.
Demans prevalansının %7 olduğu bilinmektedir. Yeni bir tanı koyma yönteminin(testin) duyarlılığı 0.75, özgüllüğü ise 0.90 olarak bulunmuştur. Buna göre test sonucu negatif çıkan bir bireyin sağlam olma olasılığı kaça eşittir? a) 0.36
91.
b) 0.68
c) 0.98
d) 0.05
e) 0.93
Alzheimer hastalığına tanı koymak için geliştirilen yeni bir yöntemin duyarlılığı 0.85, özgüllüğü 0.55 olarak bulunmuştur. Toplumda Alzheimer hastalığı görülme sıklığının %7 olduğu bilindiğine göre aşağıdaki ifadelerden hangisi/hangileri doğrudur? I. Yöntem %55 olasılıkla hastaları ayırt edebilmektedir. II. Test sonucu pozitif çıktığında kişi %98 olasılıkla hastadır. III. Test sonucu negatif çıktığında kişi %98 olasılıkla sağlıklıdır. a) II
92.
c) II ve III
d) III
e) I
Parkinson hastalığına tanı koymak için geliştirilen yeni yöntemin özgüllüğü 0.85 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)
93.
b) I ve II
Yeni yöntemin sağlamları ayırt etme olasılığı 0.85’tir. Yeni yöntem 0.85 olasılıkla hastaları ayırt etmektedir. Test sonucu negatif çıkarsa birey 0.85 olasılıkla sağlamdır. Yöntem 0.85 olasılıkla yanlış tanı koymaktadır. Test sonucu pozitif çıkarsa birey 0.85 olasılıkla hastadır.
Parkinson hastalığına tanı koymak için geliştirilen yeni yöntemin eksi yorum gücü 0.45 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)
Yöntemin hastaları ayırt etme olasılığı %45’dir. Yöntem %45 olasılıkla sağlamları ayırt edebilmektedir. Yöntem %45 olasılıkla yanlış tanı koymaktadır. Test sonucu negatif çıktığında kişi %45 olasılıkla sağlamdır. Test sonucu pozitif çıktığında kişi %45 olasılıkla hastadır.
297
94.
MS hastalığına tanı koymak için geliştirilen yeni yöntemin eksi yorum gücü 0.25 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)
95.
Yeni yöntemin sağlamları ayırt etme olasılığı 0.25’tir. Yeni yöntem 0.25 olasılıkla hastaları ayırt etmektedir. Test sonucu negatif çıkarsa birey 0.25 olasılıkla sağlamdır. Yöntem 0.25 olasılıkla doğru tanı koymaktadır. Test sonucu pozitif çıkarsa birey 0.25 olasılıkla hastadır.
MS hastalığına tanı koymak için geliştirilen yeni yöntemin özgüllüğü 0.95 olarak bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d) e)
Yöntemin hastaları ayırt etme olasılığı %95’dir. Yöntem %95 olasılıkla sağlamları ayırt edebilmektedir. Test sonucu pozitif çıktığında kişi %95 olasılıkla sağlamdır. Yöntem %95 olasılıkla doğru tanı koymaktadır. Test sonucu negatif çıktığında kişi %95 olasılıkla hastadır.
96. HASTALIK VAR
YOK
Toplam
Etken VAR
18
9
27
Etken YOK
134
26
160
Toplam
152
35
187
Kohort tipi bir araştırmada elde edilen sonuçlara göre uygun risk ölçütünü bulunuz? a) 0.52
97.
b) 0.80
c) 0.46
d) 0.84
e) 0.39
Yukarıdaki tablo (soru 96) bir vaka/kontrol çalışma sonuçları olsa idi uygun göreli değer kaç olurdu? a) 0.52
b) 0.39
c) 0.80
d) 0.46 298
e) 2.577
98.
“Bir araştırmada Relatif Risk (RR) değeri ve %95 güven aralığı alt ve üst değerleri 1.25(0.75-1.05) olarak bulunmuştur.” Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d)
Etken hastalık oluşumunu %1.25 arttırır. Etken hastalık oluşumunu 1.25 kat arttırır. Etken hastalık oluşumunun %1.25’ine engel olur. Etken ortadan kaldırılırsa etken var olan grupta hastalık oluşumu 1.25 kat engellenir. e) Etken ile hastalık arasında istatistiksel olarak ilişki yoktur.
99.
Aşağıdaki tabloda 200 bireye ilişkin on yıllık izleme sonuçları verilmiştir. Bireylerin 125’i sanayi bölgesi yakınında yaşarken, geri kalanı kırsal bölgede yaşamakta idi. (X) hastalığı +
(X) hastalığı -
Toplam
Sanayi bölgesinde yaşayanlar E+
55
70
125
Kırsal bölgede yaşayanlar E-
15
60
75
Toplam
70
130
200
Sanayi bölgesinde yaşamak (X) hastalığına yakalanma riskini arttırır mı? Geçerli risk ölçütü aşağıdakilerden hangisidir? Hesaplayınız. a) b) c) d)
RR= 2.2 Hastalık riski E – grubunda 1 iken, E+ grubunda 2.2 dir. OR= 3.1 Etken hastalık oluşumunu 3.1 kat arttırır. RR=2.2 Etken hastalık oluşumunun %2.2’sine engel olur. AR=0.24 Etkene maruz kalan grupta hastalık insidansının 0.24’lük bölümü etken ile açıklanabilir. e) Etken ile hastalık arasında istatistiksel olarak ilişki yoktur.
100.
(soru 99’da verilen bilgiler ışığında) AR değerini hesaplayınız. a) 2.2
b) 3.1
c) 0.20
d) 0.24
299
e) 0.55
101.
(soru 99’da verilen bilgiler ışığında) %AR değerini hesaplayınız. a) 2.2
102.
b) 3.1
c) 0.20
d) 0.24
e) 0.55
(soru 99’da verilen bilgiler ışığında) Tablodaki verileri kullanarak aşağıdaki ölçütlerden hangisi/hangilerinin doğru olduğunu belirtiniz. I. Ie+ = 0.44 IV. P(D+)= 0.63
II. AR=0.55 V. P(E+)= 0.63
III. OR= 2.2
a) I d) III, IV ve V
b) I ve V e) I, II ve III
c) II, III ve IV
103. Gribe yakalanan (+)
Gribe yakalanmayan (-)
1 - 30 Eylül (Erken dönem)
80
120
200
15 Ekim -15 Kasım
30
270
300
Toplam
110
390
500
Aşı zamanı
Toplam
İleri yaşlarda gribe yakalanmanın bireyler için riskli olduğu bilinmekte dir. Bu amaçla kohort tipi bir çalışma ile 65 yaş üzeri bireylerde sonbaharda aşı olma zamanının gripten korunmada etkili olup olmadığı araştırılmak isteniyor. Çalışmaya alınan bireyler aşı oldukları tarihten itibaren salgın dönemi sonuna kadar izleniyor. Bu süre içinde gribe yakalanıp yakalanmadıkları gözleniyor. Etken olarak 1-30 eylül dönemi alınıyor. Çalışma sonucunda elde edilen bulgular yukarıdaki tabloda verilmiştir. “İki grup arasındaki gribe yakalanma insidansları arasındaki (0.30)luk farkın nedeni erken dönemde aşılanmadır.” ifadesi ile aşağıdaki risk ölçütlerinden hangisi açıklanmaktadır? a) RR
b) OR
c) %AR
d) TAR
300
e) AR
104.
(soru 103’te verilen bilgiler ışığında) RR değeri kaça eşit olur ? a) 0.10
105.
b) 1.30
c) 0.25
d) 22.50
e) 4.00
(soru 103’te verilen bilgiler ışığında) OR (Odds Oranı) değeri ve %95 Güven Aralığı kaça eşit olur? a) 1.67 (1.25 - 2.23) d) 0.6 (045 – 0.80)
b) 6 (3.74 – 9.61) e) Hesaplanamaz
Beslenme Tipi
Hiperlipidemi (+)
c) 1.89(1.32 – 2.72)
106. Hiperlipidemi (-)
Toplam
Kırmızı et ağırlıklı
60
240
300
Sebze-beyaz et ağırlıklı
15
285
300
Toplam
75
525
600
Kohort tipi bir çalışma ile hiperlipidemi hastalığının beslenme alışkanlığından etkilenip etkilenmediği araştırılmak isteniyor. Çalışmaya alınan bireyler 20 yıl boyunca izleniyor. Bu süre içinde sebze-beyaz et ağırlıklı ve kırmızı et ağırlıklı beslenen bireylerde hiperlipidemi gelişip gelişmediği gözleniyor. Etken olarak kırmızı et ağırlıklı beslenme tipi alınıyor. Çalışma sonucunda elde edilen bulgular yukarıdaki tabloda verilmiştir. “İki grup arasındaki hiperlipidemi insidansları arasındaki (0.15)lik farkın nedeni kırmızı et ağırlıklı beslenmedir” ifadesi ile aşağıdaki risk ölçütlerinden hangisi açıklanmaktadır? a) RR
107.
b) TAR
c) %AR
d) AR
e) OR
(soru 106’da verilen bilgiler ışığında) Toplumda kırmızı et ağırlıklı beslenme sıklığı 0.40 olarak alındığında Toplumda Etkene Atfedilen Risk kaça eşit olur? a) 0.06
b) 0.15
c) 0.38
d) 0.75 301
e) 0.55
108.
(soru 106’da verilen bilgiler ışığında) OR (Odds Oranı) değeri ve %95 Güven Aralığı kaça eşit olur? a) 4.75 (2.63 - 8.58) d) 4 ( 2.34 – 6.89)
b) 0.25 (0.14 - 0.43) e) 4.75 (0.34 – 2.34)
c) Hesaplanamaz
109. PSA>
0
Duyarlılık 1.00 Özgüllük
0,07 0,09 0,11 0,13 0,15 0,17 0,19
0,21 0,23
0.90 0.85 0.75 0.70 0.60 0.48 0.30
0.20 0.03 0.00
0.00 0.05 0.15 0.18 0.25 0.40 0.60 0.68
0.85
1
0.98 1.00
Prostat kanseri şüphesi olan bireylerde PSA değerleri ölçülerek tanı konmak istenmektedir. Farklı kesim noktaları için hesaplanan duyarlılık ve özgüllük değerleri yukarıdaki tabloda verilmektedir. Aşağıda verilen grafiklerden hangisinde ROC eğrisi doğru olarak çizilmiştir? a)
b)
1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00
c)
1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 Özgüllük
Özgüllük
d)
e)
1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00
1-Özgüllük
1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00
1-Özgüllük
110.
1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00
1-Özgüllük
TSH hormon tedavisi alan bireylerde daha sık obezite görüldüğü hipotezi ile yapılan bir prospektif çalışmada bireyler 10 yıl süre ile izlenmiş ve bulgular aşağıdaki gibi elde edilmiştir. Buna göre; Relatif risk kaça eşit olur? TSH
Obezite
Tedavisi
Var
Yok
Toplam
Alan
30
10
40
Almayan
10
50
60
Toplam
40
60
100
302
a) 4.5
111.
b) 0.40
b) 0.30
e) Hiçbiri
c) 0.80
d) 0.15
e) 0.33
c) 0.50
d) 0.15
e) Hiçbiri
Kohort tipi bir çalışmada etkenle karşılaşan grupta hastalık insidansı 0.50, etkenle karşılaşmayan grupta 0.15 ise OR kaça eşit olur? a) 3.33
114.
d) 0.92
Kohort tipi bir çalışmada etkenle karşılaşan grupta hastalık insidansı 0.40, etkenle karşılaşmayan grupta 0.10 ise RR (Relatif Risk) kaça eşit olur? a) 4
113.
c) 15
Kohort tipi bir çalışmada etkene maruz kalan grupta gribe yakalanma sıklığı 0.60, etkene maruz kalmayan grupta ise 0.20 olarak belirleniyor. Buna göre etkene atfedilen risk kaça eşit olur? a) 3
112.
b) 0.58
b) 0.35
c) 0.65
d) 0.15
e) Hiçbiri
Grip aşısı olmanın hastalık gelişimine etkisini incelemek amacı ile 6 ay süre ile 65 yaş üzeri 340 birey izlenmiş ve izleme sonuçları aşağıdaki tabloda verilmiştir.
Hastalık Aşı
Gelişen
Gelişmeyen
(D+)
(D-)
Olan (E+)
40
160
200
Olmayan (E-)
95
45
140
135
205
340
Toplam
Toplam
Aşı olan bireylerde hastalık gelişme sıklığı aşağıdakilerden hangisidir? a) 0.30
b) 0.80
c) 0.68
d) 0.20
303
e) 0.32
115.
(soru 114’te verilen bilgiler ışığında) Aşı olmanın hastalık gelişimine etkisini gösteren değer aşağıdakilerden hangisidir? a) OR= 0.12
116.
b) AR= 0.48
c) IE+= 0.20
d) RR= 0.29
e) TAR= 0.28
Bir araştırmada Relatif Risk (RR) değeri 2.5 olarak bulunmuştur” Buna göre aşağıdaki ifadelerden hangisi doğrudur? a) b) c) d)
Etken hastalık oluşumunu %2.5 arttırır. Etken hastalık oluşumunu 2.5 kat arttırır. Etken hastalık oluşumunun %2.5’ine engel olur. Etken ortadan kaldırılırsa etken var olan grupta hastalık oluşumunu 2.5 kat engeller. e) Etken ile hastalık arasında ilişki yoktur.
117.
Yaşamının ilk 12 ayında yüksek düzeyde kurşuna maruz kaldığı bilinen 400 çocuk 15 yıl süre ile izlenmiş ve çocukların 160 'ında etkin bir hastalığın geliştiği görülmüştür. Yine, kurşuna maruz kalmayan benzer 600 çocukluk ayrı bir grup aynı sürede izlenmiş ve bunların 30’unda etkin bir hastalığın geliştiği görülmüştür. İzleme sonuçları aşağıdaki tabloda verilmektedir.
Etkin Hastalık Maruziyet
Gelişen
Kurşuna Maruz Kalanlar
160
Gelişmeyen
Toplam
240
400
Kurşuna Maruz 30 Kalmayanlar
570
600
Toplam
810
1000
190
Yaşamının ilk 12 ayında kurşuna maruz kalan grupta etkin hastalık gelişme insidansı kaçtır ? a) 0.40
b) 0.84
c) 0.60
d) 0.225
304
e) verilen bilgilerle hesaplanamaz
118.
(soru 117’de verilen bilgiler ışığında) Kurşuna maruz kalan grup, maruz kalmayan grupla karşılaştırıldığında RR değeri kaçtır? a) 12.67
119.
c) 0.23
d) 0.40
e) Hiçbiri
(soru 117’de verilen bilgiler ışığında) Kurşuna maruz kalmayan grupta etkin hastalık gelişme insidansı kaçtır? a) 0.05
120.
b) 8.0
b) 0.95
c) 0.23
d) 0.40
e) Hiçbiri
(soru 117’de verilen bilgiler ışığında) Etkene (kurşuna maruziyete) atfedilen risk (AR) değeri kaçtır ? a) 0.40
b) 0.05
c) 0.35
d) 8.0
e) Hiçbiri
121. Hasta B A E B D
İzleme Süresi (ay) 9 16 17 19 27
İzleme Sonucu Kayıp Ex Ex Hayatta Ex
Yukarıdaki tabloda 5 hastaya ilişkin izleme süreleri ve sonuçları verilmiştir. Ortalama yaşam süresi nedir? a) 23.00
122.
b) 17.07
c) 18.50
d) 21.75
e) 17.86
Yukarıdaki tabloya göre (soru 121) 17. aydaki kümülatif sağkalım olasılığı kaça eşittir? a) 0.20
b) 0.65
c) 0.89
d) 0.50
305
e) 0.70
123.
Prospektif bir izleme araştırmasının sonucunda yaşam tablosu (Life Table) oluşturulmuş ve 18-24 aylık dönemin başında 325 hastanın olduğu belirlenmiştir. Dönem içinde 30 hasta ex olmuş ve 50 hasta da izlemeden çıkmıştır. Bu dönem için ölüm olasılığı ne olur? a) 0.10
b) 0.15
c) 0.09
d) 0.25
e) 0.16
124.
İzleme aralığı (ay) (den az)
Li
Di
Ui
Ei
Qi
Pi
Ri
0-6
1250
40
112
1194
0,034
0,966
0,966
6-12
1098
22
68
1064
0,021
0,979
0,947
12-18
1008
45
0
1008
A
B
0,904
18-24
963
60
C
890
0,067
0,933
D
24-30
757
E
50
732
0,000
1,000
0,843
30-36
707
50
54
F
0,074
G
0,781
36-42
603
59
130
538
0,110
0,890
0,696
42-48
414
50
160
334
0,150
0,850
0,591
48-54
204
35
0
204
0,172
0,828
0,490
54-60
169
80
6
166
0,482
0,518
0,254
Yukarıda verilen yaşam tablosu verilerine göre, 12-18 ay arası izlenen bireylerde sağkalım olasılığı (B hücresi) kaça eşittir? a) 0.045
125.
c) 0
d) 1
e) Hiçbiri
(soru 124’te verilen yaşam tablosu verilerine göre) 30-36 ay arası izlenen bireylerde riskli nüfus (F hücresi) kaça eşittir? a) 707
126.
b) 0.955
b) 682
c) 54
d) 603
e) 680
(soru 124’te verilen yaşam tablosu verilerine göre) 18-24 ay arası izlenen bireylerde kayıplar ve 2 yıllık birikimli sağkalım olasılığı (C ve D hücreleri) kaça eşittir? 306
a) 173; 0.843
b) 146; 0.843
c) 60; 0.933
Hasta Adı
İzleme süresi(ay)
İzleme Sonucu
A B C D E F G H
8 11 14 24 28 30 36 40
Ex Kayıp Hayatta Ex Kayıp Kayıp Ex Ex
d) 146; 0.933
e) 890; 0.067
127. Qt
Pt
Rt
Yukarıdaki tabloda Kolon kanseri tanısı konan 8 hastaya ilişkin izleme süreleri ve izleme sonuçları verilmiştir. Buna göre, kolon kanseri tanısı konan 8 hastaya ilişkin ortanca ( medyan ) izleme süresi kaça eşittir? a) 24
128.
d) 23.88
e) Hiçbiri
b) 1
c) 0.70
d) 0.33
e) 0.67
(soru 127’de verilen izlem verilerine göre) 3 yıllık kümülatif sağkalım olasılığı kaça eşittir? a) 0.50
130.
c) 28
(soru 127’de verilen izlem verilerine göre) F adlı hastanın 30. aydaki ölüm olasılığı kaça eşittir? a) 0
129.
b) 26
b) 1
c) 0
d) 0.35
e) 0.70
(soru 127’de verilen izlem verilerine göre) D adlı hastanın 24. aydaki ölüm olasılığı kaça eşit olur? a) 0.80
b) 0
c) 0.88
d) 1
e) 0.20
307
Ek 2.2 Yanıtlar : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
c e e a b e b e c e a c a c d e e d d d e e a d b c e a e c
31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
a c d c a e a a b d b c c b b c c e b c c e d e e d c a d c
61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
c a c d e c a c c b d c d a c a a a d b e b d e c e e c c c
308
91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
d a d c b b b e a d e b e e e d a c c a b a e d d b a b a c
121 122 123 124 125 126 127 128 129 130
d d a b e b b a d e
DİZİN
A
Bilim dili, 3 Bilimsel araştırma, 3 Binom dağılımı, 62 Birikimli sağkalım hızı, 234 Birikimli sıklık, 8 Birleşik olasılık, 53 Biyoistatistik, 2
Açıklanan değişkenlik, 156, 176 Açıklanmayan değişkenlik, 156, 176 Ağırlıklı ortalama, 40 Alternatif hipotez, 107 Alternatif varsayım, 107 Anayığın, 29, 89, 95 Anayığın birim sayısı, 94 Anayığın oranı, 96 Anayığın ortalaması, 96, 102 Aralıklı ölçüm düzeyi, 4 Araştırma Planlanması, 187 Araştırma protokolü, 202 Araştırma tipleri, 187 Aritmetik ortalama, 29, 79 Artı yorum gücü, 205
Ç Çapraz kontrollü klinik çalışma, 200 Çeyrek sapma, 40 Çeyrekler arası yarı genişlik, 41 Çeyreklik, 37 Çift kör, 202 Çizgi grafikleri, 21 Çoklu korelasyon, 153 Çözümleyici araştırmalar, 188 Çubuk grafikler, 14
B Bağdaşan olaylar, 54 Bağdaşmayan olaylar, 53 Bağımlı olaylar, 56 Bağımsız grup, 127 Bağımsız olaylar, 56 Bağıntı, 152 Basit korelasyon, 153 Basit rastlantısal örneklem, 94 Basit rastlantısal örnekleme, 89, 182 Başarı oranı, 51, 124 Başlangıç hipotezi, 157 Başlangıç noktası, 33, 73 Bayes kuralı, 206 Bayes teoremi, 61 Beklenen sıklık, 130 Beklenen yaşam süresi, 221 Belirleme katsayısı, 156 Bernouilli denemesi, 62
D Dağılım aralığı, 7 Dağılım ölçüleri, 40 Daire dilimleri grafiği, 17 Değişim katsayısı, 47 Değişim kaynağı, 176 Değişken, 49 Denek sayısı, 98 Deney grubu, 98, 115, 125, 133, 184 Deney öncesi olasılık, 50 Deneysel araştırmalar, 188 Deneysel dağılım, 140 Deneysel olasılık, 51 Deneysel örnekleme dağılımı, 81 Dış kontrollü klinik çalışma, 199 Diyagram, 13 Doğru negatif, 204 309
Doğru pozitif, 204 Doğrusal ilişki, 152 Doğrusal olmayan ilişki, 152 Duyarlılık, 59, 203 Düzgün dağılım, 140, 149
Güven aralığı, 101, 187, 197, 213, 223 H Harita, 12 Hasta grubu, 211 Hastalığın yinelenmesi, 222 Hastalıksız geçen süre, 223 Hastalıksız sağkalım, 223 Hata, 174, 176 Hata terimi, 174 Hatalar eğrisi, 71 Hipotez, 101, 122, 182 Hipotez testleri, 106, 187 Hipotezlerin sınanması, 125, 187 Histogram, 19 Homojenlik, 128, 195
E Eğri altında kalan alan, 212 Eğrisel grafikler, 25 Eksi yorum gücü, 204 En küçük önemli fark, 177 Epsilon testi, 116 Eşlendirilmiş seri, 117, 184 Etkene atfedilen risk, 191 Etkene maruziyet, 190 Evren, 87 F
İ F testi, 114, 169 Fark serisi, 185 Farkına vardırmama, 202 Fisher Kesin Ki - Kare, 130
İki yönlü test, 110 İlişki katsayısı, 153 İnanç derecesi, 50 İnsidans, 190 İstatistik, 1, 29 İstatistiksel anlamlılık, 131, 213 İzleme çalışması, 221 İzleme süreci, 222 İzleme süresi, 222 İzlenemeyen hasta, 232
G Geçerli sınama testleri, 5 Geçerli tanımlayıcı istatistikler, 5 Genel çarpma kuralı, 56 Genel doğruluk, 203 Genel kareler toplamı, 176 Genel sağkalım, 223 Genel toplama kuralı, 54 Genelleme, 79, 101, 121, 187 Geometrik ortalama, 39 Göreli orantı, 196 Gözlemsel çalışmalar, 187 Gözlemsel sıklık, 128 Grafik, 12 Gruplararası kareler toplamı, 176 Gruplariçi kareler toplamı, 176 Güç, 98, 108
K Kabul edilebilir örnekleme hatası, 94 Kabul edilme kriterleri, 200 Kaplan-Meier yöntemi, 224 Karakteristik, 50 Kareler ortalaması, 177 Kartogram, 12 Katmanlı örnekleme, 91 Kayıp hasta, 224 Kesikli değişken, 49 310
Kesitsel araştırma, 188 Kestirim, 29, 95, 101 Kısmi korelasyon, 153 Ki - kare, 127 Kiritik D değeri , 179 Kohort Çalışması, 189 Kontenjans katsayısı, 140 Kontrol grubu, 100, 117, 125, 133, 186, 197, 211 Korelasyon, 151 Korelasyon katsayısı, 153 Körleme, 202 Kritik oran, 103 Kura yöntemi, 89 Kuramsal dağılım, 62, 142 Kuramsal örnekleme dağılımı, 81, 96, 103, 121 Kuramsal sıklık, 128 Küme örnekleme yöntemi, 91
Normal dağılım eğrisi, 71, 110 Nüfus piramidi, 20 O Odds değeri, 196 Odds oranı, 196 Olasılık, 50 Olasılık dağılımı, 49 Olasılık oranı, 196 Olasılıklı alan örneklemesi, 92 Olasılıklı örnekleme, 88 Ondalık, 36 Oransal ölçüm düzeyi, 4, 153 Orantılı katmanlı örnekleme, 91 Orantısız katmanlı örnekleme, 91 Ortak varyans, 113 Ortalama, 81 Ortalama mutlak sapma, 41 Ortalama sağkalım süresi, 223 Ortanca, 34
L Ö Laplace - Gauss dağılımı, 70 Log rank testi, 223 LSD yöntemi, 177
Ölçek değişimi, 33, 74 Ölçüm düzeyleri, 3 Ölüm oranı, 226 Önerme, 106 Örnek, 79, 87 Örneklem, 79, 93, 182 Örneklem büyüklüğü, 96 Örneklem oran, 96, 124 Örneklem ortalaması, 100, 106 Örnekleme, 87 Örnekleme hatası, 93, 174 Örnekleme yöntemleri, 88 Özel çarpma kuralı, 56 Özel toplama kuralı, 53 Özgüllük, 203 Öznelcilik, 50
M Mann-Whitney U testi, 181 Matematiksel İstatistik, 2 Medyan, 34 Medyan sağkalım süresi, 223 Merkezi eğilim ölçüleri, 29 Merkezi sınır teoremi, 81 Mod, 38 N Nesnelcilik, 50 Nicel değişken, 5 Nitel değişken, 5 Normal dağılım, 70, 146, 176, 182 311
P
S
p değeri, 187 Paralel kontrollü klinik çalışma, 198 Parametre, 29, 50, 79, 93, 101 Parametrik olmayan testler, 5, 181 Parametrik testler, 5 Pearson - Bravais korelasyon katsayısı, 139 Persantil, 37 Planlama, 3 Plasebo, 98, 198 Plasebo grubu, 123 Poisson dağılımı, 66, 143 Pozitif prediktif değer, 61 Pozitiflik sınır değeri, 210 Prevalans, 188, 205 Prospektif çalışma, 188, 221
Saçılma ölçüleri, 40 Sağkalım çözümleme yöntemi, 221 Sağkalım eğrisi, 229 Sağkalım hızı, 223 Sağkalım oranı, 226 Salt sıklık, 8 Seçicilik, 60, 203 Serbestlik derecesi, 103, 129, 157, 176 Serpilme Diyagramı, 154 Sıfır varsayımı, 106 Sıklık tablosu, 8 Sınama, 122 Sınıf değeri, 11, 32 Sınıf gerçek sınırları, 32 Sınıf sayısı, 7, 31 Sınıflayıcı ölçüm düzeyi, 4, 127 Sıra değerleri, 181 Sıra istatistik testleri, 181 Sıra numarası, 184 Sıralayıcı ölçüm düzeyi, 4, 127 Sistematik örnekleme yöntemi, 90 Sonlanma hızı, 232 Sonlanma zamanı, 232 Spearman sıra farkı ilişki katsayısı, 163 Spearmen sıra ilişki katsayısı, 138 Standardizasyon, 73 Standart hata, 81, 213, 223 Standart normal değer, 123 Standart normal değişken, 73 Standart normal eğri, 73 Standart sapma, 47, 81, 83 Student't dağılımı, 101 Student't testi, 109 Sürekli değişken, 49, 153, 209
R Randomizasyon, 187, 201 Rastgele seçim, 128 Rastlantısal değişken, 49, 181 Rastlantısal hata, 174 Rastlantısal örnekleme, 88 Rastlantısal sayılar, 89, 201 Rastlantısal sayılar tablosu, 89, 237 Rastlantısal sayılar yöntemi, 89 Rastlantısallık, 174, 187 Regresyon, 151 Regresyon doğrusu, 155 Regresyon katsayısı, 155 Regresyon sabiti, 155 Relatif risk, 190 Resimli grafikler, 18 Retrospektif araştırma, 188 Risk altındaki hasta sayısı, 232 Risk faktörleri, 221 ROC eğrisi, 212 ROC yöntemi, 209
T t test, 109, 119 Tanı karakteristiği eğrisi, 209 312
Tanı testi, 203 Tanımlayıcı araştırmalar, 188 Tchebycheff teoremi, 43 Tek kör, 202 Tek yönlü test, 109 Tek yönlü varyans analizi, 173 Tepe değer, 38 Tip I hata(α), 98, 107 Tip II hata (β), 98, 107 Tipik değer, 29 Tipik olay, 3 Toplam değişkenlik, 161, 175 Toplanma ölçüleri, 29 Toplumda etkene atfedilen risk, 191 Toplumda yüzde etkene atfedilen risk, 191
Vaka serisi, 188 Varsayım, 106 Varsayımın sınanması, 106 Varyans, 42 Varyans analizi tablosu, 176 Varyans analizi yöntemi, 173 Varyasyon katsayısı, 47 Veri tabanı, 195 Wicoxon işaretli sıra testi, 184
Y Yan etki, 124 Yanılma düzeyi, 94, 166 Yanlış negatif, 204 Yanlış pozitif, 204 Yargısal örnekleme, 92 Yarı logaritmalı grafikler, 26 Yaşam süresi, 221 Yaşam Tablosu yöntemi, 221 Yates düzeltimli ki - kare, 130 Yayılma genişliği, 40 Yığın, 3 Yığın olay, 3 Yüzde birikimli sıklık, 8 Yüzde etkene atfedilen risk, 191 Yüzde sıklık, 8 Yüzdelik, 37
U Uygulamalı İstatistik, 2 Ü Üç kör, 202 V Vaka grubu, 195 Vaka kontrol çalışması, 195
313