2013
Biostatistics Brief Notes Dealing with basic concepts about biostatistics for hospital clinical pharmacists with Arabic illustrated hints.
Clinical Pharmacist 21-Apr-13
2
Brief Notes In
Biostatistics By
Dr. Mohammad M. K. Nawar Steward of Clinical Pharmacy Department and Drug Information Center Egyptian Railway Medical Center Ministry of Transport 2013
Brief Notes In Biostatistics , 2011
3
Updated in March – April, 2013 Contact: mknawwar@yahoo.co.uk Brief Notes In Biostatistics , 2011
4 بسم اهلل الرمحن الرحيم
Biostatistics "Refresher" Statistics General Data Sources : 1ry : Original research article ( literature ) , and so we need critical appraisal . Doing critical appraisal of any paper needs to know its study design and data analysis ( biostatistics ) . 2ry : is the abstract filtered review source from the 1ry . 3ry : books , …..
Definition: 1- Method for collecting, classifying, summarizing and analyzing data. 2- Useful tools for quantifying clinical and laboratory data in meaningful way . ٌعتبر اإلحصاء أداة مفٌدة فً تقدٌم المعلومات اإلكلٌنٌكٌة و . المعملٌة " الكمٌة أو الرقمٌة " بطرٌقة ذات مؽزى و داللة 3- Assists in determining whether and by how much a treatment or procedure affects a group of patients .اإلحصاء ٌساهم فً تحدٌد بأي كمٌة . و مدى تأثٌر العالج أو البروتوكول العالجً أصال على مجموعة من المرضى
Types of Data (variables) Categorial / Qualitative / Discrete Quantitative / Continuous مىفصم/ Dichotomous ثىبئَت انخفزع Nominal Ordinal Interval Ratio فً هذا النوع ترتب المعلومات كفئات أو Categories
فً هذا النوع ترتب فً هذا النوع ترتب فً هذا النوع ترتب المعلومات ترتٌبا المعلومات ترتٌبا المعلومات ترتٌبا طبٌعٌا طبٌعٌا تصاعدٌا أو. طبٌعٌا تصاعدٌا . تصاعدٌا . تنازلٌا Can only take a limited number of values Can take on any value within a given Brief Notes In Biostatistics , 2011
5 ٌعتمد هذا النوع على ان تكون الداتا مرتبة ،و تكون الداتا مختلفة فً هذا النوع و هذا طبٌعً فً هذا النوع ( Data difference ) make scence ( Ratios make scence )
مثال :احتساب نسبة الذكور إلى االناث فً مركز كفر شكر ،فنفترض أن عدد الذكور 100و االناث ، 25 فتكون الداتا كالتالً :ذكور الى اناث = 1 : 4
Have absolute ZERO
range . ٌعتمد هذا النوع على ان تكون الداتا مرتبة ،و تكون الداتا مختلفة فً هذا النوع و هذا طبٌعً فً هذا النوع ( Data difference ) make scence ( Ratios don't ) make scence
within a given range . ال ٌهم فً هذا النوع ترتٌب الداتا بطرٌقة معٌنة ،و قد تكون الداتا مختلفة و لٌس شرطا أن تكون متشابهة Data is classified in an & unordered manner with no indication of relative severity . ( e.g sex , mortality , disease state ) .
ٌعتمد هذا النوع على ان تكون الداتا مرتبة ،و قد تكون الداتا مختلفة و لٌس شرطا أن تكون متشابهة Data ranked in a specific order , but with no ثابت consistent level of أهمٌة magnitude of difference between ranks . مثال آخر :تجمٌع بٌانات عن مثال :تجمٌع مثال :قٌاس معدل معلومات عن نسبة أسماء الوظائؾ " الفئات " درجات الحرارة الموجودة فً منطقة الفٌالت الحوافز المقررة العظمى من شهر للعاملٌن بالمستشفى فً بنها ،فستكون الداتا ٌناٌر حتى أبرٌل ، حسب قرار وزٌر فنجد مثال معدل ، 30 كالتالً :مهندسٌن الصحة األخٌر : درجة الحرارة أطباء ، 50معلمٌن ، 100 فستكون كالتالً ( العظمى فً شهر عمال . 200 ٌناٌر كان ، 20و الداتا مرتبة تصاعدٌا و هنا ستجد الداتا مختلفة فً فبراٌر وصلت أو تنازلٌا ) :األطباء باختالؾ الوظائؾ المتعددة الى 25و فً مارس البشرٌٌن - % 300هذه ،كما انه ال ٌوجد شرط أطباء األسنان 250 ، 28و فً ابرٌل للترتٌب بٌنها . - %الصٌادلة 225 ، 40هنا تعنٌنً .% القٌم الرقمٌة و الحسابٌة للداتا رؼم ( هذا المثال ٌندرج تباٌنها عبر الشهور ،أٌضا تحت ) Nominal data للتعبٌر عن مدى التؽٌر المناخً عبر هذه المدة و منه نستنتج ان شهر ابرٌل أدفا مرتٌن مثال عن ٌناٌر .لكن فً هذا النوع ال ٌratioهمنً " نسبة " درجة حرارة ٌناٌر إلى أبرٌل . You can say that they are " yes or No " No absolute data type ZERO ( Brief Notes In Biostatistics , 2011
6 conversion ) factor فً هذه النوعٌة من الداتا تعنٌنً قٌمة الداتا كقٌمة رقمٌة أو حسابٌة counted data ) ( continuous عادة ٌتم تقسٌم الـ Quantitativeفً عملنا االكلٌنٌكً إلى Normally distributed - 1 Abnormally Distributed - 2 و هذا التقسٌم الخٌر هو الذي سنأخذ به فً شرحنا و عملنا .
فً هذه النوعٌة من الداتا ال تعنٌنً قٌمة الداتا كقٌمة رقمٌة أو حسابٌة ، non countedو لكن تعنٌنً كداللة ،فمثال فً مثال الوظائؾ ،ال تعنٌنً اعداد المنتسبٌن للوظائؾ لكن تعطٌنً داللة على أن الؽالبٌة هم العمال .و أٌضا فً مثال النوع الثانً ،ال ٌهمنً قٌمة الحافز بقدر ما ٌهمنً داللة هذه األرقام فً ان فئة الصٌادلة هم األدنى فً الحوافز .
Brief Notes In Biostatistics , 2011
7 • Reasearch Data ( ex. 20000 readings )
• Description statistics • Summerizing data
few readings
conclusion
• Description statistics • Inferential statistics
عهم اإلحصبء Statistics
ٌوصف Descriptive
ٌمزئ Visual
ًانخوسٍع انخكزار Frequency Distribution
ٌاسخذالن Infrential
) ًعذدً ( حعذاد Numerical
ٌانزسم انبَبو Histogram
انخخطَط انمبعثز Scatter Plot
ٌانمخوسط انحسبب Mean
األكثز اسخخذامب
مقبٍَس انىشعت انمزكشٍت Measures of central tendency انوسَط Median
مقبٍَس انخشخج Measures of data spread or variability
انمىوال Mode
ًاالوحزاف انمعَبر Standard deviation
" أو الجدولً بخالؾ المرئً و التعداديTabular " قد نجد نوعا ثالثا من االحصاء و هو الـ
Brief Notes In Biostatistics , 2011
انمذى Range
انمئَىبث Percentiles
8 Statistics عهم اإلحصبء وصفٌ {A} Descriptive هً Used to summarize & describe data that are collected in a research طرق تجمٌع و تلخٌص المعلومات بؽرض شرحها للفهم
مزئٌ ( 1 ) Visual methods of describing data :انخوسٍع انخكزارً " ( A ) Frequency distribution " f عبارة عن جدول ( الجدول التكراري ) ٌلخص البٌانات الخام فٌوزعها على هٌئة فئات ،و ٌحدد عدد األفراد الذٌن ٌنتمون إلى كل فئة ( و ٌسمى العدد هنا بـ " تكرار الفئة = ) " f و إلتمام ذلك ٌنبؽً أن ٌصمم جدول آخر ٌسمى جدول تفرٌػ البٌانات اإلحصائٌة مكون من 3 خانات : الخانة األولى :تكتب فٌها صفة البٌانات الوصفٌة او الفئة للبٌانات الكمٌة الخانة الثانٌة :تقٌد فٌها أعداد كل فئة على هٌئة حزم ،و الحزمة مكونة من 5خطوط كالتالً :
الخانة الثالثة ٌ :كتب فٌها كل فئة باألرقام . مثال : fالتكرار/العدد 5
العالمات
الصفات A
5
B
5
C
15
total
Brief Notes In Biostatistics , 2011
9 و من هذا الجدول نستخلص الجدول التالً ( إما أن ٌكون رأسٌا أو أفقٌا ) : الفئة A B C total
التكرار 5 5 5 15 C total 5 15
B 5
A 5
الصفة التكرار
انزسم انبَبوٌ ( B ) Histogram : المدرج التكراري 1-
المضلع التكراري 2-
المنحنى التكراري الممهد 3-
Brief Notes In Biostatistics , 2011
10 a- ‍المنŘنى Ř§Ů„ŘŞŮƒŘąŘ§ŘąŮŠ المت؏مؚ الؾاؚد‏
b- ‍المنŘنى Ř§Ů„ŘŞŮƒŘąŘ§ŘąŮŠ المت؏مؚ الهابء‏
( C ) Scatter plot ‍ ان؎؎ءَء انمبؚ؍ز‏/ ‍انزسم‏
( 2 ) Numerical methods of describing data ‍Řؚذاد‏ ( A ) Measures of central tendency ‍مقبŮ?ŮŽŘł انىشؚت Ř§Ů†Ů…Ř˛ŮƒŘ´Ů?ت‏ (3M) 1 – Mean ( Average ) đ?’™: ŮŒâ€Ť Ř§Ů†Ů…ŘŽŮˆŘłŘˇ انŘسبب‏/ â€ŤŘ§Ů†ŮˆŘłŘˇâ€Ź Sum of all values âˆ‘Ă— divided by the total No. of values ) ‍( Ů…ŘŹŮ…ŮˆŘšŮ‡Ů… ؚلى ؚددهم‏ Used for continuous & distributed data 6 = ً‍ هنا ŮŒŮƒŮˆŮ† Ř§Ů„ŮˆŘłŘˇ الŘŘłŘ§Ř¨â€ŹŘŒ 12 , 8 , 5 , 3 , 2 : ‍م؍ال‏ Most commonly used & most understood measure of central tendency â€ŤŘŁŮƒŘŤŘą ŘłŮ‡ŮˆŮ„ŘŠ Ůˆ است؎داما‏ Brief Notes In Biostatistics , 2011
11 من أنواعه geometric :أي المتوسط الهندسً و arithmeticأي المتوسط الحسابً من عٌوبه : Sensitive to Outliers أي انه ٌتأثر بالقٌم الشاذة المتطرفة ( و هً القٌم الكبٌرة جدا أو الصؽٌرة جدا مقارنة بباقً القٌم الموجودة بالداتا ) مثال 0.005 , 5 , 7 , 8 . 10 , 5000 : فنجد أن القٌم الشاذة هنا هً 0.005و 5000مما ٌؤثر على حساب قٌمة المتوسط . و من عٌوبه انه ال ٌستخدم فً الجداول التكرارٌة . انوسَط 2 – Median = 50th percentile عند ترتٌب الداتا ترتٌبا تصاعدٌا أو تنازلٌا ،فإن الوسٌط ٌكون هو البٌان الذي ٌقع فً منتصؾ هذه البٌانات .فإن كان عدد البٌانات فردٌا ،فإن الوسٌط هً القٌمة التً فً المنتصؾ ،و إن كان عدد البٌانات زوجٌا ،فإن الوسٌط هو متوسط القٌمتٌن اللتان فً منتصؾ هذه البٌانات . مثال :أوجد الوسٌط لدرجات الطالب حٌث أن درجاتهم كالتالً : 60 ، 72 ، 40 ، 70 ، 63 ٌتم ترتٌب هذه البٌانات تصاعدٌا أو تنازلٌا ،و لٌكن : 72 ، 70 ، 63 ، 60 ، 40 و بما أن عدد هذه البٌانات = ( 5فردي ) فإن الوسٌط سٌكون 63 مثال :أوجد الوسٌط لدرجات الطالب حٌث أن درجاتهم كالتالً : 60 ، 72 ، 40 ، 70 ، 63 ، 72 – 1الترتٌب 40 , 60 , 63 , 72 , 72 , 80 : – 2بما ان عدد هذه البٌانات = ( 6زوجً ) إذا الوسٌط =
72+63 2
= 67.5
Midpoint of the values when placed in order form highest to lowest . half of the observations are above and below . Can be used for ordinal or continuous data Brief Notes In Biostatistics , 2011
12 Insensitive to outliers انمىوال 3 – Mode : هً عبارة عن القٌمة األكثر شٌوعا ( تكرارا ) فً مجموعة البٌانات . قد ٌكون لمجموعة البٌانات : منوال واحد ( وحٌدة المنوال) أكثر من منوال ( متعددة المنوال ) بال منوال ( عدٌمة المنوال ) مثال :أوجد المنوال للبٌانات اآلتٌة : 2,6,9,4,6,10,6,10 إذا ٌكون المنوال هو رقم 6ألنه تكرر أكثر من الرقم 10 مثال : :أوجد المنوال للبٌانات اآلتٌة : 2,6,9,10,4,6,10,6,10 إذا ٌكون المنوالٌن هما 10 ، 6لن كال منهما تكرر 3مرات . ممٌزاته : مقٌاس سهل ال ٌتأثر بالقٌم الشاذة المتطرفة ٌمكن استخدامه للقٌم الوصفٌة و التوزٌعات ( الجداول ) التكرارٌة . عٌوبه : عند حساب المنوال ال تؤخذ كل القٌم فً االعتبار قد ٌكون لبعض البٌانات أكثر من منوال و منه ال ٌمكن تحدٌد قٌمة موحدة للمنوال فً هذه الحالة . Most common value in distribution Can be used for nominal , ordinal or continuous data Doesn't help describe meaningful distributions with a large range of values , each of which occurs infrequently . Brief Notes In Biostatistics , 2011
โ ซโ ช13โ ฌโ ฌ โ ซโ ช( B ) Measures of data spread or variabilityโ ฌโ ฌ โ ซู ุนุธู ู ุง ุณุจู ู ู ุฃุณุงู ู ุจ ุงุฅู ุญุตุงุก ู ุนุชุจุฑ ุผู ุฑ ู ุงุพ ู ู ู ู ุงุฑู ุฉ ุจู ู ุงู ู ุฌู ู ุนุงุช ู ุธุฑุง ุงู ุญุชู ุงู โ ฌ โ ซู ุฌู ุฏ ู ู ุงุฑู ุจู ู ุงู ุจู ุงู ุงุช ุงู ู ุนุทุงุฉ โ ช ุ โ ฌู ุฐุง ุฏุนุช ุงู ุญุงุฌุฉ ู ู ุง ู ุณู ู ุจู ู ุงู ู ุณ ุงู ุชุดุชุช โ ช.โ ฌโ ฌ โ ซู ุซุงู โ ช :โ ฌู ุฏู ู ุจู ุงู ุงุช ุซุงู ุซ ู ุฌู ู ุนุงุช ู ู ู ู ู โ ช:โ ฌโ ฌ โ ซโ ชX : 59 , 61 , 62 , 58 , 60โ ฌโ ฌ โ ซโ ชY : 50 , 60 , 66 , 54 , 70โ ฌโ ฌ โ ซโ ชZ : 39 , 65 , 46 , 78 , 72โ ฌโ ฌ โ ซุงู ู ุณุท ุงู ุญุณุงุจู ู ู ุซุงู ุซุฉ = โ ช ุ 60โ ฌู ู ู ู ุง ู ุฌุฏ ุฃู โ ช:โ ฌโ ฌ โ ซู ู ู ุงู ู ุฌู ู ุนุฉ โ ช Xโ ฌู ุชู ุงุฑุจุฉ โ ช ุ โ ฌู ู ู ุงู ู ุฌู ู ุนุฉ โ ช Yโ ฌุฃู ู ุชู ุงุฑุจุง ู ู ู ุง ุจู ู ู ุง ู ู ุงู ู ุฌู ู ุนุฉ ุงุฃู ู ู ู โ ช ุ โ ฌู ู ู ู โ ฌ โ ซุงู ู ุฌู ู ุนุฉ โ ช Zโ ฌุฃู ู ุชู ุงุฑุจุง ู ู ู ู ุง โ ช .โ ฌู ุฐุง ู ุงู ุช ุงู ุญุงุฌุฉ ุฅู ู ุฌุงุฏ ู ู ุงู ู ุณ ุชู ู ุณ ุฏุฑุฌุฉ ุชุฌุงู ุณ ู ุชู ุงุฑุจ (โ ฌ โ ซุฃู ุชุดุชุช ู ุชุจุงุนุฏ ) ู ู ุฑุฏุงุช ุงู ุจู ุงู ุงุช ุนู ุจุนุถู ุง = " ู ู ุงู ู ุณ ุงู ุชุดุชุช "โ ฌ โ ซุงุงู ู ุญุฑุงุพ ุงู ู ุนู ุงุฑู โ ช1-Standard Deviation ( ฯ , S ) :โ ฌโ ฌ โ ซู ุจู ุงู ุญุฏู ุซ ุนู ู โ ช ุ โ ฌู ู ุฏ ุงู ุชู ู ู ุญ ุฅู ู ู ุง ู ุณู ู ุจุงุงู ู ุญุฑุงุพ ุงู ู ุชู ุณุท ) โ ช ( M.Dโ ฌู ุงู ุฐู ู ุนุฑุพ ุจุฃู ู โ ฌ โ ซู ุชู ุณุท ุงุงู ู ุญุฑุงู ุงุช ุงู ู ุทู ู ุฉ ู ู ุจู ุงู ุงุช ุนู ู ุณุทู ุง ุงู ุญุณุงุจู (๐ ) โ ช.โ ฌโ ฌ โ ซุจุจู ู ุณุจุช ู ู ุจู ุจู ุจุซ ุงู ู ุจุจุดุฒุฉ โ ช๐ โ ๐ :โ ฌโ ฌ โ ซุจุงู ู ุณุจุฉ ู ู ุจู ุงู ุงุช ุงู ู ุจู ุจุฉ โ ช:โ ฌโ ฌ
โ ซ๐ โ ช๐ โ โ ฌโ ฌ
โ ซ๐ โ ฌ โ ซ๐ ๐ ๐ =๐ โ ฌ
โ ซ๐ โ ฌ
โ ซ๐ โ ฌ โ ซ๐ =๐ โ ฌ
โ ซ๐ โ ฌ โ ซ๐ โ ฌ
โ ซ=โ ชMDโ ฌโ ฌ
โ ซ=โ ชMDโ ฌโ ฌ
โ ซุญู ุซ ุฃู โ ช nโ ฌู ู ู ุฌู ู ุน ุงู ุชู ุฑุงุฑุงุช โ ช x ุ โ ฌู ู ุงู ู ุฆุฉ ( ุฃู ู ุชู ุณุท ุงู ู ุฆุฉ ุฅุฐุง ู ุงู ุช ู ุณุจู ุฉ )โ ฌ โ ซู ุซุงู ู ู ุจู ุงู ุงุช ุงู ู ุจุงุดุฑุฉ โ ช :โ ฌุฃู ุฌุฏ ุงุงู ู ุญุฑุงุพ ุงู ู ุชู ุณุท ู ุนู ุงุฑ ู ุฌู ู ุนุฉ ู ู ุงู ุทุงู ุจ โ ช:โ ฌโ ฌ โ ซโ ช6,5,7,7,8,9,9,5โ ฌโ ฌ โ ซโ ช56โ ฌโ ฌ โ ซโ ช=7โ ฌโ ฌ โ ซโ ช8โ ฌโ ฌ โ ซ๐ โ ช๐ โ โ ฌโ ฌ
โ ซ๐ โ ช๐ โ โ ฌโ ฌ โ ซโ ช1โ ฌโ ฌ โ ซโ ช2โ ฌโ ฌ โ ซโ ช0โ ฌโ ฌ โ ซโ ช0โ ฌโ ฌ โ ซโ ช1โ ฌโ ฌ
โ ซโ ช-1โ ฌโ ฌ โ ซโ ช-2โ ฌโ ฌ โ ซโ ช0โ ฌโ ฌ โ ซโ ช0โ ฌโ ฌ โ ซโ ช1โ ฌโ ฌ
โ ซ=๐ โ ฌ โ ซโ ชXโ ฌโ ฌ โ ซโ ช6โ ฌโ ฌ โ ซโ ช5โ ฌโ ฌ โ ซโ ช7โ ฌโ ฌ โ ซโ ช7โ ฌโ ฌ โ ซโ ช8โ ฌโ ฌ
โ ซโ ชBrief Notes In Biostatistics , 2011โ ฌโ ฌ
14 2 2 2 10 بالتعوٌض فً القانون األول M D = 10/8 = 1.25 :
9 9 5 56
2 2 -2 0
مثال للبٌانات المبوبة :أوجد االنحراؾ المتوسط لدرجات الطالب كالتالً : 40 - 49الفئة 50 - 59 60 - 69 70 - 79 80 – 89 90 – 99 عدد الطالب 2 9 15 11 2 1 الحل : 𝒙−𝒙 f 42.5 101.25 18.75 96.75 37.5 28.75 325
𝒙𝒙− 21.25 11.25 1.25 8.75 18.75 28.75
𝒙𝒙− -21.25 -11.25 -1.25 8.75 18.75 28.75
f 2 9 15 11 2 1 40
fx 89 490.5 967.5 819.5 169 94.5 2630
X 44.5 54.5 64.5 74.5 84.5 94.5
Classes 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99
2630 = 65.75 40
=𝒙
و بالتعوٌض فً القانون الثانً M D = 325 / 40 = 8.125 : االنحراؾ المعٌاري :وُ ِجدَ أنه من الصعب التعامل رٌاضٌا ( تحلٌلٌا ) مع االنحراؾ المتوسط ، لذلك دعت الحاجة إلى استخدام مقاٌٌس للتشتت بنفس قوة االنحراؾ المتوسط .و لكً ٌكون من السهل التعامل معه تحلٌلٌا ،فالفكرة تتلخص فً التخلص من اإلشارات ( السالبة ) لالنحرافات عن طرٌق تربٌع االنحرافات ( ٌعنً لو أن هناك قٌمة بالسالب فإن تربٌع االنحرافات ٌجعلها بالموجب و بذلك نتخلص من السالب ) . ٌتم حساب االنحراؾ المعٌاري عن طرٌق " الجذر التربٌعً للتباٌن " ( التباٌن σ2أو : S2هو متوسط مربع انحرافات القٌم عن وسطها الحسابً ) 𝟐
𝒙𝒙−
𝑛 𝑖=1
1 𝑛−1
= σ = 𝜎2
مثال :احسب االنحراؾ المعٌاري ألعمار مجموعة من الطالب : 8,9,7,6,5 35 =7 5
=𝒙
Brief Notes In Biostatistics , 2011
15 𝟐
𝒙𝒙−
𝒙𝒙−
1 4 0 1 4 10 و بالتعوٌض فً المعادلة السابقة ٌكون الناتج :
x 8 9 7 6 5 35
1 2 0 -1 -2 0
S = 𝑆 2 = 1.581 خصائصه : - 1اذا أضفنا أو طرحنا مقدارا ثابتا ( ) Cمن جمٌع القراءات لمجموعة البٌانات ،فإن االنحراؾ المعٌاري للقٌم الجدٌدة هو نفسه االنحراؾ المعٌاري للقٌم األصلٌة . 𝟐
𝒅𝒅−
𝑛 𝑖=1
1 𝑛−1
= σ = 𝜎2
حٌث أن d = x - c : 𝟐
فلو قمنا مثال بطرح رقم 5من قٌم أعمار الطالب فً المثال السابق نجد : ) d ( = X-5 𝒅𝒅− 𝒅𝒅− 1 4 0 1 4 10
1 2 0 -1 -2 0
3 4 2 1 0 10
x 8 9 7 6 5
10 =2 5
=𝒅
و بالتعوٌض فً القانون نجد أن : 10 = 2.5 = 1.581
1 5−1
=σ
اي نفس النتٌجة للقٌم األصلٌة ٌ - 2تأثر فً حال ضرب أو قسمة جمٌع القٌم فً /على مقدار ثابت .
Brief Notes In Biostatistics , 2011
16 Is a measure of the variability about the mean , most common measure used to describe this . Square root of the variance ‍ ( Ř§Ů„ŘŞŘ¨Ř§ŮŒŮ†â€Źaverage squared difference of each observation from the mean ) returns variance back into original units ( non – squared ) . Appropriately applied only to continuous data that are normally or near normally distributed or that can be transformed to be normally distributed . The coefficient of variation ‍ Ů…Ů?ؚامŮ?Ů„ Ř§Ů„ŘŞŘ¨Ř§ŮŒŮ†â€Źrelates the mean and SD ( = đ?‘†đ??ˇ đ?‘šđ?‘’đ?‘Žđ?‘›
100% )
2-Range ( R ) ‍ المدى‏: â€ŤŮ‡Ůˆ ال٠عق Ř¨ŮŒŮ† ŘŁŮƒŘ¨Řą Ů‚ŮŒŮ…ŘŠ Ůˆ أؾؽع Ů‚ŮŒŮ…ŘŠâ€Ź : ‍ اŘسب المدى Ů„Ů„Ř¨ŮŒŘ§Ů†Ř§ŘŞ Ř§Ů„ŘŞŘ§Ů„ŮŒŘŠâ€Ź: ‍م؍ال‏ 82 , 40 , 62 , 70 , 30 , 80 R = 82 – 30 = 52 : â€ŤŮ…Ů…ŮŒŘ˛Ř§ŘŞŮ‡â€Ź ‍ سهل الŘساب‏- 1 ‍ ŮŒŘšŘˇŮ‹ Ů ŮƒŘąŘŠ ŘłŘąŮŒŘšŘŠ ؚن ŘˇŘ¨ŮŒŘšŘŠ Ř§Ů„Ř¨ŮŒŘ§Ů†Ř§ŘŞ Ůˆ ŮŒŘłŘŞŘŽŘŻŮ… ŮƒŘŤŮŒŘąŘ§ معاقب؊ ŘŹŮˆŘŻŘŠ االنتا؏ Ůˆ ŮˆŘľŘžâ€Ź- 2 . ‍األŘŮˆŘ§Ů„ Ř§Ů„ŘŹŮˆŮŒŘŠâ€Ź : â€ŤŘšŮŒŮˆŘ¨Ů‡â€Ź . ‍ ŮŒŘšŘŞŮ…ŘŻ Ů Ů‹ Řسابه ؚلى Ů‚ŮŒŮ…ŘŞŮŒŮ† ٠قء Ů…Řš اهمال باقً Ř§Ů„Ů‚ŮŒŮ…â€Ź- 1 . ‍ لذا Ů Ů‡Ůˆ Ů…Ů‚ŮŒŘ§Řł ŘŞŮ‚ŘąŮŒŘ¨Ů‹ ال ŮŒŮ…ŮƒŮ† االؚتماد ŘšŮ„ŮŒŮ‡â€ŹŘŒ ‍ ŮŒŘŞŘŁŘŤŘą ŮƒŘŤŮŒŘąŘ§ Ř¨Ř§Ů„Ů‚ŮŒŮ… الشاذ؊ المتءع٠؊‏- 2 Difference between the smallest and largest value in a data set doesn't give a tremendous ‍ ها،ل‏amount of information by itself . Easy to compute ( simple subtraction ‍) ءعŘ‏ Size of range is very sensitive to outliers
Brief Notes In Biostatistics , 2011
17 Often reported as actual values rather than the difference between two extreme values . 3-Percentiles ( P ) ال ُم َئ ٌْ َنات: ْ اذا رُ ِّت َب فإن القراءة التً تكون فً المنتصؾ تعرؾ بـ، ت عٌنة من البٌانات تصاعدٌا او تنازلٌا . " الوسٌط " كما تم شرحه ) فإن كل جزءQ1 , Q2 , Q3 , Q4 ( لكن اذا ما قسمت هذه البٌانات المرتبة الى أربعة اجزاء ، ) فكل جزء ٌسمى ُع َشٌْرD1 , D2 , ……. , D9 ( و اذا قسمت الى عشرة أجزاء. ٌسمى رُ َبٌْع . ) ٌسمى َمئٌِنP1 , P2 , ……… , P99 ( و لو قسمت الى مائة جزء Is the point ( value ) in a distribution in which a value is lager than some percentage of the other values in the sample . can be calculated by ranking all data on a data set . The 75th percentile lies at which 75% of the other values are smaller . Doesn't assume the population has a normal distribution ( or any other distribution ) .
Brief Notes In Biostatistics , 2011
18
Data Type
Subtype
Continuous Normally Distributed
Descriptive Numerical Statistics Central Measures of Variability Tendency Mean Variance( đ?œŽ 2 ) & SD ( Ďƒ )
Ďƒ = đ?œŽ2 =
Discrete
đ?‘› đ?‘–=1
đ?’™âˆ’đ?’™ đ?&#x;? đ?‘›
while n = No. of readings Abnormall Median : Range & IQR ( Inter Quartile y Rank ( odd Range ) Distributed ) = đ?‘› +1 2 Rank ( even ) = đ?‘› 25 +1 2 Rank 25th percentile = (đ?‘› + 1) 100 If n = odd No. , rank = n1 + ( n2n1 ) X fraction . Ordinal Mode ‍ Ůˆâ€Źvariability ‍ؚاد؊ ال تست؎دم Ů…Ů‚Ř§ŮŒŮŒŘł الـ‏ ‍ Ůˆ Ů„ŮƒŮ† Ů„Ůˆ ŮƒŘ§Ů† ŘšŘŻŘŻâ€ŹŘŒ â€ŤŮŒŮƒŘŞŮ Ů‰ Ř¨Ů‚ŮŒŘ§Řł Ř§Ů„Ů…Ů†ŮˆŘ§Ů„â€Ź ‍ Ů…Ů…ŮƒŮ†â€ŹŘŒ ‍ ŘŁŮƒŘ¨Řą من سبؚ؊‏Categories ‍الـ‏ median , range , IQR ‍نست؎دم الـ‏ Nominal Proportio n ‍النسب؊‏ â€ŤŘ§Ů„Ů…ŘŚŮˆŮŒŘŠâ€Ź
Brief Notes In Biostatistics , 2011
19
اسخىخبجٌ /اسخذالنٌ Inferential Are conclusions made about population ( large group ) from a study of a هً الطرق المتبعة لالستدالل عن معالم مجتمع بناء على sample of that population االستنتاجات و المعلومات التً تم الحصول علٌها من العٌنة المأخوذة من هذا المجتمع و مع الـ inferentialنتبع خطوات عدة : ٌكون لدى الباحث فرض ٌفترضه و ٌختبره بالمقارنة بٌن 1- Test of Hypothesis : الداتا التً التً افترضها و نتٌجة اختبارات الفرضٌة ( 12اختبار ) التً ٌتبعها طبقا لنوع الداتا . 2- Statistical Significance : و تعنً هل النتٌجة النهائٌة للتجارب التً أجراها الباحث فً المقارنة لها أهمٌة احصائٌة من عدمه ؟ و ٌتحدد ذلك من خالل معرفة أمرٌن - 1مجال الثقة Confidence Interval P value - 2 methods .افتراض or hypothesisتخمٌن Inferential Can made by estimation التوزٌع السكانً Population Distribution هو احدى تطبٌقات ما ٌسمى بـ " التوزٌعات االحتمالٌة " Probability Distribution
Brief Notes In Biostatistics , 2011
20
Probability Distributions
Discrete Distributionالتوزٌع المنفصل
Normal ( Gaussian ) distribution
Binomial Distribution
Poisson Distribution
لو فرضنا أن لدٌنا متؽٌر عشوائً Xفقد ٌكون Xعبارة عن : " مجموعة محددة من القٌم ،و هنا ٌعرؾ Xبالمتؽٌر العشوائً المنفصل .مثال :عدد أطفال أسرة معٌنة " أو " مجموعة ؼٌر محددة من القٌم ،و هنا ٌعرؾ Xبالمتؽٌر العشوائً المتصل .مثال :الدخل السنوي لمجموعة من األسر " توزٌع ذي الحدٌن " أبٌض أو اسود " Binomial Distribution : هو أن تكون احتمال نتٌجة أي تجربة إما " نجاحا " Pأو " فشال " q بحٌث ٌكون p + q = 1 و بتكرار التجربة عدد من المرات nفإننا نحصل فً كل مرة على احتمال النجاح أو الفشل لكل تجربة على حدة ،و تكون دالة االحتمال هنا كالتالً : x = 0 , 1 , 2 , ……. N
𝑥𝑃 𝑥 𝑄𝑛−
,
𝑛 𝑥
= ) 𝑥=𝑋 (𝑃
مثال :اذا كانت نسبة النجاح فً مادة هً ، 0.8و اذا كان عدد من تقدم لالمتحان هو 15طالبا .فما هو احتمال أن ٌنجح : كل الطالب 8 ،طالب 6 ،طالب ،و ال طالب ؟ الحل : P = 0.8 , Q = 0.2 و بالتعوٌض فً القانون السابق نجد أن : احتمال نجاح جمٌع الطالب ) = 0.035 : ( x = 15
𝑋=15
احتمال نجاح 8طالب ) = 0.013819 : ( x = 8
𝑋=8
𝑃
احتمال نجاح 6طالب ) = 0.000672 : ( x = 6
𝑋=6
𝑃
𝑃
Brief Notes In Biostatistics , 2011
โ ซโ ช21โ ฌโ ฌ โ ซุงุญุชู ุงู ู ุฌุงุญ ู ุงู ุทุงู ุจ ) โ ช= 0 : ( x = 0โ ฌโ ฌ
โ ซโ ช๐ =0โ ฌโ ฌ
โ ซ๐ โ ฌ โ ซุชู ุฒู ุน ุจู ู ุณู ู โ ชPoisson Distribution :โ ฌโ ฌ
โ ซู ุณุชุฎุฏู ู ุฐุง ุงู ุชู ุฒู ุน ู ุญุณุงุจ ุงุญุชู ุงู ู ุตู ู ุนุฏุฏ ู ุนู ู ุฅู ู ู ุฑู ุฒ ุงู ุฎุฏู ุฉ โ ช ุ โ ฌู ุซู ู ุงู ู ู ุฉ ุตุฑุพโ ฌ โ ซุขู ู โ ช ุ โ ฌุดุจุงู ุจู ู โ ช ุ โ ฌู ุตู ู ุนุฏุฏ ู ู ุงู ุณู ุงุฑุงุช ุงู ู ุฃู ุงู ู ุงุงู ู ุชุธุงุฑ โ ช.โ ฌโ ฌ โ ซุงู ุชู ุฒู ุน ุงู ุทุจู ุนู ุงู ู ู ุงุณู โ ช /โ ฌุงู ู ุนู ุงุฑู โ ชNormal ( Gaussian ) Distribution :โ ฌโ ฌ
โ ซโ ช1โ ฌโ ฌ โ ซโ ช2โ ฌโ ฌ โ ซโ ช3โ ฌโ ฌ โ ซโ ช4โ ฌโ ฌ โ ซโ ช5โ ฌโ ฌ โ ซโ ช6โ ฌโ ฌ โ ซโ ช7โ ฌโ ฌ
โ ซ ู ู ุงุฃู ู ุซุฑ ุงุณุชุฎุฏุงู ุง ู ู ุงู ุชู ุฒู ุน ุงู ุณู ุงู ู โ ช.โ ฌโ ฌโ ซ ุชู ุฒู ุน ู ู ุงู ุดู ู ุงู ุฌุฑุณู โ ชbell โ shapedโ ฌโ ฌโ ซ ุงู ุดู ู ู ู ู ู ู ุชู ุงุซู ุญู ู ุงู ู ุชู ุณุท โ ช ( ยตโ ฌู ู ู ุง โ ช ุ ) ยต = 0โ ฌู ุงุงู ู ุญุฑุงุพ ุงู ู ุนู ุงุฑู ู ู โ ชSDโ ฌโ ฌโ ซโ ชู / ฯ โ ฌุณุงู ู โ ช ( 1โ ฌุงุงู ู ุญุฑุงุพ ุงู ู ุนู ุงุฑู ุนุจุงุฑุฉ ุนู ุงู ู ุณุงุญุฉ ุชุญุช ุงู ู ู ุญู ู ) โ ช.โ ฌโ ฌ โ ซ ู ู ู ุฐุง ุงู ู ู ุน ุชู ู ู ุงู ุฏุงุชุง ( ุงู ู ุชุฝู ุฑุงุช ) ู ู ุชุฑุงู ู ุญู ู ู ู ู ู ุนู ู ุฉ ุฃู ุซุฑ ู ู ุงู ุชุดุงุฑู ุง ุนู ู โ ฌโ ซู ุฏู ุนุฏุฉ ู ู ู โ ช.โ ฌโ ฌ โ ซ ุงู ู ู ุชู ู ุงู ู ู ุญู ู ู ุน ุงู ู ุญู ุฑ ุงุฃู ู ู ู โ ช.โ ฌโ ฌโ ซ ู ุนุฏ ู ุงู ุง ู ู ุงุฎุชุจุงุฑ ุงุงู ู ุชุฑุงุถุงุช โ ช Hypothesis testsโ ฌู ู ุฌุงุงู ุช ุงู ุซู ุฉ โ ชConfidenceโ ฌโ ฌโ ซ) โ ช. Intervals ( C Iโ ฌโ ฌ โ ซ ู ุฏ ุชุณุชุฎุฏู ุงู ู ุนุงู ู ุฑ ุงู ุชุงู ู ุฉ ุงู ุซุจุงุช ู ู ุญุต ู ุง ุงุฐุง ู ุงู ุช ุงู ุฏุงุชุง ู ู ุฒุนุฉ ุทุจู ุนู ุง ุฃู ุฃู ู ู ุงโ ฌโ ซุงู ุดู ู ุงู ุฌุฑุณู ุงู ู ุชู ุงุซู ู ู ุนุฏู ู ุจุงุณุชุฎุฏุงู ุงู ู ุนุงู ู ุฑ ุงู ู ุฑุฆู ุฉ ู ุซู โ ช:โ ฌโ ฌ โ ซุฃโ ช .โ ฌุงู ุชู ุฒู ุน ุงู ุชู ุฑุงุฑู ู ุงู ุฑุณู ุงู ุจู ุงู ู โ ช.โ ฌโ ฌ โ ซโ ชBrief Notes In Biostatistics , 2011โ ฌโ ฌ
22 ب .المتوسط و الوسٌط ( و ٌكونان مساوٌان تقرٌبا لما هو بالتوزٌع ) . ت .اختبار كولموجوروؾ – سمٌرنوؾ : Kolmogorov – Smirnovو هذا ٌستخدم إما لمقارنة نتائج العٌنة بالمجتمع األصلً ،أو مقارنة عٌنتٌن ببعضهما ٌ ( .حدد مدى تطابق التوزٌع التكرارى المالحظ مع التوزٌع التكرارى للمجتمع األصل الذى سحبت منه العٌنة ) Sampling Distribution of the mean : و فٌها نختار عٌنة عشوائٌة او أكثر من المجتمع ( بحٌث تكون العٌنات متساوٌة تقرٌبا فً الحجم و نفس المجتمع ) .و وارد أن ٌختلؾ متوسط العٌنات المأخوذة عن المتوسط األصلً للمجتمع . µ ( Sample Meanتوزٌع عٌنة المتوسطات ) :و هً مجموعة المتوسطات التً تحصل علٌها من كل العٌنات العشوائٌة الممكنة من المجتمع . ( Sample Distributionتوزٌع العٌنة ) :و هو توزٌع االحصاءات التً نحصل علٌها باختٌار كل العٌنات الممكنة من المجتمع . مثال :بفرض أن لدٌنا مجتمع ٌتكون من 4درجات ، 2 , 4 , 6 , 8و أردنا اختٌار العٌنات التً ٌمكننا الحصول علٌها من هذا المجتمع على أن تشمل كل عٌنة درجتٌن . متوسط درجات العٌنة 2 3 4 5 3 4 5 6 4 5 6 7 5 6 7 8
الدرجات لكل عٌنة األولى الثانٌة 2 4 6 8 2 4 6 8 2 4 6 8 2 4 6 8
العٌنة رقم .. 2 2 2 2 4 4 4 4 6 6 6 6 8 8 8 8
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Brief Notes In Biostatistics , 2011
23
ٌالحظ هنا أن متوسطات العٌنات تتجه إلى التمركز والتجمع حول متوسط المجتمع ( ) 5وهذه المتوسطات المتجمعة حول المتوسط هى التى تمثل عٌنات المجتمع الذى سحبت منه . ) Standard Error of the Mean ( SEMاالنحراؾ /الخطأ المعٌاري لتوزٌع المتوسطات :و ٌنتج نتٌجة وجود فرقا بٌن " المتوسط األصلً " للمجتمع ،و المتوسطات للعٌنات المأخوذة منه .لذا دعت الحاجة لتحدٌده و حساب أدق انحراؾ معٌاري . SD , n = sample size
𝜎 𝑛
= 𝑥𝜎
فترة /مجال الثقة Confidence Intervals C. I. : هو عبارة عن مدى من القٌم العددٌة التً ٌحتمل بنسبة معٌنة أن تقع داخل قٌم بارامٌتر المجتمع . فلو فرضنا أن مستوى الداللة ( نسبة الشك ) ، 0.01فٌكون مجال الثقة 0.99أي ، %99و لو كان مستوى الشك 0.05فٌكون مجال الثقة . %95 ما معنى أن مستوى الداللة 0.05؟ معناه أنه اذا أجري بحث و تبعه عدة بحوث متماثلة للبحث األول و على عٌنات من نفس الحجم ،فإن احتمال تكرر نفس نتائج هذه البحوث لنتٌجة البحث األول = ، % 95و احتمال أن تختلؾ هو . % 5 تبٌن أن النسبة األكثر استخداما فً البحوث الطبٌة medical literaturesهً ، 95% C Iو قد تكون %90أو . % 99 لو فرض بأن مستوى الداللة االحصائٌة ( مستوى الشك ) ، % 32و أردنا تمثٌل مستوى الثقة له ( = ) % 68على التوزٌع الطبٌعً المعٌاري ٌ ،كون كالتالً :
Brief Notes In Biostatistics , 2011
24
و لو فرضنا بأن مستوى الشك هو ، % 5فإن مستوى الثقة سٌكون ، % 95و بتمثٌله على المنحنى السابق نجد أن مستوى الثقة ٌكون كالتالً : ) C I 95% = µ ± ( 1.96 X SEM و منه نجد ان الحد األدنى لفترة الثقة = ) SEM X 1.96 ( - µ و أن الحد االعلى لفترة الثقة = ) SEM X 1.96 ( + µ و ما بٌن هذٌن الحدٌن تكون هناك عدة قٌم ،نثق بنسبة % 95أن ٌكون من بٌنها بارامٌتر األصل ( المجتمع ) . مثال :احسب فترة الثقة عند مستوى داللة 0.05لمتوسط قٌمته 29.6اذا علمت ان الخطأ المعٌاري للمتوسط هو . 1.5 اذا ٌكون الحد األدنى = 26.7 = ) 1.5 X 1.96 ( – 29.6 و ٌكون الحد األعلى = 32.5 = ) 1.5 X 1.96 ( + 29.6 و منه ،نقول أن فترة الثقة هً 26.7 :إلى 32.5
Brief Notes In Biostatistics , 2011
25 اذا :نثق بنسبة % 95أن قٌمة متوسط األصل الكلً ( المجتمع المأخوذ عنه العٌنة ) تقع داخل فترة الثقة السابقة ( 26.7إلى . ) 32.5 مالحظة :فً حالة ما اذا كان نسبة الثقة المطلوبة هً ، % 99و بتطبٌق ذلك على ما سبق ، نجد أن : ) C I 99% = µ ± ( 2.58 X SEM و بتطبٌق ذلك على المثال السابق ( أي عند مستوى داللة 0.01و مستوى ثقة : ) 0.99 الحد األدنى = 25.7 = ) 1.5 X 2.58 ( – 29.6 الحد األعلى = 33.5 = ) 1.5 X 2.58 ( + 29.6 اذا نثق بنسبة % 99أن قٌمة متوسط األصل الكلً ٌقع داخل فترة الثقة 33.5 – 25.7 و من المثالٌن السابقٌن ٌتضح اآلتً : - 1انه كلما زاد مستوى الثقة ( ، ) % 99 % 95زاد طول فترة الثقة ( 32.5 ، 26.7 ) . ) 33.5 ، 25.7 ( - 2كلما زاد الخطأ المعٌاري ، SEMزاد اتساع فترة الثقة أٌضا . حوظَح نمسأنت مجبل انثقت : ) new drugعلى بفرض أنه تم سحب عٌنة من مجتمع للمقارنة بٌن تأثٌر دواء " أ " ( مجموعة ، GP1و تأثٌر دواء " ب " ( ) placebo or usual drugعلى مجموعة ، GP2 و بعد اتباع خطوات البحث و ظهور القراءات ، readingsو بحساب الوسٌط للمجموعتٌن : For GP1 : 𝒙1 ± SD , For GP2 : 𝒙2 ± SD و طبقا لنوع الداتا فً هذه التجربة ٌ ،ستخدم الباحث الـ ( t-testسٌأتً شرحه تباعا ) و ذلك للمقارنة بٌن وسٌطً المجموعتٌن و تكون صورة المقارنة ( mean of comparisonبؽض النظر عن الـ ) SDإما على هٌئة : طرح ( 𝒙1 − 𝒙2 :و قد ٌكون مجال الثقة ٌحتوي على zeroو فً هذه الحالة ٌمكن القول بأن البحث statistically non significance :و ذلك ألنه فً هذه الحالة ٌكون هناك احتماال ؼٌر مرؼوب فٌه بأن تأثٌر الدوائٌن متشابهٌن ) قسمة ( 𝒙1/𝒙2 :و قد ٌكون مجال الثقة هنا ٌحتوي على ، 1و فً هذه الحالة ٌمكن القول بأن البحث statistically non significance :و ذلك ألنه فً هذه الحالة ٌكون هناك احتماال ؼٌر مرؼوب فٌه بأن تأثٌر الدوائٌن متشابهٌن ) .
Brief Notes In Biostatistics , 2011
26 على باقً المجتمعGeneralized و من المفترض أن تعمم النتٌجة النهائٌة للعٌنة و قد ٌنتج عن هذا التعمٌم خطأ بسٌط فً الـ، و ذلك من خالل حساب مجال الثقةPopulation . SEM ٌتحدد بما ٌسمى بـSD
Hypothesis Tests اخخببراث انفزظَت
Type of variables Continous Normally distributed
( 4 parametric tests ) classified according to the No of groups
Discrete Abnorm ally Distribu ted
Ordinal
nonparametric
nonpar ametric
( 4 tests )
2 groups
Other 4 Tests
3 or more groups 2 groups
independent كالهما مستقلٌن و ؼٌر معتمدٌن على بعضهما
dependent معتمدٌن على بعضهما
independent كالهما مستقلٌن و ؼٌر معتمدٌن على بعضهما
3 or more groups
dependent معتمدٌن على بعضهما
independent كالهما مستقلٌن و ؼٌر معتمدٌن على بعضهما
dependent معتمدٌن على بعضهما
independent كالهما مستقلٌن و ؼٌر معتمدٌن على بعضهما
dependent معتمدٌن على بعضهما
. مثل مقارنة داتا لمجموعتٌن ؼٌر مرتبطتٌن ببعض: Independent 2 groups مثال لـ مثل مقارنة داتا ( ضؽط الدم ) لنفس المجموعة مرة قبل: dependent 2 groups مثال لـ . العالج و أخرى بعد العالج Parametric tests ( for Normally Distributed Continuous DATA ) : 1- Student t-test ( samples of 2 groups ) : a- One sample test : compares the mean of the study sample with the population mean . Group 1 mean Known population mean b- Two samples , independent samples or unpaired test : compares the means of 2 independent samples . Group 1 Group 2 Brief Notes In Biostatistics , 2011
nomina l
27 c- Two samples , dependent samples or paired test : compares the means of paired , matched dependent samples . Group 1 Measurement 1 Measurement 1 2- Analysis of variance ( ANOVA ) ( samples of 3 or more groups ) : a- One way ( single factor ) ANOVA : compares means of 3 or more groups . Young Gp1 Gp2 Gp3 b- Two way ( two factors ) ANOVA : additional factor is added . Young Gp1 Gp2 Gp3 Elderly Gp1 Gp2 Gp3 c- Repeated measures ANOVA : used for dependent ,related samples tests , extension of paired t-test . Related Measurements Young ( GP1 ) Measurement Measurement Measurement 1 2 3 Non-Parametric tests ( for Abnormally Distributed Continuous & Ordinal Discrete DATA ) : 1- Tests for independent samples : a- Wilcoxon rank sum & Mann – Whitney U-test ( for samples of 2 groups ) . b- Kruskal-Wallis one way ANOVA by ranks ( for samples of 3 or more groups ) . 2- Tests for dependent or paired samples : a- Sign test & Wilcoxon signed rank ( for samples of 2 groups ) . b- Friedman ANOVA by ranks ( for samples of 3 or more groups ) .
Brief Notes In Biostatistics , 2011
28 Non-Parametric tests ( for Nominal Discrete DATA ) : 1- Chi-square ( X2 ) test : ( for 2 independent samples ) . 2- Fisher exact test : use of chi square test for small groups containing less than 5 observations . 3- McNemar : for dependent or paired samples . 4- Mantel-Haenszel : controls for the influence of confounders . توضٌح :مع أي بحث ٌ ،كون لدى الباحث نتٌجتٌن أثناء البحث ( Observed Result ،و هً األرقام التً تالحظها أثناء البحث ) ،و ( Expected Resultsو هً النتائج التً ٌتوقعها الباحث ) . مثال : Diseased Non diseased Male 3 2 Female 4 5 فً مثل هذه الحالة قد نجد أن عدد الـ observationsأقل من الرقم ( 5بما ٌعنً small ، ) sample sizeو فً هذه الحالة نظرا ألن حجم العٌنة صؽٌر ،من الممكن ان تستخدم اختبار كاي تربٌع ،لكن و لدقة أكبر مع حجم العٌنة الصؽٌر ٌ ،فضل استخدام اختبار فٌشر ( و هو نوع من اختبار كاي تربٌع ) ،و ٌشترط فً اختباري كاي تربٌع و فٌشر أن تكون الخالٌا ( الموجودة فً الجدول ) بما ٌعرؾ بأنها ( mutual exclusiveبمعنى أنه ال ٌجوز تصنٌؾ الفرد الواحد فً أكثر من خلٌة ،فمثال ال ٌجوز أن تصنؾ ذكرا فً المثال السابق فً خلٌة الـ diseasedو تصنؾ نفس الذكر فً خلٌة الـ . ) non diseasedاما فً حالة وجود أكثر من تصنٌؾ لنفس العٌنة ال ٌصلح استخدام اختباري كاي تربٌع و فٌشر ،و لكن ٌمكن استخدام اختبار ماك نٌمار كما فً المثال اآلتً الذي قد تجد فٌه الشخص الواحد مصنؾ فً أكثر من خانة ( : ) Renal &or Hepatic Normal Renal Hepatic Male 3 5 1 Female 2 4 3 فً بعض الدراسات ،و مع الداتا المتاحة ،قد توجد بعض العوامل المؤثرة على العالقة محل البحث ،فمثال لو كان البحث عبارة عن دراسة العالقة بٌن ، Lung cancer & Smokingفإن أحد طرفً هذه العالقة ( ٌ ) Lung Cancerتأثر بعدة عوامل أخرى ( ) multifactorial ؼٌر الطرؾ اآلخر فً العالقة و هو التدخٌن ،و مثل هذه العوامل مثال السن ،النوع ،تناول كافٌٌن ....الخ ،و قد ٌكون من بٌن هذه العوامل ما له عالقة أٌضا بالطرؾ اآلخر من العالقة محل البحث ،و هذه العوامل تسمى بالـ ، confoundersو ٌجب على الباحث هنا تحٌٌدها و تثبٌتهم كً ٌحصل على أدق النتائج ،و فً مثل هذه األبحاث الٌصلح من ضمن تجارب االفتراضات سوى اختبار مانتٌل هانزٌل . Mantel-Haenszel Brief Notes In Biostatistics , 2011
29 ٍىبغٌ ان وىوي أن هىبك فزقب بَه : - 1االفتراضات : assumptionsهً جمل خبرٌة أو تقرٌرٌة عن ظروؾ أو وقائع أو أحداث بالمجتمع تبدو صحٌحة ومنطقٌة ،وال تحتاج لبرهنة ,وهى هامة كشروط للعملٌات واالختبارات اإلحصائٌة . - 2الفروض : hypothesisهً جمل خبرٌة أو تقرٌرٌة عن ظروؾ أو وقائع أو أحداث بالمجتمع .تحتاج إلى إختبارها وتستخدم العملٌات اإلحصائٌة الختبار وتحدٌد احتمال صحتها أو صدقها . ٌعرؾ الفرض بأنه حدس جدٌد حول واحد أو أكثر من بارامترات المجتمع .ومن خالل بٌانات العٌنة ٌختبر الباحث حدسه . مثال :اختار باحث عٌنة متناسقة من مجتمع ( وسطه مثال ، µ = 18و انحرافه المعٌاري = σ 4مثال ) .ثم قام بدراسة تأثٌر عقار ما على العٌنة ،و هنا إما أن ٌكون تأثٌر العالج :إما بالسلب أو باإلٌجاب أو أنه بال تأثٌر .
( ٌ ) 1الحظ هنا أن االنحراؾ المعٌاري لم ٌتأثر ( ألنه ال ٌتأثر بإضافة أو طرح أي مقدار ثابت = تأثٌر العالج ) . ( ) 2االختالؾ هنا هو ما قد ٌطرأ من زٌادة او نقصان أو عدم تأثر متوسط الدرجات لنتٌجة العالج µ ( ) 3و هنا الختبار الفروض قوم الباحث بصٌاؼة الفروض عن المتوسط ؼٌر المعلوم للمجتمع ،وفى هذه الحالة ٌمكن للباحث أن ٌفترض : - 1أن المعالجة لٌس لها أثر ،وهذا "فرضه" ٌعنً أن متوسط المجتمع بعد المعالجة هو نفسه متوسط المجتمع األصلى ( قبل العالج ) . Brief Notes In Biostatistics , 2011
30 - 2أو ٌفرض أن المعالجة سوؾ تزٌد درجات كل فرد 10درجات ،ولذلك ٌزٌد متوسط المجتمع المعالج بمقدار ( ) 10درجات عن متوسط المجتمع األصل . وفى بعض األحٌان ٌكون لدى الباحث دلٌل قوى ٌجعله ٌثق فى النتائج الخاصة باختبار الفرض ولكنه ال ٌكون متأكد تماما من النتٌجة ،وقد ٌكون الدلٌل خاطئ وأن الباحث سوؾ ٌصل إلى نتٌجة خاطئة .ولذلك ٌجب على الباحث أن ٌحدد لنفسه " مستوى من الثقة " ،وأخر مكمل له من الخطأ " مستوى الشك /الداللة " . خطوات اختبار الفرض : - 1صٌاؼة الفروض :الفرض الصفري Null Hypothesis Hoأو الفرض البدٌل . Alternative Hypothesis Ha ٌقوم الباحث بفرض فرضٌن متضادٌن بداللة بارامتر المجتمع : فرض العدم ( الفرض الصفري ) ٌ : Null Hypothesis Hoعنً انه ال توجد فروق " واضحة " significantبٌن نتائج التجارب المتعددة للمجموعة أو العٌنة الواحدة ،أو بٌن نتائج عدة مجموعات بٌن بعضها . الفرض البدٌل : Alternative Hypothesis Haهو الفرض البدٌل فً حالة رفض الفرض الصفري ،و ٌعنً أنه توجد فروق واضحة بٌن نتائج التجارب المتعددة للمجموعة أو العٌنة الواحدة ،أو بٌن نتائج عدة مجموعات بٌن بعضها . و الفرض البدٌل إما أن ٌكون One tailedأو . Two tailed مثال : نفرض أن متوسط درجات الطالب بالجامعة ،فى اختبار القدرات العقلٌة µ=455 واخترنا عٌنة من هذا المجتمع متوسطها 𝒙 .فإذا أردنا تحدٌد مدى تمثٌل هذه العٌنة لمجتمعها ،فإننا نحدد الفرق بٌن القٌمة المفترضة لمتوسط المجتمع µومتوسط العٌنة 𝒙 التى سحبت منه . فإذا كان الفرق كبٌر جدا فإننا نرفض الفرض الصفري و نأخذ بالفرض البدٌل و إذا كان الفرق صؽٌر جدا فإننا نقبل الفرض الصفري .
و فً المثال السابق : ٌ - 1صاغ الفرض الصفري على أنه 455 = µ : Ho : ٌ - 2صاغ الفرض البدٌل على انه إما : ٌسمى اختبار الفرض ذو الطرفٌن ( الفرض ؼٌر الموجه ) Ha : µ ≠ 455 ٌسمى اختبار الطرؾ الواحد " األٌمن " ( الفرض الموجه ) Ha : µ > 455 Brief Notes In Biostatistics , 2011
31 ٌسمى اختبار الطرؾ الواحد " األٌسر " ( الفرض الموجه ) Ha : µ < 455 و ٌالحظ أن اختبارات الفروض تعتمد على بٌانات العٌنة و االختبار االحصائً المستخدم فً اختبارات الفروض . - 2اختبار مستوى الداللة ( Level of Significance ) αالذي ٌحدد احتمال الخطا أو المخاطرة فً اتخاذ القرار برفض فرض صفري صحٌح فً الواقع ( false positive ) .و بما ٌعنً انه هام لتحدٌد مقدار الفرق بٌن احصاء العٌنة 𝒙 و بارامٌتر المجتمع µ . فلو افترضنا اننا اخترنا عٌنة عشوائٌة حجمها 144طالبا من المثال السابق ،و حسبنا متوسط درجاتهم فكان 𝒙 = 535 و انسإال هىب :هم انفزق بَه مخوسط انعَىت 535و مخوسط انمجخمع األصهٌ 455 كبف نزفط انفزض انصفزً ؟ و نإلجببت عهي هذا انخسبؤل البذ أن ٍإخذ فٌ االعخببر " أخطبء اخخببر انفزض " و " مسخوى انذالنت " .
عندما نقرر رفض أو عدم رفض الفرض الصفرى ،توجد أربعة مواقؾ محتملة: -1رفض الفرض الصفرى وهو صحٌح فى الواقع .مثل توصل الباحث إلى وجود تأثٌر للمعالجة ،بٌنما ال ٌوجد أثر للمعالجة فى الحقٌقة ,وهذا ما ٌسمى خطأ النوع األول ( )Iوالذى ٌسمى مستوى الداللة ،وٌرمز الحتمال حدوثه بالرمز . α -2عدم رفض الفرض الصفرى وهو صحٌح فى الواقع .وهذا ٌعتبر قرار صحٌح ومناسب. -3عدم رفض الفرض الصفرى وهو خاطئ فى الواقع .مثل عدم توصل الباحث لوجود دلٌل على تأثٌر للمعالجة ،وبٌنما ٌوجد فى الحقٌقة تأثٌر المعالجة وهذا ما ٌسمى خطأ النوع الثانى ( )Pوٌرمز الحتمال حدوثه بالرمز . β -4رفض فرض صفرى وهو خاطئ فى الواقع .وهذا ٌعتبر قرار صحٌح ومناسب ، وٌسمى بقوة االختبار اإلحصائى ,وهو ٌساوى ) . ( 1 – β والجدول التالى ٌوضح االحتماالت األربعة للقرار اإلحصائى الخاص باختبار الفرض .
Brief Notes In Biostatistics , 2011
32
- 3اختٌار االختبار االحصائً المناسب . - 4تحدٌد القٌمة الحرجة : Critical Valueلتحدٌد أقصى مدى لبٌانات العٌنة الالزمة الستبعاد الفرض الصفري . - 5اتخاذ قرار حول الفرض الصفرى وذلك بمقارنة قٌمة إحصاء االختبار االحصائى المالحظ أو المحسوب ،بالقٌمة الحرجة . حوظَح بسَط نـ : P-Value ، null hypothesisفمثال عند الباحث فً األساس ٌبدأ بحثه كما تقدم بفرض العدم المقارنة بٌن تأثٌر دواء " أ " و دواء " ب " ،فاألصل أن ٌفترض الباحث أن تأثٌرهما متساو ما لم ٌثبت البحث خالؾ ذلك ( و هذا هو الفرض الصفري أو فرض العدم ) ،ألن الباحث لو فرض بأن تأثٌر دواء " أ " سٌكون أفضل من دواء " ب " ،فإن هذا ٌعد انحٌازا ؼٌر مقبول biasو قد ٌتهم الباحث بانه ممول من جهة ما ،و بعد نهاٌة البحث و عند تقٌٌمه ،تتم مقارنة الفرض األصلً للباحث بنتٌجة البحث على النحو التالً : True Ho False Ho Accept Ho Right Decision ) Error ( Type 2 = β Reject Ho ) Error ( Type 1 = α Right Decision و توضٌحا لـ = : α Type 1ففً األصل أن المتهم بريء حتى تثبت إدانته ،و حتى تثبت إدانته ٌتبع القاضً الخطوات ،فلو كان فرض القاضً و حكمه هو اإلعدام ،و ثبتت بعد ذلك البراءة ،فهذا ٌكون الخطأ من النوع األول ( أي أن هناك خطأ فً طرٌقة البحث ) methodologyو لذلك نحتاج للـ P-Valueلقٌاس الـ . αType 1فمثال لو كانت قٌمة الـ ، 0.003 = P-Valueفهذا ٌعنً أن عدد مرات حدوث الخطأ من النوع األول statistically ألفا = 3لكل 100مرة أجري فٌها نفس البحث ،و هذه النسبة تعتبر ( significantألن أقصى قٌمة مسموح بها فً األؼلب لـ P-Valueهً أال تزٌد عن ، %5اما لو زادت فإن البحث ٌعتبر . ) statistically non significant و بالنسبة فً حال وجود خطأ من النوع الثانً بٌتا :فهذا ٌعنً أن حجم العٌنة ؼٌر كاؾ . unpowered sample Brief Notes In Biostatistics , 2011
33 Correlation & Regression هناك أنواعا من بعض األبحاث ٌحتاج الباحث فٌها الوصول لهدؾ معٌن objectو ٌخضع البحث لظروؾ خاصة ،و ال تجدي مع الباحث اختبارات الفرضٌة التً تم شرحها ،و إنما ٌقوم الباحث بعمل : 1- Correlation & Regression . 2- Survival Analysis . مثال :المرٌض المحجوز بعنبر الحروق ال ٌستطٌع الحركة non ambulatoryو ٌخشى على المرٌض فً مثل هذه الحاالت من أن ٌصبح ، hypercoagulatedو فً هذه الحالة ٌعطى prophylactic anticoagulantمثل ( Enoxaparineمثل كلكسان ) ،و تبٌن أن الجرعة العادٌة usual prophylactic doseال تكفً فً مثل هذه الحالت ،إذ تبٌن أنه كلما زادت مساحة الحرق ٌ ،حتاج المرٌض لجرعة أكبر ،و تعد هذه مشكلة لحالة استثنائٌة ( طارئة ) فً اإلحصاء الحٌوي ،ذلك للحاجة الى دراسة العالقة بٌن " مساحة الحرق " و " جرعة الدواء " .و فً مثل هذه الحالة ٌقوم الباحث بعمل : 1- Correlation & Regression . 2- Survival Analysis . بمعنى أنه ٌنبؽً على الباحث التأكد من وجود ارتباط حقٌقً associationبٌن المتؽٌرٌن ( مساحة الحرق و جرعة الدواء ) ،و هذا ما ٌسمى بـ . correlation ثم لو تبٌن وجود ارتباط حقٌقً بٌنهما ،إذا فمن الممكن أن ٌتنبأ الباحث predictبالجرعة طبقا لمساحة الحرق ،و هذا ما ٌسمى بـ . regression ٌقوم البحث برسم scatter plotكما هو مبٌن :
Brief Notes In Biostatistics , 2011
34
Correlation coefficient ( R )
Brief Notes In Biostatistics , 2011
35
( strong correlation و ٌشترط فً هذه الخطوة وجودregression ثم ٌتبع ذلك خطوة الـ line of بعد رسمregression و هنا ٌمكن التنبؤ و استخدام الـ، ) R ≥ ± 0.7 up to ± 1 : correlation
Brief Notes In Biostatistics , 2011
36
و طبقا لمعادلة الخط المستقٌم : ) Y1 = intercept + slope ( X1 و ٌمكننا من هذه المعادلة أن نتنبأ بالجرعة Yمع أي مساحة من الحرق X و فً المثال الذي نتحدث عنه وجد أنه : ) Y = 45 + slope ( X و معنى ذلك أنه ال ٌمكن اعطاء المرٌض جرعة تقل عن . ) prophylactic dose
( 45و هً أكبر من الـ
usual
تأتً بعد ذلك الـ . survival analysis
Brief Notes In Biostatistics , 2011
37 Survival Analysis هناك عادة طرٌقتٌن لحساب الـ ( anticoagulant efficacyكما فً المثال السابق ) إما : بحساب الـ serum concentrationأو بحساب الوقت الذي ٌستؽرقه المرٌض لحٌن وقت حدوث الجلطة ( او احتمال عدم حدوثها ) ، بما ٌعنً قدرة تحمل المرٌض على التحمل . إذا ،فالـ ٌ survival analysisجمع بٌن two variables : time & No. of patients و هذا ٌتم إما على دواء واحد ( عبر اختبار كابالن ، ) Kaplan أو لمقارنة دوائٌن ببعضهما ( عبر اختبار ، ) Long rank و لو أخذت الـ confoundersفً االعتبار نستخدم النوع الثالث من اختبارات الـ survival analysisو هو اختبار كوكس . Cox
Brief Notes In Biostatistics , 2011
38
Papers ACCP, Pharmacotherapy, American Board 2011. Biostatistics, Prof. Dr. Mohammad Ismaiel Hamed, Colleague of Pharmacy, 6th of October university . An Introduction to Biostatistics, Dr. Hassan Salah M., PhD. in biostatistics, Colleague of Pharmacy, 6th of October university. Illustrated Biostatistics, Dr. Mohammad ElMetwally Mawsely , iLearn and Andaluseya Medical Company . Illustrated Biostatistics, Dr. Emad Ezzat , PDipBiostat , Ain Shams University. معهد الدراسات و البحوث، أمانً موسى محمد.د. أ، التحلٌل اإلحصائً للبٌانات . جامعة القاهرة، اإلحصائٌة
Websites http://mansvu.mans.edu.eg/sites/NEW%20SITE/index.htm Online simple illustration of biostatistics and study design: http://www.youtube.com/user/scfhs2012
Others
Brief Notes In Biostatistics , 2011