TIHOMIR BABIĆ HINT, Zagreb tbabic@hint.hr ANTUN BENČIĆ HINT, Zagreb antun.bencic@inet.hr
PRIMJENA STATISTIČKIH METODA U ISPITNIM I UMJERNIM LABORATORIJIMA Sažetak Pri mjerenjima je uvijek prisutno rasipanje mjernih rezultata. Zbog toga je uz vrijednost mjerne veličine potrebno navesti mjernu nesigurnost i pripadajuću razinu povjerenja, odnosno faktor prekrivanja k. Rasipanje mjernih rezultata događa se u ispitnim i umjernim laboratorijima gdje su neke utjecajne veličine pod kontrolom, kao što su okolišni uvjeti u laboratoriju, uzorkovanje, pohrana uzoraka, transport mjerila i uzoraka, nesigurnost koju unosi mjerilo, no ipak utječu na rasipanje mjernih rezultata. Zbog svega toga, mjerni rezultati su kod dobro odabrane mjerne metode i mjerila uvijek intervalne veličine. Njihova se vrijednost iskazuje statistikom centralne tendencije primjenom odgovarajućih statističkih metoda. Najčešće statističke metode koje se primjenjuju u ispitnim i umjernim laboratorijima su opisna statistika, analiza vremenskih serija, analiza varijanci i regresijska analiza. U radu je dan kratak pregled navedenih statističkih metoda, njihova ograničenja i testiranje značajnosti. Te se statističke metode primjenjuju za dobivanje mjernog rezultata i procjenu mjerne nesigurnosti, što je ujedno i jedan od zahtjeva norme HRN EN ISO/IEC 17025:2007. Ključne riječi: ispitni i umjerni laboratoriji, statističke metode centralne tendencije, procjena mjerne nesigurnosti, HRN EN ISO/IEC 17025:2007.
1. UVOD Ispitni ili umjerni laboratorij, nakon obično ponovljenih mjerenja, mora iskazati mjerni rezultat. Mjerni rezultat mora sadržavati dobivenu vrijednost i iskaz o mjernoj nesigurnosti. Kod toga se služi normom koja propisuje određeno mjerenje. U normi su obično dani naputci za prikaz dobivenog rezultata, a u novije vrijeme i postupak procjene mjerne nesigurnosti. Za razumijevanje pozadine postupka potrebno je znanje statistike, tj. primjene statističkih alata i metoda. U većini slučajeva dovoljno je samo znanje opisne statistike i tumačenje izračunatih statistika. Cilj norme HRN EN ISO/IEC 17025 nije samo osiguranje sljedivosti mjernog rezultata, iskazivanje mjerne nesigurnosti (točnosti mjernog postupka), ponovljivost i obnovljivost mjernog rezultata već i kvalitetno upravljanje cjelokupnim radom laboratorija. Kvalitetan rad laboratorija podrazumijeva upravljanje sustavom kvalitete, resursima (ljudi, mjerna oprema, prostorije), upravljanje okolišem, zaštita na radu, upravljanje nesukladnostima, popravnim i preventivnim radnjama. Rezultati analiza navedenih aktivnosti su ulazne podloge za ocjenu Uprave, na kojoj se donose zaključci o politikama laboratorija, potrebi promjene dugoročnih ciljeva kvalitete, određuju se kratkoročni ciljevi kvalitete,
usvajaju planovi edukacije, umjeravanja i održavanja mjerne opreme, plan nabavke, osiguranja resursa, poboljšanja i dr. Za obradu podataka primjenuju se statističke metode. Poznavanje i primjena statističkih metoda omogućuje utvrđivanje bitnih značajki koje skrivaju mnogobrojni podaci, kao npr. rasipanje podataka oko aritmetičke sredine, međusobnu povezanost pojedinih pojava (mjernih veličina), trendove promjena, testiranje hipoteza o pojedinim tvrdnjama važnim za donošenje zaključka o primjerenosti provedenih analiza. Ispitni i umjerni laboratoriji u svom radu mogu, u raznim prilikama, primijeniti slijedeće statističke metode, ali ne i samo ove: a) u području obrade mjernog rezultata i analize podataka 1. opisnu statistiku 2. vjerojatnost b) u području odlučivanja: 3. analizu vremenskih nizova 4. regresiju i korelaciju 5. testiranje hipoteze 6. uzorkovanje. Pretpostavljajući da danas svaki laboratorij koristi informatičku tehnologiju i da je svakom djelatniku laboratorija dostupan programski paket EXCEL, svi prikazi primjene statističkih metoda temelje se na primjeni tog programa. 2. STATISTIČKE METODE 2.1 Opisna statistika Opisna statistika je dio statistike koja se bavi prikupljanjem, selektiranjem, prikazom, sažimanjem i tumačenjem podataka, kao i tumačenjem rezultata statističkih obrada provedenih nad tim podacima. Podatke možemo prikazati tabelarno ili grafički. Prikazivanje svih podataka u jednoj tablici otežava uočavanje bitnih podataka i njihovih svojstava. U cilju smanjenja broja podataka pristupa se sortiranju podataka i prebrojavanju učestalosti pojavljivanja pojedinog podatka. Na taj način se najčešće bitno smanji broj podataka i već se mogu lakše uočiti tendencije okupljanja podataka oko neke konkretne vrijednosti. Vidi se raspon podataka, R = MAX – MIN. Obično je takav tablični prikaz nepregledan. Za dobivanje jasnije slike o skupu podataka pristupa se razvrstavanju podataka u nekoliko razreda i prebrojavanju učestalosti podataka u svakom razredu. Preporučeni broj razreda je od 5 do 11. Neparni broj razreda omogućuje lakše uočavanje simetričnosti razdiobe frekvencija podataka. Grafički prikaz tako sređenih podataka naziva se histogram. Grafički prikaz obrađenih podataka donosi najviše informacija. Podaci se obično prikazuju linijskim dijagramom, stupčastim dijagramom, dijagramom udjela (torta) i petoparametarskim dijagramom (Box&Wiskers). Postupci grafičkog prikaza podataka poznati su i masovno se primjenjuju. Nažalost, EXCEL ne pruža mogućnost izravnog crtanja petoparametarskog dijagrama (eng. Box&Wiskers). To se može izraditi zaobilaznim postupkom.
a)
b)
c)
d)
Slika 1. a) linijski dijagram, b) stupčasti dijagram, c) dijagram udjela (torta), d) petoparametarski dijagram. Drugi način sažimanja podataka je izračun statistika. Obično nas ne zanimaju pojedinačni mjerni rezultati već pojedine statistike koje predstavljaju mjeru centralne tendencije ili mjeru varijabilnosti podataka. Kao mjere centralne tendencije obično se koriste: aritmetička sredina (prosjek, očekivanje) [(AVERAGE (podaci)] medijan [MEDIAN (podaci)] mod [MODE(podaci)] geometrijska sredina [GEOMEAN(podaci)] harmonijska sredina. [HARMEAN(podaci)] Mjere centralne tendencije su: raspon R = MAX(podaci) – MIN(podaci) varijanca [VAR(podaci)] standardno odstupanje [STDEV(podaci)] percentili [PERCENTILE(podaci; k)], za percentil 10% k je 0,1 kvartili QUARTILE(podaci;k)], za prvi kvartil k je 1, a za treći 3 koeficijent varijacije V = [AVERAGE(podaci) / STDEV(podaci)]*100 . Postupak računanja ovih statistika u programskom paketu EXCEL je jednostavan. U meniju Formulas izabere se podmeni fx Insert function, zatim se u otvorenom dijalog prozoru u ćeliji Select a category izabere Statistics, a u padajućem meniju Select a function izabere se željena funkcija. Automatski se otvori dijalog prozor u koji se unesu traženi podaci.
2.2 Korelacija Korelacija je mjera povezanosti između dvije slučajne varijable. U procjeni mjerne nesigurnosti potrebno je utvrditi postoji li povezanost između dvije varijable koje utječu na varijabilnost mjernog rezultata. Kada su ulazne veličine korelirane u obzir se moraju uzeti i kovarijantni članovi. 2
N −1 N ⎛ ∂f ⎞ 2 ∂f ∂f u ( y) = ∑ ⎜ u ( x ) ⋅ + ⋅ ⋅ ⋅ u( xi ,x j ) 2 ⎟ ∑ ∑ i i =1 ⎝ ∂xi ⎠ i =1 j = i +1 ∂xi ∂x j 2 c
N
Kovarijanca dviju slučajnih veličina je mjera njihove uzajamne povezanosti. Iskazuje se Pearson-ovim koeficijentom korelacije r: u( xi ,x j ) = r( xi ,x j ) ⋅ u( xi ) ⋅ u( x j ) U EXCEL-u Pearson-ov koeficijent korelacije računa se pomoću funkcije PEARSON (X;Y) ili pomoću funkcije CORREL(X;Y). Kod toga treba imati na umu, uvjet za računanje Pearson-ovog koeficijenta korelacije je da obje slučajne varijable slijede normalnu razdiobu. Zato bi prije toga trebalo testirati podatke na normalnost. U EXCEL-u se to može učiniti računanjem koeficijenta simetričnosti [funkcija SKEW(podaci)] i koeficijenta zaobljenosti [funkcija KURT(podaci)]. Kad su obje vrijednosti blizu ništice slučajna veličina slijedi normalnu razdiobu. U slučaju kada varijable ne slijede normalnu razdiobu, koeficijent korelacije računa se pomoću Spearman-ovog rang koeficijenta korelacije ρ N
ρ =1−6⋅
∑d i =1
2 i
n3 − n
,
gdje je: di - razlika rangova i-tog para podataka, n – broj parova podataka. Nažalost, u EXCEL-u nije programirana Spearmanova funkcija i treba je računati korak po korak. Podaci svake varijable moraju se rangirati. Ako se neke vrijednosti ponavljaju onda se računa njihov srednji rang. 2.3 Analiza vremenskih serija Analiza vremenskih serija može se primijeniti u umjernim i ispitnim laboratorijima za praćenje pokazatelja uspješnosti rada laboratorija, za praćenje trendova i za predviđanja izvršenja nekih planskih zadataka. Praćenje pokazatelja laboratorija moguće je grafičkim prikazom ili preko verižnih ili baznih indeksa. Za grafički prikaz vremenske serije podataka koristi se linijski i stupčani dijagram. Verižni indeks je definiran kao odnos tekuće vrijednosti pojave prema vrijednosti pojave u prethodnom razdoblju
Vt =
Yt ⋅ 100 , Yt −1
t = 1 ,2 ,...,N
gdje je: Vt - verižni indeks u trenutku t, Yt - vrijednost pojave u trenutku t, Yt-1 – vrijednost pojave u prethodnom vremenskom razdoblju t-1.
Slika 2. Linijski i stupčani dijagram vremenske serije podataka Verižni indeks pokazuje za koliki postotak se vrijednost pojave promijenila u odnosu na prethodno razdoblje. Bazni indeks je definiran kao odnos tekuće vrijednost pojave prema vrijednosti pojave u baznom razdoblju
It =
Yt ⋅ 100 , Yb
t = 1 ,2 ,...,N
gdje je: It – bazni indeks u trenutku t, Yt - vrijednost pojave u trenutku t, Yb – vrijednost pojave u baznom razdoblju Bazni indeks pokazuje za koliki postotak se vrijednost pojave promijenila u odnosu na vrijednost u baznom razdoblju. Linearni trend vremenske serije je grafički prikaz jednadžbe pravca y = ax + b. Koeficijent nagiba pravca a predstavlja mjeru povećanja vrijednosti funkcije y pri povećanju varijable x za jedinicu. Joeficijent b je vrijednost na osi y u kojoj je pravac presijeca (y = b kad je x = 0). Koeficijenti a i b dobiju se traženjem minimuma kvadrata odstupanja izmjerenih vrijednosti yi od prognoziranih vrijednosti yˆ i (metoda najmanjih kvadrata). Za računanje jednadžbe trenda vremenskog niza u EXCEL-u primjenjuje se funkcija LINEST(y; x; True; True). Kad se u dijalog prozoru unesu podaci za y, x a u ćelijama Const i Stats upiše True, te prozor zatvori klikom na Close, potrebno je mišem označiti polje ćelija od ćelije u kojoj se želi početi ispisivati rezultat dva polja u desno i pet polja dolje. Pritisne se tipka Slika 3. Grafički prikaz trenda F2, a zatim se istovremeno pritisnu tipke CTRL+Shift+ Enter. U prvom se redu ispišu vrijednost koeficijenata a i b. Najjasniji prikaz trenda vremenskog niza je grafički. Postupak u EXCEL-u je slijedeći: 1. nacrta se dijagram raspršenja 2. desnim klikom miša na jednu podatkovnu točku, otvorit će se padajući meni u kojem se izabere Add Trendline
3. otvorit će se prozor Format Trendline u kojem se izabere opcija Linear i na dnu prozora aktivira se opcija Display Equation on chart. Klikom na Close zatvori se prozor. Primjer grafičkog prikaza trenda i jednadžbe pravca trenda dan je na slici 3. Predviđanje realizacije plana Praćenje izvršenja planskih zadataka najlakše se prati grafičkim prikazom kumulativnih vrijednosti postavke plana po mjesecima, zatim se nacrta linija trenda koja se produži do kraja planskog razdoblja (tromjesečje, polugodište, kraj godine). Očita se vrijednost razmatrane pojave na kraju planskog razdoblja i usporedi s planskom vrijednošću.. Postupak crtanja dijagrama u EXCEL-u je slijedeći: 1. izračunaju vrijednosti
se
kumulativne
2. kvalitativni podaci (mjeseci) zapišu se brojčane vrijednosti (redni broj mjeseca) 3. nacrta se raspršni dijagram 4. desnim klikom miša na jednu podatkovnu točku, otvorit će se padajući meni u kojem se izabere Add Trendline 5. automatski će se otvoriti prozor Format Trendline u Slika 4. Praćenje izvedbe izvršenja plana kojem se izabere opcija Linear 6. i na dnu prozora aktivira se opcija 7. Display Equestion on chart, a u polju Forecast u ćeliji Forward upiše se broj vremenskih jedinica do kraja planskog razdoblja (u primjeru na slici 4 dani su podaci za pet mjeseci, a plansko je razdoblje kraj godine, zato se u ćeliju Forward upiše 7). Klikom na Close zatvori se prozor. Na slici 4. prikazan je trend troškova kvalitete praćenjem po mjesecima i predviđanje ukupnog troška kvalitete do kraja godine. Ako su, na primjer, planom predviđena sredstva od 14000 kn, sredstva će biti utrošena točno krajem 12. mjeseca, a ako su osigurana manja sredstva regresijska će linija presjeći planiranu vrijednost prije 12. mjeseca, i obratno, ako su planirana sredstva veća linija trenda neće do kraja 12. mjeseca presjeći tu vrijednost.. 2.4 Kontrolne karte Kontrolne karte su statistički alat koji služi otkrivanju trenutka kad varijabilnost neke statistike mjerne veličine više nije slučajna već se pojavljuju neki predvidljivi trendovi. Primjenjuju se kod velikih serija proizvodnje ili mjerenja. Tada se populacija procjenjuje na temelju uzoraka, koji se ispituju i računaju statistike centralne tendencije (aritmetička sredina, medijan) ili varijabilnosti (raspon, standardno odstupanje). Kontrolne karte na kojima se prati broj nesukladnosti po uzorku ili broj nesukladnosti po jedinici ne nalaze primjenu u umjernim i ispitnim laboratorijima.
Kontrolna karta je zapravo linijski dijagram. Redni broj uzorka ili vrijeme uzorkovanja prikazuje se na horizontalnoj osi, a statistika uzorka na vertikalnoj osi. Kontrolna se karta sastoji od tri linije: centralne linije koja predstavlja aritmetički sredinu statistike koja se prikazuje i linija gornje i donje kontrolne granice na udaljenosti od središnje linije za ±3 vrijednosti standardnog odstupanja, te linijskog prikaza vremenskog niza izračunatih statistika.
Slika 5. x - kontrolna karta
U umjernim i ispitnim laboratorijima malo je prilika za korištenje kontrolnih karata. Moguće ih je primijeniti za praćenje neke pojave uzimanjem uzoraka i računanja određene statistike uzorka. Takvih bi uzoraka trebalo biti najmanje 20. Drugi je slučaj praćenje uvjeta okoliša u laboratoriju (temperatura). Budući se uvjeti okoliša moraju pratiti najmanje jednom dnevno, a nekad i više puta, postoji dovoljno duga vremenska serija podataka koja se može pratiti kontrolnom kartom s ciljem otkrivanja trenutka kad varijacija parametra okoliša više nije slučajna već se je pojavio neki vanjski utjecaj koji cijeli proces vodi u ne stacionarno stanje. 2.5 Testiranje hipoteze 2.5.1 Uvod Statistička hipoteza je oblik procjene parametara populacije. Procjena može, ali i ne mora biti točna. Na temelju ispitivanja uzorka zaključuje se o parametru populacije. Ako su podaci iz uzorka u skladu sa statističkom hipotezom, hipoteza se prihvaća, a ako nije hipoteza se odbija. Postoje dva tipa statističke hipoteze koje se međusobno moraju isključivati: • nulta hipoteza - označavamo je kao H – obično je to hipoteza da je rezultat 0 dobiven opažanjem uzorka slučajan, • alternativna hipoteza – označavamo je sa H1 ili Ha – hipoteza za opažanja uzorka pod utjecajem nekog predvidljivog uzroka. U statistici se slijedi formalni proces donošenja odluke da li odbaciti ili prihvatiti nultu hipotezu na temelju podataka iz uzorka. Taj proces naziva se ispitivanje hipoteze, a provodi se u četiri koraka: 1.
Izjavljivanje hipoteza. To uključuje definiranje nulte i alternativne hipoteze. Hipoteze se definiraju na takav način da se međusobno isključuju. To znači ako je jedna istinita druga mora biti lažna.
2.
Definiranje plana analize. Plan analize definira kako primijeniti podatke iz uzorka za prihvaćanje ili odbijanje nulte hipoteze. Odluka prihvatiti/odbaciti obično je fokusirana na neku statistiku testa.
3.
Analiza podataka iz uzorka. Izračuna se vrijednost test statistike (očekivanje, udio, t-vrijednost, z-vrijednost, itd.) koja je navedena u planu analize. Ponekad je potrebno nadopuniti s drugim računanjima prema planu analize.
4.
Interpretacija rezultata. Primijeniti pravilo odluke navedeno u planu analize. Ako test statistika podržava nultu hipotezu, nulta se hipoteza prihvaća. U suprotnom se nulta hipoteza odbacuje.
Ispitivanje hipoteze dolazi u obzir kod ispitnih laboratorija. Mogući primjeri primjene i postupak provedbe dani su u nastavku. U postupku ispitivanja hipoteze moguće su dvije vrste grešaka: 1. Greška I vrste. Greška I vrste pojavljuje
se kada istraživač odbaci nultu hipotezu a ona je istinita. Vjerojatnost postojanja greške I vrste naziva se razina značajnosti. Ta se vjerojatnost naziva alfa i označava se slovom α. 2. Greška II vrste. Greška II vrste javlja se kad istraživač prihvati nultu hipotezu koja u stvarnosti nije istinita. Vjerojatnost postojanja greške II (Vjerojatnost da je počinjena greška II) vrste naziva se beta i označava se slovom β.
Slika 6. Greška I i II vrste
Vjerojatnost nepostojanja greške II vrste naziva se jakost testa. Jakost testa = 1 – β. Na slici 6. prikazane su greške I i II vrste. Neka nulta hipoteza tvrdi da je očekivanje slučajne veličine jednako ili manje od M, a alternativna hipoteze tvrdi da je očekivanje veće od M. Ako plava krivulja predstavlja funkciju gustoće vjerojatnosti na koju se odnosi nulta hipoteza, onda plava površina predstavlja grešku I vrste i iznosi α, tj. vjerojatnost odbacivanja nulte hipoteze koja je ispravna. Ako uzeti uzorak pripada slučajnom procesu čija je funkcija gustoće vjerojatnosti dana crvenom krivuljom, onda crvena površina predstavlja vjerojatnost da se učini greška II vrste, tj da se prihvati nulta hipoteza koja je neispravna. Jačina testa je jednaka 1 minus crvena površina. Pravila donošenja odluke Plan analize sadrži pravila donošenja odluke prihvaćanja ili odbacivanja nulte hipoteze. Postoje dva načina: •
P-vrijednost. Jačina dokaza koja podržava nultu hipotezu mjeri se sa P-vrijednošću. Pretpostavimo da je statistika testa jednaka S. P-vrijednost je vjerojatnost da je statistike testa S veća od kritične vrijednosti. Ako je P-vrijednost veća od razine značajnosti α, nulta se hipoteza procjenjuje kao istinita. Ako je P-vrijednost manja od razine značajnosti nulta se hipoteza odbacuje.
•
Područje prihvaćanja. Područje prihvaćanja je područje vrijednosti koje je omeđeno s jedne ili s obje strane funkcije gustoće vjerojatnosti s kritičnom vrijednošću ovisno o izjavljenim hipotezama. Površina iznad područja prihvaćanja i ispod krivulje određuje se kao 1 – α, gdje je α razina značajnosti (1 – α = 1 – 0,05 = 0,95 = 95%). Ako statistika testa padne unutar područja prihvaćanja, nulta se hipoteza prihvaća.
Skup vrijednosti izvan područja prihvaćanja naziva je područje odbijanja. Ako statistika testa padne unutar područja odbijanja, nulta se hipoteza odbija. U takvom slučaju kažemo da je hipoteza odbijena s razinom značajnosti α.
2.5.2
Test aritmetičke sredine
Ovaj se test provodi kako bi se na temelju podataka iz uzorka potvrdila ili odbacila teza o aritmetičkoj sredini populacije, npr. M. Zbog prirode uzorkovanja, ako se uzorak uzme iz populacije koja zaista ima aritmetičku sredinu jednaku M, postoji vjerojatnost da aritmetička sredina uzorka ne bude jednaka M, već da se od nje malo razlikuje. Postavlja se pitanje kad se ta razlika smatra značajnom, zbog koje se kaže da postoji dovoljno statističkih dokaza koji ukazuju na neistinitost nulte hipoteze. Nužan uvjet za provedbu ovoga testa je grubo podudaranje razdiobe uzorka i normalne razdiobe. Ovaj je uvjet ispunjen ako je ispunjen jedan od slijedećih uvjeta: uzorak je uzet iz populacije koja slijedi normalnu razdiobu, razdioba uzorka je simetrična (SKEW ≈ 0), unimodalna, bez ekstremnih vrijednosti, a veličina uzorka je jednaka ili manja od 15, razdioba uzorka je umjereno nagnuta (|SKEW| < 2), bez ekstremnih vrijednosti, a veličina uzorka od 16 do 40, veličina uzorka veća je od 40 i bez ekstremnih vrijednosti. Postupak se sastoji od 4 koraka: 1. Izjavljivanje hipoteze. Postoje tri mogućnosti definiranja nulte i alternativne hipoteze, što je prikazano u tablici Skup
Nulta hipoteza
Alternativna hipoteza
Broj ograničenja
1
μ=M
μ≠M
2
2
μ≥M
μ<M
1
3
μ≤M
μ>M
1
2. Definiranje plana analize. Razina značajnosti α = 0,05 (ponekad se uzima 0,1 ili 0,01, ali može biti i bilo koja vrijednost od 0 do 1). Metoda testa je jednostavni slučajni uzorak te jednostrani ili dvostrani t-test, što ovisi o izjavi hipoteza. 3. Analize podataka iz uzorka. Potrebno je izračunati standardnu pogrešku, broj stupnjeva slobode, statistiku testa, kritičnu vrijednost i P-vrijednost.
n⎞ N 1 ⎛ ⋅⎜1 − ⎟ ⋅ , gdje je s – standardno n ⎝ N ⎠ N −1 odstupanje uzorka, n – veličina uzorka, a N - veličina populacije iz koje je uzet s uzorak. Kad je N >> n vrijedi izraz SE = . n Izraz za standardnu pogrešku SE je SE = s ⋅
Broj stupnjeva slobode je DF = n – 1.
x −M , gdje je x - aritmetička sredina uzorka SE (AVERAGE(podaci)), M – aritmetička sredina iz nulta hipoteze, SE – standardna pogreška. Statistika
testa
je
t=
Kritična vrijednost CV očita se iz tablice za t-razdiobu ili se izračuna primjenom
funkcije u EXCEL-u. CV = tCV = TINV(α(2) ili 2α(1) ; DF), gdje je α – razina značajnosti,
obično 0,05, oznaka (1) odnosno (2) znači jednostrani, odnosno dvostrani t-test, DF – broj stupnjeva slobode.
P-vrijednost izračuna se primjenom EXCEL funkcije P = TDIST(t; DF; 1 ili 2): Treći parametar funkcije je 1 ako se radi o jednostranom, odnosno 2 za dvostrani t-test. 4. Interpretacije rezultata. Rezultat testa može se interpretirati na dva načina. (1) Ako je |t| ≥ CV odbija se nulta hipoteza. Kaže se da postoji dovoljno statističkih
dokaza za odbacivanje nulte i prihvaćanje alternativne hipoteze. Postoji značajna razlika između aritmetičke sredine uzorka i populacije tako da se odbija nulta hipoteza uz razinu značajnosti α. (2) Ako je P < α, postoji dovoljno statističkih dokaza za odbacivanje nulte i prihvaćanje alternativne hipoteze. Postoji značajna razlika između aritmetičke sredine uzorka i populacije tako da se odbija nulta hipoteza uz razinu značajnosti α. Vrlo je mala vjerojatnost da bi se ovakav uzorak mogao dobiti iz populacije navedene u nultoj hipotezi. Pogreška II vrste i jakost testa Jakost testa definirana je kao vjerojatnost odbacivanja neispravne nulte hipoteze, odnosno vjerojatnost prihvaćanja ispravne alternativne hipoteze i jednaka je 1- β, gdje je β vjerojatnost pogreške II vrste. Jakost testa ovisi u razlikama parametara danih u nultoj hipotezi i stvarnog parametra na koji se oslanja alternativna hipoteza. Što je ta razlika veća, manja je vjerojatnost prihvaćanja neispravne nulte hipoteze, lakše se prepoznaje koja je od hipoteza istinita. Unaprijed se definira vjerojatnost pogreške I vrste. Ona obično iznosi 0,05. Test je dobar ako je i vjerojatnost pogreške II vrste β također mala. Ne bi smjela biti veća od 0,2, odnosno jačina testa 1 – β = 1 - 0,2 = 0,8 = 80%. Na jačinu testa bitno utječe veličina uzorka n. Veličina uzorka utječe na standardnu pogrešku, a ona pak na vrijednost test statistike. Jakost testa je funkcija razlike prave aritmetičke sredine populacije iz koje je uzet uzorak i iskazane u nultoj hipotezi, izračunate kritične vrijednosti i standardne pogreške, odnosno standardnog odstupanja uzorka i veličine uzorka. Kritična vrijednost srednje vrijednosti uzorka uzetog iz razdiobe označene plavom bojom bila s (slika 6.). Iz izraza se vidi kako kritična bi udaljena od očekivanja razdiobe M za tCV ⋅ n granica aritmetičke sredine nakon koje se odbacuje nulta hipoteza ovisi o veličini uzorka. Povećanjem veličine uzorka obje krivulje vjerojatnosti ostaju na istom mjestu, ali se sužavaju. Kritična granica se pomiče prema M, ali obojana površina ispod krivulje prikazane plavom bojom ostaje ista. Krivulja funkcije vjerojatnosti prikazana crvenom bojom se također suzila, a budući se kritična granica udaljava od vrijednosti M1, označena površina ispod spomenute krivulje se smanjuje. To znači slijedeće: povećanjem veličine uzorka vjerojatnost pogreške I vrste ostaje ista, a smanjuje se vjerojatnost pogreške II vrste. Optimalna veličina uzorka je ona za koju se izjednačuje vjerojatnost odbacivanja ispravne nulte hipoteze, α i vjerojatnost prihvaćanja neistinite nulte hipoteze, β. Preporučena veličina uzorka je ona za koju je vjerojatnost prihvaćanja neistinite nulte hipoteze β manja od 0,2, odnosno 20%. 2.5.3
Test razlike aritmetičkih sredina
Ovaj se test primjenjuje za provjeru hipoteze da su dva uzorka uzeta iz iste populacije. Ako je ta hipoteza istinita onda se aritmetičke sredine uzoraka ne bi smjele značajnije razlikovati. Problem se sastoji u utvrđivanju značajne statističke razlike između dviju aritmetičkih sredina. Uvjeti za provedbu testa su:
oba uzorka su slučajna, uzorci su nezavisni, populacija je najmanje 10 puta veća od uzorka, svaki uzorak slijedi normalnu ili skoro normalnu razdiobu. Pretpostavke da je uzorak normalan ili skoro normalan dan je točki Testiranje aritmetičke sredine.
Test se realizira u 4 koraka kako slijedi: 1. Izjava hipoteze. Postoje tri mogućnosti definiranja nulte i alternativne hipoteze, što je prikazano u tablici Skup
Nulta hipoteza
Alternativna hipoteza
Broj ograničenja
1
μ -μ =d
μ -μ ≠d
2
2
μ -μ ≥d
μ -μ <d
1
3
μ -μ ≤d
μ -μ >d
1
1
1
1
2
1
2
1
2
1
2
2
2
2. Definiranje plana analize. Razina značajnosti α = 0,05 (ponekad se uzima 0,1 ili 0,01, a može biti i bilo koja vrijednost od 0 do 1). Metoda testa je t-test s dva uzorka. 3. Analiza podataka iz uzorka. Plan analize sadrži slijedeće elemente: Standardna pogreška:
SE =
s12 s22 + , gdje je s – standardno odstupanje uzorka, a n n1 n2
veličina uzorka. 2
Broj stupnjeva slobode:
Statistika testa:
⎛ s12 s22 ⎞ ⎜ + ⎟ n n DF = ⎝ 12 2 ⎠ 2 ⎛ s12 ⎞ ⎛ s22 ⎞ ⎜ ⎟ ⎜ ⎟ ⎝ n1 ⎠ + ⎝ n2 ⎠ n1 − 1 n2 − 1 t=
( x1 − x2 ) − d , gdje je d - razlika aritmetičkih sredina
iz nulte hipoteze.
SE
Kritična vrijednost CV: za α = 0,05, tCV = TINV(0,05(2) ili 0,1(1); DF). Indeksi (1) i (2) označavaju jednostrani, odnosno dvostrani test. P-vrijednost:
P = TDIST(t; DF; 1 ili 2).
Treći parametar je 1 ako se radi o jednostranom testu, a 2 ako se provodi dvostrani test, što je definirano u tablici hipoteza. 4. Interpretacija rezultata. Isto kao u točki Test aritmetičke sredine. 2.5.3
Testiranje hipoteze za udio.
Ovaj se test provodi za provjeru hipoteze da je uzorak uzet iz populacije čiji je udio veličine koja se ispituje jednak P. Ako je hipoteza točna onda se razlika udjela u populaciji i uzorku ne bi smjela statistički značajno razlikovati. Problem se sastoji u utvrđivanju da li se udjeli međusobno statistički značajno razlikuju.
Uvjeti za provedbu testa su: jednostavni slučajni uzorak uzorak uključuje najmanje 10 uspjeha i 10 neuspjeha populacija je najmanje 10 puta veća od uzorka. Postupak provedbe testa sastoji se od 4 koraka kako slijedi: 1. Izjavljivanje hipoteze. Postoje tri mogućnosti koje su dane u tablici Skup
Nulta hipoteza
Alternativna hipoteza
Broj ograničenja
1
p=P
p≠ P
2
2
p ≥P
p<P
1
3
p≤P
P>P
1
2. Definiranje plana analize Razina značajnosti α = 0,1; 0,05 ili 0,01. Obično se izabire 0,05, a može i bilo koja vrijednost između 0 i 1. Metoda testa: budući je veličina uzorka velika, primjenjuje se jednostrani ili dvostrani z-test ovisno o nultoj hipotezi. 3. Analiza podataka iz uzorka Standardno odstupanje s =
P ⋅ ( 1 − P) n
p−P , gdje je p – udio u uzorku, P – udio u populaciji, s – s standardno odstupanje uzorka.
Statistika testa: z =
Kritična vrijednost CV: Za α = 0,05 i jednostrano ograničenje CV = zCV = NORMSINV(1-α(1)) = NORMSINV(1-0,05) = 1,64. Za dvostrano ograničenje CV = zCV = NORMSINV(1-α(2)) = NORMSINV(1-0,025) = 1,96. P-vrijednost: za jednostrani test: P = NORMSDIST(z), a za dvostrani test P = 2*NORMSDIST(z). 4. Interpretacija rezultata. Isto kao u prethodnim slučajevima, samo se u prvom načinu odlučivanja umjesto t-vrijednosti uzima z-vrijednost.
3. ZAKLJUČAK Osnovna zadaća ispitnog i umjernog laboratorija je provesti mjerenja i iskazati mjerni rezultat, koji mora sadržavati dobivenu vrijednost i iskaz o mjernoj nesigurnosti. Kod ponovljivih mjerenja do vrijednosti mjernog rezultata dolazi se računanjem aritmetičke sredine ponovljenih mjerenja. Do procjene mjerne nesigurnosti dolazi se analizom mjernih rezultata i svih čimbenika koji utječu na varijabilnost mjernog rezultata. Kod toga je potrebno poznavati vjerojatnosti razdioba parametara koji utječu na varijabilnost mjernog rezultata. Iz razdiobe se računa standardna nesigurnost koja ulazi u proračun kombinirane, odnosno proširene mjerne nesigurnosti,. Pored zahtjeva za iskazivanje mjernog rezultata, iskazom o mjernoj nesigurnosti dobivene mjerne vrijednosti, norma HRN EN ISO/IEC 17025:2007 zahtijeva kvalitetno upravljanje
svim ostalim aktivnostima laboratorija, odnosno upravljanje sustavom kvalitete laboratorija. Odluke se moraju temeljiti na činjenicama, a do njih se dolazi prikupljanjem i obradom podataka. U obradi podataka primjenjuju se statističke metode kako bi se iz mnoštva podataka zaključilo o onome što je bitno za određeni proces. U radu su prikazane statističke metode koje se mogu primijeniti u upravljanju sustavom kvalitete u ispitnim i umjernim laboratorijima. Najčešće primjenjivane statističke metode su opisna statistika, korelacija, analiza vremenskih serija, kontrolne karte i testiranje hipoteza. Navedeni prikazi ujedno ukazuju i na područja upravljanja kvalitetom laboratorija u kojima se može primijeniti pojedina statistička metoda. LITERATURA [1] ISO/TR 10017, Guidance on statistical techniques for ISO 1901:2000; Second edition, 2003. [2] P. Newbold, W.L. Carson, B. Thorne; Statistika za poslovanje i ekonomiju; šesto izdanje, MATE, Zagrebačka škola ekonomije i menadžmenta, Zagreb, 2010. [3] J.Neter, W.Waserman, G.A.Whitmore, Applied Statistic, fourth eddition, Allyn and Bacon, 1993. APPLICATION OF STATISTICAL METHODS IN TESTING AND CALIBRATION LABORATORIES Summary Measuring procedures always lead to the dispersion of the results of measurements. Therefore, it is necessary to specify, alongside the measured value, the measurement uncertainty and the corresponding level of confidence, or covering factor k. Dispersion of measurement results takes place in testing and calibration laboratories, where some influential factors are under control but nevertheless affect the dispersion of measurement results, such as environmental conditions in the laboratory, sampling, sample storage, transportation of instruments and samples, uncertainty caused by the instrument. Because of this, measurement results are always interval values, provided they are obtained using well-selected measurement methods and standards. Their values are presented with statistics of central tendency using appropriate statistical methods. The most common statistical methods used in testing and calibration laboratories are descriptive statistics, time series analysis, analysis of variance and regression analysis. The paper provides a brief overview of these statistical methods, their limitations and significance testing. These statistical methods are applied to obtain the measurement results and evaluation of measurement uncertainty, which is also one of the HRN EN ISO/IEC 17025:2007 requirements. Keywords: testing and calibration laboratories, statistical methods of central tendency, evaluation of measurement uncertainty, HRN EN ISO/IEC 17025