XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM
vectorstock.com/24597468
Ths Nguyễn Thanh Tú eBook Collection
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC KIỂM ĐỊNH THỐNG KÊ, XỬ LÝ THỐNG KÊ THẨM ĐỊNH PHƯƠNG PHÁP PHÂN TÍCH, PHÂN TÍCH TÁC ĐỘNG CỦA CÁC YẾU TỐ TỚI THỰC NGHIỆM, THIẾT KẾ VÀ PHÂN TÍCH THỰC NGHIỆM TS. LÊ ĐÌNH VŨ WORD VERSION | 2022 EDITION ORDER NOW / CHUYỂN GIAO QUA EMAIL TAILIEUCHUANTHAMKHAO@GMAIL.COM Tài liệu chuẩn tham khảo Phát triển kênh bởi Ths Nguyễn Thanh Tú Đơn vị tài trợ / phát hành / chia sẻ học thuật : Nguyen Thanh Tu Group Hỗ trợ trực tuyến Fb www.facebook.com/DayKemQuyNhon Mobi/Zalo 0905779594
38
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Chương 3 KIỂM ĐỊNH THỐNG KÊ VÀ ỨNG DỤNG
ƠN
OF FI
Kiểm định thống kê là phép đánh giá các đại lượng đặc trưng của một hoặc nhiều tập số liệu thực nghiệm dựa vào một quy luật thống kê nhất định. Kiểm định thống kê có thể là kiểm định có tham số (parametric test) hoặc kiểm định không qua tham số (non–parametric test). Các phép kiểm định có tham số phổ biến kể đến như kiểm định Student (t–test), kiểm định Gauss (Z–test), kiểm định Fisher (f–test). Kiểm định không qua tham số thường được dùng như kiểm định Chi bình phương của Pearson (χ2–test), kiểm định Wilcoxon (W–test), kiểm định Mann–Whitney (U–test),... Phép kiểm định thống kê qua tham số cho kết quả chắc chắn hơn và thường được sử dụng trong thực nghiệm Hóa học và Hóa phân tích.
NH
3.1. Giả thuyết thống kê và kết luận thống kê
3.1.1. Giả thuyết thống kê (Statistical hypothesis)
QU
Y
Phép kiểm định thống kê gắn liền với kết luận thống kê trên cơ sở giả thuyết ban đầu cho một tham số đặc trưng nào đó của hai tập số liệu. Giả thuyết thống kê khi so sánh tham số ai và ak của hai tập số liệu này có dạng như sau: Giả thuyết H0 (Null hypothesis): giả thuyết đưa ra với ai và ak đồng nhất, biểu thức tương ứng là ai ak hay ai – ak 0
KÈ
M
Giả thuyết Ha (Alternative hypothesis): giả thuyết đưa ra ai và ak không đồng nhất, biểu thức có thể là ai ak, hoặc ai > ak, hoặc ai < ak. Trong đó a là tham số đặc trưng có thể là giá trị trung bình (µ), phương sai (σ2), độ lệch chuẩn (σ),... của hai dãy số liệu tương ứng. 3.1.2. Kết luận thống kê (Statistical conclusion)
DẠ Y
Ứng với các giả thuyết thống kê nêu trên, tùy thuộc vào kết quả tính toán dựa trên các quy luật phân phối thích hợp có thể đưa ra kết luận. Kết luận thống kê được phân loại như sau:
Chương 3. Kiểm định thống kê và ứng dụng
39
CI AL
Kết luận loại I (Type I conclusion): Bác bỏ H0 (µi µk), chấp nhận Ha (µi µk). Kết luận loại I dẫn đến sai lầm loại I.
OF FI
Sai lầm loại I (Type I error): là sai lầm của kết luận loại I đó là bác bỏ H0, chấp nhận Ha. Sai lầm loại I khiến người ta kết luận rằng một mối quan hệ được cho là không tồn tại (Ha) trong khi thực tế thì có mối quan hệ và có tồn tại (H0). Ví dụ về sai lầm loại I: Một xét nghiệm cho thấy bệnh nhân mắc bệnh nhưng thực tế là bệnh nhân đó không mắc bệnh; Một chuông báo cháy nổ hoạt động nhưng thực tế là không có đám cháy.
ƠN
Kết luận loại II (type II conclusion): Chấp nhận H0 (µi µk), bác bỏ Ha (µi µk). Kết luận loại II dẫn đến sai lầm loại II.
NH
Sai lầm loại II (Type II error) là sai lầm của kết luận loại II đó là chấp nhận H0, bác bỏ Ha. Thông thường, sai lầm loại II khiến người ta kết luận rằng một tác động hoặc mối quan hệ được cho là tồn tại (H0) trong khi thực tế thì không tồn tại (Ha).
Y
Ví dụ về sai lầm loại II: Kết quả xét nghiệm cho thấy một bệnh nhân không mắc bệnh trong khi thực tế là bệnh nhân đó mắc bệnh; Một chuông báo cháy nổ không hoạt động nhưng thực tế là có đám cháy.
M
QU
Thông thường, sai lầm loại II là nghiêm trọng hơn so với sai lầm loại I. Trong trường hợp chưa có sự chắc chắn khi buộc phải kết luận thống kê thì phải giữ nguyên tắc “Thà mắc sai lầm loại I còn hơn mắc sai lầm loại II”. Điều này có nghĩa là nếu không đủ bằng chứng thì thà bác bỏ giả thuyết H0, còn hơn chấp nhận giả thuyết H0.
KÈ
Bảng 3.1: Phân loại giả thuyết thống kê và kết luận thống kê
Kết luận
DẠ Y
Bác bỏ H0
Chấp nhận H0
Giả thuyết H0 H0 đúng
H0 sai
Sai lầm loại I
Kết luận đúng
Kết luận đúng
Sai lầm loại II
40
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
3.1.3. Mối quan hệ giữa chuẩn thống kê và kết luận thống kê Để thực hiện phép kiểm định thống kê (đưa ra kết luận thống kê) cho một đại lượng đặc trưng nào đó (giá trị trung bình, phương sai, độ đúng, độ tái lặp…) của một tập số liệu với một giá trị cho trước hoặc giữa các tập số liệu với nhau cần chọn các chuẩn thống kê phù hợp tương ứng.
ƠN
OF FI
Có thể dùng giá trị chuẩn thống kê hoặc giá trị p–value để kết luận thống kê. Về bản chất p–value chính là giá trị α = 1– P từ phép tính toán thống kê thu được với P là độ tin cậy tương ứng. Trong khi α được dùng là mức ý nghĩa chuẩn tham chiếu khi thực hiện phép kiểm định. Ví dụ trong phép kiểm định ở mức ý nghĩa 0.05 (α = 0.05), phép tính thống kê tính được p–value = 0.03 (P = 0.97), nếu so sánh ta thấy p–value < α. Các giả thuyết cho đại lượng thống kê cần được kiểm định có thể là: H0 : giống nhau;
NH
Ha: khác nhau; lớn hơn; hoặc nhỏ hơn.
Các trường hợp kết luận thống kê được trình bày trong bảng 3.1.
Y
Bảng 3.2: Kết luận thống kê theo chuẩn thống kê hoặc độ không tin cậy p–value
Kết luận thống kê
Chuẩn tính < chuẩn bảng hai phía
p–value > α
Chấp nhận H0
Chuẩn tính ≥ chuẩn bảng hai phía
p–value ≤ α
Chấp nhận Ha
Chuẩn tính ≤ chuẩn bảng phía trái
p–value ≤ α
Chấp nhận Ha
p–value ≤ α
Chấp nhận Ha
QU
Giá trị chuẩn thống kê
M
(two–tailed)
(upper–tailed)
KÈ
Chuẩn tính ≥ chuẩn bảng phía phải (lower–tailed)
DẠ Y
Chuẩn tính còn thường được gọi là chuẩn score hoặc chuẩn stat được tính cho từng trường hợp cụ thể của tập số liệu nhất định. Chuẩn thống kê có thể là chuẩn Gauss, Student, Fisher, Chi bình phương,... tùy theo tính chất của đại lượng cần so sánh.
Chương 3. Kiểm định thống kê và ứng dụng
KÈ
M
QU
Y
NH
ƠN
OF FI
CI AL
41
Hình 3.1. Biểu diễn giá trị p–value (α) trên đồ thị phân phối xác suất: (a) kiểm
DẠ Y
định hai phía; (b) kiểm định phía trái; (c) kiểm định phía phải.
3.2. Kiểm định Student và ứng dụng Kiểm định Student là kiểm định sử dụng chuẩn phân phối t, sử dụng để so sánh giá trị trung bình của một tập số liệu với giá trị thực (one
42
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Hai tập giá trị có liên quan từng đôi một?
CI AL
sample), so sánh giá trị trung bình của hai tập số liệu (two samples). Đối với trường hợp hai tập số liệu, tùy tính chất của các tập số liệu, ta có thể sử dụng kiểm định t–test trong các trường hợp khác nhau như sơ đồ ở hình 3.2. Paired t-test (phụ thuộc)
Sai
Hai tập có cùng số mẫu?
ƠN
Đúng
OF FI
Đúng
t-test Phương sai đồng nhất (độc lập)
Đúng
Sai
t-test Phương sai khác biệt (độc lập)
Y
Hai tập mẫu có đồng nhất phương sai ?
NH
Sai
QU
Hình 3.2. Kiểm định Student của hai tập số liệu
3.2.1. Kiểm định Student so sánh giá trị trung bình của một tập số liệu với giá trị cho trước (One–sample t–test)
x−μ SX ̅
=
x−μ Sd
. √N
(3.1)
KÈ
t stat =
M
Giả sử một tập số liệu có N giá trị với giá trị trung bình là x, độ lệch chuẩn là Sd , giá trị đối sánh cho trước là µ, khi đó ta có:
Tùy vào yêu cầu thực tế đặt ra cho bài toán mà phép kiểm định Student một tập mẫu có thể là một trong các tình huống xảy ra dưới đây:
DẠ Y
Tình huống 1: Đánh giá sự đồng nhất giữa x và µ, sử dụng kiểm định 2 phía với giả thuyết thống kê như sau: H0: x µ, x đồng nhất với giá trị µ. Ha: x µ, x khác biệt giá trị µ.
Chương 3. Kiểm định thống kê và ứng dụng
43
CI AL
– Nếu ׀tstat < ׀t(α,f) (two tailed), chấp nhận H0, x đồng nhất với µ. – Nếu ׀tstat ≥ ׀t(α,f) (two–tailed), bác bỏ H0, x khác biệt với µ.
Tình huống 2: Đánh giá xem x có lớn hơn µ hay không, sử dụng kiểm định phía phải (upper–tailed) với giả thuyết thống kê như sau:
OF FI
H0: x µ, giá trị trung bình không khác biệt với giá trị cho trước. Ha: x > µ, giá trị trung bình lớn hơn giá trị cho trước.
– Nếu tstat < t(α,f) (upper–tailed), chấp nhận H0, x không lớn hơn µ. – Nếu tstat ≥ t(α,f) (upper–tailed), chấp nhận Ha, x lớn hơn µ.
ƠN
Tình huống 3: Đánh giá xem x có nhỏ hơn µ hay không, sử dụng kiểm định phía trái (lower–tailed) với giả thuyết thống kê như sau: H0: x µ, giá trị trung bình không khác biệt với giá trị cho trước. Ha: x < µ, giá trị trung bình nhỏ hơn giá trị cho trước.
NH
– Nếu tstat > t(α,f) (lower–tailed), chấp nhận H0, x không nhỏ hơn µ. – Nếu tstat ≤ t(α,f) (lower–tailed), chấp nhận Ha, x nhỏ hơn µ;
QU
Y
Ứng dụng: t–test một mẫu được sử dụng phổ biến để đánh giá sai số hệ thống, kiểm tra kết quả phân tích QC trên mẫu chuẩn/vật liệu chuẩn (CRM), kiểm tra chất lượng của sản phẩm,... Ví dụ 3.1: Kết quả phân tích kiểm tra hàm lượng vitamin B1 (mg/viên) trên một lô thuốc thương phẩm thu được như sau:
5.23
5.04
M
5.02
4.75
5.20
5.10
5.03
4.90
5.13
5.05
5.04
4.96
5.17
4.81
4.80
KÈ
Kết luận như thế nào về chất lượng của loại thuốc nếu yêu cầu về hàm lượng của vitamin B1 trong loại thuốc này là 5 mg/viên, độ tin cậy 95%. Giải:
DẠ Y
Cách 1: Sử dụng công thức tính thông thường Giả thuyết thống kê: H0: x 5; Ha : x 5
44
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Áp dụng công thức tính 3.1 ta có: 1
x̅ = N ∑N i=1 xi ≈ 5.02 1
2 S 2 = N−1 ∑N i=1(xi − x) = 0.021564
Sd ≈ 0.147 x−μ Sx̅
=
x−μ Sd
. √N ≈ 0.33
OF FI
t stat =
t crit = t(0.05,14) hai phía = 2.13
ƠN
Vì t stat = 0.33 < t(α,f) hai phía, chấp nhận H0, giá trị trung bình đồng nhất với 5 mg/viên. Kết luận hàm lượng vitamin B1 trong lô thuốc là đạt yêu cầu. Cách 2: Sử dụng công cụ Data analysis trong Excel
Y
NH
Bài toán kiểm định Student so sánh giá trị trung bình của một tập số liệu với giá trị cho trước có thể thực hiện bằng công cụ Data analysis trong Excel một cách nhanh chóng, chính xác mà không cần tính toán các thông số của tập dữ liệu. Về ý nghĩa toán học và thống kê, các thông số thu được từ sử dụng công cụ Excel hoàn toàn giống so với cách thực hiện bằng công thức như trình bày ở cách 1.
QU
Thực tế rằng, Microsoft Excel không thiết kế công cụ riêng cho kiểm định Student một tập mẫu (One–sample t–test). Tuy nhiên ta có thể sử dụng kiểm định Student hai tập mẫu không đồng nhất về phương sai (Two– sample assuming unequal variances) cho mục đích này.
KÈ
M
Để sử dụng công cụ Excel, sau khi thực hiện thao tác Add–Ins (được trình bày trong Chương 1) chúng ta thực hiện chọn công cụ theo đường dẫn: data/data analysis/t–test: Two–Sample Assuming Unequal Variances
DẠ Y
Thực hiện nhập các số liệu thực nghiệm theo 1 cột, giá trị đối sánh được nhập ở cột khác và được lặp lại 2 lần, khai báo Input, các thông số và Output option như trong hình sau đây:
Chương 3. Kiểm định thống kê và ứng dụng
ƠN
OF FI
CI AL
45
M
QU
Y
NH
Chọn ok, kết quả của phép kiểm định thu được là:
KÈ
Kết quả thu được hoàn toàn giống như cách tính bằng công thức, tstat ≈ 0.33 < tcrit (two–tail) ≈ 2.14, chấp nhận H0 tức là hàm lượng vitamin B1 trong lô thuốc là đạt yêu cầu.
DẠ Y
Ví dụ 3.2: Một thiết bị phân tích được kiểm tra bằng cách xác định hàm lượng của Cu (tính bằng mg) có trong 1 g vật liệu chuẩn được chứng nhận (CRM). Giấy chứng nhận phân tích của CRM ghi rằng hàm lượng trung bình của Cu là 4.54 mg/g mẫu. Thực hiện 30 lần phân tích mẫu CRM bằng thiết bị phân tích mới thu được kết quả như trong bảng dưới đây. Với
46
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
mức ý nghĩa 5%, thiết bị có đạt yêu cầu về mặt kỹ thuật nếu tất cả các yếu tố khác khi phân tích đã được kiểm soát. 4.56
4.38
4.54
4.47
4.49
4.42
4.49
4.46
4.68
4.33
4.54
4.63
4.50
4.46
4.47
4.56
4.52
4.47
4.56
4.56
4.35
4.5
4.47
4.44
4.64
4.57
4.37
4.55
4.46
Giải: Giả thuyết thống kê: H0: x̄ , thiết bị hoạt động tốt
Ha: x̄ , thiết bị không đạt yêu cầu
OF FI
4.65
1
x̅ = N ∑N i=1 xi ≈ 4.50 1
NH
2 S 2 = N ∑N i=1(xi − x) = 0.00751
ƠN
Giá trị các thông số của tập số liệu thu được là:
Sd = 0.08667
Áp dụng công thức 3.1 ta có: x−μ Sx̅
=
x−μ Sd
. √N ≈ – 2.34
Y
t stat =
QU
t crit = t(0.05,29) = 2.24 (hai phía)
M
Vì ׀t stat = ׀2.34 > tcrit (hai phía), bác bỏ giả thuyết H0. Giá trị trung bình (x) khác biệt với giá trị chuẩn (µ), thiết bị phân tích hoạt động không tốt.
KÈ
3.2.2. Kiểm định Student liên quan từng đôi một (Paired t–test)
DẠ Y
Giả sử hai tập số liệu A, B cùng có N giá trị NA = NB = N và 2 tập số liệu có liên quan từng đôi một, để so sánh giá trị trung bình của hai tập ta sử dụng công thức sau: t stat =
(𝐱̅𝐀 −𝐱̅𝐁 ) Sd
√N =
Md Sd
√N
(3.2)
Trong đó: di = xAi − xBi
(3.3)
Chương 3. Kiểm định thống kê và ứng dụng
Sd =
∑N i=1 di N
(trung bình độ lệch)
2 ∑N i=1 di −
√
(3.4)
CI AL
Md =
47
2 (∑N i=1 di ) N
(3.5)
N−1
Bậc tự do:
OF FI
f = N A – 1 = NB – 1 = N – 1
(3.6)
Tùy vào mục đích của bài toán, kiểm định Student liên quan từng đôi một có thể là một trong các tình huống sau: Tình huống 1: Đánh giá sự tương đồng giữa xA và xB , sử dụng kiểm định 2 phía với giả thuyết thống kê như sau:
ƠN
H0: xA xB , xA tương đồng với xB .
Ha: xA xB , xA khác biệt giá trị xB .
NH
– Nếu ׀tstat < ׀t(α,f) (two–tailed), chấp nhận H0, xA tương đồng với xB . – Nếu ׀tstat ≥ ׀t(α,f) (two–tailed), bác bỏ H0, xA khác biệt với xB . Tình huống 2: Đánh giá xem xA có lớn hơn xB hay không, sử dụng kiểm định phía phải (upper–tailed) với giả thuyết thống kê như sau:
Y
H0: xA xB , xA tương đồng với xB .
QU
Ha: xA > xB , xA lớn hơn xB .
– Nếu tstat < t(α,f) (upper–tailed), chấp nhận H0, xA không lớn hơn xB . – Nếu tstat ≥ t(α,f) (upper–tailed), chấp nhận Ha, xA lớn hơn xB .
KÈ
M
Tình huống 3: Đánh giá xem xA có nhỏ hơn xB hay không, sử dụng kiểm định phía trái (lower–tailed) với giả thuyết thống kê như sau: H0: xA xB , xA tương đồng với xB . Ha: xA < xB , xA nhỏ hơn xB .
DẠ Y
– Nếu tstat > t(α,f) (lower–tailed), chấp nhận H0, xA tương đồng với xB . – Nếu tstat ≤ t(α,f) (lower–tailed), chấp nhận Ha, xA nhỏ hơn xB ;
Ứng dụng: Kiểm định Student liên quan từng đôi một được sử dụng để so sánh giá trị trung bình của hai tập số liệu nếu các lần thực nghiệm có
48
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
sự ràng buộc với nhau. Paired t–test cho kết luận chắc chắn hơn so với kiểm định Student với hai mẫu độc lập nhau.
OF FI
Ví dụ 3.3: Để đánh giá nguyên nhân ô nhiễm ô nhiễm arsenic (µg/L) trong nước ngầm ở 14 địa điểm thuộc đồng bằng Sông Hồng có phải từ nguồn ô nhiễm nước mặt gây nên hay không, người ta đi so sánh nồng độ arsenic giữa hai môi trường, kết quả thu được như sau: Vị trí
Nước ngầm (A)
1
17.74
2
32.45
3
11.98
4
9.03
5
20.64
6
26.82
7
5.85
0.63
8
36.18
4.20
9
13.07
3.70
10
0.53
NH
ƠN
2.53 6.40 3.33 1.33
Y
12
3.03
0.66
23.37
0.84
10.92
1.17
10.83
QU
11
Nước mặt (B)
KÈ
M
Chọn phương pháp kiểm định thống kê phù hợp nhất để đánh giá mối liên quan về nồng độ arenic ở hai môi trường nước nói trên ở độ tin cậy 95%. Giải:
DẠ Y
Trong bài toán này, việc khảo sát nồng độ ô nhiễm của arsenic trong nước mặt và nước ngầm được thực hiện tại cùng một vị trí địa lý với mục đích xem xét có tồn tại mối liên hệ giữa nước mặt và nước ngầm về mức độ ô nhiễm của độc chất arsenic hay không. Do đó vị trí địa lý là yếu tố ràng buộc với nhau (liên quan) của mỗi cặp giá trị khảo sát, Paired t–test
Chương 3. Kiểm định thống kê và ứng dụng
49
CI AL
là phép kiểm định thống kê phù hợp nhất được lựa chọn cho trường hợp này. Giả thuyết thống kê cho bài toán như sau:
H0: x̅A ≡ x̅B , không có sự khác biệt nồng độ arsenic trong hai môi trường nước.
OF FI
Ha: x̅A > x̅B , nồng độ arsenic trong nước ngầm lớn hơn nước mặt. Cách 1: Sử dụng công thức tính thông thường
Từ dữ liệu đề bài, áp dụng các công thức 3.2 – 3.6 ta có bảng tính như sau: B
1
17.74
3.03
14.71
216.38
2
32.45
0.53
31.92
1018.89
3
11.98
2.53
9.45
89.30
4
9.03
10.4
–1.37
1.88
5
20.64
3.33
17.31
299.64
6
26.82
1.33
25.49
649.74
7
5.85
8.63
–2.78
7.73
36.18
4.2
31.98
1022.72
13.07
3.7
9.37
87.80
10.83
0.66
10.17
103.43
11
23.37
0.84
22.53
507.60
12
10.92
1.17
9.75
95.06
QU
Y
NH
ƠN
A
8 9
KÈ
M
10
DẠ Y
d2i
di
TNV
Md
15.88
S2
131.28
Sd
11.46
tstat
4.5
t(0.05,11) (upper–tailed)
1.8
50
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
tstat = 4.5 > tcrit = 1.8, chấp nhận giả thuyết Ha. Kết luận: Nồng độ của arsenic trong nước ngầm lớn hơn trong nước mặt. Do vậy, có thể kết luận rằng, nguồn gây ô nhiễm arsenic không phải từ nước mặt mà do nguồn gốc tự nhiên có trong lòng địa chất. Cách 2: Sử dụng công cụ Data analysis trong Excel
OF FI
Công cụ thống kê được thực hiện theo trình tự: data/data analysis/t– test: Paired Two Sample for Means
Y
NH
ƠN
Khai báo các thông số Input và Output option như trong hình:
QU
– Variable 1 Range: vị trí dãy số liệu A (chọn cột A); – Variable 2 Range: vị trí dãy số liệu B (chọn cột B); – Hypothesized Mean Difference: giá trị 0 cho H0, giá trị 1 cho Ha;
DẠ Y
KÈ
M
– Output Range: Chọn vị trí xuất kết quả (cùng worksheet, khác worksheet hoặc file mới); Sau đó chọn ok ta thu được kết quả như hình sau:
Chương 3. Kiểm định thống kê và ứng dụng
ƠN
OF FI
CI AL
51
NH
Kết quả thu được tstat ≈ 4.5 > tcrit ≈ 1.8 (upper–tailed), chấp nhận Ha (x̅A > x̅B ). Điều này có nghĩa nồng độ arsenic trong nước ngầm cao hơn với nước mặt, nguồn ô nhiễm của nước ngầm có thể là tự nhiên do địa chất gây nên.
QU
Y
3.2.3. Kiểm định Student cho hai mẫu có phương sai đồng nhất (two– sample assuming equa variance t–test) Giả sử hai tập số liệu A và B có x̅A , x̅B với số giá trị tương ứng của từng tập là NA, NB, khi đó: ̅A− X ̅B X Sd
× √N
(3.7)
M
t stat =
S2A (NA −1)+S2B (NB −1) (NA −1)+(NB −1)
KÈ
Sd = √ 1
1
1
(3.8)
N .N
= N + N → √N = √N A+NB N A
B
A
B
DẠ Y
f = fA + fB = (NA – 1) + (NB – 1) = NA + NB – 2 Giả thuyết thống kê: H0: xA xB , xA tương đồng với xB . Ha: xA xB , xA khác biệt giá trị xB .
(3.9) (3.10)
52
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Kết luận thống kê: – Nếu ׀tstat < ׀t(α,f) (hai phía), chấp nhận H0 tức là x̅A x̅B .
– Nếu ׀tstat ≥ ׀t(α,f) (hai phía), bác bỏ H0, chấp nhận Ha tức là x̅A ≠ x̅B .
OF FI
Các tình huống kiểm định Student hai mẫu có phương sai đồng nhất với giả thuyết Ha là lớn hơn (x̅A > x̅B ) hay nhỏ hơn (x̅A < x̅B ) tương tự như các tình huống trong kiểm định Student liên quan từng đôi một (xem tình huống 2 và 3 mục 3.2.2).
ƠN
Ví dụ 3.4: Hai phương pháp xác định hàm lượng Cu trong mẫu nước bằng phổ hấp thu nguyên tử (AAS) và phương pháp quang phổ phát xạ nguyên tử nguồn cảm ứng cao tần plasma (ICP–AES) được áp dụng phân tích lặp lại cho cùng một mẫu thử thu được kết quả như sau: 3.015
3.019
2.987
2.995
2.904
3.097
3.099
2.987
3.098
2.89
3.101
3.102
2.966
2.987
–
3.005
2.919
2.986
–
Phương pháp AAS 2.978
3.045
2.957
2.906
Y
NH
3.013
Phương pháp ICP–AES
QU
Độ lặp của hai phương pháp là đồng nhất, đánh giá kết quả của hai phương pháp này có khác biệt nhau hay không ở độ tin cậy 95%? Giải:
M
Vì hai tập số liệu là độc lập (đo bằng hai phương pháp khác nhau) và đồng nhất về phương sai. Do vậy giả thuyết thống kê được chọn là:
KÈ
H0: x̅A x̅B Ha: x̅A ≠ xB
Cách 1: Sử dụng công thức tính thông thường
DẠ Y
Áp dụng các công thức tính từ 3.7 đến 3.10 ta thu được bảng các thông số đặc trưng cho từng tập số liệu như sau: Thông số
AAS
ICP–AES
x̅
2.990
3.018
Chương 3. Kiểm định thống kê và ứng dụng 0.004481
f
11
0.004395
CI AL
S2
53
9
0.0667
tstat
–0.97
t(0.05.20) (hai phía)
2.08
OF FI
Sd
׀tstat = ׀0.97 < t(α,20) = 2.08 chấp nhận H0. Vậy hai phương pháp phân tích cho kết quả như nhau. Cách 2: Sử dụng công cụ Data analysis trong Excel
ƠN
Nhập dữ liệu bài toán thành hai cột trong worksheet (mỗi cột là một phương pháp). Chọn công cụ thống kê theo đường dẫn data/data analysis/t–test: Two–Sample Assuming equal Variances.
KÈ
Trong đó:
M
QU
Y
NH
Khai báo các thông số Input và Output option như hình dưới đây:
– Variable 1 Range: vị trí dãy số liệu A (chọn cột A); – Variable 2 Range: vị trí dãy số liệu B (chọn cột B);
DẠ Y
– Hypothesized Mean Difference: nhập giá trị 0;
– Output Range: chọn vị trí xuất kết quả (cùng worksheet, khác worksheet hoặc file mới); Sau đó chọn ok ta thu được bảng kết quả như bảng sau:
54
ƠN
OF FI
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Kết quả thu được tstat ≈ – 0.97, do vậy ׀tstat = ׀0.97 < t(0.05,20) = 2.08, chấp nhận H0. Hai phương pháp phân tích cho kết quả là như nhau.
NH
3.2.4. Kiểm định Student cho hai mẫu không đồng nhất phương sai (two– sample assuming unequal variance t–test )
̅A− X ̅B X Sd ̅
QU
t stat =
Y
Giả sử hai tập số liệu A và B có x̅A , x̅B với số giá trị tương ứng của từng tập là NA, NB, khi đó:
S2
S2
A
B
Sd̅ = √NA + NB 2
(3.12)
2
S S ( A + B )2
M
NA NB 2 2 2 (S2 /N A A ) +(SB /NB ) NA −1 NB −1
KÈ
f=
(3.11)
(3.13)
Sau đó làm tròn bậc tự do từ công thức 3.13 về số tự nhiên để tra giá trị tcrit. Để phép kiểm định cho kết quả chắc chắn hơn, giá trị bậc tự do nên được làm tròn lên (tăng thêm 1 đơn vị) cho dù phần thập phân có nhỏ hơn 5.
DẠ Y
Giả thuyết thống kê: H0: xA xB , xA tương đồng với xB . Ha: xA xB , xA khác biệt giá trị xB . Kết luận thống kê:
Chương 3. Kiểm định thống kê và ứng dụng
55
CI AL
– Nếu ׀tstat < ׀t(α,f) (two–tailed), chấp nhận H0 tức là x̅A x̅B . – Nếu ׀tstat ≥ ׀t(α,f) (two–tailed), bác bỏ H0, chấp nhận Ha tức là x̅A ≠ x̅B .
OF FI
Các tình huống của kiểm định Student hai mẫu có phương sai không đồng nhất với giả thuyết Ha là lớn hơn (x̅A > x̅B ) hay nhỏ hơn (x̅A < x̅B ) hoàn toàn tương tự như các tình huống trong kiểm định Student liên quan từng đôi một (xem tình huống 2 và 3 mục 3.2.2). Ví dụ 3.5: Nồng độ fluoride (ppm) trong mẫu kem đánh răng được xác định bởi hai thực tập sinh phân tích bằng phương pháp điện cực chọn lọc ion (ISE). Kết quả thu được từ phân tích lặp lại năm lần như sau: Thực tập sinh A (ppm): 1392, 1390, 1390, 1391, 1395
ƠN
Thực tập sinh B (ppm): 1413, 1408, 1406, 1420, 1399 a) Mô tả thống kê hai tập dữ liệu và khoảng tin cậy ở 95%.
NH
b) Đánh giá xem giá trị nồng độ trung bình thu được của hai thực tập sinh có khác nhau hay không ở độ tin cậy 95%? Giải:
a) Mô tả thống kê hai tập dữ liệu và khoảng tin cậy ở 95%.
DẠ Y
KÈ
M
QU
Y
Đặc trưng thống kê của hai tập số liệu được mô tả thông qua công cụ Descriptive Statistics trong Excel, kết quả cụ thể như sau:
Độ lệch chuẩn của hai dãy số liệu lần lượt là 2.1 và 7.9.
56
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Khoảng biến thiên mở rộng ở 95% của hai thực tập sinh tương ứng là 3 và 10 ppm. Kết quả phân tích của hai thực tập sinh có thể biểu diễn như sau: xA= 1392 ± 3 (ppm); xB = 1409 ± 10 (ppm) b) Đánh giá xem giá trị nồng độ trung bình thu được của hai thực tập sinh có khác nhau hay không ở độ tin cậy 95%?
Áp dụng công thức ta có: S2
A
B
4.3
̅A− X ̅B X Sd ̅ 2
f=
=
5
= 3.63
1391.6 − 1409.2 3.63
= – 4.84
2
S S ( A + B )2
NA NB 2 2 2 (S2 /N A A ) +(SB /NB ) NA −1 NB −1
= 4.558 ≈ 5
tcrit = t(0.05,5) = 2.57
NH
t stat =
61.7
ƠN
S2
Sd̅ = √NA + NB = √ 5 +
OF FI
Vì giá trị phương sai giữa hai tập là khác nhau nhiều (> 14 lần), ta sử dụng kiểm định Student cho hai mẫu độc lập có phương sai không đồng nhất để so sánh hai giá trị trung bình.
QU
Y
Vì ׀tstat = ׀4.84 > tcrit = 2.57, bác bỏ H0, chấp nhận Ha. x̅A không tương đồng với x̅B . Hai thực tập sinh cho kết quả phân tích khác biệt nhau ở độ tin cậy 95%.
DẠ Y
KÈ
M
Sử dụng công cụ t–test: Two–Sample Assuming Unequal Variances cho kết quả tương tự:
Chương 3. Kiểm định thống kê và ứng dụng
57
CI AL
3.3. Kiểm định Gauss và ứng dụng
OF FI
Kiểm định Gauss (Z–test) về ý nghĩa và ứng dụng tương tự như kiểm định Student. Điểm khác biệt là số lượng mẫu trong tập dữ liệu khi sử dụng Z–test lớn hơn (N ≥ 30) và đại diện hơn so với tập mẫu khi sử dụng t–test. Vì vậy, ở cùng một độ tin cậy nhất định, Z–test cho kết luận chắc chắn hơn so với t–test.
Kiểm định Z có thể được áp dụng cho một tập mẫu hoặc hai tập mẫu. Trong đó, kiểm định Z một tập mẫu là phổ biến và được ứng dụng nhiều trong phòng thử nghiệm. 3.3.1 Kiểm định Z cho một tập mẫu (One–Sample Z–test)
NH
ƠN
Kiểm định Z một tập mẫu được sử dụng để kiểm tra xem giá trị trung bình của một tổng thể là lớn hơn, nhỏ hơn hoặc đồng nhất một giá trị biết trước (giá trị làm chuẩn). Z–test một tập mẫu là công cụ thường được áp dụng để đưa ra kết luận trong hoạt động thử nghiệm thành thạo, đánh giá độ tái lặp, biểu đồ kiểm soát chất lượng (control chart).
x−μ
x−μ
. √N
QU
Zscore = σ/√N =
Y
Giả sử một tập số liệu có N giá trị (N ≥ 30), để kiểm tra giá trị trung bình (x) của tập số liệu này so với giá trị µ cho trước ta sử dụng Z–test với giá trị chuẩn Z được tính theo công thức: σ
(3.14)
Các trường hợp kiểm định Z có thể như sau:
M
– H0: x ≡ μ; Ha: x ≠ μ, dùng chuẩn Z hai phía: Nếu ǀZscore ǀ > Z(α): kết luận Ha và ngược lại.
KÈ
– H0: x ≡ μ; Ha: x > μ, dùng chuẩn Z phía phải Nếu Zscore > Z(α) phía phải: kết luận Ha và ngược lại. – H0: x ≡ μ; Ha: x < μ, dùng chuẩn Z phía trái
DẠ Y
Nếu: Zscore < Z(α) phía trái: kết luận Ha và ngược lại. Ví dụ 3.6: Một lớp 30 sinh viên làm thực nghiệm đo năng lượng hoạt hóa của một phản ứng hóa học thu được giá trị trung bình và độ lệch chuẩn tương ứng là 116 kJ/mole và 29 kJ/mole. Kiểm tra xem giá trị trung bình
58
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
thu được so với giá trị tham chiếu của năng lượng hoạt hóa là 129 kJ/mole ở độ tin cậy là 95% và 99%. Giải:
Giả thuyết thống kê của bài toán:
OF FI
Tập số liệu của bài toán là kết quả thực nghiệm của 30 sinh viên (N ≥ 30), do vậy kiểm định Z một tập mẫu được sử dụng để so sánh giá trị trung bình với giá trị chuẩn. H0: x ≡ μ, giá trị trung bình đồng nhất với giá trị chuẩn Ha: x ≠ μ, giá trị trung bình khác biệt với giá trị chuẩn
Zscore =
X−μ σ
. √N =
116 −129 29
ƠN
Áp dụng công thức 3.14 ta có:
. √30 ≈ –2.46
– Ở độ tin cậy 95%:
– Ở độ tin cậy 99%:
NH
ǀZscore ǀ = 2.46 > Zcrit =1.96, chấp nhận Ha, giá trị trung bình khác biệt với giá trị chuẩn.
Y
ǀZscore ǀ = 2.46 < Zcrit = 2.58, chấp nhận H0, giá trị trung bình tương đồng với giá trị chuẩn.
QU
Từ ví dụ trên cho thấy kết luận thống kê của một phép kiểm định có thể là khác nhau nếu độ tin cậy khác nhau. 3.3.2. Kiểm định Z cho hai tập mẫu (Two–Samples Z–test)
KÈ
M
Tương tự như kiểm định t cho hai tập mẫu, kiểm định Z được dùng để so sánh giá trị trung bình của hai tập mẫu. Đối với những tập mẫu trong thực nghiệm hóa phân tích và hóa học thường có số lượng khảo sát nhỏ hơn 30 thì kiểm định Z ít được sử dụng bằng kiểm định t.
DẠ Y
Giả sử hai tập số liệu A và B có giá trị trung bình lần lượt là x̅A , x̅B với NA, NB là số các số liệu của tập tương ứng. Độ lệch chuẩn lần lượt là σA, σB. Zscore được tính theo biểu thức sau: Zscore =
̅A− X ̅B X σ2 σ2 √ A+ B NA NB
(3.30)
Chương 3. Kiểm định thống kê và ứng dụng
59
Các trường hợp kiểm định Z có thể như sau:
CI AL
Tương tự với kiểm định t cho hai tập số liệu, kết luận thống kê có các trường hợp sau: − H0: x̅A ≡ x̅B ; Ha: x̅A ≠ x̅B , dùng chuẩn Z hai phía. Nếu ׀Zscore > ׀Z(α/2): kết luận Ha và ngược lại
OF FI
− H0: x̅A ≡ x̅B ; Ha: x̅A < x̅B , dùng chuẩn Z phía phải. Nếu Zscore > Z(α) phía phải: kết luận Ha và ngược lại
− H0: x̅A ≡ x̅B ; Ha: x̅A > x̅B , dùng chuẩn Z phía trái. Nếu: Zscore < Z(α) phía trái: kết luận Ha và ngược lại.
NH
ƠN
Ví dụ 3.7: Giá trị trung bình khi phân tích một nguyên tố vi lượng trong 75 mẫu máu hiến tặng của nam giới và 50 mẫu máu của nữ giới lần lượt là 29 và 33 ppm. Đánh giá sự đồng nhất ở độ tin cậy 95% về thành phần nguyên tố vi lượng trong mẫu máu theo giới tính của người hiến tặng. Biết rằng độ lệch chuẩn tương ứng với hai tập mẫu trên là 15.1 ppm đối với nam và 10.5 ppm đối với nữ. Giải:
QU
Giả thuyết thống kê:
Y
Hai tập số liệu có N > 30 nên để so sánh hai giá trị trung bình ta dùng kiểm định Z hai tập mẫu thay cho kiểm định Student. H0: x̅A ≡ x̅B , giá trị trung bình của hai tập mẫu là đồng nhất. Ha: x̅A ≠ x̅B , giá trị trung bình của hai tập là khác biệt.
M
Áp dụng công thức 3.15 ta có: x̅A − x̅B
σ2 σ2 √ A+ B NA NB
KÈ
Zscore =
=
29−33 2
√15.1 +10.5 75
2
= –1.7
50
DẠ Y
׀Zscore = ׀1.7 < Z(0.05) ⁓ 2.0 (độ tin cậy 95%), chấp nhận H0. Có thể kết luận hàm lượng nguyên tố vi lượng trong máu không phụ thuộc vào giới tính.
60
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
3.3.3. Ứng dụng kiểm định Z trong đánh giá kết quả thử nghiệm thành thạo (Proficiency testing–PT)
ƠN
OF FI
Thử nghiệm thành thạo (viết tắt là PT) là việc xác định chất lượng hoạt động thử nghiệm của phòng thí nghiệm (PTN) bằng so sánh liên phòng (Interlaboratory comparison). Thử nghiệm thành thạo được tổ chức thực hiện và đánh giá năng lực thử nghiệm trên cùng một mẫu hoặc các mẫu thử nghiệm tương tự và được thực hiện bởi hai hay nhiều phòng thí nghiệm theo các điều kiện xác định trước. Thử nghiệm thành thạo là một trong những công cụ quan trọng giúp các cơ quan công nhận, cơ quan quản lý nhà nước và khách hàng đánh giá năng lực kỹ thuật của phòng thử nghiệm, phòng xét nghiệm hoặc phòng hiệu chuẩn. Thử nghiệm thành thạo đồng thời cũng giúp các phòng thí nghiệm trong hoạt động kiểm soát chất lượng và chứng minh về năng lực kỹ thuật đối với các bên quan tâm.
M
QU
Y
NH
Tổ chức thử nghiệm thành thạo là một hoạt động có tính chuyên môn cao, được thực hiện bởi những đơn vị có đủ năng lực và được cơ quan quản lý nhà nước công nhận. Mọi hoạt động phải tuân thủ chặt chẽ theo các tiêu chuẩn quốc tế như ISO 13528, ISO 5725–2 và TCVN ISO/IEC 17043:2011. Các bước thực hiện của một chương trình thử nghiệm thành thạo như trình bày trong sơ đồ hình 3.3. Việc đánh giá kết quả của thử nghiệm thành thạo thường được thực hiện dựa trên kết quả của các phép kiểm định thống kê trong đó kiểm định Z là công cụ phổ biến nhất. Giá trị phân tích của một phòng thí nghiệm tham gia được so sánh với giá trị của mẫu thử nghiệm thành thạo thông qua Zscore được tính theo biểu thức sau: (xi −xpt )
KÈ
Zscore =
σpt
DẠ Y
Trong đó: – xi : kết quả phân tích của phòng thí nghiệm thứ i – xpt : giá trị mẫu thử nghiệm thành thạo – σpt : độ lệch chuẩn trong đánh giá thử nghiệm thành thạo
(3.15)
Chương 3. Kiểm định thống kê và ứng dụng
61
CI AL
Trong trường hợp giá trị mẫu thử nghiệm thành thạo có đề cập đến độ không đảm bảo uxpt , giá trị mẫu thử nghiệm thành thạo là xpt ± uxpt , lúc này giá trị Zscore được tính có dạng như sau: ′ Zscore =
(xi −xpt )
(3.16)
2 2 √σpt +uxpt
OF FI
Kết quả thử nghiệm thành thạo được đánh giá theo tiêu chí như trình bày ở bảng 3.3. Bảng 3.3: Tiêu chí đánh giá kết quả thử nghiệm thành thạo theo Zscore Kết luận
׀Zscore ≤ ׀0.5
Rất tốt
0.5 < ׀Zscore ≤ ׀1.0
Tốt
Duy trì
1.0 < ׀Zscore ≤ ׀2.00
Đạt yêu cầu
Duy trì
2.0 ≤ ׀Zscore < ׀3.00
Nghi vấn (cảnh báo)
Cải thiện
3.0 ≤ ׀Zscore׀
Không đạt (kết quả lạc)
Khắc phục
NH
ƠN
Giá trị
Hành động Duy trì
(xi −xpt )
QU
ζscore=
Y
Trong trường hợp kết quả thử nghiệm thành thạo có xét đến độ không đảm bảo đo u(xi ) của từng phòng thí nghiệm tham gia, lúc này Zscore được thay thế bằng Altman Zscore hay con gọi là Zeta score (ζscore) và được tính theo công thức 3.17: √u2 (xi )+u2 (xpt )
(3.17)
M
Về tiêu chí đánh giá, mức ζscore = 2 tương đương với Zscore = 3. Những phòng thí nghiệm cho kết quả PT tương ứng với ζscore ≥ 2 không đạt yêu cầu và cần có hành động khắc phục.
KÈ
3.3.3.1. Xác định giá trị mẫu thử nghiệm thành thạo 𝐱 𝐩𝐭
DẠ Y
Giá trị xpt được ấn định bởi Ban tổ chức thử nghiệm thành thạo, giá trị này được xác định bằng một trong hai cách: (1) giá trị của chất chuẩn, vật liệu chuẩn hoặc giá trị đối chiếu; (2) Giá trị tính toán thống kê từ các kết quả trong đợt thử nghiệm thành thạo của PTN tham gia hoặc từ ít nhất 11 phòng thí nghiệm chuyên gia. Đối với cách 2, giá trị xpt xác định bằng kỹ thuật phân tích dữ liệu lớn Algorithm A với trình tự như sau:
62
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Bước 1: Sắp xếp các giá trị xi của N phòng thí nghiệm tham gia (hoặc phòng thí nghiệm chuyên gia) theo thứ tự từ nhỏ đến lớn, xác định giá trị trung vị (med) của tập số liệu: x1 ; x2 ; x3 ; … ; xN
x* = med(xi) với i=1, 2, 3,...,N s* = 1.483 med ǀxi – x*ǀ với i=1, 2, 3,...,N
OF FI
Bước 2: Gán giá trị ban đầu x* và s* cho phép lặp để tìm giá trị xpt , trong đó: (3.18) (3.19)
Bước 3: Thực hiện phép tính lặp để xác định giá trị xpt Tính δ = 1.5 s*
(3.20)
ƠN
– Hiệu chỉnh lại các giá trị quá lớn hoặc quá nhỏ của tập theo quy tắc:
x ∗ − δ nếu xi < x ∗ − δ = {x ∗ + δ nếu xi > x ∗ + δ xi các trường hợp còn lại
NH
xi∗
(3.21)
– Tính các giá trị mới của x* và s* theo công thức sau:
Y
∗ ∑N i=1 xi
N
(x∗i −x∗ )2
QU
x∗ =
s ∗ = 1.134√∑N i=1
N−1
(3.22) (3.23)
M
Thực hiện phép tính lặp theo các công thức từ 3.20 – 3.23 cho tới khi giá trị của hai lần tính không thay đổi ở chữ số thứ 3 sau dấu phẩy. Giá trị x* thu được chính là giá trị mẫu thử nghiệm thành thạo xpt .
KÈ
3.3.3.2. Xác định độ lệch chuẩn trong thử nghiệm thành thạo 𝛔𝐩𝐭 Độ lệch chuẩn trong đánh giá thử nghiệm thành thạo σpt có thể là một trong 5 trường hợp sau đây:
DẠ Y
(1) 𝜎𝑝𝑡 là giá trị độ lệch chuẩn tính theo Horwitz: Khi C < 1.2 10–7, σpt = 0.22C Khi 1.2 10–7 ≤ C ≤ 0.138, σpt = 0.02C0.8495 Khi C > 0.138 σpt = 0.01C0.5
(3.24)
Chương 3. Kiểm định thống kê và ứng dụng
63
CI AL
(2) 𝜎𝑝𝑡 là giá trị độ lệch chuẩn do Ban tổ chức thử nghiệm thành thạo quyết định và được lựa chọn
Trong trường hợp này, giá trị độ lệch chuẩn σpt cần phải biết thông tin về độ lặp lại và độ tái lặp của phương pháp phân tích.
OF FI
(3) 𝜎𝑝𝑡 là giá trị độ lệch chuẩn thu được từ các kết quả nghiên cứu của một phương pháp có độ chính xác cao σpt = √σ2R − σ2r (1 − 1⁄𝑛) Trong đó:
(3.25)
σR là độ lệch chuẩn tái lặp giữa các phòng thí nghiệm
ƠN
σr là độ lệch chuẩn lặp lại trung bình của các phòng thí nghiệm n là số lần lặp của phòng thí nghiệm
NH
(4) 𝜎𝑝𝑡 là giá trị độ lệch chuẩn từ tập hợp kết quả của các PTN tham gia (kỹ thuật phân tích dữ liệu Algorithm A)
QU
Y
Giá trị σpt có thể dễ dàng xác định được từ kết quả của đợt thử nghiệm thành thạo theo các công thức 3.18 – 3.23. Tuy nhiên, do mức độ tương đồng không cao giữa các đợt thử nghiệm thành thạo khác nhau dẫn tới các phòng thí nghiệm sẽ gặp khó khăn trong việc đánh giá xu hướng hoạt động của đơn vị mình khi so sánh giá trị Zscore ở các chương trình PT khác nhau. (5) 𝜎𝑝𝑡 được tính từ giá trị độ lệch chuẩn chung bằng kỹ thuật phân tích dữ liệu lớn Algorithm S
KÈ
M
Để khắc phục hạn chế đã nêu trên của việc sử dụng σpt tính theo kỹ thuật phân tích Algorithm A. Giá trị σpt được tính từ độ lệch chuẩn của p đợt thử nghiệm thành thạo theo kỹ thuật phân tích Algorithm S với các bước sau:
DẠ Y
Bước 1: Sắp xếp thứ tự từ nhỏ đến lớn các giá trị độ lệch chuẩn thử nghiệm thành thạo của p lần tổ chức khác nhau: w1 ; w2 ; w3 ; … ; wp Bước 2: Gán giá trị ban đầu w ∗ cho phép lặp để tìm giá trị σpt , trong
đó:
w ∗ = med(wi ) với i = 1, 2, 3,..., p
(3.26)
64
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
ψ = ηw ∗ với η là hệ số giới hạn
CI AL
(3.27)
Bước 3: Thực hiện phép tính lặp để xác định giá trị xpt
– Hiệu chỉnh lại các giá trị quá lớn hoặc quá nhỏ của tập theo quy tắc: ψ 𝑤𝑖
nếu 𝑤𝑖 > ψ các trường hơp còn lại
(3.28)
OF FI
wi∗ = {
– Tính các giá trị mới của w* theo công thức p
∑i=1(w∗i )2
w ∗ = ξ√
p
với ξ là hệ số hiệu chỉnh
(3.29)
ƠN
Giá trị hệ số giới hạn η và hệ số hiệu chỉnh ξ phụ thuộc vào bậc tự do (p–1) và có giá trị như trong bảng 3.4
NH
Thực hiện phép tính lặp theo các công thức từ 3.27–3.29 cho tới khi giá trị của hai lần tính không thay đổi ở chữ số khác 0 thứ 3 sau dấu phẩy. Giá trị w * cuối cùng chính là độ lệch chuẩn thử nghiệm thành thạo σpt . Giá trị này có thể được sử dụng cho các đợt thử nghiệm thành thạo khác nhau. Bảng 3.4: Giá trị hệ số giới hạn và hệ số hiệu chỉnh khi xác định độ lệch Hệ số hiệu chính (ξ)
1.645
1.097
1.517
1.054
1.444
1.039
4
1.395
1.032
5
1.359
1.027
KÈ
1
Hệ số giới hạn (η)
QU
Bậc tự do
Y
chuẩn thử nghiệm thành thảo bằng kỹ thuật phân tích dữ liệu Algorithm
6
1.332
1.024
7
1.31
1.021
8
1.292
1.019
9
1.277
1.018
10
1.264
1.017
2
DẠ Y
M
3
S
Chương 3. Kiểm định thống kê và ứng dụng Bắt đầu Kiểm tra phương pháp, pháp chuẩn chuẩn bị bị mẫu mẫu
Giá trị PT và độ không đảm bảo đo có được ấn định trước không?
không
có
có
Sử dụng độ lệch chuẩn theo một cách: - Giá trị được công nhận - Do Ban tổ chức quyết định - Tính theo Horwitz - Từ phương pháp có độ chính xác cao
Tính từ tập hợp kết quả của các PTN tham gia PT
NH
Kiểm tra phương pháp xác định giá trị PT
không
ƠN
Độ lệch chuẩn PT có được xác định trước không?
Áp dụng một trong hai cách xác định: - Từ PTN chuyên gia - Từ các PTN tham gia PT
OF FI
Sử dụng một trong các cách: - Giá trị vật liệu chuẩn - Giá trị chuẩn - Giá trị đối chiếu
CI AL
65
Tiến hành chương trình thử nghiệm thành thạo
QU
Y
Kiểm tra số lần đo lặp
Tính toán thống kết quả thử nghiệm thành thạo
KÈ
M
Tổng hợp kết quả thử nghiệm thành thạo
Thông báo kết quả đến PTN tham gia
Kết thúc
DẠ Y
Hình 3.3. Các bước tiến hành trong tổ chức thử nghiệm thành thạo
Ví dụ 3.8: Đánh giá xem kết quả thử nghiệm thành thạo của 1 phòng thí nghiệm tham gia có kết quả báo cáo là 0.058 ppm. Biết giá trị thử nghiệm thành thạo là 0.050 ppm với độ lệch chuẩn được ban tổ chức ấn định có giá trị σpt = 0.0025 ppm.
66
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Giải: Với giá trị thử nghiệm thành thạo và độ lệch chuẩn đã được ấn định trước, việc đánh giá kết quả thử nghiệm thành thạo rất dễ dàng bằng áp dụng công thức 3.16, kết quả Zscore tính được như sau: (xi −xpt ) σpt
=
(0.058−0.050) 0.0025
= 3.2
OF FI
Zscore =
ƠN
Zscore = 3.2 > 3, phòng thí nghiệm cho kết quả lạc, mức độ thành thạo của phòng thí nghiệm chưa đạt yêu cầu với chỉ tiêu tham gia thử nghiệm thành thạo. Nội bộ phòng thí nghiệm sau khi nhận được thông báo kết quả từ ban tổ chức cần tiến hành phân tích nguyên nhân và khắc phục. Phòng thí nghiệm cần tiếp tục tham gia các đợt thử nghiệm thành thạo khác để đánh giá lại năng lực phân tích của phòng thí nghiệm đối với chỉ tiêu trên.
10.57
10.98
10.72
10.61
10.79
10.83
10.88
10.89
10.43
10.47
10.95
10.99
10.75
11.39
10.55
10.51
11.23
10.67
10.78
10.60
11.05
10.66
10.51
11.39
10.49
10.74
10.95
10.43
11.10
10.69
QU
Y
10.43
NH
Ví dụ 3.9: 32 phòng thí nghiệm tham gia chương trình thử nghiệm thành thạo về chỉ tiêu xác định hàm lượng nước (%) trong nguyên liệu dược phẩm cefixim bằng phương pháp Karl Fischer cho kết quả như bảng sau:
10.83
KÈ
Giải:
M
Sử dụng kỹ thuật phân tích Algorithm A xác định giá trị thử nghiệm thành thạo và độ lệch chuẩn của tập dữ liệu trên, từ đó đánh giá kết quả PT của phòng thí nghiệm cho giá trị 11.39%. Xác định giá trị thử nghiệm thành thạo
DẠ Y
Đối với đợt thử nghiệm được mô tả như đề bài ra, Ban tổ chức chưa ấn định trước giá trị thử nghiệm thành thạo xpt và σpt . Do vậy, các giá trị này cần xác định thông qua tập dữ liệu kết quả báo cáo của các phòng thí nghiệm tham gia. Thực hiện các bước theo kỹ thuật phân tích dữ liệu Algorithm A, áp dụng công thức từ 3.18 đến 3.23, lần lượt ta có: – Gán giá trị ban đầu cho x* và s*
Chương 3. Kiểm định thống kê và ứng dụng
67
s* = 1.483medǀxi – x*ǀ = 1.483×0.2 = 0.2966 δ = 1.5 s*=1.5×0.30 = 0.4449
CI AL
x* = med(xi) = 10.745
x∗ =
∗ ∑N i=1 xi
N
≈ 10.7631
s ∗ = 1.134√∑N i=1
(x∗i −x∗ )2 N−1
≈ 0.2680
δ = 1.5 s* = 1.5×0.2680 ≈ 0.4020
OF FI
– Tính lặp lần 1: Thay thế 3 số hạng lớn x* + δ, tập số liệu không có kết quả nào nhỏ hơn x* – δ
∗ ∑N i=1 xi
N
≈ 10.7608
s ∗ = 1.134√∑N i=1
(x∗i −x∗ )2 N−1
≈ 0.2632
NH
x∗ =
ƠN
– Tính lặp lần 2: Tiếp tục thay thế 3 số hạng lớn x* + δ
δ = 1.5 s*=1.5×0.2632 ≈ 0.3948
– Tính lặp lần 3: Tiếp tục thay thế 3 số hạng lớn x* + δ N
≈ 10.7599
Y
∗ ∑N i=1 xi
(x∗i −x∗ )2
QU
x∗ =
s ∗ = 1.134√∑N i=1
N−1
≈ 0.2614
δ = 1.5 s*=1.5 × 0.2614≈ 0.3921 ∗ ∑N i=1 xi
N
≈ 10.7596
KÈ
x∗ =
M
– Tính lặp lần 4: Tiếp tục thay thế 3 số hạng lớn x* + δ
s ∗ = 1.134√∑N i=1
(x∗i −x∗ )2 N−1
≈ 0.2607
DẠ Y
δ = 1.5 s*=1.5×0.2607 ≈ 0.3911 – Tính lặp lần 5: Tiếp tục thay thế 3 số hạng lớn x* + δ x∗ =
∗ ∑N i=1 xi
N
≈ 10.7594
68
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC (x∗i −x∗ )2 N−1
≈ 0.2604
CI AL
s ∗ = 1.134√∑N i=1
xpt = 10.759 ≈10.76 σpt = 0.260 ≈ 0.26
OF FI
Ta thấy kết quả của x ∗ và s ∗ ở lần lặp thứ 4 và thứ 5 không thay đổi giá trị chữ số thứ 3 sau dấu phẩy, do vậy giá trị thử nghiệm thành thạo và độ lệch chuẩn thu được là:
Đánh giá kết quả thử nghiệm thành thạo của phòng thí nghiệm: Áp dụng công thức 3.15, Zscore của giá trị 11.39 sẽ là: (xi − xpt ) σpt
=
(11.39 − 10.76) 0.26
≈ 2.4
ƠN
Zscore =
NH
Vì 2 < Zscore < 3, phòng thí nghiệm đạt yêu cầu nhưng trong vùng cảnh báo, phòng thí nghiệm cần xem xét để cải thiện hơn về độ chính xác của phép thử. 3.3.4. Ứng dụng kiểm định Z xây dựng biểu đồ kiểm soát (Control Chart)
KÈ
M
QU
Y
Biểu đồ kiểm soát trong phòng thí nghiệm là biểu đồ theo dõi kết quả của các thí nghiệm kiểm soát chất lượng (QC) hoặc các kết quả thử nghiệm thành thạo. Biểu đồ kiểm soát giúp phòng thí nghiệm duy trì tốt các hoạt động đảm bảo chất lượng. Một biểu đồ kiểm soát thường được xây dựng trong một khoảng thời gian dài, thể hiện kết quả QC so với giá trị trung bình (giá trị tham chiếu). Biểu đồ kiểm soát thể hiện đường giá trị trung bình, mức giới hạn cao (UCL–Upper Control Limit), mức giới hạn thấp (LCL–Lower Control Limit). Mốc giới hạn thường được chọn tương ứng với của Zscore là ±2 (mức đạt yêu cầu) hoặc ±3 (mức cảnh báo).
DẠ Y
Đối với kết quả thử nghiệm QC, ngoài việc giá trị cần đạt trong mức đạt yêu cầu, cần phải xem xét xu thế của các lần thí nghiệm QC. Phòng thí nghiệm cần xem xét khi xu thế của biểu đồ kiểm soát trong 05 lần liên tiếp khi mắc sai số hệ thống như: (i) Cùng lệch về một phía so với giá trị chuẩn; (ii) luôn tăng dần hoặc giảm dần; (iii) giá trị không thay đổi (hình 3.4)
Chương 3. Kiểm định thống kê và ứng dụng
OF FI
CI AL
69
ƠN
Hình 3.4. Biểu đồ kiểm soát giá trị QC của phòng thử nghiệm trong các tình trạng: (1) Dao động theo cách ngẫu nhiên xung quanh giá trị mục tiêu trong mức đạt yêu cầu; (2) Giá trị lệch về một phía (sai số hệ thống); (3) Xu hướng tăng
NH
hoặc giảm liên tục (sai số hệ thống); (4) Giá trị nằm trong vùng cảnh báo (nghi vấn); (5) Giá trị nằm ngoài vùng kiểm soát (không đạt).
3.4. Kiểm định Grubbs và ứng dụng (Grubbs’s–test)
QU
Y
Trước khi sử dụng một tập số liệu cho các mục đích cụ thể, cần phải xác định xem các giá trị lớn nhất hoặc nhỏ nhất của tập số liệu đang xét có thật sự là bất thường (outlier) và cần phải loại bỏ khỏi dữ liệu gốc hay không. Grubbs’s–test (G–test) là công cụ thống kê phổ biến được dùng cho mục đích này.
KÈ
M
Về bản chất G–test tương tự như t–test và Z–test, tuy nhiên mức độ chắc chắn của kết luận thống kê của G–test thấp hơn so với t–test và Z– test. Do vậy, G–test thường được sử dụng đánh giá trị sơ bộ những giá trị nghi ngờ là sai số thô (giá trị lớn nhất hoặc nhỏ nhất) trong tập số liệu.
DẠ Y
G–test có thể áp dụng cho một tập giá trị đơn lẻ (một chiều) hoặc cho một tập giá trị lớn bao gồm nhiều tập giá trị thành phần (hai chiều). G–test là công cụ rất hữu hiệu để loại bỏ những dãy số liệu thành phần bất thường so với toàn bộ tập dữ liệu lớn.
70
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Giả sử tập số liệu gồm N tập số liệu thành phần với các giá trị trung bình tương ứng của từng tập là x̅1 , x̅2 , x̅3 ,..., x̅N trong đó x̅max và x̅min là giá trị trung bình lớn nhất và nhỏ nhất. – G–test cho giá trị x̅max được thực hiện với giả thuyết thống kê như sau:
OF FI
H0: x̅max không phải là giá trị bất thường trong tập số liệu. Ha: x̅max là giá trị bất thường trong tập số liệu. Chuẩn G được tính theo biểu thức 3.30: Gmax =
x̅max −x̅ S
(3.30)
ƠN
Với x̅ là giá trị trung bình của toàn bộ tập số liệu lớn.
NH
S là độ lệch chuẩn của tập dữ liệu lớn, S được tính từ phương sai tổng sau khi đã đánh giá tính đồng nhất phương sai theo Cochran’C test (loại trừ những tập số liệu không đồng nhất về phương sai) Giá trị đối sánh Gcrit = G(α, n) có thể tra bảng (bảng A6 phần phụ lục) hoặc được tính theo công thức:
√N
t2α
√
(N,N−2) N−2+t2α ( ,N−2) N
Y
Gcrit =
N−1
(3.31)
QU
Nếu Gmax > Gcrit bác bỏ H0, x̅max là giá trị bất thường cần phải loại bỏ khỏi tập dữ liệu. Ngược lại nếu Gmax < Gcrit chấp nhận H0
M
– G–test cho giá trị x̅min được thực hiện tương tự như x̅max với giả thuyết thống kê: H0: x̅min không phải là giá trị bất thường trong tập số liệu
KÈ
Ha: x̅min là giá trị bất thường trong tập số liệu Gmin =
x̅−x̅min S
(3.32)
DẠ Y
Nếu Gmin > Gcrit bác bỏ H0, x̅min là giá trị bất thường cần phải loại bỏ khỏi tập dữ liệu và ngược lại. – Có thể thực hiện phép kiểm định G cho các giá trị tiếp theo của tập số liệu nếu thấy nghi ngờ là giá trị bất thường.
Chương 3. Kiểm định thống kê và ứng dụng
71
CI AL
Ví dụ 3.10: Kết quả kiểm tra về mức độ hụt khối lượng khi làm khô của một sản phẩm dược đối với 10 mẫu thành phẩm. Mỗi mẫu được phân tích lặp 3 lần. Hãy đánh giá những giá trị bất thường ở độ tin cậy 95% biết rằng phương sai của các thực nghiệm là đồng nhất. x1
x2
x3
1
4.01
4.09
3.93
2
3.91
3.87
3
4.22
4.18
4
4.23
4.23
5
4.34
4.25
6
3.81
7
4.76
8
4.13
9
4.17
10
4.06
3.95 4.26 4.13
ƠN
4.43 3.80
4.79
4.71
4.09
4.18
4.13
4.21
4.05
4.08
NH
3.81
Y
Giải:
OF FI
Mẫu
QU
Tập số liệu của bài toán này gồm 10 tập số liệu thành phần là kết quả phân tích của các mẫu sản phẩm. Việc xác định sản phẩm bất thường là công việc quan trọng của bộ phận QA. Công cụ G–test được lựa chọn để giải quyết vấn đề được đặt ra của bài toán.
KÈ
M
Các thông số chính của tập giá trị và giá trị G được tính toán, tóm lược như trong bảng kết quả sau: Mẫu
M1
M2
M3
M4
M5
M6
M7
M8
M9
M10
4.01
3.91
4.22
4.20
4.11
3.84
4.75
4.13
4.16
4.06
S 2 . 102 0.64
0.16
0.16
0.33
0.81
0.37
0.16
0.20
0.31
0.02
DẠ Y
x̅i
x̅
4.16
S
0.25
x̅max
4.75
72 x̅min
3.84
Gmax
2.355
Gmin
1.287
Gcrit = G(0.05,10) = 2.18 (bảng A6 phần phụ lục)
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
OF FI
– Giá trị Gmax = 2.355 > Gcrit = 2.18, bác bỏ H0. Giá trị max là bất thường, mẫu số 7 có giá trị cao bất thường. – Giá trị Gmin = 1.287 < Gcrit = 2.18, chấp nhận H0. Giá trị min không là giá trị bất thường.
ƠN
Nếu tiếp tục xét giá trị lớn nhất tiếp theo sau khi loại bỏ giá trị bất thường của mẫu số 7: x̅max = 4.22
Gmax = 0.938; Gcrit = G(0.05,9) = 2.11
NH
Vì Gmax = 0.938 < Gcrit = 2.11, giá trị 4.22 không phải là bất thường. Kết luận chung: Kết quả phân tích của mẫu thứ 7 là giá trị bất thường, cần xem xét lại.
Y
3.5. Kiểm định Fisher (F–test) và ứng dụng
QU
Phương sai là đại lượng đặc trưng cho độ lặp của một tập số liệu thực nghiệm. Để so sánh độ lặp giữa hai tập số liệu, kiểm định Fisher là một công cụ hữu hiệu nhất. Với hai tập số liệu A và B có NA, NB giá trị và phương sai lần lượt là và SB2 . Fstat cho F–test được tính theo biểu thức sau:
M
SA2
S2
Fstat = SA2
KÈ
(3.31)
B
DẠ Y
Kiểm định Fisher cho hai tập số liệu trên có thể là một trong các trường hợp được trình bày trong bảng 3.4 Bảng 3.4. Kết luận thống kê cho kiểm định Fisher H0: SA2 ≡ SB2 Ha: SA2 SB2
Ha: SA2 < SB2
Ha: SA2 > SB2
Chương 3. Kiểm định thống kê và ứng dụng
73
Dùng phân phối xác suất Fisher phía trái
Dùng phân phối xác suất Fisher phía phải
Fstat > F(α/2,fA,fB) hoặc
Fstat < F(1–α,fB,fA)
Fstat > F(α,fA,fB)
Fstat < F(1–α/2,fB,fA)
Kết luận Ha
Kết luận Ha
CI AL
Dùng phân phối xác suất Fisher hai phía
OF FI
Kết luận Ha
F–test thường được sử dụng để trả lời các câu hỏi sau đây khi đánh giá các tập số liệu thực nghiệm: – Độ lặp (phương sai) của hai tập số liệu có đồng nhất?
ƠN
– Độ lặp của phương pháp mới có tốt hơn so với phương pháp hiện đang sử dụng?
NH
– Trong phép phân tích phương sai (ANOVA), F–test được sử dụng để đánh giá sự thay đổi của đại lượng ở các mức yếu tố khác nhau (between group) so với độ lặp khi thực hiện thí nghiệm trong cùng một mức (within group).
0.82
0.88
KNV B
0.80
0.75
0.91
0.75
QU
KNV A
Y
Ví dụ 3.10: Độ lặp của phương pháp phân tích aflatoxin tổng (ppb) trong nền mẫu bột đậu nành bằng phương pháp HPLC–FLD được thực hiện bởi hai kiểm nghiệm viên thu được kết quả như sau:
0.88
0.74
0.93
0.81
0.77
0.78
0.83
0.76
0.79
0.89
0.89
0.90
KÈ
Giải:
M
Đánh giá tính đồng nhất về độ lặp của hai nhân viên ở độ tin cậy 95%. Độ lặp của phương pháp nêu trên có đạt yêu cầu theo khuyến cáo của AOAC? Sử dụng công thức tính:
DẠ Y
Áp dụng các công thức tính toán ta thu được kết quả như tóm tắt trong bảng sau: Đại lượng
NV A
NV B
Giá trị trung bình
0.844
0.805
Phương sai
0.00427
0.00329
74
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
0.065
0.057
RSD (%)
7.7
7.0
RSDr =C–0.1505
23.2
23.4 1.3
F(0,05, 9,7)
3.7
OF FI
Fstat
CI AL
Độ lệch chuẩn
Ta thấy Fstat=1.3 < F(0.05,9,8) = 3.7, chấp nhận H0. Hai phương sai là đồng nhất do đó độ lặp của hai nhân viên là tương đồng ở mức tin cậy 95%.
ƠN
Độ lệch chuẩn tương đối (hệ số biến sai) của nhân viên A, B lần lượt là 7.7 và 7.0 nhỏ hơn nhiều so với mức yêu cầu là ⁓ 23%. Do vậy, độ lặp của phương pháp là đạt yêu cầu. Sử dụng Excel:
KÈ
M
QU
Y
NH
Để thực hiện một cách nhanh chóng bài tập này bằng Excel, ta sử dụng công cụ F–test trong Data analysis, nhập số liệu đầu vào (theo cột hoặc dòng), khai báo đầy đủ thông tin cần thiết và vị trí xuất kết quả như trong hình sau đây:
DẠ Y
Chọn ok thu được bảng kết quả:
Chương 3. Kiểm định thống kê và ứng dụng
OF FI
CI AL
75
ƠN
Ta thấy Fstat ≈ 1.3 < Fcrit ≈ 3.7, chấp nhận H0. Hai phương sai là đồng nhất. Do đó, độ lặp của hai nhân viên là tương đồng ở độ tin cậy 95%.
N
Hộp 1
Hộp 2
Hộp 3
Hộp 4
Hộp 5
1
98.79
Y
NH
Ví dụ 3.11: Hàm lượng hoạt chất cefadroxil trong thuốc viên nang Mekocefal được kiểm tra bằng phương pháp HPLC. 5 hộp thuốc mẫu được lấy ngẫu nhiên trên một lô sản phẩm. Thực hiện phân tích lặp 3 lần cho mỗi hộp thuốc, kết quả thu được như bảng sau:
98.83
100.07
98.77
2
99.23
99.07
98.75
99.88
99.08
3
99.43
99.03
98.87
99.24
99.85
QU
99.31
KÈ
Giải:
M
Hàm lượng hoạt chất cefadroxil có đồng đều trong lô thuốc nói trên hay không ở độ tin cậy 95%?
DẠ Y
Trong bài tập này, chúng ta cần đánh giá xem hàm lượng hoạt chất có khác nhau giữa các hộp thuốc (between group) so với sự thay đổi do phép phân tích lặp lại trong mỗi hộp (within group). Về bản chất, việc đánh giá chính là so sánh giữa phương sai giữa và phương sai sai số. Kiểm định Fisher có thể dễ dàng thực hiện và có câu trả lời chính xác cho bài toán này (xem thêm chương 5, bài toán phân tích phương sai 1 yếu tố).
76
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Gọi SA2 là phương sai giữa các nhóm, So2 là phương sai lặp lại trong mỗi nhóm. Giả thuyết thống kê:
H0: S𝐴2 ≡ S02 Phương sai giữa đồng nhất với phương sai lặp lại
Ha: S𝐴2 ≠ S02 Phương sai giữa không đồng nhất phương sai lặp lại.
Hộp 1
Hộp 2
Hộp 3
x̅i
98.79
99.31
98.83
Si2
0.107
0.023
0.004
Hộp 4
Hộp 5
100.07
98.77
0.189
0.309
ƠN
Thông số
OF FI
Trước hết, chúng ta cần tính các giá trị phương sai cho phép kiểm định.
x̅
99.21
– Phương sai lặp lại (within group) n ∑k ̅ i )2 i=1 ∑j=1(xij −x
k(n−1)
=
∑5i=1 ∑3j=1(xij −x̅i )2
NH
So2 =
5(3−1)
= 0.126
– Phương sai giữa các nhóm (between group)
Fstat =
(k−1) S2A S2o
0.326
=
3 ∑5i=1(x̅i −x̅)2 (5−1)
= 0.326
Y
̅ i −x̅)2 n ∑k i=1(x
= 0.126 =2.5
QU
SA2 =
Fcrit = F(0.05, 4, 2) ≈ 19.2
KÈ
M
Ta thấy Fstat = 2.5 << Fcrit =19.2 chấp nhận H0, phương sai giữa đồng nhất với phương sai lặp lại. Hàm lượng hoạt chất cefadroxil là đồng đều trong lô thuốc. 3.6. Kiểm định Chi bình phương (χ2–test) và ứng dụng
DẠ Y
Kiểm định Chi bình phương có nhiều ứng dụng ở các lĩnh vực khác nhau và rất phổ biến trong phép phân tích tương quan không qua tham số. Phân tích tương quan không qua tham số rất tiện lợi khi khảo sát và đánh giá trong y học, xã hội học,... Đối với thực nghiệm hóa học và hóa phân tích, kiểm định Chi bình phương được dùng để kiểm tra xem phương sai
Chương 3. Kiểm định thống kê và ứng dụng
77
CI AL
của một tập mẫu (phương sai mẫu, S2) có bằng một giá trị xác định (phương sai tổng thể, σ2) hay không.
3.6.1. Kiểm định Chi bình phương đánh giá tương quan giữa các yếu tố không qua tham số
OF FI
Bài toán khảo sát mối tương quan giữa hai yếu tố X và Y (Chi–square goodness of fit test) với n mức khảo sát tương ứng với X và m mức khảo sát với Y. Các mức khảo sát có thể là định tính hoặc định lượng, kết quả khảo sát thu được là bảng các giá trị fijo . Bảng 3.5. Biểu diễn kết quả trong kiểm định Chi bình phương
...
Xi
Xn
Y1
o f11
o f21
...
o fi1
o fn1
Y2
o f12
o f22
...
o fi2
o fn2
...
...
...
...
....
...
Yj
f1jo
o f2j
...
fijo
o fnj
Ym
o f1m
o f2m
...
o fim
o fnm
QU
Giả thuyết thống kê:
NH
X2
Y
Y
X1
ƠN
X
H0: X không ảnh hưởng đối với Y; Ha: X ảnh hưởng đối với Y.
M
χ2stat = ∑ni=1 ∑m j=1
feij
o m o ∑n i=1 fj ∑j=1 fi
KÈ
Với fije =
(f0ij −feij )2
∑ fo ij
(3.32)
là tần suất mong muốn (expected frequency)
hay tần suất/giá trị trung bình.
(3.34)
DẠ Y
Để thuận lợi trong tính toán, từ bảng số liệu nghiên cứu ta thực hiện các phép tổng cột, hàng, tính tần suất trung bình (tần suất mong muốn fije ) sau đó áp dụng công thức 3.32 tính giá trị χ2stat .
78
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Bảng 3.6: Giá trị tổng theo cột và hàng trong tính toán ꭓ2–test Tổng
X X2
...
Xi
Xn
Y1
o f11
o f21
...
o fi1
o fn1
R1
Y2
o f12
o f22
o fi2
o fn2
R2
...
...
...
Yj
f1jo
o f2j
...
Ym
o f1m
o f2m
...
C1
C2
C3
Tổng cột
...
OF FI
Y
dòng
X1
....
...
...
fijo
o fnj
Rj
o fim
o fnm
Rm
Ci
Cn
fijo
ƠN
Bảng 3.7: Giá trị tần suất mong đợi trong tính toán ꭓ2–test X
...
Xi
Xn
Y1
e f11
e f21
...
e fi1
e fn1
Y2
e f12
e f22
...
e fi2
e fn2
...
...
...
f1je
QU
Yj
Y
Y
X2
NH
X1
Ym
e f1m
...
....
...
e f2j
...
fije
e fnj
e f2m
...
e fim
e fnm
Kết luận thống kê:
2 – Nếu χ2stat > χ2α/2,f hoặc χ2stat < χ1−α/2,f (hai phía), kết luận Ha, X ảnh
M
hưởng đối với Y.
KÈ
– Hoặc nếu p–value (χ2stat , f) < 0.05, kết luận Ha. Với bậc tự do f = (n–1)(m–1).
DẠ Y
Ta có thể sử dụng hàm Excel để thực hiện kiểm định Chi bình phương một cách nhanh chóng sau khi lập giá trị trung bình/mong đợi (fije ) theo cú pháp:
fx= CHITEST(actual_range, expected_range)
Chương 3. Kiểm định thống kê và ứng dụng
79
CI AL
Trong đó: Actual_range là vị trí bảng số liệu fijo ; Expected_range là vị trí bảng số liệu fije .
Kết quả phép kiểm định được trả về giá trị p–value, nếu p–value ≤ 0.05 (mức 95%) thì kết luận Ha và ngược lại.
OF FI
Ví dụ 3.12: Số lượng dụng cụ thủy tinh bị vỡ được quan sát đối với 4 nhân viên phòng thí nghiệm lần lượt là 23, 16, 11, 8. Thời gian làm việc trong phòng thí nghiệm của các nhân viên là như nhau, hãy đánh giá xem kỹ năng sử dụng dụng cụ thủy tinh của các nhân viên có đồng đều hay không ở độ tin cậy 95%?
ƠN
Giải:
NH
Mặc dù khi nhìn về giá trị những con số, chúng ta thấy tần suất dụng cụ bị làm vỡ bởi các nhân viên là khác nhau, tuy nhiên để kết luận một cách chắc chắn bằng toán học thống kê, kiểm định ꭓ2 là công cụ hữu hiệu trong trường hợp này. Giả thuyết thống kê:
Y
Ho: số lần làm vỡ dụng cụ của các nhân viên là tương đồng Ha: có ít nhất 1 nhân viên có số lần làm vỡ dụng cụ khác biệt với còn lại.
QU
– Tần suất quan sát được fio đối với tập số liệu này là 23, 16, 11, 8 – Tần suất mong đợi (tần suất trung bình): ∑4i=1 f0i 4
=
58 4
=14.5
M
fie =
Số liệu được trình bày như trong bảng sau: (O – E)
(O − E)2 E
14.5
8.5
4.98
16
14.5
1.5
0.16
11
14.5
–3.5
0.84
8
14.5
–6.5
2.91
0
8.90
Tần suất
sát (O)
mong đợi (E)
23
DẠ Y
KÈ
Tần suất quan
Tổng
80
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Bậc tự do của tập số liệu f = 4 –1 = 3 χ2crit = χ2 (0.05,3) ≈ 7.8 (bảng A6, phụ lục)
CI AL
χ2stat = ∑ χ2ij = 8.90
OF FI
Ta thấy χ2stat = 8.9 > χ2crit = 7.8, bác bỏ Ho, chấp nhận Ha, có ít nhất 1 nhân viên có số lần làm vỡ dụng cụ khác biệt các nhân viên còn lại. Cách 2: Dùng hàm Excel
Y
NH
ƠN
Nhập số liệu dạng bảng tần suất quan sát (fijo ) và tần suất mong đợi (fije ) và sử dụng hàm CHITEST như hình dưới đây:
QU
Giá trị thu được p–value = 0,031 < 0,05, chấp nhận Ha, có ít nhất 1 nhân viên có số lần làm vỡ dụng cụ khác biệt với các nhân viên còn lại. 3.6.2. Kiểm định Chi bình phương đánh giá đồng nhất phương sai mẫu và phương sai chuẩn cho trước
KÈ
M
Trong trường hợp muốn so sánh độ lặp lại của một tập mẫu so với độ lệch chuẩn cho trước theo yêu cầu kỹ thuật, kiểm định χ2–test có tham số là công cụ để thực hiện (công thức 2.12). χ2stat =
DẠ Y
– Nếu
(N−1)S2
σ2 2 χstat > χ2α/2,f
2 hoặc χ2stat < χ1−α/2,f (hai phía) kết luận Ha, S2 ≠ σ2
2 – Nếu χ2stat > χ1−α,f (phía phải) kết luận Ha, S2 > σ2
– Nếu χ2stat < χ2α,f (phía trái) kết luận Ha, S2 < σ2.
Chương 3. Kiểm định thống kê và ứng dụng
81
CI AL
Ví dụ 3.13: Kết quả đo lặp trên mẫu chuẩn của một thiết bị phân tích thu được như dãy số liệu: 10.0012, 10.0015, 10.0011, 10.0014, 10.0018 và 10.0016. Với yêu cầu kỹ thuật là σ = 0.0002, thiết bị này có còn tốt để sử dụng? Giải:
OF FI
Đối với thiết bị đo lường, độ lặp của thiết bị là thông số quan trọng nhất khi xem xét rằng thiết bị đó có còn tốt để sử dụng hay không. Phép đo lặp phải được thực hiện giống nhau từ các lần đo để giảm thiểu sự ảnh hưởng của các yếu khác ngoài độ chính xác của thiết bị. Kiểm định χ2–test được áp dụng để giải quyết cho bài toán này. Ho: S 2 ≡ σ2 thiết bị còn tốt
ƠN
– Giả thuyết thống kê:
– Tính toán thống kê: 1
NH
Ha: S 2 ≠ σ2 thiết bị xuống cấp, cần xem xét –8 2 s 2 = N−1 ∑N i=1(xi − x) = 6.668.10
χ2stat =
(N−1) σ2
=
(6−1)6.668.10−8 0.00022
≈ 8.3
QU
– Kết luận:
Y
χ2crit = χ2(0.05, 5) ≈ 12.8 (bảng A7, phụ lục) χ2stat = 8.3 < χ2crit = 12.8 chấp nhận H0, thiết bị còn hoạt động tốt.
M
3.6.3. Kiểm định Chi bình phương đánh giá đồng nhất nhiều phương sai (Bartlett test)
DẠ Y
KÈ
Một tập dữ liệu lớn bao gồm k tập số liệu nhỏ được khảo sát với một mục đích nhất định cần được đánh giá xem phương sai của k dãy số liệu thành phần có đồng nhất hay không trước khi sử dụng chúng. Ví dụ khi đánh giá độ lặp trong phê duyệt phương pháp phân tích cần thực hiện bởi nhiều kiểm nghiệm viên phân tích lặp trên cùng một mẫu thử, mức độ thành thạo (độ lặp) có đồng nhất hay không sẽ được xem xét bằng kiểm định χ2. Giả sử một tập số gồm k dãy số liệu nhỏ với các phương sai Si2 và bậc tự do tương ứng fi, giả thuyết thống kê cho phép kiểm định sẽ là:
82
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Ho: S12 = S22 = S32 = ⋯ = Sk2 Ha: Có ít nhất 1 cặp Si2 ≠ Sj2 2 (N−k) ln S2p −∑k i=1 fi lnSi
1+
(3.35)
1 1 1 (∑k − ) 3k−3 i=1fi N−k
Trong đó: – Si2 : là phương sai của tập thứ i
OF FI
χ2stat =
– Sp2 : là phương sai của toàn bộ tập N số liệu, bao gồm tất cả các tập số liệu nhỏ. χ2crit = χ2 (α, k–1) (3.36) Nếu χ2stat < χ2crit kết luận Ho, ngược lại χ2stat > χ2crit kết luận Ha
ƠN
Ví dụ 3.14: Kết quả phân tích lặp về độ hòa tan của một loại thuốc trong 5 hộp được lấy ngẫu nhiên, mỗi hộp thuốc được phân tích lặp sáu lần, mỗi lần một viên và thu được kết quả về độ hòa tan của như sau: 101.47
101.66
103.77
101.71
102.01
100.96
Hộp 2
100.86
100.98
102.12
101.37
101.38
100.22
Hộp 3
101.16
99.69
100.22
99.47
102.46
101.2
Hộp 4
103.49
101.81
100.97
102.83
103.14
98.65
Hộp 5
102.26
99.52
99.73
100.51
102.04
101.14
QU
Y
NH
Hộp 1
Đánh giá tính đồng nhất về độ hòa tan của thuốc trong mỗi hộp thuốc nói trên với độ tin cậy 95%.
M
Giải:
KÈ
Trong bài tập này, mức độ đồng nhất của thuốc có trong từng hộp được thể hiện qua các giá trị phân tích lặp trong từng hộp thuốc. Về mặt thống kê, điều này đồng nghĩa với việc xem xét phương sai của 5 hộp thuốc có sự khác biệt hay không. Do vậy, χ2–test là công cụ thống kê phù hợp để thực hiện việc đánh giá này.
DẠ Y
Giả thuyết thống kê của bài toán:
Ho: S12 = S22 = S32 = ⋯ = S52 , độ hòa tan của thuốc trong mỗi hộp là đồng nhất.
Chương 3. Kiểm định thống kê và ứng dụng
83
đồng nhất .
CI AL
Ha: Có ít nhất 1 cặp Si2 ≠ Sj2 , ít nhất 1 hộp thuốc có độ hòa tan không Để thuận lợi cho tính toán, các thông số thành phần của công thức 3.35 được trình bày như bảng dưới đây: Si2
Hộp 1
5
0.2
0.933
Hộp 2
5
0.2
0.404
Hộp 3
5
0.2
1.265
Hộp 4
5
0.2
3.265
Hộp 5
5
0.2
1.325
Tổng
25
1.0
fi Si2
7.192
fi lnSi2
4.666
–0.069
2.020
–0.906
6.323
0.235
16.323
1.183
6.626
0.282
OF FI
1/fi
ƠN
fi
35.958
0.725
Phương sai tổng của toàn bộ tập dữ liệu là Sp2 = 1.495 2 (N−k) ln S2p −∑k i=1 fi lnSi
1+
=
(30−5) ln 1.495−0.725
NH
χ2stat =
1 1 1 (∑k − ) 3k−3 i=1fi N−k
1+
1 1 (1− ) 18−3 30−5
= 8.77
χ2crit = χ2 (α, k–1) =χ2 (0.05, 5) = 11.07 (bảng A7, phụ lục).
QU
Y
χ2stat = 8.77 < χ2crit = 11.07, phương sai của 5 tập số liệu là đồng nhất, hay độ hòa tan của thuốc trong mỗi hộp là đồng nhất với nhau. 3.7. Kiểm định Cochran và ứng dụng
KÈ
M
Tương tự χ2–test, kiểm định Cochran có thể được sử dụng khi có tham số (Cochran’ C test) và không tham số (Cochran’ Q test). Trong đó kiểm định có tham số Cochran’ C test được sử dụng phổ biến trong lĩnh vực hóa học.
DẠ Y
Về ý nghĩa thống kê, Cochran’ C test dùng để đánh giá tính đồng nhất thống kê của một tập dữ liệu lớn bao gồm nhiều tập số liệu nhỏ thành phần với phép so sánh phương sai một dãy số liệu con với tổng các phương sai của tập lớn. Điều này cho phép Cochran’ C test đưa ra kết luận rằng dãy số liệu thành phần đang xem xét có phương sai khác biệt hay không với các tập còn lại, từ đó quyết định giữ hay loại bỏ những thí nghiệm này. Do vậy, Cochran’ C test được sử dụng để kiểm tra những thí nghiệm có độ lặp
84
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
đạt yêu cầu trong thiết kế thực nghiệm hoặc có thể sử dụng để đánh giá tính đồng nhất mẫu tập số liệu thử nghiệm thành thạo và các ứng dụng khác.
OF FI
Giả sử một tập số liệu bao gồm N tập số liệu nhỏ. Mỗi tập số liệu thành 2 phần có n giá trị với các phương sai tương ứng là S12 , S22 , S32 ,..., SN . Sj2 là phương sai của tập thứ j cần xem xét, thông thường tập thứ j là tập có phương sai lớn nhất so với các tập còn lại. Giả thuyết thống kê:
2 Ho: S12 = S22 = S32 = ⋯ = SN , tất cả các phương sai là đồng nhất.
Ha: ít nhất một phương sai lớn hơn các phương sai khác trong tập số
ƠN
liệu.
Biểu thức tính của Cochran’ C test: S2
Cstat = ∑N j S2
(3.37)
NH
i=1 i
Nếu Cstat < Ccrit (α, n, N), kết luận Ho và ngược lại.
Y
Tại một độ tinh cậy nhất định có thể tra bảng giá trị Ccrit hoặc tính theo biểu thức sau: N−1
−1
Ccrit (α, n, N) = [1 + F(α/N,(n−1),(N−1)(n−1)]
QU
(3.38)
Với F là hằng số Fisher với độ tin cậy α/N, các bậc tự do lần lượt là (N–1) và (N–1)(n–1).
DẠ Y
KÈ
M
Ví dụ 3.15: 15 phòng thí nghiệm tham gia một chương trình thử nghiệm thành thạo với một phép thử bằng phương pháp UV–Vis trên 02 mẫu lặp. Dùng kiểm định thống kê xác định phòng thí nghiệm nào là không đồng nhất phương sai với toàn bộ tập số liệu. PTN
x1
x2
1
22.62
22.63
2
24.35
24.78
3
21.21
22.3
4
23.19
23.65
Chương 3. Kiểm định thống kê và ứng dụng 24.93
25.07
6
24.58
24.61
7
22.69
22.6
8
22.16
22.24
9
19.62
19.7
10
23.37
11
23.85
12
23.97
13
22.52
14
24.71
24.59
15
22.72
23.69 23.94 23.92
ƠN
22.87
23.21
NH
Giải:
CI AL
5
OF FI
85
Y
Tập số liệu là kết quả phân tích của 15 phòng thí nghiệm, mỗi phòng thí nghiệm đều có phương sai lặp lại riêng. Do vậy, để xác định xem phòng thí nghiệm nào có phương sai không đồng nhất với toàn bộ tập dữ liệu thì Cochran’ C test cho phép thực hiện điều này một cách thuận lợi nhất.
QU
Giả thuyết thống kê của bài toán: 2 Ho: S12 = S22 = S32 = ⋯ = S15 , phương sai của các phòng thí nghiệm là đồng nhất.
giá trị khác
M
Ha: Sj2 > Si2 , ít nhất 1 phòng thí nghiệm có phương sai lớn hơn các
KÈ
Áp dụng công thức 3.35 tính Ci cho từng phòng thí nghiệm thu được bảng kết quả: x1
x2
Si2
Ci
1
22.62
22.63
0.0000
0.000
2
24.35
24.78
0.0924
0.087
3
21.21
22.3
0.5941
0.561
4
23.19
23.65
0.1058
0.100
DẠ Y
PTN
86
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
24.93
25.07
0.0098
0.009
6
24.58
24.61
0.0005
7
22.69
22.6
0.0040
8
22.16
22.24
0.0032
9
19.62
19.7
0.0032
10
23.37
23.69
0.0512
0.048
11
23.85
23.94
0.0040
0.004
12
23.97
23.92
0.0012
0.001
13
22.52
22.87
0.0613
0.058
14
24.71
24.59
0.0072
0.007
15
22.72
23.21
0.1201
0.113
CI AL
5
0.000 0.004 0.003
ƠN
OF FI
0.003
NH
Tra bảng với α = 0.05, n =2, N=15 Ccrit = 0.471 (Bảng A9 Phụ lục).
QU
BÀI TẬP CHƯƠNG 3
Y
Phòng thí nghiệm thứ 3 có Cstat = 0.561 > Ccrit = 0.471, do vậy phương sai của phòng thí nghiệm này là khác biệt so với các phòng thí nghiệm còn lại.
M
Bài tập 3.1: Một nhà cung cấp vải nguyên liệu cho một cơ sở sản xuất may. Tiêu chuẩn về độ bền kéo trung bình nhỏ nhất là 200 psi. Kết quả kiểm tra ngẫu nhiên 04 mẫu cho giá trị trung bình là 214 psi. Đánh giá chất lượng lô hàng ở 95% biết phương sai cho phép kiểm định chấp nhận là 100 psi2.
DẠ Y
KÈ
Bài tập 3.2: Một nghiên cứu về hàm lượng (hoạt độ) của monoamine oxidase trong tiểu cầu của 43 bệnh nhân tâm thần phân liệt có giá trị trung bình là 2.69 với độ lệch chuẩn là 2.30. Hàm lượng này đối với 45 người bình thường là 6.35 với độ lệch chuẩn 4.03. Dùng kiểm định thống kê kiểm tra kết luận mức monoamine oxidase trung bình đối với người bình thường ít nhất gấp đôi mức trung bình đối với bệnh nhân tâm thần phân liệt.
Chương 3. Kiểm định thống kê và ứng dụng
87
1
2
3
4
5
6
7
Đầu kim 1
3
7
4
8
3
2
9
Đầu kim 2
3
6
3
8
2
8
9
10
5
4
3
5
5
OF FI
Thí nghiệm
CI AL
Bài tập 3.3: Một thiết bị kiểm tra độ cứng của vật liệu sử dụng hai đầu kim khác nhau trên cùng một mẫu. Thực hiện kiểm tra trên 10 mẫu khác nhau thu được kết quả như sau:
4
9
4
Sử dụng kiểm định thống kê đánh giá xem kết quả phân tích có phụ thuộc vào thiết bị khác nhau.
ƠN
Bài tập 3.4: Yêu cầu về độ nhớt của một loại chất tẩy rửa lỏng trung bình là 800 centistokes ở 25∘C. Kiểm tra ngẫu nhiên 16 mẻ thành phẩm được thu được độ nhớt trung bình là 812. Sử dụng kiểm định thống kê đánh giá chất lượng của các sản phẩm nói trên biết rằng độ lệch chuẩn là 𝜎 = 25 centistokes, độ tin cậy là 95%.
NH
Bài tập 3.5: Một thiết bị thử nghiệm cũ được sử dụng để giám sát đầu ra của quy trình sản xuất. Thiết bị này bị nghi ngờ về độ chính xác trong phép đo. Để kiểm tra thiết bị này người ta thực hiện đo lặp lại và đối chứng với thiết bị mới còn tốt trên cùng mẫu đo. Kết quả thu được như sau:
Y
Thiết bị cũ: phương sai là 14.3 ứng với n = 12
QU
Thiết bị mới: phương sai là 11.2 với n = 10. Sử dụng kiểm định thống kê xác định xem thiết bị cũ còn đạt yêu cầu về độ chính xác của phép đo ở độ tin cậy 95%.
KÈ
M
Ví dụ 3.6: Một thực phẩm chức năng bổ sung vitamin được thử nghiệm trên 10 tình nguyện viên xem có tác dụng làm tăng sức nâng vật nặng của cơ thể. Kết quả kiểm tra sức nâng (tính bằng kg) của tình nguyện viên trước và sau khi sử dụng sản phẩm và tập luyện một tháng thu được trong bảng bên dưới đây: 2
3
4
Trước sử dụng (A) 95
104
83
93
119 115
Sau sử dụng (B)
107
81
93
DẠ Y
Tình nguyện viên
1
99
5
6
7
8
9
10
99
112
98
89
123 114 101 116 100
84
88
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Hãy sử dụng kiểm định thống kê đánh giá xem loại thực phẩm chức năng trên có tác dụng rõ ràng ở độ tin cậy 95% hay không?
OF FI
Bài tập 3.7: Trong nghiên cứu và phát triển sản phẩm thuốc bảo vệ thực vật Inip 650EC (hoạt chất chính là chlorpyrifos ethyl ≈ 53%), để đánh giá hạn sử dụng của thuốc trong hai năm có còn đảm bảo hàm lượng không. Người ta tiến hành xác định hàm lượng hoạt chất chlorpyrifos ethyl bằng phương pháp HPLC–UV trước và sau xử lý gia nhiệt ở 54oC trong 14 ngày (tương đương với bảo quản 2 năm theo điều kiện bảo quản ở nhiệt độ thường) được thu thập ở bảng bên dưới. Hãy sử dụng đánh giá thống kê xem hàm lượng hoạt chất này có ổn định trong 2 năm bảo quản không ở độ tin cậy 95%. Trước xử lý
1
52.624
2
53.037
3
52.816
53.408
4
53.248
53.161
5
52.889
52.663
6
52.933
NH
KÈ
M
9
52.898 52.909
Y
8
Sau xử lý
52.994
53.201
53.173
53.021
52.902
52.989
52.980
53.123
53.082
QU
7
10
ƠN
N
Tài liệu tham khảo 1.
DẠ Y
2.
Alexey L. Pomerantsev, Chemometrics in Excel, John Wiley & Sons, Inc (2014). Lehmann Erich L., Joseph P. Romano, Testing statistical hypotheses, Springer Science & Business Media (2006). James N. Miller, Jane C. Miller, Robert D. Miller, Statistics and Chemometrics for Analytical Chemistry, 7th Edition, Pearson Education Limited (2018).
3.
Chương 3. Kiểm định thống kê và ứng dụng
6.
DẠ Y
KÈ
M
QU
Y
NH
ƠN
7.
CI AL
5.
International Standard, General requirements for the competence of testing and calibration laboratories, ISO/IEC 17025 (2017). International Standard, Statistical methods for use in proficiency testing by interlaboratory comparison, ISO 13528:2015 (2015). International Standard, Accuracy (trueness and precision) of measurement methods and results – Part 2: Basic method for the determination of repeatability and reproducibility of a standard measurement method, ISO 5725–2, 2nd (2019). Tiêu chuẩn Quốc gia, Phương pháp thống kê dùng trong thử nghiệm thành thạo bằng so sánh liên phòng thí nghiệm, TCVN 9596:2013 (2013).
OF FI
4.
89
90
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Chương 4
XỬ LÝ THỐNG KÊ TRONG THẨM ĐỊNH PHƯƠNG PHÁP PHÂN TÍCH
ƠN
OF FI
Thẩm định phương pháp phân tích là quá trình khẳng định độ chính xác của phương pháp bằng cách kiểm tra và cung cấp bằng chứng khách quan cho thấy các yêu cầu kỹ thuật đã được đáp ứng. Để đảm bảo độ chính xác trong phân tích và kiểm nghiệm, phương pháp sử dụng cần phải được thẩm định với điều kiện nguồn lực cụ thể của phòng thí nghiệm (còn được gọi là xác nhận giá trị sử dụng của phương pháp). Thẩm định phương pháp có hai dạng:
NH
(1) Đối với phương pháp tiêu chuẩn: Thẩm định phương pháp là quá trình đánh giá phương pháp tiêu chuẩn được áp dụng trong hệ thống điều kiện tiêu chuẩn về thiết bị, hoá chất, tiện nghi môi trường của một phòng thí nghiệm cụ thể có đạt yêu cầu hay không (method verification).
QU
Y
(2) Đối với phương pháp không tiêu chuẩn, hoặc phương pháp do phòng thí nghiệm phát triển: Thẩm định phương pháp là quá trình đánh giá phương pháp dựa trên kết quả phân tích cùng một mẫu thử khi sử dụng một phương pháp tiêu chuẩn khác hoặc dựa trên việc phân tích các mẫu chuẩn được chứng nhận (method validation).
M
Những thông số cơ bản cần xác nhận giá trị trong thẩm định phương pháp bao gồm: tính đặc hiệu, tính chọn lọc; giới hạn phát hiện, khoảng định lượng; độ lặp, độ đúng, độ không đảm bảo đo của phương pháp.
KÈ
4.1. Tính đặc hiệu, tính chọn lọc 4.1.1 Tính đặc hiệu (Specificity)
DẠ Y
Tính đặc hiệu của phương pháp phân tích là khả năng phát hiện rõ ràng một chất cần phân tích với sự có mặt của các thành phần khác trong nền mẫu. Những chất có tính chất tương tự giống với chất phân tích như các đồng phân, tiền chất, chất chuyển hóa có khả năng gây cản trở hoặc gây nhiễu tín hiệu đối với chất cần phân tích.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
91
CI AL
Một phương pháp phân tích có tính đặc hiệu cao nếu: (i) có tín hiệu đặc trưng rõ ràng khi có mặt chất phân tích (với một lượng đủ nhỏ ở gần giới hạn phát hiện); (ii) Không cho tín hiệu đặc trưng khi không có mặt chất phân tích nhưng có sự tồn tại của các chất gây cản trở như đã đề cập ở trên.
OF FI
Tùy theo phương pháp phân tích cụ thể mà tính đặc hiệu được xem xét dưới cách tiếp cận khác nhau, nhìn chung có hai nhóm cơ bản: (1) nhóm các phương pháp phổ thông thường như quang phổ, sắc ký,... tính đặc hiệu dựa vào peak tín hiệu; (2) nhóm khối phổ dựa vào mảnh ion đặc trưng (ion sơ cấp, precursor ion) hoặc/và ion thứ cấp (product ion).
ƠN
Để xác định tính đặc hiệu của phương pháp cần thực hiện các thí nghiệm sau: (1) Phân tích mẫu trắng: Mẫu trắng cần được phân tích lặp lại ít nhất 6 lần, mẫu trắng là mẫu thực nhưng không có tín hiệu của chất phân tích.
Y
NH
(2) Phân tích mẫu trắng thêm chuẩn: nồng độ chất phân tích thêm chuẩn ở khoảng giới hạn phát hiện (⁓LOD), có thể sử dụng nhiều hơn một mức nồng độ thêm chuẩn để khẳng định sự đáp ứng của tín hiệu với nồng độ chất phân tích.
QU
(3) Phân tích mẫu trắng thêm chuẩn các chất cản trở (nếu có).
M
Đối chiếu các kết quả thu được ta có thể kết luận tính đặc hiệu của phương pháp. Một phương pháp có tính đặc hiệu cao nếu tín hiệu đặc trưng của thí nghiệm (2) là rõ ràng, đồng thời thí nghiệm (1) và (3) không cho tín hiệu của chất phân tích.
DẠ Y
KÈ
Đối với các phương pháp ghép khối phổ, ta vẫn sử dụng các thí nghiệm như trên, tuy nhiên để xem xét độ đặc hiệu của phương pháp cần xét đến số lượng, tín hiệu của mảnh phổ đặc trưng. Mảnh phổ đặc trưng là các ion sơ cấp (precursor fragment) đối với một lần khối phổ và các mảnh phổ thứ cấp (product fragments) đối với phương pháp hai hoặc nhiều lần khối phổ. Tính đặc hiệu của phương pháp ghép khối phổ thông qua chế độ quét phổ toàn bộ (full scan) hoặc chế độ chọn lọc ion SIM (selective ion mode). Trong trường hợp quét phổ toàn bộ, tính đặc hiệu của phép phân tích được xác định bởi ít nhất 04 mảnh phổ có cường độ tương đối (relative abundant)
92
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
lớn hơn 10% đồng thời 4 ion này phải nằm trong dung sai tối đa cho phép của cường độ tương đối (bảng 4.1). Bảng 4.1: Dung sai tối đa cho phép của các mảnh ion trong xác định tính đặc hiệu của các phương pháp sắc ký ghép khối phổ. Dung sai đối với
GC–MS (CI), GC–MSn
đối (relative intensity)
GC–MS (EI)
LC–MS, LC–MSn
> 50%
± 10%
20 % – 50%
± 15%
20 % – 50%
± 20%
≤ 10%
± 50%
OF FI
Mức cường độ tương
± 20% ± 25% ± 30%
ƠN
± 50%
NH
Khi chạy chế độ SIM, tính đặc hiệu của phương pháp được xác nhận thông qua số điểm nhận dạng (IP– identification point), số điểm IP càng cao độ chắc chắn trong xem xét tính đặc hiệu càng cao. Số điểm IP là khác nhau trong từng phương pháp sắc ký ghép khối phổ khác nhau như được trình bày trong bảng 4.2 (theo tiêu chuẩn 2002/657/EC). khối phổ.
QU
Phương pháp MS
Y
Bảng 4.2: Số lượng điểm IP tương ứng với các phương pháp sắc ký ghép
Số lượng ion
Số IP
n
n
GC–MS (EI và CI)
2 (EI) + 2 (CI)
4
GC–MS (EI hoặc CI) 2 dẫn xuất
2 (dẫn xuất A) + 2 (dẫn xuất B)
4
n
n
HRMS
n
2n
GC–MS/MS
1 ion mẹ hai ion con
4
GC–MS/MS
2 ion mẹ, mỗi ion mẹ có 1 ion con
5
LC–MS/MS
1 ion mẹ hai ion con
4
LC–MS/MS
2 ion mẹ, mỗi ion mẹ có 1 ion con
5
LC–MS/MS/MS
1 ion mẹ, 1 ion con, 2 ion cháu
DẠ Y
KÈ
LC–MS
M
GC–MS (EI hoặc CI)
5.5
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
93
OF FI
CI AL
Tùy vào nhóm chất cần phân tích mà số điểm IP yêu cầu tối thiểu là khác nhau. Ví dụ số điểm IP tối thiểu là 4 cho nhóm chất có tác dụng đồng hóa và các chất cấm; số IP tối thiểu là 3 đối với nhóm thuốc thú y và chất gây ô nhiễm (bảng 4.3). Ngoài yêu cầu về số IP tối thiểu thì tỉ lệ tín hiệu của các ion cũng cần được đánh giá. Ít nhất 1 ion có tín hiệu lớn hơn 3 lần so với nền mẫu. Bảng 4.3: Phân loại nhóm chất theo tiêu chuẩn 96/23/EC
Nhóm B: nhóm chất thuốc thú y và
đồng hóa và chất cấm, IP ≥ 4
chất gây ô nhiễm, IP ≥ 3
– Stilbenes, đồng phân, muối và
– Các chất kháng khuẩn, bao gồm
ester của stilbene
các sulfonamides và quinolone
ƠN
Nhóm A: nhóm chất có tác dụng
– Thuốc xổ giun, chống giun bao
– Thuốc kháng giáp
gồm nitroimidazoles, carbamates và
– Steroids
zeranol – Beta–agonists
chống viêm không steroid – Hợp chất organochlorine bao gồm
PCBs – Hợp chất organophosphorus, độc tố nấm, thuốc nhuộm…
QU
Y
– Nhóm Nitrofuran
pyrethroids; thuốc an thần, thuốc
NH
– Acid resorcylic, lactones bao gồm
4.1.2. Tính chọn lọc (Selectivity)
KÈ
M
Xét về bản chất, tính chọn lọc giống như tính đặc hiệu của phương pháp. Tuy nhiên, tính chọn lọc được sử dụng trong trường hợp phân tích đồng thời nhiều chất. Trong trường hợp phương pháp có dùng chất nội chuẩn, một phương pháp có tính chọn lọc cao nếu phương pháp đó có khả năng phân biệt rõ ràng đối với một hoặc nhiều chất phân tích, chất nội chuẩn (internal standard, IS) so với các thành phần nội sinh trong nền mẫu hoặc các thành phần khác trong mẫu.
DẠ Y
4.2. Khoảng tuyến tính, độ tương quan của đường hiệu chuẩn 4.2.1. Đường hiệu chuẩn (Calibration curve) Trong phân tích định lượng, đường hiệu chuẩn (gọi tắt là đường chuẩn) được sử dụng phổ biến để liên kết nhiều điểm chuẩn để xác định
94
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
OF FI
CI AL
giá trị của mẫu cần phân tích. Phương pháp này cho độ chính xác cao hơn so với phương pháp liên kết một chuẩn (còn gọi là phương pháp so sánh). Đường chuẩn thông thường được xây dựng trên nền mẫu trắng để giảm thiểu sự ảnh hưởng của nền mẫu đến chất phân tích (matrix–matched calibration). Phương trình đường chuẩn là phương trình mô tả mối quan hệ giữa nồng độ với tín hiệu của chất cần phân tích.
Một cách tổng quát, mối tương quan giữa một đại lượng X (biến độc lập) và một đại lượng Y (biến phụ thuộc) theo dạng tuyến tính được biểu diễn bằng phương trình dưới dạng như sau: y = ax + b
(4.1)
ƠN
Hệ số a (hệ số góc/slope) và hệ số b (tung độ gốc/intercept) được xác định từ thực nghiệm khi thay đổi N lần biến độc lập xi và đo lường các giá trị phụ thuộc tương ứng yi theo bảng 4.4. pháp phân tích (N ≥ 6) 1
2
x
x1
x2
y
y1
y2
Y
n
NH
Bảng 4.4. Giá trị thực nghiệm lập đường chuẩn trong thẩm định phương
3
...
i
N
x3
...
xi
xN
y3
...
yi
yN
M
QU
Từ bảng kết quả thực nghiệm tính các tổng ∑ xi , ∑ yi , ∑ xi yi , ∑ xi2 , hệ số a và b tính bằng phương pháp bình phương cực tiểu (least square method) theo hệ phương trình: ∑ yi = N. b + a ∑ xi { (4.2) ∑ xi yi = bxi + a ∑ xi2
KÈ
Hệ số a, b tính được như sau: a=
DẠ Y
b= {
∑ xi ∑ yi N (∑ xi )2 2 ∑ xi − N ∑x ∑x y ∑ x2i ∑ yi − i i i N N ∑ x2i − (∑ xi )2
∑ x i yi −
Độ lệch chuẩn của các hệ số a và b được tính theo công thức:
(4.3)
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
2 N N ∑N i=1 xi − (∑i=1 xi )
(4.4)
2
N 2 N ∑N i=1 xi
− (∑N i=1 xi )
Độ lệch chuẩn dư, Sresidue = √
(4.5)
2
∑N ̂ 𝑖 )2 i=1(yi −𝑦 N−2
OF FI
Sb = Sresidue √
CI AL
2 ∑N i=1 xi
Sa = Sresidue √
95
(4.6)
Trong đó: yi là các giá trị thực nghiệm, ŷi là các giá trị tính được theo phương trình hồi quy.
ƠN
Trong một số ít trường hợp, đường hiệu chuẩn có thể là bậc 2 (parabol). Tương tự với hồi quy tuyến tính, các hệ số của phương trình đường hiệu chuẩn được tính toán bằng phương pháp bình phương cực tiểu Nếu phương trình đường chuẩn có dạng: y = ax 2 + bx + c
(4.7)
NH
Để tìm các hệ số a, b và c phải giải hệ phương trình: (4.8)
Y
∑ yi = ∑ xi2 + b ∑ xi + N. c {∑ xi yi = a ∑ xi3 + b ∑ xi2 + c ∑ xi ∑ xi2 yi = a ∑ xi4 + b ∑ xi3 + c ∑ xi2
QU
Tùy thuộc vào phương pháp, điều kiện và kỹ thuật khác nhau, thí nghiệm xây dựng đường hiệu chuẩn có thể là một trong các trường hợp sau:
DẠ Y
KÈ
M
(1) Đường chuẩn với chuẩn tinh khiết: Khi không có nền mẫu trắng thích hợp hoặc sự ảnh hưởng của nền mẫu đến phép phân tích là không đáng kể, đường chuẩn được xây dựng từ dung dịch chuẩn pha bằng dung môi tinh khiết mà không xét đến ảnh hưởng của nền mẫu. Trong trường hợp này, để hạn chế sự khác biệt trong liên kết chuẩn cần xem xét đến các bước trong quy trình xử lý mẫu khi xây dựng đường chuẩn, đồng thời cần có đánh giá sự ảnh hưởng của nền mẫu (EM, effective matrix) thông qua so sánh giá trị của hệ số dốc (slope) với đường thêm chuẩn trên nền mẫu thực.
96
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
(2) Đường chuẩn trên nền mẫu trắng: Mẫu trắng được sử dụng làm nền mẫu cho thí nghiệm từng điểm chuẩn. Mẫu trắng là mẫu thực không cho tín hiệu của chất phân tích.
OF FI
(3) Đường chuẩn trên nền mẫu thực: Mẫu thật được sử dụng làm môi trường cho từng điểm chuẩn. Đường chuẩn trên nền mẫu thực chỉ được sử dụng một lần để phân tích cho một mẫu cụ thể. Phương pháp cho độ chính xác cao vì loại bỏ được ảnh hưởng của nền mẫu lên chất phân tích. Tuy nhiên phương pháp này ít được sử dụng vì cần một lượng lớn mẫu thực và tốn kém về kinh phí và thời gian.
ƠN
(4) Đường chuẩn có sử dụng nội chuẩn: Là đường tương quan giữa tỉ lệ nồng độ chất chuẩn (standard, sd) và chất nội chuẩn (internal standard, isd) Csd/Cisd với tỉ lệ tín hiệu của chất chuẩn và chất nội chuẩn Wsd/Wisd. Tín hiệu thường là diện tích của peak.
NH
4.2.2. Độ tuyến tính và hệ số tương quan (Correlation coefficient)
QU
Y
Độ tuyến tính của đường chuẩn được đánh giá thông qua phép phân tích tương quan, trong đó giá trị của hệ số tương quan (R) được sử dụng làm thước đo cho độ tuyến tính. Hai loại hệ số tương quan phổ biến là hệ số tương quan Pearson và Spearman. Hệ số tương quan Pearson thường được dùng trong cho mối tương quan tuyến tính (đường thẳng) trong khi Spearman là tương quan thứ bậc và có thể sử dụng cho mối quan hệ phi tuyến tính. 4.2.2.1. Hệ số tương quan Pearson
M
Từ tập số liệu thực nghiệm để lập đường chuẩn được thiết kế như bảng 4.4, hệ số tương quan Pearson được tính theo công thức sau: 2 ∑N i=1(xi −X)
y
2 i=1(yi −Y)
KÈ σx
R = a. σ = a. √∑N
=
∑ x i yi − (∑ xi ) √(∑ x2i − N
2
∑ xi ∑ yi N
(∑ yi )2 ) )×(∑ y2i − N
(4.9)
DẠ Y
a là hệ số góc của phương trình đường hồi quy.
Dấu của hệ số góc cũng chính là dấu hệ số tương quan. R > 0 cho biết giữa X và Y có tương quan thuận. Ngược lại khi R < 0, giữa x và y có tương quan nghịch.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
97
CI AL
Giá trị tuyệt đối của R cho biết mức độ tương quan giữa x và y. Do đó, khi đánh giá mức độ tương quan người ta thường quan tâm đến giá trị R2 thay cho R. Ngoài cách tính tính theo công thức 4.5, R2 còn có thể dễ dàng tính theo biểu thức: S2y
R2 = S2
(4.10)
OF FI
̂ y
Sy2 là phương sai được tính từ các giá trị thực nghiệm y (giá trị các điểm chuẩn). Sŷ2 là phương sai của tập giá trị 𝑦̂, 𝑦̂ là các giá trị tính được theo phương trình hồi quy.
KÈ
M
QU
Y
NH
ƠN
Một cách tương đối, có thể phân mức độ tương quan giữa hai đại lượng theo giá trị của hệ số tương quan như hình 4.1 và bảng 4.5.
Hình 4.1. Tương quan Pearson giữa đại lượng X và Y
DẠ Y
Trong phân tích định lượng, yêu cầu đường hiệu chuẩn cần có giá trị R tối thiểu bằng 0.990, tương ứng với giá trị của R nhỏ nhất bằng 0.995. 2
98
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Bảng 4.5: Mối quan hệ giữa giá trị hệ số tương quan và mức độ tương quan Mức độ tương quan
Từ 0.00 đến ± 0.20
Rất yếu
Từ ± 0.21 đến ± 0.40
Yếu
Từ ± 0.41 đến ± 0.70
Vừa
Từ ± 0.71 đến ± 0.90
Mạnh
OF FI
R
Từ ± 0.91 đến ± 1.00
Rất mạnh
4.2.2.2. Hệ số tương quan Spearman
ƠN
Hệ số tương quan Spearman (Rs) đánh giá mức độ tương quan thứ hạng có tham số hoặc không qua tham số giữa 2 yếu tố X và Y với N số liệu đo tính theo công thức sau: 6∑d 2
i R s = 1 − N(N2 −1)
(4.11)
NH
Với di là sự sai khác giữa xi và yi. Để tính di, các giá trị xi được xếp theo thứ tự từ thấp đến cao hoặc ngược lại từng cặp tương ứng với yi.
1 m ∑ (t3 −tj ) 12 j=1 j N(N2 −1)
6(∑ di 2 +
(4.12)
QU
Rs = 1 −
Y
Trong trường hợp có nhiều giá trị giống nhau thì thứ hạng của chúng được tính là như nhau và bằng giá trị trung bình các thứ hạng này. Khi đó công thức 4.11 được thay thế bằng:
Với tj là số lần trùng nhau của thứ hạng j, tj được tính cho cả các giá trị của x và y.
KÈ
M
Phương trình đường chuẩn và hệ số tương quan Pearson tương ứng được tính một cách dễ dàng bằng các công cụ Excel như đồ thị Charts, công cụ Regression trong Data analysis hoặc bằng các phần mềm thống kê chuyên dụng.
DẠ Y
Ví dụ 4.1: Dữ liệu lập đường chuẩn trong phân tích tổng hàm lượng asenic trong nước mắm truyền thống bằng phương pháp HG–AAS thu được như sau: C (ppm)
0.5
1.0
2.0
4.0
6.0
8.0
10.0
Abs
0.038
0.071
0.148
0.292
0.431
0.539
0.664
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
99
CI AL
Hãy xác định phương trình và hệ số tương quan của đường chuẩn trên. Giải:
Cách 1: Dùng công cụ đồ thị Charts trong menu Insert
QU
Y
NH
ƠN
OF FI
Nhập bảng dữ liệu, chọn vị trí vùng dữ liệu và chọn insert/charts/scatter sau đó enter. Tiếp theo trong Format Trendline chọn Display Equation on chart và Display R–square on chart ta thu được kết quả như hình dưới đây:
M
Phương trình đường chuẩn thu được là y = 0.0663x + 0.0136 tương ứng với R2 = 0.997. Đường chuẩn thu được đạt yêu cầu vì R2 > 0.99.
DẠ Y
KÈ
Cách 2: Dùng công cụ Regression trong Data analysis
100
ƠN
OF FI
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
KÈ
M
QU
Y
NH
Nhập các thông số như hình trên và chọn ok ta thu được kết quả:
DẠ Y
Phương trình đường chuẩn thu được là Abs = 0.0662C + 0.014. Hệ số tương quan R = 0.9987, R2 = 0.997. Độ lệch chuẩn đối với slope (Sa) và intercept (Sb) tương ứng là 0.0015 và 0.008. Nếu xét tới sai số của các hệ số, phương trình đường chuẩn có thể biểu diễn là: Abs = (0.0662 ± 0.0015)C + (0.014 ± 0.008).
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
101
CI AL
4.3. Giới hạn phát hiện, giới hạn định lượng
OF FI
Giới hạn phát hiện (limit of detection, LOD) là giá trị nồng độ thấp nhất của một chất có thể phân tích được. Giá trị này là khác biệt với giá trị 0 (nền mẫu) ở độ tin cậy 99%. Hay nói cách khác, ở giá trị nồng độ chất phân tích bằng LOD ít nhất 99% số lần phân tích cho tín hiệu rõ ràng (positive) hoặc tối đa 10% số lần phân tích không có tín hiệu (false negative).
ƠN
Khái niệm LOD thường đề cập đến hai khía cạnh: Giới hạn phát hiện của phương pháp phân tích (method detection limit) viết tắt là MDL và giới hạn phát hiện của thiết bị (instrument detection limit) viết tắt là IDL. IDL thường gắn liền với một thiết bị cụ thể và được xác định từ dung dịch chuẩn tinh khiết.
NH
MDL là giới hạn phát hiện của phương pháp phân tích, đây là khái niệm được EPA (Environmental protection agency, USA) định nghĩa cho độ nhạy của một phương pháp phân tích. MDL có giá trị cao hơn so với IDL do ảnh hưởng của các yếu tố như quy trình phân tích, nền mẫu. MDL được sử dụng để công bố giới hạn nồng độ thấp nhất mà phương pháp phân tích có thể phát hiện được.
QU
Y
LOD/MDL sau khi được xác định bằng thực nghiệm, được sử dụng để công bố giới hạn nồng độ thấp nhất mà một phương pháp có thể phát hiện được.
KÈ
M
Giới hạn định lượng của phương pháp (limit of quantitation, LOQ hoặc method quantitation limit, MQL) là nồng độ thấp nhất của chất cần phân tích có thể định lượng được. Giới hạn định lượng có giá trị bằng 3 lần giới hạn phát hiện của phương pháp.
DẠ Y
Với một phương pháp phân tích tiêu chuẩn, phòng thí nghiệm khác nhau sẽ công bố các giới hạn phát hiện khác nhau tuỳ thuộc vào tay nghề của nhân viên, thiết bị và chất lượng của hoá chất, chất chuẩn. Trong trường hợp các yếu tố nêu trên không đảm bảo yêu cầu, giới hạn phát hiện của phương pháp sẽ tăng lên nhiều lần so với công bố của của phương pháp chuẩn. Do đó, việc xác định và công bố giới hạn phát hiện của phương pháp là cơ sở đánh giá năng lực phân tích của phòng thí nghiệm.
102
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Tùy vào trường hợp cụ thể có thể sử dụng một trong các cách xác định giới hạn phát hiện của phương pháp sau: – Dựa trên độ lệch chuẩn khi phân tích lặp mẫu trắng;
– Dựa trên độ lệch chuẩn khi phân tích lặp mẫu trắng thêm chuẩn hoặc mẫu thật; – Dựa trên đường hiệu chuẩn;
OF FI
– Dựa trên tỉ lệ tín hiệu/nhiễu nền của phổ (S/N); – Dựa trên độ tin cậy của tín hiệu phân tích.
4.3.1. Tính LOD dựa trên độ lệch chuẩn khi phân tích lặp mẫu trắng
ƠN
LOD được tính theo biểu thức sau: LOD = C̅0 + 3Sd
(4.13)
NH
Trong đó: – C̅0 là nồng độ trung bình của mẫu trắng, C̅0 được tính từ đường chuẩn dung dịch (đường hiệu chuẩn từ dung môi tinh khiết, không tính đến ảnh hưởng của nền mẫu).
Y
– Sd là độ lệch chuẩn của 10 lần phân tích lặp lại mẫu trắng. Thông thường mẫu trắng không có tín hiệu nên C̅0 = 0, lúc này LOD = 3Sd.
QU
4.3.2. Xác định LOD/MDL bằng phân tích mẫu thêm chuẩn, mẫu thật
KÈ
M
Phương pháp xác định LOD/MDL bằng phân tích lặp lại mẫu thêm chuẩn hoặc mẫu thật. Mẫu thêm chuẩn là mẫu trắng (mẫu không phát hiện chất cần phân tích) được thêm một lượng nhỏ chất phân tích. Phương pháp này được sử dụng phổ biến cho hầu hết các phương pháp phân tích định lượng. Công thức tính như sau: LOD = 3Sd
(4.14)
DẠ Y
Sd là độ lệch chuẩn của ít nhất 10 lần phân tích lặp lại mẫu thêm chuẩn hoặc mẫu thật. Nhằm đảm bảo độ chắc chắn khi công bố, giá trị LOD/MDL cần được xác định bằng phân tích lặp ở nồng độ lân cận với MQL. Nồng độ trung bình của mẫu thêm chuẩn hoặc mẫu thật khi xác định LOD/MDL nằm trong khoảng từ 2 – 10 lần LOD/MDL công bố, tốt nhất thường dùng trong
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
103
CI AL
thực tế là 4 – 10 lần LOD/MDL. MDL thu được là không chắc chắn nếu C̅ quá nhỏ (< 2MDL), trong khi nồng độ C̅ lớn (> 10MDL) chỉ được sử dụng nếu độ thu hồi của phương pháp tại khoảng nồng độ này là quá nhỏ. Độ thu hồi của phương pháp tại nồng độ C̅ = MQL/LOQ phải đạt yêu cầu như quy định chung đối với một phương pháp định lượng.
OF FI
Ngoài ra, đối với phương pháp khối phổ nhiều lần, LOD/MDL cần được xác nhận lại bằng cách so sánh tỉ lệ tín hiệu của mảnh ion con định lượng (quantitaion fragment) trên ion định tính (confirmation fragment). Tỉ lệ này tại LOD/MDL không vượt quá ± 30% so với tỉ lệ trung bình ở các mức nồng độ của đường hiệu chuẩn.
ƠN
Ví dụ 4.2: Để xác định MDL khi phân tích dư lượng hoạt chất thuốc trừ sâu chlorpirifos trong một nền mẫu thực phẩm bằng phương pháp sắc ký khối phổ. Tiến hành phân tích lặp lại 10 lần trên mẫu trắng như bảng sau: Mẫu thêm 3 ppb
1
3.532
5.887
3.027
5.045
3.381
5.635
2.969
5.595
2.896
4.827
3.357
4.948
2.898
4.830
8
3.048
5.080
9
3.107
5.178
10
3.101
5.168
NH
N
2
Y
3
6
KÈ
M
7
QU
4 5
Mẫu thêm 5 ppb
Tính MDL của phương pháp phân tích trên.
DẠ Y
Giải:
Từ bảng kết quả trên, áp dụng công thức tính Sd cho từng trường hợp và tính LOD theo công thức 4.13 ta thu được bảng kết quả:
104
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Mẫu thêm 3 ppb
Mẫu thêm 5 ppb
CI AL
Thông số
0.22
0.36
MDL
0.65
1.09
MQL
2.17
3.64
̅ /MDL R=C
4.84
4.78
OF FI
Sd
Kết quả của 2 nồng độ thêm chuẩn đều cho 2 < R <10, do đó các nồng độ đã dùng để xác định các giá trị MDL và MQL đều đạt yêu cầu. MDL của phương pháp này được chọn là giá trị lớn nhất trong 2 trường hợp trên với MDL = 1.09 ppb, có thể công bố là 2 ppb hoặc cao hơn so với giá trị thực nghiệm.
ƠN
4.3.3. Tính LOD/MDL dựa trên S/N
NH
Thông thường cách tính này áp dụng phổ biến cho các phương pháp đo phổ dễ dàng xác định được nhiễu nền như sắc ký lỏng, sắc ký khí.
KÈ
M
QU
Y
LOD là nồng độ mà tại đó tín hiệu (S) lớn gấp 3 lần nhiễu đường nền (N), ký hiệu là S/N = 3.
Hình 4.2. Tín hiệu và nhiễu nền trong xác định LOD/MDL
DẠ Y
Nhiễu đường nền được tính về hai phía của peak, nhiễu nền tốt nhất được lấy tại vị trí có khoảng cách bằng 5 lần chiều rộng chân peak hoặc 10 chiều rộng nửa peak. Nếu lấy nhiễu nền quá gần peak, nhiễu nền có thể bị ảnh hưởng của peak tín hiệu. Hoặc nếu lấy quá xa peak nhiễu không còn là nhiễu của tín hiệu cần phân tích.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
105
CI AL
Thông thường mẫu được sử dụng để xác định LOD/MDL là mẫu trắng thêm chuẩn ở nồng độ rất nhỏ và được làm lặp lại để đảm bảo độ tin cậy của phép xác định. 4.3.4. Tính LOD từ đường hiệu chuẩn
LOD = 3.3
OF FI
Phương pháp này chỉ áp dụng được khi phương pháp phân tích có xây dựng đường chuẩn. Một cách tổng quát, nếu phương trình đường chuẩn có dạng y = ax + b với a là hệ số góc (slope) thì LOD được tính theo công thức sau: Sd a
(4.15)
ƠN
Sd là độ lệch chuẩn khi phân tích lặp lại ít nhất 10 lần mẫu thêm chuẩn hoặc mẫu thực có nồng độ trong khoảng từ 2 – 10 lần LOD. 4.3.5. Xác định LOD/MDL dựa trên độ tin cậy của tín hiệu
QU
Y
NH
Phương pháp này dựa trên yêu cầu về độ tin cậy của LOD/MDL công bố. LOD/MDL là mức nồng độ mà tối thiểu 90% số lần phân tích cho tín hiệu rõ ràng hoặc tối đa 10% số lần phân tích không có tín hiệu (gọi là âm tính giả, false negative). Cần dự kiến trước mức LOD/MDL của phương pháp sau đó tiến hành thí nghiệm phân tích lặp và thống kê số lần false negative. Nếu số lần false negative nhỏ hơn mức tối đa cho phép (10%) thì có thể công bố giá trị dự kiến chính là LOD/MDL của phương pháp phân tích. Giá trị MDL công bố này nên được kiểm tra thêm về tính đặc hiệu và hiệu suất thu hồi nhằm đảm bảo sự chắc chắn.
DẠ Y
KÈ
M
Phương pháp xác định LOD/MDL dựa trên độ tin cậy thống kê đặc biệt hữu hiệu khi phân tích đồng thời nhiều chất. Ví dụ như phân tích dư lượng của thuốc bảo vệ thực vật trong thực phẩm, LOD/MDL dự kiến thường nhỏ hơn hoặc bằng giới hạn dư lượng tối đa MRL (Maximun residue limit) của đa số các hoạt chất thuốc bảo vệ thực vật, thông thường MRL là 50 μg/kg. 4.4. Độ chính xác của phương pháp phân tích Độ chính xác (accuracy) của một phương pháp phân tích được đánh giá qua hai yếu tố chính là độ đúng (trueness) và độ lặp (repeatability/reproducibility). Theo ISO (International Organization for
106
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
OF FI
CI AL
Standardization), một phương pháp phân tích có độ chính xác cao khi đồng thời có độ đúng và độ lặp cao.
QU
Y
NH
ƠN
Hình 4.3. Độ chính xác của phương pháp phân tích: (a) có độ đúng thấp, độ lặp thấp; (b) có độ đúng thấp, độ lặp cao; (c) có độ đúng cao, độ lặp cao. Tâm của các hình là giá trị thực.
Hình 4.4. Các loại sai số trong phương pháp phân tích, tính chất và thông số
M
biểu diễn các các loại sai số.
KÈ
4.4.1. Độ chụm, độ lặp của phương pháp (Precision: repeatability, intermediate precision, reproducibility) 4.4.1.1. Độ lặp (repeatability)
DẠ Y
Độ lặp đặc trưng cho sai số ngẫu nhiên của phương pháp phân tích. Độ lặp được mô tả bằng giá trị độ lệch chuẩn (Sd) hoặc độ lệch chuẩn tương đối (RSDr%) khi thực hiện phân tích lặp lại trong một số điều kiện nhất định nào đó. Thang giá trị tiêu chuẩn của RSDr thay đổi mức nồng độ của
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
107
CI AL
chất phân tích. Theo AOAC, giá trị lớn nhất có thể chấp nhận của RSDr như trình bày trong bảng 4.6. Bảng 4.6. Tiêu chuẩn về độ lặp của phương pháp phân tích theo AOAC Hàm lượng %
Tỉ lệ
Đơn vị
100
1
100%
1.3
10
10–1
10%
1.9
1
10–2
1%
2.7
0.1
10–3
0.1%
3.7
0.01
10–4
100 ppm (mg/kg)
5.3
0.001
10–5
10 ppm (mg/kg)
7.3
0.0001
10–6
1 ppm (mg/kg)
11
0.00001
10–7
100 ppb (μg/kg)
15
0.000001
10–8
10 ppb (μg/kg)
21
0.0000001
10–9
1 ppb (μg/kg)
30
NH
ƠN
OF FI
RSD (%)
QU
Y
Ngoài ra, AOAC khuyến cáo việc đối sánh độ lặp của một phương pháp tại nồng độ xác định tốt nhất có giá trị được tính từ công thức Horwitz: RSDr = ½ RSDR = C–0.1505
(4.16)
KÈ
M
Độ lặp của phương pháp thu được khi thực hiện phép đo lặp lại nhiều lần một mẫu ở cùng các điều kiện như: cùng một phòng thí nghiệm, cùng người thực hiện, cùng một phương pháp (quy trình phân tích) và ở cùng một khoảng thời gian.
DẠ Y
Cách xác định độ lặp: Tiến hành làm thí nghiệm lặp lại ít nhất 6 lần trên cùng một mẫu và tiến hành cho 3 mẫu khác nhau ở nồng độ thấp, trung bình và cao trong khoảng định lượng của phương pháp. Mẫu phân tích có thể là mẫu chuẩn, mẫu trắng thêm chuẩn hoặc mẫu thực.
108
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Ví dụ 4.3: Thí nghiệm xác định độ lặp khi phê duyệt phương pháp phân tích BOD trong nước thải (NT) thu được như trong bảng dưới đây, hãy đánh giá độ lặp lại của phương pháp. n
NT 01
NT 02
NT 03
1
39.6
165.5
2
41.1
171.8
428.0
3
42.6
174.9
416.0
4
39.3
163.9
416.0
5
39.6
168.6
420.0
6
41.5
ƠN
OF FI
424.0
174.9
436.0
NH
Giải: Áp dụng công thức tính RSD cho từng mẫu ta thu được kết quả như sau: NT 01
NT 02
NT 03
̅ X
40.6
169.9
423.3
SD
1.32
4.70
7.76
3.26
2.77
1.83
4.55
3.68
3.20
Đạt
Đạt
Đạt
RSD = C–0.15 Đánh giá
QU
RSD (%)
Y
Thông số
M
4.4.1.2. Độ lặp trung gian (Intermediate precision)
DẠ Y
KÈ
Độ lặp trung gian (còn được gọi là độ tái lặp nội bộ) là độ lặp khi thực hiện thí nghiệm phân tích lặp nhiều lần ở cùng một phòng thí nghiệm với cùng một quy trình phân tích (thiết bị có thể khác nhau nhưng phải đạt yêu cầu kỹ thuật) nhưng khác nhau về người thực hiện hoặc thời gian thực hiện. Cách xác định độ lặp trung gian: Phân tích lặp lại ít nhất n lần (n ≥ 6) trên cùng một mẫu thử và được thực hiện ở ba nồng độ khác nhau (nồng độ thấp, trung bình và cao trong khoảng định lượng của phương pháp) bởi nhiều kiểm nghiệm viên độc lập nhau trong cùng một phòng thí nghiệm.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
109
– Xác định độ lệch chuẩn riêng của từng nhân viên ̅ )2 ∑(xi −X
(4.17)
N−1
OF FI
Sri = √
CI AL
Sự khác biệt của giá trị RSDR giữa các kiểm nghiệm viên hoặc thời gian phân tích khác nhau thể hiện độ lặp trung gian của phương pháp phân tích. RSDR được tính theo các bước sau:
– Tính độ lệch chuẩn trung bình của các kiểm nghiệm viên theo công thức: f S2r1 + f2 S2r2 +⋯ f1 +f2 +⋯
Sr = √ 1
(4.18)
ƠN
– Tính độ lệch chuẩn tập mẫu gộp của tất cả các kiểm nghiệm viên khác hoặc thời gian khác nhau SX – Tính độ lệch chuẩn giữa các kiểm nghiệm viên SL theo công thức: (4.19)
NH
S2X −S2r
SL = √
N
– Độ lệch chuẩn lặp trung gian SR được tính theo công thức sau đây: (4.20)
Y
SR = √SL2 + Sr2
QU
Tính RSDR và so sánh với tiêu chuẩn cho phép đối với RSDRw được xác định theo phương trình Horwitz. Độ lặp trung gian của phương pháp đạt yêu cầu nếu: (4.21)
Hoặc RSDR ≤ 2C–0.15
(4.22)
M
RSDR (%) < 2(1–0.5.logC)
KÈ
Với C được tính là phần tỉ lệ. Ví dụ chất tinh khiết có C = 100% = 1; hàm lượng ppm (phần triệu) = 1/100000 =10–6. Bảng 4.7. Độ lệch chuẩn tương đối tối đa cho phép trong đánh giá độ lặp trung gian tính theo Horwitz Tỉ lệ
Đơn vị
RSD (%)
100
1
100%
2
10
10–1
10%
3
DẠ Y
Hàm lượng %
110
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
1
10–2
1%
0.1
10–3
0.1%
0.01
10–4
100 ppm (mg/kg)
0.001
10–5
10 ppm (mg/kg)
0.0001
10–6
1 ppm (mg/kg)
0.00001
10–7
100 ppb (μg/kg)
23
0.000001
10–8
10 ppb (μg/kg)
32
0.0000001
10–9
1 ppb (μg/kg)
45
CI AL
4 6 8
11
OF FI
16
ƠN
Ví dụ 4.4: Thí nghiệm xác định độ lặp trung gian được thực hiện trên ba mẫu khác nhau khi phê duyệt phương pháp phân tích BOD trong nước thải. Kết quả thu được như trong bảng dưới đây. Hãy đánh giá độ lặp trung gian của phương pháp. Mẫu 2
KNV2
1
21.01
22.22
2
22.42
23.23
NH
Mẫu 1 KNV1
3
21.41
4
22.42
5
20.81
6
21.21
Giải:
Mẫu 3
KNV2
KNV1
KNV2
60.53
61.09
125.58
121.05
63.92
63.92
130.1
126.71
22.22
61.09
62.22
123.31
128.97
23.43
63.35
65.62
125.58
121.05
21.62
61.09
62.22
123.31
121.05
23.64
63.92
64.48
126.71
123.31
Y
KNV1
QU
n
KÈ
M
Áp dụng các công thức từ 4.17 đến 4.20 cho tập số liệu trên ta thu được bảng kết quả: Thông số
DẠ Y
Nồng độ trung bình (mg/L) Độ lệch chuẩn của từng KNV (Sri)
Mẫu 1
Mẫu 2
Mẫu 3
KNV1 KNV2 KNV1 KNV2 KNV1 KNV2 21.55 22.73 62.32 63.26 125.77 123.69 0.71
0.81
1.58
1.70
2.52
3.41
Nồng độ trung bình
22.14
62.79
124.73
Độ lệch chuẩn tổng (SX)
0.95
1.64
3.06
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích 6
Độ lệch chuẩn trung bình (Sr)
0.76
1.64
Độ lệch chuẩn giữa hai KNV(SL)
0.23
0.00
Độ lệch chuẩn lặp trung gian (SR)
0.80
1.64
Độ tái lặp PTN RSDR (%)
3.60
2.61
RSDRw (%) = 2(1–0.5.logC)
10.04 Đạt
Kết luận
6
CI AL
6
3.00 0.24 3.01 2.41
OF FI
Số lần thí nghiệm (n)
111
8.58
7.74
Đạt
Đạt
4.4.1.3. Độ tái lặp (Reproducibility)
ƠN
Kết luận: Ở cả ba mức nồng độ, độ tái lặp trung gian của phương pháp đều đạt yêu cầu. Là độ lặp thu được khi phân tích cùng một mẫu ở các điều kiện khác nhau về phòng thí nghiệm, người thực hiện, quy trình phân tích…
NH
Độ tái lặp của phương pháp thông thường được xác lập khi tham gia thử nghiệm thành thạo/so sánh liên phòng thử nghiệm hoặc thực hiện phân tích trên mẫu là vật liệu chuẩn (CRM) (xem thêm chương 3, mục 3.3.1).
Y
4.4.2. Độ đúng (Trueness)
x̅−µ
. 100 (%)
KÈ
Bias =
M
QU
Độ đúng là khoảng cách giữa giá trị trung bình của tập số liệu so với giá trị thực (thông thường là giá trị chuẩn hay giá trị của vật liệu chuẩn được công nhận). Khoảng cách càng nhỏ thì độ đúng càng lớn và ngược lại. Về bản chất, độ đúng phản ánh sai số hệ thống của phương pháp đo lường hoặc phương pháp phân tích và được xác định bằng độ chệch (bias) theo biểu thức: µ
(4.21)
Với μ là giá trị thực hoặc giá trị được công nhận (CRM).
DẠ Y
4.4.2.1. Ảnh hưởng của nền mẫu đến độ đúng của phương pháp phân tích Có nhiều nguyên nhân ảnh hưởng tới độ đúng của phương pháp phân tích như: hóa chất, chất chuẩn, thiết bị, điều kiện môi trường và nền mẫu phân tích. Đáng kể nhất phải kể đến đó là ảnh hưởng của nền mẫu phân
112
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
tích đặc biệt với các nền mẫu phức tạp như thực phẩm, dược phẩm và sinh học.
ME(%) =
S𝑝𝑜𝑠𝑡𝑒𝑥𝑡𝑟𝑎𝑐𝑡. 𝑠𝑝𝑖𝑘𝑒𝑑 . 100 S𝑠𝑡𝑑.
Trong đó:
OF FI
Chỉ số đánh giá ảnh hưởng của nền mẫu gồm có: ME (Matrix effect), RE (Recovery of the extraction) hay R (Recovery of sample preparation). Mỗi chỉ số có một ý nghĩa riêng trong ảnh hưởng của nền mẫu đến phương pháp phân tích. (4.23)
– S𝑝𝑜𝑠𝑡𝑒𝑥𝑡𝑟𝑎𝑐𝑡. 𝑠𝑝𝑖𝑘𝑒𝑑 : tín hiệu của chất phân tích trên nền mẫu khi thêm chuẩn vào dung dịch tách chiết (sau xử lý mẫu).
ƠN
– S𝑠𝑡𝑑. : tín hiệu chất phân tích ở cùng nồng độ trong dung dịch chuẩn tinh khiết.
NH
– Để đảm bảo độ chính xác, các giá trị S trung bình được xác định bằng nhiều thí nghiệm lặp lại.
QU
Y
Công thức này chỉ áp dụng được khi có nền mẫu trắng. Chỉ số ME càng lớn, ảnh hưởng của nền mẫu càng lớn đến phép phân tích. Nếu ME nằm trong khoảng từ 80 – 100%, có thể sử dụng đường chuẩn dung dịch để phân tích thay thế cho đường chuẩn trên nền mẫu trắng hoặc phương pháp thêm chuẩn. Nếu ME nằm ngoài khoảng giá trị 80 – 100%, phương pháp phân tích cần xem xét áp dụng các biện pháp cải tiến để tránh sai số như pha loãng mẫu, cải tiến phương pháp xử lý mẫu, áp dụng phương pháp lên kết chuẩn trên nền mẫu,… S𝑝𝑟𝑒𝑒𝑥𝑡𝑟𝑎𝑐𝑡. 𝑠𝑝𝑖𝑘𝑒𝑑 . 100 S𝑝𝑜𝑠𝑡𝑒𝑥𝑡𝑟𝑎𝑐𝑡. 𝑠𝑝𝑖𝑘𝑒𝑑
M
RE(%) =
(4.24)
KÈ
Với S𝑝𝑟𝑒 và S𝑝𝑜𝑠𝑡𝑒𝑥𝑡𝑟𝑎𝑐𝑡. 𝑠𝑝𝑖𝑘𝑒𝑑 là tín hiệu chất phân tích khi thêm chuẩn trước và sau khi xử lý mẫu. Chỉ số này đánh giá hiệu suất làm sạch mẫu của phương pháp xử lý mẫu phân tích (loại trừ ảnh hưởng nền).
DẠ Y
R(%) =
S𝑝𝑟𝑒𝑒𝑥𝑡𝑟𝑎𝑐𝑡.𝑠𝑝𝑖𝑘𝑒𝑑 S𝑠𝑡𝑑.
. 100
(4.25)
R(%) cho biết độ thu hồi của quá trình xử lý mẫu, R càng cao cho biết ảnh hưởng nền càng nhỏ hoặc quá trình xử lý hiệu quả (không mất mẫu phân tích đồng thời loại bỏ được ảnh hưởng nền).
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
113
CI AL
4.4.2.2. Xác định độ đúng của phương pháp phân tích
OF FI
Có nhiều cách để xác định độ đúng trong đó đánh giá hiệu suất thu hồi của phương pháp là phổ biến và dễ thực hiện nhất trong phòng thí nghiệm. Ngoài ra, đối với phương pháp không tiêu chuẩn, độ đúng của phương pháp cần được đánh giá bằng so sánh với phương pháp tiêu chuẩn (xem chương 3, mục t–test) hoặc phân tích đối chứng vật liệu tiêu chuẩn (CRM). Hiệu suất thu hồi của phương pháp (method recovery): là % chất phân tích tính được so với lượng chất thêm chuẩn ban đầu dưới ảnh hưởng của nền mẫu và phương pháp phân tích. Hiệu suất thu hồi có thể được tính theo các công thức khác nhau tùy thuộc vào cách thực hiện thí nghiệm. C − Cx Cspike
. 100 (%)
(4.26)
ƠN
H= Trong đó:
– Cx: Nồng độ mẫu nền
NH
– C: Nồng độ của mẫu thêm chuẩn (mẫu thật thêm chuẩn) – Cspike: Nồng độ thêm chuẩn
Y
Hiệu suất thu hồi của phương pháp cần được xác định ở các mức nồng độ mức thấp, trung bình và mức cao khác nhau trong khoảng định lượng.
QU
Tiêu chuẩn về giá trị tối thiểu của hiệu suất thu hồi theo mức nồng độ định lượng theo AOAC như bảng 4.8. Bảng 4.8. Khoảng tiêu chuẩn hiệu suất thu hồi của phương pháp ở các mức nồng độ khác nhau
Tỉ lệ
Đơn vị
H (%)
100
1
100%
98 – 102
10 1 0.1 0.01 0.001 0.0001 0.00001 0.000001 0.0000001
10–1 10–2 10–3 10–4 10–5 10–6 10–7 10–8 10–9
10% 1% 0.1% 100 ppm (mg/kg) 10 ppm (mg/kg) 1 ppm (mg/kg) 100 ppb (μg/kg) 10 ppb (μg/kg) 1 ppb (μg/kg)
98 – 102 97 – 103 95 – 105 90 – 107 80 – 110 80 – 110 80 – 110 6 – 115 40 – 120
DẠ Y
KÈ
M
Hàm lượng %
114
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
H% Cspike = 20 mg/L H% Cspike = 50 mg/L H%
1
2
3
4
5
6
25.34
26.10
26.61
26.35
26.35
25.34
83.40
91.00
96.07
93.54
93.54
83.40
35.48
34.46
34.97
35.22
35.98
35.48
92.38
87.31
89.85
91.11
94.91
92.38
63.35
64.36
64.11
63.35
64.11
64.87
92.70
94.73
94.22
92.70
94.22
95.74
Htb(%) 90.16
OF FI
n Cspike = 10 mg/L
CI AL
Ví dụ 4.5: Kết quả thí nghiệm xác định hiệu suất thu hồi của phương pháp xác định hàm lượng amoni trong mẫu nước thải với nồng độ nền mẫu là 17 mg/L như bảng sau:
91.32
94.05
NH
ƠN
Ta thấy, hiệu suất trung bình ở 3 nồng độ thấp, trung bình và cao có giá trị từ 90.16 – 94.05. Đối chiếu với mức nồng độ 10 ppm (80 – 110) và 100 ppm (90 – 107), hiệu suất thu hồi của phương pháp là đạt yêu cầu. 4.5. Độ không đảm bảo đo (Measurement uncertainty)
4.5.1.1. Định nghĩa
Y
4.5.1. Số đo và chữ số có nghĩa
KÈ
M
QU
Số đo là kết quả của một phép đo trực tiếp hoặc gián tiếp được biểu diễn sao cho bảo đảm cấp độ chính xác của phép đo. Về nguyên tắc, số đo phải được biểu diễn bằng số gồm các chữ số có thể ghi nhận được từ thiết bị, những chữ số này còn được gọi là chữ số có nghĩa. Khi tính toán và biểu diễn kết quả đo lường không được thêm chữ số có nghĩa và phải làm tròn theo quy tắc trong từng trường hợp cụ thể. Để hiểu rõ hơn về số đo và chữ số có nghĩa chúng ta phân tích một ví dụ như sau:
DẠ Y
– Một cân điện tử hiển thị kết quả khi cân một vật mẫu lần thứ nhất với số có 4 chữ số sau dấu phẩy là 0.5732 g. Bốn chữ số 5, 7, 3, 2 là các chữ số có nghĩa. – Thực hiện cân lại lần thứ hai với vật mẫu trên trong điều kiện giống như lần cân thứ nhất, kết quả hiển thị là 0.5733 g. Bốn chữ số 5, 7, 3, 3 là các chữ số có nghĩa.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
115
CI AL
– Giá trị trung bình của hai lần cân tính được là 0.57325 g. Trong năm chữ số của giá trị trung bình tính được (5, 7, 3, 2, 5), chỉ có bốn chữ số có nghĩa là 5, 7, 3, 2. Chữ số 5 sau cùng là chữ số không có nghĩa.
OF FI
Khi biểu diễn kết quả trung bình thu được từ ví dụ trên đây, ta phải bỏ đi chữ số vô nghĩa bằng cách làm tròn để đảm bảo rằng cấp độ chính xác của số đo dừng lại ở bốn chữ số sau dấu phẩy như của phép cân. Thực tế đo lường cho thấy rằng, để cân được mẫu ở cấp độ chính xác lên tới năm số sau dấu phẩy (cỡ 0.00001g hay 0.01mg) cần thiết bị cân đắt tiền (khoảng gấp 3 lần so với cân 4 chữ số) và phải thực hiện phép cân trong một điều kiện môi trường nghiêm ngặt với kỹ năng thành thạo của người thực hiện.
NH
ƠN
Ví dụ trên đây cho thấy rằng, với 4 chữ số có nghĩa của hai lần cân, chữ số cuối cùng đã bị thay đổi khi thực hiện hai lần khác nhau mặc dù tất cả các điều kiện thực hiện phép cân như nhau. Ba chữ số có nghĩa đầu (5, 7, 3) không thay đổi trong hai lần cân là các chữ số tin cậy (chắc chắn). Chữ số có nghĩa cuối có sự thay đổi là chữ số có nghĩa không tin cậy (yếu tố ngẫu nhiên), sự thay đổi này đặc trưng cho dung sai của thiết bị và phương pháp đo.
QU
Y
Như vậy, số đo là số gắn liền với một thiết bị đo, một phương pháp đo chỉ bao gồm các chữ số có nghĩa. Trong đó, có duy nhất 1 chữ số có nghĩa cuối là không tin cậy (bất ổn). Đây là cơ sở cho việc làm tròn số đo và dung sai đi kèm khi biểu diễn kết quả đo lường. 4.5.1.2. Quy tắc xác định số có nghĩa
KÈ
M
Thông thường kết quả phân tích, đo lường thu được từ nhiều đại lượng đo thành phần. Mỗi đại lượng đo thành phần có một cấp độ chính xác riêng và có đơn vị riêng. Việc tính toán và biểu diễn kết quả cuối cùng phụ thuộc vào số chữ số có nghĩa của số đo thành phần theo những quy tắc cụ thể cho từng phép toán. Do vậy, việc xác định đúng số chữ số có nghĩa là quan trọng để biểu diễn một cách đúng đắn kết quả đo lường.
DẠ Y
Ví dụ: Nồng độ % của dung dịch được tính từ khối lượng cân của chất tan, thể tích và khối lượng riêng của dung dịch. Chữ số có nghĩa của nồng độ được quyết định bởi số chữ số có nghĩa của các số đo thành phần.
116
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Khi xác định số chữ số có nghĩa của số đo cần tuân theo các quy tắc sau:
(1) Chữ số có nghĩa được tính từ chữ số đầu tiên khác không từ trái sang phải của số đo. Ví dụ: Số đo 0.0537 có 3 chữ số có nghĩa là 5, 3 và 7.
OF FI
(2) Mọi chữ số “0” sau chữ số có nghĩa đầu tiên, bất kể đứng ở vị trí nào, đều là chữ số có nghĩa. Ví dụ: Số đo 0.90130 có 5 chữ số có nghĩa thứ tự là 9, 0, 1, 3, 0.
ƠN
(3) Đối với kết quả của tổng/hiệu, số chữ số có nghĩa bằng với số chữ số có nghĩa của số hạng có cấp độ chính xác thấp nhất (số chữ số có nghĩa sau dấu phẩy ít nhất). Ví dụ: 152.36 + 14.7099 + 7.684 = 174.7539 ≈ 174.75
NH
(4) Đối với kết quả của tích/thương, số chữ số có nghĩa bằng với số chữ số có nghĩa của số hạng có số chữ số có nghĩa ít nhất. Ví dụ: 0.10195×9.35 : 10.00 = 0,095323 ≈ 0,0953
Y
(5) Đối với kết quả của phép tính logarit, số chữ số có nghĩa sau dấu phẩy bằng số chữ số có nghĩa của số cần tính logarit
QU
Ví dụ: Với nồng độ [H+] = 0.0095 M thì pH của dung dịch là pH = – lg[H+] = – lg0.0095 = 2.022276395 ≈ 2.022 (6) Đối với kết quả của phép tính lũy thừa (đối logarit), số chữ số có nghĩa bằng số chữ số có nghĩa sau dấu phẩy của lũy thừa
M
Ví dụ: Nồng độ H+ của dung dịch là bao nhiêu nếu biết pH = 2.022?
KÈ
[H+] = 10–2.022 = 0.009506048 ≈ 0.0095 = 9.5 10–3 M 4.5.1.3. Quy tắc làm tròn số đo gián tiếp
DẠ Y
Kết quả trong thực nghiệm và đo lường thường là giá trị gián tiếp được tính toán từ nhiều lần đo lặp hoặc từ nhiều đại lượng đo khác nhau. Điều đó dẫn tới việc làm tròn số của kết quả thường xuyên được sử dụng. Để đảm bảo tính đúng đắn và độ tin cậy khi biểu diễn kết quả, cần lưu ý những quy tắc sau:
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
117
CI AL
(1) Khi làm tròn số không được làm tăng cấp độ chính xác của phép đo lường và cần đảm bảo tính chắc chắn của kết quả được công bố. (2) Không nên làm tròn số nhiều lần nếu kết quả được thực hiện qua nhiều phép tính trung gian, tốt nhất chỉ thực hiện làm tròn số cho kết quả cuối cùng.
Ví dụ: 10.458 = 10.46; 10.453 = 10.45
OF FI
(3) Trong trường hợp chung nhất khi làm tròn, chữ số có nghĩa sau cùng tăng lên 1 đơn vị nếu chữ số vô nghĩa bị bỏ đi lớn hơn hoặc bằng 5 (làm tròn lên), hoặc giữ nguyên khi chữ số vô nghĩa nhỏ hơn 5 (làm tròn xuống).
ƠN
Lưu ý: Một số trường hợp đặc biệt trong phân tích và đo lường, kết quả chỉ được làm tròn lên (chữ số có nghĩa tăng thêm 1 đơn vị) mặc dù chữ số vô nghĩa nhỏ hơn 5.
NH
Ví dụ 4.6: Tính giới hạn phát hiện của một phương pháp phân tích (LOD) biết độ lệch chuẩn (SD) có giá trị là 4.4 ppb. Áp dụng công thức tính LOD ta có: LOD = 3.SD = 3×4.4 = 13.2 (ppb)
QU
Y
LOD của phương pháp này có thể làm tròn lên là 14 ppb hoặc giữ nguyên (13.2 ppb), không thể làm tròn xuống thành 13 ppb.
M
Ví dụ 4.7: Độ sai chuẩn (Sx̅ ) tính được từ phép phân tích lặp có giá trị là 0.026. Biểu diễn kết quả của phép phân tích với khoảng biến thiên ở độ tin cậy 99.5 % (k = 2), biết giá trị trung bình thu được là 1.39. Khoảng biến thiên ε = k.Sx̅ = 2×0.026 = 0.052.
KÈ
Kết quả được làm tròn lên biểu diễn là 1.39 ± 0.06 (có độ tin cậy cao hơn) mà không phải theo quy tắc làm tròn xuống (kết quả là 1.39 ± 0.05). 4.5.2. Sai số tích lũy
DẠ Y
4.5.2.1. Tích lũy sai số hệ thống Đối với một tổng hoặc hiệu Sai số tuyệt đối của tổng hoặc hiệu được xác định bằng tổng hoặc hiệu sai số tuyệt đối thành phần.
118
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Công thức tính: Nếu y(Δy) = a (Δa)+ b (Δb) – c (Δc)
(4.27)
Thì Δy = Δa + Δb – Δc
(4.28)
Trong đó Δa, Δb, Δc là các sai số tuyệt đối thành phần và có dấu xác định (có thể – hoặc +). Các đại lượng thành a, b, c phải cùng thứ nguyên. a = 0.50 (+ 0.01) b = 4.10 (– 0.02) c = 1.97 (– 0.04)
ƠN
Giải: y = 0.50 + 4.10 – 1.97 = 2.63
OF FI
Ví dụ 4.8: Biểu diễn kết quả của phép tính y = a + b – c nếu biết:
Áp dụng công thức 4.27, sai số của phép tính: Δy = 0.01 + (– 0.02) – (– 0.04) = + 0.03 Đối với tích hoặc thương
NH
Biểu diễn kết quả: y = 2.63 (+0.03)
Y
Sai số tương đối của phép nhân hoặc chia bằng tổng hoặc hiệu sai số tương đối của các thành phần trong biểu thức tính toán.
QU
Công thức tính: Nếu: y = a.b/c Thì:
Δy y
=
Δa a
+
Δb b
−
Δc c
(4.29) (4.30)
KÈ
M
Trong đó Δy, Δa, Δb, Δc là các sai số tuyệt đối thành phần và có dấu xác định (có thể là – hoặc +). Các đại lượng thành phần a, b, c có thể khác nhau về thứ nguyên. Ví dụ 4.9: Biểu diễn kết quả của phép tính y = a.b/c nếu biết: a = 0.0500 (+0.0002)
DẠ Y
b = 4.10 (– 0.02) c = 1.97 (– 0.04) Giải: y = 0.0500 × 4.10/1.97 ≈ 0.0104 Áp dụng công thức 4.29 ta có
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích 0.0002
= 0.0500 +
(−0.02) 4.10
−
(−0.04) 1.97
≈ 0.0194
CI AL
Δy 0.0104
119
Δy = 0.0104 × 0.0194 ≈ 0.0002 Biểu diễn kết quả: y = 0.0104 (+0.0002) 4.5.2.2. Tích lũy sai số ngẫu nhiên
OF FI
Đối với sai số ngẫu nhiên, độ lệch chuẩn trung bình hoặc độ sai chuẩn được dùng tính toán sai số tích lũy, cụ thể trong các trường hợp sau: Đối với một tổng hoặc hiệu
Phương sai của phép tính tổng hoặc hiệu bằng tổng các phương sai thành phần.
ƠN
Nếu y = a + b – c, với Sy, Sa, Sb, Sc lần lượt là độ sai chuẩn của y, a, b, c và có cùng thứ nguyên. Độ sai chuẩn của y được tính theo công thức sau:
NH
Sy = √Sa2 + Sb2 + Sc2
(4.31)
Ví dụ 4.10: Biểu diễn kết quả của phép tính y = a + b – c nếu biết: b = 4.10 (Sb = 0.02)
QU
c = 1.97 (Sc = 0.04)
Y
a = 0.50 (Sa = 0.01)
Giải: y = 0.50 + 4.10 – 1.97 = 2.63 Áp dụng công thức 4.30. sai số của phép tính:
M
Sy = √0.012 + 0.022 + 0.042 ≈ 0.05
KÈ
Biểu diễn kết quả: y = 2.63 (Sy = 0.05) Đối với tích hoặc thương Nếu: y = a.b/c
DẠ Y
Thì:
Sy y
S
2
S
2
S
2
= √( aa ) + ( bb ) + ( cc )
Ví dụ 4.11: Biểu diễn kết quả của phép tính y = ab/c nếu biết: a = 0.50 (Sa = 0.01)
(4.32)
120
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
c = 1.97 (Sc = 0.04) Giải: y = 0.50 × 4.10/1.97 ≈ 1.04 Áp dụng công thức 4.31 ta có Sy
0.01 2
0.02 2
0.04 2
Sy = 1.04 × 0.0289 ≈ 0.03 Biểu diễn kết quả: y = 1.01 (Sy = 0.03) 4.5.3. Độ không đảm bảo đo
OF FI
= √(0.50) + (4.10) + (1.97) = 0.0289 1.04
CI AL
b = 4.10 (Sb = 0.02)
NH
ƠN
Theo định nghĩa của EURACHEM/CITAC 2012, độ không đảm bảo đo (KĐBĐ) là thông số (độ lệch chuẩn hoặc khoảng biến thiên) đi kèm với kết quả đo đặc trưng cho độ phân tán của các giá trị. Về bản chất, độ không đảm bảo đo cho biết khoảng các giá trị của phép phân tích, đồng thời thể hiện độ chính xác của phương pháp phân tích đó.
Y
Trong phân tích hoá học, đại lượng đo thông thường là nồng độ (hàm lượng) của phép phân tích. Trong một số trường hợp, đại lượng đo còn có thể là màu, pH, nhiệt độ,…
QU
Nguyên nhân gây nên độ không đảm bảo do nhiều nguồn khác nhau bao gồm: công thức tính đại lượng đo, lấy mẫu và xử lý mẫu, ảnh hưởng nhiễu nền, điều kiện môi trường, độ KĐBĐ của cân và dụng cụ thể tích, các giá trị tham chiếu,…
DẠ Y
KÈ
M
Có hai phương pháp tiếp cận khi xác định độ không đảm bảo đo trong thẩm định phương pháp phân tích: (i) Phương pháp truy tìm nguồn gốc tạo nên độ không đảm bảo đo thành phần từ đó tổng hợp thành độ KĐBĐ của phương pháp phân tích còn được gọi là phương pháp “bottom–up”. (ii) Phương pháp dựa trên thực nghiệm còn gọi là phương pháp “top–down”. Phương pháp “top–down” tính toán dựa trên kết quả về độ chụm và độ đúng khi thẩm định phương pháp. Phương pháp này còn dựa trên các kết quả của thí nghiệm QC và thử nghiệm thành thạo. Thông thường, cả hai cách tiếp cận “bottom–up” và “top–down” được sử dụng một cách tích hợp trong quy trình xác định độ KĐBĐ.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
121
CI AL
4.5.4. Quy trình xác định độ không đảm bảo đo Quy trình xác định độ KĐBĐ thông thường bao gồm 4 bước (hình 4.5).
1 Bắt đầu
Xác định đại lượng đo
Tính ĐKĐB mở rộng
Kết thúc
2
OF FI
4 Xác định nguồn gây ĐKĐB
Tính độ lệch chuẩn tổng hợp
Nhóm nguồn ĐKĐB có sẵn dữ liệu
Chuyển thành độ lệch chuẩn của từng nhóm
Định lượng ĐKĐB của từng nhóm
ƠN
3
Định lượng ĐKĐB của các nhóm còn lại
NH
Hình 4.5. Quy trình xác định độ không đảm bảo đo của phương pháp phân tích (theo EURACHEM/CITAC 2012)
DẠ Y
KÈ
M
QU
Y
4.5.4.1. Xác định đại lượng đo (bước 1) Đại lượng đo phải được diễn đạt một cách rõ ràng mối liên quan của giá trị đại lượng đo với các thông số mà đại lượng đo phụ thuộc. Các thông số này có thể là đại lượng đo thành phần hoặc là hằng số. Các thông số liên quan với hoạt động lấy mẫu phải được xem xét. Tất cả các thông tin trong biểu thức xác định đại lượng đo cần được nêu rõ trong quy trình phân tích chuẩn (SOP) xác định độ KĐBĐ. Xác định đại lượng đo cần chú ý các yếu tố sau: – Loại đại lượng cụ thể cần đo, thường là nồng độ hoặc phần khối lượng của chất phân tích; – Vật phẩm hoặc vật liệu được phân tích và thông tin bổ sung về vị trí bên trong đối tượng thử nghiệm. Ví dụ ‘sự giải phóng chì, cadimi từ đồ dùng bằng gốm;’ – Cơ sở để tính toán báo cáo kết quả phân tích. Ví dụ hàm lượng một chất được chiết xuất từ mẫu thực phẩm có thể là phần khối lượng trên trọng lượng khô của mẫu hoặc sau khi loại bỏ một số phần cụ thể của vật liệu thử (chẳng hạn như phần không ăn được của thực phẩm);
122
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
DẠ Y
KÈ
M
QU
Y
NH
ƠN
OF FI
CI AL
– Xem xét có hay không hoạt động lấy mẫu trong xác định độ KĐBĐ. Nếu lấy mẫu là một phần của quy trình được sử dụng để thu được kết quả đo thì cần phải xem xét ước lượng độ không đảm bảo đo liên quan đến quy trình lấy mẫu. Trường hợp bao gồm cả hoạt động lấy mẫu, độ KĐBĐ lớn hơn so với chỉ có hoạt động phân tích. Trong phân tích, cần phân biệt rõ những kết quả không phụ thuộc vào phương pháp phân tích (phương pháp không kinh nghiệm) với phương pháp kinh nghiệm vì nó ảnh hưởng đến việc ước lượng độ không đảm bảo. Để hiểu rõ hơn, các trường hợp sau đây là các ví dụ phân biệt giữa phương pháp kinh nghiệm và không kinh nghiệm: (i) Các phương pháp khác nhau xác định lượng niken có trong hợp kim thường mang lại kết quả giống nhau, thường được biểu thị bằng phần khối lượng hoặc phần mol. Về nguyên tắc, bất kỳ ảnh hưởng hệ thống nào gây nên độ chệch hoặc do nền mẫu sẽ cần được hiệu chỉnh, mặc dù những ảnh hưởng như vậy thông thường là rất nhỏ. Kết quả sẽ không cần phải trích dẫn phương pháp cụ thể được sử dụng. Phương pháp này không mang tính kinh nghiệm. (ii) Kết quả xác định chất béo bằng phương pháp chiết là khác nhau tùy thuộc vào các điều kiện chiết được sử dụng. Điều kiện chiết được sử dụng trong phương pháp là theo kinh nghiệm. Việc xem xét hiệu chỉnh độ chệch nội tại của phương pháp là không có ý nghĩa, vì kết quả gắn liền với phương pháp được sử dụng. Các kết quả thường được báo cáo có tham chiếu đến phương pháp, không được hiệu chỉnh cho bất kỳ sai lệch nào về bản chất của phương pháp. Phương pháp này được coi là kinh nghiệm. (iii) Trong trường hợp phương pháp có sự thay đổi cơ chất hoặc nền mẫu. Sự thay đổi này có thể là nguyên nhân ảnh hưởng lớn và không thể đoán trước tới kết quả đo lường. Quy trình mới cần được thẩm định và so sánh liên phòng nếu đạt yêu cầu có thể được áp dụng như một tiêu chuẩn cơ sở, quốc gia hoặc quốc tế. Quy trình này phải là thước đo tuyệt đối về lượng chất phân tích thực sự có mặt trong mẫu cần phân tích. Kết quả thường được báo cáo bỏ qua hiệu chỉnh của nền mẫu và độ chệch của phương pháp. Đây là phương pháp kinh nghiệm. Ví dụ 4.12: Xác định đại lượng đo trong quy trình phân tích đồng thời dư lượng thuốc trừ sâu bằng GC như hình 4.6.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
123
CI AL
Đồng nhất mẫu
Tách
OF FI
Làm sạch
Chuẩn bị dung dịch chuẩn
Phân tích bằng GC
Hiệu chuẩn
ƠN
Làm giàu
Kết quả
NH
Hình 4.6. Quy trình phân tích đồng thời dư lượng thuốc trừ sâu bằng GC (theo EURACHEM/CITAC 2012, Ví dụ A4)
Iop .Cref .Vop Iref .H.msp
. Fhom . FInt
QU
Pop =
Y
Theo quy trình trên, đại lượng đo là nồng độ (dư lượng) thuốc trừ sâu trong mẫu sẽ bị ảnh hưởng bởi các yếu tố theo công thức tính 4.33. (4.33)
DẠ Y
KÈ
M
Trong đó: – Pop là dư lượng thuốc trừ sâu trong mẫu (mg/kg) – Iop, Iref lần lượt là cường độ peak của dịch chiết mẫu và của chuẩn so sánh – Vop thể tích cuối cùng của dịch chiết – Cref nồng độ dung dịch chuẩn – msp khối lượng mẫu – Fhom, Fint hệ số hiệu chuẩn của đồng nhất mẫu và độ tái lặp nội bộ. – H độ thu hồi 4.5.4.2. Xác định các nguồn độ không đảm bảo đo (Bước 2) Những nguồn chính gây ra độ KĐBĐ cần kể tới như sau: Lấy mẫu (Sampling): Trong trường hợp lấy mẫu tại chỗ hoặc tại hiện trường là một phần của quy trình phân tích, các tác động như sự thay đổi ngẫu nhiên giữa các mẫu khác nhau và bất kỳ khả năng sai lệch nào trong
124
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
DẠ Y
KÈ
M
QU
Y
NH
ƠN
OF FI
CI AL
quy trình lấy mẫu tạo thành thành phần của độ không đảm bảo ảnh hưởng đến kết quả cuối cùng. Bảo quản mẫu (Sample storage): Khi các mẫu thử được lưu trữ trước khi phân tích, các điều kiện bảo quản có thể ảnh hưởng đến kết quả. Do đó, thời gian bảo quản cũng như các điều kiện trong quá trình bảo quản nên được coi là nguồn gây ra độ KĐBĐ. Thiết bị, dụng cụ (Instrument effect): Ảnh hưởng của các thiết bị được sử dụng trong quy trình phân tích như độ chính xác cần phải xem xét như: giá trị hiệu chuẩn cân phân tích; giá trị hiệu chuẩn của dụng cụ thể tích được sử dụng trong quy trình. Hóa chất, chất chuẩn (Reagent purity): Độ tinh khiết của hóa chất và chất chuẩn là nguồn gây nên độ KĐBĐ cần được tính đến. Nồng độ của dung dịch chuẩn không thể biết một cách chính xác ngay cả khi nồng độ chuẩn gốc đã được xác định. Độ tinh khiết của các chất chuẩn gốc thường được các nhà sản xuất công bố không nhỏ hơn mức quy định. Điều kiện đo lường (Measurement condition): Một số dụng cụ, thiết bị đo lường bị ảnh hưởng bởi yếu tố môi trường như nhiệt độ, áp suất, độ ẩm,…ví dụ như dụng cụ thủy tinh đo thể tích khi sử dụng ở nhiệt độ môi trường khác với nhiệt độ mà nó được hiệu chuẩn. Tương tự, độ ẩm có thể quan trọng khi vật liệu nhạy cảm với những thay đổi có thể có của độ ẩm. Nền mẫu (Sample effect): Thành phần của nền mẫu ảnh hưởng trực tiếp đến độ thu hồi của chất phân tích, đặc biệt là đối với nền mẫu phức tạp. Ngoài ra, độ ổn định của nền mẫu và chất phân tích còn bị ảnh hưởng bởi yếu tố môi trường như nhiệt độ và ánh sáng. Ngay cả khi sử dụng phương pháp thêm chuẩn để xác định hiệu suất thu hồi trên nền mẫu thì tín hiệu đo được từ chất chuẩn vẫn có thể khác biệt với chất phân tích thực thụ có trong mẫu. Do đó độ KĐBĐ gây bởi nền mẫu cần phải xem xét. Nhân viên thử nghiệm (Operator effects): Kiểm nghiệm viên có khả năng đọc kết quả trực tiếp trên thước hoặc thang đo khác nhau. Đồng thời độ lặp của mỗi kiểm nghiệm viên khi triển khai phương pháp đo lường là khác nhau (độ lặp trung gian). Yếu tố ngẫu nhiên: Các tác động ngẫu nhiên góp phần vào độ không đảm bảo trong tất cả các phép xác định. 4.5.4.3. Xác định độ không đảm bảo đo thành phần (bước 3) Quy trình thử nghiệm là sự kết hợp nhiều thành phần riêng lẻ, được triển khai với nhiều thiết bị, dụng cụ, hóa chất ở điều kiện thí nghiệm nhất định. Mỗi thành phần riêng lẻ có thể là một nguồn góp vào độ KĐBĐ và
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
125
Nguồn KĐB thành phần
Nhóm nguồn KĐB
Dung sai
Sai số
Thiết bị Ngẫu nhiên
Hóa chất/chất chuẩn
ĐỘ KHÔNG ĐẢM BẢO ĐO (MU)
ƠN
Độ tinh khiết
Độ đồng nhất mẫu
Thông số thẩm định Phương pháp
NH
Độ chụm
Độ đúng
OF FI
Dụng cụ thủy tinh Ngẫu nhiên
CI AL
là yếu tố đầu vào của độ KĐBĐ đo tổng hợp. Thông thường độ KĐBĐ thành phần của một quy trình phân tích được trình bày như hình 4.7.
Hình 4.7. Độ không đảm bảo đo thành phần trong quy trình phân tích
M
QU
Y
Nguồn gây nên độ KĐBĐ thành phần có thể chia làm hai loại chính là nhóm nguồn KĐBĐ dựa trên dữ liệu có sẵn và nhóm nguồn từ các thông số thẩm định của phương pháp. Nguồn KĐBĐ dựa trên dữ liệu có sẵn như: dung sai của dụng cụ đo, sai số thiết bị hay độ tinh khiết của hóa chất; Nguồn từ dữ liệu của phương pháp kể đến như: độ đồng nhất mẫu (khâu lấy mẫu và xử lý sơ bộ mẫu), độ chụm của phương pháp (độ lặp, độ tái lặp nội bộ), độ đúng (bias, độ thu hồi, thử nghiệm thành thạo).
DẠ Y
KÈ
Ngoài ra, để mô tả nguồn KĐBĐ thành phần, sơ đồ xương cá thường được sử dụng ví dụ như hình 4.8.
126
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Độ lặp Bình định mức Burrette
Pepette
OF FI
ĐKĐB
Cân mẫu
Hình 4.8. Sơ đồ xương cá xác định thành phần KĐBĐ trong quy trình phân tích
ƠN
kim loại nặng trong nước uống bằng ICP–MS.
Tính toán một số loại KĐBĐ thành phần cơ bản:
uA =
NH
(1) Độ KĐBĐ kiểu A: là độ KĐBĐ ứng với sai số ngẫu nhiên ký hiệu là UA được tính từ dữ liệu thực nghiệm thông qua việc đo lặp lại N lần trên cùng một mẫu thử. Sx √N
(4.34)
Y
Sx là độ lệch chuẩn của kết quả đo lặp
uB =
QU
(2) Độ KĐBĐ kiểu B: ký hiệu UB là độ KĐBĐ được tính từ các dữ liệu có sẵn là dung sai từ nhà sản xuất cung cấp. ε k
(4.35)
M
Trong đó ε là dung sai, k là hệ số phủ. Tùy thuộc vào loại phân bố ta có giá trị k là khác nhau:
KÈ
Dung sai của dụng cụ thủy tinh (bình định mức, pipette, burette), áp dụng phân bố tam giác: k = √6.
DẠ Y
Độ tinh khiết của hoá chất, sai số thiết bị được công bố bởi nhà sản xuất (ví dụ cân phân tích), áp dụng phân bố chữ nhật: k = √3. Đối với công bố của đơn vị hiệu chuẩn, nhà sản xuất, hoặc các dữ liệu độ KĐBĐ có sẵn, áp dụng phân bố chuẩn với k = 2 ở độ tin cậy 95%, hoặc k = 3 ở độ tin cậy 99%.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
127
CI AL
Ví dụ 4.13: Bình định mức dung tích 100 ± 0.02 mL thì ε = 0.02 mL, tính độ KĐBĐ của bình định mức. Giải:
ε
uB = k =
0.02 √6
= 0.0082 (mL)
OF FI
Áp dụng phân phối tam giác cho dung sai của dụng cụ đong đo thể tích, độ không đảm bảo chuẩn của bình định mức trên là:
Ví dụ 4.14: Tính độ không đảm bảo đo của hóa chất trong các trường hợp sau: – Chất chuẩn có độ tinh khiết là 99.9 ± 0.1%.
ƠN
– Hóa chất có độ tinh khiết p ≥ 99.5% Giải:
NH
Áp dụng phân phối hình chữ nhật cho sai số về độ tinh khiết của hóa chất, độ không đảm bảo đo chuẩn đối với các hóa chất trên là: – Chất chuẩn có độ tinh khiết là 99.9 ± 0.1%: ε
ε = 0.1% = 0.001 => uB = k =
0.001 √3
= 0.00058
ε=
100−99.5 2 ε
uB = k =
QU
Y
− Hóa chất có độ tinh khiết p ≥ 99.5%: Hóa chất có p ≥ 99.5%, nghĩa là hóa chất này có hàm lượng từ 99.5–100%, do đó: = 0.25 % = 0.0025
0.0025 √3
≈ 0.0015
KÈ
M
(3) Đường hiệu chuẩn: Sai số dư của đường hồi quy (đường chuẩn) từ sai số của thực nghiệm các điểm chuẩn gây nên là nguồn độ KĐBĐ của đường chuẩn. Độ KĐBĐ của đường chuẩn tích lũy vào kết quả phân tích thông qua phép tính toán hàm lượng chất phân tích từ liên kết chuẩn.
DẠ Y
Xét đường hiệu chuẩn y = ax + b được xây dựng từ N điểm chuẩn với các giá trị xi là nồng độ chất chuẩn, yi là độ hấp thụ tương ứng. Sai số dư của đường chuẩn Sy được tính theo công thức sau: ∑(yi −y ̂i )2
Sy = √
N−2
(4.36)
Với ŷi là giá trị tính được khi thay xi vào phương trình đường chuẩn.
128
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
ucalibration =
Sy a
1
1
√N + M + ∑
CI AL
Độ KĐBĐ do tính toán nồng độ từ đường chuẩn được tính theo công thức: (x̅∗ −x̅)2 x2 −
(4.37)
(∑ x)2 N
OF FI
Trong đó x̅ là giá trị trung bình của các xi (nồng độ các điểm chuẩn), x̅ là giá trị trung bình của M giá trị tính được từ đường chuẩn tương ứng với M lần thí nghiệm đo lặp một mẫu trên thiết bị phân tích. ∗
(i) Độ chụm cho mẫu đơn
ƠN
(4) Độ chụm của phương pháp: Tùy thuộc vào phạm vi của phương pháp, độ chụm được xác định bằng nhiều cách khác nhau. Trường hợp đơn giản nhất là khi phương pháp chỉ để áp dụng cho phân tích một dạng mẫu với khoảng nồng độ nhất định. Trường hợp phức tạp hơn khi phương pháp áp dụng cho nhiều dạng mẫu và/hoặc nhiều nồng độ phân tích
Y
NH
Để xác định độ không đảm bảo đo khi nghiên cứu độ chụm của phương pháp, tiến hành phân tích lặp lại 10 lần trên mẫu đơn (được lấy khác nhau trong cùng lô mẫu). 10 lần phân tích lặp này tốt hơn nếu được thực hiện bởi nhiều kiểm nghiệm viên khác nhau. Độ KĐBĐ do độ chụm của phương pháp gây nên UP là độ lệch chuẩn của các kết quả đo lặp (Sx).
QU
(ii) Độ chụm của phương pháp áp dụng cho nhiều dạng mẫu – Nhiều nền mẫu có cùng nồng độ: Độ KĐBĐ do độ chụm của phương pháp gây nên uP là độ lệch chuẩn Spool theo công thức 4.38. (n1 −1)S21 +(n2 −1)S22 +⋯ (n1 −1)+(n2 −1)+⋯
M
Spool = √
(4.38)
KÈ
S1, S2,… là các độ lệch chuẩn phân tích lặp trên từng dạng mẫu
DẠ Y
– Một dạng mẫu nhiều khoảng nồng độ: Độ KĐBĐ do độ chụm của phương pháp gây nên uP/P là độ lệch chuẩn tương đối RSDpool theo công thức 4.39. RSDpool = √
(n1 −1)RSD21 +(n2 −1)RSD22 +⋯ (n1 −1)+(n2 −1)+⋯
(4.39)
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
129
CI AL
(5) Độ đúng của phương pháp:
OF FI
Như đã đề cập trong mục 4.3.2, độ đúng của phương pháp được đề cập chính là độ thu hồi của phương pháp. Bao gồm độ thu hồi thông qua đánh giá qua phân tích mẫu chuẩn (CRM), hiệu suất thu hồi trên mẫu thực hoặc độ thu hồi so với kết quả phân tích trên phương pháp chuẩn. Tùy vào từng trường hợp xác định R có công thức ước lượng tương ứng của UR. Xét với góc độ tổng quát nhất, độ thu hồi (H) của phương pháp được xác định từ các yếu tố thành phần theo công thức 4.40: ̅ m . R s . R rep H=H (4.40)
ƠN
Trong đó: ̅ m là hiệu suất thu hồi trung bình của phương pháp (xác định bằng – H phân tích mẫu CRM hoặc mẫu thêm chuẩn);
NH
– R s hệ số hiệu chính sự khác nhau giữa hiệu suất thu hồi của mẫu thực với hiệu suất thu hồi của mẫu chuẩn (CRM); – R rep hệ số hiệu chính sự khác nhau khi xác định hiệu suất thu hồi trên mẫu thực và mẫu trắng thêm chuẩn.
QU
Y
Để xác định độ KĐBĐ do độ đúng của phương pháp gây nên cần xác ̅ m , R s và R rep . Tùy vào định độ KĐBĐ tương ứng với các thành phần H từng trường hợp cụ thể như sơ đồ trong hình 4.9. ̅𝑚 (i) Ước lượng độ KĐBĐ của hiệu suất thu hồi trung bình 𝐻
m
KÈ
(CRM)
M
Độ KĐBĐ của hiệu suất thu hồi trung bình có thể xác định bằng một trong những cách sau đây: ̅ m và độ KĐBĐ UH̅ bằng phân tích mẫu chuẩn Cách 1: Ước lượng H ̅m = H
̅ C
(4.41)
CCRM
DẠ Y
Độ KĐBĐ được tính theo biểu thức: 2
̅ m . √( SC ) + (UCRM ) uH̅m = H ̅ .√N C C CRM
2
(4.42)
̅ m và độ KĐBĐ UH̅ bằng cách thêm chuẩn vào Cách 2: Ước lượng H m mẫu thực có chứa một hàm lượng chất nhất định
130
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC ̅ −C ̅x C
(4.43)
Cspike
CI AL
̅m = H
Thì độ KĐBĐ được tính theo biểu thức: 2
2
2
̅ m . √ SC +SCx 2 + (UCspike ) uH̅m = H ̅ −C ̅ ) N(C C x
(4.44)
Bắt đầu
Có hiệu chỉnh theo Rm?
NH
có
có
không
DẠ Y
KÈ
M
QU
Y
Tính u Hm (4.51)
có
Phân tích lặp 10 mẫu CRM
Tính Rm và uHm
Ước lượng Urep
Tính uHm
Có mẫu CRM ?
ƠN
Phân tích lặp 10 không mẫu thêm chuẩn
OF FI
spike
Rm có khác 1? không
Tính u Hm (4.50)
Áp dụng cho nhiều khoảng nồng độ/nền mẫu?
không
có Tính Rs, uRs
Tính uHm tổng hợp
Kết thúc
Hình 4.9. Sơ đồ xác định độ KĐBĐ của hiệu suất thu hồi
̅ m và độ KĐBĐ UH̅ bằng cách thêm chuẩn vào Cách 3: Ước lượng H m mẫu trắng:
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích ̅ C
(4.45)
Cspike
CI AL
̅m = H
131
Độ KĐBĐ được tính theo biểu thức: 2
2
̅ m . √( SC ) + (UCspike ) uH̅m = H ̅ .√N C C
(4.46)
spike
OF FI
̅ m và độ KĐBĐ UH̅ bằng so sánh với phương Cách 4: Ước lượng H m pháp chuẩn:
̅m = H
ƠN
Phương pháp chuẩn là phương pháp đã được đánh giá về kỹ thuật và ̅ m và ước lượng độ KĐBĐ UH̅ theo đã công bố độ KĐBĐ. Xác định H m phương pháp này cần tiến hành phân tích ít nhất là 5 lần cùng một mẫu thử mỗi phương pháp. ̅ method C ̅ std_method C
(4.47)
2
NH
Độ không đảm bảo đo được tính bởi công thức: 2
̅ m . √ Smethod + (uStd_method ) uH̅m = H ̅ ̅ N.C C method
method
(4.48)
̅𝑚 và độ KĐBĐ 𝑢𝐻̅ theo phân bố (ii) Ước lượng 𝐻 𝑚
QU
Y
Sử dụng kiểm định Student để đánh giá hiệu suất thu hồi trung bình ̅ m ) có đồng nhất hay khác biệt so với 1 (100%). Các tình huống xảy ra (H có thể như sau: ̅ m khác biệt với 1, kết quả phân tích không hiệu chính với hiệu – H
M
suất thu hồi (recovery correction); ̅ m khác biệt với 1, kết quả phân tích được hiệu chính với hiệu suất – H
KÈ
thu hồi; ̅ m đồng nhất với 1, kết quả phân tích không cần hiệu chính với – H hiệu suất thu hồi.
DẠ Y
Biểu thức của kiểm định student được sử dụng như sau: t stat =
̅ m| |1−H uH ̅m
(4.49)
132
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
OF FI
CI AL
̅ m đồng nhất với 100%. Ngược lại tstat > k, H ̅ m khác 1 Nếu tstat < k, H đáng kể. k là hệ số phủ được dùng để tính độ KĐBĐ mở rộng, thông thường k = 2 (95%). ̅ m ≡ 1 nên kết quả phân tích không cần Trường hợp 1: Nếu tstat < k, H hiệu chính cho độ thu hồi. Độ thu hồi khi này có dạng 1 ± tcrit.uH̅m . Độ KĐBĐ liên quan với độ thu hồi trong trường hợp này là u′H̅m được tính bằng công thức: uH ̅
m u′H̅m = t crit . 1.96
(4.50)
̅m 2 1−H k
) + u2H̅m
(4.51)
NH
u′H̅m = √(
ƠN
̅ m ≠ 1, kết quả phân tích được hiệu chính Trường hợp 2: Nếu tstat > k, H với hiệu suất thu hồi. Khi tính độ KĐBĐ của phương pháp sử dụng uH̅m như một thành phần chính khi áp dụng. ̅ m ≠ 1, kết quả phân tích không được hiệu Trường hợp 3: Nếu tstat > k, H chính với hiệu suất thu hồi. Độ KĐBĐ cần phải tính lại (tăng lên một lượng) để tính chính xác của kết quả đo được đảm bảo. Công thức tính như sau:
DẠ Y
KÈ
M
QU
Y
(iii) Ước lượng Rs và 𝑢𝑅𝑠 Khi phạm vi phương pháp bao gồm nhiều dạng mẫu hoặc nhiều nồng độ phân tích, cần tính thêm yếu tố gây kết quả khác nhau về độ thu hồi của một mẫu cụ thể so với vật liệu được dùng để ước lượng Rm. Rs được ước lượng bằng phân tích lặp lại trên các dạng mẫu thêm chuẩn với các khoảng nồng độ khác nhau. Số lượng nền mẫu, số lần thử nghiệm lặp lại cho mỗi nền mẫu phụ thuộc vào phạm vi của phương pháp. Cách xác định Rs giống như trong nghiên cứu độ chụm. Độ KĐBĐ URs là độ lệch chuẩn giữa các độ thu hồi trung bình của từng dạng mẫu. Ví dụ 4.15: Thực hiện thí nghiệm lặp lại xác định hiệu suất thu hồi bằng phương pháp thêm chuẩn trên 3 nền mẫu sữa bột của quy trình phân tích Vitamin A. Kết quả thu được như bảng sau: Mẫu
Nồng độ (mg/kg)
̅m H
n
A
14
0.981
4
B
18
0.991
4
C
22
0.996
4
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
133
CI AL
Xác định URs khi hiệu chính sự khác nhau giữa hiệu suất thu hồi của mẫu thực với hiệu suất thu hồi của mẫu chuẩn trong xác định độ không đảm bảo đo của hiệu suất thu hồi. Giải:
OF FI
uRs là độ không đảm bảo đo chuẩn của hiệu suất thu hồi, giá trị này chính bằng độ lệch chuẩn trung bình của các giá trị hiệu suất thu hồi trung bình tại các nồng độ khác nhau. Sd = STDEV(0.981,0.991,0.996) = 0.00767 uRs =
Sd √N
=
0.00767 √3
= 0.0044
(iv) Ước lượng Rrep và 𝑢𝑅𝑒𝑝
̅ (CRM+spike) −C ̅ CRM CCRM C . C̅ Cspike CRM
uRrep = R rep . √
(C̅
̅ CRM (CRM+spike) −C uC(spike)
QU
+(
Cspike
(4.52)
2
uC ̅ (CRM+spike)
Y
R rep =
NH
ƠN
Rrep là hệ số hiệu chính sự khác nhau giữa hiệu suất thu hồi trên mẫu trắng thêm chuẩn so với mẫu thực. Do đó, để đánh giá độ không đảm bảo đo của hiệu suất thu hồi gây bởi nguyên nhân này cần tiến hành thực nghiệm lặp mẫu CRM và CRM thêm chuẩn. Công thức tính Rrep như sau:
) + (C̅
2
̅ CRM (CRM+spike) −C
uC(CRM) 2
) +(
CCRM
2
uC ̅ (CRM)
)
) +(
uC ̅ (CRM) 2 ̅ CRM C
(4.53)
)
Trong đó: C̅(CRM+spike) là nồng độ trung bình khi phân tích lặp mẫu CRM thêm chuẩn; C̅CRM là nồng độ trung bình khi phân tích lặp mẫu CRM
M
(v) Ước lượng H và 𝑢𝐻
KÈ
Độ thu hồi cụ thể của một mẫu H được tính bằng H = Hm.Rs.Rrep. Do đó độ KĐBĐ uR được tính theo biểu thức sau: 2
u
2
u
uRrep
DẠ Y
uH = H. √( HHm ) + ( RRs ) + ( R m
s
rep
2
)
(4.54)
Nếu hệ số hiệu chính Rs và Rrep tương đương với 1, khi đó độ KĐBĐ liên quan tới hiệu suất thu hồi được tính theo công thức:
134
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC 2
(4.55)
m
CI AL
u
uH = H. √( HHm ) + u2𝑅𝑠 + u2𝑅𝑟𝑒𝑝
Tùy vào điều kiện thực nghiệm thực tế, độ KĐBĐ ứng với hiệu suất thu hồi có thể đánh giá một cách cụ thể, có thể chỉ xét Hm là hiệu suất thu hồi chính của phương pháp, lúc này uH chính là uHm.
OF FI
4.5.4.4. Tính độ không đảm bảo đo tổng hợp (bước 4)
Tùy vào công thức xác định đại lượng đo, độ KĐBĐ tổng hợp được tính theo độ KĐBĐ thành phần theo biểu thức của sai số ngẫu nhiên dạng tổng hiệu (4.30), tích thương (4.31) hoặc tích hợp hai dạng.
uC C
u
2
u
2
u
2
ƠN
uC = √u2a + u2b + u2c + ⋯ = √( aa ) + ( bb ) + ( cc ) + ⋯
(4.56) (4.57)
NH
Biểu diễn độ đảm bảo đo của phương pháp bằng độ không đảm bảo đo mở rộng theo công thức U = k.uC với hệ số phủ k = 2 (ở độ tin cậy P = 95%). 4.5.5. Một số ví dụ
QU
Y
Ví dụ 4.16: Tính độ không đảm bảo đo của phép chuẩn độ điện thế dung dịch chuẩn NaOH bằng chất chuẩn gốc là KHP (C8H5O4K) với các dữ liệu như sau: – Độ tinh khiết của KHP là 1.0000 ± 0.0005.
M
– Khối lượng chén cân là 60.1562 g, khối lượng chén cân và chất phân tích 60.5450 g.
KÈ
– Cân phân tích có giá trị hiệu chuẩn được xác nhận là ±0.15 mg
DẠ Y
– Thể tích chuẩn độ là 18,46 mL, các nguồn gây ra sai số thể tích bao gồm: kết quả hiệu chuẩn dụng cụ burette là 20mL ± 0.03 mL; hệ số giản nở phụ thuộc vào nhiệt độ là 2.1×10–4 °C–1 với nhiệt độ thay đổi là 20 ± 3°C (ở 95%). – Sai số của khối lượng các nguyên tử C, H, O, K lần lượt là: 12.0107 ± 0.0008; 1.00794 ± 0.00007; 15.9994 ± 0.0003; 39.0983 ± 0.0001.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
135
CI AL
– Độ lặp của phương pháp chuẩn độ (n=10) là 0.05%. Điểm cuối chuẩn độ là điểm tương đương thu được từ đường cong chuẩn độ. Giải: Bước 1: Xác định đại lượng đo
Cân KHP
ƠN
Pha dd NaoH
OF FI
Quy trình chuẩn hóa nồng độ dung dịch chuẩn bằng chất chuẩn gốc được thực hiện như sau theo sơ đồ sau đây:
Chuẩn độ
CNaOH =
1000.mKHP .PKHP MKHP .VT
NH
Kết quả
(mol/L)
Y
Bước 2: Xác định nguồn gây ra độ không đảm bảo đo
DẠ Y
KÈ
M
QU
Từ công thức tính nồng độ dung dịch NaOH, các nguồn gây ra ĐKĐB của nồng độ bao gồm: phép cân, độ tinh khiết KHP, khối lượng phân tử KHP, thể tích chuẩn độ. Nguồn gây ra độ không đảm bảo đo được thể hiện qua sơ đồ nguyên nhân:
ĐKĐB
136
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Bước 3: Tính toán các nguồn gây ra độ không đảm bảo đo thành phần (1) Độ tinh khiết (PKHP)
mKHP = 60.5450 – 60.1562 = 0.3888 (g)
OF FI
Độ không đảm bảo đo kiểu B được áp dụng cho độ tinh khiết của hóa chất với phân phối hình chữ nhật a 0.0005 uPKHP = = = 0.00029 √3 √3 (2) Khối lượng cân (mKHP)
ucân =
a √3
0.15
=
√3
= 0.09 mg
ƠN
Độ không đảm bảo đo kiểu B được áp dụng cho chứng chỉ kiểm định của cân phân tích với phân phối hình chữ nhật:
NH
Theo bài ra, phép cân khối lượng KHP được thao tác 2 lần (khối lượng chén cân; khối lượng chén và chất chuẩn) nên độ không đảm bảo đo của phép cân KHP là:
Y
2 umKHP = √2. Ucân = √2. (0.09)2 = 0.13 mg
QU
(3) Khối lượng mol phân tử KHP (MKHP) Khối lượng mol phân tử của KHP được tính theo công thức C8H5O4K cho kết quả như sau:
M
MKHP = 8.MC + 5.MH + 4.MO + MK = 8×12.0107 + 5×1.00794 + 4×15.9994 + 1×39.0983 = 204.2212 g/mol
KÈ
Độ KĐBĐ của từng nguyên tố được tính theo phân phối hình chữ nhật uMC =
uMH =
DẠ Y
uMO = uMK =
aC
√3 aH
√3 aO
√3 aK √3
=
=
= =
0.0008
= 0.00046 g
√3 0.00007 √3 0.0003 √3 0.0001 √3
= 0.00004 g
= 0.00017 g = 0.000058 g
Độ KĐBĐ của MKHP thu được là:
uMKHP = √(8uC )2 + (5uH )2 + (4uO )2 + (uK )2 =
137
CI AL
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
√(8 × 0.00046)2 + (5 × 0.00040)2 + (4 × 0.00017)2 + (0.000058)2 = 0.0038
√6
OF FI
(4) Thể tích chuẩn độ: Các nguồn gây nên sai số của thể tích chuẩn độ từ dụng cụ thủy tinh, nhiệt độ, độ lặp và độ đúng cuối chuẩn độ. – Dụng cụ thủy tính: Độ KĐBĐ (kiểu B) từ công bố của nhà sản xuất cho dung cụ thể tích, áp dụng phân phối tam giác: a 0.03 udụng cụ = = = 0.012 mL √6
– Độ KĐBĐ do ảnh hưởng của nhiệt độ đến thể tích: a
unhiệt độ = 1.96 =
18.46 × 3 × 2.1 × 10–4 1.96
= 0.006 mL
NH
ƠN
– Điểm cuối chuẩn độ chính là điểm tương đương (được xác định từ phép chuẩn độ tự động) nên sai số được bỏ qua. – Sai số ngẫu nhiên (kiểu A): sẽ được đề cập trong độ tái lặp của phương pháp, do đó không xem xét trong sai số do thể tích chuẩn độ. Độ KĐBĐ do thể tích gây nên là: uV = √u2dụng cụ + u2nhiệt độ = √0.0122 + 0.0062 = 0.013 mL
CNaOH =
QU
Y
(5) Độ lặp của phương pháp: Bằng phép phân tích lặp lại 10 lần, độ lặp của phương pháp chính bằng độ lặp về thể tích chuẩn độ và bằng 0.05% (0.0005). Bước 4: Tính độ không đảm bảo đo tổng chuẩn và mở rộng 1000.mKHP .PKHP MKHP .VT
=
1000 × 0.3888 × 1.0 204.2212 × 18.64
= 0.10214 mol/L
KÈ
M
Tổng hợp các nguồn gây ra độ không đảm bảo đo được trình bày như bảng sau:
1.0
Độ KĐBĐ chuẩn 0.0005
Độ KĐBĐ tương đối 0.0005
0.3888 g
0.00013 g
0.00033
1.0 204.2212 g/mol
0.00029 0.0038 g/mol
0.00029 0.000019
18.64 mL
0.013 mL
0.0007
Giá trị
Độ lặp
Khối lượng Độ tinh khiết Khối lượng mol
Thể tích chuẩn độ
DẠ Y
Nguồn
Độ không đảm bảo tổng hợp của phép chuẩn độ tính được theo công thức 4.52 như sau:
138
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC uRep 2
u
2
u
2
u
2
2
u
0.0005 2
0.10214. √(
1
0.00013 2
0.00029 2
) + ( 0.3888 ) + (
1
CI AL
uCNaOH = CNaOH . √( Rep ) + ( mm ) + ( PP ) + ( MM ) + ( VV ) = 0.0038
2
0.013 2
) + (204.2212) + (18.64)
= 0.000099
OF FI
Độ KĐBĐ mở rộng: UcNaOH = 2 × 0.000099 ≈ 0.0002
Kết quả được biểu diễn là: CNaOH = 0.1021 ± 0.0002 mol/L
QU
Y
NH
ƠN
Ví dụ 4.17: Xác định độ không đảm bảo đo trong phép xác định sự giải phóng chì hoặc cadimi từ dụng cụ bằng gốm hình tròn (có độ sâu <25 mm) bằng phương pháp phổ hấp thu nguyên tử (AAS) với quy trình được mô tả dưới đây (Quy trình đưa ra được dựa trên quy chuẩn BS 6748:1986):
M
Với các thông số kỹ thuật của thiết bị và thuốc thử như sau:
KÈ
Dung dịch acid acetic 4%, được tạo thành bằng cách pha loãng 40 mL acetic băng đến 1 L. Dung dịch chuẩn Pb (1000 ± 1) mg/L trong acid acetic 4% (v/v). Dung dịch chuẩn Cd (500 ± 0.5) mg/L trong acid acetic 4% (v/v).
DẠ Y
Dụng cụ thủy tinh trong phòng thí nghiệm được yêu cầu ít nhất là loại B và không có khả năng sinh ra Cd trong quá trình thử nghiệm. Sự hấp thụ nguyên tử máy quang phổ cần thiết để phát hiện giới hạn đối với chì là 0,2 mg/L và 0,02 mg/L đối với cadimi.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
139
CI AL
Quy trình định lượng Quy trình xử lý mẫu và phân tích được thực hiện theo các bước sau:
Dụng cụ gốm (mẫu) có diện tích bề mặt được xác định là 5,73 dm2 được đưa về điều kiện nhiệt độ khoảng (22 ± 2)°C.
OF FI
Mẫu sau đó được đổ đầy dung dịch ngâm chiết là acid acetic 4% (v/v) ở (22 ± 2)°C cách điểm tràn 1 mm (vành trên của mẫu). Lượng dung dịch đã dùng là 332 mL với độ chính xác ± 2%. Mẫu được để ở nhiệt độ (22 ± 2)°C trong 24 giờ (trong bóng tối nếu xác định được cadimi) với các biện pháp thích hợp để hạn chế sự bay hơi.
ƠN
Dung dịch ngâm chiết sau đó được khuấy đồng nhất, được pha loãng nếu cần thiết và phân tích bằng thiết bị AAS với bước sóng thích hợp.
NH
Kết quả tính toán là lượng chì hoặc cadimi trong tổng thể tích của dung dịch ngâm chiết tính bằng mg Pb hoặc Cd trên 1 dm2 diện tích bề mặt. Bước 1: Xác định đại lượng đo
M
QU
Y
Các đại lượng ảnh hưởng đến độ không đảm bảo đo như thời gian, nhiệt độ, khối lượng và thể tích... Nồng độ C0 của chì hoặc cadimi trong acid acetic sau khi pha loãng được xác định bằng phép đo phổ hấp thụ nguyên tử và được tính toán bằng cách sử dụng công thức: A0 − a (mg/L) Co = b Trong đó: – C0: Nồng độ của chì hoặc cadimi trong dung dịch chiết (mg/L);
KÈ
– A0: Độ hấp thu của chì hoặc cadimi trong dung dịch chiết; – a: Hệ số tự do của đường chuẩn; – b: Hệ số góc của đường chuẩn.
DẠ Y
Kết quả từ phương pháp thực nghiệm được biểu thị bằng khối lượng mr của chì hoặc cadimi bị rửa trôi trên một đơn vị diện tích. mr được tính bằng công thức
140
mr =
C0 × VL VL × (A0 − a) ×d = × d (mg/dm2 ) aV aV × b
Trong đó: – VL: Thể tích của dung dịch chiết (L); – aV: Diện tích bề mặt của đồ gốm (dm2);
OF FI
– d: Hệ số pha loãng của mẫu.
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Bước 2. Xác định các nguồn gây nên độ không đảm bảo đo
QU
Y
NH
ƠN
Từ công thức tính đại lượng đo, các nguồn gây nên độ KĐBĐ được mô tả theo sơ đồ xương cá sau:
DẠ Y
KÈ
M
Tất cả các đại lượng ảnh hưởng có khả năng xảy ra đều phải được tính đến ví dụ như: ảnh hưởng nhiệt độ thời gian và nồng độ acid đến sự tách kim loại bằng ngâm chiết. Để phù hợp hơn, các đại lượng ảnh hưởng được bổ sung vào phương trình bằng các hệ số hiệu chỉnh tương ứng. Công thức hiệu chỉnh tính khối lượng m của chì hoặc cadimi bị tách chiết trên một đơn vị diện tích được tính như sau: C0 × VL mr = × d × facid × ftime × ftemp aV Sơ đồ xương cá bổ sung các yếu tố hiệu chỉnh có dạng:
141
ƠN
OF FI
CI AL
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
Bước 3: Xác định các nguồn gây ra độ không đảm bảo đo
NH
Độ KĐBĐ thành phần được xác định bằng cách sử dụng dữ liệu thực nghiệm hoặc từ các giả định dựa trên cơ sở chắc chắn. (1) Nguồn gây độ không đảm bảo đo của thể tích VL
QU
Y
– Sự làm đầy mẫu: Phương pháp thực nghiệm yêu cầu bình gốm phải được làm đầy bằng dung dịch acid acetic. Đối với dụng cụ ly, chén bằng gốm trong nhà bếp thông thường gần như hình trụ. Nếu dụng cụ gốm được lấp đầy 99.5 ± 0.5% tương đương với VL sẽ xấp xỉ 0.995 ± 0.005 thể tích của bình gốm.
KÈ
M
– Ảnh hưởng của nhiệt độ: Nhiệt độ của acid acetic là 22 ± 2ºC. Khoảng nhiệt độ này dẫn đến độ không đảm bảo do sự giãn nở thể tích của chất lỏng lớn hơn đáng kể so với bình với hệ số giản nở của dung dịch là 2.1 × 10–4. Với thể tích 332 mL dung dịch acid acetic, độ không đảm bảo đo thể tích do nhiệt độ gây nên là (phân bố hình chữ nhật): 2.1 × 10−4 × 332 × 2
DẠ Y
= 0.08 mL √3 – Sai số do đong thể tích: Sai số về thể tích VL khi dùng ống đong có độ chính xác là 1% (tức là 0.01VL). Độ không đảm bảo đo tiêu chuẩn được tính toán theo phân bố tam giác.
142
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
– Hiệu chuẩn: Ống đong 500 mL có dung sai theo cam kết của nhà sản xuất là ± 2.5 mL cho. Độ không đảm bảo đo chuẩn được tính theo phân bố tam giác.
Với thể tích dung dịch chiết là 332 mL, độ không đảm bảo đo của thể tích là: 0.005×332 2 √6
0.01×332 2
) + 0.082 + (
√6
2.5 2
OF FI
u(VL ) = √(
) + ( ) = 1.83 mL √6
(2) Độ không đảm bảo đo tính từ đường chuẩn
Kết quả thực nghiệm xây dựng đường hiệu chuẩn thu được như bảng sau:
ƠN
ABS
Nồng độ (mg/L) 1
2
3
0.029
0.029
0.028
0.3
0.084
0.083
0.081
0.5
0.135
0.131
0.133
0.7
0.180
0.181
0.183
0.230
0.216
Y
NH
0.1
0.215
QU
0.9
Giá trị
SD
b (slope)
0.2410
0.0050
a (intercept)
0.0087
0.0029
KÈ
Hệ số
M
Sau khi tính toán hồi quy (theo phương pháp bình phương cực tiểu) các hệ số của phương trình đường hồi quy thu được là:
Nồng độ cadimi trong dung dịch ngâm chiết thu được là 0.026 mg/L (trung bình của 2 lần đo lặp)
DẠ Y
Độ KĐBĐ đo của C0 do đường chuẩn gây nên là: uC0 =
S𝑦 b
1
1
√ + + p n
̅ 0 −C ̅ )2 (C s2x
=
0.005486 0.241
1
1
√ + + 2 15
(0.26−0.5)2 1.2
= 0.018
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
143
2 ∑n j=1[Aj −(𝑎+b×Cj )]
S𝑦 = √
n−2
CI AL
Trong đó: = 0.005486;
2 Sx2 = ∑nj=1(Cj − C̅) = 1.2;
p: Số lần đo để xác định giá trị C0 ;
OF FI
b: độ dốc của đường chuẩn; n: tổng số thí nghiệm của đường chuẩn; C̅0 : Nồng độ của cadimi trong dịch rửa giải; Cj: nồng độ tại các điểm chuẩn. (3) Diện tích bề mặt aV
ƠN
C̅: Giá trị trung trình của các nồng độ trong đường chuẩn;
NH
– Đo chiều dài (đo đường kính hình tròn): Diện tích bề mặt của mẫu là diện tích của hình võng được hình thành khi đổ đầy dung dịch rửa giải (theo tiêu chuẩn Châu Âu 84/500/EEC). Diện tích bề mặt aV của vật mẫu được tính bằng diện tích của hình tròn có đường kính đo được d = 2.70 dm. aV = πd2/4 = 3.142×(2.70/2)2 = 5.73 dm2.
QU
Y
Phép đo đường kính được ước tính có dung sai khoảng 2 mm ở độ tin cậy 95%. Do vậy độ không đảm bảo đo chuẩn của đường kính Ud = 0.02/2= 0.01. Áp dụng công thức tính sai số tích lũy thu được độ không đảm bảo đo chuẩn gây nên bởi đường kính là 0.042 dm2.
KÈ
M
– Ảnh hưởng của hình dạng đến ước tính diện tích: Vì vật phẩm không có hình dạng hình học hoàn hảo nên có sự không chắc chắn trong việc tính toán diện tích. Trong trường hợp này, ước tính sai số đóng góp thêm 5% ở độ tin cậy 95%. Do vậy, độ không đảm bảo đo chuẩn ứng với diện tích 5.73 dm2 là: 5.73 × 0.05/1.96 = 0.146 dm2.
DẠ Y
Độ không đảm bảo đo chuẩn của diện tích bề mặt là: uaV = √0.0422 + 0.1462 = 0.19 dm2
144
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
(4) Hiệu ứng nhiệt độ
uftemp =
0.1 √3
OF FI
Theo một số nghiên cứu về ảnh hưởng của nhiệt độ đến sự giải phóng kim loại từ đồ gốm đã được thực hiện, ảnh hưởng của nhiệt độ là đáng kể và sự giải phóng kim loại theo nhiệt độ tăng theo cấp số nhân cho đến khi đạt đến các giá trị giới hạn. Các nghiên cứu chỉ ra rằng sự thay đổi khi giải phóng kim loại ở nhiệt độ gần 25°C là xấp xỉ tuyến tính với gradient 5% (0.05). Trong phạm vi ± 2°C được phép của phương pháp thực nghiệm, thì sai lệch của nhiệt độ là 0.05 ×(± 2°C) = ± 0.1°C. Phân bố hình chữ nhật được sử dụng để chuyển đổi giá trị này thành độ không đảm bảo đo chuẩn: = 0,06
ƠN
(5) Hiệu ứng thời gian
QU
Y
NH
Đối với một quá trình rửa trôi tương đối chậm như ngâm chiết, lượng chất tách ra của quá trình này tỉ lệ thuận với thời gian. Krinitz và Francol đã tìm thấy sự thay đổi nồng độ tách chiết trung bình trong 6h là khoảng 1.8 mg/L (ứng với nồng độ trung bình 86 mg/L), tức là khoảng 0.3%/h. Do đó, với khoảng thời gian ngâm chiết là 24 ± 0.5 h nồng độ C0 sẽ cần hiệu chỉnh theo hệ số fthời gian là ± 0.5 × 0.003 = ± 0.0015. Độ không đảm bảo đo tiêu chuẩn của hiệu ứng thời gian theo phân bố hình chữ nhật là: 0.0015 uftime = = 0.001 √3 (6) Nồng độ acid
DẠ Y
KÈ
M
Nghiên cứu về ảnh hưởng của nồng độ acid đối với sự giải phóng chì từ sản phẩm gốm cho thấy rằng sự thay đổi nồng độ từ 4% đến 5% (v/v) làm lượng chì giải phóng tăng từ 92.9 lên 101.9 mg/L, tương đương với tăng 10 %. Một nghiên cứu khác cho thấy lượng chì giải phóng tăng 50% khi nồng độ tăng thêm 4% (từ 2% đến 6%). Từ hai nghiên cứu trên, một cách gần đúng, sự thay đổi nồng độ chì giải phóng là tuyến tính và xấp xỉ bằng 0.1% thay đổi của nồng độ acid. Trong một thí nghiệm riêng biệt xác định nồng độ và độ KĐBĐ chuẩn của dung dịch acid được sử dụng ngâm chiết bằng cách chuẩn độ với dung dịch NaOH đã chuẩn hóa thu được nồng độ là 3.996% v/v, tương ứng với u = 0.008% v/v (tương tự ví dụ 4.14).
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
145
CI AL
Độ KĐBĐ chuẩn do nồng độ acid đến lượng chì hoặc cadimi giải phóng ra là: ufacid = 0.008 × 0.1 = 0.0008 (%) Bước 4: Tính toán độ không đảm bảo đo
Nồng độ cadimi trong dung dịch ngâm chiết xác định được là
mr =
C0 VL aV
. d. facid . ftime . ftemp =
0.26×0.332
=
OF FI
Lượng cadimi bị giải phóng trên một đơn vị diện tích, giả sử không pha loãng mr có giá trị:
5.73
× 1 × 1 × 1= 0.015 mg/dm2
mr
2
u
2
u
u
2
2
u
2
u
2
uf
f f V a C =√( C 0 ) + ( V L ) + ( a V ) + ( f acid ) + ( f time ) + ( f temp ) 0
L
0.018 2
NH
U mr
ƠN
Độ KĐBĐ chuẩn tổng theo biểu thức tính mr theo KĐBĐ chuẩn của mỗi thành phần được sử dụng như sau:
V
1.83 2
0.19 2
acid
0.0008 2 1
) +(
0.001 2 1
0.06 2
) +(
1
)
Y
= √( 0.26 ) + ( 332 ) + (5.73) + (
temp
time
= 0.097
QU
= √0.0692 + 0.00552 + 0.0332 + 0.00082 + 0.0012 + 0.062 umr = 0.097 × 0.015 = 0.0015 mg/dm2
M
Độ KĐBĐ mở rộng U(mr) thu được bằng áp dụng hệ số phủ là k = 2 Um𝑟 = 0.0015 × 2 = 0.003 mg/dm2
KÈ
Do đó lượng cadimi giải phóng ra từ đồ gốm xác định theo tiêu chuẩn BS 6748:1986 được biểu diễn là:
DẠ Y
mr = 0.015 ± 0.003 mg/dm2 BÀI TẬP CHƯƠNG 4 Bài tập 4.1: Đường chuẩn trong phương pháp phân tích hàm lượng 3,4–methylenedioxy–N–methamphetamine trên nền mẫu máu bằng
146
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
1
2
3
4
5
C
0.25
1.25
2.5
5
25
y1
1.30
1.39
2.56
4.23
15.54
y2
1.26
1.41
2.56
4.22
y3
1.29
1.38
2.58
2.25
6
7
50
100
26.59
53.47
OF FI
n
CI AL
HPLC–MS/MS được thực hiện với 3 lần thí nghiệm lặp, thu được kết quả như sau:
15.56
26.58
53.45
15.54
26.58
53.48
ƠN
a) Xác định các hệ số của phương trình hồi quy. b) Độ lệch chuẩn dư, độ lệch chuẩn của các hệ số của phương trình hồi quy trên có giá trị là bao nhiêu? c) Xác định hệ số tương quan của phương trình, giá trị thu được có đạt yêu cầu cho phép phân tích định lượng nói trên không?
NH
Bài tập 4.2: Hiệu suất thu hồi của phương pháp phân tích dư lượng trifluralin trong thủy sản bằng GC–MS/MS được thực hiện ở 3 khoảng nồng độ bởi 02 kiểm nghiệm thu được kết quả như bảng dưới đây: Nền mẫu 1
Nền mẫu 2
Y
n
KNVB
KNVA
KNVB
KNVA
KNVB
101.40
93.20
88.90
93.10
94.25
96.80
100.90
94.40
97.30
89.25
92.73
103.40
97.70
92.20
91.80
QU
KNVA
Nền mẫu 3
97.20
2
98.47
3
95.93
4
96.33
95.47
94.30
86.60
96.40
92.00
5
97.93
94.93
97.20
89.40
96.45
96.20
6
97.47
92.60
96.90
91.60
101.50
93.35
7
94.93
94.27
98.80
87.50
99.45
97.05
KÈ
M
1
DẠ Y
a) Đánh giá độ lặp của phương pháp trên theo AOAC b) Đánh giá độ lặp trung gian (độ tái lặp nội bộ) theo Horwitz
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
147
CI AL
c) Sử dụng kiểm định student kiểm tra hiệu suất thu hồi trung bình có sự khác biệt so với 100%? Nêu phương thức áp dụng giá trị hiệu suất thu hồi trong tính toán kết quả phân tích thực tế. Bài tập 4.3: Thực hiện hiệu chuẩn bình định mức 100 mL bằng phép cân “đổ vào” với các nguồn gây độ không đảm bảo đo như sau:
OF FI
– Dung sai của bình định mức ε = ± 0.1mL (p = 0.95)
– Độ KĐBĐ chuẩn loại A (cân 10 lần lặp lại) uA = 1.728×10–5 g – Dung sai của cân từ nhà sản xuất ε = ± 0.1 mg (p = 0.95) – Chứng nhận hiệu chuẩn của cân phân tích cho độ lệch chuẩn là 0.1 mg – Hệ số giản nở của nước với P = 0.995 ở 20 ± 30C là 2.1×10–4
ƠN
Tính độ không đảm bảo đo của bình định mức 100 mL nói trên ở độ tin cậy 95%.
NH
Bài tập 4.4: Xác định độ không đảm bảo đo của phương pháp phân tích dư lượng thuốc trừ sâu nhóm phosphor hữu cơ trong bột mì nếu xét đến các nguồn gây nên độ không đảm bảo đo thành phần như sau: – Độ lặp của phương pháp có độ sai chuẩn 0.27 mg/kg (n = 15)
Y
– Độ thu hồi đạt 90% với độ sai chuẩn 4.3% (n = 42)
QU
– Độ đồng nhất mẫu có độ sai chuẩn là 20% Biết độ không đảm bảo đo mở rộng được tính ở độ tin cậy 95%. Tài liệu tham khảo
Alankar Shrivastava. Methods for the determination of limit of detection and limit of quantitation of the analytical methods. Chronicles of Young Scientists, (2011).
2.
W. Horwitz and R.J. Albert. The Horwitz Ratio (HorRat): A Useful Index of Method Performance with Respect to Precision. Journal of AOAC International, Vol. 89, No. 4 (2006), pp. 1095– 1109.
DẠ Y
KÈ
M
1.
3.
Carlos Rivera, Rosario Rodrigez. Horwitz equation as quality benchmark in ISO/IEC 17025 testing laboratory. Bufete de ingerieros industriales, S.C., Pimentel 4104–B; Col. Las Granjas Chihuahua Mexico. C.P. 31160.
148
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Trần Cao Sơn, Phạm Xuân Đà, Lê Thị Hồng Hảo, Nguyễn Thành Trung, Thẩm định phương pháp trong phân tích hóa học và vi sinh vật. NXB. Khoa học và kỹ thuật Hà Nội (2010).
5.
Association of Official Analytical Chemists, Appendix F: Guidelines for standard method performance requirements, Journal of AOAC International, (2016).
6.
International Standard, General requirements for the competence of testing and calibration laboratories, ISO/IEC 17025 (2017).
7.
International Standard, Statistical methods for use in proficiency testing by interlaboratory comparison, ISO 13528:2015 (2015).
8.
International Standard, Accuracy (trueness and precision) of measurement methods and results–Part 2: Basic method for the determination of repeatability and reproducibility of a standard measurement method, ISO 5725–2, 2nd (2019).
9.
Tiêu chuẩn Quốc gia, Phương pháp thống kê dùng trong thử nghiệm thành thạo bằng so sánh liên phòng thí nghiệm, TCVN 9596:2013 (2013).
NH
ƠN
OF FI
CI AL
4.
Y
10. EURACHEM/CITAC, Guide Quantifying Uncertainty in Analytical Measurement, 3th Ed.,(2012).
QU
11. JCGM 100:2008, Evaluation of measurement data–Guide to the expression of uncertainty in measurement. BIMP, Sevres, (2008). 12. Veronika R. Meyer, Review–Measurement uncertainty, Journal of Chromatography A, Vol. 1158 (2007), pp. 15–24.
M
13. European Communities, The performance of Analytical Methods and interpretation of results, 2002/657/EC. (2002).
KÈ
14. Ludwig Huber, Validation and Qualification in Analytical Laboratories, Informa Healthcare, London (2007).
DẠ Y
15. EU Reference Laboratories for residues of Pectisides. Analytical quality control and method validation procedures for pesticide residues analysis in food and feed. SANTE/2017/11813 (2017). 16. Wanlong Zhou, Shuang Yang, Perry G Wang, Matrix effects and application of matrix effect factor, Bioanalysis, Volume 9 (2017), pp.1839–1844.
Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
149
CI AL
17. Dinh–Vu Le, Trong–Tuan Nguyen, Van–Trong Nguyen, A validated method for the simultaneous determination of methamphetamine and 3,4–methylenedioxy–N–methamphetamine in blood based liquid chromatography–tandem mass spectrometry. International journal of Analytical Chemistry, Volume 2020, ID 8862679 (2020) pp.1687– 8760.
OF FI
18. Le Dinh Vu, Phan Tan Lap, Le Van Tan, Development and validation of an analytical method for quantitative determination of benzene, toluene, ethylbenzene, xylenes in ambient air. Rasayan Journal of Chemistry, 11 (2018), pp. 1537–1543.
DẠ Y
KÈ
M
QU
Y
NH
ƠN
19. Dinh–Vu Le, Tan–Lap Phan, Quang–Hieu Tran, Validation of an analytical method for the determination of total arsenic, inorganic arsenic, and total organic arsenic in fish sauce based on hydride generation atomic absorption spectrometry. International Food Research Journal, ID IFRJ20429.R1 (2021)
150
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Chương 5
PHÂN TÍCH TÁC ĐỘNG CỦA CÁC YẾU TỐ TỚI KẾT QUẢ THỰC NGHIỆM
ƠN
OF FI
Phân tích tác động của các yếu tố lên kết quả nghiên cứu được thực hiện dựa trên tham số (phương sai) hoặc không dựa trên tham số của tập số liệu thực nghiệm. Việc phân tích, đánh giá sự ảnh hưởng của các yếu tố không qua tham số đã được đề cập trong chương 3. Trong phạm vi chương này, phương pháp phân tích phương sai (Analysis of Variance, ANOVA) được trình bày với mục đích đánh giá sự ảnh hưởng của các yếu tố thông qua phương sai do ảnh hưởng của các yếu tố lên kết quả nghiên cứu bằng kiểm định Fisher. Các mô hình thực nghiệm phổ biến ứng với phân tích phương sai cụ thể như sau:
NH
– Phân tích phương sai một yếu tố;
– Phân tích phương sai hai yếu tố không có lặp; – Phân tích phương sai hai yếu tố có lặp;
Y
– Phân tích phương sai ba yếu tố trở lên.
M
QU
Tùy vào số lượng các yếu tố khảo sát trong mô hình thực nghiệm và mục đích nghiên cứu cụ thể mà ta áp dụng dạng phân tích một yếu tố, hai yếu tố hay nhiều yếu tố. Việc áp dụng ANOVA trong nghiên cứu đem lại nhiều lợi ích như: rút ngắn thời gian thực nghiệm, tiết kiệm nguyên vật liệu và đặc biệt là cho kết luận một cách khoa học, chắc chắn về mức độ ảnh hưởng của các yếu tố thông qua phép kiểm định thống kê F–test.
DẠ Y
KÈ
Về nguyên tắc, ANOVA dựa trên việc so sánh phương sai do tác động của một yếu tố cụ thể với phương sai ngẫu nhiên/phương sai dư gây ra do thí nghiệm lặp lại. Nếu sự khác biệt này là chắc chắn ở một độ tin cậy nhất định thì sự ảnh hưởng của yếu tố đó là rõ ràng và ngược lại. Để giải quyết bài toán ANOVA, về mặt toán học, cần bóc tách được sự ảnh hưởng thành phần của các yếu tố cơ bản và yếu tố ngẫu nhiên sau đó áp dụng phép kiểm định Fisher để đánh giá.
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
151
CI AL
5.1. Phân tích phương sai một yếu tố
OF FI
Khi khảo sát sự ảnh hưởng của một yếu tố nào đó tới đại lượng quan tâm ta tiến hành thực nghiệm ở các mức giá trị khác nhau của yếu tố đó (yếu tố cơ bản). Tại mỗi mức giá trị của yếu tố cần thực nghiệm lặp lại một số lần nhất định để xác định yếu tố ngẫu nhiên, số lần thí nghiệm lặp tại các mức thực nghiệm khác nhau có thể giống hoặc khác nhau. Ma trận thực nghiệm của bài toán một yếu tố được mô tả như bảng 5.1. Bảng 5.1. Ma trận thực nghiệm của bài toán ANOVA một yếu tố, a mức thực nghiệm
Yếu tố A1
A2
...
Aa
1
y11
y21
...
ya1
2
y12
y22
...
ya2
...
...
...
...
...
y2n
...
y1m m
∑ y1j
Tổng
j=1
∑ y2j j=1
yak p
n
Y
...
ƠN
lặp
NH
Thí nghiệm
...
∑ yaj j=1
QU
Sự khác nhau giữa các kết quả đo khi thay đổi các mức Ai (between group) được thể hiện bởi phương sai của yếu tố. Phương sai của yếu tố sẽ càng lớn nếu ảnh hưởng của yếu tố đó tới kết quả càng lớn.
M
Sự sai khác khi tiến hành đo lặp lại tại mỗi mức (within group) đặc trưng bởi phương sai sai số hay phương sai dư (residue).
KÈ
Phép kiểm định Fisher so sánh phương sai của yếu tố với phương sai dư cho phép kết luận sự ảnh hưởng của yếu tố đang xét tới kết quả là có ý nghĩa hay không có ý nghĩa.
DẠ Y
Kết quả tính toán trong ANOVA một yếu tố được trình bày tóm tắt như trong bảng 5.2.
152
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Tổng
N–1
SSt = SS1 – SS3
Trong đó:
Fstat SA2 Sr2
Fcrit
p–value
F(α, fA,fr) P(F,fA,fr)
OF FI
Phương sai Bậc tự Tổng bình phương Nguồn (S2, Mean of do (f) (Sum of square) square) SSA SA2 = A fA=a – 1 SSA = SS2 – SS3 fA SSr Sr2 = Sai số fr=N–a SSr = SS1–SS2 fr
CI AL
Bảng 5.2. Bảng ANOVA một yếu tố
ƠN
– SSt là tổng các bình phương đặc trưng cho độ sai khác của toàn bộ ma trận so với giá trị trung bình: 2
SSt=∑ai=1 ∑nj=1(xij − x̅) = SS1 – SS3
(5.1)
NH
– SSA là tổng các bình phương của yếu tố A, đặc trưng cho sự thay đổi các mức (giữa các cột/between group): SSA = ∑ai=1 ni (x̅i − x̅)2 = SS2 – SS3
(5.2)
ni là số lần lặp lại tại mức thứ i của yếu tố A
QU
Y
– SSr là tổng bình phương sai số hay tổng bình phương dư đặc trưng cho thay đổi ngẫu nhiên của thực nghiệm: 2
SSr = ∑ai=1 ∑nj=1(xij − x̅i ) = SSt – SSA= SS1–SS2
(5.3)
M
– SS1 là tổng bình phương tất cả các giá trị trong ma trận thực nghiệm: SS1 = ∑ai=1 ∑nj=1 yij2 (5.4)
KÈ
– SS2 là tổng các trung bình bình phương tất cả các giá trị của mỗi cột (mỗi mức thực nghiệm): A2
DẠ Y
SS2 = ∑ai=1 ni
i
(5.5)
Trong đó Ai là tổng của cột i, n là số lần thí nghiệm lặp trong cột thứ i, số lần thí nghiệm lặp trong các cột có thể khác nhau. – SS3 là bình phương của tổng các giá trị trong ma trận thực nghiệm:
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm 2
(5.6)
CI AL
1
SS3 = N (∑ai=1 ∑nj=1 yij )
153
– SA2 là phương sai đặc trưng cho sự ảnh hưởng yếu tố A lên kết quả thực nghiệm: SS
SA2 = a−1A
(5.7)
Sr2 =
OF FI
– Sr2 là phương sai dư hay phương sai lặp lại của thí nghiệm, đặc trưng cho sai số ngẫu nhiên trong quá trình thực nghiệm: SSr fr
(5.8)
Sử dụng chuẩn Fisher để so sánh phương sai: S2
Fstat = SA2
ƠN
r
Fcrit = F(α,fa,fr) p–value = P(Fstat,fa,fr)
(5.9) (5.10) (5.11)
NH
Giả thuyết thống kê: H0: SA2 đồng nhất với Sr2 , yếu tố A có ảnh hưởng lên kết quả đo Ha: SA2 khác biệt với Sr2 , yếu tố A không ảnh hưởng lên kết quả đo
QU
Y
– Nếu Fstat < Fcrit hoặc p–value > α (thường là 0.05), chấp nhận giả thuyết H0. Sai khác do thay đổi các mức thực nghiệm của yếu tố A gây ra không khác sai số thí nghiệm. Do vậy, yếu tố A không có ảnh hưởng đến kết quả đo.
KÈ
M
– Nếu Fstat > Fcrit hoặc p–value < α (thường là 0.05), chấp nhận giả thuyết Ha. Sai khác do thay đổi các mức thực nghiệm của yếu tố A khác biệt với sai số thí nghiệm. Do vậy yếu tố A có ảnh hưởng lên kết quả đo ở một độ tin cậy nhất định (thông thường là 95%). Trong trường hợp cần chỉ ra sự khác biệt ở mức nào của yếu tố so với các mức còn lại cần thực hiện phân tích sâu Post–hoc theo phép kiểm định Ducan hoặc Tukey.
DẠ Y
Ví dụ 5.1: Phân tích hàm lượng muối (%) trong 04 mẫu khoai tây chiên thu được kết quả như bảng dưới đây, hãy kiểm tra xem hàm lượng muối trong các mẫu khoai tây chiên có đồng nhất không?
154
Mẫu 2
Mẫu 3
0.340
0.452
0.398
0.311
0.467
0.447
0.352
0.448
0.377
0.324
0.455
–
0.327
–
–
Giải:
Mẫu 4 0.463 0.420 0.439
OF FI
Mẫu 1
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
0.424 –
SS1 = ∑ai=1 ∑nj=1 yij2 = 2.64186 A2i ni
=
1.6452 5
+
1.8222 4 2
1
+
1.2222 3
+
NH
SS2 = ∑
ƠN
Cách 1: Thực hiện các công thức tính từ 5.1 đến 5.10 kết quả thu được như bảng sau:
SS3 = N (∑ai=1 ∑nj=1 yij ) =
6.4442 16
1.7462 4
= 2.637
= 2.595
f
SS
A
3
SSA = 0.04163
SA2 = 0.01388 33.95
Sai số
12
SSr = 0.00491
Sr2 = 0.00041
Tổng
15
QU
Y
Nguồn
S2
Fstat
Fcrit
p–value
3.49
3.8 10–6
SST= 0.04654
M
Fstat = 33.95 >> Fcrit = 3.49 (p–value = 3.8 10–6 << 0,05) kết luận Ha. Hàm lượng muối trong các mẫu khoai tây chiên là khác nhau rõ rệt. Cách 2: Sử dụng công cụ phân tích ANOVA trong Excel
DẠ Y
KÈ
Nhập bảng dữ liệu Excel, trong data chọn Data analysis và chọn ANOVA: single factor sau đó nhập dữ liệu theo hình sau:
155
ƠN
OF FI
CI AL
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
DẠ Y
KÈ
M
QU
Y
NH
Sau khi chọn ok, kết quả thu được dưới bảng ANOVA tương tự như bảng 5.2:
Cách 3: Sử dụng phần mềm Statgraphics
Phần mềm Statgraphics là một phần mềm xử lý thống kê được sử dụng rộng rãi từ năm 1980 bởi Tiến sỹ Neil W. Polhemus. Đến nay, sau hơn 40
156
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
OF FI
CI AL
năm phát triển, phần mềm đã được nâng cấp lên tới phiên bản 19 với năm ngôn ngữ Anh, Đức, Pháp, Tây Ban Nha và Ý. Phần mềm có thể thực hiện được hầu hết các phép xử lý thống kê và đồ thị. Stagraphics cung cấp nhiều công cụ trong xử lý thống kê trong đó có kiểm định thống kê, phân tích phương sai, thiết kế và phân tích thực nghiệm với hầu hết các mô hình thực nghiệm phổ biến hiện nay.
KÈ
M
QU
Y
NH
ƠN
Trong phân tích phương sai, Statgraphics cho phép xử lý các bài toán ANOVA đa dạng hơn so với Excel ở số lượng yếu tố của mô hình thực nghiệm. Để tiến hành bài toán ANOVA một yếu tố, tiến hành cài đặt phần mềm Statgraphics và nhập số liệu vào sheet data theo quy cách như hình sau:
DẠ Y
Trong công cụ Compare chọn Analysis of Variance và chọn One– Way ANOVA:
157
OF FI
CI AL
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
QU
Y
NH
ƠN
Chọn biến phụ thuộc là % salt, yếu tố là sample sau đó chọn ok. Khi bảng tables and graph xuất hiện, chọn các bảng cần xuất dữ liệu trong đó chọn ANOVA table, kết quả thu được như sau:
Kết quả thu được tương tự như giải bằng hai cách trên. 5.2. Phân tích phương sai hai yếu tố không lặp (Two factor without replication)
KÈ
M
Khi cần xem xét đại lượng đo có phụ thuộc vào hai yếu tố khác nhau, chúng ta có ma trận thực nghiệm cho phân tích phương sai hai yếu tố, yếu tố A: a mức đo; yếu tố B: b mức đo.
DẠ Y
Ma trận thực nghiệm của bài toán ANOVA hai yếu tố không lặp như bảng 5.3.
158
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Yếu tố A
Yếu tố B
CI AL
Bảng 5.3. Ma trận thực nghiệm của bài toàn ANOVA hai yếu tố không có lặp Tổng hàng
A2
Ai
Aa
B1
y11
y21
...
yn1
B2
y12
y22
...
yn2
Bj
...
...
...
Bb
y1b
y2b
...
Tổng cột
∑bj=1 y1j
∑bj=1 y2j
...
∑ai=1 yi1 ∑ai=1 yi2
OF FI
A1
...
...
yab
∑ai=1 yib
∑bj=1 yaj
∑ai=1 ∑bj=1 yij
ƠN
Để tính toán bài toán này một cách thuận lợi ta lập bảng tính như bảng 5.4 Bảng 5.4. Bảng kết quả bài toán ANOVA hai yếu tố không có lặp f
SS
A
fA = a –1
SSA = SS2 – SS4
B
fB = b –1
SSB = SS3 – SS4
Tổng
N = ab–1
Y
fr = ab – a – SSr = SS1–SS2– b+1 SS3+SS4
Fcrit
p–value
F(α, fA, fr) P(F,fA,fr) F(α,fB, fr) P(F,fB,fr)
SSt = SS1 – SS4
QU
Sai số
S2 Fstat SS SA2 A SA2 = fA Sr2 SSB SB2 SB2 = fB Sr2 SSr Sr2 = fr
NH
Nguồn
Trong đó:
– SSt là tổng các bình phương đặc trưng cho độ sai khác của toàn bộ ma trận so với giá trị trung bình:
M
2
SST = ∑ai=1 ∑bj=1(xij − x̅) = SS1 – SS4
(5.12)
KÈ
– SSA là tổng các bình phương của yếu tố A, đặc trưng cho sự thay đổi của A: SSA =b ∑ai=1(x̅i − x̅)2 = SS2 – SS4
(5.13)
DẠ Y
– SSB là tổng các bình phương của yếu tố B, đặc trưng cho sự thay đổi của B: 2
SSB = a ∑bj=1(x̅j − x̅) = SS3 – SS4
(5.14)
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
159
CI AL
– SSr là tổng bình phương sai số hay tổng bình phương dư đặc trưng cho thay đổi ngẫu nhiên của thực nghiệm: 2
SSr =∑ai=1 ∑bj=1(xij − x̅i − x̅j + x̅) = SST –SSA – SSB = SS1 – SS2 – SS3 + SS4
(5.15)
OF FI
– SS1 là tổng bình phương tất cả các giá trị trong ma trận thực nghiệm tương tự công thức 5.1 2 SS1 = ∑ ∑ ∑ yijk
(5.16)
– SS2 là trung bình tổng các bình phương mỗi cột: 1
SS2 = b ∑ A2i
(5.17)
ƠN
Trong đó Ai là tổng của cột thứ i, b là số mức thực nghiệm của yếu tố B. – SS3 là trung bình tổng các bình phương của mỗi hàng: 1
SS3 = a ∑ Bj2
(5.18)
NH
Trong đó Bj là tổng của hàng thứ j, a là số mức thực nghiệm của yếu tố A. – SS4 là trung bình của bình phương tổng các giá trị trong ma trận thực nghiệm tương tự công thức 5.3: 1
2
Y
SS4 = ab (∑ ∑ yij )
(5.19)
SA2 =
SSA fA
QU
– SA2 là phương sai đặc trưng cho sự ảnh hưởng yếu tố A lên kết quả thực nghiệm: SS
= a−1A
(5.20)
M
– SB2 là phương sai đặc trưng cho sự ảnh hưởng yếu tố B lên kết quả thực nghiệm: SSB
KÈ SB2 =
fB
SS
B = b−1
(5.21)
DẠ Y
– Sr2 là phương sai dư hay phương sai lặp lại của thí nghiệm, đặc trưng cho sai số ngẫu nhiên trong quá trình thực nghiệm: Sr2 =
SSr fr
SS
r = ab−a−b+1
(5.22)
160
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Sử dụng chuẩn Fisher để so sánh lần lượt các phương sai SA2 , SB2 so với Sr2 . Giả thuyết thống kê và kết luận thống kê tương tự như bài toán ANOVA một yếu tố.
OF FI
Ví dụ 5.2: Kết quả phân tích protein trong mẫu dăm bông đóng hộp trên cùng một mẫu ở 3 mức nhiệt độ 415, 435 và 460 oC ở các thời gian 30, 60 và 90 phút thu được như bảng sau đây: t oC 415
435
460
30 phút
27.13
27.20
27.03
60 phút
27.29
27.07
27.10
90 phút
27.03
ƠN
Thời gian
27.03
27.20
NH
Đánh giá nhiệt độ và thời gian có ảnh hưởng đến kết quả phân tích protein trong mẫu dăm bông đóng hộp hay không? Giải:
Cách 1: Áp dụng công thức
Thời gian
QU
Y
Tính các giá trị Ai, Bj (tổng cột và tổng hàng) trong ma trận thực nghiệm t oC
Σhàng
415
435
460
27.13
27.20
27.03
81.36
60 phút
27.29
27.07
27.10
81.46
90 phút
27.03
27.20
27.03
81.26
81.45
81.47
81.16
244.08
KÈ
M
30 phút
Σcột
DẠ Y
Tính tổng các bình phương giá trị trong ma trận thực nghiệm t oC
Thời gian
Σhàng
415
435
460
30 phút
736.04
739.84
730.62
2206.50
60 phút
744.74
732.78
734.41
2211.94
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm 730.62
739.84
730.62
Σcột
2211.40
2212.46
2195.65
Ta có các giá trị như sau:
6619.52
OF FI
– Tổng tất cả các kết quả: ∑ ∑ yij = ∑ Ai = ∑ Bj = 244.08
2201.08
CI AL
90 phút
161
– Tổng bình phương của tất cả các kết quả: SS1 =∑ ∑ yij2 = 6619.5186 1
1
1
1
SS2 = m ∑ A2i = 3 (81.452 + 81.472 + 81.162 ) = 6619.4697
SS4 =
(∑ ∑ yij )
2
N
=
244.082 9
ƠN
SS3 = n ∑ Bj2 = 3 (81.362 + 81.462 + 81.262 ) = 6619.4563 = 6619.4496
SSA = SS2– SS4 = 6619.47 – 6619.45 = 0.0201
NH
SSB = SS3– SS4 = 6619.46 – 6619.45 = 0.0067 SSt = SS1 – SS4 = 6619.52 – 6619.45 = 0.0690 SSr = SST –SSA – SSB= 0.0690 – 0.0201– 0.0067= 0.0423 0.0201
SSB
3−1 0.0067
SB2 =
=
= 0.01003333
QU
SS
SA2 = a−1A =
Y
– Tìm phương sai tương ứng:
= 0.00333333
b−1 3−1 SSr 0.0423
M
Sr2 = a.b−a−b+1 =
4
= =0.01056667
Kết quả được trình bày trong bảng ANOVA thành bảng ta có: Nguồn
SS
Nhiệt độ
2
0.0201
Thời gian
2
Sai số Tổng
DẠ Y
S2
Fcrit
p–value
0.01003333 0.9495268
6.94
0.4598
0.0067
0.00333333 0.3154574
6.94
0.7461
4
0.0423
0.01056667
8
0.0690
KÈ
f
Fstat
162
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Kết luận: – Yếu tố nhiệt độ:
Vì Fstat ≈ 0.95 << Fcrit = 6.94 (p–value = 0.4598 >> 0.05) nên nhiệt độ không ảnh hưởng đến kết quả phân tích. – Yếu tố thời gian:
Cách 2: Sử dụng Microsoft Excel
OF FI
Vì Fstat≈ 0.32 << Fcrit = 6.94 (p–value = 0.7461 >> 0.05) nên thời gian không ảnh hưởng đến kết quả phân tích. – Kết luận chung: nhiệt độ và thời gian không ảnh hưởng lên kết quả phân tích protein trong mẫu dăm bông đóng hộp.
KÈ
M
QU
Y
NH
ƠN
Nhập dữ liệu theo ma trận thực nghiệm và sử dụng công cụ ANOVA: Two–Factor without Replication trong Data analysis theo bảng sau đây:
DẠ Y
Chọn ok kết quả thu được như bảng ANOVA:
163
ƠN
OF FI
CI AL
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
Các giá trị thu được hoàn toàn giống cách 1.
NH
Kết luận: Nhiệt độ và thời gian không ảnh hưởng đến kết quả phân tích.
Cách 3: Sử dụng phần mềm Statgraphics
DẠ Y
KÈ
M
QU
Y
Nhập số liệu vào sheet data như hình dưới đây:
164
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
ƠN
OF FI
CI AL
Trong menu Compare chọn Analysis of Variance và chọn Multifactor ANOVA khai báo dữ liệu theo hướng dẫn dưới đây :
KÈ
M
QU
Y
NH
Sau khi chọn ok kết quả thu được là bảng ANOVA giống như trong cách 2.
Kết luận thống kê hoàn toàn giống như hai cách đã trình bày trên.
DẠ Y
5.3. Phân tích phương sai hai yếu tố có lặp (Two factor with replication) Ma trận thực nghiệm của bài toán ANOVA hai yếu tố có lặp được thiết kế tương tự như không có lặp, chỉ khác tại mỗi tọa độ thí nghiệm được lặp lại k lần. Ma trận thực nghiệm được trình bày như bảng 5.5.
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
165
Yếu tố A
Yếu tố B A2
Ai
y111
y211
...
y112
y212
...
...
...
y11n
y21n
y121
y221
y122
y222
...
OF FI
A1
CI AL
Bảng 5.5. Ma trận thực nghiệm của bài toán ANOVA hai yếu tố có lặp
B1
...
Aa
ya11 ya12 ...
ya1n
...
ya21
...
ya22
...
...
...
y12n
y22n
...
ya2n
...
...
...
...
y2b1
...
yab1
y2b2
...
yab2
...
...
...
y2bn
...
yabn
y1b2 Bb ...
QU
y1bn
NH
y1b1
Y
Bj
ƠN
B2
Kết quả bài toán ANOVA hai yếu tố có lặp được trình bày theo bảng 5.6. f
A
fA=a–1
SSA = SS2 – SS5
fB=b–1
SSB = SS3 – SS5
fAB = (a–1)(b–1)
SSAB = SS4 – SS3 – SS2+ SS5
B
DẠ Y
AB
M
Nguồn
KÈ
Bảng 5.6. Bảng kết quả bài toán ANOVA hai yếu tố có lặp SS
Sai số
fr = ab(n–1)
SSr = SS1 – SS4
Tổng
ft = abn–1
SSt = SS1 – SS5
S2 SSA fA SSB fB SSAB fAB SSr fr
Fstat Fcrit p–value SA2 F(α, fA, fr) P(F,fA,fr) Sr2 SB2 F(α,fB, fr) P(F,fB,fr) Sr2 2 SAB F(α,fAB, fr) P(F,fAB,fr) 2 Sr
166
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Để thuận lợi khi tính các tổng bình phương (SS), trước tiên cần tính tổng các giá trị lặp lại trong một tọa độ thí nghiệm/mức thức nghiệm theo Bảng 5.7 Bảng 5.7. Bảng tổng các giá trị thực nghiệm lặp lại trong bài toán ANOVA Yếu tố A
Tổng hàng
A2
Ai
Aa
B1
∑ni=1 x11i
∑ni=1 x21i
...
B2
∑ni=1 x12i
∑ni=1 x22i
...
Bj
...
...
...
Bb
∑ni=1 x2bi
∑ni=1 x2bi
...
Tổng cột
∑bj=1 x1j
∑bj=1 x2j
OF FI
A1
ƠN
Yếu tố B
∑ni=1 xa1i
∑ai=1 xi1
∑ni=1 xa2i
∑ai=1 xi2
...
...
∑ni=1 xabi
∑ai=1 xi2
∑bj=1 xaj
∑ai=1 ∑bj=1 xij
...
Các tổng bình phương (SS) lần lượt tính bằng các công thức dưới đây:
NH
– SSt là tổng các bình phương đặc trưng cho độ sai khác của toàn bộ ma trận so với giá trị trung bình: 2
SSt = ∑ai=1 ∑bj=1 ∑nk=1(xijk − x̅) = SS1 – SS5
(5.27)
QU
Y
– SSA là tổng các bình phương của yếu tố A, đặc trưng cho sự thay đổi của A: SSA = nb∑ai=1(x̅i − x̅)2 = SS2 – SS5
(5.28)
– SSB là tổng các bình phương của yếu tố B, đặc trưng cho sự thay đổi của B: 2
SSB = na ∑bj=1(x̅j − x̅) = SS3 – SS5
M
(5.29)
KÈ
– SSAB là tổng các bình phương của yếu tố B, đặc trưng cho sự thay đổi của B: 2
SSAB = ∑ai=1 ∑bj=1(x̅ij − x̅i − x̅j + x̅) = SS4 – SS3 – SS2 + SS5
DẠ Y
(5.30) – SSr là tổng bình phương sai số hay tổng bình phương dư đặc trưng cho thay đổi ngẫu nhiên của thực nghiệm:
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
167
2
CI AL
SSr = ∑ai=1 ∑bj=1 ∑nk=1(xijk − x̅ij ) = SST –SSA – SSB – SSAB = SS1 – SS4
(5.31)
– SS1: Tổng của tất cả các bình phương trong ma trận thực nghiệm (công thức 5.16):
OF FI
– SS2: Trung bình tổng của các bình phương tổng tại mức thực nghiệm theo yếu tố A (Ai): 1
SS2 = nb ∑ai=1 A2i
(5.32)
– SS3: Trung bình tổng của các bình phương tổng tại mức thực nghiệm theo yếu tố B:
ƠN
1
SS3 = an ∑bj=1 Bj2
(5.33)
– SS4 là tổng bình phương các giá trị tại các ô của bảng 5.7 chia cho số lần lặp lại: 1
2
NH
SS4 = n ∑ai=1 ∑bj=1(∑nk=1 yijk )
(5.34)
– SS5 là trung bình của bình phương tổng các giá trị trong ma trận thực nghiệm tương tự công thức 5.3: 1
2
Y
SS5 = abn (∑ ∑ ∑ yijk )
(5.35)
QU
– SA2 , SB2 là phương sai đặc trưng cho sự ảnh hưởng yếu tố A và B lên kết quả thực nghiệm tính theo công thức 5.18 và 5.19. 2 – SAB là phương sai đặc trưng cho sự ảnh hưởng đồng thời hai yếu tố A và B lên kết quả thực nghiệm: SSAB
SS
M
2 SAB =
fAB
AB = (a−1)(b−1)
(5.36)
KÈ
– Sr2 là phương sai dư hay phương sai lặp lại của thí nghiệm, đặc trưng cho sai số ngẫu nhiên trong quá trình thực nghiệm:
DẠ Y
Sr2 =
SSr fr
SS
r = ab(n−1)
(5.37)
2 Sử dụng chuẩn Fisher để so sánh lần lượt các phương sai SA2 , SB2 , SAB so với Sr2 . Giả thuyết thống kê và kết luận thống kê tương tự như bài toán ANOVA một yếu tố.
168
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Ví dụ 5.3: Một nghiên cứu về ảnh hưởng của nhiệt độ và thời gian sấy đến hàm lượng ẩm khi sấy khô một sản phẩm như dưới đây: Thời gian
100 oC
3 giờ
6.74
7.32
7.57
6.61
8.02
7.15
6.97
8.04
6.79
7.66
8.53
7.03
7.72
8.4
6.55
7.59
8.65
8.84
11.38
8.48
10.99
9.20
11.76
9.32 9.04
NH
120 oC
15 giờ 8.05
OF FI
80 oC
1 giờ
ƠN
Nhiệt độ
9.60
Phân tích ảnh hưởng của nhiệt độ và thời gian đến độ giảm khối lượng (%) sản phẩm khi sấy.
Y
Giải:
QU
Cách 1: Sử dụng công thức
Tổng các giá trị thực nghiệm lặp lại tại từng mức thí nghiệm như sau: Nhiệt độ
Tổng
Thời gian 3 giờ
15 giờ
dòng
21.46
20.90
24.11
66.47
100 oC
20.37
22.97
25.58
68.92
120 oC
27.96
26.52
34.13
88.61
Tổng cột
69.79
70.39
83.82
224
M
1 giờ
DẠ Y
KÈ
80 oC
Áp dụng các công thức từ 5.22 đến 5.32 thu được các kết quả như sau: 2 SS1 = ∑ ∑ ∑ yijk = 1909.9500 1
SS2 = nb ∑ A2i = 1872.3543
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
169
1
CI AL
SS3 = na ∑ Bj2 = 1891.1066 2
1
SS4 = n ∑ai=1 ∑bj=1(∑nk=1 yijk ) = 1908.4856 2
1
SS5 = nab (∑ ∑ ∑ yijk ) = 1858.3704 SSA = SS2 – SS5 =13.98 SSB = SS3 – SS5 = 32.74 SSAB = SS4 – SS3 – SS2+ SS5 = 3.40 SSr = SS1 – SS4 = 1.46
SB2
SSB
=
fA fB
2 SAB =
Sr2 =
14
= 3−1 = 6.99 32.7
= 3−1 = 16.37
SSAB fAB
SSr fr
3.4
= (3−1)(3−1) = 0.85
ƠN
SSA
NH
SA2 =
OF FI
SSt = SS1 – SS5 = 51.58
1.5
= 3.3(3−1) = 0.08
Kết quả tính toán được trình bày theo bảng dưới đây (theo Bảng 5.7): Nguồn
f
Nhiệt độ (A)
2
Thời gian (B)
2
Fcrit
SSA = 13.98
6.99
85.94
3.55
SSB = 32.74
16.37
201.19
3.55
4
SSAB = 3.40
0.85
10.43
2.93
18
SSr = 1.46
0.08
26
SSt = 51.58
KÈ
Sai số
Fstat
Y QU
M
AB
S2
SS
Tổng
p–value
6.18x10– 10
4.83x10– 13
0.00098
DẠ Y
Kết luận:
– Đối với nhiệt độ: vì Fstat = 85.94 >> Fcrit = 3.55 nên nhiệt độ ảnh hưởng mạnh đến độ hụt khối lượng trong quá trình sấy sản phẩm. Khi nhiệt
170
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
độ thay đổi từ 80 – 100 oC kết quả thay đổi không nhiều, tuy nhiên sự thay đổi là rõ rệt khi tăng từ 100 –120 oC.
OF FI
– Đối với thời gian: vì Fstat = 201.19 >> Fcrit = 3.55 nên thời gian ảnh hưởng mạnh đến độ hụt khối lượng trong quá trình sấy sản phẩm. Khi thời gian sấy thay đổi từ 1h – 3h kết quả thay đổi không nhiều, tuy nhiên sự thay đổi là rõ rệt khi tăng từ 3h–15h. – Yếu tố tác động đồng thời có ảnh hưởng rõ rệt tới độ hụt khối lượng của quá trình sấy (Fstat = 10.43 > Fcrit = 2.93). Cách 2: Sử dụng công cụ Excel
KÈ
M
QU
Y
NH
ƠN
Nhập dữ liệu theo ma trận thực nghiệm và sử dụng công cụ ANOVA: Two–Factor with Replication trong Data analysis theo hình sau đây:
DẠ Y
Chọn ok, kết quả thu được như bảng ANOVA:
171
OF FI
CI AL
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
Các giá trị thu được từ công cụ Excel giống như cách 1. Kết luận thống kê cho bài tập như trong cách 1. Cách 3: Sử dụng phần mềm Stagraphics
DẠ Y
KÈ
M
QU
Y
NH
ƠN
Nhập dữ liệu thực nghiệm theo dòng (27 thí nghiệm tương đương 27 dòng) như hình dưới đây:
Trong menu Compare chọn Analysis of Variance và chọn Multifactor ANOVA khai báo dữ liệu theo hướng dẫn dưới đây:
172
OF FI
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
M
QU
Y
NH
ƠN
Sau khi chọn ok kết quả thu được là bảng ANOVA giống như trong cách 2
KÈ
5.4. Phân tích phương sai ba yếu tố trở lên
DẠ Y
Trong trường hợp mô hình thực nghiệm có ba yếu tố trở lên, việc bố trí thí nghiệm dạng bảng gặp khó khăn. Do vậy, để thuận lợi khi thiết kế thực nghiệm và tính toán, các thí nghiệm được bố trí theo dòng. Mỗi yếu tố được bố trí trong một cột, kết quả thực nghiệm được bố trí một cột. Một dòng của thiết kế thực nghiệm là 1 tọa độ thí nghiệm. Trong trường hợp chung, tổng số thí nghiệm là tích của số mức thực nghiệm các yếu tố. Giả sử bài toán ANOVA 3 yếu tố A, B, C có các mức
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
173
CI AL
thực nghiệm tương ứng là a, b, c thì số thí nghiệm đầy đủ nhất được tính theo công thức: N = abc
(5.34)
OF FI
Ví dụ: Ma trận thực nghiệm của bài toán khảo sát sự ảnh hưởng của nhiệt độ, thời gian và nồng độ vào hiệu suất được khảo sát với các điều kiện: 3 mức nhiệt độ: 100 oC, 150 oC và 200 oC. 4 mức thời gian: 60 phút, 90 phút, 120 phút và 150 phút. 2 mức nồng độ xúc tác là 2% và 5 % Số thí nghiệm của bài toán là: N= 3 × 4 × 2 = 24 thí nghiệm và được trình bày như bảng 5.8. Xúc tác (%)
Nhiệt độ (oC)
Thời gian (phút)
Hiệu suất (%)
1
2
100
60
y111
2
2
100
90
y112
3
2
100
120
y113
4
2
100
150
y114
5
2
150
60
y121
6
2
150
90
y122
7
2
150
120
y123
8
2
150
150
y124
9
2
200
60
y131
10
2
200
90
y132
11
2
200
120
y133
2
200
150
y134
Y QU
M
13
5
100
60
y211
14
5
100
90
y212
15
5
100
120
y213
16
5
100
150
y214
17
5
150
60
y221
18
5
150
90
y222
19
5
150
120
y223
DẠ Y
KÈ
12
NH
n
ƠN
Bảng 5.8. Ví dụ về ma trận thực nghiệm của phương pháp ANOVA 3 yếu tố
174
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC 5
150
150
21
5
200
60
22
5
200
90
23
5
200
120
24
5
200
150
y224
CI AL
20
y231 y232 y233 y234
OF FI
Nguyên tắc xây dựng ma trận: đảm bảo tất cả các mức thực nghiệm của các yếu tố đều xuất hiện.
Việc tính toán của bài toán ANOVA đa yếu tố tương tự như các bài toán hai yếu tố, dưới đây là cách tính của các bài toán ANOVA ba yếu tố. 5.4.1. Phân tích phương sai ba yếu tố không có lặp
ƠN
Gọi A, B, C là ba yếu tố cần khảo sát với các mức thực nghiệm tương ứng là a, b, c. Mỗi mức thực nghiệm làm 01 lần, bài toán ANOVA lúc này được chia làm hai trường hợp sau:
NH
Trường hợp 1: không tính các tương tác đồng thời hai yếu tố (AB, AC, BC).
QU
Y
Trong trường hợp này, sai khác do các tương tác đồng thời được tính gộp với sai số thực nghiệm và được tính là phần dư. Kết luận về sự ảnh hưởng của các yếu tố sẽ chắc chắn hơn do Fstat có xu thế nhỏ hơn (do phương sai dư lớn hơn). Bảng 5.9: Bảng tính toán của bài toán ANOVA 3 yếu tố không lặp, không tính yếu tố tác động từng đôi một Nhân tố
fA= a – 1
SSA = SS2 – SS5
M
SS
fB = b – 1
KÈ
A
f
B
DẠ Y
C
Sai số Tổng
fC = c – 1 fr= a.b.c–
(a+b+c) +2
SSB = SS3 – SS5 SSC = SS4 – SS5
S2 SSA SA2 = fA SB2 =
SSB fB
SC2 =
SSC fC
Sr2 =
SSTN fr
SSr = SS1 –SS2 –SS3 – SS4 + 2SS5
fT = a.b.c–1 SSt = SS1 –SS5
Fstat Fcrit p–value SA2 F(α,fA,fr) P(F,fA,fr) Sr2 SB2 F(α,fB,fr) P(F,fB,fr) Sr2 SC2 Sr2
F(α,fC,fr) P(F,fC,fr)
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
175
CI AL
Trong đó: – SSt là tổng các bình phương đặc trưng cho độ sai khác của toàn bộ ma trận so với giá trị trung bình: 2
SSt = ∑ai=1 ∑bj=1 ∑ck=1(xijk − x̅) = SS1 – SS5
(5.35)
SSA = bc∑ai=1(x̅i − x̅)2 = SS2 – SS5
OF FI
– SSA là tổng các bình phương của yếu tố A, đặc trưng cho sự thay đổi của A: (5.36)
– SSB là tổng các bình phương của yếu tố B, đặc trưng cho sự thay đổi của B: 2
ƠN
SSB = ac ∑bj=1(x̅j − x̅) = SS3 – SS5
(5.37)
– SSC là tổng các bình phương của yếu tố C, đặc trưng cho sự thay đổi của C:
NH
SSC = ab ∑ck=1(x̅k − x̅)2= SS4 – SS5
(5.38)
– SSr là tổng bình phương dư đặc trưng cho thay đổi ngẫu nhiên của thực nghiệm:
Y
SSr = SST –SSA – SSB – SSC = SS1 – SS2 – SS3 – SS4 + 2SS5 (5.39)
QU
– SS1: Tổng của tất cả các bình phương trong ma trận thực nghiệm (theo công thức 5.16) – SS2: Trung bình tổng các bình phương của tổng tại mức mỗi thực nghiệm theo yếu tố A (Ai): 1
M
SS2 = bc ∑ai=1 A2i
(5.40)
KÈ
– SS3: Trung bình tổng các bình phương của tổng tại mức mỗi thực nghiệm theo yếu tố B (Bj): 1
SS3 = ac ∑bj=1 Bj2
(5.41)
DẠ Y
– SS4: Trung bình tổng các bình phương của tổng tại mức mỗi thực nghiệm theo yếu tố C (Ck): 1
SS4 = ab ∑ck=1 Ck2
– SS5: Trung bình bình phương tổng các giá trị:
(5.42)
176
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC 2
(5.43)
CI AL
1
SS5 = abc (∑ai=1 ∑bj=1 ∑ck=1 yijk )
– SA2 , SB2 , SC2 là phương sai đặc trưng cho sự ảnh hưởng yếu tố A, B và C lên kết quả thực nghiệm tính theo công thức tương tự công thức 5.1 – Sr2 là phương sai dư của thí nghiệm, đặc trưng cho sai số ngẫu nhiên trong quá trình thực nghiệm: SSr fr
SS
OF FI
Sr2 =
r = abc−a−b−c +2
(5.44)
ƠN
Sử dụng chuẩn Fisher để so sánh lần lượt các phương sai SA2 , SB2 , SC2 so với Sr2 . Giả thuyết thống kê và kết luận thống kê tương tự như bài toán ANOVA một yếu tố. Trường hợp 2: Có tính đến các tương tác đồng thời hai yếu tố (AB, AC, BC)
NH
Trong trường hợp này, ngoài các tác động của yếu tố đơn lẻ như được trình bày ở trường hợp 1, bài toán còn xét đến các yếu tố đồng thời AB, AC, BC (bảng 5.10). Bảng 5.10. Bảng ANOVA 3 yếu tố không lặp có tính tương tác đồng thời từng đôi một f
S2
SS
Y
Yếu tố
Fstat
Fcrit
p–value
F(α,fA,fr)
P(F,fA,fr)
fA = a – 1
SSA = SS2 – SS8
SA2 =
SSA fA
B
fB = b – 1
SSB = SS3 – SS8
SB2 =
SSB fB
SB2 Sr2
F(α,fB,fr)
P(F,fB,fr)
C
fC = c – 1
SSC = SS4 – SS8
SC2 =
SSC fC
SC2 Sr2
F(α,fC,fr)
P(F,fC,fr)
M
fAB = (a–1)(b–1)
fAC = (a–1)(c–1)
DẠ Y
AC
KÈ
AB
QU
A
SA2 Sr2
BC
fBC = (b–1)(c–1)
SSAB = SS5 – SS2 – SS3 + SS8 SSAC =SS6 – SS2 – SS4 + SS8 SSBC =SS7 – SS3 –SS4 +SS8
2 SAB
2 SSAB SAB = 2 fAB Sr
2 SAC =
2 SSAC SAC Sr2 fAC
2 SBC =
SSBC fBC
2 SBC Sr2
F(α,fAB,fr) P(F,fA,fr)
F(α,fAC,fr) P(F,fAC,fr)
F(α,fBC,fr) P(F,fBC,fr)
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
177
Sai số
fr =abc–ab–ac– + SS3 + SS4 –
Sr2 =
bc+a+b+c –1 SS5 – SS6 – SS7
SSr fr
– SS8 ft = abc – 1
SST = SS1 – SS8
OF FI
Tổng
CI AL
SSr = SS1 + SS2
Tổng bình phương tương ứng được tính theo các công thức sau: – SSt là tổng các bình phương đặc trưng cho độ sai khác của toàn bộ ma trận so với giá trị trung bình: 2
SSt = ∑ai=1 ∑bj=1 ∑ck=1(xijk − x̅) = SS1 – SS8
(5.45)
ƠN
– SSA là tổng các bình phương của yếu tố A: SSA = bc∑ai=1(x̅i − x̅)2 = SS2 – SS8
(5.46)
NH
– SSB là tổng các bình phương của yếu tố B: 2
SSB = ac ∑bj=1(x̅j − x̅) = SS3 – SS8
(5.47)
– SSC là tổng các bình phương của yếu tố C: SSC = ab ∑ck=1(x̅k − x̅)2= SS4 – SS8
Y
(5.48)
QU
– SSAB là tổng các bình phương của đồng thời hai yếu tố A và B: 2
SSAB = c∑ai=1 ∑bj=1(x̅ij − x̅i − x̅j + x̅) = SS5 – SS2 – SS3 + SS8 (5.49)
– SSAC là tổng các bình phương của đồng thời hai yếu tố A và C:
KÈ
M
SSAC = b∑ai=1 ∑ck=1(x̅ik − x̅i − x̅k + x̅)2= SS6 – SS2 – SS4 + SS8 (5.50) – SSBC là tổng các bình phương của đồng thời hai yếu tố B và C: 2
DẠ Y
SSBC = a∑bj=1 ∑ck=1(x̅jk − x̅j − x̅k + x̅) = SS7 –SS3 –SS4 +SS8 (5.51)
– SSr là tổng bình phương dư đặc trưng cho thay đổi ngẫu nhiên của thực nghiệm:
178
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
SSr = SST –SSA – SSB – SSC – SSAB – SSAC – SSBC = SS1 + SS2 + SS3 + SS4 – SS5 – SS6 – SS7 – SS8 (5.52) SS1 được tính theo công thức 5.16. SS2 đến SS4 được tính giống như các công thức 5.40, 5.41, 5.42. SS8 được tính theo công thức 5.43. – SS5 đặc trưng cho tương tác đồng thời hai yếu tố A và B: 2
OF FI
1
SS5 = c ∑ai=1 ∑bj=1(∑ck=1 yijk )
(5.53)
– SS6 đặc trưng cho tương tác đồng thời hai yếu tố A và C: 1
SS6 = b ∑ai=1 ∑ck=1(∑bj=1 yijk )
2
(5.54)
– SS7 đặc trưng cho tương tác đồng thời hai yếu tố B và C: 2
(5.55)
ƠN
1
SS7 = a ∑bj=1 ∑ck=1(∑ai=1 yijk )
NH
Sử dụng chuẩn Fisher để so sánh lần lượt các phương sai SA2 , SB2 , SC2 , 2 2 2 SAB , SAC , SBC với Sr2 . Giả thuyết thống kê và kết luận thống kê tương tự như bài toán ANOVA một yếu tố. 5.4.2. Phân tích phương sai ba yếu tố có lặp
QU
Y
Trong trường hợp mô hình thực nghiệm ba yếu tố có thực hiện các thí nghiệm lặp lại tại mỗi tọa độ thí nghiệm, bài toán trở thành ANOVA ba yếu tố có lặp. Công thức tính toán tương tự như trường hợp thứ 2 của bài toán không có lặp và có tính thêm tương tác đồng thời ba yếu tố ABC. Bảng 5.11. Bảng ANOVA 3 yếu tố có lặp Yếu
SS
fA = a – 1
SSA = SS2 – SS9
SA2 =
C
Fstat
Fcrit
p–value
SSA fA
SA2 Sr2
F(α,fA,fr)
P(F,fA,fr)
SSB = SS3 – SS9
SB2 =
SSB fB
SB2 Sr2
F(α,fB,fr)
P(F,fB,fr)
SSC = SS4 – SS9
SC2 =
SSC fC
SC2 Sr2
F(α,fC,fr)
P(F,fC,fr)
SSAB fAB
2 SAB Sr2
F(α,fAB,fr)
P(F,fA,fr)
M
fB = b – 1
DẠ Y
B
KÈ
A
S2
f
tố
fC = c – 1
AB fAB = (a–1)(b–1)
SSAB = SS5 – SS2 – SS3 + SS9
2 SAB =
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
AC fAC = (a–1)(c–1)
– SS4 + SS9 SSBC =SS7 –SS3
BC fBC = (b–1)(c–1)
–SS4 +SS9
2 SAC
SSAC = fAC
2 SAC Sr2
F(α,fAC,fr)
SSBC fBC
2 SBC Sr2
F(α,fBC,fr)
2 SBC =
SSABC = SS8 – SS5 – SS6– SS7 +
(b–1)(c–1)
SS2+ SS3+ SS4 –
2 SABC =
SSABC fABC
SS9
số Tổng
fr = abc(n–1)
SSr = SS1 – SS8
fT = nabc–1
SST = SS1–SS9
Sr2 =
SSr fr
2 SABC F(α,fABC,fr) P(F,fABC,fr) Sr2
ƠN
Sai
P(F,fBC,fr)
OF FI
fABC = (a–1) ABC
P(F,fAC,fr)
CI AL
SSAC =SS6 – SS2
179
Tổng bình phương tương ứng được tính theo các công thức sau:
NH
– SSt là tổng các bình phương đặc trưng cho độ sai khác của toàn bộ ma trận so với giá trị trung bình: 2
SSt = ∑ai=1 ∑bj=1 ∑ck=1 ∑nl=1(xijkl − x̅) = SS1 – SS9
(5.56)
Y
– SSA là tổng các bình phương của yếu tố A, đặc trưng cho sự thay đổi của A:
QU
SSA = nbc∑ai=1(x̅i − x̅)2 = SS2 – SS9
(5.57)
– SSB là tổng các bình phương của yếu tố B: 2
SSB = nac ∑bj=1(x̅j − x̅) = SS3 – SS9
(5.58)
M
– SSC là tổng các bình phương của yếu tố C: SSC = nab ∑ck=1(x̅k − x̅)2 = SS4 – SS9
(5.59)
KÈ
– SSAB là tổng các bình phương của đồng thời hai yếu tố A và B: 2
DẠ Y
SSAB = nc∑ai=1 ∑bj=1(x̅ij − x̅i − x̅j + x̅) = SS5 – SS2 – SS3 + SS9 (5.60)
– SSAC là tổng các bình phương của đồng thời hai yếu tố A và C: SSAC = nb∑ai=1 ∑ck=1(x̅ik − x̅i − x̅k + x̅)2= SS6 – SS2 – SS4 + SS9 (5.61) – SSBC là tổng các bình phương của đồng thời hai yếu tố B và C:
180
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC 2
CI AL
SSBC = na∑bj=1 ∑ck=1(x̅jk − x̅j − x̅k + x̅) = SS7 –SS3 –SS4 +SS9 (5.62)
– SSABC là tổng bình phương dư đặc trưng cho thay đổi đồng thời ba yếu tố A, B, C: SSABC
=
n∑ai=1 ∑bj=1 ∑ck=1(x̅ijk − x̅ij − x̅ik − x̅jk + x̅i + x̅j + x̅k −
2
OF FI
x̅) = SS8 – SS5 – SS6– SS7 + SS2+ SS3+ SS4 –SS9
(5.63)
– SSr là tổng bình phương dư đặc trưng cho thay đổi ngẫu nhiên của thực nghiệm: 2
SSr = ∑ai=1 ∑bj=1 ∑ck=1 ∑nl=1(xijkl − x̅ijk ) = SST –SSA – SSB – SSC – SSAB – SSAC – SSBC – SSABC = SS1 – SS8
(5.64)
2 SS1 = ∑ai=1 ∑bj=1 ∑ck=1 ∑nl xijkl
ƠN
– SS1 là tổng của tất cả các bình phương trong ma trận thực nghiệm: (5.65)
1
SS2 = nbc ∑ai=1 A2i
NH
– SS2 trung bình tổng các bình phương của tổng tại mức mỗi thực nghiệm theo yếu tố A (Ai): (5.66)
1
(5.67)
QU
SS3 = nac ∑bj=1 Bj2
Y
– SS3: Trung bình tổng các bình phương của tổng tại mức mỗi thực nghiệm theo yếu tố B (Bj):
– SS4 là trung bình tổng các bình phương của tổng tại mức mỗi thực nghiệm theo yếu tố C (Ck): 1
M
SS4 = nab ∑ck=1 Ck2
(5.68)
– SS5 đặc trưng cho tương tác đồng thời hai yếu tố A và B: 1
KÈ
SS5 = nc ∑ai=1 ∑bj=1(∑ck=1 ∑nl=1 yijkl )
2
(5.69)
– SS6 đặc trưng cho tương tác đồng thời hai yếu tố A và C:
DẠ Y
SS6 =
1
nb
∑ai=1 ∑ck=1(∑bj=1 ∑nl=1 yijkl )
2
(5.70)
– SS7 đặc trưng cho tương tác đồng thời hai yếu tố B và C: 1
SS7 = na ∑bj=1 ∑ck=1(∑ai=1 ∑nl=1 yijkl )
2
– SS8 đặc trưng cho tương tác đồng thời ba yếu tố A, B và C:
(5.71)
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
181
2
(5.72)
– SS9 là trung bình bình phương tổng các giá trị: 1
SS9 = nabc (∑ai=1 ∑bj=1 ∑ck=1 yijk )
2
CI AL
1
SS8 = n ∑ai=1 ∑bj=1 ∑ck=1 (∑nl=1 yijkl )
(5.73)
OF FI
Sử dụng chuẩn Fisher để so sánh lần lượt các phương sai SA2 , SB2 , SC2 , 2 2 2 2 SAB , SAC , SBC , SABC với Sr2 . Giả thuyết thống kê và kết luận thống kê tương tự như bài toán ANOVA một yếu tố. Ví dụ 5.4: Trong quá trình sản xuất giấy, người ta đã nghiên cứu ảnh hưởng của tỉ lệ phần trăm gỗ cứng trong bột gỗ thô nguyên liệu, áp suất và thời gian nấu lên độ bền của giấy với giá trị của các yếu tố như sau:
ƠN
Yếu tố A, thời gian nấu ở 2 mức: 3h và 4h.
Yếu tố B, áp suất ở 3 mức: 400, 500 và 650.
Yếu tố C, tỉ lệ % gỗ cứng ở 3 mức: 2%, 4% và 6%.
NH
Mỗi mức thực nghiệm được làm lặp lại hai lần, kết quả thu được như bảng số liệu dưới đây: Thời gian (h)
Áp suất (psi)
Gỗ cứng (%)
Độ bền
1
3
400
2
196.6
2
3
400
2
196.0
3
3
400
4
198.5
4
3
400
4
197.2
5
3
400
6
197.5
6
3
400
6
196.6
3
500
2
197.7
3
500
2
196.0
9
3
500
4
196.0
10
3
500
4
196.9
11
3
500
6
195.6
12
3
500
6
196.2
13
3
650
2
199.8
14
3
650
2
199.4
DẠ Y
QU
KÈ
8
M
7
Y
n
182
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
650
4
16
3
650
4
17
3
650
6
18
3
650
6
19
4
400
2
20
4
400
2
21
4
400
22
4
400
23
4
400
24
4
400
25
4
500
26
4
500
27
4
500
28
4
500
29
4
30
4
31
4
32
4
33
4
34
198.4
CI AL
3
OF FI
15
197.6 197.4 198.1 198.4 198.6 197.5
4
198.1
6
197.6
6
198.4
2
199.6
2
200.4
4
198.7
4
198.0
500
6
197.0
500
6
197.8
650
2
200.6
650
2
200.9
650
4
199.6
4
650
4
199.0
35
4
650
6
198.5
36
4
650
6
199.8
QU
Y
NH
ƠN
4
KÈ
M
Phân tích sự ảnh hưởng của các yếu tố nói trên đến độ bền của sản phẩm giấy thu được. Giải:
Cách 1: Áp dụng công thức tính thông thường
DẠ Y
Áp dụng các công thức từ 5.65 đến 5.73 cho bộ số liệu ở trên ta thu được các kết quả như sau: 2 SS1 = ∑2i=1 ∑3j=1 ∑3k=1 ∑21 xijkl = 1412202.42 1
SS2 = 2.3.3 ∑2i=1 A2i = 1412156.36
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
183
1
SS4 = 2.2.3 ∑3k=1 Ck2 = 1412143.88 1
2
1
2
1
2
SS5 = 2.3 ∑2i=1 ∑3j=1(∑3k=1 ∑2l=1 yijkl ) = 1412177.93
OF FI
SS6 = 2.3 ∑2i=1 ∑3k=1(∑3j=1 ∑2l=1 yijkl ) = 1412166.21
CI AL
1
SS3 = 2.2.3 ∑3j=1 Bj2 =1412155.49
SS7 = 2.2 ∑3j=1 ∑3k=1(∑2i=1 ∑2l=1 yijkl ) = 1412169.34 2
1
SS8 = 2 ∑2i=1 ∑3j=1 ∑3k=1 (∑3l=1 yijkl ) = 1412195.84 2
1
SS9 = 2.2.3.3 (∑2i=1 ∑3j=1 ∑3k=1 yijk ) = 1412136.11
ƠN
Việc tính toán sẽ nhanh chóng và chính xác nếu sử dụng các hàm Excel. Trong đó sử dụng hàm Sumsq cho SS1; Sumif cho các tổng SS2, SS3, SS4 và hàm Sumifs cho các tổng SS5, SS6, SS7 và SS8.
SSt = SS1 – SS9 = 66.31
NH
Thay các giá trị SS1 đến SS9 và các công thức 5.56 đến 5.64 thu được tổng các bình phương đặc trưng cho từng yếu tố và các tổ hợp tương tác đồng thời:
Y
SSA = SS2 – SS9 = 20.25
QU
SSB = SS3 – SS9 = 19.37 SSC = SS4 – SS9 = 7.76
SSAB = SS5 – SS2 – SS3 + SS9 = 2.20
M
SSAC = SS6 – SS2 – SS4 + SS9 = 2.08
KÈ
SSBC = SS7 –SS3 –SS4 +SS9 = 6.09 SSABC = SS8–SS5 –SS6–SS7 + SS2+ SS3+SS4 –SS9 = 1.97 SSr = SS1–SS8 = 6.58
DẠ Y
Từ giá trị các tổng bình phương, tính giá trị Fisher tương ứng với giá trị F tra bảng (hoặc dùng hàm FINV(0.05,f1,f2)) và p–value tính được (dùng hàm FDIST(F,f1,f2)). Kết được trình bày như bảng sau:
184
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
SS
S2
Fstat
Fcrit
A
1
20.25
20.250
55.39
4.41
B
2
19.37
9.687
26.50
3.56
C
2
7.76
3.882
10.62
3.56
AB
2
2.20
1.098
3.00
3.56
AC
2
2.08
1.041
2.85
BC
4
6.09
1.523
4.17
ABC
4
1.97
0.493
1.35
Sai số
18
6.58
0.366
Tổng
35
66.31
p–value
CI AL
f
6.75E–07
4.327E–06 0.000899 0.074956
OF FI
Yếu tố
0.084260
2.93
0.014626
2.93
0.290305
ƠN
3.56
NH
Kết luận: Cả 3 yếu tố đều ảnh hưởng mạnh đến độ bền của giấy thành phẩm. Trong các yếu tác động đồng thời chỉ có AC có ảnh hưởng tới chất lượng của sản phẩm. Cách 2: Dùng phần mềm Statgraphics
Y
Nhập ma trận thực nghiệm vào DataBook sau đó sử dụng công cụ Compare/Analysis of Variance/Multifactor ANOVA.
QU
Tiếp theo khai báo dữ liệu đầu vào: Chọn giá trị thực nghiệm (Endurance–độ bền) vào ô Dependent Variable; Các yếu tố vào ô Factors và chọn ok. Tiếp tục chọn giá trị của Maximum order interaction với ý nghĩa như sau:
KÈ
M
– Maximum order interaction #1: Chỉ tính tác động của các yếu tố đơn lẻ. – Maximum order interaction #2: Tính đến các tác động đồng thời từng cặp hai yếu tố. – Maximum order interaction #3: Tính đến tác động đồng thời ba yếu
DẠ Y
tố.
Nhập giá trị Maximum order interaction #3 và chọn ok, chọn trả kết quả ANOVA table và chọn ok để hoàn tất bài toán ANOVA. Bảng dữ liệu và kết quả thu được như trình bày bởi các hình dưới đây.
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
185
ƠN
OF FI
CI AL
Bảng nhập dữ liệu và khai báo:
KÈ
M
QU
Y
NH
Bảng kết quả ANOVA:
DẠ Y
Kết quả ANOVA hoàn toàn giống với cách tính thông thường. Kết luận thống kê cho bài toán giống như đã trình bày ở cách 1.
186
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
BÀI TẬP CHƯƠNG 5 Bài tập 5.1. Độ tái lặp của một phương pháp thử nghiệm được đánh giá bằng phân tích lặp trên một mẫu chuẩn bởi các kiểm nghiệm viên làm việc độc lập với nhau, kết quả thu được như sau: KNV 2
KNV 3
KNV 4
0.1177
0.1186
0.1183
0.1191
0.1207
0.1199
0.1195
0.1202
0.1185
0.1192
0.1187
0.1192
0.1197
0.1213
0.1184
0.1187
0.1187
0.1205
0.1201
0.1179
0.1207
0.1191
0.1183
0.1191
ƠN
OF FI
KNV 1
NH
Có khác biệt về độ lặp giữa các kiểm nghiệm viên hay không ở độ tin cậy 95%? Hãy đánh giá độ lặp của phương pháp theo tiêu chuẩn RSDr Horwizt.
DẠ Y
pH 5
6
7
8
9
20
12
10
6.0
5.0
5.0
4.0
30
12
9.8
5.0
5.5
8.0
9.5
40
13
9.0
5.0
5.5
8.0
9.0
50
15
9.5
6.0
5.6
7.5
9.2
60
11
9.2
5.4
6.2
7.0
9.2
M
4
KÈ
Nhiệt độ (oC)
QU
Y
Bài tập 5.2. Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa nhiệt độ, giá trị pH đến quá trình chiết điểm đám mây (cloud point extraction ) của phức Fe–1,10 phenalthroline. Hàm lượng Fe (ppm) được ghi nhận từ các thí nghiệm như bảng bên dưới đây:
Đánh giá sự ảnh hưởng của nhiệt độ và giá trị pH đến kết quả chiết suất Fe bằng phương pháp chiết điểm đám mây với độ tin cậy 95%.
Chương 5: Phân tích tác động của các yếu tố tới kết quả thực nghiệm
187
pH
40
0.527
0.419
0.573
0.452
0.596
0.515
0.490
0.391
0.425
0.382
0.409
0.368
0.299
0.363
0.671
0.596
0.527
0.561
0.645
0.576
0.559
0.591
0.573
0.566
0.644
0.617
4,5
OF FI
3,5
0.352
0.464
0.276
0.482
0.322
0.499
0.275
0.318
0.262
0.350
ƠN
30
3
NH
Nhiệt độ
20
4
CI AL
Bài tập 5.3. Đánh giá ảnh hưởng pH và nhiệt độ đến việc xử lý Pb trong bùn thải với kết quả hàm lượng Pb còn lại sau khi xử lý thu được như bảng sau:
Các yếu tố pH và nhiệt độ ảnh hưởng như thế nào đến kết quả xử lý?
QU
Y
Bài tập 5.4. Hiệu suất của một phản ứng hóa học được nghiên cứu dưới sự thay đổi của nhiệt độ và áp suất ở hai ngày khác nhau: Ngày 1
Thấp
Cao
250
260
270
250
260
270
86.3
84
85.8
86.1
85.2
87.3
88.5
87.3
89
89.4
89.9
90.3
89.1
90.2
91.3
91.7
93.2
93.7
KÈ
Trung bình
Áp suất
M
Nhiệt độ
Ngày 2
Đánh giá sự ảnh hưởng của các yếu tố lên hiệu suất của phản ứng.
DẠ Y
Bài tập 5.5. Một khảo sát về mức độ ô nhiễm hạt vi nhựa trong cát tại một bãi biển theo nồng độ hạt/kg ở các vị trí lấy mẫu khác, kết quả thu được như bảng sau:
188
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Vị trí 1
Vị trí 2
Vị trí 3
Hàng 1
74.96
38.95
68.32
Hàng 2
72.80
43.81
84.73
Hàng 3
59.92
49.41
66.97
Hàng 4
86.37
58.03
59.26
CI AL
Vị trí theo chiều ngang bãi biển
Vị trí theo chiều dọc
Hàng 5
77.02
53.70
58.09
80.14
Vị trí 4 67.61 65.64 84.26
OF FI
31.99
Đánh giá tính đồng nhất thống kê theo hai yếu tố trên, trong trường hợp có khác biệt hãy xác định mức của yếu tố có sự khác biệt ở độ tin cậy 95%.
4.
DẠ Y
KÈ
M
5.
NH
3.
Y
2.
Douglas C. Montgomery, Design and Analysis of Experiments, 10th Edition , Johnwiley & Sons. Inc (2019) Alexey L. Pomerantsev, Chemometrics in Excel, John Wiley & Sons, Inc (2014). James N. Miller, Jane C. Miller, Robert D. Miller, Statistics and Chemometrics for Analytical Chemistry, 7th Edition, Pearson Education Limited (2018). Lê Đức Ngọc, Vũ Thị Quyên. Nhập môn Xử lý số liệu và kế hoạch hóa thực nghiệm Hóa học. NXB ĐHQG Hà Nội. (2017). Vo Thi Kim Khuyen, Dinh Vu Le, Axel René Fischer, and Christina Dornack, Comparison of Microplastic Pollution in Beach Sediment and Seawater at UNESCO Can Gio Mangrove Biosphere Reserve, Global Challenges, 2100044 (2021) pp.1–9.
QU
1.
ƠN
Tài liệu tham khảo
Chương 6. Thiết kế và phân tích thực nghiệm
189
CI AL
Chương 6
THIẾT KẾ VÀ PHÂN TÍCH THỰC NGHIỆM
OF FI
6.1. Cơ sở lý thuyết về thiết kế và phân tích thực nghiệm 6.1.1. Vai trò của thiết kế và phân tích thực nghiệm
ƠN
Trong phương pháp nghiên cứu thực nghiệm truyền thống, khi xem xét sự ảnh hưởng của một yếu tố cơ bản nào đó lên kết quả cần khảo sát người ta thường cô lập sự tác động của các yếu tố cơ bản khác (cố định giá trị các yếu tố khác). Từ quy luật ảnh hưởng của một yếu tố đơn lẻ, tìm được điểm tối ưu cô lập để phục vụ cho việc tìm các điểm tối ưu khác. Điều kiện tối ưu chung cho nghiên cứu là tổ hợp tất cả các điểm tối ưu thành phần. Phương pháp được gọi là phương pháp thực nghiệm sàng lọc.
NH
Xét về tính khoa học, độ tin cậy và nguồn lực kinh tế (thời gian, vật liệu nghiên cứu,...), phương pháp trên gặp những khó khăn như sau: – Số lượng khảo sát thực nghiệm lớn.
QU
Y
– Kết quả tối ưu tìm được có độ tin cậy không cao vì không xét đến các yếu tố đồng thời. Giá trị tối ưu tìm được có thể thay đổi khi các yếu tố còn lại thay đổi.
M
– Trong thực tế, không phải tất cả các nghiên cứu thực nghiệm mong muốn là giá trị lớn nhất hoặc nhỏ nhất. Có nhiều bài toán thực nghiệm cần tìm giá trị các yếu tố tại một giá trị nhất định (không phải cực trị). Phương pháp cô lập rất khó đáp ứng được trong trường hợp này.
DẠ Y
KÈ
Để khắc phục những hạn chế nói trên, thiết kế thí nghiệm dựa trên thực nghiệm mô phỏng với mô hình toán học hồi quy đa thức được sử dụng thay thế. Quy luật về mối tương quan giữa những yếu tố cần khảo sát (biến độc lập) với đại lượng đo được nghiên cứu (biến phụ thuộc) thông qua thiết kế ma trận thực nghiệm. Mỗi dạng mô hình thực nghiệm được lựa chọn sẽ có một kiểu ma trận thí nghiệm tương ứng. Điểm chung ở các mô hình này thường là hàm đa thức còn được gọi là phương trình hồi quy. Phương trình hồi quy có thể là
190
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
đa thức bậc 1, bậc 2 hay bậc cao hơn. Bậc của phương trình càng cao thì mô hình càng phù hợp. Một cách tổng quát, phương trình hồi quy của mô hình thực nghiệm có dạng như biểu thức 6.1. y = b0 + ∑ni=1 bi xi + ∑ni<j bij xi xj + ∑ni<j<k… bijk… xi xj xk… + + ⋯ + ∑ni=1 bii xi2
(6.1)
OF FI
Trong đó:
– y: hàm mục tiêu (biến phụ thuộc) đặc trưng cho giá trị đo trong mô hình thực nghiệm (hiệu suất, độ ẩm, năng suất,...); – xi : là yếu tố ảnh hưởng lên hàm mục tiêu (biến độc lập); – b0 : hệ số tự do, không phụ thuộc vào các biến;
ƠN
– bi : hệ số bậc 1 đặc trưng cho sự ảnh hưởng của yếu tố xi lên hàm mục tiêu; – bij : hệ số đặc trưng cho tác động đồng thời của hai yếu tố xi và xj ;
NH
– bijk… : hệ số đặc trưng cho tác động đồng thời của nhiều yếu tố xi , xj , xk ,... Thông thường hệ số này là rất nhỏ có thể không tính đến;
Y
– bii: hệ số đặc trưng cho ảnh hưởng bậc 2 của yếu tố thứ xi lên kết quả thực nghiệm;
QU
Giá trị tuyệt đối của các hệ số cho biết mức độ ảnh hưởng của các yếu tố tới giá trị hàm mục tiêu. Giá trị tuyệt đối càng lớn thì ảnh hưởng càng mạnh và ngược lại.
M
Dấu của các hệ số cho biết chiều hướng ảnh hưởng lên hàm mục tiêu. Yếu tố ảnh hưởng tăng hàm mục tiêu nếu hệ số b > 0. Ngược lại, b < 0 thì yếu tố ảnh hưởng giảm hàm mục tiêu.
DẠ Y
KÈ
Từ phương trình hàm mục tiêu phù hợp với thực nghiệm, có thể tính được được giá trị của hàm mục tiêu bằng phương pháp ngoại suy mà không cần làm thêm thực nghiệm. Mặt khác, từ giá trị nhất định của hàm mục tiêu (y) cũng có thể suy đoán được các yếu tố ảnh hưởng mà không cần làm thêm thực nghiệm. Để tiến hành thiết kế và phân tích thực nghiệm thông thường ta cần thực hiện 06 bước chính: Bước 1: Thiết kế ma trận;
Chương 6. Thiết kế và phân tích thực nghiệm
191
Bước 3: Tính toán hệ số phương trình hồi quy; Bước 4: Đánh giá hệ số của phương trình hồi quy; Bước 5: Đánh giá phương trình hồi quy;
6.1.2. Thiết kế ma trận thực nghiệm
OF FI
Bước 6: Tối ưu hóa.
CI AL
Bước 2: Tiến hành thực nghiệm theo ma trận;
ƠN
Một mô hình thực nghiệm được chọn tương ứng với một kiểu ma trận thực nghiệm nhất định. Việc chọn các yếu tố và khoảng giá trị cho mô hình thực nghiệm yêu cầu kiến thức chuyên môn và kinh nghiệm của người làm thực nghiệm nghiên cứu. Mô hình toán học (hàm mục tiêu) thu được chỉ phù hợp khi các yếu tố (biến độc lập) và khoảng giá trị thực nghiệm được lựa chọn là phù hợp.
NH
Các yếu tố phải là các biến độc lập có thể điều chỉnh được. Nói cách khác, sự thay đổi của một yếu tố không kéo theo sự thay đổi của các yếu tố khác. Về mặt toán học, không gian vectơ gồm giá trị của các yếu tố phải độc lập tuyến tính.
QU
Y
Các yếu tố được lựa chọn là phù hợp nếu sự thay đổi của yếu tố làm thay đổi một cách rõ ràng tới giá trị hàm mục tiêu trên cơ sở so sánh với sai số ngẫu nhiên của thực nghiệm. Các phương pháp thường được sử dụng để lựa chọn yếu tố và giá trị thực nghiệm của các yếu tố như sau:
M
– Dựa vào kết quả nghiên cứu lý thuyết: Cơ sở của phương pháp này là dựa trên các công trình nghiên cứu tương tự hoặc suy luận từ những lý thuyết của khoa học cơ sở để lựa chọn các yếu tố cho mô hình thực nghiệm.
DẠ Y
KÈ
– Phương pháp chuyên gia: tiến hành đánh giá thông qua kết quả thăm dò ý kiến nhiều chuyên gia khác nhau về mức độ quan trọng của từng yếu tố được đề xuất. Các yếu tố mới có thể được bổ sung và/hoặc các yếu tố cũ bị loại bỏ khỏi mô hình theo đề xuất của nhiều chuyên gia. Số lượng chuyên gia càng lớn tính phù hợp của các yếu tố được lựa chọn càng cao. – Dựa trên thực nghiệm sàng lọc: Như đã đề cập ở trên, phương pháp này là phương pháp truyền thống để khảo sát mức độ ảnh hưởng của một
192
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
yếu tố khi cô lập các yếu tố còn lại từ đó đưa ra quyết định về việc lựa chọn các yếu tố và khoảng giá trị cho mô hình thực nghiệm.
xmã hóa =
Xthực −X0 λ
=
OF FI
Ma trận thực nghiệm có thể là giá trị thực của các yếu tố. Tuy nhiên, để thuận lợi cho quá trình tính toán bằng các công thức toán học (không dùng phần mềm thống kê) thì mã hóa yếu tố thường được sử dụng. Yếu tố được mã hóa với mức thấp là –1, mức cao là +1. Giá trị mã hóa tại tâm của yếu tố là 0. Giá trị thực và mã hóa có mối liên hệ qua công thức như sau: Xthực −X0 Xmax −X0
(6.2)
Với Xthực là giá trị thực của yếu tố tại điểm đang xét; Xmax là giá trị thực lớn nhất của yếu tố, X0 là giá trị thực của yếu tố tại tâm.
ƠN
Ma trận thực nghiệm được thiết kế phải đáp ứng các yếu tố sau: – Các yếu tố phải độc lập tuyến tính với nhau, sự thay đổi giá trị của một yếu tố không ảnh hưởng đến các yếu tố còn lại. 2 ∑N u=1 xiu = N
NH
– Ma trận thực nghiệm có tính chất chuẩn hoá: (6.3)
Với xi là giá trị mã hóa yếu tố thứ i, u: thí nghiệm thứ u.
QU
∑N u=1 xiu = 0
Y
– Ma trận thực nghiệm có tính chất đối xứng: (6.4)
– Ma trận thực nghiệm có tính chất trực giao: ∑N u=1 xiu xju = 0
(6.5)
M
6.1.3. Thực nghiệm theo ma trận thiết kế
KÈ
Mỗi tọa độ trong ma trận thực nghiệm có thể được làm lặp nhiều lần để đảm bảo độ chính xác của thí nghiệm. Khi đó độ lặp của thí nghiệm cần được kiểm tra bằng kiểm định Cochran’ C test (xem thêm mục 3.7).
DẠ Y
Cstat =
S2u (max) 2 ∑N u=1 Su 1
(6.6)
Trong đó Su2 = a−1 ∑ai=1(yiu − y̅iu )2 là phương sai tái lặp của các giá trị y thu được từ thực nghiệm tại thực nghiệm thứ u.
Chương 6. Thiết kế và phân tích thực nghiệm
193
6.1.4. Tính toán hệ số của phương trình hồi quy
CI AL
Nếu Cstat < Ccrit thì thực nghiệm lặp lại, ngược lại Cstat > Ccrit , tọa độ thực nghiệm đang xét có độ lặp chưa đạt yêu cầu, cần phải xem xét loại bỏ sai số thô tại tọa độ thí nghiệm này.
OF FI
Các hệ số hồi quy được tìm bằng phương pháp bình phương cực tiểu (least squares) khi giải phương trình ma trận. Y = B.X
(6.7)
ƠN
Trong đó Y là ma trận cột các giá trị thực nghiêm yi y1 y2 Y = y3 … [yn ]
QU
Y
NH
X: là ma trận giá trị các yếu tố thực nghiệm, về nguyên tắc số thí nghiệm tối thiểu phải bằng số hệ số b trong phương trình hồi quy. 1 x11 x12 x13 … x1ij … 1 x21 x22 x23 … x2ij … X = 1 x31 x32 x33 … x3ij … ………………………… [1 xn1 xn2 xn3 … xnij …]
KÈ
M
Ma trận cột B bao gồm giá trị các hệ số b cần tìm. b0 b1 B = b2 … bij […] Khi đó ma trận hệ số B cần tìm là:
DẠ Y
B = [X T X]−1 X T Y
(6.8)
XT là ma trận chuyển vị của ma trận thực nghiệm X
Trong trường hợp ma trận thực nghiệm có dạng đặc biệt như có tâm, trực giao, ma trận hỗn hợp, các hệ số hồi quy có thể tính bằng các công thức thu được từ cách giải hệ phương trình ma trận nói trên.
194
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
6.1.5. Đánh giá hệ số hồi quy 6.1.5.1. Dùng kiểm định Student
ti =
OF FI
Để đánh giá sự ảnh hưởng của yếu tố lên giá trị hàm mục tiêu, kiểm định t–test được sử dụng khi thực hiện phân tích thực nghiệm bằng phép tính thông thường. t–test được thực hiện với từng hệ số trong phương trình với biểu thức như sau: |bi | Sb
i
Trong đó:
(6.9)
– bi : là giá trị của các hệ số trong phương trình;
ƠN
– Sbi : là giá trị phương sai đặc trưng cho sai số thực nghiệm. Nếu t i > t crit hệ số bi là có ý nghĩa, yếu tố tương ứng có ảnh hưởng rõ ràng lên hàm mục tiêu.
NH
Nếu t i ≤ t crit hệ số bi là không có ý nghĩa, yếu tố tương ứng ảnh hưởng không rõ ràng lên hàm mục tiêu, cần loại bỏ yếu tố này khỏi hàm mục tiêu.
Y
Tùy vào số lượng các hệ số của mô hình và số lần lặp lại của thí nghiệm (thường là tại tâm) mà giá trị t crit là khác nhau.
QU
6.1.5.2. Phân tích phương sai đánh giá tính có nghĩa các hệ số
KÈ
M
Ngoài sử dụng t–test để đánh các hệ số trong phương trình hồi quy thì phân tích phương sai còn được dùng phổ biến để xem xét tính có nghĩa các yếu tố trong phương trình. Trong tất cả phần mềm phân tích thống kê được sử dụng cho thiết kế và phân tích thực nghiệm, kết quả ANOVA đối với phương trình hồi quy là kết quả chính để đánh giá mức độ ảnh hưởng của từng yếu tố (xem thêm chương 5). Hằng số Fisher hoặc giá trị p–value của từng yếu tố là cơ sở khẳng định sự ảnh hưởng là có ý nghĩa hay không, từ đó giữ lại hay loại bỏ hệ số ảnh hưởng trong phương trình hàm mục tiêu.
DẠ Y
F–test trong đánh giá các hệ số có dạng như sau: S2
Fi = Si2 0
(6.10)
Chương 6. Thiết kế và phân tích thực nghiệm
195
CI AL
Trong đó: – Si2 : là phương sai đặc trưng cho sự thay đổi của yếu tố i tương ứng với hệ số bi trong phương trình. – S02 : là phương sai đặc trưng cho sai số thực nghiệm.
OF FI
Nếu Fi > Fcrit hoặc p–value < 0.05, hệ số bi là có ý nghĩa, yếu tố tương ứng có ảnh hưởng rõ ràng lên hàm mục tiêu. Nếu Fi ≤ Fcrit hoặc p–value ≥ 0.05, hệ số bi là không có ý nghĩa, yếu tố tương ứng ảnh hưởng không rõ ràng lên hàm mục tiêu, cần loại bỏ yếu tố này khỏi hàm mục tiêu. 6.1.6. Đánh giá phương trình hồi quy
NH
ƠN
Về bản chất, việc đánh giá sự phù hợp của mô hình là kiểm tra sự khác nhau giữa các giá trị thực nghiệm và giá trị tính được từ phương trình hàm mục tiêu (giá trị ngoại suy). Do vậy, phép kiểm định Fisher được sử dụng bằng một trong hai cách khác nhau: (1) tính toán sự khác biệt giữa giá trị ngoại suy và giá trị thực nghiệm từ đó so sánh với sai số thí nghiệm; (2) sử dụng hệ số tương quan R2, độ tương quan của phương trình hàm mục tiêu càng cao thì mô hình toán học thu được càng phù hợp.
Y
6.1.6.1. Kiểm định Fisher theo phương sai phù hợp
S2fit S20
KÈ
Fstat =
M
QU
2 Phương sai phù hợp (Sfit ) là phương sai do sai khác giữa các giá trị thực nghiệm với giá trị tính toán được từ phương trình hồi quy. Phương sai này được so sánh với sai số thí nghiệm thông qua phép kiểm định Fisher. Nếu không có sự khác biệt giữa hai phương sai thì phương trình thu được của mô hình thực nghiệm là phù hợp.
1
2 Sfit = f ∑N ̂ u )2 u=1(yu − y fit
(6.11) (6.12)
DẠ Y
Trong đó:
– ŷu : Kết quả tính được tại tọa độ u theo phương trình hồi quy sau khi đã loại bỏ những hệ số không có nghĩa. – yu : Giá trị thực nghiệm tại tọa độ thứ u (là giá trị trung bình nếu thực hiện lặp).
196
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
– yu –ŷu : Sai khác giữa các trị tính được từ phương trình và thực nghiệm tại thí nghiệm thứ u. – ffit =N–L với N là tổng số thực nghiệm, L là số hệ số có nghĩa.
OF FI
– S02 là phương sai sai số, thông thường được tính từ các thí nghiệm lặp lại tại tâm. – Nếu Fstat < Fcrit thì sai khác giữa mô hình và thực nghiệm là không đáng tin cậy, nên mô hình thu được là phù hợp. 6.1.6.2. Kiểm định Fisher theo hệ số tương quan Hệ số tương quan của phương trình hồi quy được tính theo công thức: S2y
R2 = S2
̂ y
(6.13)
QU
Y
NH
ƠN
Trong đó S𝑦2 , 𝑆𝑦2̂ là phương sai của các giá trị yu thu được khi thực nghiệm và các giá trị ŷu tính được từ phương trình hồi quy. Phương sai chỉ tính cho các thực nghiệm cơ bản (2n) mà không tính các thí nghiệm lặp lại tại tâm (N0). R2 về bản chất là % các giá trị thực nghiệm đồng nhất với giá trị tính được từ phương trình hồi quy. R2 càng lớn độ phù hợp của mô hình càng cao (goodness of fit). Để đánh giá sự phù hợp của phương trình hồi quy, thực hiện kiểm định F với giả thuyết: H0: bi = bij = bijk = ... = 0, Ha: ít nhất 1 hệ số khác 0 (đồng nghĩa với phương trình hồi quy là tin cậy). Fstat cho giả thuyết thống kê trên được tính theo hệ số tương quan R2: R2
N−L−1
M
Fstat = 1−R2 .
L
(6.14)
DẠ Y
KÈ
Với N là số thí nghiệm trong mô hình cơ bản, L là số hệ số có nghĩa trong phương trình hồi quy bao gồm cả hệ số b0. So sánh Fstat với Fcrit ở 95% bậc tự do tương ứng là L và N – L – 1. – Nếu Fstat < Fcrit (α, L, N – L – 1): chấp nhận H0, các hệ số đều bằng không, phương trình hồi quy không đáng tin cậy. Mô hình thực nghiệm không phù hợp. – Fstat > Fcrit (α, L, N – L – 1): chấp nhận Ha, có ít nhất một hệ số khác không, phương trình hồi quy có tồn tại, hay mô hình là phù hợp.
Chương 6. Thiết kế và phân tích thực nghiệm
197
CI AL
Thực chất, phép kiểm định Fisher cho độ tương quan trên đây chính là phép so sánh giữa phần có tương quan (R2) và phần không tương quan (1–R2) của các thí nghiệm. 6.1.7. Tối ưu hóa
OF FI
Điểm tối ưu của mô hình thực nghiệm có thể là giá trị max, min hoặc một giá trị theo yêu cầu định trước. Có nhiều phương pháp để tìm điểm tối ưu như phương pháp mạng đơn hình, phương pháp khảo sát mặt mục tiêu, phương pháp đường dốc nhất (ascent step).
ƠN
Phương pháp đường dốc nhất được sử dụng phổ biến để tối ưu hóa theo mô hình hàm hồi quy thu được sau các bước trình bày trên đây. Điểm tối ưu của mô hình thực nghiệm có thể tìm được bằng cách thay đổi giá trị các yếu tố trong hàm mục tiêu. Phương pháp này chỉ áp dụng sau khi mô hình toán học được thiết lập là phù hợp giữa các giá trị thực nghiệm và ngoại suy từ phương trình hồi quy.
NH
Đường dốc nhất là đường chuyển dịch theo vectơ gradient ŷ(x) theo các bước chuyển của các yếu tố trong miền thực nghiệm. Vectơ này biểu thị sự biến thiên nhanh nhất của ŷ(x) về phía cực trị.
QU
Y
Thực chất của tính toán thực nghiệm theo đường dốc nhất là việc thực hiện tính giá trị hàm hồi quy tương ứng với các bước chuyển δ1, δ2, δ3,... của các yếu tố x1 , x2 , x3 , … Các bước chuyển này được lựa chọn có liên quan với bước chuyển của yếu tố ảnh hưởng lớn nhất được chọn (có biλi lớn nhất về độ lớn, cực đại tương ứng với bi > 0 và ngược lại).
M
Để tìm điểm tối ưu theo phương pháp đường dốc nhất, phép tính toán được thực hiện theo bảng 6.2:
KÈ
Bảng 6.2: Các bước tìm điểm tối ưu theo phương pháp đường dốc nhất x2
x3
...
xn
Mức gốc
x01
x02
x03
...
0n
Hệ số bi
b1
b2
b3
...
bn
Khoảng biến thiên
1
2
3
...
n
bi λi
b11
b22
b33
...
bnn
DẠ Y
x1
ŷ(x)
198
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
δ1'
Làm tròn δi' thành δi
δ1
δ2
δ3
...
Bước dịch chuyển thứ 1
x01+ δ1
x02+ δ2
x03+ δ3
...
Bước dịch chuyển thứ 2
x01+2δ1
x02+2δ2 x03+2δ3 ...
x0n+2δn
ŷ2
Bước dịch chuyển thứ 3
x01+3δ1
x02+3δ2 x03+3δ3 ...
x0n+3δn
ŷ3
...
...
...
...
Bước dịch chuyển thứ k
x01+kδ1
x0n+kn
ŷk
δ2'
δ3'
δn'
δn
x0n+ δn
OF FI
...
...
CI AL
Bước chuyển bi λi δ′i = δmax bi λi (max)
...
...
x02+kδ2 x03+kδ3 ...
ŷ1
ƠN
Phép tính được thực hiện đến khi tìm thấy cực trị hoặc giá trị mong muốn. Giá trị của các yếu tố (x0i+kδi) tương ứng với giá trị tối ưu chính là điều kiện tối ưu thực nghiệm.
NH
Trong đó:
– x01, x02, x03 là giá trị tại tâm của các yếu tố x1, x2, x3,..., xn; – bi là các hệ số của phương trình hồi quy;
Y
– i là khoảng biến thiên của của các yếu tố xi;
QU
– ŷk là giá trị tính được từ phương trình hồi quy khi thay giá trị của các yếu tố theo từng bước dịch chuyển. 6.2. Mô hình hóa thực nghiệm bậc một (mặt phẳng/screening)
M
6.2.1. Mô hình hóa thực nghiệm bậc một đầy đủ
KÈ
Mô hình hóa thực nghiệm bậc 1 đầy đủ là trường hợp cơ bản nhất trong thiết kế và phân tích thực nghiệm. Để xác định các trọng số ảnh hưởng (hệ số b) của mô hình, ma trận bậc một đầy đủ với 2 mức tối ưu của Box–Wilson được sử dụng để tiến hành thực nghiệm.
DẠ Y
Phương trình bậc một đầy đủ có dạng như sau: y = b0 + ∑ni=1 bi xi + ∑ni<j bij xi xj + ∑ni<j<k bijk xi xj xk
(6.15)
Số các hệ số b trong của phương trình hồi quy tuyến tính được tính theo công thức:
Chương 6. Thiết kế và phân tích thực nghiệm
199
N = ∑nk=0 Cnk = 2n
CI AL
(6.16)
Với n là số yếu tố khảo sát trong mô hình thực nghiệm;
Ví dụ mô hình có 3 yếu tố, hai mức thực nghiệm thì số các hệ số trong phương trình hồi quy là N = 2n = 23 = 8. 6.2.1.1. Ma trận thực nghiệm
OF FI
Với hai mức thực nghiệm được mã hóa cho từng yếu tố: mức cao tương ứng với +1, và mức thấp là –1. Ma trận thực nghiệm tổng quát có dạng như bảng 6.1.
...
y
ƠN
x0
x1
x2
x3
1
+1
–1
–1
–1
–1
...
y1
2
+1
+1
–1
–1
–1
...
y2
3
+1
–1
+1
–1
–1
...
y3
4
+1
+1
+1
–1
–1
...
y4
5
+1
–1
–1
+1
–1
...
y5
6
+1
+1
–1
+1
–1
...
y6
7
+1
–1
+1
+1
–1
...
y7
8
+1
+1
+1
+1
–1
...
y8
9
+1
–1
–1
–1
+1
...
Y9
10
+1
+1
–1
–1
+1
...
y10
–1
+1
–1
+1
...
y11
M
QU
NH
N
11
x4
Y
Bảng 6.1. Ma trận mã hóa của mô hình thực nghiệm bậc1 đầy đủ
+1 +1
+1
+1
–1
+1
...
y12
13
+1
–1
–1
+1
+1
...
y13
14
+1
+1
–1
+1
+1
...
y14
15
+1
–1
+1
+1
+1
...
y15
16
+1
+1
+1
+1
+1
...
y16
...
+1
...
...
...
...
...
...
DẠ Y
KÈ 12
200
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
+1
+1
+1
+1
N01
+1
0
0
0
0
N02
+1
0
0
0
0
N03
+1
0
0
0
0
...
+1
...
...
...
...
y2n
CI AL
+1
y01 y02 y03
...
...
OF FI
2n
Ngoài ma trận gốc có 2n thí nghiệm, ma trận cần có các thí nghiệm tại tâm (N0) được sử dụng để tính sai số của thực nghiệm và làm tăng độ chính xác của mô hình thu được.
x2
x3
Y
–1
–1
y1
+1
–1
–1
y2
–1
+1
–1
y3
+1
+1
–1
y4
–1
–1
+1
y5
+1
–1
+1
y6
+1
–1
+1
+1
y7
block
x1
1
+1
–1
2
+1
3
+1
4
+1
5
+1
6
+1
8
QU
Y
N
NH
ƠN
Ví dụ: Ma trận thực nghiệm của mô hình bậc nhất 3 yếu tố (8 thí nghiệm của ma trận gốc và 5 thí nghiệm tại tâm), số thí nghiệm lặp lại tại tâm có thể thay đổi tùy theo điều kiện thí nghiệm thực tế.
+1
+1
+1
+1
y8
9
+1
0
0
0
y01
+1
0
0
0
y02
11
+1
0
0
0
y03
12
+1
0
0
0
y04
13
+1
0
0
0
y05
KÈ
10
M
7
DẠ Y
08 thí nghiệm của ma trận gốc có thể được mô phỏng bằng 08 đỉnh của một hình lập phương. Mỗi đỉnh là một tọa độ thí nghiệm. Thí nghiệm ở tâm chính là các thí nghiệm lặp lại tại gốc tọa độ (0,0,0).
Chương 6. Thiết kế và phân tích thực nghiệm
OF FI
CI AL
201
ƠN
Hình 6.1 Mô phỏng tọa độ thí nghiệm mã hóa ba yếu tố trong không gian thực nghiệm, mỗi yếu tố có 3 mức thực nghiệm +1, 0, –1.
6.2.1.2. Tính toán và đánh giá phương trình hồi quy
NH
Xuất phát từ biểu thức 6.8 giải phương trình ma trận, các hệ số của phương trình được tính theo các biểu thức sau: – Hệ số tự do b0: ∑N u=1 yu N
– Các hệ số bi: ∑N u=1 xiu yu N
QU
bi =
Y
b0 =
(6.17)
(6.18)
– Các hệ số tác động đồng thời hai yếu tố: bij =
∑N u=1 xiu xju yu N
(6.19)
∑N u=1 xiu xju xku.. yu
KÈ
bijk… =
M
– Các hệ số tác động đồng thời nhiều yếu tố: N
(6.20)
DẠ Y
Lưu ý: Giá trị các hệ số b trong các biểu thức trên chỉ được tính với N giá trị thực nghiệm cơ bản (2n) không bao gồm các giá trị thực nghiệm lặp lại tại tâm (N0). Tuy các công thức tính hệ số là khác nhau, nhưng về bản chất chúng có cùng quy luật là giá trị trung bình của các tích số giá trị yếu tố với giá đo (y) trong N thực nghiệm.
202
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
6.2.1.3. Đánh giá hệ số của phương trình hồi quy
OF FI
Độ lớn các hệ số b trong phương trình hồi quy là trọng số ảnh hưởng của yếu tố tương ứng đến hàm mục tiêu. Để biết các trọng số này là đủ lớn để xác định là có ảnh hưởng rõ ràng hay không, cần phải thực hiện việc đánh giá thông qua phép kiểm định Student hoặc phân tích phương sai. Về bản chất các phép kiểm định này là việc so sánh hệ số b so với sai số của thí nghiệm. Kiểm định Student được sử dụng để đánh giá tính có nghĩa của hệ số hồi quy.
ƠN
Từ phương trình hồi quy (6.15), ta thấy thực chất độ lớn của hệ số b bất kỳ chính là phần giá trị đóng góp vào giá trị y của yếu tố đang xét bằng +1 hoặc –1 nếu các yếu tố khác không tác động đến hàm mục tiêu (giá trị tại tâm). Do đó, ta chỉ cần so sánh giá trị b với sai số của thí nghiệm (độ lệch chuẩn của thí nghiệm lặp). Nếu sự khác biệt giữa hệ số b với sai số của thí nghiệm có ý nghĩa thì sự ảnh hưởng của yếu tố đang xét là đáng kể. ti =
NH
Tính giá trị chuẩn Student cho các hệ số tương ứng theo công thức: |bi | Sb
i
Trong đó:
Y
S20 N
QU
2 Sbi =
(6. 21)
(6. 22)
Với S02 là phương sai thí nghiệm lặp tại tâm. S02 = N
1 0 −1
0 ∑N ̅0u )2 u=1(y0u − y
N
0 y ∑u=1 0u
(6. 24)
M
y̅0 =
(6. 23)
N0
KÈ
N0: số thực nghiệm lặp ở tâm, bậc tự do f = N0 – 1. Nếu ma trận thực nghiệm có làm các thí nghiệm lặp (lặp M lần) tại mỗi tọa độ thí nghiệm thì S02 còn có thể tính bằng công thức sau: 1
1
N
f
DẠ Y
N M 2 2 S02 = ∑N u=1 Su = ∑u=1 ∑q=1(yun − ȳ un )
Trong đó: f = N(M – 1). So sánh giá trị chuẩn ti so với tcrit = t(0.95, f):
(6. 25)
Chương 6. Thiết kế và phân tích thực nghiệm
203
CI AL
Nếu ti > tcrit yếu tố đang xét có tác động rõ ràng đến hàm thống kê (yếu tố này có thể là các xi, tổ hợp chập hai xixj, hay yếu tố tương tác đồng thời nhiều hơn 2).
OF FI
Nếu ti < tcrit yếu tố đang xét không ảnh hưởng đến hàm thống kê và có thể loại bỏ khỏi phương trình hồi quy. Đối với các ảnh hưởng trực tiếp (xi) việc loại bỏ các hệ số là cần thiết. Tuy nhiên, đối với các yếu tố tác động đồng thời, việc giữ lại các hệ số này trong phương trình không ảnh hưởng đến các kết quả tính toán sau này.
NH
ƠN
Ngoài cách sử dụng kiểm định Student để đánh giá tính có nghĩa của các hệ số hồi quy, hiện nay phân tích phương sai được sử dụng phổ biến hơn khi thiết kế và phân tích thực nghiệm bằng các phần mềm thống kê. Phép phân tích ANOVA đa yếu tố được thực hiện bằng cách bóc tách riêng biệt sự ảnh hưởng của từng yếu tố (các yếu tố tương tác đồng thời 2, 3 được xem như những yếu tố trong phương trình) và so sánh với phương sai dư hay phương sai sai số thực nghiệm (xem chương 5). 6.2.1.4. Đánh giá sự phù hợp của mô hình
Y
Thực hiện kiểm định Fisher như công thức 6.11 và 6.12 hoặc công thức 6.13 và 6.14 khi sử dụng hệ số tương quan.
QU
6.2.1.5. Tìm điểm tối ưu
Dùng phương pháp ngoại suy tìm điểm tối ưu hoặc tính toán theo từng bước tiến đường dốc nhất (ascent step).
KÈ
M
Ví dụ 6.1: Để tối ưu hóa quy trình phân tích penicilin bằng phương pháp phân tích dòng chảy (flow–injection analysis method), người ta thiết kế thực nghiệm với các yếu tố: độ dài buồng phản ứng (cm); tốc độ dòng (mL/phút) và thể tích mẫu (µL). Kết quả thực nghiệm như bảng sau: Tốc độ dòng
Thể tích mẫu
Độ nhạy
(mL/min)
(µL)
(ΔE)
1.5
1.6
100
37.45
2
2.0
1.6
100
31.70
3
1.5
2.2
100
32.10
Độ dài (cm)
1
DẠ Y
N
204
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
2.2
100
5
1.5
1.6
150
6
2.0
1.6
150
7
1.5
2.2
150
8
2.0
2.2
150
9
1.75
1.9
10
1.75
1.9
11
1.75
1.9
27.20
CI AL
2.0
39.85 32.85 35.00 32.15
OF FI
4
125
32.85
125
33.50
125
32.15
a) Tính toán và đánh giá mô hình thực nghiệm bậc 1 đầy đủ.
ƠN
b) Tìm điều kiện để phép phân tích có độ nhạy cao nhất. Giải:
NH
Cách 1: Sử dụng công thức tính toán
a) Tính toán và đánh giá mô hình thực nghiệm bậc 1 đầy đủ Phương trình hồi quy bậc một ba yếu tố đầy đủ có dạng như sau:
Y
y = b0 + b1 x1 + b2 x2 + b3 x3 + b12 x1 x2 + b13 x1 x3 + b23 x2 x3 + b123 x1 x2 x3
x1
1
x3
x 1x 2
x1x3
x2x3
x1x2x3
–1
–1
–1
+1
+1
+1
–1
37.45
+1
–1
–1
–1
–1
+1
+1
31.70
DẠ Y
KÈ
2
y
x2
M
N
QU
Từ ma trận kết quả thực nghiệm, ta lập ma trận các yếu tố của mô hình như bảng sau: (mPa s)103
3
–1
+1
–1
–1
+1
–1
+1
32.10
4
+1
+1
–1
+1
–1
–1
–1
27.20
5
–1
–1
+1
+1
–1
–1
+1
39.85
6
+1
–1
+1
–1
1
–1
–1
32.85
7
–1
+1
+1
–1
–1
+1
–1
35.00
8
+1
+1
+1
+1
+1
+1
+1
32.15
Chương 6. Thiết kế và phân tích thực nghiệm
205
Tính các hệ số của phương trình hồi quy
CI AL
Áp dụng các công thức từ 6.17 đến 6.20 ta thu được các kết quả như sau: – Các hệ số bi:
b1 = b2 = b3 =
∑N u=1 yu
=
N
∑N u=1 x1u yu N ∑N u=1 x2u yu N ∑N u=1 x3u yu N
∑8u=1 yu 8
= = =
= 33.54
∑8u=1 x1u yu 8 ∑8u=1 x2u yu 8 ∑8u=1 x3u yu 8
OF FI
b0 =
= – 2.6 = –1.9 = 1.4
b13 = b23 =
∑N u=1 x1u x2u yu N ∑N u=1 x1u x3u yu N ∑N u=1 x2u x3u yu N
= = =
∑8u=1 x1u x2u yu 8
∑8u=1 x1u x3u yu 8
= 0.6 = 0.1
NH
b12 =
ƠN
– Các hệ số tác động đồng thời hai yếu tố:
∑8u=1 x2u x3u yu 8
= 0.5
– Hệ số tác động đồng thời ba yếu tố: N
=
∑8u=1 x1u x2u x3u
Y
∑N u=1 x1u x2u x3u
QU
b123 =
8
= – 0.4
Đánh giá tính có nghĩa của hệ số hồi quy Áp dụng công thức 6.19 ta có: S02 = N
M
N
1
0 ∑N ̅0u )2 = 3−1 ∑3u=1(y0u − y̅0u )2 = 0.456 u=1(y0u − y
=
0.456 8
= 0.057
KÈ
Sb2 i =
1
0 −1 S20
=> Sbi = 0.239 Áp dụng công thức 6.19 ta tính được các giá trị ti:
DẠ Y
t1 = 10.74; t2 = 8.06; t3 = 5.97; t12 = 2.62, t13 = 0.42, t23 = 2.25, t123 = 1.73
Ở tin cậy 95%, bậc tự do của S02 là 2, giá trị tcrit = t(0.05, 2) = 4.3.
206
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Các giá trị t12, t13, t23, và t123 đều nhỏ hơn tcrit, do vậy các hệ số b12, b13, b23 và b123 không có ý nghĩa và bị loại khỏi phương trình hồi quy. Phương trình hồi thu được có dạng: y = 33.54 – 2.6x1 – 1.9x2 +1.4x3 Đánh giá tính phù hợp của phương trình hồi quy
x1
x2
x3
y
1
–1
–1
–1
37.45
2
+1
–1
–1
31.70
3
–1
+1
–1
4
+1
+1
–1
5
–1
–1
+1
6
+1
–1
7
–1
+1
8
+1
+1
𝑦̂
yu – 𝑦̂𝑢
(yu – 𝑦̂𝑢 )2
36.60
0.85
0.723
31.47
0.23
0.051
32.10
32.75
–0.65
0.422
27.20
27.62
–0.42
0.181
39.85
39.45
0.40
0.160
+1
32.85
34.33
–1.48
2.176
+1
35.00
35.60
–0.60
0.360
+1
32.15
30.48
1.68
2.806
Y
NH
ƠN
N
OF FI
Thay giá trị các yếu tố theo tọa độ thí nghiệm vào phương trình hồi quy ta tính được các giá trị 𝑦̂ như bảng sau:
2 Sfit =
QU
– Tính phương sai phù hợp theo phương trình 6.11: ∑N ̂u )2 u=1(yu −y
Fstat =
N−L S2fit S20
=
6.88 4
=1.72
1.72
= 0.46 = 3.77
M
Với độ tin cậy 95%. bậc tự do f1= 5. f2 = 2. Fcrit (0.05,4, 2) = 19.2
KÈ
Do Fstat = 3.77 << Fcrit =19.2 phương trình hồi quy tìm được mô tả đúng thực nghiệm. b) Tìm điều kiện để phép phân tích có độ nhạy cao nhất
DẠ Y
Độ nhạy cao nhất tương ứng với giá trị maximum của hàm hồi quy. Vì phương trình hàm mục tiêu là bậc nhất, nên giá trị maximum sẽ nằm trên biên của miền thực nghiệm tương ứng với giá trị lớn nhất của yếu tố làm tăng và nhỏ nhất của các yếu tố làm giảm giá trị hàm.
Chương 6. Thiết kế và phân tích thực nghiệm
207
CI AL
Từ phương trình hàm mục tiêu thu được sau khi loại bỏ hệ số không ảnh hưởng. Ta thấy yếu tố x1, x2 làm giảm (hệ số < 0) và yếu tố x3 làm tăng (hệ số b3 > 0). Do đó tọa độ thực nghiệm cho độ nhạy lớn nhất là (–1, –1,1). ymax = y(–1, –1,1) = 39.5 – Độ dài buồng phản ứng: 1.5 cm – Tốc độ dòng: 1.6 mL/phút – Thể tích mẫu: 150 µL
OF FI
Điều kiện thực cho phép phân tích có độ nhạy cao nhất là:
ƠN
Cách 2: Sử dụng phần mềm Statgraphics
DẠ Y
KÈ
M
QU
Y
NH
Từ thanh menu chọn DOE/Legacy DOE Procedures/Design Creation/Create new design. Chọn Screening trong màn hình Create design option và khai báo: số hàm mục tiêu (No. of Response Variables) bằng 1; số yếu tố (Experimental factors) là 3. Tiếp theo đặt tên cho các yếu tố (xi) và hàm mục tiêu y.
208
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Chọn dạng ma trận là 23 và khai báo các điểm tại tâm theo hình dưới
NH
ƠN
OF FI
CI AL
đây:
DẠ Y
KÈ
M
QU
Y
Nhập số liệu giá trị hàm y vào ma trận thực nghiệm theo hình sau:
Chương 6. Thiết kế và phân tích thực nghiệm
209
CI AL
Sau khi chọn maximun order effect bằng 3 và chọn ok hộp thoại Tables and Graphs xuất hiện. Tại hộp thoại này ta chọn những thông số đầu ra theo mong muốn. Một số bảng số liệu và hình cần chọn như: – Analysis summary: Phân tích các thông số của ma trận – Regression coefficients: Hệ số hồi quy
OF FI
– ANOVA table: Phân tích phương sai – Pareto charts: Biểu đồ ảnh hưởng của các yếu tố
– Main effects plots: Biểu đồ các ảnh hưởng chính
– Response surface plot: Đồ thị hàm hồi quy trong không gian – Optimization: Điểm tối ưu
ƠN
– Contour plot: Đồ thị đường đồng mức của hàm trên mặt phẳng.
NH
Sau khi chọn ok, kết quả phân tích thực nghiệm ở dạng bảng và hình, sau đây là một số kết quả chính:
DẠ Y
KÈ
M
QU
Y
Regression coefficients: Hệ số hồi quy và phương trình hồi quy của mô hình được hiển thị trong bảng Regression coefficients. Giá trị thu được giống như kết quả tính toán bằng công thức như trình bày ở cách 1.
210
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
NH
ƠN
OF FI
CI AL
ANOVA table: bảng phân tích tác động của các yếu tố
Y
Giá trị p–value cho biết ảnh hưởng các yếu tố là có ý nghĩa ở một độ tin cậy nhất định (95%). Các giá trị hiển thị màu đỏ khi p–value < 0.05. Như vậy các hệ số b12, b13, b23, và b123 không có ý nghĩa và bị loại bỏ khỏi phương trình hồi quy.
QU
Giá trị hệ số tương quan (R–square) cho biết mức độ phù hợp của mô hình thu được so với các giá trị thực nghiệm. Giá trị này càng lớn độ phù hợp càng cao và ngược lại (công thức 6.13). Thực hiện kiểm định F–test (công thức 6.14) cho mô hình thực nghiệm ta thu được: R2
N−L−1
M
Fstat = 1−R2 .
L
0.981
= (1−0.981) .
8−4−1 4
= 36.7;
KÈ
Fcrit = F(0.05,4,3) = 9.12. Vì Fstat > Fcrit nên mô hình thu được phù hợp với thực nghiệm.
DẠ Y
Pareto charts: Biểu đồ ảnh hưởng của các yếu tố
Chương 6. Thiết kế và phân tích thực nghiệm
OF FI
CI AL
211
NH
ƠN
Các yếu tố có chiều cao hơn đường trung bình (mức 95%) có ý nghĩa đối với hàm mục tiêu ở mức 95% và ngược lại. Ý nghĩa của Pareto chart giống như trong bảng ANOVA nhưng được trực quan bằng đồ thị. Cột màu xanh ứng với yếu tố ảnh hưởng âm (làm giảm hàm mục tiêu) và yếu tố màu xám ảnh hưởng dương (làm tăng hàm mục tiêu). Main effects plots: Các ảnh hưởng chính
DẠ Y
KÈ
M
QU
Y
Đối với mô hình đang xét, các ảnh hưởng chính là yếu tố x1, x2, x3. Trong đó hai yếu tố x1, x2 làm giảm hàm mục tiêu. Yếu tố x3 làm tăng hàm mục tiêu. Xét về độ dốc, yếu tố x1 làm giảm hàm mục tiêu nhanh nhất.
212
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Response surface plot: Hàm mục tiêu có thể được mô phỏng trong không gian 3 chiều trong đó 1 chiều là giá trị y, hai chiều còn lại là hai yếu tố bất kỳ.
NH
ƠN
OF FI
Mô hình đang xét có 3 yếu tố, do vậy ta có thể mô tả được 03 đồ thị tương ứng với 03 cặp tương ứng từng đôi một các yếu tố. Đồ thị hàm mục tiêu bậc nhất (mặt phẳng) trong không gian có dạng như hình sau:
DẠ Y
KÈ
M
QU
Y
Để thay đổi cặp yếu tố khác (x1, x3) hoặc (x2, x3) ta dùng chuột phải. chọn Pane option/Factors và chọn cặp yếu tố tương ứng theo hình:
Chương 6. Thiết kế và phân tích thực nghiệm
213
CI AL
Optimize Response: (Giá trị tối ưu)
NH
ƠN
OF FI
Giá trị tối ưu cần tìm được hiển thị trong bảng Optimize Response. Đối với mô hình đang xét giá trị tối ưu là giá trị max của hàm mục tiêu và bằng 39.56 ứng với các điều kiện x1, x2, x3 lần lượt là –1, –1, 1. Giá trị tối ưu và điều kiện tối ưu giống như thực hiện trong cách 1.
DẠ Y
KÈ
M
QU
Y
Giá trị tối ưu cũng có thể dễ dàng xác định một cách trực quan bằng đồ thị hàm mục tiêu dạng hình chiếu (đồ thị dạng Contour của hàm mục tiêu). Giá trị hàm tương ứng với tọa độ (–1, –1,1) là 39.5 như hình dưới đây:
Trong trường hợp điểm tối ưu là min hoặc một giá trị nào đó theo yêu cầu của mô hình thực nghiệm, ta có thể sử dụng Pane option bằng cách dùng chuột phải và điền các thông tin tối ưu hóa theo yêu cầu:
214
NH
ƠN
OF FI
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
– Nếu giá trị tối ưu là lớn nhất chọn “Maximize” – Nếu giá trị tối ưu là nhỏ nhất chọn “Minimize”.
Y
– Nếu giá trị tối ưu là giá trị cho trước chọn “Maintain at” và điền giá trị mong muốn.
QU
Đối với ví dụ này, giá trị lớn nhất thu được từ phân tích mô hình bằng Statgraphics là 39.56. Điều kiện thực nghiệm tối ưu tương ứng là x1 = –1, x2 = –1, x3 = 1.
M
6.2.2. Mô hình hóa thực nghiệm bậc một rút gọn
KÈ
Khi số lượng các yếu tố (n) của mô hình thực nghiệm lớn, số lần thực nghiệm thực theo ma trận bậc 1 đầy đủ rất lớn (2n) gây mất nhiều thời gian và vật liệu thực nghiệm. Lúc này ta nên thực hiện mô hình thực nghiệm rút gọn với số thực nghiệm được tính theo công thức:
DẠ Y
N = 2n−q , q là mức rút gọn.
(6. 26)
Về nguyên tắc, các thí nghiệm rút gọn sao cho miền thực nghiệm vẫn phải bao trùm tâm thực nghiệm. Để đảm bảo được điều kiện này, tọa độ thí nghiệm trong ma trận cần thực hiện theo một nguyên tắc nhất định:
Chương 6. Thiết kế và phân tích thực nghiệm
215
– Ma trận cột gốc trùng với ma trận (n – q) yếu tố
CI AL
– Ma trận thực nghiệm có số cột trùng với số yếu tố là n cột – Giá trị của các yếu tố còn lại (q yếu tố) được tính từ giá trị của các yếu tố trong ma trận gốc theo biểu thức tương phản và biểu thức phát sinh
x1
1
–1
2
+1
3
–1
4
+1
5
–1
6
+1
7 8
x2
x3
–1
–1
–1
–1
+1
–1
ƠN
N
OF FI
Ví dụ ma trận thực nghiệm 4 yếu tố, rút gọn 1 mức (24–1) được thiết lập như sau giống như ma trận 23:
–1
–1
+1
–1
+1
–1
+1
+1
+1
+1
+1
NH
+1
(6.27)
QU
Vì x1 x2 x3 x4 = ±1
Y
Giá trị của yếu tố thứ 4 được tính theo biểu thức tương phản như sau: Nhân hai vế với x4 thu được x1 x2 x3 x42 = ±x4 => x4 = ±x1 x2 x3
(6.28)
M
Như vậy giá trị thực nghiệm của x4 có thể chọn bằng x1x2x3 hoặc bằng –x1x2x3. Ma trận thực nghiệm 24–1 được thể hiện như trong bảng 6.3.
KÈ
Bảng 6.3. Ma trân thực nghiệm rút gọn 24–1 x1
x2
x3
x4= x1x2x3
Hoặc x4= –x1x2x3
y
1
–1
–1
–1
–1
+1
y1
2
+1
–1
–1
+1
–1
y2
3
–1
+1
–1
+1
–1
y3
4
+1
+1
–1
–1
+1
y4
5
–1
–1
+1
+1
–1
y5
DẠ Y
n
216
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
6
+1
–1
+1
–1
+1
7
–1
+1
+1
–1
+1
y7
8
+1
+1
+1
+1
–1
y8
CI AL
y6
Nếu x4 = x1 x2 x3 thì các tổ hợp tương tác đồng thời xảy ra như sau: x1 x2 = x3 x4
OF FI
x1 x3 = x2 x4 x1 x4 = x2 x3 x1 = x2 x3 x4 x2 = x1 x3 x4
ƠN
x3 = x1 x2 x4
Do đó phương trình hồi quy của mô hình 24–1có dạng:
NH
y = b0 + b1 x1 + b2 x2 + b3 x3 + b4 x4 + b12 x1 x2 + b13 x1 x3 + b14 x1 x4 (6.29) Việc tính toán, đánh giá phương trình hồi quy và tối ưu hóa được thực hiện tương tự như đối với phương trình hồi quy bậc 1 đầy đủ (dạng 2n).
QU
Y
Ví dụ 6.2: Một sản phẩm hóa học được sản xuất trong bình áp lực. Mô hình thực nghiệm trong nhà máy thí điểm được nghiên cứu đối với các yếu tố ảnh hưởng đến chất lượng của sản phẩm này. Bốn yếu tố là thời gian phản ứng, nhiệt độ phản ứng, tỉ lệ của các chất với hai mức thực nghiệm như sau: x1: Thời gian phản ứng: 1.5 ÷ 3h
M
x2: Nhiệt độ phản ứng: 85 ÷ 115 oC
KÈ
x3: Tỉ lệ mole của natri hydrosulfite và olefin: 0.8 ÷ 2.2 x4: Tỉ lệ mole của NaNO3 và olefin: 0.2 ÷ 0.4
DẠ Y
Mô hình rút gọn 24–1, lấy giá trị x4 = x1x2x3, ma trận thực nghiệm được thực hiện như bảng sau: n
x1
x2
x3
x4
Hàm mục tiêu y
1
–1
–1
–1
–1
14.5
2
+1
–1
–1
+1
18.6
Chương 6. Thiết kế và phân tích thực nghiệm
217
+1
–1
+1
4
+1
+1
–1
–1
5
–1
–1
+1
+1
6
+1
–1
+1
–1
7
–1
+1
+1
–1
8
+1
+1
+1
9
0
0
0
10
0
0
0
11
0
0
0
13.8
CI AL
–1
51.0 23.2 41.0 38.0
OF FI
3
+1
17.6
0
32.4
0
29.8
0
31.5
ƠN
Tính toán và tìm điều kiện để hàm mục tiêu đạt giá trị lớn nhất. Giải:
NH
Cách 1: Sử dụng công thức tính toán Tính toán phương trình hồi quy
Phương trình hồi quy bậc 1, 4 yếu tố rút gọn có dạng: y = b0 + b1 x1 + b2 x2 + b3 x3 + b4 x4 + b12 x1 x2 + b13 x1 x3 + b14 x1 x4
b2 =
=
∑N u=1 x1u yu N
∑N u=1 x2u yu N
∑N u=1 x3u yu N
KÈ
b3 =
N
b4 =
∑N u=1 x4u yu
b12 =
DẠ Y
∑8u=1 yu
QU
b1 =
∑N u=1 yu
8
=
=
M
b0 =
Y
– Xác định các hệ số bi
b13 = b14 =
N
= =
∑8u=1 x1u yu 8
∑8u=1 x2u yu 8 ∑8u=1 x3u yu 8 ∑8u=1 x4u yu
∑N u=1 x1u x2u yu N ∑N u=1 x1u x3u yu N ∑N u=1 x1u x4u yu N
= 27.2
8
= = =
= 4.8 = 2.9 = 2.7 = –8.9
∑8u=1 x1u x2u yu 8 ∑8u=1 x1u x3u yu 8 ∑8u=1 x1u x4u yu 8
= 0.6 = –5.5 = –5.0
218
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Áp dụng công thức 6.22 và 6.23 ta có: S02 = N Sb2 i =
1
1
CI AL
Đánh giá tính có nghĩa của hệ số hồi quy ∑N0 (y − y̅0u )2 = ∑3 (y − y̅0u )2 = 1.7 −1 u=1 0u 3−1 u=1 0u
0 S20
N
=
1.7 8
= 0.218 → Sbi = 0.46
t1 = 10.36; t2 = 6.19; t3 = 5.9; t4 = 19.1 t12 = 1.37 ; t13 = 11.76; t14 = 10.79 tcrit = t(0.05, 2) = 4.3
OF FI
Áp dụng công thức 6.21 ta tính được các giá trị tstat:
ƠN
Giá trị t12 nhỏ hơn tcrit , do vậy hệ số b12 không có ý nghĩa và bị loại khỏi phương trình hồi quy. Phương trình hồi quy thu được có dạng: y = 27.2 + 4.8x1 + 2.9x2 + 2.7x3 – 8.9x4 – 5.5 x1x3 – 5.0 x1x4
NH
Đánh giá tính phù hợp của phương trình hồi quy Thay giá trị các yếu tố theo tọa độ thí nghiệm vào phương trình hồi quy ta tính được các giá trị 𝑦̂ như bảng sau: x2
1
–1
–1
2
+1
3
–1
x3
y
𝑦̂
yu – 𝑦̂𝑢
(yu – 𝑦̂𝑢 )2
–1
14.5
15.1
–0.6
0.41
x4
Y
x1
–1
QU
n
–1
–1
+1
18.6
18.0
0.6
0.41
+1
–1
+1
13.8
13.2
0.6
0.41
+1
–1
–1
51.0
51.6
–0.6
0.41
–1
–1
+1
+1
23.2
23.8
–0.6
0.41
6
+1
–1
+1
–1
41.0
40.4
0.6
0.41
7
–1
+1
+1
–1
38.0
37.4
0.6
0.41
8
+1
+1
+1
+1
17.6
18.2
–0.6
0.41
9
0
0
0
0
32.4
32.1
0.3
0.12
DẠ Y
KÈ
5
M +1
4
Chương 6. Thiết kế và phân tích thực nghiệm
219
0
0
0
0
29.8
32.1
–2.3
11
0
0
0
0
31.5
32.1
–0.6
5.06
CI AL
10
0.30
Phương sai phù hợp được tính theo phương trình 6.11: ∑N ̂u )2 u=1(yu −y ffit
Fstat =
S2fit S20
=
2.175 1.7
8.7
= 11−7 = 2.175
OF FI
2 Sfit =
≈ 1.3
Với độ tin cậy 95%, bậc tự do ffit= 1, f0 = 2, Fcrit (0.05,4,2) = 19.2 Do Fstat = 1.3 < Fcrit =19.2, phương trình hồi quy tìm được mô tả đúng thực nghiệm.
ƠN
Tìm điều kiện để giá trị hàm mục tiêu lớn nhất
NH
Giá trị lớn nhất sẽ nằm trên biên của miền thực nghiệm tương ứng với giá trị max của yếu tố làm tăng và min của các yếu tố làm giảm giá trị hàm mục tiêu.
QU
Y
Từ phương trình hàm mục tiêu thu được sau khi loại bỏ hệ số không ảnh hưởng, ta thấy yếu tố x1, x2 làm tăng (hệ số > 0) và yếu tố x4 làm giảm. Mặc dù hệ số b3 = 2.7 > 0, hệ số tương tác đồng thời b13 = –5.5 (x1 > 0) nên x3 sẽ làm giảm hàm mục tiêu (b13 = –5.5 làm giảm nhanh hơn so với b3 = 2.7 làm tăng). Từ những lập luận ở trên, ta dễ dàng thấy tọa độ thực nghiệm cho giá trị lớn nhất của hàm mục tiêu tương ứng là (1, 1,–1,–1).
M
ymax = y(1,1, –1–1) = 51.6. Điều kiện thực cho phép phân tích có độ nhạy cao nhất là: – Thời gian phản ứng: 3h;
KÈ
– Nhiệt độ phản ứng: 115 oC; – Tỉ lệ mole của natri hydrosulfite và olefin: 0.8; – Tỉ lệ mole của NaNO3 và olefin: 0.2.
DẠ Y
Cách 2: Sử dụng phần mềm Statgraphics
Thao tác các bước như Ví dụ 6.1, chỉ khác khi chọn dạng ma trận thực nghiệm dạng 24–1 thay cho 23 như hình dưới đây:
220
M
QU
Y
NH
– Ma trận thực nghiệm:
ƠN
OF FI
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
KÈ
Thực hiện các thao tác phân tích thí nghiệm thu được các kết quả tương tự như giải bằng cách tính toán thông thường.
DẠ Y
– Phương trình hàm mục tiêu:
Chương 6. Thiết kế và phân tích thực nghiệm
OF FI
CI AL
221
ƠN
Theo bảng ANOVA, chỉ có yếu tố hệ số b12 không có ý nghĩa (p–value = 0.336 >> 0.05). Phương trình của mô hình thu được là:
M
QU
Y
NH
y = 27.2 + 4.8x1 + 2.9x2 + 2.7x3 – 8.9x4 – 5.5 x1x3 – 5.0 x1x4
KÈ
Hệ số tương quan R2 = 0.995 cho thấy mô hình thu được phù hợp với thực nghiệm. Áp dụng công thức 6.12 ta có: R2
DẠ Y
Fstat = 1−R2 .
N−L−1 L
0.995
= (1−0.995) .
11−7−1 7
= 113.7
Fcrit (0.05, 7,3) ≈ 8.9. Fstat >> Fcrit, mô hình thu được phù hợp với thực nghiệm. Biểu đồ ảnh hưởng của các yếu tố:
222
Y
NH
ƠN
OF FI
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
DẠ Y
KÈ
M
QU
– Giá trị tối ưu (maximum):
Giá trị lớn nhất là 51.12 ứng với giá trị của các yếu tố x1 = 1, x2 = 1, x3 = –1, x4 = –1.
Chương 6. Thiết kế và phân tích thực nghiệm
223
CI AL
6.3. Mô hình mặt đáp ứng bậc hai (Response surface)
OF FI
Trong trường hợp mô hình thực nghiệm bậc một là không tương thích với thực nghiệm (F–test), cần bổ sung thêm các hệ số bậc hai cho phương trình hồi quy. Vì số hệ số trong phương trình hồi quy có thêm các hệ số bậc hai nên ma trận thực nghiệm cần làm bổ sung các thực nghiệm cho hồi quy bậc hai tương ứng. Có nhiều loại mô hình bậc hai trong đó phổ biến là mô hình bậc hai có tâm (tâm xoay và tâm trực giao), mô hình đa mức thực nghiệm.
Y
NH
ƠN
Vùng thực nghiệm của một số mô hình bậc hai, ba yếu tố được mô phỏng bằng các hình dưới đây:
DẠ Y
KÈ
M
QU
Hình 6.2. Mô phỏng không gian và hình chiếu vùng thực nghiệm của mô hình bậc hai, ba yếu tố tâm xoay và bậc hai tâm trực giao. Mỗi yếu tố 3 mức thực nghiệm với tổng số 15 thí nghiệm.
224
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
ƠN
OF FI
CI AL
Hình 6.3. Mô phỏng không gian và hình chiếu vùng thực nghiệm của mô hình bậc 2 trực giao của Box–Behnken. Mỗi yếu tố 3 mức thực nghiệm với tổng số 13 thí nghiệm.
Hình 6.4. Mô phỏng không gian và hình chiếu vùng thực nghiệm của mô hình bậc hai, ba mức thực nghiệm, 27 thí nghiệm (33).
NH
Tùy vào từng loại mô hình bậc hai mà số lượng thí nghiệm, tính chất của vùng thực nghiệm là khác nhau. 6.3.1. Mô hình bậc hai tâm trực giao (Central composite orthogonal designs)
QU
Y
Đối với mô hình bậc hai tâm trực giao và tâm xoay, các thí nghiệm được bổ sung so với mô hình bậc một là các điểm sao (starlike, *) nằm trên trục tọa độ của các yếu tố. Vùng giá trị khảo sát của mỗi yếu tố được mở rộng với giá trị ± α so với giá trị ±1 ban đầu. Do đó, số thí nghiệm của mô hình bậc hai nói chung được tính theo công thức:
M
N = Nf + N ∗ + N0 = 2n−q + 2n + N0
(6.30)
KÈ
q: bậc rút gọn của mô hình; Nf = 2n–q: số thực nghiệm ở ma trận gốc; N*= 2n: số thực nghiệm ở điểm sao;
DẠ Y
N0: số thực nghiệm ở điểm tâm, N0 tối thiểu là 1 thí nghiệm.
Ví dụ mô hình thực nghiệm bậc 2 đầy đủ có 3 yếu tố ảnh hưởng lên kết quả thực nghiệm với 1 thí nghiệm tại tâm thì số lượng thí nghiệm cần thiết là:
Chương 6. Thiết kế và phân tích thực nghiệm
225
CI AL
N = 23−0 + 2 × 3 + 1 = 15 thí nghiệm. Các thí nghiệm của mô hình này được mô phỏng như trong hình 6.2.
Các bước tiến hành quy hoạch hóa thực nghiệm giống như các mô hình khác bao gồm: 6.3.1.1. Ma trận thực nghiệm bậc hai tâm trực giao
OF FI
Một cách tổng quát, ma trận thực nghiệm bậc hai có tâm trực giao được thiết kế như bảng 6.4. Bảng 6.4. Ma trận thực nghiệm của mô hình bậc hai tổng quát x1
x2
x3
...
1
–
–
–
...
2
+
–
–
3
–
+
–
4
+
+
–
5
–
–
+
6
+
–
7
–
+
8
+
+
...
...
...
2n
+
+
2n+1
+α
2n+2
–α
2n+3
0
...
y2
...
y3
...
y4
...
y5
+
...
y6
+
...
y7
+
...
y8
...
...
yi
NH
Y
QU
y1
2n thí nghiệm của ma trận gốc.
y2^n 0
...
y2^n+1
0
0
...
y2^n+2
+α
0
...
y2^n+3
0
–α
0
...
y2^n+4
0
0
+α
...
y2^n+5
KÈ
2n+5
y
0
M
2n+4
ƠN
n
2n+6
0
0
–α
...
y2^n+6
...
...
...
...
...
...
2n+2n–1
2n thí nghiệm ở điểm ‘*’
0
0
+α
y2^n+2n–1
2 +2n
0
0
0
–α
y2^n+2n
N01
0
0
0
0
y01
N0 thí nghiệm
N02
0
0
0
0
y02
lặp tại tâm (N0
...
0
0
0
0
...
≥ 1)
DẠ Y
0
n
226
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Ma trận thực nghiệm gồm các thí nghiệm ma trận gốc bậc 1 đầy đủ có tính chất trực giao (2n thí nghiệm). 2n thí nghiệm ở điểm sao (*) là các thí nghiệm từ 2n +1 đến 2n +2n. Ngoài ra, ma trận thực nghiệm còn có No các thí nghiệm ở tâm của không gian thực nghiệm.
OF FI
Giá trị của α là khoảng cách từ tâm đến các điểm sao. Tùy theo loại mô hình bậc hai mà giá trị α được tính khác nhau. Đối với mô hình bậc hai tâm trực giao, giá trị α được tính theo công thức sau: α = √√N × 2n−q−2 − 2n−q–1
(6.31)
Để ma trận thực nghiệm đảm bảo tính chất trực giao, các ma trận cột tương ứng với các số hạng bậc hai phải đưa thêm tham số hiệu chỉnh : 2
2n−q +2×α2
Với φ = 2n−q +2n+N
(6.32)
ƠN
xi′ = xi2 − φ 0
(6.33)
NH
Với tham số hiệu chỉnh này đáp ứng điều kiện trực giao được đảm bảo theo biểu thức: 2 2 ∑N u=1(xiu − φ)(xju − φ) = 0
(6.34)
Y
Tùy vào số lượng yếu tố và bậc rút gọn của mô hình, có thể dễ dàng tính được các giá trị α và như bảng 6.5.
QU
Bảng 6.5. Bảng các giá trị α và của một số mô hình thực nghiệm bậc hai tâm trực giao (N0=1). N
α
9
1.000
0.667
15
1.215
0.730
24
25
1.414
0.800
24–1
17
1.353
0.686
25
43
1.596
0.863
25–1
27
1.547
0.770
25–2
19
1.471
0.649
26
77
1.761
0.912
22
DẠ Y
KÈ
23
M
Mô hình
Chương 6. Thiết kế và phân tích thực nghiệm 45
1.724
26–2
29
1.664
26–3
21
1.575
0.843
CI AL
26–1
227
0.743 0.617
Giá trị α và thay đổi nếu số thí nghiệm lặp lại tại tâm thay đổi.
OF FI
6.3.1.2. Tiến hành thực nghiệm
Thực nghiệm được tiến hành theo ma trận đã thiết kế ở bước 1 (Bảng 6.4), giá trị thực nghiệm được điền vào cột y của bảng. Để tăng độ chính xác của thí nghiệm, tại mỗi tọa độ thực nghiệm nên làm thí nghiệm lặp và dùng giá trị trung bình.
ƠN
6.3.1.3. Tính hệ số hồi quy của phương trình hồi quy
Phương trình hồi quy bậc hai, n yếu tố có dạng tổng quát như sau:
NH
y = b′0 + b1 x1 + b2 x2 + ⋯ + bi xi + b12 x1 x2 + b13 x1 x3 + ⋯ +bij xi xj +b11 (x12 − φ) + b22 (x22 − φ) + ⋯ +bii (xi2 − φ) (6.35) Cách tính các hệ số trong phương trình hồi quy tương tự với trong hồi quy bậc nhất. Giá trị tương ứng với yếu tố có ý nghĩa tương tự trung bình của tích số giữa yếu tố đó với giá trị hàm mục tiêu. ∑N u=1 xiu yu 2 ∑N u=1 xiu
(6. 36)
QU
bi =
Y
Các hệ số bi được tính theo công thức 6.36:
Các hệ số tổ hợp đồng thời hai yếu tố bij được tính theo công thức: ∑N
x x yu
bij = ∑Nu=1(xiu xju )2
(6.37)
iu ju
M
u=1
Các hệ số bậc 2, bii được tính theo công thức: 2 ∑N u=1(xiu −φ)yu
KÈ
bii =
(6.38)
2 2 ∑N u=1(xiu −φ)
Trong đó các hệ số b0 được tính theo công thức 6.37:
DẠ Y
b0 = b′0 − ∑ni=1 bii φ =
∑N u=1 yu N
− ∑ni=1 bii φ
(6.39)
6.3.1.4. Đánh giá tính có nghĩa của hệ số hồi quy Tương tự như mô hình bậc 1, kiểm định Student (t–test) hoặc phân tích ANOVA được sử dụng để đánh giá tính có nghĩa của phương trình
228
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
hàm mục tiêu ở độ tin cậy 95%. Nếu sự khác biệt giữa hệ số b với sai số của thí nghiệm (độ lệch chuẩn trung bình) có ý nghĩa thì sự ảnh hưởng của yếu tố đang xét là đáng kể.
Để thực hiện t–test, các giá trị tstat của các hệ số tương ứng trong phương trình được tính theo các công thức:
t ij = t ii =
|bi | Sb
OF FI
ti =
i
|bij | Sb
ij
|bii | Sb
ij
(6.40)
ƠN
Các giá trị độ lệch chuẩn trung bình tương ứng các hệ số được tính từ công thức 6.39. S2
Sb 2i = ∑(x 0 )2 Sb 2ij = ∑(x
S20 2 iu xju )
S2
NH
iu
Sb 2ii = ∑(x2 0−φ)2 , S02 là phương sai lặp lại của các thí nghiệm iu
(6. 41)
QU
Y
Nếu tstat > tcrit thì hệ số hồi quy có nghĩa, những hệ số có tstat < tcrit cần loại bỏ khỏi phương trình của mô hình thực nghiệm. 6.3.1.5. Đánh giá tính phù hợp của mô hình
M
Tiến hành đánh giá tính phù hợp của mô hình giống như trong mô hình bậc 1 (xem mục 6.2.1.3). Nếu Fstat < Fcrit, mô hình thu được là phù hợp với thực nghiệm.
KÈ
6.3.1.6. Xác định giá trị tối ưu theo hàm mục tiêu
DẠ Y
Nếu hàm mục tiêu là phù hợp giữa thực nghiệm và lý thuyết, giá trị tối ưu sẽ được xác định thông qua phép tính toán theo phương pháp đường dốc nhất. Ví dụ 6.3: Nghiên cứu điều kiện ảnh hưởng đến hiệu suất xử lý nước thải từ công nghiệp nhuộm bằng chất keo tụ aluminium sulphate bằng mô hình bậc hai tâm trực giao với 3 yếu tố: nhiệt độ, pH và nồng độ aluminium sulphate. Thuốc nhuộm C.I. Acid Black 210 được sử dụng trong nghiên
Chương 6. Thiết kế và phân tích thực nghiệm
229
Yếu tố
Mức thực nghiệm
Ký
CI AL
cứu có bước sóng hấp thu 460 nm. Điều kiện các yếu tố được thiết lập cho mô hình như sau: –1.215
–1
0
+1
1.215
ToC
x1
20
21.8
30
38.2
40
pH
x2
5
5.09
5.5
5.91
6
C (g/L)
x3
0.8
0.86
1.15
1.44
1.5
OF FI
hiệu
Giá trị hàm mục tiêu là % lượng thuốc nhuộm đã được loại bỏ khỏi nước thải. Ma trận thực nghiệm và kết quả như bảng sau đây: x2
x3
y
1
1
1
1
71.96
2
–1
1
1
88.06
3
1
–1
1
77.71
4
–1
–1
1
97.23
5
1
1
–1
96.32
6
–1
1
–1
94.85
7
1
–1
–1
95.59
–1
–1
–1
92.83
9
1.215
0
0
90.38
10
–1.215
0
0
93.03
0
1.215
0
59.05
12
0
–1.215
0
63.72
13
0
0
1.215
81.11
14
0
0
–1.215
87.49
0
0
0
61.24
DẠ Y 15
Y
QU
KÈ
11
M
8
ƠN
x1
NH
n
Độ lệch chuẩn của 03 thí nghiệm lặp lại tại tâm là Sd = 1.55
a) Tính toán và đánh giá mô hình thực nghiệm.
230
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Giải: Cách 1: Tính toán bằng công thức Xác định phương trình hồi quy
OF FI
a) Tính toán và đánh giá mô hình thực nghiệm
CI AL
b) Tìm điều kiện trong miền thực nghiệm để hiệu suất loại bỏ thuốc nhuộm trong nước thải là lớn nhất.
x1′2
x2′2
0.27
0.27
0.27 71.96
0.27
0.27 88.06
–1
0.27
0.27
0.27 77.71
–1
–1
0.27
0.27
0.27 97.23
1
ƠN
0.27
–1
–1
0.27
0.27 96.32
–1
–1
1
–1
0.27
0.27
0.27 94.85
–1
–1
–1
–1
1
0.27
0.27
0.27 95.59
–1
–1
–1
NH
0.27
1
1
1
0.27
0.27
0.27 92.83
9
1.215
0
0
0
0
0
0.75
–0.73 –0.73 90.38
10
–1.215
0
0
0
0
0
0.75
–0.73 –0.73 93.03
11
0
1.215
0
0
0
0
–0.73
0.75 –0.73 59.05
12
0
–1.215
0
0
0
0
–0.73
0.75 –0.73 63.72
13
0
0
QU
Để thuận lợi trong tính toán, ta lập bảng ma trận các hệ số trong phương trình bậc hai tâm trực giao như sau:
1.215
0
0
0
–0.73
–0.73 0.75 81.11
14
0
0
–1.215
0
0
0
–0.73
–0.73 0.75 87.49
15
0
0
0
0
0
0
–0.73
–0.73 –0.73 61.24
x2
x3
x1x2
x1x3
x2x3
1
1
1
1
1
1
1
2
–1
1
1
–1
–1
1
3
1
–1
1
–1
1
4
–1
–1
1
1
5
1
1
–1
6
–1
1
7
1
8
Y
x1
M
n
x3′2
y
KÈ
Áp dụng các công thức từ 6.34 đến 6.37 ta thu được giá trị các hệ số như sau: b1 = –3.16; b2 = –1.63; b3 = –4.78
DẠ Y
b12 = 0.27; b13 = –4.98; b23 = –2.2 b11 = 16.60; b22 = –3.93; b33 = 11.59 b0 = 65.67 Phương trình hàm hồi quy của mô hình thực nghiệm thu được là:
Chương 6. Thiết kế và phân tích thực nghiệm
231
Đánh giá phương trình hồi quy
CI AL
y = 65.67 − 3.16x1 − 1.63x2 − 4.78x3 + 0.27x1 x2 − 4.98x1 x3 − 2.2x1 x3 + 16.60x12 − 3.93x22 + 11.59x32
Áp dụng công thức 6.38, ta thu được các giá trị tstat của các hệ số trong phương trình: Hệ số
Giá trị tstat
b1 = – 3.16
6.74
4.30
Có ý nghĩa
b2 = – 1.63
3.48
4.30
Loại bỏ
b3 = – 4.78
10.20
4.30
Có ý nghĩa
b12 = 0.27
0.49
4.30
Loại bỏ
b13 = – 4.98
9.08
b23 = – 2.2
4.03
b11 = 16.60
22.34
b22 = – 3.93 b33 = 11.59
Kết luận
ƠN
OF FI
tcrit
Có ý nghĩa
4.30
Loại bỏ
4.30
Có ý nghĩa
5.29
4.30
Có ý nghĩa
15.60
4.30
Có ý nghĩa
NH
4.30
QU
Y
Các hệ số b2, b12, b23 có giá trị t nhỏ hơn t tra bảng. Phương trình của mô hình thực nghiệm sau khi loại bỏ các hệ số không có ý nghĩa có dạng: y = 65.67 − 3.16x1 − 4.78x3 − 4.98x1 x3 + 16.60x12 − 3.93x22 + 11.59x32 Đánh giá sự phù hợp của mô hình
KÈ
M
Từ phương trình mô hình, tính độ khác biệt giữa các giá trị được từ phương trình và thực nghiệm. Thực hiện kiểm định Fisher cho mô hình thu được kết quả như bảng sau: y
𝑦̂
yu – 𝑦̂𝑢
(yu – 𝑦̂𝑢 )2
1
71.96
77.00
–5.04
25.36
2
88.06
93.28
–5.22
27.23
3
77.71
77.00
0.71
0.51
4
97.23
93.28
3.95
15.61
DẠ Y
n
232
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
96.32
96.52
–0.20
6
94.85
92.88
1.97
7
95.59
96.52
–0.93
8
92.83
92.88
–0.05
9
90.38
86.33
4.05
10
93.03
94.01
11
59.05
59.87
12
63.72
59.87
13
81.11
76.96
14
87.49
15
61.24
0.00
OF FI –0.82
0.67
3.85
14.84
4.15
17.25
88.58
–1.09
1.18
65.67
–4.43
19.59
ƠN
0.95
144.42 16.05 6.67 19.37
Y
F(0.05,8,2)
0.87
16.42
NH
Fstat
3.88
–0.98
Tổng 2 Sfit
0.04
CI AL
5
QU
Ta thấy Fstat = 6.67 < Fcrit = 19.37. Mô hình bậc hai tâm trực giao đã chọn là phù hợp với thực nghiệm. b) Tìm điều kiện thực nghiệm để hàm đạt cực đại
M
Thay giá trị mã hóa bằng các giá trị thực theo biểu thức 6.4, ta thu được phương trình giá trị thực như sau:
KÈ
y = −278.53 − 12.79T + 257.0pH − 279.5C − 2.09TC + 0.246T 2 − 23.36pH 2 + 137.75C2
DẠ Y
Mặc dù ảnh hưởng của nhiệt độ làm giảm hiệu suất loại bỏ thuốc nhuộm (hệ số là –12.79), trong thực tế nhiệt độ của nước thải nhuộm có giá trị ở ngưỡng cao so với mức gốc, nên ta tiến hành tìm điểm cực đại với xu hướng tăng của nhiệt độ. Đồng thời, nhiệt độ tăng còn làm cho quá trình cộng kết tốt hơn khi keo tụ và phù hợp với điều kiện nhiệt độ thực tế của nước thải dệt nhuộm. Do vậy ta tiến hành tính giá trị hàm mục tiêu theo
Chương 6. Thiết kế và phân tích thực nghiệm
233
CI AL
các bước dịch chuyển tương ứng là 1; 0.01 và 0.035 cho nhiệt độ, pH và nồng độ. Giá trị tính được như bảng sau: ŷ(x)
pH
C (mg/L)
Mức gốc
30
5.5
1.15
Hệ số bi
–12.79
257
–279.5
Khoảng biến thiên
10
0.5
0.35
Bước chuyển δi
1
0,01
0,035
Bước dịch chuyển thứ 1
31
5.51
1.115
66.34
Bước dịch chuyển thứ 2
32
5.52
1.08
68.00
Bước dịch chuyển thứ 3
33
5.53
1.045
70.62
Bước dịch chuyển thứ 4
34
5.54
1.01
74.22
35
5.55
0.975
78.79
36
5.56
0.94
84.33
37
5.57
0.905
90.85
38
5.58
0.87
98.34
Bước dịch chuyển thứ 9
39
5.59
0.835
106.80
Bước dịch chuyển thứ 10
40
5.6
0.8
116.24
Bước dịch chuyển thứ 6
Y
Bước dịch chuyển thứ 7
ƠN
NH
Bước dịch chuyển thứ 5
OF FI
T(oC)
QU
Bước dịch chuyển thứ 8
M
Giá trị lớn nhất trong miền thực nghiệm tìm được là 116.24 % cho mức nồng độ thấp nhất của thuốc nhuộm C = 0.8 g/L giá trị T = 40 oC. pH = 5.6.
KÈ
Từ điều kiện tìm được, thực hiện thí nghiệm kiểm chứng lại điều kiện tối ưu ở trên thu được hiệu suất loại bỏ thuốc nhuộm trong nước thải đạt ⁓97.9%. Cách 2: Sử dụng phần mềm Statgraphics
DẠ Y
a) Tính toán và đánh giá phương trình hồi quy Thực hiện tương tự như Ví dụ 6.1 và 6.2 chỉ khác bước chọn mô hình và ma trận thực nghiệm. Chọn dạng mô hình mặt đáp ứng bậc 2 (Response surface)/dạng ma trận 23 + star/mô hình othogonal/
234
ƠN
OF FI
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Sau khi nhập dữ liệu và thực hiện phân tích thực nghiệm thu được những kết quả chính sau:
DẠ Y
KÈ
M
QU
Y
NH
Bảng Regression coefficients: cho giá trị các hệ số của phương trình hồi quy như hình sau đây.
Các hệ số có giá trị giống như cách tính bằng công thức.
Chương 6. Thiết kế và phân tích thực nghiệm
235
CI AL
Đánh giá hệ số hồi quy
QU
Y
NH
ƠN
OF FI
Bảng ANOVA cho thấy các hệ số x1, x3, x1x3, x12 , x32 có ảnh hưởng rõ ràng. Các yếu tố x2, x1x2, x2x3 không có ý nghĩa trong phương trình hồi quy (p–value > 0.169). Riêng yếu tố x22 , mặc dù có giá trị p–value = 0.085 > 0.05, tuy nhiên sự khác biệt không nhiều nên có thể giữ lại trong phương trình hồi quy.
Phương trình hồi quy thu được là: y = 65.79 − 3.16x1 − 4.78x3 − 4.98x1 x3 + 16.55x12 − 3.99x22 + 11.53x32
M
Đánh giá sự phù hợp của mô hình
KÈ
Từ bảng ANOVA ta thu được hệ số tương quan R2 = 0.97 cho thấy 97% các điểm thực nghiệm phù hợp với phương trình hồi quy. Để khẳng định một cách chắc chắn hơn, kiểm định Fisher được thực hiện giống như Ví dụ 6.1 và 6.2. R2
DẠ Y
Fstat = 1−R2 .
N−L−1 L
0.97
= (1−0.97) .
15−7−1 7
= 32.3
Fcrit = F(0.05, 7, 7) = 3.79 Fstat >> Fcrit , mô hình thu được phù hợp với thực nghiệm.
236
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
b) Tối ưu hóa thực nghiệm
ƠN
OF FI
Giá trị maximum của hàm hồi quy thu được trong bảng Optimization tương ứng với các giá trị mã hóa như hình sau:
NH
Thay giá trị mã hóa bằng giá trị thực theo công thức 6.4, giá trị thực của điều kiện tối ưu là : T = 40 oC, pH = 5.51 và C = 0.8 mg/L. Đối chiếu với tính toán giá trị max theo cách 1 ta thấy có sự khác biệt về pH (5.6 so với 5.5) điều này là phù hợp vì pH ảnh hưởng rất nhỏ đến phương trình hàm hồi quy.
QU
Y
Kiểm tra lại bằng thực nghiệm với điều kiện tối ưu này thu được kết quả tương tự cách 1 (98.2%).
DẠ Y
KÈ
M
Để có cái nhìn trực quan về giá trị tối ưu, đồ thị dạng “contours plot” của hàm mục tiêu thể hiện vùng các yếu tố cho giá trị cực đại.
Chương 6. Thiết kế và phân tích thực nghiệm
DẠ Y
KÈ
M
QU
Y
NH
ƠN
OF FI
CI AL
237
Từ các đồ thị contours, ta thấy giá trị lớn nhất của hàm mục tiêu (đường màu nâu, giá trị ⁓116%) ứng với pH tại tâm (x2 = 0) và tại 3 vùng thực
238
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
nghiệm khác nhau: (i) Nhiệt độ cao, pH tại tâm, nồng cao; (ii) Nhiệt độ thấp, pH tại tâm, nồng độ thấp; (iii) Nhiệt độ thấp, pH tại tâm, nồng độ cao. Trong ví dụ này, điều kiện loại bỏ thuốc nhuộm trong nước thải với nhiệt độ cao ⁓ 40 oC tại nồng độ nhỏ của thuốc nhuộm ⁓ 8 mg/L được lựa chọn với hiệu suất về mặt lý thuyết là 116%.
OF FI
6.3.2. Mô hình bậc hai tâm xoay (central composite rotable designs/Box– Wilson Design) 6.3.2.1. Ma trận thực nghiệm
ƠN
Mô hình thực nghiệm bậc hai tâm xoay tương tự như bậc hai tâm trực giao nhưng có vùng thực nghiệm rộng hơn với giá trị khoảng cách từ tâm đến các điểm sao α được tính theo công thức: 4
α = 4√Nf = √2n−q
(6.42)
NH
Giá trị α của các điểm sao tính theo số yếu tố của mô hình được trình bày trong Bảng 6.6. Bảng 6.6. Bảng các giá trị α của mô hình thực nghiệm bậc hai tâm xoay (N0=1)
Y
Số thí nghiệm
Số yếu tố
gốc (Nf)
α
2
4
1.414
3
8
1.682
4
16
2.000
24–1
4
8
1.682
25
5
32
2.378
25–1
5
16
2.000
26
6
64
2.828
26–1
6
32
2.378
26–2
6
16
2.000
22 23
DẠ Y
KÈ
M
24
QU
Mô hình
Chương 6. Thiết kế và phân tích thực nghiệm
239
CI AL
Ma trận thực nghiệm như được trình bày ở bảng 6.4 với các thí nghiệm ở điểm sao có giá trị tương ứng ở bảng 6.6. Điều kiện “xoay” của ma trận thực nghiệm được đảm bảo nếu: 2 ∑N u=1 xiu = N × λ2
=
(6.43)
2 2 3 ∑N u=1 xiu xju
= 3N × λ4
(6.44)
OF FI
Và
4 ∑N u=1 xiu
Với λ2 và λ4 là các hằng số thỏa mãn biểu thức: λ4 λ22
nC
n.N
= n+2 = (N−N
o )(n+2)
= λ∗4
N
C = N−N
o
– n: số yếu tố của mô hình
(6.46)
ƠN
Trong đó:
(6.45)
– N: Tổng số thí nghiệm, N= Nf + N*+N0 = 2n–q + 2n + N0
NH
– Nf = 2n: số thí nghiệm ở điểm sao – N0: số thí nghiệm ở tâm, N0 ≥ 1
– Nf = 2n–q: số thí nghiệm của ma trận gốc.
Y
6.3.2.2. Tính toán các hệ số của phương trình hồi quy
QU
Tương tự như mô hình bậc hai tâm trực giao, dạng tổng quát của phương trình hồi quy bậc hai tâm xoay có dạng: y = b0 + b1 x1 + b2 x2 + ⋯ +bi xi + b12 x1 x2 + b13 x1 x3 + ⋯ +bij xi xj +b11 x12 + b22 x22 + ⋯ +bii xi2 (6.47)
M
Các hệ số hồi quy được tính theo các công thức sau đây: b0 = N[(λ∗ )2 (n+2) ∑N
KÈ
4
bi =
2A
(6.48)
2 ∗ n N u=1 yu −Cλ4 ∑i=1 ∑u=1 xiu yu ]
∑N u=1 xiu yu
(6.49)
N−N0
C2
DẠ Y
bij = Nλ∗ ∑N u=1 xiu xiu yu bii =
4 AC2
2 [(n + 2)λ∗4 − n] ∑N u=1 xiu yu +
N 2 λ∗4 ) ∑ni=1 ∑N u=1 xiu yu
(6.50) AC2 N
(1 −
Trong đó, C và λ∗4 được tính theo các công thức 6.45 và 6.46.
(6.51)
240
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC 1
A = 2λ∗ [(n+2)λ∗ −n]
(6.52)
4
CI AL
4
Để thuận lợi trong tính toán, giá trị các hệ số được tính theo các biểu thức đơn giản như sau: n 2 N b 0 = a 1 ∑N u=1 yu − a 2 ∑i=1 ∑u=1 xiu yu
b i = a 3 ∑N u=1 xiu yu
(6.54)
OF FI
bij =
a 4 ∑N u=1 xiu
(6.53)
xju yu
(6.55)
2 n 2 N N bii = a5 ∑N u=1 xiu yu + a 6 ∑i=1 ∑u=1 xiu yu − a 2 ∑u=1 yu
(6.56)
Các hằng số ai được tính theo A, C và λ∗4 khi biết số yếu tố và số thí nghiệm của mô hình như trình bày trong Bảng 6.7.
a3
a4
a5
a6
0.1250
0.2500
0.1250
0.0187
0.0732
0.1250
0.0625
0.0069
0.0357
0.0417
0.0625
0.0312
0.0037
0.1591
0.0341
0.0417
0.0625
0.0312
0.0028
52
0.0988
NH
N
a1
a2
22
13
0.2000
0.1000
23
20
0.1663
0.0568
24
31
0.1428
25–1
32
25
0.0191
0.0231
0.0312
0.0156
0.0015
26–1
53
0.1108
0.0187
0.0231
0.0312
0.0156
0.0012
26
91
0.0625
0.0098
0.0125
0.0156
0.0078
0.0005
27–1
92
0.0730
0.0098
0.0125
0.0156
0.0078
0.0005
27
163
0.0398
0.0052
0.0066
0.0078
0.0039
0.0002
QU
Y
Mô hình
ƠN
Bảng 6.7. Các hệ số ai được tính trước tương ứng với số yếu tố
6.3.2.2. Đánh giá hệ số của phương trình hồi quy
KÈ
M
Các hệ số của phương trình mặt mục tiêu được đánh giá bằng kiểm định Student (t–test) hoặc phân tích phương sai như được trình bày trong các mô hình mặt phẳng và bậc hai tâm trực giao. Giá trị chuẩn student được tính và kiểm định lần lượt theo các công thức 6.57–6.61.
DẠ Y
t stat =
|b| Sb
(6.57)
Sb20 = a1 S02
(6.58)
Sb2i = a3 S02
(6.59)
Sb2ij = 2a4 S02
(6.60)
Chương 6. Thiết kế và phân tích thực nghiệm
241
Sb2ii = a6 S02
CI AL
(6.61)
Trong đó S02 là phương sai lặp lại của các thí nghiệm tại tâm
Đánh giá tính phù hợp của mô hình tìm được thông qua phương trình hồi quy bậc 2 tâm xoay theo chuẩn F:
2 Sfit =
S2fit
(6.62)
S20 N
0 (y0 −ȳ 0 ) ∑N ̂u )2 − ∑k=1 u=1(yu −y k ffit
OF FI
Fstat =
2
(6.63)
f0 = N0 – 1: bậc tự do thí nghiệm lặp tại tâm;
ƠN
ffit = N − L − N0 + 1: bậc tự do của phương sai phù hợp, L là số hệ số có nghĩa trong phương trình hàm mục tiêu. Với tổng số thí nghiệm N và N0 thí nghiệm lặp lại tại tâm.
NH
Nếu Fstat < Fcrit = F(α, ffit, f0), kết luận mô hình tìm được là phù hợp với thực nghiệm.
Yếu tố
QU
Y
Ví dụ 6.4: Tối ưu hóa điều kiện tổng hợp methacrylic acid trong phòng thí nghiệm được thực hiện bằng mô hình bậc hai tâm xoay với 3 yếu tố nhiệt độ (x1, oC), nồng độ α–oxy iso acid béo trong dung dịch nước (x2, %) và lưu lượng thể tích của dung dịch (x3, L/h). Hiệu suất tổng hợp methacrylic acid là giá trị hàm mục tiêu (y). Giá trị của các yếu tố và ma trận thực nghiệm được trình bày như bảng sau đây: Ký hiệu
Mức thực nghiệm –1.682
–1
0
+1
1.682
x1
229.8
240
255
270
280.2
C (%)
x2
3.2
10
20
30
36.8
Lưu lượng (L/h)
x3
0.33
0,4
0,5
0,6
0.67
KÈ
M
t oC
x1
x2
x3
y
1
–1
–1
–1
61.5
2
1
–1
–1
64
3
–1
1
–1
87.6
DẠ Y
N
242
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
1
–1
5
–1
–1
1
6
1
–1
1
7
–1
1
1
8
1
1
1
9
–1.682
0
10
1.682
0
11
0
–1.682
12
0
1.682
13
0
0
14
0
0
15
0
0
16
0
17
0
18
0
19
0 0
72.7 70.5 82.7 87
78.1
0
79.3
0
49.2
0
81.4
–1.682
81.2
1.682
90.6
0
86.8
0
0
86.2
0
0
84.9
0
0
85.9
0
0
84.6
0
0
85.4
ƠN
0
NH Y
QU
20
84.5
CI AL
1
OF FI
4
Phân tích kết quả của mô hình thực nghiệm. Giải:
M
Cách 1: Sử dụng công thức tính
KÈ
Tính toán phương trình hồi quy Để tính toán các hệ số, trước hết cần tính các tổng thành phần trong công thức từ 6.53 đến 6.56.
DẠ Y
– ∑20 u=1 yu = 1584.1 – ∑N u=1 x1u yu = 3.5 – ∑N u=1 x2u yu = 127.3 – ∑N u=1 x3u yu = 31.1
Chương 6. Thiết kế và phân tích thực nghiệm
243
CI AL
– ∑20 u=1 x1u x2u yu = 0.9 – ∑20 u=1 x1u x3u yu = 2.7 – ∑20 u=1 x2u x3u yu = –20.1 2 – ∑20 u=1 x1u yu =1055.7
OF FI
2 – ∑20 u=1 x2u yu = 979.9 2 – ∑20 u=1 x3u yu = 1096.4 2 – ∑3i=1 ∑20 u=1 xiu yu = 3132.0
Thay các tổng vào công thức tính các hệ số ta thu được kết quả như sau: b1 = 0.0732 ∑20 u=1 x1u yu = 0.26 b2 = 0.0732 ∑20 u=1 x2u yu = 9.32
NH
b3 = 0.0732 ∑20 u=1 x3u yu = 2.28
ƠN
n 2 N b0 = 0.1663 ∑20 u=1 yu − 0.0568 ∑i=1 ∑u=1 xiu yu = 85.54
b12 = 0.125 ∑20 u=1 x1u x2u yu = 0.11
b13 = 0.125 ∑20 u=1 x1u x3u yu = 0.34
Y
b23 = 0.125 ∑20 u=1 x2u x3u yu = –2.51
QU
3 2 20 2 b11 = 0.0625 ∑20 u=1 x1u yu + 0.0069 ∑i=1 ∑u=1 xiu yu − 0.0732 ∑20 u=1 yu = –2.39 3 2 20 2 b22 = 0.0625 ∑20 u=1 x2u yu + 0.0069 ∑i=1 ∑u=1 xiu yu − 0.0732 ∑20 u=1 yu = –7.12
KÈ
M
3 2 20 2 b33 = 0.0625 ∑20 u=1 x3u yu + 0.0069 ∑i=1 ∑u=1 xiu yu − 0.0732 ∑20 u=1 yu = 0.16
Phương trình hàm mục tiêu thu được có dạng:
DẠ Y
y = 85.54 + 0.26x1 + 9.32x2 + 2.28x3 + 0.11x1 x2 + 0.34x1 x3 − 2.51x2 x3 − 2.397x12 − 7.12x22 + 0.16x32 Đánh giá các hệ số của phương trình hồi quy: S02 = N
1 0 −1
1
0 ∑N ̅0k )2 = 6−1 ∑6k=1(y0k − y̅0k )2 =0.6827 k=1(y0k − y
Sb20 = 0,1663S02 = 0.1135
244
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Sb2i = 0.0732S02 = 0.0500 Sb2ij = 0.125S02 = 0.0853 Sb2ii = 0.0069S02 = 0.0427
OF FI
Áp dụng công thức 6.55 thu được giá trị hằng số t của các hệ số tương ứng như sau: t1 = 1.15, t2 = 41.67, t3 = 10.19, t12 = 0.39, t13 = 1.16, t23 = 8.60, t11= 11.55, t22 = 34.48, t33 = 0.78. Ta thấy t1 = 1.15, t12 = 0.39, t13 = 1.16 và t33 = 0.78 < t(0.05, 5) = 2.57, các hệ số b1, b12, b13, b33 không có ý nghĩa và bị loại bỏ khỏi phương trình hồi quy. Phương trình hàm mục tiêu thu được là:
ƠN
y = 85.54 + 9.32x2 + 2.28x3 − 2.51x2 x3 − 2.397x12 − 7.12x22 Đánh giá sự phù hợp của phương trình hồi quy: 2
∑6k=1(yk0 − ȳ 0 ) = 3.41 N
2
N0 −1
=
3.41 5
= 0.6827
N
0 (y0 −ȳ 0 ) ∑N ̂u )2 − ∑k=1 u=1(yu −y k ffit
Fstat =
Y
2 Sfit =
0 (y0 −ȳ 0 ) ∑k=1 k
S2fit S20
QU
S02 =
NH
∑20 ̂ u )2 = 27.93 u=1(yu − y
2
=
27.93 − 3.41 20−6−5
= 2.724
= 2.724/0.6827= 3.99
Fcrit = F(0.05,9,5) = 4.77
M
Ta thấy Fstat < Fcrit, mô hình thực nghiệm là phù hợp.
KÈ
Tìm điểm tối ưu: Phương trình mặt mục tiêu với giá trị thực của các yếu tố có dạng:
DẠ Y
y = −687.425 + 5.407T + 54.795C + 73.022L − 2.513LC − 0.011T 2 − 0.071C2 Từ phương trình mã hóa ta thấy yếu tố T (x1) chỉ ảnh hưởng đến hàm mục tiêu ở số hạng bậc 2 và luôn làm giảm giá trị hàm mục tiêu. Do vậy ta tiến hành tìm điểm cực đại tại giá trị tại tâm của giá trị T (x1 = 0). Ngoài ra, kết quả thí nghiệm tại các điểm sao cho thấy giá trị lớn nhất gần với
Chương 6. Thiết kế và phân tích thực nghiệm
245
CI AL
điểm lớn nhất của yếu tố lưu lượng (yếu tố L). Từ lập luận đó, việc tính toán giá trị lớn nhất của hàm mục tiêu được lập theo bảng sau: Mức gốc
255
20
0.5
Khoảng biến thiên
15
10
0.1
Bước chuyển δi
0
0.32
0.0153
Bước dịch chuyển thứ 1
255
20.32
0.515
86.16
Bước dịch chuyển thứ 2
255
20.64
0.53
86.74
Bước dịch chuyển thứ 3
255
20.96
0.545
87.28
Bước dịch chuyển thứ 4
255
21.28
0.56
87.79
Bước dịch chuyển thứ 5
255
21.6
0.575
88.25
Bước dịch chuyển thứ 6
255
21.92
0.59
88.68
Bước dịch chuyển thứ 7
255
22.24
0.605
89.07
Bước dịch chuyển thứ 8
255
22.56
0.62
89.42
Bước dịch chuyển thứ 9
255
22.88
0.635
89.73
Bước dịch chuyển thứ 10
255
23.2
0.65
90.00
Bước dịch chuyển thứ 11
255
23.52
0.665
90.23
Bước dịch chuyển thứ 12
255
7.5264
0.68
72.58
Bước dịch chuyển thứ 13
255
7.8464
0.695
74.09
Bước dịch chuyển thứ 14
255
8.1664
0.71
75.57
Bước dịch chuyển thứ 15
255
8.4864
0.725
77.00
Y
QU
OF FI
L (L/h)
NH
C(%)
ƠN
ŷ(x)
T (oC)
Điểm lớn nhất của hàm mục tiêu là 90.23 ứng với điều kiện nhiệt độ 255 C, nồng độ 23.5% và lưu lượng là 0.665 L/h. o
M
Cách 2: Sử dụng phần mềm Statgraphics
KÈ
– Lập ma trận thực nghiệm: thực hiện giống như Ví dụ 6.3 chỉ thay chọn dạng Rotable thay cho Orthogonal trong dạng mặt đáp ứng.
DẠ Y
– Phương trình hồi quy: sau khi nhập giá trị hàm mục tiêu vào cột y, tiến hành phân tích thực nghiệm (thực hiện Design analysis trong DOE) thu được những kết quả như sau:
246
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
NH
ƠN
OF FI
CI AL
Phương trình hàm mục tiêu
Các hệ số của phương trình hàm hồi quy thu được giống như cách 1 Đánh giá tính có nghĩa của hệ số trong phương trình
DẠ Y
KÈ
M
QU
Y
Kết quả phân tích ANOVA cho mô hình thu được như bảng sau:
Chương 6. Thiết kế và phân tích thực nghiệm
247
CI AL
Các hệ số tương ứng với x1 , x1 x2 , x1 x3 và x32 có giá trị p–value > 0.05 không có ý nghĩa và bị loại bỏ khỏi trong phương trình hàm hồi quy. Phương trình còn lại là: y = 85.74 + 9.32x2 + 2.28x3 − 2.51x2 x3 − 2.42x12 − 7.16x22 Đánh giá tính phù hợp của mô hình:
OF FI
Độ tương quan của mô hình thực nghiệm là rất cao với hệ số R2 = 0.988 có thể khẳng định tính phù hợp của mô hình thực nghiệm. Cụ thể hơn, kiểm định Fisher được thực hiện để đánh giá với giá trị thu được dưới đây: N−L−1 L
0.988
= (1−0.988) .
20−6−1 6
= 173.39
ƠN
R2
Fstat = 1−R2 .
Fstat = 173.39 >> F(0.05, 6, 13) = 2.91, mô hình thu được phù hợp với thực nghiệm.
NH
Tối ưu hóa
KÈ
M
QU
Y
Giá trị lớn nhất thể hiện trong kết quả bảng tối ưu:
DẠ Y
Giá trị lớn nhất đạt 90.48. Điều kiện tối ưu ứng với giá trị mã hóa của các yếu tố x1 , x2 , x3 lần lượt là 0; 0.356; 1.681. Thay bằng giá trị thực, điều kiện tối ưu cho nhiệt độ là 255oC, nồng độ 23.56% và lưu lượng là 0.67 L/h.
248
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
6.4. Mô hình thực nghiệm dạng hỗn hợp (Mixture model) Bài toán nghiên cứu hỗn hợp được áp dụng phổ biến khi cần tìm thành phần tối ưu của hỗn hợp các chất tham gia nhằm thu được sản phẩm có tính chất mong muốn.
OF FI
Ma trận thực nghiệm của mô hình hỗn hợp gồm n cấu tử (xi, chất tham gia) được thiết kế trong đó các cấu tử có thể biểu diễn dưới dạng thành phần tỉ lệ giữa các cấu tử với tổng giá trị các cấu tử là 100%. Một thực nghiệm bất kỳ trong ma trận thực nghiệm luôn được đảm bảo theo biểu thức: ∑ni=1 xi = 1
(6.64)
ƠN
Phương trình hồi quy mô hình hỗn hợp có 3 dạng: dạng tuyến tính (linear model), bậc 2 (quadratic model) và dạng khối đầy đủ (full cubic model).
NH
Phương trình tổng quát dạng tuyến tính của mô hình hỗn hợp: y = ∑ni βi xi
(6.66)
Y
Phương trình tổng quát dạng bậc hai của mô hình hỗn hợp: 𝑦 = ∑ni βi xi + ∑ni<j βij xi xj
(6.65)
QU
Phương trình tổng quát dạng khối đầy đủ của mô hình hỗn hợp: 𝑦 = ∑ni βi xi + ∑ni<j βij xi xj + ∑ni<j<k βijk xi xj xk (6.67) 6.4.1. Ma trận thực nghiệm của mô hình hỗn hợp
KÈ
M
Ma trận thực nghiệm của mô hình hỗn hợp có thể được thiết kế theo dạng trục (Axial design), dạng lưới (Lattice design) hay dạng đỉnh (Vertex Design). Phổ biến nhất thường được sử dụng là dạng lưới. Mô hình thực nghiệm dạng lưới đơn giản được trình bày bằng các hình dưới đây:
DẠ Y
Mô hình hỗn hợp ba cấu tử:
Chương 6. Thiết kế và phân tích thực nghiệm
NH
ƠN
OF FI
CI AL
249
Y
Hình 6.4 Không gian thực nghiệm của mô hình hỗn hợp: (a) N=6 tương tác bậc hai; (b) N=7, tương tác bậc 3 không đầy đủ; N=10, tương tác bậc 3 đầy đủ; (d) tương tác bậc 4
QU
Ma trận thực nghiệm cho từng trường hợp cụ thể được thể hiện trong bảng sau: Bảng 6.8. Ma trận thực nghiệm mô hình hỗn hợp ba yếu tố tương tác bậc 2
x1
x2
x3
y
1
1
0
0
y1
2
0
1
0
y2
3
0
0
1
y3
4
1/2
1/2
0
y12
5
1/2
0
1/2
y13
6
0
1/2
1/2
y23
DẠ Y
KÈ
n
M
(N=6)
250
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
đủ, ba yếu tố (N=7) x1
x2
x3
1
1
0
0
2
0
1
0
3
0
0
4
1/2
1/2
5
1/2
0
6
0
1/2
7
1/3
1/3
ƠN
OF FI
N
CI AL
Bảng 6.9. Ma trận thực nghiệm của mô hình hỗn hợp tương tác bậc 3 không đầy
y
y1 y2
1
y3
0
y12
1/2
y13
1/2
y23
1/3
y123
Bảng 6.10. Ma trận thực nghiệm của mô hình hỗn hợp tương tác bậc 3 đầy đủ,
x2
x3
y
0
0
y1
1
0
y2
0
1
y3
1/3
0
y112
1/3
2/3
0
y122
2/3
0
1/3
y113
1/3
0
2/3
y133
0
2/3
1/3
y223
9
0
1/3
2/3
y233
10
1/3
1/3
1/3
y123
x1
1
1
2
0
3
0
4
2/3
QU
N
5
KÈ
8
M
6 7
Y
NH
ba yếu tố (N=10)
DẠ Y
Bảng 6.11. Ma trận thực nghiệm của mô hình hỗn hợp tương tác bậc 4, ba yếu tố (N=15)
N
x1
x2
x3
y
1
1
0
0
y1
Chương 6. Thiết kế và phân tích thực nghiệm
251
1
0
3
0
0
1
4
1/2
1/2
0
5
1/2
0
1/2
6
0
1/2
1/2
7
3/4
1/4
8
1/4
3/4
9
3/4
0
10
1/4
0
11
0
12
y2
CI AL
0
y3
y12 y13 y23
OF FI
2
y1112
0
y1222
1/4
y1113
3/4
y1333
3/4
1/4
y2223
0
1/4
3/4
y2333
13
1/2
1/4
1/4
y1123
14
1/4
1/2
1/4
y1223
15
1/4
1/4
1/2
y1233
NH
ƠN
0
Y
6.4.2. Tính toán phương trình hồi quy
QU
Mô hình hỗn hợp tương tác bậc 2 (Ma trận thực nghiệm như bảng 6.8)
y = ∑ni bi xi + ∑ni<j bij xi xj bi = yi
M
Trong đó:
KÈ
bij = 4yij − 2yi − 2yj
(6.68)
(6.69) (6.70)
DẠ Y
Mô hình hỗn hợp tương tác bậc 3 không đầy đủ (Ma trận thực nghiệm như Bảng 6.9) y = ∑ni bi xi + ∑ni<j bij xi xj + ∑ni<j<k bijk xi xj xk (6.71) Các hệ số bi và bij được tính theo biểu thức 6.66 và 6.67. Hệ số bijk tính theo 6.69. bijk = 27yijk − 12(yij + yik + yjk ) + 3(yi + yj + yk )
(6.72)
252
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Mô hình hỗn hợp tương tác bậc 3 đầy đủ (Ma trận thực nghiệm như bảng 6.10) y = ∑ni bi xi + ∑ni<j bij xi xj + ∑ni<j γij xi xj (xi − xj ) + ∑ni<j<k bijk xi xj xk (6.73)
Trong đó:
OF FI
bi = yi 9
bij = 4 (yiij + yijj − yi − yj ) 9
γij = 4 (3yiij − 3yijj − yi − yj ) 27 4
(6.74) (6.76) 9
(yiij + yijj + yiik + yjjk + yikk + yjkk ) + 2 (yi + (6.77)
ƠN
bijk = 27yijk − yj + yk )
(6.74)
NH
Mô hình hỗn hợp tương tác bậc 4 (Ma trận thực nghiệm như Bảng 6.11) y = ∑ni bi xi + ∑ni<j bij xi xj + ∑ni<j γij xi xj (xi − xj ) + ∑ni<j δij xi xj (xi − xj )2 + ∑ni<j<k biijk x𝑖2 xj xk + ∑ni<j<k bijjk x𝑖 x𝑗2 xk + ∑ni<j<k bijkk x𝑖 xj x𝑘2 + ∑ni<j<k<l bijkl xi xj xk xl (6.78)
Y
Trong đó:
(6.79)
QU
bi = yi
bij = 4yij − 2yi − 2yj 8
(6.80)
γij = 3 (2yiiij − 2yijjj − yi + yj ) 8
(6.81)
M
δij = 3 (4yiiij + 4yijjj − 6yij − yi − yj )
(6.82)
8
biijk = 32(3yiijk − yijjk − yijkk ) + 3 (6yi − yj − yk ) − 16(yij + 16
(5yiiij + 5yiiik − 3yijjj − 3yikkk − yjjjk − yjkkk )
KÈ
yik ) −
3
(6.83)
8
bijjk = 32(3yijjk − yiijk − yijkk ) + 3 (6yj − yi − yk ) − 16(yij + 16 3
DẠ Y
yik ) −
(5yijjj + 5yjjjk − 3yiiij − 3yjkkk − yiiik − yikkk )
(6.84)
8
bijkk = 32(3yijkk − yiijk − yijjk ) + 3 (6yk − yi − yj ) − 16(yik +
yjk ) −
16 3
(5yikkk + 5yjkkk − 3yiiik − 3yjjjk − yiiij − yijjj )
(6.85)
Chương 6. Thiết kế và phân tích thực nghiệm
253
bijkl = 256yijkl − 32(yiijk + yiijl + yiikl + yijjk + yijjl + yjjkl + yijkk +
CI AL
32
yikkl + yjkkl + yijll + yikll + yjkll ) + 3 (yiiij + yiiik + yiiil + yijjj + yjjjk + yjjjl + yikkk + yjkkk + ykkkl + yilll + yjlll + yklll ) (6.86) 6.4.3. Đánh giá tính phù hợp của phương trình hồi quy
t stat =
Δyu
OF FI
Tính phù hợp của phương trình hồi quy được đánh giá bằng kiểm định Student hoặc kiểm định Fisher. Δyu √m
√S2y̅ +S2𝑦 ̂
=S
y √1+ε
Δyi = 𝑦̅𝑖 − ŷi
(6.87) (6.88)
S20 m
×ε
(6.89)
NH
Sy2 =
ƠN
U là thí nghiệm kiểm soát thứ u, thí nghiệm kiểm soát có thể là một trong các thí nghiệm trong ma trận thực nghiệm hoặc là một thí nghiệm khác ma trận thực nghiệm.
S02 là phương sai của thí nghiệm lặp lại, m là số thí nghiệm lặp lại có thể thực hiện ở một tọa độ thí nghiệm hoặc nhiều tọa độ thí nghiệm và tính trung bình phương sai.
QU
Y
Tùy từng trường hợp là tương tác bậc 2, bậc 3 không đầy đủ hay bậc 3 đầy đủ mà ta có cách tính Sy và ε khác nhau, cụ thể như sau: – Mô hình hỗn hợp bậc 2 (n yếu tố). Trong đó:
(6.90)
M
ε = ∑ni=1 a2i + ∑ni<j a2ij
KÈ
ai = xi (2xi − 1) aij = 4xi xj
– Mô hình hỗn hợp bậc 3 không đầy đủ (n yếu tố)
DẠ Y
ε = ∑ni=1 b2i + ∑ni<j b2ij + ∑ni<j<k b2ijk Trong đó: 1 bi = xi (6xi2 − 2xi + 1) 2 bij = 4xi xj (3xi + 3xj − 2)
(6.91)
254
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
– Mô hình hỗn hợp bậc 3 đầy đủ (n yếu tố) 2 2 2 ε = ∑ni=1 ci2 + ∑ni<j ciij + ∑ni<j cijj + ∑ni<j<k cijk
(6.92)
ƠN
OF FI
Trong đó: 1 ci = xi (3xi − 1)(3xi − 2) 2 9 ciij = xi xj (3xi − 1) 2 9 cijj = xi xj (3xj − 1) 2 cijk = 27xi xj xk
CI AL
bijk = 27xi xj xk
NH
– Mô hình hỗn hợp bậc 4 (n yếu tố) ε = ∑ni=1 d2i + ∑ni<j d2ij + ∑ni<j d2iiij + ∑ni<j d2ijjj + ∑ni<j<k d2iijk + ∑ni<j<k d2ijjk + ∑ni<j<k d2ijkk + ∑ni<j<k<l d2ijkl (6.93) Với:
M
QU
Y
1 di = xi (4xi − 1)(4xi − 2)(4xi − 3) 6 dij = 4xi xj (4xi − 1)(4xj − 1) 8 diiij = xi xj (4xi − 1)(4xi − 2) 3 8 dijjj = xi xj (4xj − 1)(4xj − 2) 3 diijk = 32xi xj xk (4xi − 1)
KÈ
dijjk = 32xi xj xk (4xj − 1) dijkk = 32xi xj xk (4xk − 1) dijkl = 256xi xj xk xl
DẠ Y
Nếu tstat < tcrit = t(α,f) mô hình thực nghiệm là phù hợp. Với α = 0.05, bậc tự do được tính theo công thức f = N(m–1), N là tổng số thí nghiệm, m là số thí nghiệm lặp. Ví dụ 6.5: Một nghiên cứu xác định thành phần của hỗn hợp gồm ba hydrocacbon x1 (ozocerit), x2 (parafin) và x3 (vaseline) sao cho nhiệt độ
Chương 6. Thiết kế và phân tích thực nghiệm
255
N
Yếu tố
ya
Hàm
CI AL
nóng chảy (ya ) của hỗn hợp đạt từ 66–68 oC và độ xuyên kim (yb ) đạt 16– 18. Thực nghiệm được thiết kế theo ma trận của mô hình hỗn hợp bậc 3 không đầy đủ, kết quả thu được như bảng sau đây: yb
x1
x2
x3
(y)
y1
y2
y̅
y1
1
1
0
0
y1
73.0
72.5
72.8
22
2
0
1
0
y2
54.5
54.0
54.3
3
0
0
1
y3
57.0
57.5
4
1/2
1/2
0
y12
66.0
65.5
5
1/2
0
1/2
y13
68.5
68.5
6
0
1/2
1/2
y23
52.5
52.5
7
1/3
1/3
1/3
y123
62.5
y̅
23
22.5
8
8
8
57.3
156
156
156
65.8
12
12
12
68.5
305
292
298.5
52.5
68
67
67.5
145
148
146.5
ƠN
OF FI
y2
62.5
62.5
a) Xác định phương trình hàm hồi quy và đánh giá tính phù hợp đối với hai hàm mục tiêu trên.
NH
b) Xác định điều kiện về thành phần của hỗn hợp để giá trị nhiệt độ nóng chảy là 66 và độ xuyên kim là 18. Giải:
Y
Cách 1: Áp dụng công thức tính
QU
a) Xác định phương trình hàm hồi quy bậc 2 và đánh giá tính phù hợp đối với hai hàm mục tiêu trên. Tính các hệ số của phương trình hồi quy
M
Áp dụng các công thức từ 6.68, 6.69 và 6.71 ta thu được các hệ số tương ứng với bảng dưới đây: ya
yb
b1
72.75
22.5
b2
54.25
8.0
b3
57.25
156.0
b12
9.0
–13.0
b13
14
837
b23
–13
–58
DẠ Y
KÈ
Hệ số
Phương trình hồi quy thu được lần lượt cho ya và yb là:
256
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
ya = 72.75x1 + 54.25x2 + 57.25x3 + 9.0x1 x2 + 14.0x1 x3 −13.0x2 x3 yb = 22.5x1 + 8x2 + 156x3 − 13x1 x2 + 837x1 x3 − 58x2 x3 Đánh giá tính phù hợp của phương trình hồi quy
Xét phương trình hồi quy bậc 2 đối với nhiệt độ nóng chảy:
OF FI
ya = 72.8x1 + 54.3x2 + 57.3x3 + 9.0x1 x2 + 14.0x1 x3 −13.0x2 x3 Chọn thí nghiệm 7 làm thí nghiệm kiểm soát, ta có: Δy7 = ȳ 7 − ŷ7 = 62.550– 62.521= 0.029
a1 = x1 (2x1 − 1) = –0.111122; a2 =–0.111122; a3 =–0.111122
S02 = 0.072 => Sy2 = y √1+ε
7
×ε=
0.072 7
0.029√7
× 0.629 = 0.0065, Sy = 0.080
= 0.08√1+0.629 = 0.736.
NH
Δyu √m
t stat = S
S20
ƠN
a12 = 4x1 x2 = 0.444356; a13 = 0.444356; a23 = 0.444356 ε = ∑ni=1 a2i + ∑ni<j a2ij = 0.629
tcrit = t(0.05,7) = 2.4
Y
Ta thấy ׀tstat =׀0.736 < tcrit, mô hình thực nghiệm bậc 2 thu được đối với nhiệt độ nóng chảy của hỗn hợp là phù hợp với thực nghiệm.
QU
Xét phương trình hồi quy bậc 2 đối với độ xuyên kim của hỗn hợp: yb = 22.5x1 + 8.0x2 + 156.0x3 − 13.0x1 x2 + 837.0x1 x3 − 58.0x2 x3 Tương tự cách tính như trên, ta có: Δy7 = ȳ 7 − ŷ7 = 147.25 –146.5 = 0.75
M
a1 = x1 (2x1 − 1) = –0.111122; a2 = –0.111122; a3 = –0.111122
KÈ
a12 = 4x1 x2 = 0.444356; a13 = 0.444356; a23 = 0.444356 ε = ∑ni=1 a2i + ∑ni<j a2ij = 0.629
DẠ Y
S02 = 12.86 => Sy2 = Δyu √m
t stat = 𝑆
𝑦 √1+ε
S20
×ε= m
0.75√7
12.86 7
× 0.629 = 1.156, Sy = 1.075
= 1.075√1+0.629 = 1.454
tcrit = t(0.05,7) = 2.4
Chương 6. Thiết kế và phân tích thực nghiệm
257
CI AL
Ta thấy ׀tstat =׀1.452 < tcrit, mô hình thực nghiệm bậc 2 thu được đối với độ xuyên kim của hỗn hợp là phù hợp với thực nghiệm.
Ngoài cách tính theo kiểm định Student ở trên, ta cũng có thể dễ dàng thực hiện kiểm định Fisher cho mô hình từ việc tính toán hằng số tương quan (R2) theo công thức 6.13.
OF FI
Hai mô hình bậc hai cho nhiệt độ nóng chảy và độ xuyên kim phụ thuộc vào thành phần của hỗn hợp hydrocarbon đều phù hợp với thực nghiệm. Do vậy, phương trình hồi quy cuối cùng được sử dụng để tối ưu hóa điều kiện là: ya = 72.8x1 + 54.3x2 + 57.3x3 + 9.0x1 x2 + 51.0x1 x3 −36.0x2 x3
ƠN
yb = 22.5x1 + 8.0x2 + 156.0x3 − 13.0x1 x2 + 866.0x1 x3 − 66.0x2 x3 b) Xác định điều kiện về thành phần của hỗn hợp để giá trị nhiệt độ nóng chảy là 66 và độ xuyên kim là 18.
QU
Y
NH
Giá trị thành phần của hỗn hợp đáp ứng đồng thời điều kiện của giá trị về nhiệt độ nóng chảy, độ xuyên kim với nồng độ tổng ba thành phần là 1, do đó thành phần x1 , x2 , x3 là nghiệm của hệ phương trình: 1 = x1 + x2 + x3 { 66 = 72.8x1 + 54.3x2 + 57.25x3 + 9.0x1 x2 + 14.0x1 x3 −13.0x2 x3 18 = 22.5x1 + 8.0x2 + 156.0x3 − 13.0x1 x2 + 837x1 x3 − 58x2 x3 Giải hệ phương trình thu được: x1 = 0.6342; x2 = 0.3604; x3 = 0.0054
M
Vậy để hỗn hợp có được tính chất về nhiệt độ nóng chảy bằng 66 oC và độ xuyên kim là 18, thành phần của các chất trong hỗn hợp hydrocacbon là: ozocerit 63.42%; parafin 36.04% và vaseline 0.54%.
KÈ
Cách 2: Sử dụng phần mềm Statgraphics
DẠ Y
Với bài tập này, trong phần thiết kế ta chọn mô hình dạng Mixture khai báo số lượng biến là 3 (x1 , x2 , x3 ), số hàm mục tiêu là 2 (ya , yb ); chọn tổng của hỗn hợp là 1; chọn dạng của ma trận là Simplex–Centroid; chọn model type bậc 2 (Quadratic); số điểm thí nghiệm lặp lại là 7 (mỗi điểm làm lặp 1 lần). Sau khi chọn ok, nhập dữ liệu của hai hàm thu được ma trận như hình sau:
258
OF FI
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
ƠN
Tiến hành phân tích thí nghiệm lần lượt cho các hàm ya và yb . Phương trình hồi quy và bảng phân tích ANOVA thu được như sau:
DẠ Y
KÈ
M
QU
Y
NH
Hàm ya (nhiệt độ nóng chảy của hỗn hợp)
Chương 6. Thiết kế và phân tích thực nghiệm
259
M
QU
Y
NH
ƠN
OF FI
CI AL
Hàm yb (độ xuyên kim)
DẠ Y
KÈ
Nhận xét: Kết quả về hàm mục tiêu thu được hoàn toàn giống như cách 1. Khác với các loại mô hình đã xét, trong trường hợp này phần mềm còn cho kết quả về kiểm định sự phù hợp của mô hình bằng F–test với giá trị Fstat của ya và yb là 2183.6 và 2396.4 tương ứng với các giá trị p–value gần bằng 0. Điều này khẳng định cả hai mô hình là rất phù hợp với thực nghiệm. Sau khi xác định và đánh giá các phương trình của mô hình thực nghiệm, thành phần của hỗn hợp được tìm bằng cách giải hệ phương trình như trình bày ở cách 1.
260
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
6.5. Mô hình đa mức thực nghiệm (Multilevel factorial design)
OF FI
Mô hình đa mức thực nghiệm là mô hình trong đó mỗi yếu tố được thực hiện ở nhiều mức khác nhau. Thiết kế thực nghiệm của mô hình giống như trong bài toán ANOVA nhiều yếu tố và được sử dụng trong nhiều tình huống khác nhau. Đặc biệt trong mô hình có yếu tố định tính, người ta thường không có lựa chọn nào khác ngoài việc tạo ra nhiều cấp độ có các giá trị khác nhau cho yếu tố đó. Ma trận thực nghiệm của mô hình không có đặc điểm riêng như mô hình có tâm hay mô hình hỗn hợp. Do đó, việc tính toán không theo những công thức chung mà được thực hiện theo phương pháp giải hệ phương trình ma trận theo công thức 6.7 và 6.8.
NH
ƠN
Các bước thực hiện thiết kế và phân tích thực nghiệm của mô hình đa mức thực nghiệm hoàn toàn giống với các mô hình đã trình bày trước đây. Để hiểu rõ hơn, sau đây ta thực hiện việc thiết kế và phân tích thực nghiệm bằng một ví dụ cụ thể (ví dụ 6.6).
Y
Ví dụ 6.6: Một nghiên cứu dư lượng một hoạt chất thuốc trừ sâu (y, mg/Kg) khi canh tác rau phụ thuộc vào hàm lượng thuốc trừ sâu (TTS) đã sử dụng và thời gian phun thuốc với mô hình đa mức thực nghiệm được cho kết quả như sau: Hàm lượng TTS
Thời gian
Dư lượng
(C, mg/kg)
(T, ngày)
Hàm (y)
32.622
0
32.622
QU
N
x0
1
2
1
62.816
0
62.816
1
91.523
0
91.523
1
32.622
7
3.545
M
1
5
KÈ
3
1
62.816
7
7.458
6
1
91.523
7
12.353
7
1
32.622
10
0.302
8
1
62.816
10
0.631
9
1
91.523
10
1.268
DẠ Y
4
Chương 6. Thiết kế và phân tích thực nghiệm
261
32.622
12
11
1
62.816
12
12
1
91.523
12
13
1
32.622
14
14
1
62.816
14
15
1
91.523
16
1
32.622
17
1
62.816
18
1
91.523
0.161
CI AL
1
0.414 0.761 0.015 0.087
OF FI
10
14
0.139
16
0.013
16
0.062
16
0.087
ƠN
– Tính toán và đánh giá phương trình bậc 2 của mô hình, biết độ lặp của của 5 lần thí nghiệm cho độ lệch chuẩn là 0.01.
NH
– Nếu dư lượng tối đa cho phép của hoạt chất thuốc trừ sâu nói trên là 0.05 mg/kg, nồng độ TTS sử dụng ban đầu là 32.622 mg/kg thì thời gian tối thiểu để thu hoạch an toàn sau khi phun thuốc là bao nhiêu? Giải:
Y
Cách 1: Giải hệ phương trình ma trận
QU
Tính hệ số của phương trình hồi quy Ma trận thực nghiệm đầy đủ với các yếu tố bậc hai có dạng như bảng sau: x0
1 3 4 5
DẠ Y
6 7 8 9
CT
C2
T2
y
32.622
0
0
1064.195
0
32.622
62.816
0
0
3945.85
0
62.816
91.523
0
0
8376.46
0
91.523
32.622
7
228.354
1064.195
49
3.545
1 1 1 1 1
62.816
7
439.712
3945.85
49
7.458
1 1 1 1
91.523
7
640.661
8376.46
49
12.353
32.622
10
326.22
1064.195
100
0.302
62.816
10
628.16
3945.85
100
0.631
91.523
10
915.23
8376.46
100
1.268
KÈ
2
T
C
M
N
262
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
12 13 14 15 16 17 18
32.622
12
391.464
1064.195
144
62.816
12
753.792
3945.85
144
0.414
91.523
12
1098.276
8376.46
144
0.761
32.622
14
456.708
1064.195
196
0.015
62.816
14
879.424
3945.85
196
0.087
91.523
14
1281.322
8376.46
196
0.139
32.622
16
521.952
1064.195
256
0.013
62.816
16
1005.056
3945.85
256
0.062
91.523
16
1464.368
8376.46
256
0.087
Tính toán hệ số của phương trình:
0.161
CI AL
11
1 1 1 1 1 1 1 1 1
OF FI
10
NH
Ma trận X T X:
ƠN
Theo công thức 6.7 ta có B = [X T X]−1 X T Y, để tính được ma trận B trước hết cần tính ma trận X T X và ma trận X T Y. Thực hiện các phép toán về phép nhân ma trận, phép tính ma trận nghịch đảo ta thu được kết quả như sau:
1121.77
177.00
11030.70
80319.03
2235.00
1121.77
80319.03
11030.70
789803.75
6295304.25
139285.95
177.00
11030.70
2235.00
139285.95
789803.75
29733.00
61903825.16
1852970.47
Y
18.00
QU
11030.70 789803.75 139285.95 9972945.68
80319.03 6295304.25 789803.75 61903825.16 521203896.47 9972945.68 2235.00
139285.95
29733.00
1852970.47
9972945.68
411267.00
M
Ma trận [X T X]−1 có dạng như sau: 5.5471271 –0.1614521 –0.1923124 0.0021428
0.0024796
–0.1614521 0.0055432 0.0021428 –3.438e–05 –4.124e–05
–3.334e–12
–0.1923124 0.0021428 0.0358956 –0.0002179 –9.920e–13
–0.0012939
0.0021428 –3.438e–05 –0.0002179 3.497e–06
8.408e–15
6.798e–22
0.0010847 –4.121e–05 –9.920e–13 8.408e–15
3.328e–07
2.691e–14
0.0024796 –3.334e–12 –0.0012939 6.798e–22
2.691e–14
8.250e–05
DẠ Y
KÈ
0.0010847
Ma trận X T Y có dạng như sau:
Chương 6. Thiết kế và phân tích thực nghiệm
263
CI AL
214.257 15398.619
207.500 15327.218 1210015.28 [ 1645.636 ] Vậy ma trận hệ số B thu được là: 11.92749 0.786804 −6.22932 B = [X T X]−1 X T Y = −0.06197 0.000154 [ 0.39854 ]
ƠN
Phương trình hồi quy có dạng:
OF FI
XT Y =
y = 11.927 + 0.787C – 6.229T – 0.062C*T + 0.00015C2 + 0.399T2 Đánh giá tính có nghĩa của các hệ số
NH
Sử dụng kiểm định Student để đánh giá các hệ số phương trình hồi quy với độ lệch chuẩn của sai số là 0.01. Các giá trị t tương ứng với các hệ số tính được như sau:
Y
tC = 78.68; tT = 622.9; tC*T = 6.19; t C2 = 0.02; t T2 = 39.85
QU
Ta thấy chỉ có t C2 < t(0.05, 4) = 2.78 nên hệ số bậc hai của nồng độ C không có ý nghĩa. Phương trình hồi quy còn lại là:
M
y = 11.927 +0.787C – 6.229T– 0.062C*T + 0.399T2 Đánh giá tình phù hợp của phương trình hồi quy y
ŷ
y − ŷ
1
32.622
37.595
–4.973
2
62.816
61.351
1.465
3
91.523
83.938
7.585
4
3.545
–0.634
4.179
5
7.458
10.024
–2.566
DẠ Y
KÈ
N
264
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
–7.805
12.353
20.158
7
0.302
–5.061
8
0.631
–0.017
9
1.268
4.779
10
0.161
–4.028
11
0.414
–2.725
3.139
12
0.761
–1.487
2.248
13
0.015
0.195
–0.180
14
0.087
–2.246
2.333
15
0.139
–4.566
4.705
16
0.013
7.605
–7.592
17
0.062
1.422
–1.360
18
0.087
Phương sai
650.580
5.363 0.648
–3.511
NH
ƠN
OF FI
4.189
2 𝑆𝑦 ̂ S2𝑦
–4.456
4.543
626.274
12.408
626.274
= 650.580 = 0.9626
Y
Hệ số tương quan R2 =
CI AL
6
QU
Để đánh giá sự phù hợp của phương trình hồi quy, thực hiện kiểm định F với giả thuyết: H0: bi = bij = bijk = ... = 0
M
Ha: ít nhất 1 hệ số khác 0 (đồng nghĩa với phương trình hồi quy là tin cậy).
KÈ
Fstat cho giả thuyết thống kê trên được tính theo hệ số tương quan R2: R2
Fstat = 1−R2 .
N−L−1 L
0.9626
= 1−0.9626 .
18−5−1 5
=61.84
DẠ Y
Fstat >> F(0.05,5,12) = 3.11, phương trình hồi quy là phù hợp với thực nghiệm. Tìm điều kiện tối ưu
Thay các giá trị y = 0.05; C = 32.622 mg/Kg vào phương trình hồi quy ta dễ dàng tìm được T = 13.93 ngày.
Chương 6. Thiết kế và phân tích thực nghiệm
265
CI AL
Vậy thời gian tối thiểu có thể thu hoạch loại rau trên an toàn là sau 14 ngày kể từ khi phun thuốc trừ sâu với hàm lượng 32.622 mg/Kg. Cách 2: Dùng phần mềm Statgraphics
Xác định phương trình hàm hồi quy và phân tích kết quả
ƠN
Nhập file dữ liệu theo hình dưới đây:
OF FI
Vì ma trận theo mô hình đa mức thực nghiệm không được thực hiện theo quy cách chuẩn, nên trước tiên ta phải nhập bản dữ liệu ma trận vào databook sau đó lưu dữ liệu dạng Statgraphics data file.
DẠ Y
KÈ
M
QU
Y
NH
Khai báo các cột yếu tố và hàm mục tiêu ta thu được bảng dữ liệu đã sẵn sàng cho phép phân tích mô hình như hình dưới đây:
266
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
Thực hiện phân tích thí nghiệm như các ví dụ trước đây, chọn tương tác bậc hai thu được các kết quả:
NH
ƠN
OF FI
Phương trình hồi quy
Các hệ số thu được hoàn toàn giống như cách giải hệ phương trình ma trận.
KÈ
M
QU
Y
Đánh giá các hệ số (phân tích ANOVA):
DẠ Y
Trong các hệ số của phương trình hồi quy chỉ có hệ số bậc hai ứng với nồng độ không có ý nghĩa. Sau khi loại bỏ hệ số này ta thu được phương trình hồi quy và độ tương quan mới:
Chương 6. Thiết kế và phân tích thực nghiệm
QU
Y
NH
ƠN
OF FI
CI AL
267
Kiểm tra tính phù hợp của mô hình: Từ hệ số tương quan thực hiện phép kiểm định F: N−L−1
M
R2
Fstat = 1−R2 .
L
0.9694
= 1−0.9694 .
18−5−1 5
= 76.03
KÈ
Fcrit = F(0.05,5,12) = 3.11. Vì Fstat >> Fcrit cho thấy mô hình hoàn toàn phù hợp với thực nghiệm. Tối ưu hóa
DẠ Y
Chọn điều kiện tối ưu tại một điểm y = 0.05, biến C cố định là 32.622 thu được kết quả như hình dưới đây:
268
ƠN
OF FI
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
NH
Kết quả thu được T cần tìm là 13.9075 ≈ 14. Kết luận sau 14 ngày có thể thu hoạch được sản phẩm.
QU
Y
Nhận xét: Sau khi loại bỏ yếu tố không phù hợp, phần mềm thực hiện tính toán lại từ đầu và không có sự tham gia của yếu tố bậc 2 của C. Do vậy, kết quả thu được về hệ số hồi quy và độ tương quan có sai khác chút ít so với cách 1. BÀI TẬP CHƯƠNG 6:
Bài 6.1: Một nghiên cứu trong phòng thí nghiệm về hiệu suất tạo isatin từ isonitrozoacetylamine với các yếu tố ảnh hưởng như sau:
DẠ Y
KÈ
M
Yếu tố Mức thấp Mức cao 93 87 A–nồng độ nguyên liệu thô (%): B– thời gian phản ứng (phút): 15 30 0 C– nhiệt độ phản ứng ( C): 60 70 Mỗi thực nghiệm được tiến hành lặp lại 02 lần cho kết quả như bảng sau bảng sau: N
A
B
C
y1
y2
1
–1
–1
–1
6.08
6.31
2
+1
–1
–1
6.04
6.09
Chương 6. Thiết kế và phân tích thực nghiệm
269
+1
–1
6.53
4
+1
+1
–1
6.43
5
–1
–1
+1
6.79
6
+1
–1
+1
6.68
7
–1
+1
+1
6.73
8
+1
+1
+1
6.12
CI AL
–1
OF FI
3
6.08
6.36 6.77 6.38 6.49 6.23
a) Tính toán và đánh giá tính phù hợp của phương trình thu được. b) Xác định điều kiện để hiệu suất phản ứng lớn nhất.
1
–1
2
+1
3
–1
4
+1
5
–1
D
y
–1
–1
–1
378
–1
–1
–1
416
+1
–1
–1
381
+1
–1
–1
448
–1
+1
–1
372
+1
–1
+1
–1
390
–1
+1
+1
–1
385
+1
+1
+1
–1
430
–1
–1
–1
+1
380
+1
–1
–1
+1
415
–1
+1
–1
+1
371
12
+1
+1
–1
+1
446
13
–1
–1
+1
+1
378
14
+1
–1
+1
+1
392
15
–1
+1
+1
+1
376
16
+1
+1
+1
+1
429
6 7 8
DẠ Y
KÈ
11
M
9 10
B
NH
C
Y
A
QU
N
ƠN
Bài 6.2: Nghiên cứu độ dày của vật liệu bán dẫn phụ thuộc vào 4 yếu tố trong quá trình nung oxi hóa sản phẩm: nhiệt độ (A), thời gian (B), áp suất (C) và tốc độ dòng khí (C). Ma trận thực nghiệm được như ở bảng sau:
a) Tính toán và đánh giá tính phù hợp của phương trình thu được biết phương sai tái lặp là 12 (n=5).
270
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
CI AL
b) Xác định điều kiện để độ dày lớp vật liệu bán dẫn lớn nhất.
x1
x2
x3
1
60
16
0.8
2
100
16
0.8
OF FI
3
60
24
4
100
24
5
60
16
6
100
7
60
8
100
NH
9
80
10 11
y
80
44
120
70
0.8
120
39
0.8
80
98
1.6
120
11
16
1.6
80
65
24
1.6
80
51
24
1.6
120
77
20
1.2
100
56
80
20
1.2
100
58
80
20
1.2
100
57
Y
x4
ƠN
STT
QU
Bài 6.3: Tiến hành phản ứng phân hủy KClO3. Khảo sát hiệu suất phân hủy KClO3 dựa theo mô hình hóa thực nhiệm bậc 1 rút gọn 24–1 với hệ thức phát sinh x4 = x1x2x3. Các yếu tố ảnh hưởng tới hiệu suất phân hủy như sau: x1 – thời gian phản ứng (giây); x2 – khối lượng ban đầu của KClO3 (g); x3 – khối lượng xúc tác MnO2 (g); x4 – nhiệt độ (oC). Mô hình hóa sự tiến hành thí nghiệm thu được kết quả sau:
a) Tìm phương trình hồi quy mô tả thực nghiệm trên với P = 99%.
M
b) Đánh giá tính phù hợp của phương trình thu được.
DẠ Y
KÈ
Bài 6.4: Độ nhớt động học (y, P) của một hỗn hợp nhiên liệu dùng cho tên lửa được nghiên cứu dưới sự ảnh hưởng của tốc độ khuấy trộn (x1, phút–1) và thời gian khuấy trộn (x2, phút) theo mô hình bậc hai tâm xoay với các điều kiện thực nghiệm như sau: Yếu tố
V khuấy
(phút–1)
T khuấy (phút)
Mức thực nghiệm
Ký hiệu
–1.414
–1
0
+1
1.414
x1
37.72
40.00
60.00
80.00
88.28
x2
11.02
40.00
110.00
180.00
208.98
Chương 6. Thiết kế và phân tích thực nghiệm
271
CI AL
Kết quả thực nghiệm thu được như bảng: n
x1
x2
y
1
1
1
2
–1
1
3
1
–1
4
–1
–1
5
1.414
0
6
–1.414
0
7
0
1.414
800.0
8
0
1.414
571.2
9
0
0
528.0
10
0
0
540.8
11
0
0
520.0
12
0
0
531.2
13
0
0
524.8
499.2 640.0
OF FI
635.2 736.0 688.0
Y
NH
ƠN
483.2
QU
Phân tích kết quả thực nghiệm và xác định điều kiện để độ nhớt động học của hỗn hợp nhiên liệu là thấp nhất.
M
Bài 6.5: Để nghiên cứu các yếu tố ảnh hưởng đến độ chuyển hóa (y) và khối lượng phân tử trung bình (y’) của polyacrylic, phản ứng trùng hợp acid acrylic được tiến hành với các điều kiện như sau:
KÈ
Yếu tố
Ký hiệu
Mức thực nghiệm –1.414
–1
0
+1
1.414
x1
60
65
77.5
90
95
Thời gian (phút)
x2
5
25
72.5
120
140
Hàm lượng xúc tác (amoni pesulfat)
x3
0.43
0.6
1.0
1.4
1.57
DẠ Y
Nhiệt độ (oC)
Ma trận thực nghiệm bậc hai tâm trực giao được tiến hành và cho kết quả như bảng dưới đây:
272
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
–1
2
1
3
–1
4
1
5
–1
6
1
7
–1
8
1
9
–1.414
10
+1.414
11
0
12
0
13
0
14
0
15
0
x3
y
–1
–1
0.515
5.2
–1
–1
0.683
2.2
1
–1
0.795
4.9
1
–1
0.883
2.4
–1
1
–1
1
1
1
1
1
0
0
0
CI AL
1
y’
x2
OF FI
x1
0.764
4.1
0.936
2.4
0.951
3.1
0.993
2.7
0.871
5.2
ƠN
N
0
0.971
2.9
0
0.746
3.7
0
0.991
3.2
0
–1.414
0.792
3.5
0
+1.414
0.984
2.7
0
0
0.962
3.4
–1.414
NH
+1.414
QU
Y
Phân tích kết quả thực nghiệm và xác định điều kiện để cả hai giá trị hàm mục tiêu đạt giá trị lớn nhất.
M
Bài 6.6: Hiệu suất của một phản ứng tổng hợp được khảo sát dưới sự ảnh hưởng của yếu tố nhiệt độ phản ứng (x1, oC), nồng độ chất tham gia (x2, %) và thời gian phản ứng (x3, giờ) theo mô hình bậc hai tâm trực giao với các điều kiện thực nghiệm như sau:
KÈ
Yếu tố
Ký hiệu
Mức thực nghiệm –1
0
+1
x1
142
147
152
C (%)
x2
35
37.5
40
Thời gian
x3
7
0,5
10
DẠ Y
t oC
Chương 6. Thiết kế và phân tích thực nghiệm
273
x1
x1
1
–1
–1
–1
2
–1
–1
1
3
–1
1
–1
4
–1
1
1
5
1
–1
6
1
–1
7
1
1
8
1
1
9
1.215
10
–1.215
11
0
12
0
13
0
14
0
15
0
55.9 63.3 67.5 68.8 70.6
1
68.0
–1
68.6
1
62.4
0
0
65.4
0
0
56.9
1.215
0
67.5
–1.215
0
65.0
0
1.215
68.9
0
–1.215
60.3
0
0
66.9
NH
ƠN
–1
QU
Y
y
CI AL
x1
OF FI
N
Phân tích kết quả thực nghiệm và xác định điều kiện để hiệu suất phản ứng là cao nhất.
KÈ
M
Bài 6.7: Nghiên cứu hoạt tính (y) và độ bền (y’) của một loại xúc tác ở phản ứng có nhiệt độ 350 oC phụ thuộc vào 3 thành phần của xúc tác đó. Thực nghiệm được thiết kế dựa theo mô hình hóa thực nhiệm hỗn hợp với các yếu tố như sau: x1: thành phần của Pt/Al2O3 x2: thành phần của các oxit kim loại nhóm II
DẠ Y
x3: thành phần của các oxit kim loại nhóm III Với x1 + x2 + x3 = 1 Kết quả thực nghiệm theo mô hình được thể hiện trong bảng sau:
274
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
x2
x3
y(%)
1
1
0
0
97.4
2
0
1
0
3.0
3
0
0
1
4.7
4
1/2
1/2
0
70.0
5
1/2
0
1/2
6
0
1/2
1/2
7
1/3
1/3
1/3
y’(%)
CI AL
x1
OF FI
N
62 73 47 64
66.0
55
6.8
72
95.4
67
ƠN
Hai thí nghiệm kiểm soát được thực hiện tại tọa độ (0.58, 0.32, 0) thu được giá trị thực nghiệm đối với y và y’ là 91 và 62, tương ứng với độ lệch chuẩn là 3.21 và 2.4 của 03 lần thí nghiệm lặp (m = 3).
NH
a) Xác định phương trình hàm hồi quy và đánh giá tính phù hợp đối với hai hàm mục tiêu trên. b) Tìm điều kiện để hoạt tính là lớn nhất với độ bền đạt 65%
Y
Bài 6.8: Ứng dụng thiết kế và phân tích thực nghiệm xác định điều kiện tối ưu thu hồi phân đoạn diezen bằng quá trình crackinh dầu thải. Các yếu tố ảnh hưởng của của mô hình thực nghiệm được khảo sát như sau:
QU
x1: nhiệt độ 400 ÷ 480 oC
x2: thời gian phản ứng: 15 ÷ 60 phút x3: tỉ lệ nguyên liệu/xúc tác: 5 ÷ 10
M
x4: áp suất: 1,5 ÷ 2,5 atm
KÈ
Phân tích kết quả của mô hình và tìm điều kiện để giá trị hàm y là lớn nhất. x1
x2
x3
x4
y
1
400
15
5
1.5
44
2
480
15
5
2.5
70
3
400
60
5
2.5
39
4
480
60
5
1.5
98
DẠ Y
STT
Phụ lục
275 15
10
2.5
6
480
15
10
1.5
7
400
60
10
1.5
8
480
60
10
2.5
9
440
37.5
7.5
2
10
440
37.5
7.5
11
440
37.5
7.5
Tài liệu tham khảo
11
CI AL
400
OF FI
5
65 51 77 79
2
75
2
70
Douglas C. Montgomery, Design and Analysis of Experiments, 10th Edition, Johnwiley & Sons. Inc, (2019).
2.
James N. Miller, Jane C. Miller, Robert D. Miller, Statistics and Chemometrics for Analytical Chemistry, 7th Edition, Pearson Education Limited, (2018).
3.
Lê Đức Ngọc, Vũ Thị Quyên. Nhập môn Xử lý số liệu và kế hoạch hóa thực nghiệm Hóa học. NXB ĐHQG Hà Nội, (2017).
4.
Zivorad R. Lazic, Design of Experiments in Chemical Engineering: A Practical Guide, WILEY–VCH Verlag GmbH & Co., (2004).
5.
Dinh-Vu Le, Van-Nhan Truong, A validated method for investigation of the effect of time and treating concentration on the pesticide residues in mustard–based on the multilevel factorial model and GC– MS/MS . Rasayan Journal of Chemistry, Vol.14, No.3, (2021).
6.
M. Khayet, Abu Zahrim Yaser, Nidal Hilal. Modelling and optimization of coagulation of highly concentrated industrial grade leather dye by response surface methodology. Chemical Engineering Journal Vol. 167, No. 1, pp. 77–83, (2011).
7.
Phần mềm tính toán ma trận online: https://matrixcalc.org
DẠ Y
KÈ
M
QU
Y
NH
ƠN
1.
276
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
Bảng A1: Giá trị hằng số Student theo phân phối hai phía t = t(α,f) two-tailed α
0.4
0.25
0.1
0.05
0.025
0.01
1.376
2.414
6.314
12.706
25.452
63.657
2
1.061
1.604
2.920
4.303
6.205
3
0.978
1.423
2.353
3.182
4.177
4
0.941
1.344
2.132
2.776
3.495
5
0.920
1.301
2.015
2.571
3.163
6
0.906
1.273
1.943
2.447
2.969
7
0.896
1.254
1.895
2.365
2.841
8
0.889
1.240
1.860
2.306
9
0.883
1.230
1.833
2.262
10
0.879
1.221
1.812
11
0.876
1.214
1.796
12
0.873
1.209
1.782
13
0.870
1.204
1.771
14
0.868
1.200
1.761
15
0.866
1.197
1.753
16
0.865
1.194
1.746
17
0.863
1.191
1.740
18
0.862
1.189
19
0.861
20 21
0.005
0.003
127.321 212.205 14.089
18.216
5.841
7.453
8.891
4.604
5.598
6.435
4.032
4.773
5.376
3.707
4.317
4.800
3.499
4.029
4.442
2.752
3.355
3.833
4.199
2.685
3.250
3.690
4.024
2.228
2.634
3.169
3.581
3.892
2.201
2.593
3.106
3.497
3.789
2.179
2.560
3.055
3.428
3.706
2.160
2.533
3.012
3.372
3.639
2.145
2.510
2.977
3.326
3.583
2.131
2.490
2.947
3.286
3.535
2.120
2.473
2.921
3.252
3.494
2.110
2.458
2.898
3.222
3.459
1.734
2.101
2.445
2.878
3.197
3.428
1.187
1.729
2.093
2.433
2.861
3.174
3.401
0.860
1.185
1.725
2.086
2.423
2.845
3.153
3.376
0.859
1.183
1.721
2.080
2.414
2.831
3.135
3.355
22
0.858
1.182
1.717
2.074
2.405
2.819
3.119
3.335
23
0.858
1.180
1.714
2.069
2.398
2.807
3.104
3.318
0.857
1.179
1.711
2.064
2.391
2.797
3.091
3.302
0.856
1.178
1.708
2.060
2.385
2.787
3.078
3.287
0.856
1.177
1.706
2.056
2.379
2.779
3.067
3.274
27
0.855
1.176
1.703
2.052
2.373
2.771
3.057
3.261
28
0.855
1.175
1.701
2.048
2.368
2.763
3.047
3.250
29
0.854
1.174
1.699
2.045
2.364
2.756
3.038
3.239
30
0.854
1.173
1.697
2.042
2.360
2.750
3.030
3.230
25
NH
QU
M
DẠ Y
26
KÈ
24
ƠN
9.925
Y
OF FI
f 1
CI AL
PHỤ LỤC
Phụ lục
277
t = t(α,f) upper-tailed α
0.4
0.25
0.1
0.05
0.025
0.01
0.325
1.000
3.078
6.314
12.706
31.821
2
0.289
0.816
1.886
2.920
4.303
6.965
3
0.277
0.765
1.638
2.353
3.182
4.541
4
0.271
0.741
1.533
2.132
2.776
5
0.267
0.727
1.476
2.015
2.571
6
0.265
0.718
1.440
1.943
2.447
7
0.263
0.711
1.415
1.895
2.365
8
0.262
0.706
1.397
1.860
2.306
9
0.261
0.703
1.383
1.833
2.262
10
0.260
0.700
1.372
1.812
11
0.260
0.697
1.363
12
0.259
0.695
1.356
13
0.259
0.694
1.350
14
0.258
0.692
1.345
15
0.258
0.691
1.341
16
0.258
0.690
1.337
17
0.257
0.689
18
0.257
0.688
19
0.257
0.688
20
0.257
0.687
21
0.257
22
0.005
0.003
63.657
106.100
9.925
12.852 6.994
4.604
5.321
3.365
4.032
4.570
3.143
3.707
4.152
2.998
3.499
3.887
2.896
3.355
3.705
2.821
3.250
3.573
2.228
2.764
3.169
3.472
1.796
2.201
2.718
3.106
3.393
1.782
2.179
2.681
3.055
3.330
1.771
2.160
2.650
3.012
3.278
1.761
2.145
2.624
2.977
3.234
1.753
2.131
2.602
2.947
3.197
1.746
2.120
2.583
2.921
3.165
1.333
1.740
2.110
2.567
2.898
3.138
1.330
1.734
2.101
2.552
2.878
3.113
1.328
1.729
2.093
2.539
2.861
3.092
1.325
1.725
2.086
2.528
2.845
3.073
0.686
1.323
1.721
2.080
2.518
2.831
3.056
0.256
0.686
1.321
1.717
2.074
2.508
2.819
3.041
23
0.256
0.685
1.319
1.714
2.069
2.500
2.807
3.027
24
0.256
0.685
1.318
1.711
2.064
2.492
2.797
3.014
26 27
ƠN
Y
QU
M
0.256
0.684
1.316
1.708
2.060
2.485
2.787
3.003
0.256
0.684
1.315
1.706
2.056
2.479
2.779
2.992
0.256
0.684
1.314
1.703
2.052
2.473
2.771
2.982
0.256
0.683
1.313
1.701
2.048
2.467
2.763
2.973
DẠ Y
28
KÈ
25
OF FI
5.841
3.747
NH
f 1
CI AL
Bảng A2: Giá trị hằng số Student theo phân phối phía phải
29
0.256
0.683
1.311
1.699
2.045
2.462
2.756
2.965
30
0.256
0.683
1.310
1.697
2.042
2.457
2.750
2.957
278
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
f 1
0.4
0.25
0.1
0.05
0.025
0.01
-0.325
-1.000
-3.078
-6.314
-12.706
-31.821
-63.657 -106.100
2
-0.289
-0.816
-1.886
-2.920
-4.303
-6.965
-9.925
-12.852
3
-0.277
-0.765
-1.638
-2.353
-3.182
-4.541
-5.841
-6.994
CI AL
4
-0.271
-0.741
-1.533
-2.132
-2.776
-3.747
-4.604
-5.321
5
-0.267
-0.727
-1.476
-2.015
-2.571
-3.365
-4.032
-4.570
6
-0.265
-0.718
-1.440
-1.943
-2.447
-3.143
-3.707
-4.152
7
-0.263
-0.711
-1.415
-1.895
-2.365
-2.998
-3.499
-3.887
8
-0.262
-0.706
-1.397
-1.860
-2.306
-2.896
-3.355
-3.705
9
-0.261
-0.703
-1.383
-1.833
-2.262
-2.821
-3.250
-3.573
10
-0.260
-0.700
-1.372
-1.812
-2.228
-2.764
-3.169
-3.472
11
-0.260
-0.697
-1.363
-1.796
-2.201
-2.718
-3.106
-3.393
12
-0.259
-0.695
-1.356
-1.782
-2.179
-2.681
-3.055
-3.330
13
-0.259
-0.694
-1.350
-1.771
-2.160
-3.012
-3.278
14
-0.258
-0.692
-1.345
-1.761
-2.145
-2.624
-2.977
-3.234
15
-0.258
-0.691
-1.341
-1.753
-2.131
-2.602
-2.947
-3.197
16
-0.258
-0.690
-1.337
NH
-2.650
-1.746
-2.120
-2.583
-2.921
-3.165
17
-0.257
-0.689
-1.333
-1.740
-2.110
-2.567
-2.898
-3.138
18
-0.257
-0.688
-1.330
-1.734
-2.101
-2.552
-2.878
-3.113
19
-0.257
-0.688
-1.328
-1.729
-2.093
-2.539
-2.861
-3.092
20
-0.257
-0.687
-1.325
-1.725
-2.086
-2.528
-2.845
-3.073
21
-0.257
-0.686
-1.323
-1.721
-2.080
-2.518
-2.831
-3.056
22
-0.256
QU
Bảng A3: Giá trị hằng số Student theo phân phối phía trái
-0.686
-1.321
-1.717
-2.074
-2.508
-2.819
-3.041
23
-0.256
-0.685
-1.319
-1.714
-2.069
-2.500
-2.807
-3.027
24
-0.256
-0.685
-1.318
-1.711
-2.064
-2.492
-2.797
-3.014
25 26 27
OF FI
ƠN
Y
0.005
0.003
-0.256
-0.684
-1.316
-1.708
-2.060
-2.485
-2.787
-3.003
-0.256
-0.684
-1.315
-1.706
-2.056
-2.479
-2.779
-2.992
-0.256
-0.684
-1.314
-1.703
-2.052
-2.473
-2.771
-2.982
-0.256
-0.683
-1.313
-1.701
-2.048
-2.467
-2.763
-2.973
DẠ Y
28
KÈ
α
M
t = t(α,f) lower-tailed
29
-0.256
-0.683
-1.311
-1.699
-2.045
-2.462
-2.756
-2.965
30
-0.256
-0.683
-1.310
-1.697
-2.042
-2.457
-2.750
-2.957
Phụ lục
279
F = F(0.05,f1,f2) f1
1
2
3
4
5
6
7
8
CI AL
Bảng A4: Giá trị hằng số Fisher với α = 0.05 (P = 95%) 9
10
f2 1
161.448 199.500 215.707 224.583 230.162 233.986 236.768 238.883 240.543 241.882
2
18.513 19.000 19.164 19.247 19.296 19.330 19.353 19.371 19.385 19.396
3
10.128
9.552
9.277
9.117
9.013
8.941
4
7.709
6.944
6.591
6.388
6.256
6.163
5
6.608
5.786
5.409
5.192
5.050
4.950
6
5.987
5.143
4.757
4.534
4.387
4.284
7
5.591
4.737
4.347
4.120
3.972
3.866
8
5.318
4.459
4.066
3.838
3.687
3.581
9
5.117
4.256
3.863
3.633
3.482
3.374
10
4.965
4.103
3.708
3.478
3.326
3.217
11
4.844
3.982
3.587
3.357
3.204
3.095
3.012
12
4.747
3.885
3.490
3.259
3.106
2.996
13
4.667
3.806
3.411
3.179
3.025
2.915
14
4.600
3.739
3.344
3.112
2.958
2.848
15
4.543
3.682
3.287
3.056
2.901
16
4.494
3.634
3.239
3.007
2.852
17
4.451
3.592
3.197
2.965
18
4.414
3.555
3.160
19
4.381
3.522
3.127
20
4.351
3.493
3.098
21
4.325
3.467
3.072
2.840
22
4.301
3.443
3.049
23
4.279
3.422
24
4.260
3.403
25
4.242
3.385
26
4.225
27
4.210
29
OF FI
8.812
8.786
5.999
5.964
4.818
4.772
4.735
4.207
4.147
4.099
4.060
3.787
3.726
3.677
3.637
3.500
3.438
3.388
3.347
3.293
3.230
3.179
3.137
3.135
3.072
3.020
2.978
2.948
2.896
2.854
2.913
2.849
2.796
2.753
2.832
2.767
2.714
2.671
2.764
2.699
2.646
2.602
2.790
2.707
2.641
2.588
2.544
2.741
2.657
2.591
2.538
2.494
2.810
2.699
2.614
2.548
2.494
2.450
2.928
2.773
2.661
2.577
2.510
2.456
2.412
2.895
2.740
2.628
2.544
2.477
2.423
2.378
2.866
2.711
2.599
2.514
2.447
2.393
2.348
2.685
2.573
2.488
2.420
2.366
2.321
2.817
2.661
2.549
2.464
2.397
2.342
2.297
3.028
2.796
2.640
2.528
2.442
2.375
2.320
2.275
3.009
2.776
2.621
2.508
2.423
2.355
2.300
2.255
2.991
2.759
2.603
2.490
2.405
2.337
2.282
2.236
3.369
2.975
2.743
2.587
2.474
2.388
2.321
2.265
2.220
3.354
2.960
2.728
2.572
2.459
2.373
2.305
2.250
2.204
NH
Y
QU
M
ƠN
6.041
4.876
4.196
3.340
2.947
2.714
2.558
2.445
2.359
2.291
2.236
2.190
4.183
3.328
2.934
2.701
2.545
2.432
2.346
2.278
2.223
2.177
4.171
3.316
2.922
2.690
2.534
2.421
2.334
2.266
2.211
2.165
DẠ Y
30
8.845
6.094
KÈ
28
8.887
280
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
F = F(0.05,f1,f2) f1
11
12
13
14
15
16
17
CI AL
Bảng A4: Giá trị hằng số Fisher với α = 0.05 (P = 95%)
18
19
20
f2 1
242.983 243.906 244.690 245.364 245.950 246.464 246.918 247.323 247.686 248.013
2
19.405 19.413 19.419 19.424 19.429 19.433 19.437 19.440 19.443 19.446
3
8.763
8.745
8.729
8.715
8.703
8.692
4
5.936
5.912
5.891
5.873
5.858
5.844
5
4.704
4.678
4.655
4.636
4.619
4.604
6
4.027
4.000
3.976
3.956
3.938
3.922
7
3.603
3.575
3.550
3.529
3.511
3.494
8
3.313
3.284
3.259
3.237
3.218
3.202
8.675
8.667
OF FI
8.683
8.660
5.821
5.811
5.803
4.590
4.579
4.568
4.558
3.908
3.896
3.884
3.874
3.480
3.467
3.455
3.445
3.187
3.173
3.161
3.150
3.102
3.073
3.048
3.025
3.006
2.989
2.974
2.960
2.948
2.936
2.943
2.913
2.887
2.865
2.845
2.828
2.812
2.798
2.785
2.774
11
2.818
2.788
2.761
2.739
2.719
2.701
2.685
2.671
2.658
2.646
12
2.717
2.687
2.660
2.637
2.617
2.599
2.583
2.568
2.555
2.544
13
2.635
2.604
2.577
2.554
2.533
2.515
2.499
2.484
2.471
2.459
14
2.565
2.534
2.507
2.484
2.463
2.445
2.428
2.413
2.400
2.388
15
2.507
2.475
2.448
2.424
2.403
2.385
2.368
2.353
2.340
2.328
16
2.456
2.425
2.397
2.373
2.352
2.333
2.317
2.302
2.288
2.276
17
2.413
2.381
2.353
2.329
2.308
2.289
2.272
2.257
2.243
2.230
18
2.374
2.342
2.314
2.290
2.269
19
2.340
2.308
2.280
20
2.310
2.278
2.250
21
2.283
2.250
2.222
22
2.259
2.226
23
2.236
2.204
24
2.216
2.183
25
2.198
26
2.181
27
2.166
28 29 30
2.233
2.217
2.203
2.191
2.256
2.234
2.215
2.198
2.182
2.168
2.155
2.225
2.203
2.184
2.167
2.151
2.137
2.124
2.197
2.176
2.156
2.139
2.123
2.109
2.096
2.198
2.173
2.151
2.131
2.114
2.098
2.084
2.071
2.175
2.150
2.128
2.109
2.091
2.075
2.061
2.048
2.155
QU
2.250
Y
NH
ƠN
9 10
M
5.832
2.108
2.088
2.070
2.054
2.040
2.027
2.136
2.111
2.089
2.069
2.051
2.035
2.021
2.007
2.148
2.119
2.094
2.072
2.052
2.034
2.018
2.003
1.990
2.132
2.103
2.078
2.056
2.036
2.018
2.002
1.987
1.974
2.151
2.118
2.089
2.064
2.041
2.021
2.003
1.987
1.972
1.959
2.138
2.104
2.075
2.050
2.027
2.007
1.989
1.973
1.958
1.945
2.126
2.092
2.063
2.037
2.015
1.995
1.976
1.960
1.945
1.932
DẠ Y
KÈ
2.130
2.165
Phụ lục
281
F = F(α,f1,f2) f1
21
22
23
24
25
26
27
CI AL
Bảng A4: Giá trị hằng số Fisher với α = 0.05 (P = 95%)
28
29
30
f2 1
248.309 248.579 248.826 249.052 249.260 249.453 249.631 249.797 249.951 250.095
2
19.448 19.450 19.452 19.454 19.456 19.457 19.459 19.460 19.461 19.462
3
8.654
8.648
8.643
8.639
8.634
8.630
4
5.795
5.787
5.781
5.774
5.769
5.763
5
4.549
4.541
4.534
4.527
4.521
4.515
6
3.865
3.856
3.849
3.841
3.835
3.829
7
3.435
3.426
3.418
3.410
3.404
3.397
8
3.140
3.131
3.123
3.115
3.108
3.102
8.623
8.620
8.617
5.759
5.754
5.750
5.746
4.510
4.505
4.500
4.496
3.823
3.818
3.813
3.808
3.391
3.386
3.381
3.376
3.095
3.090
3.084
3.079
OF FI
8.626
2.926
2.917
2.908
2.900
2.893
2.886
2.880
2.874
2.869
2.864
2.764
2.754
2.745
2.737
2.730
2.723
2.716
2.710
2.705
2.700
11
2.636
2.626
2.617
2.609
2.601
2.594
2.588
2.582
2.576
2.570
12
2.533
2.523
2.514
2.505
2.498
2.491
2.484
2.478
2.472
2.466
13
2.448
2.438
2.429
2.420
2.412
2.405
2.398
2.392
2.386
2.380
14
2.377
2.367
2.357
2.349
2.341
2.333
2.326
2.320
2.314
2.308
15
2.316
2.306
2.297
2.288
2.280
2.272
2.265
2.259
2.253
2.247
16
2.264
2.254
2.244
2.235
2.227
2.220
2.212
2.206
2.200
2.194
17
2.219
2.208
2.199
2.190
2.181
2.174
2.167
2.160
2.154
2.148
18
2.179
2.168
2.159
2.150
2.141
2.134
2.126
2.119
2.113
2.107
19
2.144
2.133
2.123
2.114
2.106
2.098
2.090
2.084
2.077
2.071
20
2.112
2.102
21
2.084
2.073
22
2.059
2.048
23
2.036
2.025
24
2.015
2.003
25
1.995
26
1.978
27
1.961
28 29 30
QU
Y
NH
ƠN
9 10
2.082
2.074
2.066
2.059
2.052
2.045
2.039
2.063
2.054
2.045
2.037
2.030
2.023
2.016
2.010
2.038
2.028
2.020
2.012
2.004
1.997
1.990
1.984
2.014
2.005
1.996
1.988
1.981
1.973
1.967
1.961
1.993
1.984
1.975
1.967
1.959
1.952
1.945
1.939
1.984
1.974
1.964
1.955
1.947
1.939
1.932
1.926
1.919
1.966
1.956
1.946
1.938
1.929
1.921
1.914
1.907
1.901
1.950
1.940
1.930
1.921
1.913
1.905
1.898
1.891
1.884
1.946
1.935
1.924
1.915
1.906
1.897
1.889
1.882
1.875
1.869
1.932
1.921
1.910
1.901
1.891
1.883
1.875
1.868
1.861
1.854
1.919
1.908
1.897
1.887
1.878
1.870
1.862
1.854
1.847
1.841
DẠ Y
KÈ
M
2.092
282
Bảng A5: Giá trị hằng số Fisher với α = 0.01 (P = 99%) F = F(α,f1,f2) f1 f2 1
1
2
3
4
5
6
7
CI AL
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
8
9
10
4052.181 4999.500 5403.352 5624.583 5763.650 5858.986 5928.356 5981.070 6022.473 6055.847 98.503
99.000
99.166
99.249
99.299
99.333
99.356
99.374
99.388
99.399
3
34.116
30.817
29.457
28.710
28.237
27.911
27.672
27.489
27.345
27.229
4
21.198
18.000
16.694
15.977
15.522
15.207
14.976
14.799
14.659
14.546
5
16.258
13.274
12.060
11.392
10.967
10.672
10.456
10.289
10.158
10.051
6
13.745
10.925
9.780
9.148
8.746
8.466
8.260
8.102
7.976
7.874
7
12.246
9.547
8.451
7.847
7.460
7.191
6.993
6.840
6.719
6.620
8
11.259
8.649
7.591
7.006
6.632
6.371
6.178
6.029
5.911
5.814
9
10.561
8.022
6.992
6.422
6.057
5.802
5.613
5.467
5.351
5.257
10
10.044
7.559
6.552
5.994
5.636
5.386
5.200
5.057
4.942
4.849
11
9.646
7.206
6.217
5.668
5.316
5.069
4.886
4.744
4.632
4.539
12
9.330
6.927
5.953
5.412
5.064
4.821
4.640
4.499
4.388
4.296
13
9.074
6.701
5.739
5.205
4.862
4.620
4.441
4.302
4.191
4.100
14
8.862
6.515
5.564
5.035
4.695
4.456
4.278
4.140
4.030
3.939
15
8.683
6.359
5.417
4.893
4.556
4.318
4.142
4.004
3.895
3.805
16
8.531
6.226
5.292
4.773
4.437
4.202
4.026
3.890
3.780
3.691
17
8.400
6.112
5.185
4.669
4.336
4.102
3.927
3.791
3.682
3.593
18
8.285
6.013
5.092
4.579
4.248
4.015
3.841
3.705
3.597
3.508
19
8.185
5.926
5.010
4.500
4.171
3.939
3.765
3.631
3.523
3.434
20
8.096
5.849
4.938
4.431
4.103
3.871
3.699
3.564
3.457
3.368
21
8.017
5.780
22
7.945
5.719
23
7.881
5.664
24
7.823
5.614
25
7.770
5.568
26
7.721
27
7.677
28
7.636
29
7.598
30
7.562
ƠN
NH
Y
QU 4.874
4.369
4.042
3.812
3.640
3.506
3.398
3.310
4.817
4.313
3.988
3.758
3.587
3.453
3.346
3.258
4.765
4.264
3.939
3.710
3.539
3.406
3.299
3.211
4.718
4.218
3.895
3.667
3.496
3.363
3.256
3.168
4.675
3.855
3.627
3.457
3.324
3.217
3.129
4.637
4.140
3.818
3.591
3.421
3.288
3.182
3.094
5.488
4.601
4.106
3.785
3.558
3.388
3.256
3.149
3.062
5.453
4.568
4.074
3.754
3.528
3.358
3.226
3.120
3.032
5.420
4.538
4.045
3.725
3.499
3.330
3.198
3.092
3.005
5.390
4.510
4.018
3.699
3.473
3.304
3.173
3.067
2.979
M
4.177
5.526
KÈ
DẠ Y
OF FI
2
Phụ lục
283
F = F(α,f1,f2) f1 f2 1
11
12
13
14
15
16
17
CI AL
Bảng A5: Giá trị hằng số Fisher với α = 0.01 (P = 99%) 18
19
20
6083.317 6106.321 6125.865 6142.674 6157.285 6170.101 6181.435 6191.529 6200.576 6208.730 99.408
99.416
99.422
99.428
99.433
99.437
99.440
99.444
99.447
99.449
3
27.133
27.052
26.983
26.924
26.872
26.827
26.787
26.751
26.719
26.690
4
14.452
14.374
14.307
14.249
14.198
14.154
5
9.963
9.888
9.825
9.770
9.722
9.680
6
7.790
7.718
7.657
7.605
7.559
7.519
7
6.538
6.469
6.410
6.359
6.314
6.275
8
5.734
5.667
5.609
5.559
5.515
5.477
OF FI
2
14.080
14.048
14.020
9.643
9.610
9.580
9.553
7.483
7.451
7.422
7.396
6.240
6.209
6.181
6.155
5.442
5.412
5.384
5.359
5.178
5.111
5.055
5.005
4.962
4.924
4.890
4.860
4.833
4.808
4.772
4.706
4.650
4.601
4.558
4.520
4.487
4.457
4.430
4.405
11
4.462
4.397
4.342
4.293
4.251
4.213
4.180
4.150
4.123
4.099
12
4.220
4.155
4.100
4.052
4.010
3.972
3.939
3.909
3.883
3.858
13
4.025
3.960
3.905
3.857
3.815
3.778
3.745
3.716
3.689
3.665
14
3.864
3.800
3.745
3.698
3.656
3.619
3.586
3.556
3.529
3.505
15
3.730
3.666
3.612
3.564
3.522
3.485
3.452
3.423
3.396
3.372
16
3.616
3.553
3.498
3.451
3.409
3.372
3.339
3.310
3.283
3.259
17
3.519
3.455
3.401
3.353
3.312
3.275
3.242
3.212
3.186
3.162
18
3.434
3.371
3.316
3.269
3.227
3.190
3.158
3.128
3.101
3.077
19
3.360
3.297
3.242
3.195
3.153
3.116
3.084
3.054
3.027
3.003
20
3.294
3.231
21
3.236
3.173
22
3.184
3.121
23
3.137
3.074
24
3.094
3.032
25
3.056
26
3.021
27 28
QU
Y
NH
ƠN
9 10
M
14.115
3.130
3.088
3.051
3.018
2.989
2.962
2.938
3.119
3.072
3.030
2.993
2.960
2.931
2.904
2.880
3.067
3.019
2.978
2.941
2.908
2.879
2.852
2.827
3.020
2.973
2.931
2.894
2.861
2.832
2.805
2.781
2.977
2.930
2.889
2.852
2.819
2.789
2.762
2.738
2.993
2.939
2.892
2.850
2.813
2.780
2.751
2.724
2.699
2.958
2.904
2.857
2.815
2.778
2.745
2.715
2.688
2.664
2.988
2.926
2.871
2.824
2.783
2.746
2.713
2.683
2.656
2.632
2.959
2.896
2.842
2.795
2.753
2.716
2.683
2.653
2.626
2.602
29
2.931
2.868
2.814
2.767
2.726
2.689
2.656
2.626
2.599
2.574
30
2.906
2.843
2.789
2.742
2.700
2.663
2.630
2.600
2.573
2.549
DẠ Y
KÈ
3.177
284
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
F = F(α,f1,f2) f1
21
22
23
24
25
26
27
28
29
30
6216.118 6222.843 6228.990 6234.631 6239.825 6244.624 6249.071 6253.203 6257.053 6260.649 99.452
99.454
99.456
99.458
99.459
99.461
99.462
99.463
99.465
99.466
3
26.664
26.640
26.618
26.598
26.579
26.562
26.546
26.531
26.517
26.505
4
13.994
13.970
13.949
13.929
13.911
13.894
5
9.528
9.506
9.485
9.466
9.449
9.433
6
7.372
7.351
7.331
7.313
7.296
7.280
7
6.132
6.111
6.092
6.074
6.058
6.043
8
5.336
5.316
5.297
5.279
5.263
5.248
9
4.786
4.765
4.746
4.729
4.713
4.698
10
4.383
4.363
4.344
4.327
4.311
4.296
11
4.077
4.057
4.038
4.021
4.005
3.990
12
3.836
3.816
3.798
3.780
3.765
3.750
13
3.643
3.622
3.604
3.587
3.571
14
3.483
3.463
3.444
3.427
3.412
15
3.350
3.330
3.311
3.294
3.278
3.264
16
3.237
3.216
3.198
3.181
3.165
17
3.139
3.119
3.101
3.084
18
3.055
3.035
3.016
2.999
19
2.981
2.961
2.942
2.925
20
2.916
2.895
2.877
21
2.857
2.837
2.818
22
2.805
2.785
23
2.758
2.738
24
2.716
2.695
25
2.677
2.657
26
2.642
27
2.609
28
2.579
29
2.552
30
2.526
13.864
13.850
13.838
9.418
9.404
9.391
9.379
7.266
7.253
7.240
7.229
6.029
6.016
6.003
5.992
5.234
5.221
5.209
5.198
4.685
4.672
4.660
4.649
4.283
4.270
4.258
4.247
3.977
3.964
3.952
3.941
3.736
3.724
3.712
3.701
3.556
3.543
3.530
3.518
3.507
3.397
3.383
3.371
3.359
3.348
3.250
3.237
3.225
3.214
3.150
3.137
3.124
3.112
3.101
3.068
3.053
3.039
3.026
3.014
3.003
2.983
2.968
2.955
2.942
2.930
2.919
2.909
2.894
2.880
2.868
2.855
2.844
2.859
2.843
2.829
2.815
2.802
2.790
2.778
2.801
2.785
2.770
2.756
2.743
2.731
2.720
2.766
2.749
2.733
2.718
2.704
2.691
2.679
2.667
2.719
2.702
2.686
2.671
2.657
2.644
2.632
2.620
2.676
2.659
2.643
2.628
2.614
2.601
2.589
2.577
2.638
2.620
2.604
2.589
2.575
2.562
2.550
2.538
QU
Y
NH
ƠN
13.878
2.621
2.602
2.585
2.569
2.554
2.540
2.526
2.514
2.503
2.589
2.570
2.552
2.536
2.521
2.507
2.494
2.481
2.470
2.559
2.540
2.522
2.506
2.491
2.477
2.464
2.451
2.440
2.531
2.512
2.495
2.478
2.463
2.449
2.436
2.423
2.412
2.506
2.487
2.469
2.453
2.437
2.423
2.410
2.398
2.386
KÈ
DẠ Y
OF FI
2
M
f2 1
CI AL
Bảng A5: Giá trị hằng số Fisher với α = 0.01 (P = 99%)
Phụ lục
285
G = G(α,N) α
0.1
0.05
0.025
0.01
1.148
1.153
1.154
1.155
4
1.425
1.463
1.481
1.493
5
1.602
1.671
1.715
1.749
6
1.729
1.822
1.887
7
1.828
1.938
2.020
8
1.909
2.032
2.127
1.155 1.496 1.764
1.944
1.973
2.097
2.139
2.221
2.274
2.323
2.387
2.410
2.482
2.484
2.564
2.412
2.549
2.636
2.462
2.607
2.699
2.507
2.658
2.755
2.548
2.705
2.806
1.977
2.110
2.215
2.036
2.176
2.290
11
2.088
2.234
2.355
12
2.134
2.285
13
2.176
2.331
14
2.213
2.372
15
2.248
2.409
16
2.279
2.443
2.586
2.747
2.852
17
2.309
2.475
2.620
2.785
2.894
18
2.336
2.504
2.652
2.821
2.932
19
2.361
2.531
2.681
2.853
2.968
20
2.385
2.557
2.708
2.884
3.001
QU
Y
NH
ƠN
9 10
21
2.408
2.580
2.734
2.912
3.031
2.429
2.603
2.758
2.939
3.060
2.449
2.624
2.780
2.963
3.087
2.468
2.644
2.802
2.987
3.112
2.486
2.663
2.822
3.009
3.135
2.503
2.681
2.841
3.029
3.158
27
2.520
2.698
2.859
3.049
3.179
28
2.536
2.714
2.876
3.068
3.199
29
2.551
2.730
2.893
3.086
3.218
30
2.565
2.745
2.908
3.103
3.236
22 23 25
KÈ
26
M
24
DẠ Y
0.005
OF FI
N 3
CI AL
Bảng A6: Giá trị hằng số Grubbs (upper-tailed)
286
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
α
0.05
0.025
0.01
1
2.706
3.841
5.024
6.635
2
4.605
5.991
7.378
9.210
3
6.251
7.815
9.348
11.345
4
7.779
9.488
11.143
13.277
5
9.236
11.070
12.833
6
10.645
12.592
14.449
7
12.017
14.067
16.013
8
13.362
15.507
17.535
9
14.684
16.919
19.023
10
15.987
18.307
20.483
11
17.275
19.675
12
18.549
21.026
13
19.812
22.362
14
21.064
23.685
15
22.307
16 17
7.879
10.597 12.838 14.860 16.750
16.812
18.548
18.475
20.278
20.090
21.955
21.666
23.589
23.209
25.188
21.920
24.725
26.757
23.337
26.217
28.300
24.736
27.688
29.819
26.119
29.141
31.319
24.996
27.488
30.578
32.801
23.542
26.296
28.845
32.000
34.267
24.769
27.587
30.191
33.409
35.718
18
25.989
28.869
31.526
34.805
37.156
19
27.204
30.144
36.191
38.582
20
28.412
32.852
31.410
37.566
39.997
29.615
32.671
35.479
38.932
41.401
30.813
33.924
36.781
40.289
42.796
34.170
23
QU
Y
NH
ƠN
15.086
32.007
35.172
38.076
41.638
44.181
24
33.196
36.415
39.364
42.980
45.559
34.382
37.652
40.646
44.314
46.928
35.563
38.885
41.923
45.642
48.290
27
36.741
40.113
43.195
46.963
49.645
28
37.916
41.337
44.461
48.278
50.993
29
39.087
42.557
45.722
49.588
52.336
30
40.256
43.773
46.979
50.892
53.672
21
25
KÈ
26
M
22
DẠ Y
0.005
OF FI
0.1
f
CI AL
Bảng A7: Giá trị hằng số Chi square χ2 (α,f)
Phụ lục
287
C = C(α,n-1,N) n-1
2
3
4
5
6
7
8
2
0.999
0.995
0.979
0.959
0.937
0.917
0.899
3
0.993
0.942
0.883
0.833
0.793
0.761
4
0.968
0.864
0.781
0.721
0.676
0.641
5
0.928
0.789
0.696
0.633
0.588
0.553
6
0.883
0.722
0.626
0.563
0.520
0.487
7
0.838
0.664
0.568
0.508
0.466
0.435
8
0.794
0.615
0.521
0.463
0.423
0.393
9
0.754
0.573
0.481
0.425
0.387
0.359
10
0.717
0.536
0.447
0.393
0.357
0.331
11
0.684
0.504
0.418
0.366
0.332
0.307
12
0.653
0.475
0.392
0.343
0.310
0.286
13
0.624
0.450
0.369
0.322
0.291
14
0.599
0.427
0.350
0.304
0.274
15
0.575
0.407
0.332
0.288
0.259
16
0.553
0.389
0.316
0.274
0.246
0.226
17
0.532
0.372
0.301
0.261
0.234
18
0.514
0.357
0.288
0.249
19
0.496
0.343
0.276
0.239
20
0.480
0.330
0.265
21
0.465
0.318
0.255
22
0.451
0.307
0.246
23
0.437
0.297
24
0.425
0.287
25
0.413
26
0.402
27 28
0.882
0.882
0.854
0.734
0.711
0.711
0.674
0.613
0.590
0.590
0.554
0.504
0.470
0.440
0.440
0.408
0.411
0.391
0.391
0.362
0.370
0.352
0.352
0.325
0.338
0.321
0.321
0.295
0.311
0.295
0.295
0.270
0.288
0.272
0.272
0.250
0.268
0.254
0.254
0.232
0.268
0.251
0.237
0.237
0.217
0.252
0.236
0.223
0.223
0.204
0.239
0.223
0.210
0.210
0.192
0.211
0.199
0.199
0.182
0.215
0.201
0.189
0.189
0.172
0.223
0.205
0.191
0.180
0.180
0.164
0.214
0.196
0.183
0.172
0.172
0.156
0.229
0.205
0.188
0.175
0.165
0.165
0.150
0.220
0.197
0.180
0.168
0.158
0.158
0.143
0.212
0.189
0.173
0.161
0.152
0.152
0.138
0.237
0.204
0.182
0.167
0.155
0.146
0.146
0.132
0.229
0.197
0.176
0.161
0.149
0.141
0.141
0.127
0.278
0.222
0.190
0.170
0.155
0.144
0.136
0.136
0.123
0.270
0.215
0.184
0.164
0.150
0.139
0.131
0.131
0.119
0.391
0.262
0.209
0.179
0.159
0.145
0.135
0.127
0.127
0.115
0.382
0.255
NH
Y
QU
M
ƠN
0.504
0.461
0.202
0.173
0.154
0.141
0.131
0.123
0.123
0.111
0.372
0.248
0.197
0.168
0.150
0.137
0.127
0.119
0.119
0.108
0.363
0.241
0.191
0.164
0.145
0.133
0.123
0.116
0.116
0.105
DẠ Y
30
10
0.526
KÈ
29
9
OF FI
1
N
CI AL
Bảng A8: Giá trị hằng số Cochran với α = 0.01,
288
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
C = C(α,n-1,N) 13
14
15
16
17
18
0.842 0.659 0.539 0.456 0.396 0.350 0.314 0.285 0.261 0.241 0.224 0.209 0.196 0.185 0.175 0.166 0.158 0.150 0.144 0.138 0.132 0.127 0.122 0.118 0.114 0.110 0.107 0.103 0.100
0.831 0.646 0.527 0.445 0.385 0.340 0.305 0.276 0.253 0.233 0.217 0.202 0.190 0.179 0.169 0.160 0.152 0.145 0.139 0.133 0.128 0.123 0.118 0.114 0.110 0.106 0.103 0.100 0.097
0.821 0.635 0.515 0.434 0.376 0.331 0.297 0.269 0.246 0.227 0.210 0.196 0.184 0.173 0.164 0.155 0.148 0.141 0.135 0.129 0.124 0.119 0.114 0.110 0.106 0.103 0.100 0.097 0.094
0.811 0.624 0.505 0.425 0.367 0.324 0.290 0.262 0.240 0.221 0.205 0.191 0.179 0.169 0.159 0.151 0.144 0.137 0.131 0.125 0.120 0.115 0.111 0.107 0.103 0.100 0.097 0.094 0.091
0.803 0.615 0.496 0.417 0.360 0.317 0.283 0.256 0.234 0.216 0.200 0.187 0.175 0.164 0.155 0.147 0.140 0.133 0.127 0.122 0.117 0.112 0.108 0.104 0.101 0.097 0.094 0.091 0.088
0.795 0.606 0.488 0.409 0.353 0.310 0.277 0.251 0.229 0.211 0.196 0.182 0.171 0.161 0.152 0.144 0.137 0.130 0.124 0.119 0.114 0.110 0.106 0.102 0.098 0.095 0.092 0.089 0.086
0.788 0.598 0.481 0.403 0.347 0.305 0.272 0.246 0.225 0.207 0.192 0.179 0.167 0.157 0.149 0.141 0.134 0.127 0.122 0.116 0.112 0.107 0.103 0.100 0.096 0.093 0.090 0.087 0.084
0.781 0.591 0.474 0.396 0.341 0.300 0.268 0.242 0.221 0.203 0.188 0.175 0.164 0.154 0.146 0.138 0.131 0.125 0.119 0.114 0.109 0.105 0.101 0.097 0.094 0.091 0.088 0.085 0.083
DẠ Y
ƠN
NH
Y
QU
19
20
0.774 0.584 0.468 0.391 0.336 0.295 0.263 0.238 0.217 0.200 0.185 0.172 0.161 0.152 0.143 0.135 0.129 0.123 0.117 0.112 0.107 0.103 0.099 0.096 0.092 0.089 0.086 0.083 0.081
0.768 0.578 0.462 0.386 0.331 0.291 0.259 0.234 0.213 0.196 0.182 0.169 0.158 0.149 0.141 0.133 0.126 0.120 0.115 0.110 0.105 0.101 0.097 0.094 0.091 0.087 0.085 0.082 0.079
OF FI
12
KÈ
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
11
M
n-1 N
CI AL
Bảng A8: Giá trị hằng số Cochran với α = 0.01,
Phụ lục
289
C= C(α,n-1,N) 3
4
5
6
7
8
0.998 0.967 0.906 0.841 0.781 0.727 0.680 0.638 0.602 0.570 0.541 0.515 0.492 0.471 0.452 0.434 0.418 0.403 0.389 0.377 0.365 0.354 0.343 0.334 0.325 0.316 0.308 0.300 0.293 0.286
0.975 0.871 0.768 0.684 0.616 0.561 0.516 0.477 0.445 0.417 0.392 0.371 0.352 0.335 0.319 0.305 0.293 0.281 0.270 0.261 0.252 0.243 0.235 0.228 0.221 0.215 0.209 0.203 0.198 0.193
0.939 0.798 0.684 0.598 0.532 0.480 0.438 0.403 0.373 0.348 0.326 0.307 0.291 0.276 0.262 0.250 0.240 0.230 0.221 0.212 0.204 0.197 0.191 0.185 0.179 0.174 0.168 0.164 0.159 0.155
0.906 0.746 0.629 0.544 0.480 0.431 0.391 0.358 0.331 0.308 0.288 0.271 0.255 0.242 0.230 0.219 0.209 0.200 0.192 0.185 0.178 0.171 0.166 0.160 0.155 0.150 0.146 0.142 0.138 0.134
0.877 0.707 0.589 0.506 0.445 0.397 0.359 0.328 0.303 0.281 0.262 0.246 0.232 0.220 0.208 0.198 0.189 0.181 0.174 0.167 0.160 0.155 0.149 0.144 0.139 0.135 0.131 0.127 0.124 0.120
0.853 0.677 0.560 0.478 0.418 0.373 0.336 0.307 0.282 0.262 0.244 0.229 0.215 0.203 0.193 0.183 0.175 0.167 0.160 0.154 0.148 0.142 0.137 0.133 0.128 0.124 0.121 0.117 0.114 0.111
0.833 0.653 0.536 0.456 0.398 0.354 0.318 0.290 0.267 0.247 0.230 0.215 0.202 0.191 0.181 0.172 0.164 0.157 0.150 0.144 0.138 0.133 0.129 0.124 0.120 0.116 0.113 0.109 0.106 0.103
0.816 0.633 0.518 0.439 0.382 0.338 0.304 0.277 0.254 0.235 0.219 0.205 0.192 0.182 0.172 0.163 0.156 0.149 0.142 0.136 0.131 0.126 0.122 0.117 0.114 0.110 0.106 0.103 0.100 0.097
DẠ Y
ƠN
NH
Y
QU
9
10
0.816 0.633 0.518 0.439 0.382 0.338 0.304 0.277 0.254 0.235 0.219 0.205 0.192 0.182 0.172 0.163 0.156 0.149 0.142 0.136 0.131 0.126 0.122 0.117 0.114 0.110 0.106 0.103 0.100 0.097
0.788 0.603 0.488 0.412 0.357 0.315 0.283 0.257 0.235 0.217 0.202 0.189 0.177 0.167 0.158 0.150 0.143 0.136 0.130 0.125 0.120 0.116 0.111 0.107 0.104 0.100 0.097 0.094 0.092 0.089
OF FI
2
KÈ
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
1
M
n-1 N
CI AL
Bảng A9: Giá trị hằng số Cochran với α = 0.05
290
XỬ LÝ SỐ LIỆU VÀ QUY HOẠCH THỰC NGHIỆM HÓA HỌC
C = C(α,n-1,N) n-1
12
13
14
15
16
17
18
19
20
0.776 0.590 0.477 0.401 0.347 0.306 0.275 0.249 0.228 0.210 0.196 0.183 0.171 0.162 0.153 0.145 0.138 0.132 0.126 0.121 0.116 0.111 0.107 0.104 0.100 0.097 0.094 0.091 0.088
0.766 0.579 0.467 0.392 0.339 0.299 0.267 0.242 0.222 0.205 0.190 0.177 0.166 0.157 0.148 0.141 0.134 0.128 0.122 0.117 0.112 0.108 0.104 0.100 0.097 0.094 0.091 0.088 0.085
0.757 0.570 0.458 0.384 0.331 0.292 0.261 0.237 0.216 0.199 0.185 0.173 0.162 0.153 0.144 0.137 0.130 0.124 0.119 0.114 0.109 0.105 0.101 0.097 0.094 0.091 0.088 0.085 0.083
0.749 0.561 0.450 0.377 0.325 0.286 0.256 0.231 0.211 0.195 0.181 0.169 0.158 0.149 0.141 0.133 0.127 0.121 0.116 0.111 0.106 0.102 0.098 0.095 0.092 0.089 0.086 0.083 0.081
0.741 0.554 0.443 0.370 0.319 0.280 0.251 0.227 0.207 0.191 0.177 0.165 0.155 0.146 0.138 0.130 0.124 0.118 0.113 0.108 0.104 0.100 0.096 0.093 0.089 0.086 0.084 0.081 0.079
0.734 0.547 0.437 0.364 0.314 0.276 0.246 0.223 0.203 0.187 0.174 0.162 0.152 0.143 0.135 0.128 0.122 0.116 0.111 0.106 0.102 0.098 0.094 0.091 0.088 0.085 0.082 0.079 0.077
0.728 0.540 0.431 0.359 0.309 0.271 0.242 0.219 0.200 0.184 0.170 0.159 0.149 0.140 0.132 0.125 0.119 0.114 0.109 0.104 0.100 0.096 0.092 0.089 0.086 0.083 0.080 0.078 0.075
0.722 0.534 0.425 0.354 0.304 0.267 0.238 0.215 0.197 0.181 0.168 0.156 0.146 0.138 0.130 0.123 0.117 0.112 0.107 0.102 0.098 0.094 0.090 0.087 0.084 0.081 0.079 0.076 0.074
0.716 0.529 0.420 0.350 0.300 0.264 0.235 0.212 0.194 0.178 0.165 0.154 0.144 0.135 0.128 0.121 0.115 0.110 0.105 0.100 0.096 0.092 0.089 0.086 0.083 0.080 0.077 0.075 0.073
0.711 0.524 0.416 0.346 0.297 0.260 0.232 0.209 0.191 0.176 0.163 0.152 0.142 0.133 0.126 0.119 0.113 0.108 0.103 0.099 0.095 0.091 0.088 0.084 0.081 0.079 0.076 0.074 0.071
ƠN
NH
Y
QU
M
KÈ
DẠ Y
OF FI
11
N 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
CI AL
Bảng A9: Giá trị hằng số Cochran với α = 0.05