Modelli pratici per Excel
Raffaele Scurelli
Modelli Excel per la Statistica
Prima edizione
Copyright©2014 Raffaele Scurelli Tutti i diritti sono riservati a norma di legge, è vietata la riproduzione, parziale o totale senza autorizzazione scritta da parte dell’autore. Qualsiasi riproduzione, parziale o totale, anche a uso interno o a scopo didattico, priva di autorizzazione scritta sarà perseguita ai sensi di legge.
Stampato in giugno 2014
Indice
Introduzione CAPITOLO 1 - FREQUENZE ED INDICI 1. 2.
3.
4.
5. 6. 7.
Obiettivo n.1: costruzione di una tabella analisi dati Obiettivo n.2: costruzione di un grafico partendo da una tabella dati Grafico 1 Frequenza percentuale Grafico 2 Frequenza relativa Grafico 3 Frequenza cumulata Grafico 4 Frequenza percentuale cumulata Obiettivo n.3: costruzione degli indici Moda Mediana Indice di omogeneitĂ Indice omogeneitĂ normalizzato Media Media troncata Varianza Scarto quadratico medio Obiettivo n.4: visualizzazione della casistica Perfetta equidistribuzione Perfetta noequidistribuzione Distribuzione Normale Obiettivo n.5: casistica di esempio Definizioni Modello foglio di lavoro
8 11 11 13 13 13 14 14 15 15 15 16 16 17 17 17 17 18 18 19 20 21 30 33
CAPITOLO 2 - MODELLO DI CORRELAZIONE 1. 2. 3.
4. 5.
6. 7. 8.
Obiettivo n.1: costruzione di una tabella analisi dati Obiettivo n.2: costruzione di un grafico partendo da una tabella dati Grafico 1 Grafico a dispersione Obiettivo n.3: costruzione degli indici Media Indice di covarianza metodo 1 Indice di covarianza metodo 2 Indice di covarianza automazione Scarto quadratico medio Indice di correlazione Indice di correlazione automatizzato Varianza automatizzata Indice di Pearson automatizzato Normalizzazione automatizzata Coefficiente angolare Coefficiente angolare automatizzato Intercetta Intercetta automatizzata Obiettivo n.4:costruzione strumenti di calcolo Obiettivo n.5: visualizzazione della casistica Perfetta correlazione positiva Perfetta correlazione negativa Perfetta no correlazione Obiettivo n.6: casistica di esempio Definizioni Modello foglio di lavoro
CAPITOLO 3 - CONTROLLO CAMPIONARIO 1. 2. 3. 4.
5. 6. 7. 8.
Obiettivo n.1: costruzione di una tabella analisi dati Obiettivo n.2: costruzione istogramma seriazione campionaria Obiettivo n.3: costruzione delle carte di controllo Obiettivo n.4:visualizzazione della casistica Processo sotto controllo Processo fuori controllo Processo intermedio Obiettivo n.5:casistica di esempio Definizioni Modello foglio di lavoro Bibliografia
35 35 39 39 40 40 41 41 42 42 42 43 43 44 45 45 45 46 46 47 50 50 51 52 53 63 67
69 69 75 76 82 82 85 87 92 107 108 111
Introduzione Modelli Excel© per la Statistica è il primo libro della serie Modelli pratici per Excel. In questo volume composto da tre capitoli si affrontano le tematiche pratiche delle applicazioni statistiche in ambito delle valutazioni economico produttive. Il testo è impostato in modo tale che la comprensione degli argomenti trattati risulti la più immediata possibile, comprendendone il funzionamento attraverso l’ausilio del software di calcolo Excel. Gli argomenti trattati sono: la gestione dei dati, il loro raggruppamento in modalità, il calcolo delle percentuali, degli indici di posizione e la loro visualizzazione nel primo capitolo; indice di correlazione, indice di covarianza tra due variabili e rappresentazione grafica nel secondo capitolo; campionamento e sistemi di valutazione nel terzo capitolo.
CAPITOLO 2 - MODELLO DI CORRELAZIONE Il foglio di lavoro permette di verificare la sussistenza di un legame funzionale tra due variabili.
Obiettivo n.1: costruzione di una tabella analisi dati
X Y 1 2
3
xi-μx yi-μy
(xi-μx)² (yi-μy)²
181 54 9774
282 74 20868
312 75 23400
272 72 19584
254 75 19050
321 81 26001
211 65 13715
-84,50 -54,50 -44,50 -24,50 -18,92 -14,92 -8,92 -4,92 1598 813 397 120
16,50 1,08 18
46,50 2,08 97
6,50 -0,92 -6
-11,50 2,08 -24
55,50 8,08 449
-54,50 102,50 -7,92 25,08 431 2571
47 18 841
7306
272 1
2162 4
42 1
132 4
3080 65
2970 63
10506
2162
34019
629
327
358
2970 223
221 64 14144
1980 80
600 24
368 98 36064
312 91 28392
n 12 12
241 68 16388
7140
211 58 12238
(xi-μx)² automa (yi-μy)²automa
4
Nella tabella vengono trattati i seguenti argomenti: 1. 2. 3. 4.
Prodotto delle variabili Calcolo delle medie e scarti dalla media Quadrato degli scarti dalla media Automazione del quadrato degli scarti dalla media
X *Y xi-µx ; yi-µy (xi-µ)²; (yi-µ)²
Il procedimento di automazione delle formule di calcolo prevede i seguenti passaggi: Calcolo di n
CELLA O2=CONTA.NUMERI(C2:N2) CELLA O3=CONTA.NUMERI(C3:N3)
1779 34019 1779
1.Prodotto delle variabili X Y 1
9774
12238
14144
16388
20868
23400
19584
19050
26001
CELLA C4=PRODOTTO(C2:C3)
TRASCINARE LA CASELLA PER COPIARE FORMULA
2a.Calcolo delle medie µx µy
μx μy
265,50 72,92
CELLA Q2=MEDIA(C2:N2)
CELLA Q3=MEDIA(C3:N3)
13715
36064
28392
2b.Calcolo degli scarti dalla media 2
xi-μx yi-μy
-84,50 -54,50 -44,50 -24,50 -18,92 -14,92 -8,92 -4,92 1598 813 397 120
16,50 1,08 18
46,50 2,08 97
6,50 -0,92 -6
-11,50 2,08 -24
55,50 8,08 449
-54,50 102,50 -7,92 25,08 431 2571
CELLA C6=C2-Q2 CELLA D6=D2-Q2…………………CELLA N6=N2-Q2
CELLA C7=C3-Q3 CELLA D7=D3-Q3…………………CELLAN7=N3-Q3
2c.Prodotto degli scarti dalla media
TRASCINARE LA CASELLA PER COPIARE FORMULA
CELLA C8=PRODOTTO(C6:C7)
2
xi-μx yi-μy
-84,50 -54,50 -18,92 -14,92 1598 813
47 18 841
7306
CELLA O8=SOMMA(C8:N8)
3. Quadrato degli scarti dalla media 3
(xi-μx)² (yi-μy)²
7140 358
2970 223
1980 80
600 24
272 1
2162 4
42 1
132 4
3080 65
2970 63
10506
2162
34019
629
327
1779
CELLA C10=POTENZA(C6;2) TRASCINARE LA CASELLA PER COPIARE FORMULA
CELLA O10=SOMMA(C10:N10)
RIPETERE PER LA VARIABILE Y
4.Automazione del quadrato degli scarti dalla media CELLA O12=DEV.Q(C2:N2); CELLA O13=DEV.Q(C3:N3);
Obiettivo n.2: costruzione di un grafico partendo da una tabella dati Grafico 1 Grafico a dispersione
Scheda Inserisci > Grafici > Grafico a dispersione> Selezione dati
X
181
211
221
241
282
312
272
254
321
211
368
312
Y
54
58
64
68
74
75
72
75
81
65
98
91
Tasto destro sui punti del grafico > selezionare linea di tendenza > visualizza equazione
Il grafico dimostra la correlazione tra le due variabili, nel caso opposto i punti risulterebbero distanziati dalla linea di tendenza.
Obiettivo n.3: costruzione degli indici
μx μy μ(xi*yi) μx*μy σxy σxy automa σxy
265,50 72,92
σx σy ρ ρ auto ma σ²x automa σ²y automa χ auto ma N auto ma N auto ma No rmauto ma No rmauto ma
53 12 0,94 0,94 2835 148 0,94 0,50 0,50 0,00 0,00
a a auto ma b b auto ma
0,21 0,21 16 16
Vengono trattati i seguenti argomenti:
19968 19359
609 609 609
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.
Media Media prodotto variabili X Y Prodotto delle medie Indice di covarianza Indice di covarianza automa Scarto quadratico medio Indice di correlazione Indice di correlazione automa Varianza automatizzata Indice di Pearson automa Distribuzione Normale automa Coefficiente angolare Coefficiente angolare automa Intercetta Intercetta automa
µx µy µ(xi*yi) µx*µy σxy σxy automa σx ρ ρ automa σ²x σ²y χ automa N automa a a automa b b automa
Il procedimento di automazione delle formule di calcolo prevede i seguenti passaggi: Media
Automazione effettuata a pagina 36.
Media prodotto delle variabili X Y
CELLA Q4=MEDIA(C4:N4)
Prodotto delle medie
CELLA Q5=PRODOTTO(Q2:Q3)
Indice di covarianza metodo 1
CELLA Q6=Q4-Q5
Indice di covarianza metodo 2
CELLA Q8=O8/O3
Indice di covarianza automazione
マベy マベy automa マベy
609 609 609
CELLA Q7=COVARIANZA.P(C2:N2;C3:N3)
Scarto quadratico medio
CELLA Q10=RADQ(O10/O3)
CELLA Q11=RADQ(O11/O3)
Indice di correlazione
CELLA Q12=Q8/(Q10*Q11)
Indice di correlazione automatizzato
CELLA Q13=CORRELAZIONE(C2:N2;C3:N3)
Varianza automatizzata
CELLA Q14=VAR.P(C2:N2)
CELLA Q15=VAR.P(C3:N3)
Indice di Pearson automatizzato
CELLA Q16=PEARSON(C2:N2;C3:N3)
Distribuzione Normale automatizzata
CELLA Q17=DISTRIB.NORM.N(O17;Q2;Q10;VERO)
CELLA Q18=DISTRIB.NORM.N(O18;Q3;Q11;VERO)
CELLA Q19=NORMALIZZA(O17;Q2;Q10)
CELLA Q20=NORMALIZZA(O18;Q3;Q11)
Coefficiente angolare CELLA Q22=Q7/Q14
Coefficiente angolare automatizzato
CELLA Q23=PENDENZA(C3:N3;C2:N2)
Intercetta
CELLA Q24=Q3-(Q22*Q2)
Intercetta automatizzata
CELLA Q25=INTERCETTA(C3:N3;C2:N2)
Obiettivo n.4:costruzione strumenti di calcolo
X Y
265,50 N auto ma 72,92 N auto ma No rmauto ma No rmauto ma
0,50 0,50 0,00 0,00
1.Visualizzazione della distribuzione Normale per la media e la deviazione standard specificate
Scheda Inserisci > Grafici > Grafico a linee > Selezione dati
Grafico Funzione Normalizza
Scheda Inserisci > Grafici > Grafico a linee > Selezione dati
Grafico Funzione Normalizza
2. Visualizzazione della variabile Y determinato il valore di X
Y=aX+b coef.angolare coef.angolare intercetta intercetta
X Y
a a auto ma b b auto ma
0,21 0,21 16 16
COMPUTO 265,50 72,92
CELLA O29=(Q22*O28)+Q24
Il grafico dimostra la correlazione tra le due variabili, nel caso opposto i punti risulterebbero distanziati dalla linea di tendenza.
Obiettivo n.5: visualizzazione della casistica Perfetta correlazione positiva Visualizzare il modello di correlazione tra i seguenti prodotti in riferimento ai dati di vendita mensili. Software applicativo
8740
8825
8760
8820
8825
8870
8864
8832
8875
8978
9140
9250
Smartphone
18956
19563
19213
19542
19600
19852
19754
19542
19854
20541
21540
22310
X Y
8740 18956 2E+08 x i -μx yi -μy
8825 19563 2E+08
8760 19213 2E+08
8820 19542 2E+08
8825 19600 2E+08
8870 19852 2E+08
8864 19754 2E+08
8832 19542 2E+08
8875 19854 2E+08
-158 -73 -138 -78 -1066 -459 -809 -480 168734 33640 111879 37580
-73 -422 30930
-28 -170 4810
-34 -268 9188
-66 -480 31817
-23 -168 3912
(x i -μx)² 25043 5366 19113 6123 5366 798 (yi -μy)² 1136889 210911 654886 230640 178295 28985 22500 22000
8978 20541 2E+08
9140 21540 2E+08
μx μy μ(xi*yi) μx*μy 80 242 352 σxy 519 1518 2288 σxy automa 41370 366916 804716 1645490 σxy
1173 4389 541 6360 58443 123728 71958 230640 28308 269102 2303565 5233800 (x i -μx)² automa (yi -μy)²automa
21500 21000
x 20500
8752 19083
y
20000
8898 20022
X Y
9044 20961
y = 6,4166x - 37074
19500 19000 18500 8700
8800
8900
9000
9100
9200
n 12 12
9250 22310 2E+08
9300
σx σy ρ ρ auto ma 10577978 σ²x automa σ²y automa χ auto ma 8898 N auto ma 20022 N auto ma No rmauto ma No rmauto ma 256442
10577978
256442,25
Y=aX+b coef.angolare coef.angolare intercetta intercetta
a a auto ma b b auto ma
8898 20022 178300110 178162986
137124 137124 137124 146 939 1,00 1,00 21370 881498 1,00 0,50 0,50 0,00 0,00 6,42 6,42 -37074 -37074
Estremo di massimo correlazione perfetta positiva. Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
8898 20022 137124 146 939 1.00 1.00
Il calcolo della media e della varianza ci permette di definire un range di probabile collocazione dei punti di seriazione, individuati con i tre punti grigi . La covarianza risulta elevata, l’indice di correlazione è a valore massimo.
Perfetta correlazione negativa Visualizzare il modello di correlazione tra i seguenti prodotti in riferimento ai dati di vendita mensili. Cd
1005
2015
3051
4012
5789
6879
7845
8654
9523
10235
11254
12456
Dischi
1242
1151
1047
986
860
716
651
515
439
313
217
159
X Y
5789 860 5E+06
6879 716 5E+06
7845 651 5E+06
8654 515 4E+06
-2881 295
-1104 169
-3242417 -2242331 -1366531 -848984
-186236
-14 25 -349
952 -40 -38391
-310494
(x i -μx)² 34670507 23796510 14762245 8301121 1219184 (yi -μy)² 303234 211293 126499 86828 28448
201 608
x i -μx yi -μy
1005 1242 1E+06
2015 1151 2E+06
3051 1047 3E+06
4012 986 4E+06
-5888 551
-4878 460
-3842 356
1400 1200 1000 800
x
3301 337
600 y
6893 691
10485 1045
400 200 0 0
2000
4000
6000
1761 -176
9523 439 4E+06
10235 313 3E+06
11254 217 2E+06
12456 159 2E+06
2630 -252
3342 -378
4361 -474
5563 -532
-663595 -1264327 -2068489 -2961282
n 12 12
μx μy μ(xi*yi) μx*μy σxy σxy automa -15193424 σxy
6893 691 3499357 4765476 -1266119 -1266119 -1266119
905987 3100534 6916023 11167850 19016867 30945115 154802144 σx 3592 1627 31093 63672 143136 224992 283379 1504811 σy 354 (x i -μx)² automa 154802144 ρ -1,00 (yi -μy)²automa 1504811 ρ auto ma -1,00 σ²x automa 12900179 σ²y automa 125401 χ auto ma -1,00 X 6893 N auto ma 0,50 Y 691 N auto ma 0,50 y = -0,0981x + 1367,9 No rmauto ma 0,00 No rmauto ma 0,00 Y=aX+b coef.angolare a -0,10 coef.angolare a auto ma -0,10 intercetta b 1368 8000 10000 12000 14000 intercetta b auto ma 1368
Estremo di massimo correlazione perfetta negativa. Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
6893 691 -1266119 3592 354 -1.00 -1.00
Il calcolo della media e della varianza ci permette di definire un range di probabile collocazione dei punti di seriazione, individuati con i tre punti grigi . La covarianza risulta elevata, l’indice di correlazione è a valore massimo.
Perfetta no correlazione Visualizzare il modello di correlazione tra i seguenti prodotti in riferimento ai dati di vendita mensili. Matite
8421
8542
8475
8547
8518
8475
8486
8412
8445
8451
8401
8501
Bottiglie
1654
1545
1245
1345
1348
1258
1298
1265
1245
1421
1411
1421
X Y
8421 1654 1E+07 x i -μx yi -μy
8542 1545 1E+07
-52 69 283 174 -14652 12012
(x i -μx)² 2687 (yi -μy)² 79900
4784 30160
8475 1245 1E+07
8547 1345 1E+07
8518 1348 1E+07
8475 1258 1E+07
8486 1298 1E+07
8412 1265 1E+07
8445 1245 1E+07
8451 1421 1E+07
8401 1411 1E+07
8501 1421 1E+07
2 -126 -274
74 -26 -1953
45 -23 -1054
2 -113 -246
13 -73 -966
-61 -106 6469
-28 -126 3516
-22 50 -1084
-72 40 -2849
28 50 1399
5 15960
5501 693
2040 544
5 12844
173 5378
3701 11307
775 15960
477 2467
5160 793 1573 2467 (x i -μx)² automa (yi -μy)²automa
1800 1600
n 12 12
319 26100 179255 26099,67 179255
1400 1200 1000
x
800 y
8426 1249
8473 1371
X Y
8519 1494
600 400 200 0 8350
8400
8450
8500
8550
8600
μx 8473 μy 1371 μ(xi*yi) 11619105 μx*μy 11619079 σxy 27 σxy auto ma 27 σxy 27
Y=aX+b coef.angolare coef.angolare intercetta intercetta
σx σy ρ ρ auto ma σ²x automa σ²y automa χ auto ma 8473 N auto ma 1371 N auto ma No rmauto ma No rmauto ma a a auto ma b b auto ma
47 122 0,00 0,00 2175 14938 0,00 0,50 0,50 0,00 0,00 0,01 0,01 1268 1268
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
8473 1371 27 47 122 0.00 0.00
Il calcolo della media e della varianza ci permette di definire un range di probabile collocazione dei punti di seriazione, individuati con i tre punti grigi . La covarianza e l’indice di correlazione è zero, assenza di correlazione.
Obiettivo n.6: casistica di esempio Esempio 1 Visualizzare il modello di correlazione tra la spesa pubblicitaria e l’aumento di vendita di un prodotto. Pubblicità
3500
3800
3850
6850
6850
6850
8560
8560
8560
9100
9100
9100
Prodotto
2423
2541
2487
2514
2528
2541
2565
2687
2695
2721
2725
2748
X Y
3500 2423 8E+06 x i -μx yi -μy
6850 2514 2E+07
6850 2528 2E+07
-3557 -3257 -3207 -207 -175 -57 -111 -84 622120 185359 355673 17343
-207 -70 14449
(x i -μx)² 12649878 (yi -μy)² 30596
3800 2541 1E+07
3850 2487 1E+07
10282711
42711
42711
3240
12303
7042
4888
2750 2700 2650
x 2600
4956
7057
y = 0,0426x 2492 + 2297,5 2598
y
2550 2500 2450 2400 0
2000
8560 2565 2E+07
8560 2687 2E+07
8560 2695 2E+07
9100 2721 2E+07
9100 2725 2E+07
9100 2748 3E+07
n 12 12
μx 7057 μy 2598 μ(xi*yi) 18520543 μx*μy 18332632 -207 1503 1503 1503 2043 2043 2043 σxy 187911 -57 -33 89 97 123 127 150 σxy auto ma 187911 11763 -49485 133922 145949 251500 259674 306670 2254937 σxy 187911
42711 2260011 2260011 2260011 4175211 4175211 4175211 52972267 σx 2101 3240 1084 7936 9425 15150 16150 22525 133577 σy 106 (x i -μx)² automa 52972267 ρ 0,85 (yi -μy)²automa 133577 ρ automa 0,85 σ²x automa 4414356 σ²y automa 11131 χ auto ma 0,85 X 7057 N auto ma 0,50 9158 Y 2598 N auto ma 0,50 2703 No rmauto ma 0,00 No rmauto ma 0,00 Y=aX+b coef.angolare a 0,04 coef.angolare a auto ma 0,04 intercetta b 2298 4000 6000 8000 10000 intercetta b auto ma 2298
10605878
2800
6850 2541 2E+07
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
7057 2598 187911 2101 106 0.85 0.85
Il calcolo della media e della varianza ci permette di definire un range di probabile collocazione dei punti di seriazione, individuati con i tre punti grigi . La covarianza e l’indice di correlazione presenta un valore non molto elevato. E’ probabile che modificando la seriazione distribuendone gli aumenti di spesa, l’indice risulti maggiormente elevato.
Pubblicità
3500
3800
3850
4850
5850
6850
7560
8560
9100
9800
10300
10660
Prodotto
2423
2541
2487
2514
2528
2541
2565
2687
2695
2721
2725
2748
X Y
3500 2423 8E+06 x i -μx yi -μy
3800 2541 1E+07
3850 2487 1E+07
4850 2514 1E+07
5850 2528 1E+07
-3557 -3257 -3207 -2207 -1207 -175 -57 -111 -84 -70 622120 185359 355673 185176 84366
(x i -μx)² 12649878 (yi -μy)² 30596
10282711
3240
12303
2750 2700 2650
x 2600 y
2550 2500 2450 2400
7560 2565 2E+07
8560 2687 2E+07
9100 2695 2E+07
9800 2721 3E+07
10300 2725 3E+07
10660 2748 3E+07
n 12 12
μx 7057 μy 2598 μ(xi*yi) 18586867 μx*μy 18332632 -207 503 1503 2043 2743 3243 3603 σxy 254235 -57 -33 89 97 123 127 150 σxy auto ma 254235 11763 -16568 133922 198374 337659 412174 540800 3050817 σxy 254235
42711 253344 2260011 4175211 7525878 10519211 12984011 77624267 σx 2543 3240 1084 7936 9425 15150 16150 22525 133577 σy 106 (x i -μx)² automa 77624267 ρ 0,95 (yi -μy)²automa 133577 ρ auto ma 0,95 σ²x automa 6468689 σ²y automa 11131 χ auto ma 0,95 X 7057 N 0,50 auto ma y = 0,0393x + 2320,6 4513 7057 9600 Y 2598 N auto ma 0,50 2492 2598 2703 No rmauto ma 0,00 No rmauto ma 0,00 Y=aX+b coef.angolare a 0,04 coef.angolare a auto ma 0,04 intercetta b 2321 0 2000 4000 6000 8000 10000 12000 intercetta b auto ma 2321
10605878
2800
6850 2541 2E+07
4869378 1456044
7042
4888
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
7057 2598 254235 2543 106 0.95 0.95
Distribuendo gli aumenti della variabile X nei periodi immediatamente successivi, covarianza ed indice di correlazione aumentano rispettivamente di 66234 e 0.10.
Esempio 2 Visualizzare il modello di correlazione tra la vendita di camicie e pantaloni. Camicie
254
271
245
231
215
221
235
241
354
312
251
261
Pantaloni
119
125
109
103
98
106
95
106
136
128
118
137
μx μy μ(xi*yi) μx*μy σxy σxy automa σxy
258 115 30035 29622 413 413 413
σx σy ρ ρ auto ma σ²x automa σ²y automa χ auto ma 258 N auto ma 115 N auto ma No rmauto ma No rmauto ma
38 14 0,79 0,79 1442 188 0,79 0,50 0,50 0,01 0,00
X Y
x i -μx yi -μy
(x i -μx)² (yi -μy)²
254 119 30226
271 125 33875
245 109 26705
231 103 23793
215 98 21070
221 106 23426
235 95 22325
241 106 25546
354 136 48144
312 128 39936
251 118 29618
261 137 35757
-4 4 -14
13 10 134
-13 -6 75
-27 -12 319
-43 -17 724
-37 -9 329
-23 -20 452
-17 -9 149
96 21 2025
54 13 707
-7 3 -20
3 22 75
13 16
180 100
158 36
707 144
1813 289
1338 81
510 400
275 81
9296 441
2961 169
250
43 12 9 484 (x i -μx)² automa (yi -μy)²automa
n 12 12
4956 17307 2250 17306,92 2250
200
X Y
150
x y 100
220 101
258 115
296 129
y = 0,5882x - 10,708
50 0 150
200
250
300
350
400
Y=aX+b coef.angolare coef.angolare intercetta intercetta
a a auto ma b b auto ma
0,29 0,29 41 41
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
258 115 410 38 14 0.79 0.79
Il calcolo della media e della varianza ci permette di definire un range di probabile collocazione dei punti di seriazione, individuati con i tre punti grigi . La covarianza ed indice di correlazione presentano un valore discreto. Un azione che potrebbe aumentare la correlazione potrebbe essere quella di vendere in promozione i prodotti correlati.
Visualizzare il modello di correlazione tra la vendita di camicie e pantaloni, il negozio applica una promozione acquistando un camicia si ottiene il 20% di sconto nell’acquisto di un pantalone della stessa marca. Camicie
264
285
256
241
224
228
239
248
369
325
275
289
Pantaloni
135
148
129
128
124
129
135
139
206
187
154
165
X Y
264 135 35640
285 148 42180
256 129 33024
241 128 30848
224 124 27776
228 129 29412
239 135 32265
248 139 34472
369 206 76014
325 187 60775
275 154 42350
289 165 47685
x i -μx yi -μy
-6 -13 83
15 0 -4
-14 -19 274
-29 -20 592
-46 -24 1122
-42 -19 813
-31 -13 414
-22 -9 206
99 58 5703
55 39 2122
5 6 27
19 17 314
(x i -μx)² (yi -μy)²
39 176
218 0
203 371
856 410
2139 588
1785 371
977 176
495 86
9752 3335
2998 1502
250
23 352 33 281 (x i -μx)² automa (yi -μy)²automa
n 12 12
x y 100
230 124
270 148
311 173
50 0 150
200
250
300
350
400
σx σy ρ ρ auto ma σ²x automa σ²y automa χ auto ma 6893 N auto ma 691 N auto ma No rmauto ma No rmauto ma
41 25 0,97 0,97 1653 611 0,97 1,00 1,00 162,90 21,97
19834 7326 19834,25 7326
X Y
y = 0,5882x - 10,708
270 148 41037 40065 972 972 972
11666
200 150
μx μy μ(xi*yi) μx*μy σxy σxy auto ma σxy
Y=aX+b coef.angolare coef.angolare intercetta intercetta
a a auto ma b b auto ma
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
270 148 972 41 25 0.97 0.97
La media di vendita è aumentata per entrambi i prodotti, ciò significa che la promozione ha incrementato le vendite dei due prodotti. Covarianza ed indice di correlazione risultano aumentati di 562 e 0.18.
0,59 0,59 -11 -11
Esempio 3 Visualizzare il modello di correlazione tra la vendita di due software della stessa marca. Software A
5478
5896
6542
6421
6891
7210
7325
7541
7654
7896
7898
7985
Software B
2415
2685
3125
3085
3210
3452
3125
3085
3051
2954
2874
2812
X Y
5478 2415 1E+07 x i -μx yi -μy
5896 2685 2E+07
6542 3125 2E+07
6421 3085 2E+07
6891 3210 2E+07
7210 3452 2E+07
7325 3125 2E+07
7541 3085 2E+07
-1583 -1165 -519 -640 -170 149 -574 -304 136 96 221 463 909541 354772 -70424 -61213 -37591 68732
264 136 35738
480 96 45840
7654 3051 2E+07
7896 2954 2E+07
7898 2874 2E+07
7985 2812 2E+07
n 12 12
μx 7061 μy 2989 μ(xi*yi) 21192176 μx*μy 21109517 593 835 837 924 σxy 82660 62 -35 -115 -177 σxy auto ma 82660 36493 -29558 -96556 -163859 991915 σxy 82660
(x i -μx)² 2507208 1358196 269794 410134 29042 22077 69476 230000 351155 696529 699872 853006 7496489 σx (yi -μy)² 329955 92670 18383 9136 48657 213983 18383 9136 3793 1254 13321 31477 790147 σy (x i -μx)² automa 7496489 ρ 4000 (yi -μy)²automa 790147 ρ auto ma 3500 σ²x automa σ²y automa 3000 χ auto ma 2500 X 6893 N auto ma x 6271 7061 7852 Y 691 N auto ma 2000 y 2733 2989 3246 No rmauto ma y = 0,1323x + 2055,1 1500 No rmauto ma 1000 Y=aX+b coef.angolare a 500 coef.angolare a auto ma 0 intercetta b 5000 6000 7000 8000 9000 intercetta b auto ma
790 257 0,41 0,41 624707 65846 0,41 0,42 0,00 -0,21 -8,96 0,13 0,13 2055 2055
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
7061 2989 82660 790 257 0.41 0.41
La covarianza presenta un valore non elevato, indice di correlazione piuttosto basso. Dal grafico si nota una diminuizione di vendita del software B a partire dal punto [7210;3452] in controtendenza all’aumento del software A. Se separiamo l’analisi in due parti vedremo che vi correlazione positiva nei primi 6 mesi e correlazione negativa nei 6 mesi successivi.Un azione di vendita a pacchetto con riduzione di prezzo in caso di acquisto congiunto potrebbe ridurre il trend negativo.
Software A
5478
5896
6542
6421
6891
7210
Software B
2415
2685
3125
3085
3210
3452
X Y
5478 2415 1E+07 x i -μx yi -μy
5896 2685 2E+07
6542 3125 2E+07
6421 3085 2E+07
-928 -510 136 -580 -310 130 538743 158373 17591
15 90 1315
(x i -μx)² 861803 260440 (yi -μy)² 336787 96307 4000 3500 3000 2500
x y
2000 1500
18405 16813
6891 3210 2E+07
7210 3452 2E+07
n 6 6
μx 6406 μy 2995 μ(xi*yi) 19386949 μx*μy 19189104 485 804 σxy 197845 215 457 σxy auto ma 197845 104042 367008 1187072 σxy 197845
215 8040
234902 645880 2021645 σx 46082 208544 712573 σy 2021645 ρ 712573 ρ auto ma σ²x automa σ²y automa χ auto ma 6893 N auto ma 5826 y = 0,5872x 6406 - 766,35 6987 691 N auto ma 2651 2995 3340 No rmauto ma No rmauto ma
1000 500 0 5000
6000
7000
8000
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
6406 2995 197845 580 345 0.99 0.99
La covarianza presenta un valore elevato, indice di correlazione elevato.
a a auto ma b b auto ma
580 345 0,99 0,99 336941 118762 0,99 0,80 0,00 0,84 -6,69 0,59 0,59 -766 -766
Software A
7325
7541
7654
7896
7898
7985
Software B
3125
3085
3051
3085
3125
3074
X Y
7325 3125 2E+07 x i -μx yi -μy
7541 3085 2E+07
7654 3051 2E+07
-392 -176 -63 142 102 68 -55397 -17813 -4219
(x i -μx)² 153272 30800 (yi -μy)² 20022 10302
3906 4556
7898 2874 2E+07
μx 7717 μy 2984 μ(xi*yi) 22997403 μx*μy 23022178 180 182 269 σxy -24774 -30 -110 -172 σxy auto ma -24774 -5295 -19874 -46048 -148647 σxy -24774
32220 870
32942 72092 325234 σx 11990 29412 77154 σy (x i -μx)² automa 325233,5 ρ (yi -μy)²automa 77154 ρ auto ma σ²x automa σ²y automa χ auto ma X 6893 N auto ma Y 691 N auto ma No rmauto ma No rmauto ma Y=aX+b coef.angolare a coef.angolare a auto ma intercetta b intercetta b auto ma
3300
3100
7484 2870
7717 2984
7949 3097
2900 y = -0,457x + 6510,3
2700
2500 7000
8000
9000
7985 2812 2E+07
n 6 6
7896 2954 2E+07
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
7717 2984 -24774 233 113 -0.94 -0.94
La covarianza presenta un valore elevato, indice di correlazione elevato.
233 113 -0,94 -0,94 54206 12859 -0,94 0,00 0,00 -3,54 -20,22 -0,46 -0,46 6510 6510
Esempio 4 Visualizzare il modello di correlazione libri con stesso mercato di vendita. Libro A
654
623
647
625
684
628
712
714
689
654
652
643
Libro B
245
236
287
264
241
275
278
267
298
265
279
241
μx μy μ(xi*yi) μx*μy σxy σxy auto ma σxy
660 265 174964 174790 174 174 174
σx σy ρ ρ auto ma σ²x automa σ²y automa χ auto ma 6893 N auto ma 691 N auto ma No rmauto ma No rmauto ma
31 19 0,30 0,30 937 370 0,30 1,00 1,00 203,58 22,18
X Y
n 12 12
654 623 647 625 684 628 712 714 689 654 652 643 245 236 287 264 241 275 278 267 298 265 279 241 160230 147028 185689 165000 164844 172700 197936 190638 205322 173310 181908 154963 x i -μx yi -μy
(x i -μx)² (yi -μy)²
-6 -20 126
-37 -29 1073
-13 22 -300
-35 -1 24
24 -24 -558
-32 10 -335
52 13 688
54 2 125
29 33 953
-6 0 -2
-8 14 -121
41 387
1400 822
180 499
1254 0
556 560
1051 107
2661 178
2871 5
817 1111
41 0
71 303 205 560 (x i -μx)² automa (yi -μy)²automa
350
-17 -24 412
2085 11247 4435 11246,92 4435
300 250 200
x
630 245
150 y
660 265
X Y
691 284 y = 0,1854x + 142,26
100 50 0 620
640
660
680
700
720
Y=aX+b coef.angolare coef.angolare intercetta intercetta
a a auto ma b b auto ma
0,19 0,19 142 142
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
661 265 176 31 19 0.30 0.30
Ad una prima valutazione potrebbe sembrare che non sussiste correlazione tra le due variabili, tuttavia è compito di chi esegue la valutazione individuare ed intuire una eventuale correlazione con dati grezzi, prima che si effettui il calcolo degli indici; potrebbe risultare fuorviante la singola valutazione, come avviene in questo caso; se rielaboriamo i dati in trimestri otterremo opposta valutazione.
Libro A
1924
1937
2115
1951
Libro B
768
780
843
785
n X
1924
1937
2115
1951
4
μx
Y
768
780
843
785
4
μy
1477632 1510860 1782945 1531535
xi -μx
-58
-45
133
yi -μy
-26
-14
49
1502
627
6529
277
(xi -μx)²
3335
2003
17756
(yi -μy)²
676
196
2401
1982 794
μ(xi *yi )
1575743
μx*μy
1573510
-31
σxy
2234
-9
σxy automa
2234
8934
σxy
2234
946
24039
σx
81
3354
σy
24039
ρ
3354
ρ automa
0,99
σ²x
6010
1000 800
78 29 0,99
automa
σ²y automa
600
1904 765
400
1982 794
2059 823
y = 0,3716x + 57,483
0,99
6893
N automa
1,00
691
N automa
0,00
Normautoma
63,35
Normautoma
-3,56
a
0,37
200 a
0 1850 1900 1950 2000 2050 2100 2150
automa
µx µy σxy σx σy ρ χ
0,37
b
57
b automa
57
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
839
χ automa
1982 794 2234 78 29 0.99 0.99
In questo caso la covarianza aumenta 12.69 volte e l’indice di correlazione di 3.3 volte.
Esempio 5 Visualizzare il modello di correlazione tra il prodotto A e il prodotto B venduti in un ecommerce visibili nella stessa pagina di riferimento. Prodotto A
245
256
261
265
264
271
278
275
282
275
286
291
Prodotto B
15
16
12
10
6
7
5
8
3
14
12
13
X Y
x i -μx yi -μy
(x i -μx)² (yi -μy)²
245 15 3675
256 16 4096
261 12 3132
265 10 2650
264 6 1584
271 7 1897
278 5 1390
275 8 2200
282 3 846
275 14 3850
286 12 3432
291 13 3783
-26 5 -127
-15 6 -87
-10 2 -19
-6 0 0
-7 -4 28
0 -3 -1
7 -5 -37
4 -2 -9
11 -7 -80
4 4 17
15 2 29
20 3
663
218
24
35
95 4
33 0
46 17
0 10
53 26
18 4
127 50
18 15
18 16
59
233 410 4 9 (x i -μx)² automa (yi -μy)²automa
n 12 12
10
x
258 6
8y
271 10
6 4 2
y = -0,1181x + 42,047
0 240
250
260
270
280
290
300
σx σy ρ ρ auto ma σ²x automa σ²y automa χ auto ma 6893 N auto ma 691 N auto ma No rmauto ma No rmauto ma
13 4 -0,37 -0,37 159 16 -0,37 1,00 1,00 524,59 168,09
1912 197 1912,25 197
X Y
283 14
271 10 2711 2730 -19 -19 -19
-226
14 12
μx μy μ(xi*yi) μx*μy σxy σxy auto ma σxy
Y=aX+b coef.angolare coef.angolare intercetta intercetta
a a auto ma b b auto ma
-0,12 -0,12 42 42
Valutazione dei dati: 1. 2. 3. 4. 5. 6. 7.
µx µy σxy σx σy ρ χ
272 11 -18 11 4 -0.36 -0.36
L’indice di correlazione evidenzia una correlazione discretamente negativa, la collocazione nella stessa pagina di riferimento non determina l’incremento congiunto dei due prodotti.
DEFINIZIONI
ni
Numerosità seriazione
X
Variabile
Y
Variabile
µx
Media X
Sommatoria degli x valori osservati diviso n
1/n Ʃi xi
µy
Media Y
Sommatoria degli y valori osservati diviso n
1/n Ʃi yi
xi-μx
Scarti dalla media variabile X
Indica omogeità o dispersione dei valori della seriazione, elemento di calcolo per l’indice di covarianza
yi-μy
Scarti dalla media variabile Y
Indica omogeità o dispersione dei valori della seriazione, elemento di calcolo per l’indice di covarianza
(xi-μx)²
Quadrato degli scarti dalla media variabile X
Elemento di calcolo della varianza
(yi-μy)²
Quadrato degli scarti dalla media variabile Y
Elemento di calcolo della varianza
μ(xi*yi)
Media dal prodotto variabile X Y
Elemento di calcolo per l’indice di covarianza metodo secondo
Prodotto delle medie
Elemento di calcolo per l’indice di covarianza metodo secondo
μx*μy
σxy
Indice di covarianza
Indica l’eventuale convergenza o divergenza tra le variabili oggetto di analisi
1/n Ʃ (xi-μx) (yi-μy) [μ(xi*yi)](μx*μy)
σ²x
Varianza variabile X
Media dei quadrati degli scarti dalla media
1/n Ʃ(xi-μx)²
σ²y
Varianza variabile Y
Media dei quadrati degli scarti dalla media
1/n Ʃ(yi-μy)²
σx
Scarto quadratico medio variabile X
Risultato comparabile con i valori e gli indici di posizione
[1/n Ʃ(xi-μx)²]½
σy
Scarto quadratico medio variabile Y
Risultato comparabile con i valori e gli indici di posizione
[1/n Ʃ(yi-μy)²]½
ρ
Indice di correlazione
Indica il grado di correlazione tra le due variabili
σxy/ σx* σy
χ
Indice di Pearson
Indica il grado di correlazione tra le due variabili
Ʃ (xi-μx )(yi-μy)
N X~N(µ,σ²)
Distribuzione Normale
Normalizza
[Ʃ(xi-μx)² Ʃ(yi-μy)²]½
Restituisce la distribuzione Normale per la media e la varianza indicate Valore normalizzato
a
Pendenza
Indica la pendenza dell’equazione Y=aX+b
σxy/ σ²x
b
Intercetta
Indica l’intercetta dell’equazione Y=aX+b
µy- a* µx
MODELLO FOGLIO DI LAVORO