Ci sono due categorie di università: le università progredite e le università non progredite. La nostra rientra nella seconda categoria per numerosissime ragioni, per esempio, i servizi offerti agli studenti, nello specifico il materiale didattico. In tutte le facoltà italiane eccetto la Facoltà di Economia di Catania, in discipline tecniche, come matematica, statistica e altro, il minimo che si possa fare è fornire esercizi svolti. Con questo documento, che mai il docente avrebbe pensato di realizzare, il messaggio che voglio lanciare è proprio questo: in questa condizione allarmante della nostra facoltà, i servizi innovativi, possono essere offerti solo da chi vive i problemi, cioè dagli studenti, e possiamo farlo grazie alla rete e al nostro blog.
Francesco Alessi
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -1-
COMPITI DI STATISTICA Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01074 Cognome e Nome:_____________ ___________________ Matr.:_____________ Data compito:__09/11/06__ 1)p1La seguente tabella riporta i dati relativi alla produzione di formaggio Grana Padano relativi al periodo 2000-‐2005 per la provincia di Piacenza e l’Italia (forme prodotte/10000). Calcolare lo scarto quadratico medio dei dati relativi a Piacenza Anno
Piacenza
Italia
2000
39
377
2001
44
386
2002
48
404
2003
49
406
2004
48
414
2005
50
441
(A) 14,22 (B) 20,51 (C) 45 (D) 3,77 SOLUZIONE 1) Media aritmetica: Somma dei valori/Numero dei valori= =(39+44+48+49+48+50)/6=278/6=46,3333 2) Valori
39
44
48
49
48
50
Scarto dalla media=
39-‐46,3333=
44-‐46,3333=
48-‐46,3333=
49-‐46,3333=
48-‐46,3333=
50-‐46,3333=
Valore-‐Media
-‐7,3333
-‐2,3333
1,6667
2,6667
1,6667
3,6667
3)Lo scarto quadratico medio: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -2-
Risposta esatta: (D)3,77. 2)p.1Calcolare il numero indice a base fissa (anno 2000=100) della produzione Italiana per l’anno 2004 (A) 0,991 (B) 414 (C) 1,098 (D) 1,019 SOLUZIONE Anni
Italia
2000
377
2004
414
Indici
L’indice per il 2004 vale 109,81. Risposta esatta: (C)1,098 3)p.1Calcolare il numero indice a base mobile (anno 2000=100) della produzione di Piacenza per l’anno 2005 (A) 0,958 (B) 1,280 (C) 1,041 (D) 50 SOLUZIONE Anni
Piacenza
Indici
2004
48
-‐
2005
50
L’indice per il 2005 vale 104,17. Risposta esatta: (C) 1,041. 4)p.1Calcolare il coefficiente di correlazione delle due distribuzioni. (A) 0,254 (B) 0,857 (C) -‐0,873 (D) 0,589 SOLUZIONE 1)
;
Gli ingredienti necessari per il calcolo di r sono:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -3-
Risposta esatta: (B)0,857. 5)p.1Calcolare la mediana della distribuzione di Piacenza (A) 48,5 (B) 46 (C) 49 (D) 48 SOLUZIONE Ordinando i dati: 39; 44; 48; 48; 49; 50 Essendo N=6, vi sono due posti centrali, dati da N/2=6/2=3 e (N/2)+1=(6/2)+1=4. La mediana è data dalla semisomma dei termini che occupano i posti centrali, e quindi: Risposta esatta: (D)48. 6) Viene condotta un’indagine tra gli studenti di una scuola per analizzare se vi sia relazione tra la loro abitudine al fumo e quella dei genitori. I dati raccolti, relativi a 100 intervistati, sono riassunti nella seguente tabella doppia: Abitudine al fumo dei Lo studente fuma? genitori si no totale http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -4-
Nessuno uno solo Entrambi Totale
3 8 7 18
22 34 26 82
25 42 33 100
Calcolare la frequenza prevista corrispondente alla coppia di modalità “entrambi” e “Si” qualora vi fosse indipendenza tra abitudine al fumo degli studenti e quella dei genitori. (A) 7,5 (B) 8 (C) 5,94 (D) 7 SOLUZIONE In una tabella a doppia entrata e sono le frequenze marginali di riga e di colonna, n è il totale delle unità statistiche. L’indipendenza tra due caratteri si manifesta quando tutte le frequenze congiunte soddisfano la seguente relazione Tabella delle frequenze teoriche calcolate in caso di indipendenza: Abitudine al fumo dei Lo studente fuma? genitori si no totale Entrambi 5,94 Totale
Risposta esatta: (C)5,94. Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01138 Cognome e Nome:_____________ ___________________ Matr.:_____________ Data compito:__26/01/07__ http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -5-
1)p.1Se l'81% della variabilità di Y è spiegata dalla variabile X, qual è il valore assoluto del coefficiente di correlazione r di Pearson? (A) .49 (B) .64 (C) .90 (D) .87 La percentuale di variabilità di Y spiegata dalla variabilità di X è data da: Risposta esatta: (C).90.
2)p.2Le differenze medie si fondano sulle differenze fra: (A) ogni termine della distribuzione ed una media (B) ogni termine della distribuzione e tutti gli altri (C) ogni termine della distribuzione e la media aritmetica SOLUZIONE Col nome di differenze medie di un insieme di dati si intendono delle medie calcolate sulle differenze fra ciascun dato e tutti gli altri. Risposta esatta:(B)ogni termine della distribuzione e tutti gli altri. 3)p.1Con le misure eseguite su una scala ordinale si può fare (A) la somma (B) il prodotto (C) nessuna delle quattro operazioni SOLUZIONE Operazioni consentite: Risposa esatta: (C)nessuna delle quattro operazioni. 4)p.2La differenza semplice media, calcolata in un gruppo di soggetti con reddito medio di € 20.000 è risultata € 18.000. Pertanto il rapporto di concentrazione dei redditi è (A) 0,58 (B) 0,75 (C) 1,2 (D) 0,45 (E) 0,90 (F) 0,11 SOLUZIONE , dove è la differenza media semplice. Il rapporto di concentrazione equivale al rapporto tra la differenza semplice media ed il doppio della media aritmetica.
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -6-
Risposta esatta: (D)0,45. 5)p.2Uno studente ha superato due esami con una media di 21. La varianza dei due voti è uguale a 9. Successivamente supera altri due esami, riportando in uno 28 e nell’altro 30. La varianza dei quattro voti sarà (A)17 (B) 10 (C)28 (D) 21 (E)2 F)Non si può calcolare SOLUZIONE 1)
2)La media generale è:
3)La scomposizione della varianza può essere la seguente:
N=4, g=2 gruppi e Abbiamo che
Risposta esatta: (D)21. 6)p.2Le confezioni di succhi di frutta prodotti da un’industria alimentare hanno, in media, rispetto a quanto dichiarato nell’etichetta, nel 5% dei casi un contenuto inferiore; nell’ 8% dei casi una concentrazione inferiore e nel 2% dei casi sia contenuto che concentrazione inferiori. La probabilità che una confezione non sia conforme a quanto dichiarato solo per contenuto o solo per concentrazione o per entrambi i motivi è, pertanto A)10% B) 11% C) Non si può dire D) 13% E)15% SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -7-
Risposta esatta: (B) 11%. 7)p.1Il numero indice degli investimenti esteri in un Paese, con base 2003=100, nel 2005 è risultato 79,3. Questo sta a significare che nel 2005, rispetto al 2003, si è avuto (A)una diminuzione del 20,7% (B)una diminuzione del 79,3% (C)un aumento del 79,3% (D)un aumento del 20,7% SOLUZIONE Anni
Indici
2003
100
2005
79,3
Nel 2005 c’è stata una riduzione del 20,7%(=100-‐79,3) sul 2003. Risposta esatta: (A)una diminuzione del 20,7%. Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01442 Cognome e Nome:_____________ ___________________ Matr.:_____________ Data compito:__23/01/09__
1)Date le due distribuzioni X e Y sotto riportate, determinare i parametri della retta di regressione a e b X 46 52 61 34 61 Y 37 62 64 47 38
(A)a= 40; b=-‐0,56 (B) a=0,81; b=13,57 (C) a=23,79; b=0,44 (D) a=31,17; b=0,33 (E) a=23,79; b=2,44 (F) a= 35,03; b=0,28 SOLUZIONE Le quantità utili per rispondere al quesito sono riassunte nella seguente tabella: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -8-
46
37
-‐4,8
-‐12,6
23,04
158,76
60,48
52
62
1,2
12,4
1,44
153,76
14,88
61
64
10,2
14,4
104,04
207,36
146,88
34
47
-‐16,8
-‐2,6
282,24
6,76
43,68
61
38
10,2
-‐11,6
104,04
134,56
-‐118,32
254
248
0
0
514,8
661,2
147,6
n=5
Risposta esatta: (F)a=35,03; b=0,28. 2)La varianza di un gruppo di soggetti secondo la statura (in cm) è 36. Se si adatta alla distribuzione la curva normale, la differenza interquartile (tenendo presente che P(|Z|<0,6745)=0,5) risulta (A)4,05 cm (B) 8,10 cm (C) 6,02 cm (D) 8,04 cm SOLUZIONE I primi 3 quartili si dispongono lungo l’asse delle ascisse ad intervalli tali che l’area compresa tra uno e l’altro sia uguale a 0,25. Per la simmetria, rispetto alla normale standard
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -9-
Risposta esatta:(B)8,10 cm. 3)Nella tavola di correlazione di due variabili (tabella a doppia entrata), ciascuna delle quali può assumere, rispettivamente, r ed s modalità, le distribuzioni parziali sono in numero di (A) r + s -‐ 1 (B) r + s (C) due (D) r + s – 2 SOLUZIONE In una tavola a doppia entrata vi sono s+k distribuzioni parziali. Risposta esatta: (B)r+s. 4)Un quiz è composto da 5 domande, tra loro indipendenti, ciascuna con cinque possibili risposte di cui una sola corretta. Assumendo che un candidato scelga a caso la risposta ad ogni quesito, si calcoli la probabilità che il numero di risposte esatte sia al massimo uno (A)0,33 (B) 0,45 (C) 0,73 (D) 0,93 SOLUZIONE Per ogni quesito, rispondendo a caso, si ha probabilità pari a 1/5 di rispondere correttamente e pari a 4/5 di sbagliare. Le 5 domande costituiscono sottoprove indipendenti tra loro, per cui indicando con l’evento “risposta esatta alla i-‐esima domanda” e con X il numero di risposte esatte su 5 domande si ha: L’evento “numero di risposte esatte al massimo pari a uno” è dato dall’unione dei due eventi incompatibili tra loro: “X=0” e “X=1”, per cui la probabilità totale cercata sarà data dalla somma delle corrispondenti due probabilità. La prima è di immediata derivazione: Per quanto riguarda la seconda, si tenga presente che l’unica risposta esatta può essere ottenuta alla prima domanda, oppure alla seconda,…, oppure all’ultima, ovvero in 5 diversi modi; in ciascun caso la probabilità è data da: per cui la probabilità totale di “X=1” è data da: Concludendo: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -10-
Risposta esatta: (C)0,73. 5)In generale, se il rapporto di correlazione di una variabile Y su una variabile X assume un valore prossimo ad 1, il coefficiente di correlazione lineare può avere un valore intorno a 0? (A)Sì, ma solo se la regressione è lineare (B) No, non può mai verificarsi. (C) Sì, se il legame è non lineare può capitare (D) Sì, accade tutte le volte che due variabili sono indipendenti. SOLUZIONE 6)Se il coefficiente di correlazione lineare r tra due variabili ha un valore negativo, prossimo a -‐1, la correlazione è: (A)forte (B) debole (C) non si può dire (D) assente 7)Si deve ripartire un podere, costituito da 100 appezzamenti quadrati, in 100 appezzamenti di uguale superficie. Determinare il lato medio di ogni appezzamento: Lato in m.
100
16 n.ro di appezzamenti
50
25
Totale
41
64
100
(A)55 (B) 62 (C)50 (D) 54 SOLUZIONE Nella seguente tabella sono riportati alcuni calcoli utili per lo sviluppo dell’esercizio. 100
16
1.600
10.000
160.000
50
41
2.050
2.500
102.500
25
64
1.600
625
40.000
Tot
121
5.250
-‐
302.500
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -11-
La media quadratica del carattere rilevato è data da: Risposta esatta: (C)50. 8)Si determini il valore medio della seguente distribuzione del numero di pratiche evase dai 22 impiegati di un certo comune, in una data settimana lavorativa: p.evase
2
3
4
5
6
8
10
Totale
Tot.Imp
5
4
3
5
3
1
1
22
(A)3,56 (B) 6,12 (C) 5,23 (D) 6,67 (E) 4,32 (F) 4,59 SOLUZIONE Applicando la formula della media aritmetica per le seriazioni, si ottiene:
Risposta esatta: (E)4,32.
SCRITTO FINO APRILE 2008 La media della distribuzione di un gruppo di soggetti secondo la statura è 174 cm e lo scarto quadratico medio 6 cm. Se si adatta alla distribuzione la curva normale,il 90° centile (tenendo presente che P|Z|< 1,645=0,95) risulta: (A)192,9 (B)175,8 (C)186,9 (D)181,68 SOLUZIONE μ = 174 σ = 6 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -12-
Con Z ~ N(μ, σ²) Dobbiamo trovare il 90° centile, ovvero la quantità t tale per cui P(X < t) = 0.9 Standardizziamo P[(x -‐ μ)/σ < (t -‐ μ)/σ] = 0.9 Abbiamo quindi il quantile di una gaussiana standard Φ[(t -‐ μ)/σ] = 0.9 Sulle tavole della gaussiana standard il quantile 0.9 corrisponde ad 1.29 (t -‐ μ)/σ = 1.29 1.28 I due valori più prossimi a 0.9 sono: 0,8997 e 0,9015. 0,9-‐0,8997=0,0003; 0,9015-‐0,9000=0,0015 quindi il valore più prossimo a 0,9 è 0,8997; di conseguenza si approssima z con 1,28. Oppure: i due valori più prossimi a 0,9 sono 0,8997 e 0,9015 a cui corrispondono, rispettivamente, z=1,28 (1,2+0,08) e z=1,29 (1,2+0,09); t -‐ μ = 1.28 σ t = 1.28 σ + μ Sostituendo i dati t = 1.29 (6) + 174 = 7.74 + 174 = 181,74 t = 1.28 (6) + 174 = 7.68 + 174 = 181,68 Quindi t = 181,68 Risposta esatta: (D)181,68. -‐ Al primo corso di laurea di editoria e giornalismo in una Università, il 25 % degli studenti è stato bocciato in latino, il 15% in inglese e il 10 % in http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -13-
entrambe le materie. Si sceglie a caso uno studente, determinare la probabilità che sia stato bocciato in una delle due.
(A) 0,30 (B) 0,56 (C) 0,11 (D) 0,90 (E) 0,02 (F) 0,34 SOLUZIONE Si considerino gli eventi A: essere bocciato in latino e B: essere bocciato in inglese Pr(A)=0,25 Pr(B)=0,15 Risposta esatta: (A)0,30. -‐12 imprese presentano i seguenti valori relativamente alle variabili X ed Y, 1 e 7; 2 e 8; 3 e 9; 3 e 5; 4 e 6; 5 e 7; 5 e 3; 6 e 4; 7 e 5; 7 e 1; 8 e 2; 9 e 9. Quanto vale il coefficiente di correlazione? A) 0,418 B) -‐ 0,76441 C) -‐ 0,55824 D) -‐ 0,38695 (E) 1 SOLUZIONE X
Y
1
7
2
8
3
9
3
5
4
6
5
7
5
3
6
4 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -14-
7
5
7
1
8
2
9
9
Totale 60
1)
66
;
Gli ingredienti necessari per il calcolo di r sono:
Risposta esatta:(D)-‐0,38695 -‐Con riferimento alle condizioni che favoriscono il fallimento, sono state definite tre categorie di imprese, A, B, C, e si stima che, secondo che un’impresa appartenga ad A, a B, o a C, la probabilità di fallimento sia del 9%, dell’8% o del 10%. Senza approfondite verifiche non si può stabilire a quale http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -15-
categoria appartenga un’impresa, ma si stima che con probabilità del 20% appartenga ad A, del 50% a B e del 30% a C. Un’impresa di cui non si conosceva la categoria è fallita. La probabilità che appartenesse alla categoria A, che inizialmente era del 20% diventa a posteriori del (A) 12.5% (B) 9% (C) 20.4% (D) 13.5% (E) 10.0% (F) 20% SOLUZIONE Indicando con F l’evento “l’impresa è fallita”, e con Pr(X) la probabilità che l’impresa provenga dalla categoria X, le informazioni fornite dal testo possono essere schematizzate nel seguente modo: Pr(A)=0,20; Pr(B)=0,50 Pr(C)0,30; P(F|A)=0,09; Pr(F|B)=0,08; Pr(F|C)=0,1. L’evento F, inoltre, può essere partizionato nel seguente modo: Per cui: La probabilità da valutare è invece: Risposta esatta: (C)20,4%. -‐Considerando che la media e lo scarto quadratico medio di un campione sono pari rispettivamente a 40 e a 5, quale sarà lo scarto ridotto z relativo a un soggetto che ha un valore pari a 2 volte lo scarto quadratico medio sopra la media? (A) 30 (B) -‐2 (C) 2 (D) 50 SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -16-
poiché
allora Risposta esatta: (C) 2 -Considerando che la media e lo scarto quadratico medio di un campione sono rispettivamente pari a 39 e a 9, quale sarà lo scarto ridotto z relativo ad un soggetto che ha un valore pari a 2,5 volte lo scarto quadratico medio sotto la media? (A)-‐2 (B)50 (C)5 (D)2,5 (E)-‐5 (F)-‐ 2,5 SOLUZIONE poiché
allora Risposta esatta: (F)-‐2,5. Dati i seguenti gruppi di osservazioni, calcolare la varianza totale: Gruppo A B
Numero di osservazioni 4 8
10 9.5
2 1
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -17-
C
6
11
3
(A)1.9 (B) 2.3 (C) 6 SOLUZIONE Denotiamo con , , , , , , rispettivamente la media e la varianza del gruppo A, la media e la varianza del gruppo B e la media e la varianza del gruppo C. a)La media totale si ottiene come
dove , e indicano rispettivamente la numerosità dei tre gruppi. b)La varianza totale si ottiene come somma della varianza tra i gruppi varianza nei gruppi
e la
. Abbiano rispettivamente:
e quindi la varianza totale risulta
=0,4321+1,8889=2,321 Risposta esatta: (B)2,3. -‐Data la distribuzione per due variabili, calorie (C) e proteine (P) quale delle due ha maggiore variabilità: C 240 397 175 190 157 98 98 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -18-
P 27 29 26 29 30 16 22 (A)P B) C C) Nessuna SOLUZIONE
Confrontando i due coefficienti di variazione si conclude che la distribuzione C è più variabile rispetto alla distribuzione P. Risposta esatta: B(C) -‐Date le distribuzioni A e B determinare quale delle due ha maggiore variabilità e spiegarne il perché: A 12 21 13 24 43 34 56 11 B 65 30 21 19 20 17 19 21 (A)A B) B C) Nessuna http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -19-
Confrontando i due coefficienti di variazione si conclude che la distribuzione A è più variabile rispetto alla distribuzione B. Risposta esatta: (A)A. -‐Dati i valori 15,2; 15, 9; 7; 16,9; 17,5, calcolare la loro differenza semplice media applicando la formula: ;
;
(A) 7,540 (B) 5,540 (C) 8,540 (D) 4,540 SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -20-
Si ordinano i dati in modo non decrescente. i
Dati
1
7
2
15,2
3
15,9
4
16,9
5
17,5
Totale 72,5
Il secondo passo è quello di determinare la media aritmetica semplice: Utilizzare il secondo metodo richiede di applicare la formula: Posto n=5 e ricordando che le xi in questo caso sono i dati, occorre determinare la somma di (2i-‐n-‐1)xi. i
2i-‐n-‐1
1
7
2
15,2
3
15,9
4
16,9
5
17,5
(2i-‐n-‐1)
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -21-
Totale
72,5
45,4
Metodo 2:
Risposta esatta: (D)4,540 -‐Dato il seguente insieme di valori calcolare la differenza semplice media con ripetizione: 15,2 ; 15,9 ; 18 ; 16,9 ; 17,5. (p.3) (A)0,558 B) 3,761 C) 1,152 D) 4,320 SOLUZIONE Si ordinano i dati in modo non decrescente. i
Dati
1
15,2
2
15,9
3
16,9
4
17,5
5
18
Totale 83,5
Il secondo passo è quello di determinare la media aritmetica semplice: Utilizzare il secondo metodo richiede di applicare la formula: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -22-
Posto n=5 e ricordando che le xi in questo caso sono i dati, occorre determinare la somma di (2i-‐n-‐1)xi. i
2i-‐n-‐1
1
15,2
2
15,9
3
16,9
4
17,5
5
18
Totale
83,5
(2i-‐n-‐1)
14,4
La differenza semplice media con ripetizione si ottiene: Risposta esatta: (C)1,152. -‐Dato il numero di sale cinematografiche per 10000 abitanti nel 1998 in alcuni comuni, calcolare il rapporto di concentrazione: salerno matera potenza cosenza catanzaro reggio crotone
26,9 27,4 31 36,3 44,7 54,8 80
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -23-
(A)0.45 (B) 0.54 (C) 0.26 (D) 0.62 (E) 0.17 (F) 0.78 SOLUZIONE Si ricordi sempre che bisogna anzitutto ordinare in modo non decrescente le modalità, e poi si procede con i calcoli. Comuni
n° Sale cinematografiche
Salerno
26,9
1/7=0,1429
26,9
26,9/301,1=0,0893
0,1429-‐0,0893=0,0536
Matera
27,4
2/7=0,2857
26,9+27,4=54,3
54,3/301,1=0,1803
0,2857-‐0,1803=0,1054
Potenza
31
3/7=0,4286
54,3+31=85,3
85,3/301,1=0,2833
0,4286-‐0,2833=0,1453
Cosenza
36,3
4/7=0,5714
85,3+36,3=121,6
121,6/301,1=0,4039
0,5714-‐0,4039=0,1675
Catanzaro
44,7
5/7=0,7143
121,6+44,7=166,3
166,3/301,1=0,5523
0,7143-‐0,5523=0,162
Reggio
54,8
6/7=0,8571
166,3+54,8=221,1
221,1/301,1=0,7343
0,8571-‐0,7343=0,1228
Crotone
80
7/7=1
221,1+80=301,1
301/301=1
1-‐1=0
Totale
301,1
0,7566
Risposta esatta: (C)0,26. -‐Determinare il valore dell’indice chi-‐quadrato per la seguente tavola di contingenza L M N A 150 50 40 B 20 160 20 C 90 10 200 (A)85 B) 816,6 C) 706,16 D) 480,22 E) 790,2 F) 370,5 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -24-
SOLUZIONE L
M
N
Totale
A
150
50
40
240
B
20
160
20
200
C
90
10
200
300
220
260
740
Totale 260
In questi dati il primo carattere assume 3 modalità, sicché k=3 e anche il secondo carattere assume 3 modalità e pertanto h=3. Infine la numerosità complessiva è n=740. Utilizzando la formula si ha
L’indice
è positivo quindi fra i due caratteri vi è dipendenza.
Risposta esatta: (D)480,22. -‐Determinare il valore dell’indice chi-‐quadrato per la seguente tavola di contingenza L M N A 150 50 40 B 20 160 20 C 90 30 400 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -25-
(A)671,87 B) 816,6 C) 706,16 D) 480,22 E) 790,2 F) 370,5 SOLUZIONE L
M
N
Totale
A
150
50
40
240
B
20
160
20
200
C
90
30
400
520
240
460
960
Totale 260
In questi dati il primo carattere assume 3 modalità, sicché k=3 e anche il secondo carattere assume 3 modalità e pertanto h=3. Infine la numerosità complessiva è n=960. Utilizzando la formula si ha
L’indice
è positivo quindi fra i due caratteri vi è dipendenza.
Risposta esatta:(A)671,87. -‐Due esperti hanno giudicato indipendentemente la qualità di 5 prodotti, indicati con le lettere da A a E. Le due graduatorie differiscono in quanto B e C sono,rispettivamente, al secondo e al terzo posto nella prima graduatoria e viceversa nella seconda e così pure D ed E sono, rispettivamente, al quarto e http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -26-
al quinto posto nella prima graduatoria e viceversa nella seconda. L’indice di Spearman è: (A)0,8 (B) 0.5 (C) 7 (D) 8 (E) 0.2 (F) 78 SOLUZIONE Qualità rango(x) rango(y) prodotti a
1
1
0
0
b
2
3
-‐1
1
c
3
2
1
1
d
4
5
-‐1
1
e
5
4
1
1
0
4
Totali N=5
Risposta esatta: (A)0,8 -‐E’ stato determinato che lo 0,2% della popolazione italiana è allergica ad un certo vaccino; determinare la probabilità che in un paese di 1.500 abitanti vi siano oltre 3 individui allergici. (A)35,27% (B) 45,27% (C) 25,27% (D) 15,27% SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -27-
Applichiamo la formula seguente
, detta esponenziale di Poisson:
In genere si considera una buona approssimazione quando n>50 e p<0,1. P(X>3)=P(X=4)+P(X=5)+…+P(X=1500) È evidente che è molto più semplice calcolare il complementare di P(X>3) cioè calcolare Pertanto poiché P(A)=1-‐P(A)’ Risposta esatta: (A)35,27%. -‐E’ stato determinato che lo 0,1% della popolazione italiana è allergica ad un certo vaccino; determinare la probabilità che in un paese di 1.500 abitanti vi siano oltre 3 individui allergici. (A)6,56% (B) 45,27% (C) 25,27% (D) 15,27% SOLUZIONE Applicando la formula seguente
, detta esponenziale di Poisson:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -28-
In genere si considera una buona approssimazione quando n>50 e p<0,1. P(X>3)=P(X=4)+P(X=5)+…+P(X=1500) È evidente che è molto più semplice calcolare il complementare di P(X>3) cioè calcolare Pertanto poiché P(A)=1-‐P(A)’ Risposta esatta: (A)=6,56%. -‐In un istituto scolastico il personale tecnico è composto da 12 maschi e 4 femmine. Vengono scelti a caso tre dei 16 impiegati: qual è la probabilità p che siano tutti i maschi? (A)0.45 (B)0.21 (C) 0.39 (D) 0.78 (E) 0.12 (F) 0.67 SOLUZIONE La probabilità che la prima persona scelta sia di sesso maschile è:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -29-
; ci sono 12 uomini e 4 donne: . È come pescare una pallina bianca da un’urna contenente 12 palline bianche e 4 nere: 12+4=16 è il totale dei casi, 12 è il totale dei casi favorevoli. La probabilità che anche la seconda persona scelta sia di sesso maschile è condizionata dal verificarsi dell’evento
; sapendo che il primo scelto è un uomo, rimangono 15 persone di cui 11 uomini e 4 donne:
Infine, la probabilità che la terza persona scelta a caso sia di sesso maschile è condizionata al verificarsi dell’evento entrambi gli eventi).
e dell’evento
(intersezione di
; analogamente, nell’ipotesi che siano estratti due uomini, rimangono 10 uomini e 4 donne: casi favorevoli, 10; casi totali, 14. . Quindi la probabilità che le tre persone siano tutte di sesso maschile sarà pari a:
2°Modo di risolvere Il problema rientra con evidenza nei casi di estrazione in blocco (distribuzione ipergeometrica). Nel caso generale, se un’urna contiene H palline, di cui h bianche e H-‐h nere, e si estraggono n palline in blocco, qual è la probabilità che a delle palline estratte siano bianche?
Applicando al caso particolare: H=16 (Totale impiegati) http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -30-
h=12 (impiegati maschi) H-‐h=4 (impiegate femmine) n=3 (impiegati scelti a caso) a=3 (numero dei maschi tra quelli scelti) Quindi:
Risposta esatta: (C)0,39. -‐Il fatturato di un’impresa è stato di € 75.000,00 nel 2000, di € 78.000,00 nel 2001 e di € 84.000,00 nel 2002. I numeri indice con base 2000-‐100 sono: (A) 100; 104; 112 (B) 100; 104; 108 (C) 100; 108; 112 SOLUZIONE Anni
Fatturato
2000
75.000
2001
78.000
2002
84.000
Indici
Risposta esatta: (A)100; 104; 112. -‐In un magazzino all’inizio del 2004 vi sono 20 quintali di merce. Se nell’arco dello stesso anno sono entrati ed usciti rispettivamente, 247 quintali e 245 quintali di merce il rapporto di durata in mesi sarà? (A) 0,976 m (B) 1,024 (C) 1,041 (D) 1,25 SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -31-
Il rapporto di durata è dato da:
consistenza all’inizio del 2004 Consistenza media=
Calcoliamo la semisomma dei movimenti e rapportiamola ai mesi:
q
q
La durata media delle giacenze è pari a:
mesi.
Risposta esatta: (B)1,024. -‐In un campione di 131 pazienti affetti da cirrosi è stato rilevato il numero di complicanze rilevate. I dati sono stati organizzati nella seguente distribuzione di frequenza, determinare la mediana delle complicanze. Complicanze 0 1 2 3 4 ≥ 5
5 17 24 28 35 22
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -32-
(A)5 B) 0 C) 1 D) 3 E) 4 F) 66 SOLUZIONE Essendo N=131 dispari, esiste un solo posto centrale, in corrispondenza della (N+1)/2=
ma unità; le frequenze cumulate sono
0
5
5
1
17
22
2
24
46
3
28
74
4
35
109
22
131
131
Il 66° posto si trova in corrispondenza della modalità “3 complicanze”, e quindi Me=3 complicanze. Risposta esatta: (D)3. -‐In una prova di abilità manuale un gruppo di n=20 ragazzi, distinti con le lettere da A a T, ottengono i seguenti risultati ( o = ottimo, d = distinto, b = buono, s = sufficiente, i = insufficiente): A B C D E F G H I J K L M N O P Q R S T
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -33-
d s o i o s d o i i s d s o i b i o d s qual è la somma totale dei ranghi? (A)210 (B) 100 (C) nessuna delle 3 (D) 20 SOLUZIONE Ragazzi
Voti rango provvisorio
rango definitivo
A
d
6
7,5
B
s
11
13
C
o
1
3
D
i
16
18
E
o
2
3
F
s
12
13
G
d
7
7,5
H
o
3
3
I
i
17
18
J
i
18
18
K
s
13
13
L
d
8
7,5
M
s
14
13
N
o
4
3
O
i
19
18
P
b
10
10
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -34-
Q
i
20
18
R
o
5
3
S
d
9
7,5
T
s
15
13
N=20
210
Metodo di risoluzione abbreviato, controprova. I ranghi vanno da 1 a 20. Perciò la somma è: 1+2+3+4+…+18+19+20=
Risposta esatta:(A)210. -‐In un giuoco del tipo “gratta e vinci” il 40 % delle schede è vincente. Acquistando 8 schede, quale è la probabilità che almeno due sono vincenti? (A)0,04 B) 0,68 C) 0,005 D) 0,89 SOLUZIONE La v.c. di riferimento è X=”numero di schede vincenti su n=8”, che segue la distribuzione Binomiale con parametri n=8 e p=0,4. Indichiamo con A l’evento “la scheda è vincente” e con il suo complementare, dove
e
Sia X la v.a. che conta quante delle 8 schede considerate sono vincenti. Allora È evidente che è molto più semplice calcolare il complementare di cioè calcolare P(X<2).
Pertanto poiché P(A)=1-‐P(A)’ http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -35-
p=0,4 1-‐p=1-‐0,4=0,6 Risposta esatta: (D)0,89 -‐In un giuoco del tipo “gratta e vinci” il 40 % delle schede è vincente. Acquistando 8 schede, quale è la probabilità che più di due sono vincenti. (A)0,04 B) 0,68 C) 0,005 D) 0,89 SOLUZIONE La v.c. di riferimento è X=”numero di schede vincenti su n=8”, che segue la distribuzione Binomiale con parametri n=8 e p=0,4. Indichiamo con A l’evento “la scheda è vincente” e con il suo complementare, dove
e
Sia X la v.a. che conta quante delle 8 schede considerate sono vincenti. Allora È evidente che è molto più semplice calcolare il complementare di cioè calcolare
.
Pertanto poiché P(A)=1-‐P(A)’ http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -36-
p=0,4 1-‐p=1-‐0,4=0,6 Risposta esatta: (B)0,68. -‐In un gruppo di paesi, il coefficiente di regressione del tasso di mortalità infantile sul reddito pro-‐capite è negativo e la frazione della varianza del suddetto tasso, spiegata dal reddito, è del 43 %. Qual è il valore del coefficiente di correlazione lineare tra le due variabili? (p.1) (A)0,65 B) -‐0,43 C) 0,36 D) 0,53 E) -‐0,65 F) 0,25 SOLUZIONE Il segno della correlazione coincide con quello della covarianza. Se il coefficiente di regressione è negativo, vuol dire che la covarianza ( ) è negativa, perché il denominatore del coefficiente di regressione è sempre positivo. Questo implica che anche il coefficiente di correlazione sia negativo, perché anche il suo denominatore è sempre positivo. La varianza, infatti, è http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -37-
sempre positiva perché al suo numeratore vi è una somma di quadrati e al denominatore un numero positivo; lo scarto quadratico medio è sempre positivo perché è la radice quadrata della varianza.
, dove ESS è la “devianza spiegata” (per ottenere la varianza basta
dividere per la numerosità), TSS la devianza totale. In dettaglio, se sono i dati osservati, quelli stimati dal modello di regressione e gli errori Il primo membro è la devianza totale, i due termini del secondo sono, rispettivamente, la devianza spiegata e quella residua. Si scrive anche TSS=ESS+RSS e si ha: . Dire “la frazione della varianza del suddetto tasso, spiegata dal reddito, è del 43%” equivale a dire che il rapporto tra varianza spiegata e varianza totale, quindi , è 0,43. Per ottenere il coefficiente di correlazione, essendo il suo quadrato, dobbiamo per prima cosa calcolare
Poi, dobbiamo tenere conto dell’informazione “il coefficiente di regressione del tasso di mortalità infantile sul reddito pro-‐capite è negativo” e concludere che il valore del coefficiente di correlazione è -‐0,65. Risposta esatta: (E)-‐0,65. -‐In una popolazione il 10 % possiede un telefono cellulare. Estraendo a caso 8 persone, quale è la probabilità che almeno due possiedano il telefono cellulare? (p.3) SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -38-
È evidente che è molto più semplice calcolare il complementare di cioè calcolare
.
Pertanto poiché P(A)=1-‐P(A)’ X ∼Bin(8; 0,1) 1-‐p=1-‐0,1=0,9 n=8 p=0,1 probabilità di successo Risposta esatta:(B)0,18. A) 0,58 B) 0,18 C) 0,04 D) 0,005 -‐ In una lotteria i premi estratti sono uno ogni cinque biglietti venduti. Quanti biglietti è necessario acquistare affinché la probabilità di vincere almeno un premio sia maggiore del 60%? (A) 4 B) 7 C)6 D) 5 SOLUZIONE Abbiamo eventi del tipo successo-‐insuccesso (il successo è vincere il premio) con probabilità di successo pari a 0,2. Il testo chiede però di ragionare su n biglietti, cioè sulla somma di n eventi indipendenti. Pensare ad una distribuzione Binom(n,0,2). Ragioniamo sull’evento complementare perché semplifica i calcoli. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -39-
Quindi il problema diventa: in una distribuzione Binom(n, 0,2) quanto deve essere n affinché la probabilità di non avere alcun successo sia minore o uguale al 40%? da cui n=5. Oppure ci si potrebbe egualmente chiedere: in una distribuzione binomiale Binom(n, 0,8) quanto deve essere n affinché la probabilità di avere n successi (gli insuccessi sono diventati ora successi, con probabilità 0,8) sia minore o uguale al 40%? da cui n=5, come sopra. Possiamo risolvere e ottenere n=5, così: .
Oppure l’esercizio si può risolvere: procedimento lungo e non considerando l’evento complementare. Compro un biglietto:
. Totale: 0,2<0,6
Compro due biglietti: 0,32+0,04=0,36<0,6.
Compro tre biglietti:
Totale:
Totale: 0,384+0,096+0,008=0,488<0,6. Compro quattro biglietti: 0,4096+0,1536+0,0256+0,0016=0,5904<0,6.
Totale:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -40-
Compro cinque biglietti:
Totale: 0,4096+0,2048+0,0512+0,0064+0,0003=0,6723>0,6. Quindi n=5. Risposta esatta: (D)5. -‐In un aula d’esame 158 studenti hanno sostenuto una prova che ha avuto i seguenti esiti come riportato in tabella:
SI 80 36 116
F M T
NO 30 12 42
T 110 48 158
se dall’aula esce una persona che ha superato la prova, qual è la probabilità (condizionata) che sia femmina?
(A)80 (B) 75 36/48 (C) 630 (D) 715 (E) 0.689 SOLUZIONE Si considerino gli eventi
e
Calcolare Pr(B|A)
Risposta esatta: (E)0,689
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -41-
In un aula d’esame 185 studenti hanno sostenuto una prova che ha avuto esiti come riportato in tabella:
SI 110 36 146
F M T
NO 30 9 39
T 140 45 185
se dall’aula esce una persona che ha superato la prova, qual è la probabilità (condizionata) che sia femmina? (A) 0.7534 (B) 0 (C) 0.555 (D)0,9100 SOLUZIONE Si considerino gli eventi
e
Calcolare Pr(B|A)
Risposta esatta: (A)0,7534. -‐Gli addobbi di un albero di natale contengono 20 lampadine che si accendono in serie (nel caso che una si rompa si spengono anche le altre). E’ stato calcolato che ogni singola lampadina ha probabilità 0,02 di fulminarsi e che ognuna si rompa indipendentemente dalle altre. Qual è la probabilità di trascorrere le vacanze di natale senza l’albero di natale illuminato?
(A) 2,5 % (B) 66,7 % (C) 31,5% (D) 78,5% (E) 33,3 % (F) 22,5 % SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -42-
X ∼Bin(n, p), con n=20 e p=0,02. X ∼Bin(20, 0,02) È evidente che è molto più semplice calcolare il complementare di cioè calcolare
.
Pertanto poiché P(A)=1-‐P(A)’ q=1-‐p q=1-‐0,02=0,98 p=0,02 Risposta esatta: (E)33,3%. -‐Gli amministratori di una società hanno deciso di condurre un’indagine per conoscere gli effetti delle spese in pubblicità sulla vendita di un loro prodotto. Per ciascuna delle 10 zone geografiche in cui viene pubblicizzato il prodotto sono stati rilevati l’ammontare speso per pubblicità nelle reti televisive locali (indicato con x e misurato in migliaia di euro) ed il numero di unità di prodotto vendute (indicato con y e misurato in migliaia). I dati raccolti hanno fornito per le medie, le varianze e la covarianza, i seguenti valori: µx = 4,9; µy = 13,3; =150,9; 3 5 2 , 1 ;
Determinare il coefficiente di regressione b di Y su X. (A) 0,2 (B) 8,345 (C) 0,711 (D) 3 (E) 12,582 (F) 1,5 SOLUZIONE La retta di regressione si esprime con y=a+bx dove il parametro b si calcola:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -43-
Quindi: Risposta esatta: (C)0,711. ·
Con riferimento all’esercizio precedente, calcolate il coefficiente di determinazione :
(A)0,7167 (B) 0.9167 (C) 0,8167 (D) 0,5167 (E)0,6167 (F) 0,2167 SOLUZIONE ;
Risposta esatta: (F)0,2167. ·
Con riferimento all’esercizio precedente, determinare la varianza dei valori di Y spiegata dalla regressione su X :
(A)176,3 (B) 6,3 (C) 256,3 (D) 156,3 (E)76,3 (F) 276,3 SOLUZIONE Risposta esatta: (E)76,3. -‐La tabella seguente mostra il numero di addetti di un gruppo di aziende:
A B C D E F G http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -44-
71 20 250 25 19 100 25 calcolare il rapporto di concentrazione.
(A)0.75 (B) 0.89 (C) 0.39 (D) 0.93 E) 0,59 SOLUZIONE Si ricordi sempre che bisogna anzitutto ordinare in modo non decrescente le modalità, e poi si procede con i calcoli. Azienda
n° adetti
E
19
1/7=0,1429
19
19/510=0,0373
0,1429-‐0,0373=0,1056
B
20
2/7=0,2857
19+20=39
39/510=0,0765
0,2857-‐0,0765=0,2092
D
25
3/7=0,4286
39+25=64
64/510=0,1255
0,4286-‐0,1255=0,3031
G
25
4/7=0,5714
64+25=89
89/510=0,1745
0,5714-‐0,1745=0,3969
A
71
5/7=0,7143
89+71=160
160/510=0,3137
0,7143-‐0,3137=0,4006
F
100
6/7=0,8571
160+100=260
260/510=0,5098
0,8571-‐0,5098=0,3473
C
250
7/7=1
260+250=510
510/510=1
1-‐1=0
Totale
510
1,7627
Risposta esatta: (E)0,59. ·
Con riferimento al quesito precedente, determinare il rapporto tra la differenza semplice media ed il suo valore massimo.
(A)0.55 (B) 0.89 (C) 0.49 (D) 0.77 (E)0.59 (F) 0.79 SOLUZIONE
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -45-
La differenza semplice media è un indice di mutua variabilità ottenuto facendo la media aritmetica tra tutte le possibili n(n-‐1) differenze in valore assoluto tra le modalità differenti ed di un carattere quantitativo, cioè Tale indice è una misura della variabilità media interna alla distribuzione, cioè fra i singoli valori tra di loro. Il suo valore massimo è pari a 2μ. Il rapporto tra la differenza semplice media ed il suo massimo 2μ coincide con il rapporto di concentrazione R. Risposta esatta:(E)0.59. -‐La tabella seguente mostra le quantità di concime impiegato e la produzione di cinque campi di grano. Ipotizzando una relazione lineare tra le due variabili, quali sono le stime dei parametri α e β del modello di regressione? concime 38 56 59 64 74 produzione di grano 41 63 70 72 84 (A)y = -‐12,660 + 41,1969x (B) y = -‐9,660 + 4,1969x (C) y = -‐3,660 + 1,1969x (D) y = -‐2,660 + 1,1969x (E) y = -‐ 2,660 + 7,1969x SOLUZIONE La retta di regressione si esprime con y=a+bx dove i parametri a e b si calcolano:
,
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -46-
Quindi:
Risposta esatta: (C)y=-‐3,660+1,1969x. ·
Con riferimento all’esercizio precedente, calcolare il coefficiente di determinazione.
(A)0,45 (B) 0,65 (C) 0,98 (D)0,68 (E) 0,35 (F) 0,75 SOLUZIONE Il coefficiente di determinazione
è dato da:
Risposta esatta: (C)0,98. -‐La lunghezza media di 500 foglie di lauro di un certo cespuglio è di 15.1 cm e lo scarto quadratico medio è pari a 1.5 cm. Assumendo che le lunghezze siano distribuite normalmente, determinare quante lunghezze sono comprese tra 12 cm e 15.5 cm. (A)200 (B) 155 (C) 300 (D) 255 (E) 123 (F) 280 SOLUZIONE Le lunghezze che consideriamo comprese tra 12 cm e 15,5 cm possono in realtà assumere qualsiasi valore compreso tra 11,95 (12-‐0,05) e 15,55 cm (15,5+0,05), assumendo che le lunghezze stesse siano registrate al centimetro più prossimo. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -47-
11,95 cm in unità standard valgono (11,95-‐15,1)/1,5=-‐2,10 15,55 cm in unità standard valgono (15,55-‐15,1)/1,5=0,30 Proporzioni di foglia richiesta =(area compresa tra z=-‐2,10 e z=0,30)= =(area compresa tra z=-‐2,10 e z=0)+(area compresa tra z=0 e z=0,30)= =0,4821+0,1179=0,6000. Quindi il numero di foglie di lunghezza tra 12 cm e 15,5 cm è 500(0,6000)=300. Risposa esatta: (C)300 -‐La varianza dei redditi medi di 4 categorie di lavoratori è 80.000, mentre la media aritmetica ponderata delle varianze dei redditi delle singole categorie è 420.000. Qual è il valore del rapporto di correlazione? (A)0,19 (B) 0,80 (C) 0,23 (D) 0,40 SOLUZIONE varianza della distribuzione marginale di Y. varianza delle medie delle distribuzioni parziali di Y. media aritmetica ponderata delle distribuzioni parziali di Y. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -48-
Risposta esatta: (D)0,40. -‐La tabella seguente riporta i pesi X e Y di 12 padri e dei loro figli primogeniti. Trovare il coefficiente di regressione b di Y su X, X = 65 63 67 64 68 62 70 66 68 67 69 71 Y = 68 66 68 65 69 66 68 65 71 67 68 70 (A)0.88 (B) 0.48 (C) -‐0.58 (D) 0.28 (E) 0.18 (F) 0.25 SOLUZIONE La retta di regressione si esprime con y=a+bx dove il parametrO b si calcola:
,
2°Modo di risolvere http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -49-
X
Y
65
68
63
66
67
68
64
65
68
69
62
66
70
68
66
65
68
71
67
67
69
68
71
70
X
Y
65
68
-‐1,6667
2,7779
0,4167
0,1736
5,8055
63
66
-‐3,6667
13,4447
-‐1,5833
2,5068
0,1389
67
68
0,3333
0,1111
0,4167
0,1736
6,8889
64
65
-‐2,6667
7,1113
-‐2,5833
6,6734
1,8889
68
69
1,3333
1,7777
1,4167
2,0070
7,3888
62
66
-‐4,6667
21,7781
-‐1,5833
2,5068
1,3890
70
68
3,3333
11,1109
0,4167
0,1736
1,7223
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -50-
66
65
-‐0,6667
0,4445
-‐2,5833
6,6734
4,5555
68
71
1,3333
1,7777
3,4167
11,6738
-‐0,1944
67
67
0,3333
0,1111
-‐0,5833
0,3402
0,9723
69
68
2,3333
5,4443
0,4167
0,1736
10,4723
71
70
4,3333
18,7775
2,4167
5,8404
41,028
-‐0,0004
84,6668
0,0004
38,9162
Risposta esatta: (B)0.48 ·
Con riferimento all’esercizio precedente, calcolate la varianza spiegata da X:
(A)10.6 (B) -‐6,6 (C) 0.6 (D) 1.6 (E) 5.6 (F) 2.6 SOLUZIONE Risposta esatta: (D)1.6 -‐Nella popolazione i punteggi di un test di memoria a breve (X) si distribuiscono normalmente con media µ = 15 e scarto σ = 3. Il valore X che delimita il 20% dei soggetti peggiori è:
(A)10.00 (B) 42.48 (C)13.41 (D) 17.52 SOLUZIONE Cerchiamo il valore di x per cui Pr(X=x)=0,2 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -51-
Partiamo prima dalla distribuzione normale standardizzata e poi applichiamo la trasformazione inversa alla standardizzazione. Si ha che Pr (Z=z)=0,2
z=0,84.
Il valore di z si dovrebbe individuare ricercando all’interno delle tavole della normale standard il valore di e risalendo da questo al valore di z. In questo caso, tuttavia all’interno delle tavole della normale standard non è possibile individuare un valore pari a 0,3. I due valori di più prossimi a 0,3 sono: 0,2995 e 3,023; si considera tra i valori 0,2995 e 3,023 quello più vicino a 0,3 vale a dire 0,2995 (perché:0,3-‐0,2995=0,0005 che è più piccolo di 0,3023-‐0,3=0,0023; si sceglie quel numero che genera, in confronto con 0,3, la differenza più piccola) e si approssima z con 0,84. Quindi
Il valore 0,3 è dato da 0,5-‐0,2=0,3. Risposta esatta: (D)17.52. -‐La tabella seguente mostra il numero di addetti di un gruppo di aziende, calcolare il rapporto di concentrazione con il metodo dei trapezi: Addetti azienda 1-‐20 21-‐40 41-‐100 101-‐150
Azienda 20 40 100 150
(A)0.89 (B) 0.79 (C) 0.77 (D) 0.24 SOLUZIONE
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -52-
Nella seguente tabella vengono aggiunte due colonne, che contengono rispettivamente i valori centrali delle classi e l’ammontare stimato del carattere all’interno di ciascuna classe. Addetti Azienda Azienda 1-‐20
20
10,5
210
21-‐40
40
30,5
1220
41-‐100
100
70,5
7050
101-‐150
150
125,5
18825
Totale
310
Il passo successivo consiste nel determinare le frequenze cumulate (numero aziende), da cui si calcolano i vari , e gli ammontari cumulati stimati, da cui si calcolano i vari . Addetti Azienda
Azienda
1-‐20
20
10,5
210
20
(20/310=0,0 210 645
(210/27.305)=0,0077
21-‐40
40
30,5
1220
60
(60/310)=0,1 1430=(210+1220) 935
(1430/27305)= =0,0524
41-‐100
101-‐150
100
150
70,5
125,5
7050
18825
160
310
(160/310)=0, 8.480= 5161 =(1430+7050)
(8480/27305)=
(310/310)=1 27.305=
(27.305/27305)=1
=0,3106
=(8480+18825) Totale
310
Poi, per giungere alla formula dei trapezi, si aggiungono altre due colonne con gli ultimi calcoli. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -53-
Addetti Azienda
Azienda
1-‐20
20
10,5
210
20
(20/310)=
210
(210/27.305)=0,0077 0,0645
0,0077
(60/310)=
1430=
(1430/27305)=
0,1858
0,0601
=0,1935
=(210+1220)
=0,0524
8.480=
(8480/27305)=
0,4637
0,363
=(1430+7050)
=0,3106 0,6894
1,3106
=0,0645 21-‐40
41-‐100
40
30,5
100
70,5
1220
7050
60
160 (160/310)= =0,5161
101-‐150
150
125,5 18825
310 (310/310)==1 27.305= =(8480+18825)
Totale
(27.305/27305)= =1
310
Infine si devono moltiplicare le quantità delle ultime due colonne e poi sommarle, ottenendo la quantità entro la sommatoria dell’indice ; si ha quindi:
Per cui: Si evidenzia un grado di concentrazione molto tenue. Risposta esatta: (D)0.24. – L’altezza delle donne tra i 20 e i 29 anni segue approssimativamente la distribuzione N(163; 6,9) mentre l’altezza degli uomini della stessa età ha una distribuzione N(178; 7,1). Quale percentuale di donne ha un’altezza maggiore all’altezza media degli uomini? (A)1,96% (B) 2,5% (C) 5% (D) -‐1,89% (E) 2,9% (F) 1,49% http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -54-
SOLUZIONE Devi trovare l'area che sta sotto la curva N(163; 6,9) a destra di 178. Se avessimo la tavola di N(163; 6,9) tale valore si troverebbe subito. Invece abbiamo solo la tavola della normale standardizzata, cioè N(0;1). Allora dobbiamo standardizzare il valore che ci interessa, in modo da poter usare la tavola della normale standardizzata. Per farlo, sottraiamo la media e dividiamo per lo scarto quadratico medio: (178-‐163)/6,9=2,17 Dalla tavola, si vede che l'area che sta alla destra di 2,17 nella normale standardizzata è 0,015, cioè 1,5% (spesso le tavole danno l'area che sta a sinistra, per avere quella a destra la si sottrae da 1). Risponderei f. Il valore che trovi dipende da che tavola usi, non sono tutte uguali: alcune ti danno l'area dal punto cercato in poi, altre quella fino al punto cercato. Sopra la tavola c'è scritto come è fatta (a volte c'è anche un disegnino). Io ho usato questa: http://www.dss.uniud.it/utenti/lagazio/t… In corrispondenza di 2,17 mi dà 0,985, ma quella è l'area fino a 2,17, a me interessa quella da 2,17 in poi, che è il suo complemento a 1 (dato che l'area totale sotto la curva è 1). Allora ho fatto 1-‐0.985. Risposta esatta: -‐Per un tipo di carote o viti, si assuma che la lunghezza sia una variabile casuale X distribuita normalmente con media µ = 11,5 cm e scarto quadratico medio σ = 2,15 cm. Qual è la probabilità che estratto un campione casuale di 25 carote o viti, la media del campione si discosti di 0,5 cm da µ in entrambe le direzioni? A) 0,190 B) 0,079 C) 0,755 D) 0,970 E) 0,089 F) 0,097 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -55-
SOLUZIONE la prima x è uguale a 11,5-‐0,5=11. La seconda x è uguale a 11,5+0,5=12. Quindi devo calcolare la probabilità di x compreso fra 11 e 12. Trasformo le x in z ...la prima z=11-‐11,5/2,15=-‐0,23. La seconda z=12-‐11,5/2,15=0,23. Calcolo la probabilità di z compresa fra -‐0,23 e +0,23 e risulta 0,1819 Risposta esatta: -In un esercizio composto da n tiri indipendenti, un arciere realizza mediamente 16 centri con coefficiente di variazione 0.25. Adattare un opportuna distribuzione e calcolare la probabilità di ottenere esattamente 11 o 12 centri (A) 4.14 (B)6.61 (C)11.57 (D)65.18 SOLUZIONE Poiché media e varianza sono uguali, si applica la distribuzione di Poisson.
Risposta esatta: (C)11.57. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -56-
–Per un gruppo di famiglie i coefficienti angolari delle due rette di regressione della spesa per consumi sul reddito e viceversa sono rispettivamente 0,7 e 0,9. Qual è la frazione della varianza della spesa delle famiglie non spiegata dal reddito? (A)25% (B) 17% (C) 49% (D) 37% SOLUZIONE Relazioni che intercorrono tra il coefficiente di correlazione lineare (r) e i coefficienti di regressione:
: scarto quadratico medio di X : scarto quadratico medio di Y Il rapporto tra la varianza degli scarti tra valori osservati e calcolati e quella dei valori osservati, detto coefficiente di alienazione, è ed esprime la frazione della varianza di Y non spiegata da X. Risposta esatta: (D) 37% -‐In un collettivo di n:6 unità sono stati rilevati i valori di x e di y. Ipotizzando una relazione lineare tra le due variabili, qual è il valore che ci aspettiamo per y quando x è nullo? X 5 9 7 1 2 12 Y 16 15 19 10 14 21 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -57-
A)11.19 B) 9.78 C) 12 D) 8 E) 9.47 F) 10 La retta di regressione si esprime con y=a+bx dove il parametro b si calcola:
,
La retta di regressione ha la seguente equazione:
Pertanto, per x=0 y=11,1971. Risposta esatta: (A)11.19. ·
Con riferimento all’esercizio precedente, qual è l’incremento che subisce y quando il valore di x viene incrementato di 1?
A)0.91 B) 1 C) 0.49 D) 2.15 E) 1.58 F) 0.77 SOLUZIONE quindi ad ogni incremento unitario di x la y aumenta in media di 0,77. Risposta esatta: (F) 0.77. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -58-
-‐Il tempo (misurato in minuti) trascorso giornalmente davanti al televisore si distribuisce in modo normale con media 120 minuti e scarto quadratico medio 30 minuti. Un terzo dei soggetti trascorre davanti alla televisione più di Y minuti. Trovare il valore di Y. (p.3) A) 140 B) 107 C) 133 -Il tempo trascorso davanti alla tv si distribuisce normalmente con media=120 e scarto quadratico medio=30. Un terzo soggetto trascorre davanti alla tv meno di y minuti. Trovare il valore della y. -‐Il peso di una confezione di pasta alimentare ha una distribuzione normale con media 0,5 Kg e deviazione standard 0,02 kg. Una persona ha acquistato 5 confezioni di quella marca di pasta. Calcolare la probabilità che il peso medio delle 5 confezioni sia minore a 485 g. (p.3) A) 0,7521 B) 0,9532 C) 0,9911 D) 0,0468 E) 0,0089 F) 0,024 SOLUZIONE
La probabilità che il peso medio delle cinque confezioni sia inferiore a 485 grammi è 0,9535. Il valore 1,6771 va ricercato all’interno delle tavole individuano il valore in corrispondenza della riga e della colonna di z cioè: z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 . . . 1,6 .4535 A 0,5 va sommato 0,4535 e si ottiene 0,9535 che è il valore della probabilità: P(z<1,6771)=0,9535. Risposta esatta: (B) 0,9532. -‐In una Università italiana si é rilevato che rispettivamente il 30% degli studenti e il 20% delle studentesse sono iscritti a Economia. Inoltre, il 45 % degli studenti è costituito da donne. Qual è la probabilità che, osservando uno studente studiare Economia, questi sia donna? http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -59-
(A)0,26 (B) 0,35 (C) 0,30 (D)0,10 (E) 0,57 F) 0,71 -‐Il direttore del personale di una grossa società suppone che ci sia una relazione tra l’assenteismo e l’età dei dipendenti, e vorrebbe impiegare il dato relativo all’età di un lavoratore per sviluppare un modello di previsione del numero di giorni d assenza durante un anno. In un gruppo di lavoratori si sono osservati i seguenti valori Lavoratore A B C D E F G I J Eta 27 61 37 23 39 58 29 64 40 Giorni di assenza 15 6 14 11 5 8 14 5 8 Determinare il coefficiente di regressione. A)-‐0,26 B) -‐0,04 C) 0,51 D) -‐0,19 E) 2 F) 1,3 · Con riferimento all’esercizio precedente, calcolate il coefficiente di correlazione: A)-‐0,141 B) -‐0,739 C) 0,941 D)0,514 E) -‐0,919 F) 0,782 -‐Nella popolazione di una regione, la percentuale di fumatori è pari al 21,4%. Calcolare a probabilità che in un campione casuale di 5 residenti almeno uno sia fumatore. (A) 0,45 (B) 0,30 (C) 0,70 (D) 0,20 -‐ Nella tabella seguente sono riportati, con riferimento ai due anni 1980 e 2000, i clienti di un impresa ripartiti per area geografica di appartenenza. Misurate il legame fra i dati relativi ai due anni mediante il coefficiente di regressione lineare. Area geografica Clienti 1980 Clienti 2000 America del Nord 10 100 America latina 22 80 Europa Occidentale 35 100 Europa Orientale 35 50 Africa 36 45 Medio Oriente 39 20 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -60-
Asia e Oceania Totale Mondiale
43 220
12 407
A)8,77 (B) -‐3,24 (C) -‐5,3 (D)32,15 E)4,23 (F) -‐2,37 · CALCOLARE LA FRAZIONE DI VARIANZA SPIEGATA DALLA FUNZIONE DI REGRESSIONE:: (A)3,1 (B) -‐0.56 (C) 0.56 -‐Nella popolazione di una regione, la percentuale di fumatori è pari al 21,4%. In un campione casuale di 180 residenti, quale è la media e la varianza del numero di fumatori? (A) 68, 52; 60,28 (B) 38,52; 23,28 (C) 38,52; 150,28 (D)38,52; 30,28 (E) 48,52; 40,28 (F) 48,52; 30,28 SOLUZIONE Teorema (senza dimostrazione) Una variabile casuale X binomiale ha media e varianza date da: , n=180 p=0,214 q=1-‐p=1-‐0,214=0,786 Risposta esatta: (D)38,52; 30,28. -‐ Si consideri la seguente tabella di dati relativi alle variabili quantitative X e Y. Si indichi qual è la covarianza di x e y: id degenti giornate di degenza 1 11.5 3.1 2 25,8 5,6 3 21,2 5,5 4 11,3 4,3 5 6,3 1,7 A)9,71 B) 74,51 C) 138,42 D)10,59 SOLUZIONE X=degenti Y=giornate di degenza http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -61-
11,5 25,8 21,2 11,3 6,3
3,1 5,6 5,5 4,3 1,7
Per la covarianza si ha: -‐3,72 10,58 5,98 -‐3,92 -‐8,92
-‐0,94 1,56 1,46 0,26 -‐2,34
3,4968 16,5048 8,7308 -‐1,0192 20,8728 48,586
Risposta esatta: (A)9,71 · Con riferimento all’esercizio precedente si indichi il valore della covarianza tra x e y divisa per il suo massimo possibile valore. A)9,71 B) 0,91 C) 138,42 D) 2 SOLUZIONE Covarianza-‐proprietà Disuguaglianza di Cauchy-‐Schwarz La covarianza è in valore assoluto, minore o uguale al prodotto degli scarti quadratici medi. Se fra le due variabili esiste un perfetto legame lineare, che si può esprimere nella forma la covarianza è in valore assoluto uguale al prodotto degli scarti quadratici medi.
ed in particolare
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -62-
11,5 25,8 21,2 11,3 6,3
-‐3,72 10,58 5,98 -‐3,92 -‐8,92
13,8384 111,9364 35,7604 15,3664 79,5664 256,468
Lo scarto quadratico medio di X è pari a: 3,1 5,6 5,5 4,3 1,7
-‐0,94 1,56 1,46 0,26 -‐2,34
0,8836 2,4336 2,1316 0,0676 5,4756 10,992
Lo scarto quadratico medio di Y è pari a:
Usando la proprietà possiamo costruire una misura di dipendenza lineare, mediante il rapporto tra la covarianza al suo massimo: detto coefficiente di correlazione lineare.
Risposta esatta: (B) 0,91. -‐Nella popolazione di una regione, la percentuale di fumatori è pari al 21,4%. Qual è la probabilità che in un campione casuale di 260 residenti, meno di un quinto siano fumatori? http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -63-
(A)0,257 (B) 0,291 (C) 0,480 (D) 0,482 (E)0,709 (F) 0,478 SOLUZIONE Grazie al Teorema del Limite Centrale è possibile approssimare la Binomiale alla variabile casuale Normale e di conseguenza alla v.c. Normale Standardizzata. Poiché la variabile casuale Binomiale ha valore atteso pari a:
e varianza
Se X è il numero di fumatori in un campione di 260 residenti con probabilità p di fumatori, X∼Bi(n,p), con n=260. Allora per il Teorema del Limite Centrale si ha ∼N(0,1) La probabilità richiesta è
cioè
.
Risposta esatta: (B) 0,291. -‐Sappiamo che l’equazione della retta di regressione di y rispetto ad x, è y: 2.4 x. Sappiamo anche che il coefficiente di correlazione lineare tra le due variabili è pari ad r = 0.8 e sappiamo che la varianza dei residui è 29.16. Quanto vale la varianza di y?: A)81 B) 37 C) 10.5 D) 52 E) 96 SOLUZIONE
dove: varianza spiegata
varianza totale varianza residua o di errore http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -64-
quindi Risposta esatta: (A)81. · Con riferimento all’esercizio precedente, qual è il valore dello scarto quadratico medio di x?: A)81 B) 3 C) 18 D) 9 E) 1 F) 16 SOLUZIONE Supponiamo che il modello abbia anche l’intercetta a. Il modello è dunque La stima di b è data dalla formula Il coefficiente di correlazione è dato da: Dalle due forme si può ricavare che: quindi
Risposta esatta: (B) 3. · Con riferimento all’esercizio precedente, qual è il valore della covarianza tra x e y?: A)101 B) 35 C) 21,6 D) 0.66 E) 0.03 F) -‐0.03 SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -65-
Risposta esatta: (C) 21,6. · Con riferimento all’esercizio precedente, se la media di x è 1 quanto vale la media di y?: A)2 B) 2.4 C) -‐2.4 D) 0 E) 7 F) 5 SOLUZIONE Si ha che:
, cioè nel nostro caso
Abbiamo che: cioè
e
Risposta esatta: (B)2.4. -‐Se, lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero dispari; B = uscita del 2, la probabilità esatte dell’evento <<A e B>> sarà: (p.1)A) P (A e B) = 2/8 B) P (A e B) = 0 C) P (A e B) = 1/12 D)P (A e B) = 1/6 SOLUZIONE Lo spazio campione è rappresentato graficamente come segue: 1 3 4 2 5 6 L’evento A= “estrazione di un numero dispari” è costituito dagli eventi elementari: , , ed è rappresentato graficamente come segue: A 1 3 5
L’evento B= “estrazione del 2” è costituito dall’ evento elementare: ed è rappresentato graficamente come segue: B
,
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -66-
2
L’evento è costituito dagli elementi che fanno parte sia di A sia di B, ossia ed è rappresentato graficamente come segue: 1 3 5
Risposta esatta: B) P (A e B) = 0. -‐Se, lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero dispari; B = uscita del 5, la probabilità esatte dell’evento <<A e B>> sarà: (p.1) A) P (A e B) = 2/8 B) P (A e B) = 0 C) P (A e B) = 1/12 D)P (A e B) = 1/6 SOLUZIONE Lo spazio campione è rappresentato graficamente come segue: 1 3 4 2 5 6 L’evento A= “estrazione di un numero dispari” è costituito dagli eventi elementari: , , ed è rappresentato graficamente come segue: A 1 3 5
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -67-
L’evento B= “estrazione del 5” è costituito dall’ evento elementare: ed è rappresentato graficamente come segue: B 5
,
L’evento è costituito dagli elementi che fanno parte sia di A sia di B, ossia ed è rappresentato graficamente come segue: 1 5 3
Avremmo potuto calcolare composte:
in base al Teorema delle probabilità utilizzando i valori:
ovvero: è la probabilità che si verifichi l’evento A sapendo che si è verificato l’evento B. Pertanto, si tratta di limitare lo spazio campionario agli elementi dell’insieme B. Ovvero, se lo spazio campionario fosse composto dai soli elementi dell’insieme B (cioè un elemento), qual è la probabilità che si verifichi l’evento A (cioè 5)?. Nel caso,
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -68-
Allo stesso modo, è la probabilità che si verifichi l’evento B (cioè 5) sapendo che si è verificato l’evento A. Cioè, qual è la probabilità di ottenere un 5 lanciando un dado che contenga solo i numeri 1, 3 e 5?
Ovvero, Risposta esatta: (D)P (A e B) = 1/6. -‐Se lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero pari, “B” uscita del 2. La probabilità dell’evento “A o B” sono: A) P (A o B) = 0; B) P (A o B) = 1/6 C) P (A o B) = 2/3 D) P (A o B) = ½ SOLUZIONE Lo spazio campione è rappresentato graficamente come segue: 1 3 4 2 5 6 L’evento A= “estrazione di un numero pari” è costituito dagli eventi elementari: , , ed è rappresentato graficamente come segue: A 2 4 6
L’evento B= “estrazione del 2” è costituito dall’ evento elementare: ed è rappresentato graficamente come segue: B 2 2
,
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -69-
L’evento ossia , 4 6
è costituito dagli elementi che fanno parte di A o di B, , , ed è rappresentato graficamente come segue: 2
L’evento è costituito dagli elementi che fanno parte sia di A sia di B ed è rappresentato graficamente come segue: 4 2 6
Avremmo potuto calcolare
in base al Teorema delle probabilità totale:
Risposta esatta: D) P (A o B) = ½. -‐Se lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero dispari; B = uscita del 4. La probabilità esatta di A o B sarà: (p.1)A) P (A o B) = 0; B) P (A o B) = 1/6 C) P (A o B) = 2/3 D)P(A o B)=2/8 E) p SOLUZIONE Lo spazio campione è rappresentato graficamente come segue: 1 3 4 2 5 6 L’evento A= “estrazione di un numero dispari” è costituito dagli eventi elementari: , , ed è rappresentato graficamente come segue: A http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -70-
1 3 5
L’evento B= “estrazione del 4” è costituito dall’ evento elementaro: ed è rappresentato graficamente come segue: B 4
,
L’evento è costituito dagli elementi che fanno parte sia di A sia di B ed è rappresentato graficamente come segue: L’evento ossia , 1
,
è costituito dagli elementi che fanno parte di A o di B, , ed è rappresentato graficamente come segue:
3 4
4 5
Risposta esatta: C) P (A o B) = 2/3 -‐Se la distribuzione del carattere z in una data popolazione ha media -‐3 e varianza 2 e se le modalità del carattere Y si ottengono da quelle di Z tramite la trasformazione Y= -‐1/3*Z, qual è il valore della media di Y? (A) 1 (B) 0 (C) -‐1 (D) 1/3 (E) 2/3 Soluzione http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -71-
La media cambia: viene dilatata o contratta del fattore a, così come i singoli dati. Viene riportata la variabili Y “contratta” -‐3 volte, cioè: Si ha:
e
e quindi:
In presenza sia di traslazione che di dilatazione/contrazione si ha: -‐la media si trasforma secondo la stessa trasformazione della variabile X, ovvero
Risposta esatta:(A)1. · Con riferimento all’esercizio precedente, quanto vale la varianza di Y? (A)2/9 (B) -‐2/3 (C) 1/3 (D) ¼ (E)2/3 Soluzione La varianza cambia; gli scarti dalla media diventano: e quindi Il segno del coefficiente a non incide sulla varianza. Viene riportata la variabile Y “contratta” -‐3 volte, cioè Si ha:
.
e quindi:
In presenza sia di traslazione che di dilatazione/contrazione si ha: -‐la varianza, invece, ha un comportamento differente
Risposta esatta: (A)2/9 -‐Se ad un certo capitale, vengono applicati gli interessi del 10 % per 2 anni; successivamente il 12 % per 5 anni ed infine per altri 3 anni il 13.50%, l’interesse medio sarà: (p.1) (A) 11.98645 (B) 12.64 (C) 13.6 (D) 12.05 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -72-
SOLUZIONE Per individuare la media più opportuna per calcolare il tasso medio annuo d’interesse, occorre tener presente il meccanismo di rendimento di una certa somma di denaro. In particolare, a partire da un capitale iniziale , applicando il tasso d’interesse costante r, il capitale finale dopo 1, 2, …, p anni risulterebbe: Supponendo, ora, di considerare k periodi consecutivi, ciascuno dei quali costituito da , ,…, anni, con corrispondenti tassi d’interesse costanti , ,…, , il capitale al termine del k-‐esimo periodo risulterà: In questo caso particolare: La media più opportuna da applicare è quindi la media geometrica ponderata dei tassi Si tenga presente che il valore cercato può anche essere ottenuto passando ai logaritmi (la cui base può essere scelta arbitrariamente, purché sempre la stessa e purché l’antilogaritmo venga ricavato coerentemente):
Risposta esatta: (D) 12.05. -‐Se la popolazione di un paese nei censimenti del 1951 e del 2001 è rispettivamente di 27 e 35 milioni, il saggio di incremento relativo annuo, secondo una legge di una progressione geometrica, sarà: A) 133.000 B) 160.000 C) 0,004334554 D ) 70.000 E) 0,005203716 F) 1 2,5 3 5 Il saggio relativo medio annuo di variazione, s, della popolazione di un paese nel cinquantennio dal 4 1951 al 2001, si ottiene in base ai risultati dei censimenti del 1951 e del 2001, riportati nel testo dell’esercizio, come segue. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -73-
Dalla
con n=51 (si deve contare anche il 1951), si ha
e passando ai logaritmi (decimali) da cui, risalendo dal logaritmo al numero, si trova q=1,00520 . Pertanto, la popolazione del paese è, aumentata, in media, ogni anno, tra il 1951 ed il 2001, di 5,2 abitanti ogni 1000 abitanti. Si noti che questo calcolo corrisponde all’ipotesi che la popolazione sia cresciuta negli anni secondo la legge di una progressione geometrica, cioè ad un saggio annuo relativo costante. 2° MODO DI RISOLVERE saggio medio relativo di variazione che dipende soltanto dai valori ed . Quindi: n=51 (si deve contare anche il 1951)
Risposta esatta: (E) 0,005203716. -‐Se la popolazione di un paese nei censimenti del 1941 e 2001 è rispettivamente di 27 e 35milioni, il saggio di incremento relativo annuo, secondo una legge di una progressione geometrica, sarà: A) 133.000 B) 160.000 C) 0,004334554 D) 70.000 E) 0,005203716 F) 2,5 SOLUZIONE Il saggio relativo medio annuo di variazione, s, della popolazione di un paese nel cinquantennio dal 1941 al 2001, si ottiene in base ai risultati dei censimenti del 1941 e del 2001, riportati nel testo dell’esercizio, come segue. Dalla
con n=61 (si deve contare anche il 1941), si ha http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -74-
e passando ai logaritmi (decimali) da cui, risalendo dal logaritmo al numero, si trova q=1,00433 . Pertanto, la popolazione del paese è, aumentata, in media, ogni anno, tra il 1941 ed il 2001, di 4,33 abitanti ogni 1000 abitanti. Si noti che questo calcolo corrisponde all’ipotesi che la popolazione sia cresciuta negli anni secondo la legge di una progressione geometrica, cioè ad un saggio annuo relativo costante. 2° MODO DI RISOLVERE saggio medio relativo di variazione che dipende soltanto dai valori ed . Quindi: n=61 (si deve contare anche il 1941)
Si noti che questo calcolo corrisponde all’ipotesi che la popolazione sia cresciuta negli anni secondo la legge di una progressione geometrica, cioè ad un saggio annuo relativo costante. Risposta esatta: C) 0,004334554. -‐Se la popolazione di un Paese al censimento del 1951-‐2001 era rispettivamente di 27 e 31,5 milioni, il rapporto incrementale annuale sarà: (A) 0,001256 (B) 88.000 C) 90.000 D) 0,001257 (E) 85.000 (F) 0.00308 SOLUZIONE Il rapporto incrementale annuo della popolazione di un Paese tra il 1951 e il 2001 è: (31.500.000-‐27.000.000)/50=90.000 abitanti per anno. Risposta esatta: C) 90.000 -‐Se la popolazione di un Paese al censimento del 1941-‐2001 era rispettivamente di 27 e 35 milioni, il rapporto incrementale annuale sarà: (A) 0,001256 (B) 88.000 C) 133.333,33 D) 0,001257 (E) 85.000 (F) 0.00308 -‐Se la popolazione di un paese nei censimenti del 1951 e 2001 è rispettivamente di 27 e 31,5 milioni, il saggio di incremento relativo annuo, secondo una legge di una progressione aritmetica, sarà: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -75-
31,5 – 27 27 + 31,5 0,09 (A)-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐ = 0,09 (B) -‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐ = 29,25 (C) -‐-‐-‐-‐-‐-‐=0,00307692 50 2 29,25 SOLUZIONE Se si divide il rapporto incrementale della popolazione tra il 1951 ed il 2001, cioè (31.500.000-‐27.000.000)/50=90.000 abitanti per anno, per l’ammontare medio della popolazione nel cinquantennio (31.500.000+27.000.000)/2=29.250.000 abitanti, si ottiene un saggio medio annuo relativo 90.000/29.250.000=0,0307692 corrispondente all’ipotesi che la popolazione sia cresciuta secondo la legge di una progressione aritmetica e quindi ad un saggio annuo relativo decrescente (se in ogni anno l’aumento della popolazione, in termini assoluti, è costane, in termini relativi diminuisce da un anno all’altro, perché l’ammontare della popolazione va crescendo).
Risposta esatta: -‐Se la popolazione di un paese nei censimenti del 1941 e 2001 e rispettivamente di 27 e 35 milioni, il saggio di incremento relativo annuo, secondo una legge di una progressione aritmetica, sarà: 35 – 27 27 + 35 0,133 -‐-‐-‐-‐-‐-‐-‐-‐-‐ = 0,133 -‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐-‐ = 31 -‐-‐-‐-‐-‐-‐-‐-‐ = 0,00430106 60 2 31 -‐Se in una distribuzione di valori, la varianza è 1.6, la differenza quadratica media con ripetizione risulta: (p.1) A) 2.265 B) 1.61 C) 1.788 D) 2.45 SOLUZIONE Si può dimostrare che il quadrato della differenza quadratica media con ripetizione è uguale al doppio della varianza dei valori dati, ossia . Quindi: ; Risposta esatta: (C) 1.788. -‐Se in una distribuzione di 20 valori, lo s.q.m. è 1,2 ; la differenza quadratica media senza ripetizione risulta: A) 2,107 B) 2,115 C) 1,123 SOLUZIONE n=20; σ=1,2; Risposta esatta:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -76-
-‐Sei persone che si trovano in una stanza possiedono, rispettivamente, le seguenti stature e pesi: statura (cm) 160 166 170 175 180 185, peso (kg) 64 61 68 7478 82. Determinare la retta di regressione in funzione della statura (A)y = 0.84x – 73.7 (B) y = 0.80x – 67.6 (C) y = 0.96x -‐ 93.3 (D) y = 0.94x – 90.2 -‐Un giocatore di poker ha un colore quando le cinque carte che tiene in mano appartengono allo stesso seme. Qual è la probabilità di ottenere un colore di picche prendendo cinque carte dal mazzo? (un mazzo contiene 52 carte, 13 per seme) (p.3): A) 0,902 % B) 0,000021 % C) 0,81 % D) 1,2 % E) 0,0495 % F) 3,05 % F) 0.00308 SOLUZIONE Qui è semplice procedere in ciascuno dei vari modi equivalenti, perché le 5 carte devono soddisfare la stessa proprietà. Quindi prima, seconda, terza, quarta, quinta carta di picche. , ogni volta che estraggo una carta di picche diminuisce di 1 sia il numero delle carte di picche dal mazzo, sia il totale delle carte. Ma quante combinazioni esistono delle carte estratte a caso? Il totale dei casi è il numero di sottoinsiemi di 5 elementi di un insieme di 52 elementi, il numero dei casi favorevoli è il numero di sottoinsiemi di 5 elementi di un insieme di 13 elementi (le cinque carte le scelgo dal mazzo di 52; ma voglio che tutte siano di picche, cioè che appartengano all’insieme delle 13 carte di picche). Dunque:
Risposta esatta: (E) 0,0495 %. -‐Se alla domanda “siete favorevoli al fumo “ rivolta a 200 studenti scelti in maniera casuale fra la popolazione studentesca catanese, si sono avuti i seguenti risultati: 99 femmine, di cui 28 hanno risposto “SI”; 101 maschi di http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -77-
cui 60 hanno risposto “NO”; la probabilità di estrarre un unità che appartenga alla categoria “M” e “SI”, risulta: (A) 20,50 % (B) 10,51% (C) 6,5% (D) 18% (E) 67,5% (F)25,1% -‐Se alla domanda “siete favorevoli al fumo “ rivolta a 200 studenti scelti in maniera casuale fra la popolazione studentesca catanese, si sono avuti i seguenti risultati: 99 femmine, di cui 28 hanno risposto “SI”; 101 maschi di cui 60 hanno risposto “NO”; la probabilità di estrarre un unità che appartenga alla categoria “F” o “SI”, risulta: (A) 70,0 % (B) 10,51% (C) 6,5% (D) 18% (E) 67,5% (F)25,1% -‐Se alla domanda “siete favorevoli al fumo “ rivolta a 200 studenti scelti in maniera casule fra la popolazione studentesca catanese, si sono avuti i seguenti risultati: 99 femmine, di cui 35 hanno risposto “SI”; 101 maschi di cui 65 hanno risposto “NO”; la probabilità di estrarre un unità che appartenga alla categoria “M” e “SI”, risulta: (A) 20,50 % (B) 6.5% (C) 24.1% (D) 18% (E) 10.51% (F) 67.5% -‐Sono noti i dati relativi ai prezzi di un bene rilevati in 5 mercati prezzo medio 20, scarto quadratico 2 euro al quintale. Successivamente vengono comunicati i dati relativi ad altri 5 mercati, prezzo medio 22, scarto quadratico ancora 2 euro al quintale. Quali sono i valori del prezzo medio e della varianza nel complesso dei 10 mercati: A) 21,9 B) 21,3 C) 20,5 e 3 D) 20,5 e 9 E) 21 e 5 -‐ Supponiamo che il prezzo di un appartamento di 80 mq sia stato negli anni 1999 e 2005 di 150 e 170 (migliaia di euro). Prendendo il 1999 come anno base di quanto è aumentato il costo di un appartamento? (A) 13 % (B) 18% (C) 20% (D)0,20% (E) 40% (F) 0,13% SOLUZIONE Anni
prezzi
1999
150
2005
170
Indici
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -78-
Il numero indice per l’anno 2005 nella serie che ha come anno base il 1999 è
pari a il che indica che nel 2005 il prezzo è aumentato del 13,33% rispetto al 1999. Risposta esatta: (A) 13 %. -‐ Supponendo che agli alunni di una classe superiore di un istituto venga somministrato un questionario di 10 domande. Il voto medio è stato 6.7 e lo scarto quadratico medio è stato di 1.2. Supponendo che i voti siano distribuiti normalmente, determinate la percentuale di studenti che ha ottenuto il voto 6. (A) 27 % (B) 15% (C) 75% (D) 12% (E) 50% (F) 30% SOLUZIONE L’intervallo di punteggi riportati al questionario che producono il voto 6 è [5,5; 6,5], pertanto la percentuale di studenti che hanno ottenuto un voto sei si ottiene integrando la funzione di densità normale in tale intervallo. Occorre dunque standardizzare il problema. Sfruttando la simmetria della curva normale, la percentuale cercata è data da: Risposta esatta: (A) 27 %. -‐ Si determini il valore medio della seguente distribuzione del numero di pratiche evase agli impiegati di un certo comune, in una data settimana lavorativa: p.evase 2 3 4 5 6 8 16 Totale Tot. 5 4 3 5 3 1 1 22 Imp. A)4,59 B)6,12 C)5,23 D) 4,32 -‐Una ditta dolciaria dichiara che “ogni cinque uova si trova come sorpresa un giocattolo”. Quante uova è necessario comprare affinché la probabilità di trovare un giocattolo sia maggiore del 60 %? A) 4 B)2 C) 7 D) 5 )p.1Viene condotta un’indagine tra gli studenti di una scuola per analizzare se vi sia relazione tra la loro abitudine al fumo e quella de genitori. I dati http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -79-
raccolti, relativi a 100 intervistati, sono riassunti nella seguente tabella doppia: Abitudine al fumo dei Lo studente fuma? genitori si no totale Nessuno 4 20 24 uno solo 8 34 42 Entrambi 8 26 34 Totale 20 80 100 Calcolare la frequenza prevista corrispondente alla coppia di modalità “entrambi” e “No” qualora vi fosse indipendenza tra abitudine al fumo degli studenti e quella dei genitori. (A) 25.14 (B) 5.14 (C) 6.12 (D) 27.2 (E) 8.14 (F) 7.25 )p.1Viene condotta un’indagine tra gli studenti di una scuola per analizzare se vi sia relazione tra la loro abitudine al fumo e quella de genitori. I dati raccolti, relativi a 100 intervistati, sono riassunti nella seguente tabella doppia: Abitudine al fumo dei Lo studente fuma? genitori si no totale Nessuno 3 22 25 uno solo 8 34 42 Entrambi 7 26 33 Totale 18 82 100 Calcolare la frequenza prevista corrispondente alla coppia di modalità “entrambi” e “Si” qualora vi fosse indipendenza tra abitudine al fumo degli studenti e quella dei genitori. (A)7,5 (B) 8 C) 5,94 D) 7 7)p.2Calcolare il valore dell’indice http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -80-
(A)0,87 (B) 1,84 (C) 3,11 (D) 0,55 Soluzione è 0.87 -‐Un individuo viaggia da Catania a Furci Siculo alla velocità media di 30 kmh e fa il percorso inverso per la stessa strada ad una velocità di 60 kmh. Calcolare la velocità media per l’intero percorso. (A) 60kmh (B) 40kmh (C) 30kmh (D) 50kmh (E) 70kmh SOLUZIONE Supponiamo che la distanza tra le due città sia di 60 km. Avremo: Tempo da A a B
Tempo da B ad A
Velocità media del viaggio= Calcoliamo la Media Armonica ponderata (Ma):
;
kmh. Se le distanze percorse non sono tutte uguali, si deve usare una media armonica ponderata delle velocità, dove i pesi sono le rispettive distanze. Si deve notare che se si fosse calcolata la media aritmetica delle velocità si sarebbe caduti in errore (28,33). In generale, se ai valori sono attribuiti dei pesi, la formula della media armonica semplice
va sostituita con quella della media armonica ponderata
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -81-
che si riduce alla
se i pesi sono tutti uguali a
1.
Risposta esatta: (B) 40kmh. -‐ Un quiz è composto da 5 domande, tra loro indipendenti, ciascuna con tre possibili risposte di cui una sola corretta. Assumendo che un candidato scelga a caso la risposta al quesito, si calcoli la probabilità che il numero di risposte esatte sia pari a due. (A) 0,67 (B) 0,15 (C) 0,56 (D) 0,03 E) 0,33 F) 0,25 -‐ Una famiglia nel 1997 ha destinato, in tre anni consecutivi, lo stesso ammontare di denaro per l’acquisto di argento, il cui prezzo al chilogrammo è stato di lire 160000 il primo anno, 170500 lire al secondo e 172000 lire al terzo. Determinare il prezzo medio di acquisto nei tre anni considerati. (A) 165789,00 (B) 164567,12 (C) 167326,15 (D) 156789,23 (E) 171234,12 (F) 170232,12 SOLUZIONE Il prezzo medio dell’argento non può essere ottenuto come media aritmetica semplice dei tre prezzi, in quanto nei tre anni sono cambiate le quantità acquistate (dato che la somma spesa S è rimasta invariata). Pertanto, indicando rispettivamente con e il prezzo e la quantità acquistata di argento nell’anno i, occorrerà calcolare:
, essendo
,
E, come si può vedere, l’ultima espressione corrisponde proprio alla media armonica dei prezzi: Riposta esatta: (C) 167326,15. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -82-
-‐ Sono state intervistate 150 persone. Hanno dato risposta affermativa ad una domanda 30 persone, ad un’altra domanda 50 persone ed è, inoltre, 12 il numero di persone che hanno dato riposta affermativa ad entrambe le domande. Per questa tavola di associazione l’indice chi quadrato è: (A) 0.75 (B) 0.85 (C)124 (D) 4 (E) 11 (F) 0.4 NUOVI -‐ Si intervistano 100 famiglie, a cui si chiede di indicare la spesa sostenuta per l’acquisto di generi alimentari nell’ultimo mese. La spesa media risulta di 850 € e lo scarto quadratico medio risulta di 200 €. In mancanza di dati sul reddito, si cerca di valutare la condizione socio-‐economica e si formano 3 classi: la prima contiene 30 famiglie, che hanno una spesa media di 700 €, la seconda 50 famiglie con spesa media di 800 € e la terza 20 famiglie con spesa media di 1200 €. Una misura della correlazione tra la spesa e la condizione socio-‐economica è (A) 0,81 (B) 0,10 (C) 0,40 (D) 3 (E) 5 (F) -‐0,40 SOLUZIONE In effetti la difficoltà dell'esercizio è proprio quella di individuare i due caratteri di interesse. Il primo carattere è quantitativo ed è la spesa sostenuta per generi alimentari, il secondo è la "condizione socio economica" ed è un carattere qualitativo, nel senso che le sue modalità sono prima classe, seconda classe e terza classe. Quando si hanno a disposizione 1 variabile ed 1 mutabile la correlazione si calcola con l'indice Eta o Eta^2 di Pearson che misura la dipendenza in media del carattere quantitativo (spesa) da quello qualitativo (condizione socio-‐ economica). In questo caso non devo fare molti calcoli perché non ho le osservazioni individuali ma già le medie, quindi devo semplicemente calcolare la devianza tra e dividerla per la devianza totale. n 30 50 20 700 800 1200 varianza della distribuzione marginale di Y. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -83-
varianza delle medie delle distribuzioni parziali di Y. media aritmetica ponderata delle distribuzioni parziali di Y. ; M=850
Risposta esatta: (A)0,81 -‐Si intervistano 100 famiglie, a cui si chiede di indicare la spesa sostenuta per l’acquisto di generi alimentari nell’ultimo mese. La spesa media risulta di 860 € e lo scarto quadratico medio risulta di 200 €. In mancanza di dati sul reddito, si cerca di valutare la condizione socio-‐economica e si formano 3 classi: la prima contiene 50 famiglie, che hanno una spesa media di 700 €, la seconda 30 famiglie con spesa media di 900 € e la terza 20 famiglie con spesa media di 1200 €. Una misura della correlazione tra la spesa e la condizione socio-‐economica è (A)0.10 (B) 0.81 (C) 0.91 (D) 0.54 (E)0.40, (F)-‐0.31 SOLUZIONE In effetti la difficoltà dell'esercizio è proprio quella di individuare i due caratteri di interesse. Il primo carattere è quantitativo ed è la spesa sostenuta per generi alimentari, il secondo è la "condizione socio economica" ed è un carattere qualitativo, nel senso che le sue modalità sono prima classe, seconda classe e terza classe. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -84-
Quando si hanno a disposizione 1 variabile ed 1 mutabile la correlazione si calcola con l'indice Eta o Eta^2 di Pearson che misura la dipendenza in media del carattere quantitativo (spesa) da quello qualitativo (condizione socio-‐ economica). In questo caso non devo fare molti calcoli perché non ho le osservazioni individuali ma già le medie, quindi devo semplicemente calcolare la devianza tra e dividerla per la devianza totale. n 50 30 20 700 900 1200 varianza della distribuzione marginale di Y. varianza delle medie delle distribuzioni parziali di Y. media aritmetica ponderata delle distribuzioni parziali di Y. ; M=860
Risposta esatta: (C)0.91. -‐ Data la seguente distribuzione che rappresenta le frequenze percentuali di un controllo di durata effettuato su 600 lampadine, calcolare la media aritmetica. Ore di funzionamento % 0-‐300 40 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -85-
300-‐600 600-‐900
50 10
A)400 B) 330 C) 390 D) 360 E) 200 F) 450 SOLUZIONE Ore funzionamento 0-‐300 40 150 6000 300-‐600 50 450 22500 600-‐900 10 750 7500 Totale 100 36.000
La media aritmetica è pari a: Risposta esatta: (D) 360. Il fatturato di un’impresa è stato di € 85.000 nel 2000, di € 83.000 nel 2001 e di € 90.000 nel 2002. I numeri indici a base mobile sono: (A)100; 97,65; 108,43 (B) 100; 97,65; 105,88 C) 100;-‐97,65;105,88 (D) 100; 104; 108 7)p.2In un incontro di tennis, la velocità dei servizi si distribuisce normalmente, con media µ = 180 km. orari e scarto quadratico medio σ= 30. Il 30% delle battute risultano più lente di: (A)170 (B) 185 (C) 154 (D) 165 8)p.3Una pasticceria produce in egual numero torroncini al cacao ed alla arancia; i torroncini vengono confezionati in maniera causale in pacchetti da due. In un pacchetto preso a caso, uno dei due torroncini è all’arancia. Calcolare la probabilità che l’altro sia al cacao, dopo aver elencato per iscritto gli eventi che costituiscono lo spazio campionario Ω. (A) 1/3 (B) 33% (C) 50% (D) 2/3 (E) 100% SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -86-
, , , Lo spazio campionario è rappresentato graficamente come segue A-‐A C-‐A A-‐C C-‐C L’evento A= “estrazione di un torroncino all’arancia” è costituito dali eventi elementari: , , ed è rappresentato graficamente come segue: A A-‐A C-‐A A-‐C
L’evento B= “estrazione di un torroncino al cacao” è costituito dagli eventi elementari: , , ed è rappresentato graficamente come segue: B A-‐C C-‐C C-‐A
P(B|A) è la probabilità che si verifichi l’evento B sapendo che si è verificato l’evento A. Pertanto si ratta di limitare lo spazio campionario agli elementi dell’insieme B. Ovvero, se lo spazio campionario fosse composto dai soli elementi dell’insieme A (cioè 3 elementi), qual è la probabilità che si verifichi l’evento (cioè di estrarre un torroncino al cacao)? Nel caso,
Risposta esatta: (D) 2/3. 3)p.2Alcuni soggetti sono stati raggruppati in tre classi, a seconda della professione: nella prima classe il reddito medio è € 20.000 e lo scarto http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -87-
quadratico medio è € 5.000, nella seconda classe il reddito medio è € 30.000 e lo scarto quadratico medio è € 9.000, nella terza classe il reddito medio è € 40.000 e lo scarto quadratico medio € 10.000. La variabilità relativa dei redditi è maggiore nella classe (A) terza (B) seconda (C) prima e terza (D) prima 4)p.2La varianza dei fatturati medi di quattro categorie di imprese è 40.000, mentre la media aritmetica ponderata delle varianze dei redditi delle singole categorie è 20.000. Qual è il valore del rapporto di correlazione eta? (A) 0.21 (B) 0.516 (C) 0,63 (D) 0.82 E) 0.90 SOLUZIONE varianza della distribuzione marginale di Y. varianza delle medie delle distribuzioni parziali di Y. media aritmetica ponderata delle distribuzioni parziali di Y. Risposta esatta: (D) 0.82. 7)p.2Le confezioni di succhi di frutta prodotti da un’industria alimentare hanno, in media, rispetto a quanto dichiarato nell’etichetta, nel 5% dei casi un contenuto inferiore e nell’8% dei casi una concentrazione inferiore Inoltre, nel 40% dei casi in cui il contenuto risulta inferiore, lo è anche la concentrazione e viceversa nel 25% dei casi in cui concentrazione risulta inferiore, lo è anche il contenuto. La probabilità che una confezione abbia contenuto e concentrazione inferiori a quelli dichiarati è, pertanto, http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -88-
A)2% (B) 13% (C) 4,5% (D) 4% SOLUZIONE Si considerino gli eventi: A= “la confezione ha un contenuto inferiore” e B: “la confezione ha una concentrazione inferiore”. P[contenuto inferiore, concentrazione inferiore]= =P[contento inferiore|concentrazione inferiore]·∙P[concentrazione inferiore] P(contenuto inferiore concentrazione inferiore)= =P(contenuto inferiore|concentrazione inferiore)·∙P(concentrazione inferiore) P(A)=0,05 P(B)=0,08 P(A|B)=0,4 P(B|A)=0,25 Pensando semplicemente ad un’applicazione delle formula Risposta esatta: (A)2%. )p.2Le confezioni di succhi di frutta prodotti da un’industria alimentare hanno, in media, rispetto a quanto dichiarato nell’etichetta, nel 5% dei casi un contenuto inferiore; nell’ 8% dei casi una concentrazione inferiore e nel 2% dei casi sia contenuto che concentrazione inferiori. La probabilità che una confezione non sia conforme a quanto dichiarato solo per contenuto o solo per concentrazione o per entrambi i motivi è, (A)Non si può dire (B) 13% (C) 10% (D) 15% (E)11% SOLUZIONE La percentuale dell’intersezione deve risultare uguale se si parte dal primo oppure dal secondo insieme. Infatti: il 4% del 5% è:
, ed anche il
25% dell’8% è: . Se chiamiamo A l’insieme delle confezioni con contenuto inferiore e B l’insieme delle confezioni con concentrazione inferiore, evitando di scrivere “%” tutte le volte, , , , dunque l’11% delle confezioni non è conforme all’etichetta, per almeno una delle due irregolarità. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -89-
Risposta esatta: (E)11%. 2)p.2Un operaio produce 40 pezzi in un’ora; un altro ne produce 55 ed un terzo ne produce 70. La velocità di produzione media dei tre operai è (A) 55 (B) 52,20 (C) 90,0 (D) 83,4 SOLUZIONE Risposta esatta: (A) 55. 5)p.3La cittadina di Acicolore è suddivisa in tre quartieri: Arancio, Bianco e Celeste. L’assessorato all’istruzione ha condotto un’indagine tra le famiglie con figli in età scolare. I dati seguenti, misurati in euro, riguardano la spesa mensile sostenuta durante lo scorso anno per il trasporto scolastico. A quanto ammonta la spesa media totale sostenuta dalle famiglie di Acicolore per il trasporto scolastico? Arancio Bianco Celeste media 71 70 88 scarto quadratico 6 8 5 medio numero famiglie 150 100 200 (A)63,33 (B) 58,5 (C) 61,6 (D) 60,35 (E)78,33 (F) 68 SOLUZIONE Media aritmetica ponderata: Risposta esatta: (E)78,33. 8)p.2In una località turistica, una malattia tropicale colpisce mediamente un turista ogni venticinque. In un villaggio turistico vi sono 200 ospiti; determinare la probabilità che vi siano non oltre 10 turisti malati. (A) 19% (B) 72% (C) 46% (D) 82% SOLUZIONE Se X è la percentuale di turisti colpiti da una malattia tropicale in un villaggio turistico di 200 ospiti, X∼Bi(n, p), con n=200 e p=1/25. Allora per il Teorema del Limite Centrale si ha: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -90-
∼N . La probabilità richiesta è: P(X<10). Se avessimo usato la correzione di continuità, indicando con Z una gaussiana con stessa media e varianza di X, avremmo ottenuto, Se avessimo usato la correzione di continuità, indicando con Z una gaussiana con stessa media e varianza di X, avremmo ottenuto,
Risposta esatta: (D) 82%. )p.2Uno studente ha superato due esami con una media di 21. La varianza dei due voti è uguale a 9. Successivamente supera altri due esami, riportando in uno 28 e nell’altro 30. La varianza dei quattro voti sarà (A)2 (B) 21 (C) 17 (D) 10 (E)28 (F) Non si può calcolare )p.2La differenza semplice media, calcolata in gruppo di soggetti con un reddito medio di € 20.000 è risultata € 18.000. Pertanto, il rapporto di concentrazione dei redditi è (A)0,75 (B) 0,11 (C) 0,45 (D) 0,58 (E) 1,2 (F) 0,90 Nei primi 10 giorni del mese di novembre un negozio di abbigliamento ha venduto, in media, 13 capi al giorno, ma nei 20 giorni successivi la media è scesa a 7 capi al giorno. Quanti capi sono stati venduti, in media, ogni giorno, durante tutto il mese di novembre? (A)7 (B) 6 (C) 5 (D) 9 (E)6.5 (F) 4.5 SOLUZIONE Media aritmetica ponderata:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -91-
Nella media aritmetica ponderata, il numero delle osservazioni eseguite non è n (numero dei valori distinti), ma è dato dalla somma delle frequenze. Risposta esatta: (D) 9. La tabella seguente riporta i voti V conseguiti ad un esame universitario dagli studenti provenienti da tre facoltà S. Determinare la varianza della distribuzione condizionata di V|S-‐a S=a S=b S=c 30 21 25 28 24 26 30 24 25 (A)2,146 (B) 7,876 (C) 0,500 (D) 4,187 (E)7, 66 SOLUZIONE Per calcolare la media e la varianza della distribuzione condizionata dell’esercizio, devo semplicemente utilizzare i soli dati del gruppo S=a. Il calcolo della media e della varianza va effettuato dunque esclusivamente sui dati della prima colonna, in cui ho la sequenza individuale delle osservazioni (formule di protocollo elementare). S=a 30 28 30 25
Risposta esatta: (D) 4,187 -‐In un supermercato, l'importo degli scontrini emessi si distribuisce normalmente, con media 65 euro e scarto quadratico medio 30. Il 30% degli scontrini risultano inferiori a (A)58,25 (B)49,26 (C)65 (D)80,73 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -92-
Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01311 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.1Il momento di origine due e di grado zero, µ2,0 , è: (A)Il quadrato della media quadratica (B) media quadratica (C) La media aritmetica (D)1 SOLUZIONE Indicando con m un numero reale e con r un intero positivo, si definisce momento di origine m e grado r di una distribuzione la media aritmetica ponderata delle potenze r-‐esime degli scarti da m dei valori, , della variabile, con pesi espressi dalle corrispondenti frequenze, , ossia dove N è la somma delle frequenze. È possibile definire anche un momento di grado r=0, che, evidentemente, è sempre uguale all’unità, cioè µm,0 =1. Nel caso particolare: Risposta esatta: (D)1. 2)p.1Nel caso di dati raggruppati, la varianza totale si ottiene: (A) calcolando la media aritmetica ponderata delle varianze dei singoli gruppi (B) sommando alla media ponderata delle varianze dei gruppi, la varianza ponderata calcolata sulle medie dei singoli gruppi (C) sommando le varianze dei singoli gruppi SOLUZIONE La varianza è uguale alla somma della media aritmetica ponderata delle varianze dei singoli gruppi e della varianza delle medie dei gruppi. Risposta esatta: (B) sommando alla media ponderata delle varianze dei gruppi, la varianza ponderata calcolata sulle medie dei singoli gruppi 3)p.1Date le due distribuzioni X e Y sotto riportate, determinare i parametri della retta di regressione a e b X 46 52 61 34 61 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -93-
Y 37 62 64 47 38 (A) a= 40; b=-‐ 0,56 (B) a=35,03; b=0,28 (C) a= 23,79; b= 0,44 (D) a=21; b= 4,31 (E) a= 23,79; b=2,44 (F)a=0,81; b=13,57 4)p.110 studenti riportano i seguenti voti nell’esame di statistica: a b c d e f g h i l 28 30 18 29 28 22 25 19 23 29 Qual è l’ordine di rango dello studente f? (A) 8 (B) 7 (C) 6 (D) 8.5 5)p.3In un giuoco del tipo “gratta e vinci” il 60 % delle schede non è vincente. Acquistando 8 schede, quale è la probabilità che almeno due siano vincenti? (A)0,89 (B)0,78 (C)0,84 (D)0,04 6)p.1La distribuzione dei redditi degli impiegati di un’azienda ha media m e scarto quadratico medio s. Se gli stipendi venissero aumentati del 20%, quale valore avrebbe lo scarto quadratico medio? (A)s (B)1,2s (C)1,44 s2 (D) 1,44s 7)p.1Con riferimento al quesito precedente, determinare se, a seguito dell’aumento concesso, la variabilità della distribuzione è aumentata, diminuita o è rimasta uguale, spiegando per iscritto le ragioni della risposta. (A)aumentata perché 1,2s>s (B) non si può dire perché non si conoscono i singoli redditi (C) diminuita perché s<1,44s (D) uguale perché 1,2s/1,2m=s/m 8)p.2Dati i seguenti gruppi, indicare la varianza totale Gruppo
N
A B C
4 3 6
_ X 10 9,5 11
2 1 3
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -94-
(A)6 (B) 2,6 (C) 3 (D) 2,2 9)p.1Le scale per rapporti sono le scale che hanno uno zero assoluto naturale. (A) dipende dalla natura del carattere (B)non esiste uno zero assoluto (C) falso (D) vero SOLUZIONE In alcune scale lo Zero indica assenza dell'attributo, di conseguenza il rapporto tra due valori della scala indica un rapporto tra due valori valore dell'attributo, es.: un guadagno di £_100.000 è il doppio di £_50.000. Questa caratteristica addizionale è chiamata scala per rapporti. Scale per rapporti sono ad es.: il peso misurato in Kg., la pressione arteriosa misurata in Mg. di Hg, il tasso di mortalità, numero di morti per 1000 persone a rischio. Una scala metrica fornisce più informazioni di una ordinale o nominale, quindi è preferibile quando se ne ha la possibilità. La scala di rapporti è simile a quella di intervalli ad eccezione che qui lo zero è assoluto e ciò consente la moltiplicazione e la divisione sui diversi valori della variabile. E proprio lo zero assoluto (ovvero non arbitrario), che costituisce l'unica differenza tra misurazione su scala di rapporti e la misurazione ad intervalli. Per riconoscere una scala di rapporti occorre valutare se lo zero costituisce assenza della proprietà in questione. Un esempio è costituito dalla scala Kelvin, dove la temperatura ha una interpretazione diretta in termini del moto delle molecole ed il punto 0° K è il punto in cui tale moto cessa del tutto. Le scale di rapporti si dividono in scale metriche, se il fenomeno non è trasferibile (come ad esempio l'altezza) e scale di quantità, se il fenomeno lo è (come ad esempio il denaro). Risposta esatta:(D)vero. Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01332
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -95-
Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.1In una distribuzione normale standardizzata z: (A)la varianza è sempre proporzionale alla media (B) la media è uguale alla radice quadrata della varianza (C)la media è uguale a 0 (D) la varianza è uguale a 0 2)p.2Sei persone che si trovano in una stanza possiedono, rispettivamente, le seguenti stature e pesi: Statura (cm) 160 165 170 175 180 185, Peso (kg) 64 61 68 74 78 82. Determinare la retta di regressione del peso in funzione della statura. (A)y = 0,94x – 90,2 (B) y = 0,96x – 93,3 (C) y = 0,84x – 73,7 (D) y = 0,80x – 67,6 3)p.1Il campionamento stratificato viene preferito quando le unità della popolazione sono molto: (A)simili (B) numerose (C) eterogenee 4)p.1Dati i seguenti gruppi di osservazioni, calcolare la varianza totale: Gruppo numero di osservazioni A 4 7 2 B 3 8 1 C 6 10 3 (A)3,2 (B) 2,23 (C) 6,01 (D) 4,01 5)p.1Per una variabile continua la funzione di densità di frequenza fx, è la derivata della funzione di ripartizione. (A)Vero solo se la variabile è una normale (B) per le variabili continue non esiste la densità di frequenza (C)Vero (D) falso
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -96-
6)p.3Per una certa squadra di calcio, il numero atteso di reti segnate per partita è 1,458. Determinare la probabilità che in due partite la squadra realizzi almeno tre reti? (A)0,558 (B) 0,687 (C) Non si può dire (D) 1,131 7)p.3La spesa telefoniche annue di 10 famiglie sono le seguenti:707,1 721,6 504,5 1078,7 1141,6 1411,5 1772,5 1814,6 1504,2. Determinare la mediana, il venticinquesimo ed il settantacinquesimo percentile. (A)1276,6; 714,35; 1638,35 (B) 1276,6; 613,05; 1659,4 (C)1141,6; 504,4; 1816,4 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01378 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1Per un gruppo di atleti, si ha una statura media di m. 1,85 con σ2=0,81 ed un peso medio di kg. 80 con σ2=0,25. Calcolare il valore massimo possibile che la covarianza tra le due variabili può raggiungere. (A)0,2025 (B) 1 (C) 0,45 (D) +∞ SOLUZIONE Covarianza-‐proprietà Disuguaglianza di Cauchy-‐Schwarz. La covarianza è in valore assoluto, minore o uguale al prodotto degli scarti quadratici medi. Se fra le due variabili esiste un perfetto legame lineare, che si può esprimere nella forma Y=aX+b, la covarianza è in valore assoluto uguale al prodotto degli scarti quadratici medi.
ed in particolare
Quindi:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -97-
Risposta esatta: (C) 0,45. 2)p.3In un esercizio composto da n tiri indipendenti, un arciere realizza mediamente 8 centri, con coefficiente di variazione 0.25. Adattare un’opportuna distribuzione e calcolare la probabilità di ottenere esattamente 7 centri. (A)19,64% (B) 40,45 (C) 12,54% (D)35,28% 3)p.3Con riferimento a 6 studenti universitari, sono state rilevate le variabili X= punteggio ottenuto al test di ingresso, Y= numero di crediti universitari acquisiti nei primi due anni accademici. Si riportano alcune statistiche descrittive dei dati: = 81;
= 112;
= 1559;
= 3080
= 2106;
Calcolare il coefficiente di regressione b di Y su X. (A)-‐0.36 (B) 1.28 (C) 4.52 (D) 0.65 4)p.3Il manager di un negozio di abbigliamento ha rilevato che durante il periodo natalizio, in media, ogni cento clienti che visitano il negozio uno acquista una pelliccia. Posto che il negozio riceve circa 600 visite al giorno, qual è la probabilità di vendere tra due e quattro pellicce in un giorno? (A) 8,92% (B) 4,46% (C) 26,77% (D) 13,39% 5)p.1Il tasso di disoccupazione in una regione è 17,0%, mentre in un’altra regione, che ha una popolazione doppia è 8,0%. Nel complesso delle due regioni il tasso di disoccupazione è (A)7,0% (B) 11% (C) 12,5% (D) 8,0% SOLUZIONE
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -98-
Tassi di disoccupazione
17,0%
8,0%
Totale
Popolazione
1
2
3
La media aritmetica ponderata è: Risposta esatta: (B) 11% 6)p.1Un’azienda ha verificato che all’aumentare del prezzo p la quantità venduta q di un dato prodotto diminuisce. Posto che il 64% della varianza di q è spiegata da p, determinare il valore del coefficiente di correlazione lineare tra p e q. (A) 7% (B) 0,8 (C) 0,4 (D) -‐0,4 (E) -‐0,8 SOLUZIONE Dividendo la varianza dei valori calcolati, espressa nella forma , per quella dei valori osservati, è facile verificare che si ottiene il quadrato del coefficiente di correlazione, r, cioè . Tale rapporto, detto coefficiente di determinazione, esprime, quindi la frazione della varianza dei valori osservati della variabile Y, spiegata dalla regressione sulla variabile X. La percentuale di variabilità di Y spiegata dalla variabilità di X data da: . Il coefficiente di correlazione lineare assume un valore compreso http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -99-
fra -‐1 e +1; risulta, generalmente, positivo se, al crescere di X, tende a crescere anche Y e negativo se Y tende a decrescere al crescere di X. Ma si considera -‐0,8 perché al crescere del prezzo p la quantità venduta q diminuisce. Risposta esatta: (E) -‐0,8. 7)p.2La media della distribuzione di un gruppo di soggetti secondo la statura a è 174 cm e lo scarto quadratico medio 6 cm. Se si adatta alla distribuzione la curva normale, il 50% dei soggetti ha un’altezza h compresa tra 170 ed x, P(170>h>X)=50%. Determinare il valore di x. (A)185 (B) 174 (C) 164 (D) 176 SOLUZIONE
Quindi 8)p.3Sono state intervistate 150 persone. Hanno dato risposta affermativa ad una domanda 30 persone, ad un’altra domanda 70 persone ed è, inoltre, 12 il numero delle persone che hanno dato riposta affermativa ad entrambe le domande. Per questa tavola di associazione l’indice chi quadrato è: (A) 0,85 (B) 0,75 (C)124 (D) 0,67 (E) 11 (F) 0,4 SOLUZIONE Domanda 2 Domanda 1 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -100-
SI NO Totale
SI 12 18 30
NO 58 62 120
Totale 70 80 250
In questi dati il primo carattere, Domanda 2, assume 2 modalità, sicché k=2 e anche il secondo carattere, Domanda 1, assume 2 modalità e pertanto h=2. Infine la numerosità complessiva è n=150. Utilizzando la formula si ha
si ha
L’indice
è positivo quindi fra i due caratteri vi è dipendenza.
Risposta esatta: (D) 0,67. Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01441 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1Si determini il valore medio della seguente distribuzione del numero di pratiche evase dai 22 impiegati di un certo comune, in una data settimana lavorativa: p.evase 2 3 4 5 6 8 10 Totale Tot. 5 4 3 5 3 1 1 22 Imp.
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -101-
(A)4,32 (B) 6,67 (C) 3,56 (D) 4,59 (E) 5,23 (F) 6,12 Applicando la formula della media aritmetica per le seriazioni, si ottiene:
Risposta esatta: (E)4,32.
2)p.2Un quiz è composto da 5 domande, tra loro indipendenti, ciascuna con cinque possibili risposte di cui una sola corretta. Assumendo che un candidato scelga a caso la risposta ad ogni quesito, si calcoli la probabilità che il numero di risposte esatte sia al massimo uno. (A)0,33 (B) 0,23 (C) 0,73 (D) 0,93 (E) 0,56 (F) 0,45 3)p.2Date le due distribuzioni X e Y sotto riportate, determinare i parametri della retta di regressione a e b X 46 52 61 34 61 Y 37 62 64 47 38
(A)a=23,79; b=0,44 (B) a= 35,03; b=0,48 (C) a=23,79; b=2,44 (D) a=0,81; b=13,57 (E) a= 40; b=-‐0,56 (F) a=31,17; b=0,33 4)p.3La varianza della distribuzione di un gruppo di soggetti secondo la statura (in cm) è 36. Se si adatta alla distribuzione la curva normale, la differenza interquartile (tenendo presente che P(|z|<0,6745)=0,5) risulta (A)8,10 cm (B) 8,04 cm (C) 4,05 cm (D) 6,02 cm 5)p.1Se il coefficiente di correlazione lineare r tra due variabili ha un valore negativo, prossimo a -‐1, la correlazione è: (A)forte (B) assente (C) debole (D) non si può dire SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -102-
Il coefficiente di correlazione di Pearson fornisce un’idea del grado di legame lineare tra le variabili X e Y. Ammettiamo di disporre di più campioni aleatori delle variabili X e Y. Nel caso in cui tra queste non esista alcuna correlazione, i valori di r, calcolati per ciascun campione, oscilleranno intorno a zero, e saranno talvolta positivi, talvolta negativi; solo molto raramente r potrà raggiungere valori elevati. Se invece la correlazione tra le variabili è forte, il valore di r sarà vicino a +1 oppure a -‐1, e quanto più è vicino, tanto più forte è la correlazione. Quando r è uguale a +1 oppure a -‐1 si dice che tra X e Y vi è correlazione lineare perfetta. Risposta esatta: (A)forte. 6)p.2In generale, se il rapporto di correlazione di una variabile Y su una variabile X assume un valore prossimo ad 1, il coefficiente di correlazione lineare può avere un valore intorno a 0? (A)Sì, accade tutte le volte che due variabili sono indipendenti. (B) No, non può mai verificarsi. (C) Sì, ma solo se la regressione è lineare (D) Sì, se il legame è non lineare può capitare SOLUZIONE La regola dice che l'indipendenza in media implica l'indipendenza lineare. Questo significa che se avessi una dipendenza in media pari a 0 (es. eta2=0 o ) allora avrei sicuramente un coefficiente lineare nullo. Invece, il fatto che l'eta2 (rapporto di correlazione) sia vicino ad 1 indica che sussiste massima dipendenza in media di Y da X. Questo non ci dice nulla sulla dipendenza lineare, quindi, se effettivamente essa non sussiste, il coefficiente di correlazione lineare sarà pari a 0. Risposta esatta: (D) Sì, se il legame è non lineare può capitare.
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -103-
7)p.2Si deve ripartire un podere, costituito da 100 appezzamenti quadrati, in 100 appezzamenti di uguale superficie. Determinare il lato medio di ogni appezzamento: (A)54 (B) 50 (C) 62 (D) 55 SOLUZIONE Nella seguente tabella sono riportati alcuni calcoli utili per lo sviluppo dell’esercizio. 100
16
1.600
10.000
160.000
50
41
2.050
2.500
102.500
25
64
1.600
625
40.000
Tot
121
5.250
-‐
302.500
La media quadratica del carattere rilevato è data da: Risposta esatta: (C)50. 8)p.1Nella tavola di correlazione di due variabili (tabella a doppia entrata), ciascuna delle quali può assumere, rispettivamente, r ed s modalità, le distribuzioni parziali sono in numero di (A)r + s – 2 (B) due (C) r + s (D) r + s – 1 SOLUZIONE In una tavola a doppia entrata vi sono s+k distribuzioni parziali. Risposta esatta: (C) r + s.
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -104-
Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01363 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.1Lo scostamento medio potenziato di ordine r si fonda sul (A)confronto fra ogni termine della distribuzione e una loro media. (B) confronto fra ogni termine della distribuzione e la differenza interquartile (C) confronto fra ogni termine della distribuzione e tutti gli altri SOLUZIONE In generale, si può assumere come indice di variabilità una media potenziata dei valori assoluti degli scarti dei valori osservati da una loro media, X, cioè l’espressione
, dove r è un numero positivo arbitrario, detta scostamento medio potenziato di ordine r. Risposta esatta: (A)confronto fra ogni termine della distribuzione e una loro media. 2)p.3 Il tempo (misurato in minuti) trascorso giornalmente davanti al televisore si distribuisce in modo normale con media 120 minuti e scarto quadratico medio 30 minuti. Un terzo dei soggetti trascorre davanti alla televisione più di Y minuti. Trovare il valore di Y. (A) 140 (B) 107 (C) 100 (D) 133 X∼N(120,900) Tavola z .03
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -105-
… 0.4 0.1664 2° modo di risolvere. Cerchiamo il valore di y per cui Pr(Y>y)=0,3333 Partiamo dalla distribuzione normale standardizzata e poi applichiamo la trasformazione inversa alla standardizzazione. Si ha che: Pr(Z>z)=0,3333 z=0,4303 Il valore di z si dovrebbe individuare ricercando all’interno delle tavole della normale standard il valore di (0,5000-‐0,3333) e risalendo da questo al valore di z. In questo caso, tuttavia all’interno delle tavole della normale standard non è possibile individuare un valore di pari a 0,1667. I due valori di più prossimi a 0,1667 sono: 0,1664 e 0,1700 corrispondenti, rispettivamente, a z=0,43 e z=0,44. Interpolazione tramite proporzione: 0,1667-‐0,1664=0,0003; 0,1700-‐0,1667=0,0033 0,0003:(0,1700-‐0,1664)=(z-‐0,43):(0,1700-‐0,1664) 0,0003:0,0036=(z-‐0,43):0,0036 z-‐0,43=0,0003 z=0,43+0,0003 z=0,4303
Quindi: . Risposta esatta: (D) 133. 3)p.1Un’impresa preleva periodicamente un campione di pezzi prodotti da un dato macchinario per rilevare il numero di pezzi difettosi. Il carattere pezzi difettosi è: (A)quantitativo continuo (B) qualitativo nominale (C)quantitativo discreto SOLUZIONE Innanzitutto sono da distinguere diversi tipi di dati derivanti dall’osservazione dei caratteri delle unità:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -106-
-‐caratteri di tipo quantitativo esprimibili con una misura (statura, peso, diametro, ecc.) su un continuo, oppure discreti, che assumono cioè solo determinati valori (numero di pezzi difettosi, numero di difetti in una unità, numero di pezzi prodotti, ecc.); -‐caratteri di tipo qualitativo, per i quali non è prevedibile un ordinamento (sesso, religione, difettoso/non difettoso, ecc.). Dal punto di vista delle elaborazioni cui possono essere sottoposti, è utile distinguere i caratteri quantitativi in discreti e continui. Sono caratteri discreti ad esempio, la dimensione familiare (numero dei componenti), il numero di pezzi difettosi presenti nelle confezioni di un prodotto industriale, il numero di giornate piovose nel mese di marzo, ecc. Questi esempi, si rifriscono a caratteri numerabili, le cui modalità sono cioè riconoscibili mediante conteggio o numerazione; l’insieme A delle modalità risulta essere perciò un sottoinsieme dei numeri interi non negativi. Risposta esatta: (C)quantitativo discreto. 4)p.1La somma dei quadrati degli scarti dei valori di una distribuzione rispetto ad una quantità arbitraria m, è minima solo se: (A)nessuno dei casi precedenti (B) m=mediana (C) m=0 (D) m=moda SOLUZIONE La somma dei quadrati degli scarti (differenze) dei valori osservati da un’origine m è un minimo quando m è uguale alla media aritmetica per Risposta esatta: (A)nessuno dei casi precedenti. 5)p.1Per misurare la correlazione esistente tra un carattere quantitativo e un carattere qualitativo si impiega: (A) l’indice chi-‐quadrato (B) il rapporto di correlazione (C)la covarianza (D) il coefficiente di correlazione lineare di Bravais-‐Pearson SOLUZIONE Il rapporto di correlazione si applica, di solito, quando la regressione è non lineare. Inoltre, il rapporto di correlazione si può calcolare anche se una delle due variabili è misurata su una scala nominale d ordinale, cioè tra un carattere quantitativo ed un carattere qualitativo. Risposta esatta: (B) il rapporto di correlazione. 6)p.1Se nella regressione lineare semplice Y = Bo + B1X il coefficiente di determinazione R2= 0,9 vuol dire: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -107-
(A) il 90% della variabilità di Y non è spiegata dalla retta di regressione (B) il 10% della variabilità di Y è spiegata dalla retta di regressione (C)il 90% della variabilità di Y è spiegata dalla retta di regressione SOLUZIONE Per definizione indica quanta parte della devianza di Y (misura della variabilità di Y) è spiegata dalla devianza di regressione, o dal modello di regressione. Il coefficiente di determinazione esprime la frazione della varianza dei valori osservati della variabile Y, spiegata dalla regressione sulla variabile X. Risposta esatta: (C)il 90% della variabilità di Y è spiegata dalla retta di regressione. 7)p.2Un quiz è composto da 5 domande, tra loro indipendenti, ciascuna con tre possibili risposte di cui una sola corretta. Assumendo che un candidato scelga a caso la risposta ad ogni quesito, si calcoli la probabilità che si risponda esattamente soltanto alle prime due domande. (A)0,25 (B) 0,15 (C) 0,09 (D) 0,033 (E) 0,12 (F) 0,4 SOLUZIONE Per ogni quesito, rispondendo a caso, si ha probabilità pari 1/3 di rispondere correttamente e pari a 2/3 di sbagliare. Le 5 domande costituiscono sottoprove indipendenti tra loro, per cui indicando con Ei l’evento “risposta esatta alla i-‐esima domanda e con X il numero di risposte esatte su 5 domande si ha: Risposta esatta: (D) 0,033. 8)p.2In un’impresa, i lavoratori con salario inferiore a € 800 sono il 44%, mentre quelli con salario da € 800 a € 900 sono il 15%. La mediana dei salari è: (A) € 870 (B) € 840 (C) € 850 (D) € 860
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -108-
La distribuzione è formata da n=2 classi chiuse a sinistra (se le classi contengono i loro estremi inferiori, ma non anche quelli superiori, sono intervalli chiusi a sinistra, quindi si può far precedere il trattino da una sbarretta verticale ( ); i limiti superiori delle classi, xi, sono indicati nella quinta colonna. i
Classi
Rapporti percentuali
Distribuzione cumulativa
Ore funzionamento
1
<800
44
80
44
2
800-‐900
15
900
59
Totali
59
Si può utilizzare la seguente formula per risalire al valore della mediana dove rappresenta il valore del limite superiore della classe immediatamente precedente alla classe alla quale appartiene le mediana. Il secondo quartile (k=2), ossia la mediana, appartiene, alla seconda classe, in quanto ed ha il valore rappresenta il valore della frequenza cumulata percentuale immediatamente precedente alla classe alla quale appartiene la mediana. Risposta esatta: (B) € 840. 9)p.2Nella tabella seguente sono riportati, con riferimento ai due anni 1980 e 2000, i clienti di un’impresa ripartiti per area geografica di appartenenza.
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -109-
Misurare il legame fra i dati relativi ai due anni mediante il coefficiente di regressione lineare Area geografica clienti 1980 clienti 2000 America del Nord 10 100 America Latina 22 80 Europa occidentale 35 100 Europa orientale 35 50 Africa 36 45 Medio Oriente 39 20 Asia e Oceania 43 12 Totale mondiale 220 407 (A)-‐2,37 (B) 8,77 (C) -‐3,24 (D) 4,23 (E) 32,15 (F) -‐5,3 SOLUZIONE La retta di regressione si esprime con y=a+bx dove il parametro b si calcola:
,
Risposta esatta: (A)-‐2,37. Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01488 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -110-
Lato in m. 100 50 n.ro di 16 41 appezzamenti
25 64
Totale 100
Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.2Sono noti i dati relativi ai prezzi di un bene rilevati in cinque mercati: prezzo medio 20 e scarto quadratico medio 3 euro al quintale. Successivamente, vengono comunicati i dati relativi ad altri cinque mercati: prezzo medio 22 e scarto quadratico medio 2,65 euro al quintale. Quali sono i valori del prezzo medio e della varianza nel complesso dei dieci mercati? (A)21; 9 (B) 20; 5 (C) 21; 3 (D)21; 5 (E) 20,5; 3 (F) 20,5; 9 SOLUZIONE 1)La media generale è:
2)La scomposizione della varianza può essere la seguente:
N=10, g=2 gruppi e Abbiamo che
Risposta esatta: (A)21; 9. 2)p.1Il rapporto di correlazione di una variabile Y su una variabile X coincide con il valore assoluto del coefficiente di correlazione lineare se la regressione è (A)mai (B) non lineare (C) lineare 3)p.2Se alla domanda “Siete favorevoli al fumo”, rivolta a 200 studenti scelti in maniera casule fra la popolazione studentesca catanese, si sono avuti i seguenti risultati: 99 Femmine, di cui 14 hanno risposto SI; 101 maschi, di cui 65 hanno risposto NO; la probabilità di estrarre un’unità che appartenga alla categoria F “o” SI, risulta: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -111-
(A)56,00 % (B) 25,04% (C) 67,5% (D)18,00% (E) 12,01% (F) 70,0% SOLUZIONE “F o S” è dato dall’unione dei due insiemi; il numero degli elementi si ottiene sommando componenti disgiunte: qui è più facile sommare il numero di Femmine con il numero di Maschi che ha risposto SI (99+(101-‐65)=135). Analogamente si potrebbe sommare il totale dei SI con le Femmine che hanno risposto NO: 50+85=135. Dalla tabella sommando i sottoinsiemi disgiunti che compongono l’insieme, si ha: 36+14+85=135. La probabilità richiesta è: Si indichi con n(I) il numero di elementi che formano un insieme e siano: S l’insieme di tutti gli elementi; A l’insieme di coloro che hanno risposto affermativamente e B il numero delle Femmine. n(A)=50 n(B)=99 l’unione di A e B è l’insieme di coloro che hanno risposto affermativamente “o” che sono Femmine. Il numero, n(A o B), di questi intervistati si ottiene facendo la somma del numero, n(A), delle risposte affermative e del numero, n(B), delle Femmine e sottraendo poi il numero n(A e B) delle Femmine che hanno risposto affermativamente (intersezione di A e B), che verrebbero altrimenti contate due volte cioè n(A o B)=n(A)+n(B)-‐n(A e B) Con i dati della Tavola si ha n(A o B)=50+99-‐14=135; e dividendo per il totale, n(S)=200, delle interviste, si ottiene il rapporto Nel definire gli insiemi bisogna guardare la probabilità richiesta dall’esercizio, quindi nel nostro caso, F “o” SI rappresentano gli insiemi A e B. 2°Modo di risolvere Si considerino gli eventi A:= SI e B:= è di sesso femminile Calcolare Risposta esatta: (C) 67,5%. 4)p.2Per una specie equina, la percentuale di cavalli di colore nero è pari al 20,73%. Quale è la probabilità che in un campione casuale di 300 cavalli, oltre 57 siano neri? http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -112-
(A)0,39 (B) 0,480 (C) 0,22 (D)0,70 (E) 0,59 (F) 0,77 SOLUZIONE Grazie al Teorema del Limite Centrale è possibile approssimare la Binomiale alla variabile casuale Normale e di conseguenza alla v.c. Normale Standardizzata. Poiché la variabile casuale Binomiale ha valore atteso pari a: e varianza
possiamo procedere all’operazione di standardizzazione. Quindi :
La è 0,2286. Dalla lettura delle tavole della v.c. normale standardizzata si ha che tale probabilità è pari a 0,2296. Infatti, l’ordinata z=0,74 della suddetta curva riporta un valore (compreso tra 0,04 e 0,70) pari a 0,2704. Dalla simmetria della v.c. normale segue che P(z<-‐0,74)=0,5-‐P(0,04<0,7). Infatti 0,5-‐ 0,2704=0,2296. Segue che P(x>57)=P(z>-‐0,74). Quindi, P(z>-‐0,74)=0,2704+0,5=0,7704.
Risposta esatta: (F) 0,77. 5)p.2La tabella seguente mostra le quantità di concime impiegato e la produzione di cinque campi di grano. Ipotizzando una relazione lineare tra le due variabili, quali sono le stime dei parametri α e β del modello di regressione? concime 45 53 59 64 74 produzione 38 45 60 72 84 di grano (A) y = –19,710 + 71,9x (B) y = –17,660 + 48,109x http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -113-
(C) y = –3,80 + 1,169x (D) y = –5,660 + 1,9x (E) y = –40,33 + 1,697x (F) y= -‐54,690 + 4,2569x SOLUZIONE La retta di regressione si esprime con y=a+bx dove i parametri a e b si calcolano:
,
Quindi:
Risposta esatta: (E) y = –40,33 + 1,697x. 6)p.1In un supermercato, l’importo degli scontrini emessi si distribuisce normalmente, con media µ = 80,35 euro e scarto quadratico medio σ = 30. Il 45% degli scontrini risultano superiori a: (A)84,12 (B) 68,77 (C) 19,47 (D) 61,23 SOLUZIONE X∼N(80,35,900) Tavola z .03 …
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -114-
0.4 0.1664 2° modo di risolvere. Cerchiamo il valore di y per cui Pr(X>x)=0,45 Partiamo dalla distribuzione normale standardizzata e poi applichiamo la trasformazione inversa alla standardizzazione. Si ha che: Pr(Z>z)=0,45 z=0,1317 Il valore di z si dovrebbe individuare ricercando all’interno delle tavole della normale standard il valore di (0,5000-‐0,45) e risalendo da questo al valore di z. In questo caso, tuttavia all’interno delle tavole della normale standard non è possibile individuare un valore di pari a 0,05. I due valori di più prossimi a 0,05 sono: 0,0478 e 0,0517 corrispondenti, rispettivamente, a z=0,12 e z=0,13. Interpolazione tramite proporzione: 0,05-‐0,0478=0,0022; 0,0517-‐0,05=0,0017 0,0017:(0,0517-‐0,0478)=(z-‐0,13):(0,0517-‐0,0478) 0,0017:0,0039=(z-‐0,13):0,0039 z-‐0,13=0,0017 z=0,13+0,0017 z=0,1317 Quindi:
Oppure bisogna fare la media aritmetica di 0,12 e 0,13, ottenendo come risultato 0,125. Quindi la media aritmetica fra 0,125 e 0,126, ottenendo come risultato 0,1255 che è il valore con il quale si approssima z. Risposta esatta: (A)84,12. Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 196 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:_ _ __ http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -115-
Modulo I 1)Un’industria di manufatti rileva l’incremento relativo mensile delle quantità prodotte. Per calcolare l’incremento relativo medio mensile deve utilizzare: (A)La media aritmetica (B) La media armonica (C)La media geometrica 2)p.1La somma algebrica degli scarti relativi dei valori osservati dalla loro media, moltiplicati per i rispettivi pesi, è nulla se la media è: (A)aritmetica (B) geometrica (C) armonica SOLUZIONE La scritta nella forma , esprime una proprietà della media armonica: la somma algebrica degli scarti relativi dei valori osservati dalla loro media armonica, cioè dei rapporti , moltiplicati per i rispettivi pesi è nulla. Risposta esatta: (C) armonica. 3) p.3In una distribuzione di frequenza la media aritmetica è 3 e la media quadratica è 5. Quale valore ha lo scarto quadratico medio? (A)8 (B) 9 (C) 2 (D) 16 (E)4 (F) 5 SOLUZIONE media aritmetica media quadratica , cioè la varianza si può calcolare come differenza fra i quadrati della media quadratica e della media aritmetica dei valori osservati. Risposta esatta: (E)4. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -116-
4)p.3Gli operai di una fabbrica sono raggruppati in 4 classi. Quale valore avrebbe l’indice di mutabilità di Gini (che si può calcolare sottraendo dall’unità la somma dei quadrati delle frequenze relative delle classi), se le classi contenessero tutte lo stesso numero di operai? (A)0,75 (B) 0,25 (C) 0,85 (D) 0,55 (E)0,35 (F) 0,50 5) p.1Mediante l'impiego delle tavole della curva normale standardizzata calcolare il valore di Z0 per il quale la probabilità è uguale a: Pr (0<Z <Z0) = 0,47500. (A)0,06 (B) 1,96 (C) 4,75% SOLUZIONE Si consideri l’intervallo (0, zo). L’area sottostante la curva normale in tale intervallo è data da: Il testo dell’esercizio specifica che e di conseguenza zo deve essere tale da soddisfare la seguente equazione: (7) Il valore di zo che soddisfa (7) viene individuato ricercando all’interno delle tavole della normale standard il valore e risalendo da questo al valore di zo. Per chiarire meglio questo procedimento, di seguito riportiamo una porzione delle tavole della normale standard in cui sono evidenziati i passaggi da compiere: z .00 .01 .02 .03 .04 .05 .06 .07 .08 . . . 1.9 0.975 Risposta esatta: (B) 1,96. 6)p.1Nella popolazione i punteggi in un test di <<memoria a breve termine>> (X) si distribuiscono normalmente, con media µ = 15 e scarto quadratico medio σ = 3. Il valore X che delimita il 20% dei soggetti peggiori è: (A)13.41 (B) 12.48 (C) 10.00 (D)17.52 SOLUZIONE Cerchiamo il valore di x per cui Pr(X=x)=0,2.
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -117-
Partiamo prima dalla distribuzione normale standardizzata e poi applichiamo la trasformazione inversa alla standardizzazione. Si ha che Pr(Z=z)=0,2 0,84. Il valore di z si dovrebbe individuare ricercando all’interno delle tavole della normale standard il valore di e risalendo da questo al valore di z. In questo caso, tuttavia, all’interno delle tavole della nomale standard non è possibile individuare un valore pari 0,3. I due valori di più prossimi a 0,3 sono: 0,2995 e 3,023; si considera tra i valori 0,2995 e 3,023 quello più vicino a 0,3, vale a dire 0,2995 (perché: 0,3-‐0,2995=0,0005 che è più piccolo di 0,3023-‐03=0,0023); si sceglie quel numero che genera, in confronto con 0,3, la differenza più piccola) e si approssima z con 0,84. Quindi
Il valore 0,3 è dato da 0,5000-‐0,2=0,3. Risposta esatta: (D)17.52. 7) p.1Nella regressione si applica il concetto di dipendenza: (A)stocastica (B) matematica (C) in media SOLUZIONE Se la variabile Y dipende in media da X, si ottiene, sovente, una spezzata, il cui andamento è assimilabile a quello di qualche curva regolare. In tal caso, scelta ed adattata alla spezzata una conveniente curva, la sua equazione, y=f(x), può essere considerata come la relazione teorica che intercorre fra le medie delle distribuzioni parziali di Y ed i corrispondenti valori di X e la funzione f(x) viene detta funzione di regressione di Y si X. In particolare, se la spezzata è assimilabile ad una retta, si sule dire che la regressione è lineare ed alla retta si dà il nome di retta di regressione. Risposta esatta: (C) in media. 8) p.1La dipendenza in media implica la dipendenza stocastica (A)vero (B) falso 9) p.1Il coefficiente di correlazione lineare semplice si avvicina in valore assoluto ad 1 quanto più è stretta la relazione tra le variabili : http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -118-
(A)sempre (B) se la relazione è lineare (C) se la relazione è non lineare 10)p.1Se il carattere Y dipende in media dal carattere X, il carattere X dipende sempre in media dal carattere Y (A)vero (B) falso 11)p.3Una certa zona è servita da quattro compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto per telefonate interurbane (X) ed il numero (in migliaia) di nuovi contratti di abbonamento sottoscritti nell’ultimo anno (Y). Determinare il coefficiente di regressione semplice e la percentuale di varianza di Y spiegata dalla regressione. Compagnia telefonica Costo al minuto (X)
Numero contratti (Y)
A
9
15
B
7
20
C
10
10
D
13
5
(A)-‐12; 98% (B) 3,12; 72% (C) 3,12; 93% (D)4,2; 72% SOLUZIONE La retta di regressione si esprime con y=a+bx dove il parametro b si calcola:
,
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -119-
La tabella è stata presa da un altro esercizio uguale, la tabella di questo esercizio non si riusciva a leggere; i dati sono diversi e per questo anche il risultato non coincide con quelli previsti nell’esercizio del compito. 12)p.3In un gruppo di paesi, il coefficiente di regressione del tasso di mortalità infantile sul reddito pro-‐capite è negativo e la frazione della varianza del suddetto tasso, spiegata dal reddito, è del 36 %. Qual è il valore del coefficiente di correlazione lineare tra le due variabili?
(A)-‐0,60 B) 0,36 C) 0,60 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 238 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1) La tabella seguente mostra il numero di addetti di un gruppo di aziende http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -120-
A B C D E F G 71 20 250 25 10 100 25 Calcolare il rapporto di concentrazione. (A)0,49 (B) 0,77 (C) 0,59 (D) 0,55 (E)0,79 (F) 0,89 2)p.2Con riferimento al quesito precedente, determinare il rapporto tra la differenza semplice media ed il suo valore massimo. (A)0,55 (B) 0,89 (C) 0,49 (D) 0,77 (E)0,59 (F) 0,79 3)p.Sui dati della seguente tabella fi 1 2 4 5 10 xi 30 100 40 20 10 calcolare la media aritmetica (A)52 (B) 2,95 (C) 2,80 (D) 3,05 (E)48 (F) 3 SOLUZIONE La formula della media aritmetica ponderata è: Se ho delle frequenze, con qualsiasi simbolo siano indicate: a)se la loro somma è 1, sono relative; b)se la loro somma è 100%, sono percentuali;
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -121-
c)altrimenti sono assolute (sono indicate con fi? E allora? In fondo, “f” è l’iniziale di frequenza, non è assurdo indicare con fi le frequenze assolute). Nella tabella dell’esercizio, sono state considerate frequenze assolute: 30 100 40 20 10, e modalità 1 2 4 5 10. Risposta esatta: (B) 2,95.
4)p.Un’industria di manufatti rileva l’incremento relativo mensile delle quantità prodotte. Per calcolare l’incremento relativo medio mensile deve utilizzare: (A)La media armonica (B) La media aritmetica (C)La media geometrica 5)p.1La media potenziata rappresenta una media geometrica per: (A) r = 0 (B) r ≠ 0? (C) r → 0 6)p.Nel caso di caratteri espressi su scala ordinale un valore di sintesi si può ottenere con: (A)media geometrica (B) media geometrica (C)media armonica (D) mediana (E)media aritmetica SOLUZIONE La mediana è la media più adatta, quando i dati, pur essendo espressi da numeri naturali, sono in realtà, misure ottenute su una scala ordinale, come accade, ad esempio, el caso di punteggi ottenuti con alcuni test psicologici. Risposta esatta: (D) mediana. 7)p.In un campione di n = 10 unità misurabili su scala ordinale, la mediana: (A)è la semisomma dei ranghi 5 e 6 (B) è il rango numero 5 (C)è la coppia dei punteggi corrispondenti ai ranghi 5 e 6 (D)è il punteggio corrispondente al rango numero 6 SOLUZIONE Se il numero dei valori che si considerano è pari, vi sono due valori centrali e qualunque numero compreso fra di essi può essere scelto come mediana (in pratica si prende la semisomma dei due valori). In questo caso, essendo i dati in numero di 10, vi sono due valori centrali, il 5° e il 6°, (oppure il rango 5 e 6); se n è pari, si può assumere come mediana un numero compreso fra i valori che occupano i posti (n/2)-‐esimo ed [(n+2)/2]-‐esimo, che, di solito, è la loro semisomma. Risposta esatta: (C)è la coppia dei punteggi corrispondenti ai ranghi 5 e 6. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -122-
8)p.2Le frequenze congiunte di due mutabili statistiche sono riportate nella seguente tabella. Determinare il valore dell’indice chi-‐quadrato. L M N A 150 50 0 B 20 160 20 C 90 10 400 (A)370,5 B) 85 C) 816,6 D)790,2 E) 706,16 F) 818,01 DA DEFINIRE IL NUMERO DEL COMPITO )p.In un aula d’esame 185 studenti hanno sostenuto una prova che ha avuto esiti come riportato in tabella:
F M T
SI 110 36 146
NO 30 9 39
T 140 45 185
Se dall’aula esce una persona che ha superato la prova, qual è la probabilità (condizionata) che sia femmina?
(A)0.7534 (B) 0 (C) 0.555 (D)0.9100 9) p.1Se il coefficiente di determinazione
= 0 significa che
(A)
(C)
(B)
14)p.1Gli amministratori di una società hanno deciso di condurre un’indagine per conoscere gli effetti delle spese in pubblicità sulla vendita di un loro prodotto. Per ciascuna delle 10 zone geografiche in cui viene pubblicizzato il prodotto sono stati rilevati l’ammontare speso per pubblicità nelle reti http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -123-
televisive locali (indicato con x e misurato in migliaia di euro) ed il numero di unità di prodotto vendute (indicato con y e misurato in migliaia). I dati raccolti hanno fornito, per le medie, le varianze e la covarianza, i seguenti valori: µx = 4,9; µy = 13,3; 1 5 0 , 9 ; 3 5 2 , 1 ; Determinare il coefficiente di regressione b di Y su X. (A) 12,582 (B) 1,5 (C) 3 (D) 0,33 (E) 0,2 (F) 8,345 15)p.1Con riferimento all’esercizio precedente, calcolare il coefficiente di determinazione
(A) 0,6167 (B) 0,5167 (C)0,7167 (D) 0,8167 (E)0,9167 (F) 0,047 16)p.2Se alla domanda “Siete favorevoli al fumo”, rivolta a 200 studenti scelti n maniera casuale fra la popolazione studentesca catanese, si sono avuti i seguenti risultati: 99 Femmine, di cui 28 hanno risposto SI; 101 maschi, di cui 65 hanno risposto NO, la probabilità di estrarre un’unità che appartenga alla categoria M “e” SI, risulta:
(A) 10,51% (B) 18,00% (C) 67,5% (D) 6,5% (E) 12,16% (F)24,1% SOLUZIONE Sesso Risposta Maschi Femmine Totale SI 36 28 64 NO 65 71 136 Totale 101 99 200
Si considerino gli eventi A:= essere maschio e B:= risposta affermativa http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -124-
Risposta esatta: (B) 18,00%. 17)p.1In un aula d’esame 185 studenti hanno sostenuto una prova che ha avuto esiti come riportato in tabella:
SI’ 80 36 116
F M T
NO 30 12 42
T 110 48 158
Se dall’aula esce una persona che ha superato la prova, qual è la probabilità (condizionata) che sia una femmina?
(A).9188 (B).7534 (C) 0,689 (D).555 (E) 0 13)p.1Gli amministratori di una società hanno deciso di condurre un’indagine per conoscere gli effetti delle spese in pubblicità sulla vendita di un loro prodotto. Per ciascuna delle 10 zone geografiche in cui viene pubblicizzato il prodotto sono stati rilevati l’ammontare speso per pubblicità nelle reti televisive locali (indicato con x e misurato in migliaia di euro) ed il numero di unità di prodotto vendute (indicato con y e misurato in migliaia). I dati raccolti hanno fornito, per le medie, le varianze e la covarianza, i seguenti valori: µx = 4,9; µy = 13,3; 2 5 0 , 9 ; 3 5 2 , 1 ; Determinare il coefficiente di regressione b di Y su X. (A)0,53 (B) 8,345 (C) 3 (D)0,318 (E) 0,2 (F) 1,5 14)p.1Con riferimento all’esercizio precedente, calcolare il coefficiente di determinazione
(A) 0,072 (B) 0,12 (C) 0,9167 (D) 0,7167 (E) 0,6167 (F) 0,5167 15)p.1 Con riferimento all’esercizio precedente, determinare la varianza dei valori di Y spiegata dalla regressione su X http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -125-
(A)42,41 (B) 276,41 (C) 176,3 (D) 6,3 (E)256,3 (F) 25,50 16)p.2Se alla domanda “Siete favorevoli al fumo”, rivolta a 200 studenti scelti in maniera casuale fra la popolazione studentesca catanese, si sono avuti i seguenti risultati: 99 Femmine, di cui 28 hanno risposto SI; 101 maschi, di cui 65 hanno risposto NO; la probabilità di estrarre un’ unità che appartenga alla categoria F “o” SI, risulta: (A) 47,24 % (B) 25,04% (C) 67,5% (D)56,00% (E)12,01% (F) 18,00% 17)p.1In un aula d’esame 185 studenti hanno sostenuto una prova che ha avuto esiti come riportato in tabella:
F M T
SI’ 80 36 116
NO 30 12 42
T 110 48 158
Se dall’aula esce una persona che ha superato la prova, qual è la probabilità (condizionata) che sia una femmina? (A).9188 (B) 0 (C) .7534 (D) 0,689 (E) .555 10)p.In un campione di N soggetti la correlazione tra le variabili X e Y è risultata r = .64. Volendo stimare le Y di 10 nuovi soggetti dei quali si conosce solo il valore X, occorre calcolare: (A)la retta di regressione X = a + b Y? (B) la retta di regressione Y=a+b X? (C) la tabella a doppia entrata X x Y divisi alla mediana (D) la tabella a doppia entrata X x Y divisi alla media 11)p.In una distribuzione normale, la media: (A)è il valore che divide in due parti uguali la distribuzione http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -126-
(B)è sempre uguale a 1 (C) è sempre uguale a 0 (D)è un valore tendenzialmente diverso dalla mediana SOLUZIONE Si osservi che se a partire dalla media si innalza la retta perpendicolare all’asse delle ascisse, questa perpendicolare divide la superficie sottesa alla curva in due parti uguali. Ciò significa che la curva della funzione di densità di probabilità di una popolazione normale è simmetrica rispetto al valore centrale che divide la superficie sottesa in due parti uguali. Risposta esatta: (A)è il valore che divide in due parti uguali la distribuzione. 12)p.In una distribuzione normale, la percentuale di valori che cade entro una deviazione standard (scarto quadratico medio) sopra e sotto la media è: (A)68.26 (B) 34.13 (C) 95.00 (D) 50.00 SOLUZIONE Nell’intervallo (m-‐σ; m+σ) cadono il 68,3% dei casi. Risposta esatta: (A)68.26. 13)p.1 Se ai valori di due variabili viene sommata una costante C, il coefficiente di correlazione r risulta: (A)aumentato della costante C (B) diminuito della costante C (C) uguale al quadrato della costante C (D) uguale al precedente 14)p.1Due variabili non correlate linearmente (r=0) possono essere dipendenti? (A)sempre (B) si, se ordinabili (C) mai (D)si http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -127-
13)p.2Gli amministratori di una società hanno deciso di condurre un’indagine per conoscere gli effetti delle spese in pubblicità sulla vendita di un loro prodotto. Per ciascuna delle 10 zone geografiche in cui viene pubblicizzato il prodotto sono stati rilevati l’ammontare speso per pubblicità nelle reti televisive locali (indicato con x e misurato in migliaia di euro) ed il numero di unità di prodotto vendute (indicato con y e misurato in migliaia). I dati raccolti hanno fornito, per le medie, le varianze e la covarianza, i seguenti
valori: µx = 4,9; µy = 13,3; 1 5 0 , 9 ; 3 5 2 , 1 ; Determinare il coefficiente di regressione b di Y su X. (A) 3 (B) 0,711 (C) 1,5 (D)12,582 (E) 8,345 (F) 0,2 14)p.1Gli amministratori di una società hanno deciso di condurre un’indagine per conoscere gli effetti delle spese in pubblicità sulla vendita di un loro prodotto. Per ciascuna delle 10 zone geografiche in cui viene pubblicizzato il prodotto sono stati rilevati l’ammontare speso per pubblicità nelle reti televisive locali (indicato con x e misurato in migliaia di euro) ed il numero di unità di prodotto vendute (indicato con y e misurato in migliaia). I dati raccolti hanno fornito, per le medie, le varianze e la covarianza, i seguenti
valori: µx = 4,9; µy = 13,3; 1 5 0 , 9 ; 3 5 2 , 1 ; Determinare il coefficiente di regressione b di Y su X. (A) 1,5 (B) 0,86 (C) 8,345 (D) 0,2 (E) 0,711 (F) 3 15)p.1Con riferimento all’esercizio precedente, calcolare il coefficiente di determinazione
(A) 0,318 (B) 0,2167 (C) 0,5167 (D) 0,7167 (E) 0,6167 (F) 0,9167 16)p.2Se alla domanda “Siete favorevoli al fumo”, rivolta a 200 studenti scelti in maniera casuale fra la popolazione studentesca catanese, si sono avuti i seguenti risultati: 99 Femmine, di cui 28 hanno risposto SI; 101 maschi, di cui 65 hanno risposto NO; la probabilità di estrarre un’unità che appartenga alla categoria F “o” SI, risulta: (A) 25,04% (B) 56,00% (C) 47,24 % (D) 12,01% (E) 18,00% (F) 67,5% http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -128-
17)p.2E’ stato misurato il gradimento di un prodotto su un campione di 100 consumatori. Considerando la divisione dei consumatori in <<poco soddisfatti>> (valori inferiori al 25° percentile, n=25), <<mediamente soddisfatti>> (valori compresi tra il 25° e il 75° percentile, n=50) e <<molto soddisfatti>> (valori superiori al 75° percentile, n=25), estraendo a caso tre consumatori con reimmissione, qual è la probabilità che il primo sia <<poco soddisfatto>> e i due seguenti <<mediamente soddisfatti>>? (A) 0,1875 (B) 0,047 (C) 0,0156 (D) 0,0625 SOLUZIONE Se c’è re immissione, si sceglie sempre a caso con le stesse probabilità iniziali, dunque tre estrazioni indipendenti portano al prodotto delle te probabilità: Se invece non ci fosse sta re immissione, sarebbe stato:
Risposta esatta: (D) 0,0625. 11)p.1Nel caso di regressione con dati raggruppati, la condizione dei minimi quadrati si scrive: (A)
minimo
(B)
m i n i m o minimo
(C)
(D)
m i n i m o
S O L U Z I O N E http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -129-
S e s i v u o l e a d a t t a r e u n a c u r v a d i e q u a z i o n e y = f ( x ) a l l e c o p p i e
b i s o g n a t e n e r p r e s e n t e c h e c i a s c u n a d i
q u e s t e è s t a t a o s s e r v a t a
v o l t e e p o r r e l a c o n d i z i o n e d e i
m i n i m i q u a d r a t i n e l l a f o r m a
minimo.
Risposta esatta: (C)
minimo.
12) p.1Se il coefficiente di determinazione
= 0 significa che
(A)
(B)
(C)
13)p.1Il coefficiente di regressione dà: (A) il punto di incontro della retta di regressione con l’asse delle ordinate (B) l’inclinazione della retta di regressione (C)la varianza dei valori stimati (D)la media dei valori stimati 14)p.1Nella regressione lineare semplice se le due rette di regressione di Y a X e X a Y coincidono significa che tra X e Y vi è:
(A) correlazione nulla (B) perfetta correlazione lineare (C) indipendenza 15)p.1Se nella regressione lineare semplice Y = Bo + B1X il coefficiente di determinazione R2= 0,9 vuol dire: (A) il 90% della variabilità di Y non è spiegata dalla retta di regressione (B) il 90% della variabilità di Y è spiegata dalla retta di regressione (C) il 10% della variabilità di Y è spiegata dalla retta di regressione 16)p.1Se l’equazione della retta di regressione in un insieme di dati è: Y=2.65X+11.25, quale sarà il valore di Y per X=33? (A)243.25 (B) 98.7 (C) 77.2 (D) 89.72
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -130-
14)p.1Con riferimento all’esercizio precedente, calcolare il coefficiente di determinazione
(A) 0,8167 (B) 0,9167 (C)0,7167 (D) 0,6167 (E) 0,047 (F) 0,5167 15)p.1 Con riferimento all’esercizio precedente, determinare la varianza dei valori di Y spiegata dalla regressione su X
(A) 256,3 (B) 176,3 (C) 6,3 (D)156,3 (E)276,3 (F)16,56 16)p.2E’ stato misurato il gradimento di un prodotto su un campione di 100 consumatori. Considerando la divisione dei consumatori in <<poco soddisfatti>> (valori inferiori al 25° percentile, n=25), <<mediamente soddisfatti>> (valori compresi tra il 25° e il 75° percentile, n=50) e <<molto soddisfatti>> (valori superiori al 75° percentile, n=25), estraendo a caso tre consumatori con reimmissione, qual è la probabilità che il primo sia <<poco soddisfatto>> e i due seguenti <<mediamente soddisfatti>>? (A) 0,0625 (B) 0,1875 (C) 0,047 (D) 0,0156 17)p.1In un aula d’esame 185 studenti hanno sostenuto una prova che ha avuto esiti come riportato in tabella:
SI’ 80 36 116
F M T
NO 30 12 42
T 110 48 158
Stimare la probabilità che un maschio superi la prova. (A).75 (B).613 (C).715 (D).80 SOLUZIONE Si considerino gli eventi A: superare la prova e B: essere maschio http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -131-
Risposta esatta: (A).75. Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 205 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.1La media potenziata rappresenta una media geometrica per: (A)r → 0 (B) r ≠ 0? (C) r = 0 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -132-
2)p.1I quartili sono: (A)medie analitiche (B) sempre diversi (C)medie lasche o di posizione (D) indici di dispersione (E)sempre positivi (F) indici di variabilità 3)p.3Gli operai di una fabbrica sono raggruppati in 4 classi. Quale valore avrebbe l’indice di mutabilità di Gini (che si può calcolare sottraendo dall’unità la somma dei quadrati delle frequenze relative delle classi), se le classi contenessero tutte lo stesso numero di operai? (A)0,35 (B) 0,55 (C) 0,25 (D) 0,85 (E)0,50 (F) 0,75 4) p.3In una distribuzione di frequenza la media aritmetica è 3 e la media quadratica è 5. Quale valore ha lo scarto quadratico medio? (A)9 (B) 5 (C) 4 (D) 2 (E)16 (F) 8 5)p.1Nella popolazione i punteggi in un test di <<memoria a breve termine>> (X) si distribuiscono normalmente, con media µ = 15 e scarto quadratico medio σ = 3. Il valore X che delimita il 20% dei soggetti peggiori è: (A)10.00 (B) 12.48 (C) 13.41 (D)17.52 6) p.1Mediante l'impiego delle tavole della curva normale standardizzata calcolare il valore di Z0 per il quale la probabilità è uguale a: Pr (0< Z <Z0) = 0,47500. (A)0,06 (B) 4,75% (C) 1,96 Modulo II 7)p.1La condizione dei minimi quadrati consiste nel trovare il minimo di:
(A)
( B )
( C )
8) p.1Nella regressione si applica il concetto di dipendenza: (A)stocastica (B) matematica (C) in media 9)p.1Se il carattere Y dipende in media dal carattere X, il carattere X dipende sempre in media dal carattere Y http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -133-
(A)vero (B) falso 10) p.1Il coefficiente di correlazione lineare semplice si avvicina in valore assoluto ad 1 quanto più è stretta la relazione tra le variabili : (A)sempre (B) se la relazione è lineare (C) se la relazione è non lineare 11)p.3In un gruppo di paesi, il coefficiente di regressione del tasso di mortalità infantile sul reddito pro-‐capite è negativo e la frazione della varianza del suddetto tasso, spiegata dal reddito, è del 36%. Qual è il valore del coefficiente di correlazione lineare tra le due variabili? (A)0,36 B) -‐0,60 C) 0,60 12)p.3La varianza dei redditi medi di quattro categorie di lavoratori è 80.000, mentre la media aritmetica ponderata delle varianze dei redditi delle singole categorie è 420.000. Qual è il valore del rapporto di correlazione? (A)0,40 (B) 0,80 (C) 0,19 (D) 0,23 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 256 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.1Dati i seguenti gruppi di osservazioni, calcolare la varianza totale Gruppo numero di osservaz. A 4 10 2 B 3 8 1 C 6 11 3 (A)3.6 (B) 3 (C) 6 (D) 2.2 2)p.1Se una variabile X si distribuisce normalmente la Pr (-‐ ∞ < X < + ∞) è uguale a (A)1 (B) 0 (C) 0,5 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -134-
3)p.1Quando la scala di misura di una variabile è quella nominale, è possibile, con determinate procedure, trasformarla in una scala di misura almeno ordinale? (A)solo se N >30 (B) solo se le categorie sono più di 2 (C)solo se la deviazione standard è diversa da 0 (D)falso (E) vero 4)p.1Quali dei seguenti indici non rappresenta una misura della variabilità della distribuzione? (A)differenza interquartile (B) varianza (C)scarto quadratico medio (D)la differenza tra la media e la mediana SOLUZIONE Una misura di dispersione riassume la variabilità di una distribuzione (per dati quantitativi). Il campo di variazione (range), R, è la differenza fa l’osservazione più grande e quella più piccola. R=x(n)-‐x(1) Il campo di variazione interquartile: IQR IQR=Q3-‐Q1 Gli indici di variabilità assoluti sono quelli che mantengono la medesima unità di misura dei dati statistici, sono: campo di variazione, scarto semplice medio, varianza e scarto quadratico medio. Gli indici di variabilità relativi sono quelli che, essendo un rapporto tra indici di variabilità assoluti e medie, non mantengono la medesima unità di misura dei dati statistici, bensì risultano numeri puri. Il deficiente di variazione è un indice di variabilità relativo. Risposta esatta: (D)la differenza tra la media e la mediana. 5)p.1Per trasformare uno scarto quadratico medio in una varianza dobbiamo: (A)dividerla per X (B) elevarla al quadrato (C)moltiplicarla per 1/X SOLUZIONE Lo scarto quadratico medio è la media quadratica dei valori assoluti degli scarti Il quadrato dello scarto quadratico medio rappresenta la media aritmetica dei quadrati degli scarti dei valori osservati dalla loro media aritmetica e viene detto varianza. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -135-
Risposta esatta: (B) elevarla al quadrato. Modulo II 6)p.2La tabella seguente riporta i pesi X e Y di 12 padri e dei loro figli primogeniti. Trovare il coefficiente di regressione b di Y su X. X 65 63 67 64 68 62 70 66 68 67 69 71 Y 68 66 68 65 69 66 68 65 71 67 68 70 (A)0,18 (B) 0,88 (C) 0,28 (D) 0,48 (E)0,25 (F) -‐0,58 7)p.1Con riferimento al precedente esercizio, calcolare la varianza spiegata da X. (A)2,6 (B) 0,6 (C) 10,6 (D)-‐6,6 (E) 5,6 (F) 1,6 8)p.2Determinare il valore dell’indice chi-‐quadrato nella seguente tavola di contingenza L M N A 150 50 0 B 20 160 20 C 90 10 400 (A)370.5 B) 818.01 C) 706.16 D)816.6 E) 790.2 F) 85 9)p.2Per un gruppo di famiglie, i coefficienti angolari delle due rette di regressione della spesa per consumi sul reddito e viceversa sono rispettivamente 0,7 e 0,9. Qual è la frazione della varianza della spesa delle famiglie non spiegata dal reddito? http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -136-
(A)37% (B) 25% (C) 17% (D) 22% (E)63% (F) 49% 10)p.1Per un gruppo di 25 imprese si è rilevato la quantità X di pezzi venduti di un dato prodotto. Viene poi formata una graduatoria delle stesse imprese secondo la qualità (Y), dalla migliore, al 1° posto, alla peggiore. Per calcolare la correlazione tra pezzi venduti e qualità del prodotto occorre: (A)trasformare la Y in punteggio continuo e utilizzare il coefficiente r di Pearson (B)non è possibile calcolare la correlazione tra X e Y (C)trasformare la X in variabile ordinale e utilizzare il coefficiente rho di Spearman (D)utilizzare l’indice chi quadrato 11)p.1Due variabili non correlate linearmente (r=0) possono essere dipendenti? (A)sempre (B) si, se ordinabili (C) mai (D)si 12)p.1Se il carattere Y dipende in media dal carattere X, il carattere X dipende sempre in media dal carattere Y (A)vero (B) falso 13)p.1Nella regressione l’intercetta dà (A)il punto di incontro della retta di regressione con l’asse delle ordinate (B)l’inclinazione della retta di regressione (C)la varianza dei valori stimati (D)la media dei punteggi stimati 14)p.1Se i seguenti punti (0, 8) e (8, 16) cadono sulla retta di regressione, l’equazione di tale retta sarà: (A)Y’ = 16X (B) Y’=X+8 (C) Y’=8X + 16 (D)Y’ = 8X SOLUZIONE La retta di regressione si esprime con y=a+bx dove i parametri a e b si calcolano: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -137-
,
Quindi: Risposta esatta:(B)Y’=X+8. Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 00283 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1Sui dati della seguente tabella Anno 1990 1991 1992 1993 1994 1995 1996 Popol. 400 440 450 480 520 600 650 Calcolare il numero indice a base 1990 relativo al 1996 (A)1,3 (B) 1,08 (C) 1,625 (D) 1193? (E)1995 (F) 1,12 2)p.1?Un funzionario addetto alla rilevazione dei dati relativi alla produzione mensile di una data merce riscontra l’esistenza di dati anomali. Per calcolare la produzione media mensile è opportuno utilizzare: (A)La media aritmetica (B) La media armonica (C)La mediana http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -138-
3)p.1La somma algebrica degli scarti relativi dei valori osservati dalla loro media, moltiplicati per i rispettivi pesi, è nulla se la media è: (A)aritmetica (B) armonica (C) geometrica 4)p.1La mutabilità è massima quando: (A)tutte le osservazioni presentano la stessa modalità (B)tutte le modalità hanno eguale frequenza (C)le modalità hanno differenti frequenze SOLUZIONE In generale, pertanto, se un carattere può assumere due o più modalità la mutabilità si considera massima se le frequenze con cui si osservano le diverse modalità sono uguali. Risposta esatta: (B)tutte le modalità hanno eguale frequenza. 5)p.1Il valore massimo Gmax dell’indice di mutabilità del Gini è: (A)log m (B) 1-‐(1/m) (C) 1/m 6)p.1Una misura di dispersione assume il valore massimo quando: (A)le unità assumono soltanto i valori estremi del carattere (B)tutte le unità presentano la stessa modalità (C)le modalità hanno diversa frequenza 7)p.1Una grande impresa ha bisogno di rappresentare la distribuzione per età dei suoi dipendenti. E’ opportuno utilizzare: (A)Un istogramma (B)Una rappresentazione per punti (C)Un ideogramma 8)p.1Un carattere quantitativo discreto deve essere rappresentato mediante: (A)Un istogramma (B) Un diagramma a segmenti http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -139-
(C)Un ideogramma a punti 9)p.1In una rappresentazione areale mediante cerchi i diametri devono essere proporzionali: (A)al quadrato dei dati osservati (B) ai dati osservati (C)alla radice quadrata dei dati osservati SOLUZIONE Quando un fenomeno assume modalità qualitative, si costruisce, di solito, un diagramma areale, formato da una serie di figure geometriche dello stesso tipo, ma con aree proporzionali ai dati osservati (frequenze o intensità del fenomeno). In particolare, si possono impiegare rettangoli, che devono avere uguali basi e altezze proporzionali ai dati osservati (o viceversa), considerato che aree di rettangoli con la stessa base sono proporzionali alle rispettive altezze, oppure cerchi, i cui diametri debbono essere proporzionali alle radici quadrate dei dati osservati, perché è noto che le aree dei cerchi sono proporzionali ai quadrati dei rispettivi raggi, e così via. Risposta esatta: (C)alla radice quadrata dei dati osservati. 10)p.1La distribuzione normale o di Gauss di una variabile X dipende dai parametri: (A)µ;
(B) µ; σ (C) µ;
SOLUZIONE I parametri di una distribuzione (o legge) normale sono la speranza matematica o valor medio μ e la deviazione standard σ. Si tenga presente però che non esiste una sola distribuzione normale. Dato che i valori della media e della deviazione standard possono cambiare, avremo tante distribuzioni normali quante possono essere le coppie di valori μ e σ. Questo potrebbe far pensare che le tavole della legge normale siano voluminose come quelle della legge binomiale e quindi poco agevoli all’uso. Per fortuna, le cose non stanno così: la conoscenza della legge normale per un valore http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -140-
determinato di μ e di σ (e precisamente μ=0 e σ=1) consente di risolvere i problemi relativi a distribuzioni di probabilità corrispondenti a qualsiasi altra coppia di valori dei parametri. Risposta esatta: (B)μ; σ. 11)p.1In una distribuzione binomiale, il primo ed il secondo momento corrispondono rispettivamente a µ1=np; µ2=
(A)Vero (B) Vero se p=q (C) Vero se p<q (D)Falso (E) Vero se p>q 12)p.4La tabella seguente riporta i pesi X e Y di 12 padri e dei loro figli primogeniti. Trovare il coefficiente di regressione b di Y su X. X 65 63 67 64 68 62 70 66 68 67 69 71 Y 68 66 68 65 69 66 68 65 71 67 68 65 (A)0,22 (B) 0,88 (C) 0,68 (D) 0,45 (E)0,18 (F) -‐0,58
13) p.1Il coefficiente di correlazione lineare semplice si avvicina in valore assoluto ad 1 quanto più è stretta la relazione tra le variabili : (A)sempre (B) se la relazione è lineare (C) se la relazione è non lineare 8) p.1Nella regressione si applica il concetto di dipendenza: (A)stocastica (B) matematica (C) in media Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 00262 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -141-
1)p.1Dati i seguenti gruppi di osservazioni, calcolare la varianza totale Gruppo numero di osservaz. A 4 10 2 B 8 9,5 1 C 6 11 3 (A)1,9 (B) 2,3 (C) 6 2)p.1In una distribuzione normale i valori compresi nell’intervallo [µ + σ, µ -‐ σ ] (dove µ = media, σ = scarto quadratico medio) sono: (A)?....inferiore rispetto a quelli compresi nell’intervallo [µ + σ , µ -‐ 4σ] (B)circa lo 0.68% del totale (C)circa il 68% del totale (D)circa il 34% del totale 3)p.1In un’indagine di mercato viene chiesto a 50 consumatori se sono favorevoli o meno al cambiamento di alcune caratteristiche di un dato prodotto. Il parere (favorevole – non favorevole) espresso dai consumatori è un carattere espresso su scala (A)invariante (B) ordinale (C) mobile (D)metrica (E) nominale ordinabile (F) nominale 4)p.1Quali dei seguenti indici non rappresenta una misura della variabilità della distribuzione? (A)la differenza tra la media e la mediana (B)varianza (C)differenza interquartile (D)scarto quadratico medio 5)p.1Lo scostamento quadratico medio (standard deviation) dalla media aritmetica varia tra: (A)0;1 (B) -‐1; +1 (C) 0; un max Modulo II http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -142-
6)p.2La tabella seguente riporta i pesi X e Y di 12 padri e dei loro figli primogeniti. Trovare il coefficiente di regressione b di Y su X. X 65 63 67 64 68 62 70 66 68 67 69 71 Y 68 66 68 65 69 66 68 65 71 67 68 70 (A)0,88 (B) 0,48 (C) -‐0,58 (D) 0,28 (E)0,18 (F) 0,25 7)p.1Con riferimento al precedente esercizio, calcolare la varianza spiegata da X. (A)10,6 (B) -‐6,6 (C) 0,6 (D)1,6 (E) 5,6 (F) 2,6 8)p.2Determinare il valore dell’indice chi-‐quadrato nella seguente tavola di contingenza L M N A 150 50 0 B 20 160 20 C 10 90 300 (A)450? B) 816,6 C) 706,16 D)790,2 E) 85 F) 370,5 9)p.2Per un gruppo di famiglie, i coefficienti angolari delle due rette di regressione della spesa per consumi sul reddito e viceversa sono rispettivamente 0,7 e 0,9. Qual è la frazione della varianza della spesa delle famiglie non spiegata dal reddito? (A)25% (B) 17% (C) 49% (D) 37% (E)22% (F) 63%
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -143-
10)p.1Se il coefficiente di correlazione r di Pearson calcolato tra due variabili è uguale a 0,32, allora la frazione di varianza spiegata è: (A)32% (B) 16% (C) 64% (D) 10% 11) p.1Se il 64% della variabilità di Y è spiegata dalla variabile X, qual è il valore assoluto del coefficiente di correlazione r di Pearson? (A).87 (B) .80 (C) .64 (D).49 12)p.1Il coefficiente di regressione dà: (A)la varianza dei valori stimati (B)l’inclinazione della retta di regressione (C)la media dei valori stimati (D)il punto di incontro della retta di regressione con l’asse delle ordinate 13) p.1Se il coefficiente di determinazione = 0 significa che (A) (B) (C)
SOLUZIONE quando la devianza di regressione è nulla. dove: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -144-
La devianza di Y è data dalla somma di due contibuti dove i due termini a destra sono chiamati, rispettivamente, devianza residua o dell’errore e devianza di regressine. la varianza spiegata o di regressione si annulla perché nulla è Quando la devianza di regressione. Quindi quando Risposta esatta: (C)
:
14)p.1Nella regressione l’intercetta dà (A)il punto di incontro della retta di regressione con l’asse delle ordinate (B)la media dei punteggi stimati (C)l’inclinazione della retta di regressione (D)la varianza dei valori stimati Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 00462 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1La somma dei quadrati degli scarti dei valori osservati dalla media aritmetica è: (A)può essere negativa (B) coincide con il quadrato della devianza (C)coincide con la varianza (D) sempre nulla (E)minima rispetto a qualunque altra origine 2)p.1La somma algebrica degli scarti dei valori osservati dalla loro media, moltiplicati per i rispettivi pesi, è nulla se la media è: (A)geometrica (B) armonica (C) aritmetica 3)p.1Il valore massimo Hmax dell’indice di entropia è: (A)1/log m (B) 1/m (C) log m SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -145-
Se le frequenze delle m modalità sono uguali, ossia (considerato che la loro somma deve essere uguale a 1) la
assume il valore massimo
Risposta esatta: (C) log m. 4)p.1Il valore massimo Gmax dell’indice di mutabilità del Gini è: (A)1-‐(1/m) (B) log m (C) 1/m 5)p.1Per trasformare uno scarto quadratico medio in una varianza dobbiamo: (A)dividerla per X (B) elevarla al quadrato (C)moltiplicarla per 1/X 6)p.1La probabilità di due eventi E1 e E2 indipendenti per il teorema delle probabilità composte è data da: (A)p(E1 e E2) = p(E1)p(E2 / E1) (B) p(E1 e E2) = p(E1)p(E2) (C)p(E1 e E2) = 0 Soluzione La probabilità che n eventi compatibili e indipendenti, , ,…, , si verifichino tutti insieme è uguale al prodotto delle probabilità dei singoli eventi Questa relazione è nota anche come principio delle probabilità composte. Risposta esatta: (B) p(E1 e E2) = p(E1)p(E2). 7)p.3Gli operai di una fabbrica sono raggruppati in 4 classi. Quale valore avrebbe l’indice di mutabilità di Gini (che si può calcolare sottraendo dall’unità la somma dei quadrati delle frequenze relative delle classi), se le classi contenessero tutte lo stesso numero di operai? (A)0,75 (B) 0,85 (C) 0,25 (D) 0,35 (E)0,50 (F) 0,55 Modulo II 8)p.1Il coefficiente di correlazione lineare di Bravais-‐Pearson di due variabili standardizzate Z1 e Z2 è uguale a:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -146-
(A)
(B)
(C)
Soluzione Come si potrebbe definire un indice, che dia le informazioni della covarianza ma non dipenda dalla scelta delle unità di misura di X e Y? Bisogna trasformare le variabili X e Y operando, oltre che una centratura, anche una standardizzazione, considerando quindi variabili con varianza 1.
Indichiamo con e con le variabili standardizzate: Il coefficiente di correlazione è definito come Quindi
e
.
Il segno della correlazione coincide con quello della coarianza. Risposta esatta: (B) 9)p.1Se il coefficiente di correlazione r di Pearson calcolato tra due variabili è uguale a 0,32, allora la frazione di varianza spiegata è: (A)64% (B) 16% (C) 10% (D) 32% 10)p.2La tabella seguente riporta i pesi X e Y di 12 padri e dei loro figli primogeniti. Trovare il coefficiente di regressione b di Y su X. X 65 63 67 64 68 62 70 66 68 67 69 71 Y 68 66 68 65 69 66 65 65 71 67 68 70 (A)0,28 (B) 0,18 (C) -‐0,58 (D) 0,25 (E)0,88 (F) 0,36 11)p.1Se nella regressione lineare semplice Y = Bo + B1X il coefficiente di determinazione R2= 0,9 vuol dire: (A)il 90% della variabilità di Y non è spiegata dalla retta di regressione (B)il 10% della variabilità di Y è spiegata dalla retta di regressione http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -147-
(C)il 90% della variabilità di Y è spiegata dalla retta di regressione Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.La somma algebrica degli scarti dei valori osservati dalla media aritmetica è: (A)coincide con la differenza semplice media (B)sempre nulla (C)coincide con il quadrato della devianza (D)diversa da zero 2)p.1Supponiamo di avere un insieme di 35 valori con media = 100 e σ = 9. Se aggiungiamo 5 valori, tutti uguali a 100, otterremo una media: (A)più bassa (B) non si può dire (C) più alta (D)uguale 3)p.1La somma dei quadrati degli scarti dei valori osservati dalla media aritmetica è: (A)può essere negativa (B) sempre nulla (C)minima rispetto a qualunque altra origine (D)coincide con il quadrato della devianza (E)coincide con la varianza 4)p. La tabella seguente mostra il numero di addetti di un gruppo di aziende
A B C D E F G 71 20 250 25 19 100 25 Calcolare il rapporto di concentrazione. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -148-
(A)0,75 (B) 0,89 (C) 0,39 (D) 0,93 (E)0,25 (F) 0,59 5)p.1In una distribuzione binomiale, il primo ed il secondo momento corrispondono rispettivamente a µ1=np; µ2=
(A)Vero (B) Vero se p<q (C) Vero se p=q (D)Falso (E) Vero se p>q Modulo II 6)p.1Il coefficiente di regressione dà: (A)l’inclinazione della retta di regressione (B)il punto di incontro della retta di regressione con l’asse delle ordinate (C)la varianza dei valori stimati (D)la media dei valori stimati 7)p.1Se il carattere Y dipende in media dal carattere X, il carattere X dipende sempre in media dal carattere Y (A)vero (B) falso 8)p.1Se nella regressione lineare semplice Y = Bo + B1X il coefficiente di determinazione R2= 0,9 vuol dire: (A) il 90% della variabilità di Y non è spiegata dalla retta di regressione (B) il 10% della variabilità di Y è spiegata dalla retta di regressione (C)il 90% della variabilità di Y è spiegata dalla retta di regressione Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 237 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.2La tabella seguente mostra il numero di addetti di un gruppo di aziende Addetti per azienda
Aziende
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -149-
1-‐20 21-‐40 41-‐100 101-‐150
18 10 14 20
Calcolare il rapporto di concentrazione con il metodo dei trapezi. (A)0,40 (B) 0,79 (C) 0,53 (D) 0,55 (E)0,67 (F) 0,92 2)p.2Con riferimento al quesito precedente, determinare il rapporto tra la differenza semplice media ed il suo valore massimo. (A)0,59 (B) 0,89 (C) 0,79 (D) 0,55 (E)0,41 (F) 0,45 3)p.2Data la seguente distribuzione che rappresenta le frequenze percentuali di un controllo di durata effettuato su 600 lampadine, calcolare la durata media delle lampade ore funzionamento % 0 ¬ 300 1 300 ¬ 600 2 600 ¬ 900 20 900 ¬ 1.200 53 1.200 ¬ 1.500 21 1.500 ¬ 1.800 3 (A)1070 (B) 1250 (C) 1000 (D) 1050 (E)1090 (F) 1080 4)p.1Gli investimenti fissi lordi (in migliaia di miliardi di lire) nel settore industriale in Italia nel periodo 1970-‐1974 sono stati i seguenti: Anno 1970 1971 1972 1973 1974 Investimenti 3.9 3.9 3.8 4.3 4.5
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -150-
Il valore “3.8” nella tabella è (A)una modalità (B) una frequenza (C)una unità statistica 5)p.1Con riferimento al quesito precedente, ciascun anno è (A)una frequenza (B) una modalità (C) una unità statistica 6)p.1Con riferimento al quesito precedente, qual è la moda della distribuzione? (A)1974 (B) 4,5 (C) 3,9 SOLUZIONE Un altro indice di uso corrente è la moda, definita, con riferimento soltanto ad una distribuzione di frequenza, come il valore a cui corrisponde la massima frequenza. Investimenti 3.9 2 3.8 1 4.3 1 4.5 1 Totale 2 La moda della distribuzione è 3,9 perché a questa modalità è associata la frequenza più alta (2). Risposta esatta: (C)3,9. 7)p.3Qual è la mediana della distribuzione? (A)1971 (B) 3,9 (C) 3,8 SOLUZIONE I dati devono essere preventivamente ordinati nella serie: 3.8 3.9 3.9 4.3 4.5 Essendo N=5, il posto centrale è pari a: (N+1)/2=(5+1)/2=3, dunque la terza unità è quella che bipartisce la distribuzione, in quanto vi sono 2 casi alla sua sinistra e 2 alla sua destra. Pertanto la mediana è data dalla terza unità della successione, e si ha: Me=3.9. Risposta esatta: (B) 3,9. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -151-
Modulo II 8)p.2Le frequenze congiunte di due mutabili statistiche sono riportate nella seguente tabella. Determinare il valore dell’indice chi-‐quadrato. L M N A 150 50 0 B 20 160 20 C 10 90 300 (A)706,16 B) 816,6 C) 790,2 D)370,5 E) 450 F) 85 9)p.2E’ stato misurato il gradimento di un prodotto su un campione di 100 consumatori. Considerando la divisione dei consumatori in <<poco soddisfatti>> (punteggi inferiori al 25° percentile, n=25), <<mediamente soddisfatti>> (punteggi compresi tra il 25° e il 75° percentile, n=50) e <<molto soddisfatti>> (punteggi superiori al 75° percentile, n=25), estraendo a caso tre consumatori con reimmissione, qual è la probabilità che uno sia <<poco soddisfatto>> e gli altri due <<molto soddisfatti>>? (A).0047 (B) .0625 (C) .1875 (D) .00156 10)p.1Se l’equazione della retta di regressione in un insieme di dati è: Y=2.65X+11.25, quale sarà il valore di Y per X=33? (A)243.25 (B) 77.2 (C) 98.7 (D) 89.72 La risposta corretta è la (C). Si sostituisce al posto di X il valore 33 e si calcola così il valore di Y’ corrispondente. Risposta esatta: (4) 98.7. 11) p.1Se il coefficiente di determinazione (A)
(B)
= 0 significa che (C)
12)p.1Se una variabile X si distribuisce normalmente la Pr (-‐ ∞ < X < + ∞) è uguale a http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -152-
(A)0 (B) 0,5 (C) 1 13) p.1Mediante l'impiego delle tavole della curva normale standardizzata calcolare il valore di z0 per il quale si ha: Pr (0< z <z0) = 0,47500. (A)1,96 (B) 0,06 (C) 4,75% 14)p.1?Se il coefficiente di correlazione r di Pearson calcolato tra due variabili è uguale a 0,32, allora: (A)la correlazione tra le due variabili è sicuramente significativa (B)le due variabili sono negativamente correlate (C)le due variabili condividono circa il 10% di varianza (D)le due variabili condividono il 32% di varianza 15)p.Si chiede a tre esperti (A, B e C) di stabilire, ciascuno per suo conto, una graduatoria dei 15 partecipanti alla finale di un concorso di cucina, dopo aver assaggiato le pietanze preparate dai finalisti. Per spere quale coppia di esperti concorda maggiormente nel giudizio dato si calcolano e si confrontano: (A)i tre coefficienti di correlazione r di Pearson (B)i tre coefficienti di correlazione rho di Spearman (C)i sei coefficienti di correlazione rho di Spearman (D)i due coefficienti di correlazione r di Pearson Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01309 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.1Il momento di origine due e di grado zero, µ2,0 , è: (A)La media aritmetica (B) media quadratica (C) 1 (D)Il quadrato della media quadratica 2)p.1Nel caso di dati raggruppati, la varianza totale si ottiene: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -153-
(A)sommando alla media ponderata delle varianze dei gruppi, la varianza ponderata calcolata sulle medie dei singoli gruppi (B)calcolando la media aritmetica ponderata delle varianze dei singoli gruppi (C)sommando le varianze dei singoli gruppi 3)p.1Le scale per rapporti sono le scale che hanno uno zero assoluto naturale. (A)non esiste uno zero assoluto (B) vero (C) falso (D)dipende dalla natura del carattere 4)p.3In un prontuario della curva normale ridotta (standard) si legge che il 75° centile è 0,6745. Quali valori hanno il primo ed il terzo quartile per una distribuzione normale con media 46,5 e varianza 400? (A)25; 75 (B) 55;80 (C)33; 60 (D)20;85 (E)40; 80 (F) 0.25; 0.75 SOLUZIONE Frattili di una distribuzione Una distribuzione può essere descritta per mezzo dei suoi frattili. Si dice frattile (sinonimo: centile, percentile e quantile) p-‐esimo di una distribuzione quel valore xp tale che la frequenza relativa cumulata F(xp )=p. Ad esempio, il 50° centile di una distribuzione è il valore che, sull’asse dei numeri reali, ha alla sua sinistra il 50% dei valori della distribuzione, e coincide con la mediana. Il 10° centile è il valore che ha alla sinistra il 10% della distribuzione. L’intervallo interquartile Un indice di dispersione di uso comune è l’intervallo interquartile, dato dalla differenza tra 3° quartile e 1° quartile (cioè tra 75° e 25° centile): tale intervallo contiene la metà dei valori inclusi nel campione, indipendentemente dalla forma della distribuzione della variabile. Tavola z 0,08 … 0,6 0,2517 Oppure:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -154-
Risposta esatta: (C)33; 60. 5)p.1Date le due distribuzioni X e Y sotto riportate, determinare i parametri della retta di regressione a e b X 46 52 61 34 61 Y 37 62 64 47 38 (A)a= 23,79; b=2,44 (B) a=21; b= 4,31 (C)a=35,03; b=0,28 (D) a=0,81; b=13,57 (E) a= 40; b=-‐ 0,56 (F) a= 23,79; b= 0,44 6)p.110 studenti riportano i seguenti voti nell’esame di statistica: a b c d e f g h i l 28 30 18 29 28 22 25 19 23 29 Qual è l’ordine di rango dello studente f? (A)6 (B) 7 (C) 8 (D) 8.5 7)p.2Dati i seguenti gruppi, indicare la varianza totale Gruppo N _ x A 4 10 2 B 3 9,5 1 C 6 11 3
(A)2,6 (B) 2,2 (C) 3 (D) 6 8)p.3Se in un minuto arrivano circa tre autovetture ai caselli autostradali di Catania, qual è la probabilità che arrivino più di due autovetture? (A)0,23 (B) 0,76 (C) 0,85 (D)0,59 (E) 0,80 (F) 0,67 9)p.1La distribuzione dei redditi degli impiegati di un’azienda ha media m e scarto quadratico medio s. Se gli stipendi venissero aumentati del 20%, quale valore avrebbe lo scarto quadratico medio? (A)s (B)1,2s (C) 1,44s (D) 1,44 s2 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -155-
Numero del compito: 199 10) p.1Nella regressione si applica il concetto di dipendenza: (A)stocastica (B) matematica (C) in media 11)p.3La varianza dei redditi medi di quattro categorie di lavoratori è 80.000, mentre la media aritmetica ponderata delle varianze dei redditi delle singole categorie è 420.000. Qual è il valore del rapporto di correlazione? (A) 0,19 (B) 0,23 (C) 0,80 (D) 0,40 12)p.3Per un gruppo di famiglie, i coefficienti angolari delle due rette di regressione della spesa per consumi sul reddito e viceversa sono rispettivamente 0,7 e 0,9. Qual è la frazione della varianza della spesa delle famiglie non spiegata dal reddito? (A) 22% (B) 25% (C) 17% (D) 63% (E) 37% (F) 49% Numero del compito: 269
10)p.1Gli amministratori di una società hanno deciso di condurre un’indagine per conoscere gli effetti delle spese in pubblicità sulla vendita di un loro prodotto. Per ciascuna delle 10 zone geografiche in cui viene pubblicizzato il prodotto sono stati rilevati l’ammontare speso per pubblicità nelle reti televisive locali (indicato con x e misurato in migliaia di euro) ed il numero di unità di prodotto vendute (indicato con y e misurato in migliaia). I dati raccolti hanno fornito, per le medie, le varianze e la covarianza, i seguenti valori: µx = 4,9; µy = 13,3; =1 5 0 , 9 ; = 3 5 2 , 1 ; . Determinare il coefficiente di regressione b di Y su X. (A) 0,2 (B) 8,345 (C) 0.711 (D) 3 (E) 12,582 (F) 1,5 11)p.1Con riferimento all’esercizio precedente, calcolare il coefficiente di determinazione
(A) 0,7167 (B) 0,9167 (C)0,8167 (D) 0,5167 (E) 0,6167 (F)0,2167
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -156-
12)p.1 Con riferimento all’esercizio precedente, determinare la varianza dei valori di Y spiegata dalla regressione su X
(A) 176,3 (B) 6,3 (C) 256,3 (D) 156,3 (E) 76,3? (F) 276,3 13)p.2La varianza dei redditi medi di quattro categorie di lavoratori è 80.000, mentre la media aritmetica ponderata delle varianze dei redditi delle singole categorie è 420.000. Qual è il valore del rapporto di correlazione? (A) 0,19 (B) 0,80 (C) 0,23 (D) 0,40 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01308 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ Modulo I 1)p.1Il momento di origine due e di grado zero, µ2,0 , è: (A) media quadratica (B) Il quadrato della media quadratica (C) 1 (D) La media aritmetica 2)p.1Nel caso di dati raggruppati, la varianza totale si ottiene: (A) calcolando la media aritmetica ponderata delle varianze dei singoli gruppi (B) sommando alla media ponderata delle varianze dei gruppi, la varianza ponderata calcolata sulle medie dei singoli gruppi (C) sommando le varianze dei singoli gruppi 3)p.3In un giuoco del tipo “gratta e vinci” il 60 % delle schede non è vincente. Acquistando 8 schede, quale è la probabilità che almeno due siano vincenti? (A)0,89 (B) 0,04 (C) 0,78 (D) 0,84
4)p.110 studenti riportano i seguenti voti nell’esame di statistica: a b c d e f g h i l 28 30 18 29 28 22 25 19 23 29 Qual è l’ordine di rango dello studente f? (A) 6 (B) 7 (C) 8.5 (D) 8 5)p.2Dati i seguenti gruppi, indicare la varianza totale http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -157-
Gruppo
N
A B C
4 3 6
_ x 10 9,5 11
2 1 3
(A) 3 (B) 2,2 (C) 2,6 (D) 6
6)p.1Date le due distribuzioni X e Y sotto riportate, determinare i parametri della retta di regressione a e b X 46 52 61 34 61 Y 37 62 64 47 38 (A) a= 40; b=-‐ 0,56 (B) a=0,81; b=13,57 (C) a=35,03; b=0,28 (D) a=21; b= 4,31 (E) a= 23,79; b=2,44 (F) a= 23,79; b= 0,44 7)p.1Le scale per rapporti sono le scale che hanno uno zero assoluto naturale. (A) falso (B) vero (C) dipende dalla natura del carattere (D) non esiste uno zero assoluto
8)p.3Se in un minuto arrivano circa tre autovetture ai caselli autostradali di Catania, qual è la probabilità che arrivino più di due autovetture? (A) 0,76 (B) 0,23 (C) 0,85 (D) 0,67 (E) 0,80 (F) 0,59 9)p.1La distribuzione dei redditi degli impiegati di un’azienda ha media m e scarto quadratico medio s. Se gli stipendi venissero aumentati del 20%, quale valore avrebbe lo scarto quadratico medio? (A) 1,44s (B) s (C) 1,2s (D) 1,44s2 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -158-
Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1) p.1Se il 64% della variabilità di Y è spiegata dalla variabile X, qual è il valore assoluto del coefficiente di correlazione r di Pearson? (A).87 (B) .49 (C) .80 (D) .64 2)p.1Per misurare la correlazione esistente tra un carattere quantitativo e un carattere qualitativo si impiega: (A) il rapporto di correlazione (B) il coefficiente di correlazione lineare di Bravais-‐Pearson (C) l’indice chi-‐quadrato 3)p.3In una distribuzione di frequenza la media aritmetica è 3 e la media quadratica è 5. Quale valore ha lo scarto quadratico medio? (A) 4 (B) 16 (C) 2 (D) 8 (E) 5 (F) 9 4)p.1Quando n→∞ e q p la binomiale tende alla: (A)curva normale (B)binomiale negativa (C)distribuzione di Poisson 5)p.1Le differenze medie si fondano sulle differenze fra: (A) ogni termine della distribuzione e tutti gli altri (B) ogni termine della distribuzione ed una media (C) ogni termine della distribuzione e la media aritmetica 6)p.1La mutabilità è massima quando: (A) tutte le modalità hanno eguale frequenza (B) tutte le osservazioni presentano la stessa modalità (C)le modalità hanno differenti frequenze 7)p.1Un’impresa preleva periodicamente un campione di pezzi prodotti da un dato macchinario per rilevare il numero di pezzi difettosi. Il carattere pezzi difettosi è: (A) quantitativo discreto (B) quantitativo continuo http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -159-
(C) qualitativo nominale 8)p.1Se una variabile X si distribuisce normalmente la Pr (-‐ ∞ < X < + ∞) è uguale a (A) 0,5 (B) 0 (C) 1 9)p.1L’indice di curtosi è un indice di forma di una distribuzione che serve a verificare: (A)la normalità di una distribuzione qualsiasi (B)la normalità di una distribuzione simmetrica e unimodale (C)l’asimmetria 10)p.212imprese presentano i seguenti valori relativamente alle variabili X ed Y. 1 e 7; 2 e 8; 3 e 9; 3 e 5; 4 e 6; 5 e 7; 5 e 3; 6 e 4; 7 e 5; 7 e 1; 8 e 2; 9 e 9. Quanto vale il coefficiente di correlazione? A) 0 B) .418 C)1 D)-‐.76
11)p.1Gli amministratori di una società hanno deciso di condurre un’indagine per conoscere gli effetti delle spese in pubblicità sulla vendita di un loro prodotto. Per ciascuna delle 10 zone geografiche in cui viene pubblicizzato il prodotto sono stati rilevati l’ammontare speso per pubblicità nelle reti televisive locali (indicato con x e misurato in migliaia di euro) ed il numero di unità di prodotto vendute (indicato con y e misurato in migliaia). I dati raccolti hanno fornito, per le medie, le varianze e la covarianza, i seguenti valori: µx = 4,9; µy = 13,3; =1 5 0 , 9 ; = 3 5 2 , 1 ; . Determinare il coefficiente di regressione b di Y su X. (A)0,53 (B) 3 (C) 8,345 (D) 1,5 (E) 0,2 (F) 12,582 12)p.1Con riferimento all’esercizio precedente, calcolare il coefficiente di determinazione
(A) 0,8167 (B) 0,9167 (C) 0,6167 (D) 0,7167 (E)0,12 (F) 0,5167 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 779
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -160-
Cognome e Nome:_____________ ___________________ Matric.:_____________ Corso di laurea: __ __ Docente:Prof.__ __
1)Quando la scala di misura di una variabile è quella nominale, è possibile, con determinate procedure, trasformarla in una scala di misura almeno ordinale? 1 2 3 4 5 (1) vero (2) solo se le categorie sono più di 2 (3) falso (4) solo se N >30 SOLUZIONE Procedure tecniche non riescono a trasformare una categorizzazione in dati ordinali. (Attenzione, in combinazione con altre variabili e con molti assunti addizionali si possono costruire punteggi per categorie nelle procedure di analisi di corrispondenza multipla (ANACOR) o con analisi di omogeneità (HOMALS, homogeneity analysis with alternating least squares) ma i punteggi ottenuti dipendono comunque dalle variabili incluse in queste analisi e dagli assunti fatti. Alcune volte tali procedure sono ragionevoli, altre volte sono decisamente fuorvianti). Risposta esatta: (3) falso. 2)Se, in un insieme di 200 punteggi con deviazione standard 12, sottraiamo 5 a ciascun valore, il nuovo valore della deviazione standard sarà: 1 2 3 4 5 (1)12 (2)12/5 (3) (4)12-‐5 SOLUZIONE 5 atlete sono state pesate all’inizio dell’allenamento per le olimpiadi: Si sono osservati i seguenti valori (in kg): 55, 59, 63, 66, 67 Il peso medio delle atlete è pari a 62 kg. Se, dopo un mese di allenamenti, ogni atleta ha perso 5 kg, quale sarà il peso medio delle atlete? 50, 54, 58, 61, 62
Il peso medio è di 57 kg. Pesi delle atlete dopo un mese: 55, 59, 63, 66, 67 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -161-
Se, all’inizio dell’allenamento, lo scarto quadratico medio era pari a 4,47; quanto varrà dopo una settimana? Pesi delle atlete dopo una settimana: 50, 54, 58, 61, 62
sarà ancora pari a 4,47.
Se si aggiunge o sottrae dai dati una costante: -‐la media risulterà aumentata o diminuita del valore della costante -‐lo scarto quadratico medio rimane invariato. Risposta esatta: (1)12. 3)Quali dei seguenti indici non rappresenta una misura della dispersione della distribuzione? 1 2 3 4 5 (1)la differenza tra la media e la mediana (2)differenza interquartilica (3) varianza (4) deviazione standard Soluzione Le misure di dispersione o di variabilità possono essere: il campo di variazione, la differenza interquartile, la deviazione media, la varianza e lo scarto quadratico medio (detto più comunemente deviazione standard). La differenza tra media e mediana fornisce una misura assoluta della simmetria che però non consente di effettuare comparazioni tra fenomeni differenti. Risposta esatta: (1)la differenza tra la media e la mediana. 4)Dati i seguenti gruppi, indicare la varianza totale 1 2 3 4 5 Gruppo
N
A B C
4 3 6
_ x 10 9,5 11
2 1 3
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -162-
(1) 2,6 (2) 6 (3) 3 (4) 2,2
5)Nell’ambito di un settore produttivo un gruppo di soggetti in <<mobilità>> devono essere riutilizzati in settori diversi di attività purché di loro gradimento. Vengono sottoposti a prove di abilità manuale, di memoria, di abilità di lettura e di attitudine al calcolo matematico, per ricavarne una valutazione media. Il Signor Rossi nelle quattro prove elencate ha ottenuto rispettivamente i punteggi: 14, 30, 23, 18; egli desidera essere applicato in un settore in cui vengano richieste in maniera prevalente memoria e attitudine al calcolo con pesi valutati da esperti in misura di 1.2 e 1.5 rispetto a quelli unitari delle altre due prove. Quale risulta la sua valutazione media? 1 2 3 4 5 (1)24 (2)25 (3)100 (4)21.28 SOLUZIONE Tipo di prova
Abilità manuale
Memoria
Abilità di lettura
Attitudine Totale al calcolo
Punteggi
14
30
23
18
1
1,2
1
1,5
4,7
Si ha:
Risposta esatta: (4)21.28. 6)Per un gruppo di 25 imprese si è rilevato la quantità X di pezzi venduti di un dato prodotto. Viene poi formata una graduatoria delle stesse imprese http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -163-
secondo la percezione di qualità espressa dai consumatori (Y), dalla migliore, al 1° posto, alla peggiore. Per calcolare la correlazione tra pezzi venduti e qualità del prodotto occorre: 1 2 3 4 5 (1) trasformare la X in variabile ordinale e utilizzare il coefficiente rho di Spearman (2) utilizzare l’indice
(3) trasformare la Y in punteggio continuo e utilizzare il coefficiente r di Pearson (4) non è possibile calcolare la correlazione tra X e Y 7)Se la relazione tra due variabili X e Y è tale che a un incremento di X corrisponde sempre un incremento di Y, il coefficiente di correlazione tra le due variabili sarà: 1 2 3 4 5 (1)positivo solo se si utilizza rho di Spearman (2)positivo solo se si utilizza r di Pearson (3)non si può dire (4)sicuramente positivo 8)Se il coefficiente di correlazione di Pearson calcolato tra due variabili è uguale a .32, allora: 1 2 3 4 5 (1) le due variabili sono negativamente correlate (2) le due variabili condividono circa il 10% di varianza (3) la correlazione tra le due variabili è sicuramente significativa (4)le due variabili condividono il 32% di varianza 10)Si chiede a tre esperti (A, B e C) di stabilire, ciascuno per suo conto, una graduatoria dei 15 partecipanti alla finale di un concorso di cucina, dopo aver assaggiato le pietanze preparate dai finalisti. Per spere quale coppia di
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -164-
esperti concorda maggiormente nel giudizio dato si calcolano e si confrontano: 1 2 3 4 5 (1) i due coefficienti di correlazione r di Pearson (2) i sei coefficienti di correlazione rho di Spearman (3) i tre coefficienti di correlazione rho di Spearman (4) i tre coefficienti di correlazione r di Pearson 11)Se una nuvola di punti assume andamento circolare le rette di regressione: 1 2 3 4 5 (1)non esistono (2)sono perpendicolari (3)coincidono (4)sono parallele SOLUZIONE Se si intendono le rette di regressione di Y da X e di X da Y, il fatto che la nuvola di punti sia circolare significa che la relazione tra le due variabili non può essere bene approssimata con una retta, quindi che presumibilmente ci sarà poca dipendenza lineare, se non nulla, tra le due variabili. Quando non c'è indipendenza lineare le rette sono parallele ad uno degli assi (es. se faccio la regressione di Y da X e metto Y sull'asse delle ordinate, allora la retta sarà parallela all'asse delle ascisse). Risposta esatta: (4)sono parallele. 12)Nel caso di regressione con dati raggruppati, la condizione dei minimi quadrati si scrive: 1 2 3 4 5 (1)
minimo
(2)
m i n i m o
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -165-
(3)
minimo
(4)
m i n i m o
13)Nella regressione lineare l’intercetta corrisponde: 1 2 3 4 5 (A) alla varianza dei punteggi stimati (B) al punto di incontro della retta di regressione con l’asse delle ordinate (C)all’inclinazione della retta di regressione (D)alla media dei punteggi stimati
1 4 ) N e l l a r e g r e s s i o n e l i n e a r e i l c o e f f i c i e n t e b c o r r i s p o n d e : 1 2 3 4 5 ( 1 ) a l p u n t o d i i n c o n t r o d e l l a r e t t a d i r e g r e s s i o n e c o n l ’ a s s e d e l l e o r d i n a t e ( 2 ) a l l a v a r i a n z a d e i v a l o r i s t i m a t i ( 3 ) a l l ’ i n c l i n a z i o n e d e l l a r e t t a d i r e g r e s s i o n e ( 4 ) a l l a m e d i a d e i p u n t e g g i s t i m a t i 15)Se l’equazione della retta di regressione in un insieme di dati è: Y’=2.65X+11.25, quale sarà il valore di Y’ per X=33? 1 2 3 4 5 (1) 77.2 (2) 243.25 (3) 89.72 (4) 98.7 SOLUZIONE La risposta corretta è la 4. Si sostituisce al posto di X il valore 33 e si calcola così il valore di Y’ corrispondente. Risposta esatta: (4) 98.7. 16)10 studenti riportano i seguenti voti nell’esame di statistica: 1 2 3 4 5 a b c d e f g h i l 28 30 18 19 28 22 25 19 23 29 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -166-
Qual è l’ordine di rango dello studente f? (1) 6 (2)5 (3) 7 (4) 8.5 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 00362 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1In un istogramma, sono proporzionali alle frequenze della distribuzione: (A)le altezze dei rettangoli (B)le basi dei rettangoli (C)le aree dei rettangoli SOLUZIONE Una distribuzione per classi si rappresenta graficamente in base ad un principio differente, mediante una figura, detta istogramma, formata da un insieme di rettangoli affiancati, che hanno aree proporzionali alle frequenze e basi di lunghezza proporzionale alle ampiezze delle classi. Risposta esatta: (C)le aree dei rettangoli. 2)p.1In una prova di abilità manuale un gruppo di n=20 ragazzi, distinti con lettere da A a T, ottengono i seguenti risultati ( o = ottimo, d = distinto, b = buono, s = sufficiente, i = insufficiente): A B C D E F G H I J K L M N O P Q R S T d s o i o s d o i i s d s o i b i o d s Qual è la percentuale cumulata dei migliori fino alla classe s compresa? (A)60% (B) 75% (C) 90% (D)5% http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -167-
SOLUZIONE Voti o
5
d
4
b
1
s
5
i
5
25
20
100
Controprova:s=B, F, K, M T b=P d=A, G, L, S o=C, E, H, N, R Totale:15 studenti. 15/20=0,75*100=75% Risposta esatta: (B) 75%. 3)p.1In un magazzino all’inizio del 2004 vi sono 20 q. di merce; se nell’arco dello stesso anno sono entrati/e ed usciti/e, rispettivamente, 247 q. e 245 q., il rapporto di durata in mesi sarà? (A) 1.041 m. (B) 1.25 m (C) 1.024 m. (D) 0,976 m. 4)p.1Il rapporto di concentrazione ha significato quando il fenomeno è: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -168-
(A)quantitativo trasferibile (B)qualitativo (C)quantitativo 5)p.2Se la popolazione di un paese nei censimenti del 1951 e del 2001 era, rispettivamente, di 27 e 31,5 milioni, il saggio di incremento relativo annuo, secondo una legge di una progressione geometrica, sarà: A) 0,001257 B) 90.000 C) 2,5 D )85.000 E) 70.000 F)0,003087771 6)p.1La somma algebrica degli scarti dei valori osservati dalla loro media, moltiplicati per i rispettivi pesi, è nulla se la media è: (A)aritmetica (B) armonica (C) geometrica
7)p.1Se, lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero dispari; B = uscita del 5. la probabilità esatta dell’evento <<A e B>> sarà: A) P (A e B) = 2/8 B) P(AeB)=0 C) P(AeB)=1/12 D)P(AeB)=1/6 8)p.1Se in una serie di n prove indipendenti ripetute N volte, la probabilità dell’evento E si mantiene costante in ogni prova di qualunque serie, la distribuzione dei valori appartiene allo schema di: (A)Lexis (B)Poisson (C)Spearman (D)Cauchy (E)Bernoulli (F)Kendall Modulo II 9)p.1La condizione dei minimi quadrati consiste nel trovare il minimo di:
(A)
(B)
(C)
10)p.1Nella regressione lineare semplice se le due rette di regressione di Y a X e X a Y coincidono significa che tra X e Y vi è:
(A) correlazione nulla (B) perfetta correlazione lineare (C) indipendenza 11)p.1Se il coefficiente di correlazione r di Pearson calcolato tra due variabili è uguale a 0,32, allora la frazione di varianza spiegata è: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -169-
(A)32% (B) 16% (C) 64% (D) 10% 12)p.1Per misurare la correlazione esistente tra un carattere quantitativo e un carattere qualitativo si impiega: (A) il coefficiente di correlazione lineare di Bravais-‐Pearson (B) il rapporto di correlazione (C) l’indice chi-‐quadrato Numero del compito:197 11)p.3In un gruppo di paesi, il coefficiente di regressione del tasso di mortalità infantile sul reddito pro-‐capite è negativo e la frazione della varianza del suddetto tasso, spiegata dal reddito, è del 36 %. Qual è il valore del coefficiente di correlazione lineare tra le due variabili? (A)60 B) 0,36 C) -‐0,60 12)p.3La varianza dei redditi medi di quattro categorie di lavoratori è 80.000, mentre la media aritmetica ponderata delle varianze dei redditi delle singole categorie è 420.000. Qual è il valore del rapporto di correlazione? (A) 0,40 (B) 0,19 (C) 0,23 (D) 0,80 Numero del compito:233 In un aula d’esame 185 studenti hanno sostenuto una prova che ha avuto esiti come riportato in tabella:
F M T
SI’ 110 36 146
NO 30 9 39
T 140 45 185
Se dall’aula esce una persona che ha superato la prova, qual è la probabilità (condizionata) che sia una femmina? (A) .7534. (B) 0 (C) .555 (D) .9100 Se il coefficiente di determinazione = 0 significa che http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -170-
(A)
(B)
(C)
In un campione di N soggetti la correlazione tra le variabili X e Y è risultata r = .64. Volendo stimare le Y di 10 nuovi soggetti dei quali si conosce solo il valore X, occorre calcolare: (A)la retta di regressione X’ = a + b Y (B) la retta di regressione Y’=a+b X
(C) la tabella a doppia entrata X x Y divisi alla mediana (D) la tabella a doppia entrata X x Y divisi alla media In una distribuzione normale, la media: (A)è il valore che divide in due parti uguali la distribuzione (B)è sempre uguale a 1 (C) è sempre uguale a 0 (D)è un valore tendenzialmente diverso dalla mediana In una distribuzione normale, la percentuale di valori che cade entro una deviazione standard (scarto quadratico medio) sopra e sotto la media è: (A)68.26 (B) 34.13 (C) 95.00 (D) 50.00 Se ai valori di due variabili viene sommata una costante C, il coefficiente di correlazione r risulta: (A)aumentato della costante C (B) diminuito della costante C (C) uguale al quadrato della costante C (D) uguale al precedente Due variabili non correlate linearmente (r=0) possono essere dipendenti? (A)sempre (B) si, se ordinabili (C) mai (D)si Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 00448 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -171-
Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1La somma algebrica degli scarti relativi dei valori osservati dalla loro media, moltiplicati per i rispettivi pesi, è nulla se la media è: (A) armonica (B) aritmetica (C) geometrica 2)p.1La media aritmetica si può ottenere sommando alla media aritmetica degli scarti dei valori osservati da un’origine arbitraria m l’origine stessa m. (A)mai (B)solo se l’origine m coincide con il valore centrale della classe modale (C)solo se l’origine m coincide con la mediana (D)sempre 3)p.1La mutabilità è massima quando: (A) tutte le modalità hanno eguale frequenza (B) tutte le osservazioni presentano la stessa modalità (C)le modalità hanno differenti frequenze 4)p.1Se, in un insieme di 200 valori con scarto quadratico medio 18, sottraiamo 5 a ciascun valore, il nuovo valore dello scarto quadratico medio sarà: (A) (B)18-‐5 (C)18 (D)18/5 5)p.1Lo scostamento quadratico medio (standard deviation) dalla media aritmetica varia tra: (A)0; 1 (B) -‐1; +1 (C) 0; un max 6)p.1La probabilità di due eventi E1 e E2 indipendenti per il teorema delle probabilità composte è data da: (A) p(E1 e E2,) = p(E1)p(E2) (B) p(E1 e E2) = 0 (C) p(E1 e E2) = p(E1)p(E2 / E1) 7)p.2In una distribuzione di redditi la media è 20.000 euro e la differenza semplice media è 10.000. Qual è il valore del rapporto di concentrazione? (A)0,65 (B)0,25 (C)0,48 (D)0,75 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -172-
(E)0,55
Modulo II 8)p.1 Se ai valori di due variabili viene sommata una costante C, il coefficiente di correlazione r risulta: (A)aumentato della costante C (B) uguale al precedente (C) diminuito della costante C (D) uguale al quadrato della costante C 9)p.1Il coefficiente di correlazione lineare di Bravais-‐Pearson di due variabili standardizzate Z1 e Z2 è uguale a: (A) (B) (C) 10)p.2La tabella seguente riporta i p esi X e Y di 12 padri e dei loro figli primogeniti. Trovare il coefficiente di regressione b di Y su X. X 65 63 67 64 68 62 70 66 68 67 69 71 Y 68 66 68 65 69 66 68 65 71 67 68 65 (A)0,45 (B) -‐0,58 (C)0,22 (D) 0,68 (E)0,88 (F) 0,18 11)p.1Se il carattere Y dipende in media dal carattere X, il carattere X dipende sempre in media dal carattere Y (A)vero (B) falso 12)p.1In un campione di N soggetti la correlazione tra le variabili X e Y è risultata r = .64. Volendo stimare le Y di 10 nuovi soggetti dei quali si conosce solo il valore X, occorre calcolare: (A) la tabella a doppia entrata X x Y divisi alla mediana (B) la tabella a doppia entrata X x Y divisi alla media (C) la retta di regressione X’ = a + b Y (D) la retta di regressione Y’=a+b X 13)p.1Nel caso di regressione con dati raggruppati, la condizione dei minimi quadrati si scrive: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -173-
(A) (B)
minimo m i n i m o
minimo
(C)
(D)
m i n i m o
14) p.1La dipendenza in media implica la dipendenza stocastica (A)vero (B) falso 15)p.1Nella regressione si applica il concetto di dipendenza: (A)stocastica (B) matematica (C) in media 16)p.1Se nella regressione lineare semplice Y = Bo + B1X il coefficiente di determinazione R2= 0,9 vuol dire: (A) il 10% della variabilità di Y è spiegata dalla retta di regressione (B) il 90% della variabilità di Y è spiegata dalla retta di regressione (C) il 90% della variabilità di Y non è spiegata dalla retta di regressione Compito di Statistica Numero del compito: 00865 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1In una rappresentazione mediante istogrammi le altezze devono essere proporzionali: (A)al rapporto fra le frequenze osservate e l’ampiezza delle classi (B)alla differenza fra frequenze successive (C)alle intensità osservate SOLUZIONE
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -174-
Per fare in modo che le aree dei rettangoli siano proporzionali alle frequenze, si assegnano alle altezze di rettangoli misure proporzionali ai rapporti tra le frequenze e le ampiezze delle classi. Risposta esatta: (A)al rapporto fra le frequenze osservate e l’ampiezza delle classi. 2)p.1Un insieme di possibili coppie di valori di due variabili ai quali corrispondono delle frequenze è: (A)una variabile statistica doppia (B)una variabile statistica semplice (C)una distribuzione di frequenza SOLUZIONE I dati statistici sui quali di fonda lo studio della relazione fra due caratteri quantitativi, X ed Y, raffigurano una variabile statistica doppia (X, Y) e possono essere presentati sotto forma di serie a due variabili o di tavola a doppia entrata, detta anche tavola di correlazione. Quando la rilevazione riguarda poche unità statistiche, è sufficiente elencare le coppie dei valori di X e di Y, osservati nelle diverse unità, e si ottiene un prospetto formato da due colonne, che si dice serie a due variabili. Se, invece, la rilevazione si estende a molte unità statistiche, vi sono, generalmente, diverse coppie di valori che si osservano più volte, vale a dire a ciascuna di queste coppie corrisponde una frequenza, data dal numero delle unità in cui viene osservata. Conviene, in tal caso, individuare i valori distinti di ciascuno dei due caratteri e costruire una tavola doppia entrata o tavola di correlazione, formata da più righe e colonne, in cui le righe corrispondono ai valori di un carattere e le colonne a quelli dell’altro carattere, e negli incroci fra le righe e le colonne, detti caselle della tavola, porre le frequenze con cui sono state osservate le corrispondenti coppie. Risposta esatta: (A)una variabile statistica doppia. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -175-
3)p.1Un insieme di possibili valori di una variabile ai quali corrispondono delle probabilità è: (A)una variabile casuale (B)una variabile statistica (C)una distribuzione di probabilità 4)p.1Il valore massimo Gmax dell’indice di mutabilità del Gini è: (A) 1/m (B) 1-‐(1/m) (C) log m 5)p.1La somma algebrica degli scarti dei valori osservati dalla loro media, moltiplicati per i rispettivi pesi, è nulla se la media è: (A) geometrica (B) aritmetica (C) armonica 6)p.2Se la popolazione di un paese nei censimenti del 1951 e del 2001 era, rispettivamente, di 27 e 31,5 milioni, il saggio di incremento relativo annuo, secondo una legge di una progressione aritmetica, sarà: A)0,003076923 B) 2,5 C)0,001256 D ) 90,000 E) 0,001257 F) 70.000 7)p.1Se in una serie di n prove indipendenti ripetute N volte, la probabilità dell’evento E si mantiene costante in ogni prova di qualunque serie, la distribuzione dei valori appartiene allo schema di: (A) Poisson (B) Bernoulli (C)Spearman (D)Cauchy (E) Lexis (F)Kendall SOLUZIONE In termini generali, il problema può essere formulato come segue: si debbono eseguire n prove indipendenti, in ciascuna delle quali un evento E ha la probabilità costante, p, di verificarsi (schema di Bernoulli) e si vuole calcolare la probabilità che l’evento E si verifichi x volte nelle n prove, in un ordine qualsiasi (essendo, ovviamente, x un numero intero prefissato, maggiore o uguale a 0 e minore o uguale ad n). Risposta esatta: (B) Bernoulli.
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -176-
8)p.1Se, lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero dispari; B = uscita del 5, la probabilità esatta dell’evento <<A e B>> sarà: A) P(AeB)=0 B) P(AeB)=1/12 C) P(A e B)=2/8 D)P(AeB)=1/6 Modulo II
9)p.1Il coefficiente di correlazione lineare semplice si avvicina in valore assoluto ad 1 quanto più è stretta la relazione tra le variabili : (A)sempre (B) se la relazione è lineare (C) se la relazione è non lineare 10)p.1Se nella regressione lineare semplice Y = Bo + B1X il coefficiente di determinazione R2= 0,9 vuol dire: (A) il 10% della variabilità di Y è spiegata dalla retta di regressione (B) il 90% della variabilità di Y non è spiegata dalla retta di regressione (C) il 90% della variabilità di Y è spiegata dalla retta di regressione 11)p.1Se ai valori di due variabili viene sommata una costante C, il coefficiente di correlazione r risulta: (A)aumentato della costante C (B) uguale al quadrato della costante C (C) uguale al precedente (D) diminuito della costante C 12)p.1La covarianza di due variabili standardizzate è uguale a: (A)
(B)
(C)
13)p.2Gli amministratori di una società hanno deciso di condurre un’indagine per conoscere gli effetti delle spese in pubblicità sulla vendita di un loro prodotto. Per ciascuna delle 10 zone geografiche in cui viene pubblicizzato il prodotto sono stati rilevati l’ammontare speso per pubblicità nelle reti http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -177-
televisive locali (indicato con x e misurato in migliaia di euro) ed il numero di unità di prodotto vendute (indicato con y e misurato in migliaia). I dati raccolti hanno fornito, per le medie, le varianze e la covarianza, i seguenti valori: µx = 4,9; µy = 13,3; =1 5 0 , 9 ; = 3 5 2 , 1 ; . Determinare il coefficiente di regressione b di Y su X. (A) 3 (B) 1,5 (C) 0,2 (D) 8,345 (E) 12,582 (F)0,711 Compito di Statistica Numero del compito: 00963 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1Un carattere quantitativo discreto deve essere rappresentato mediante: (A) Un diagramma a punti (B) Un istogramma (C) Un diagramma a segmenti 2)p.1Un insieme di possibili coppie di valori di due variabili ai quali corrispondono delle frequenze è: (A) una variabile statistica semplice (B) una variabile statistica doppia (C)una distribuzione di frequenza 3)p.1In una distribuzione “cumulativa” le frequenze si possono riferire a classi di valori (segnare più risposte): (A)maggiori o uguali a determinati limiti (B)compresi tra due limiti (C)minori o uguali a determinati limiti 4)p.1Lo scostamento medio potenziato di ordine r si fonda sul (A)confronto fra ogni termine della distribuzione e una loro media. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -178-
(B) confronto fra ogni termine della distribuzione e tutti gli altri (C) confronto fra ogni termine della distribuzione e la differenza interquartile 5)p.2Se la popolazione di un paese nei censimenti del 1951 e 2001 era, rispettivamente, di 27 e 31,5 milioni, il rapporto incrementale annuo sarà: A)85.000 B) 88.000 C)0,00308 D )0,001256 E) 90.000 F) 0,001257 6)p.1La somma algebrica degli scarti dei valori osservati dalla loro media, moltiplicati per i rispettivi pesi, è nulla se la media è: (A) aritmetica (B) armonica (C) geometrica 7)p.2Se in una serie di n prove indipendenti ripetute N volte, la probabilità dell’evento E varia nelle n prove di ciascuna serie, secondo una legge che si riproduce immutata nelle serie successive, la distribuzione dei valori appartiene allo schema di: (A) Poisson (B) Spearman (C) Lexis (D)Cauchy (E)Binomiale (F)Kendall
8)p.1Se, lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero dispari; B = uscita del 5, la probabilità esatta dell’evento <<A e B>> sarà: A) P(AeB)=1/6 B) P(A e B)=2/8 C) P(AeB)=1/12 D) P(AeB)=0 9)p.1Se i seguenti punti (0, 8) e (8, 16) cadono sulla retta di regressione, l’equazione di tale retta sarà: (A) Y’ = 8X (B) Y’ = 16X (C) Y’=X+8 (D) Y’=8X + 16 10)p.1Se il carattere Y dipende in media dal carattere X, il carattere X dipende sempre in media dal carattere Y (A)vero (B) falso 11)p.1La covarianza di due variabili standardizzate è uguale a:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -179-
(A)
(B)
(C) 12)p.1Se la relazione tra due variabili X e Y è tale che a un incremento di X corrisponde sempre un incremento di Y, il coefficiente di correlazione tra le due variabili sarà: (A) non si può dire (B)positivo solo se si utilizza r di Pearson (C) sicuramente positivo (D) positivo solo se si utilizza rho di Spearman Compito di Statistica Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1I quartili sono: (A) medie lasche o di posizione (B) indici di dispersione (C) sempre positivi (D) sempre diversi (E) medie analitiche (F) indici di variabilità 2)p.1In un campione di n = 10 unità misurabili su scala ordinale, la mediana: (A) è il rango numero 5 (B) è la semisomma dei ranghi 5 e 6 (C)è la coppia delle modalità corrispondenti ai ranghi 5 e 6 (D)è la modalità corrispondente al rango numero 6 3)p.1Gli indici di dispersione si fondano sul: (A)confronto fra ogni termine della distribuzione e una media qualunque. (B)confronto fra ogni termine della distribuzione e la media aritmetica (C)confronto fra ogni termine della distribuzione e tutti gli altri 4)p.1Una misura di dispersione assume il valore massimo quando: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -180-
(A) le modalità hanno diversa frequenza (B)tutte le unità presentano la stessa modalità (C) le unità assumono soltanto i valori estremi del carattere 5)p.1Se, in un insieme di 200 valori con scarto quadratico medio 18, sottraiamo 5 a ciascun valore, il nuovo valore dello scarto quadratico medio sarà: (A) 18 (B) 18/5 (C) 18-‐5 (D) 6)p.1Se, lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero pari; B = uscita del 5, la probabilità esatta dell’evento <<A e B>> sarà: A) P(AeB)=0 B) P(AeB)=1/12 C) P(AeB)=1/6 D) P(A e B)=2/8 7)p.3Gli operai di una fabbrica sono raggruppati in 4 classi. Quale valore avrebbe l’indice di mutabilità di Gini (che si può calcolare sottraendo dall’unità la somma dei quadrati delle frequenze relative delle classi), se le classi contenessero tutte lo stesso numero di operai? (A) 0,55 (B) 0,85 (C) 0,25 (D) 0,35 (E) 0,75 (F) 0,50 Modulo II 8)p.1Il coefficiente di correlazione lineare di Bravais-‐Pearson di due variabili standardizzate Z1 e Z2 è uguale a: (A) (B) (C) 9) p .1Se il 64% della variabilità di Y è spiegata dalla variabile X, qual è il valore assoluto del coefficiente di correlazione r di Pearson?
(A) .49 (B) .64 (C) .87 (D) .80 Compito di Statistica Numero del compito:452 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -181-
1)p.1La media aritmetica si può ottenere sommando alla media aritmetica degli scarti dei valori osservati da un’origine arbitraria m l’origine stessa m.
(A) solo se l’origine m coincide con il valore centrale della classe modale (B) solo se l’origine m coincide con la mediana (C) sempre (D) mai 2)p.1Supponiamo di avere un insieme di 35 valori con media = 100 e σ = 9. Se aggiungiamo 5 valori, tutti uguali a 100, otterremo una media: (A)più bassa (B) non si può dire (C) più alta (D)uguale 3)p.1Il valore massimo Gmax dell’indice di mutabilità del Gini è: (A) 1/m (B) 1-‐(1/m) (C) log m 4)p.1Gli indici di dispersione si fondano sul: (A)confronto fra ogni termine della distribuzione e una media qualunque. (B) confronto fra ogni termine della distribuzione e tutti gli altri (C) confronto fra ogni termine della distribuzione e la media aritmetica 5)p.1Se, in un insieme di 200 valori con scarto quadratico medio 18, sottraiamo 5 a ciascun valore, il nuovo valore dello scarto quadratico medio sarà: (A) 18/5 (B) (C) 18 (D) 18-‐5 6)p.1La probabilità di due eventi E1 e E2 indipendenti per il teorema delle probabilità composte è data da: (A) p(E1 e E2.) = 0 (B) p(E1 e E2,) = p(E,)p(EZ) (C) p(E1 e E2) = p(E1)p(E2 / E1) 7)p.3Gli operai di una fabbrica sono raggruppati in 4 classi. Quale valore avrebbe l’indice di mutabilità di Gini (che si può calcolare sottraendo dall’unità la somma dei quadrati delle frequenze relative delle classi), se le classi contenessero tutte lo stesso numero di operai? (A) 0,85 (B) 0,25 (C) 0,35 (D) 0,50 (E) 0,55 (F) 0,75 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -182-
Modulo II 8)p.1Se il 64% della variabilità di Y è spiegata dalla variabile X, qual è il valore assoluto del coefficiente di correlazione r di Pearson?
(A) .87 (B) .64 (C) .80 (D) .49 9)p.1Due variabili non correlate linearmente (r=0) possono essere dipendenti? (A) si (B) sempre (C) si, se ordinabili (D) mai 10)p.2La tabella seguente riporta i pesi X e Y di 12 padri e dei loro figli primogeniti. Trovare il coefficiente di regressione b di Y su X. X 65 63 67 64 68 62 70 66 68 67 69 71 Y 68 66 68 65 69 66 68 65 71 67 68 70 (A) 0,88 (B)0,28 (C) 0,18 (D) -‐0,58 (E)0,25 (F)0,48 11)p.1Nel caso di regressione con dati raggruppati, la condizione dei minimi quadrati si scrive:
(A)
minimo
(B)
(C)
minimo
(D)
m i n i m o
m i n i m o
12)p.1Se i seguenti punti (0, 8) e (8, 16) cadono sulla retta di regressione, l’equazione di tale retta sarà: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -183-
(A) Y’ = 8X (B) Y’=8X + 16 (C) Y’ = 16X (D) Y’=X+8 13)p.1Il coefficiente di regressione dà: (A)l’inclinazione della retta di regressione (B)il punto di incontro della retta di regressione con l’asse delle ordinate (C)la varianza dei valori stimati (D)la media dei valori stimati 14)p.1Se il carattere Y dipende in media dal carattere X, il carattere X dipende sempre in media dal carattere Y (A)vero (B) falso 15)p.1Se nella regressione lineare semplice Y = Bo + B1X il coefficiente di determinazione R2= 0,9 vuol dire: (A) il 10% della variabilità di Y è spiegata dalla retta di regressione (B) il 90% della variabilità di Y è spiegata dalla retta di regressione (C) il 90% della variabilità di Y non è spiegata dalla retta di regressione 16)p.1Nella regressione lineare multipla Y = Bo + B1,X, + B2X2 il coefficiente di regressione B1 indica: (A) all'aumentare di una unità di X1di quanto aumenta o diminuisce in media Y a parità di X2 (B) all'aumentare di una unità di Y di quanto aumenta o diminuisce in media X1 a parità di X2 (C) la correlazione esistente tra X1e Y Numero del compito:332 13)Se il coefficiente di determinazione = 0 significa che (A) (C) (B) 14)p.1L’indice di determinazione indicante la bontà di accostamento dei valori empirici y ai valori teorici y* varia tra: (A)0; un max (B)0; 1 (C)-‐1; +1 Compito di Statistica Numero del compito:00867
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -184-
Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1Una grande impresa ha bisogno di rappresentare la distribuzione per età dei suoi dipendenti. E’ opportuno utilizzare: (A) Una rappresentazione per punti (B) Un istogramma (C)Un ideogramma 2)p.1Un insieme di possibili valori di una variabile ai quali corrispondono delle frequenze è: (A) una variabile casuale (B) una distribuzione di frequenza (C) una variabile statistica 3)p.1Un insieme di possibili coppie di valori di due variabili ai quali corrispondono delle frequenze è: (A) una variabile statistica semplice (B) una distribuzione di frequenza (C) una variabile statistica doppia 4)p.1Per confrontare la variabilità di due distribuzioni è corretto utilizzare: (A)il coefficiente di variazione del Pearson (B)il rapporto di concentrazione (C)la varianza 5)p.1La somma algebrica degli scarti dei valori osservati dalla loro media, moltiplicati per i rispettivi pesi, è nulla se la media è: (A) aritmetica (B) armonica (C) geometrica
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -185-
6)p.2Se la popolazione di un paese nei censimenti del 1951 e 2001 era, rispettivamente, di 27 e 31,5 milioni, il rapporto incrementale annuo sarà: (A) 0,00308 (B) 0,001257 (C) 85.000 (D) 90.000 (E) 0,001256 (F) 88.000 7)p.2Se in una serie di n prove indipendenti ripetute N volte, la probabilità dell’evento E varia nelle n prove di ciascuna serie, secondo una legge che si riproduce immutata nelle serie successive, la distribuzione dei valori appartiene allo schema di: (A) Kendall (B) Binomiale (C) Poisson (D) Spearman (E) Lexis (F) Cauchy 8)p.1Se, lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero dispari; B = uscita del 5, la probabilità esatta dell’evento <<A e B>> sarà: A) P(A e B)=2/8 B) P(AeB)=1/6 C) P(AeB)=0 D) P(AeB)=1/12 Modulo II 9)p.1Se l’equazione della retta di regressione in un insieme di dati è: Y=3.65X+11.25, quale sarà il valore di Y per X=33? (A)243.25 (B)131,7 (C) 98.7 (D) 89.72 (E) 77.2 10)p.1La condizione dei minimi quadrati consiste nel trovare il minimo di:
(A)
( B )
( C )
11)p.1In una tavola di correlazione le caselle contengono:
(A)devono essere due mutabili (B)i coefficienti di correlazione lineare http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -186-
(C)le freqenze Una tavola a doppia entrata o di correlazione è formata da più righe e colonne, in cui le righe corrispondono ai valori di un carattere e le colonne a quelli dell’altro carattere, e negli incroci fra le righe e le colonne, detti caselle della tavola, sono poste le frequenze con cui sono state osservate le corrispondenti coppie di valori. Risposta esatta: (C)le freqenze. 12)p.1Per un gruppo di 25 imprese si è rilevato la quantità X di pezzi venduti di un dato prodotto. Viene poi formata una graduatoria delle stesse imprese secondo la qualità (Y), dalla migliore, al 1° posto, alla peggiore. Per calcolare la correlazione tra pezzi venduti e qualità del prodotto occorre: (A)trasformare la Y in variabile continua e utilizzare il coefficiente r di Pearson (B) trasformare la X in variabile ordinale e utilizzare il coefficiente rho di Spearman (C) utilizzare l’indice chi quadrato (D) non è possibile calcolare la correlazione tra X e Y Compito di Statistica Numero del compito:00864 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1L’istogramma è la rappresentazione grafica di una distribuzione: (A)di un carattere qualitativo (B)per classi di valori (C)per valori singoli http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -187-
2)p.1Il più alto livello di misura di un carattere qualitativo è la scala: (A)ordinale (B)nominale (C)metrica 3)p.1In un magazzino all’inizio dell’anno, vi sono 20 q. di merce; se ne entrano ed escono, rispettivamente, 25 q. mensili, il rapporto di durata sarà? (A) 0.976 m. (B) 1.25 g. (C) 24 g. 4)p.1Quali dei seguenti indici non rappresenta una misura della variabilità della distribuzione? (A) la differenza tra la media e la mediana (B) scarto quadratico medio (C) varianza (D) differenza interquartile 5)p.2Se la popolazione di un paese nei censimenti del 1951 e 2001 era, rispettivamente, di 27 e 31,5 milioni, il rapporto incrementale annuo sarà: (A) 0,001256 (B) 88.000 (C) 0,00308 (D) 0,001257 (E) 85.000 (F) 90.000 6)p.1La somma algebrica degli scarti dei valori osservati dalla loro media, moltiplicati per i rispettivi pesi, è nulla se la media è: (A) armonica (B) aritmetica (C) geometrica 7)p.2Se in una serie di n prove indipendenti ripetute N volte, la probabilità dell’evento E varia nelle n prove di ciascuna serie, secondo una legge che si riproduce immutata nelle serie successive, la distribuzione dei valori appartiene allo schema di: (A) Poisson (B) Spearman (C) Cauchy (D) Binomiale (E) Lexis (F) Kendall 8)p.1Se, lanciando un dado a sei facce, definiamo i seguenti eventi: A = uscita di un numero dispari; B = uscita del 5, la probabilità esatta dell’evento <<A e B>> sarà: A) P(AeB)=1/12 B) P(AeB)=0 C) P(A e B)=2/8 D) P(AeB)=1/6 Modulo II http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -188-
9)p.1Se il carattere Y dipende in media dal carattere X, il carattere X dipende sempre in media dal carattere Y (A)vero (B) falso 10)Se il coefficiente di determinazione = 0 significa che (A) (B) (C)
11)p.1Se il coefficiente di correlazione r di Pearson calcolato tra due variabili è uguale a 0,32, allora la frazione di varianza spiegata è: (A) 32% (B) 16% (C) 64% (D) 10% 12)p.1La covarianza di due variabili standardizzate è uguale a: (A)
(B)
(C)
13)p.1Gli amministratori di una società hanno deciso di condurre un’indagine per conoscere gli effetti delle spese in pubblicità sulla vendita di un loro prodotto. Per ciascuna delle 10 zone geografiche in cui viene pubblicizzato il prodotto sono stati rilevati l’ammontare speso per pubblicità nelle reti televisive locali (indicato con x e misurato in migliaia di euro) ed il numero di unità di prodotto vendute (indicato con y e misurato in migliaia). I dati raccolti hanno fornito, per le medie, le varianze e la covarianza, i seguenti valori: µx = 4,9; µy = 13,3; =1 5 0 , 9 ; = 3 5 2 , 1 ; . Determinare il coefficiente di regressione b di Y su X. (A) 1,5 (B)12,582 (C)0,33 (D)0,2 (E) 8,345 (F) 3 Compito di Statistica Numero del compito: 152 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -189-
1)Il quoziente di Lexis è dato dal rapporto tra il valore osservato dello scarto quadratico medio e (A)lo scarto quadratico medio che si avrebbe se i dati fossero conformi alo schema di Gauss (B)lo scarto quadratico medio che si avrebbe se i dati fossero conformi allo schema di Poisson (C)lo scarto quadratico medio che si avrebbe se i dati fossero conformi allo schema di Lexis (D)lo scarto quadratico medio che si avrebbe se la probabilità p dell’evento E si mantiene costante in ogni prova SOLUZIONE Il quoziente di Lexis è dato dal rapporto fra il valore osservato dello scarto quadratico medio e quello che si dovrebbe avere se i dati fossero conformi allo schema di Bernoulli (se la probabilità p dell’evento E si mantiene costante in ogni prova di qualunque serie), ossia consente anche di stabilire a quale dei tre schemi (Bernoulli, Poisson, Lexis) appaiono maggiormente conformi i dati osservati. Risposta esatta: (D)lo scarto quadratico medio che si avrebbe se la probabilità p dell’evento E si mantiene costante in ogni prova. 2)Nella regressione lineare semplice se le due rette di regressione di Y a X e X a Y coincidono significa che tra X e Y vi è:
(A) indipendenza (B) perfetta correlazione lineare (C) correlazione nulla 3)p.1In un’indagine di mercato viene chiesto a 50 consumatori se sono favorevoli o meno al cambiamento di alcune caratteristiche di un dato
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -190-
prodotto. Il parere (favorevole – non favorevole) espresso dai consumatori è un carattere espresso su scala (A) nominale (B) ordinale (C) metrica 4)In una distribuzione normale, la percentuale di valori che cade entro una deviazione standard sopra e sotto la media è: (A) 50.00 (B) 95.00 (C) 68.26 (D) 34.13 SOLUZIONE C’è una interpretazione della deviazione standard di una distribuzione normale, che può essere rappresentata come segue. La deviazione standard misura la distanza sulla scala orizzontale associata ai limiti di contenimento del 68.26%, 95.46%, 99.73%. Risposta esatta: (C) 68.26. 5)Una grande impresa ha bisogno di rappresentare la distribuzione per età dei suoi dipendenti. E’ opportuno utilizzare: (A) Un istogramma (B) Un ideogramma (C) Una rappresentazione per punti
6)Se, in un insieme di 200 punteggi con deviazione standard 12, sottraiamo 5 a ciascun valore, il nuovo valore della deviazione standard sarà: (A) 12-‐5 (B) 12 (C)12/5 (D)
7)L’indice di curtosi è un indice di forma di una distribuzione che serve a verificare: (A)la normalità di una distribuzione qualsiasi (B)la normalità di una distribuzione simmetrica e unimodale (C)l’asimmetria SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -191-
Quando si descrive la forma delle curve unimodali simmetriche, con il termine curtosi si intende il grado di appiattimento, rispetto alla curva normale o gaussiana. Nella valutazione della curtosi, una distribuzione unimodale simmetrica è detta: -‐mesocurtica, quando ha forma uguale alla distribuzione normale; -‐leptocurtica, quando ha un eccesso di frequenza delle classi centrali, una frequenza minore delle classi intermedie ed un eccesso di frequenza delle classi estreme; è quindi una distribuzione più alta al centro e agli estremi e più bassa ai fianchi; la caratteristica più evidente è l’eccesso di frequenza dei valor centrali; -‐platicurtica, quando rispetto alla normale presenta una frequenza minore delle classi centrali e di quelle estreme, con una frequenza maggiore di quelle intermedie; è quindi una distribuzione più bassa al centro e agli estremi e più alta ai fianchi; la caratteristica più evidente è il numero più ridotto di valori centrali. Nella distribuzione normale, che è simmetrica e unimodale l’indice di Kurtosi risulta uguale a 3. Le distribuzioni per le quali l’indice di kurtosi assume un valore minore, uguale o maggiore di 3 sono dette, rispettivamente, platikurtiche, mesokurtiche e leptokurtiche. In pratica l’indice di kurtosi serve a stabilire se una distribuzione di frequenza si può considerare approssimativamente normale, nel qual caso deve assumere un valore intorno a 3. Nella distribuzione normale il momento terzo di origine la media aritmetica è uguale a 0 ed il momento quarto della stessa origine, è uguale al triplo del quadrato della varianza, cioè il rapporto , che viene detto indice di kurtosi, risulta uguale a 3. Risposta esatta: (B)la normalità di una distribuzione simmetrica e unimodale. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -192-
8)Affinché lo scarto quadratico medio di una distribuzione raddoppi occorre che i punteggi vengano moltiplicati per: (A)1/2 (B) (C)2 (D)4 SOLUZIONE Bisogna ricordarsi che la deviazione standard è nella scala delle variabili, e perciò moltiplicare con una costante i valori implica moltiplicare la deviazione standard con la stessa costante c. Risposta esatta: (C)2. 9)Data la seguente distribuzione che rappresenta le frequenze percentuali di un controllo di durata effettuato su 600 lampadine, calcolare la durata media delle lampade ore funzionamento % 0 ¬ 300 1 300 ¬ 600 2 600 ¬ 900 20 900 ¬ 1.200 53 1.200 ¬ 1.500 21 1500 ¬ 1.800 3 (A) 1080 (B) 1000 (C) 1050 (D) 1250 (E) 1070 (F) 1090 10)Con riferimento alla distribuzione di frequenze percentuali dell’esercizio precedente, calcolare la mediana. (A)1092,83 (B)1042,83 (C)1062,83 (D)1032,83 (E)1052,83 SOLUZIONE La distribuzione è formata da n=6 classi chiuse a sinistra (se le classi contengono i loro estremi inferiori, ma non anche quelli superiori, sono intervalli chiusi a sinistra, quindi si può far precedere il trattino da una http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -193-
sbarretta verticale ( quinta colonna. i
Classi
); i limiti superiori delle classi, xi, sono indicati nella Rapporti percentuali
Distribuzione cumulativa
Ore funzionamento
1
0-‐300
1
300
1
2
300-‐600
2
600
3
3
600-‐900
20
900
23
4
900-‐1200
53
1.200
76
5
1200-‐1500
21
1.500
97
6
1500-‐1800
3
1.800
100
Totale
100
Si può utilizzare la seguente formula per risalire al valore della mediana dove rappresenta il valore del limite superiore della classe immediatamente precedente alla classe alla quale appartiene le mediana. Il secondo quartile (k=2), ossia la mediana, appartiene, alla quarta classe, in quanto ed ha il valore rappresenta il valore della frequenza cumulata percentuale immediatamente precedente alla classe alla quale appartiene la mediana. (E)1052,83. Compito di Statistica Numero del compito: 459 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -194-
Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__ __ 1)p.1Gli investimenti fissi lordi (in migliaia di miliardi di lire) nel settore industriale in Italia nel periodo 1970-‐1974 sono stati i seguenti: Anno 1970 1971 1972 1973 1974 Investimenti 3.9 3.9 3.8 4.3 4.5
Il valore “3.8” nella tabella è (A) una frequenza (B) una modalità (C) una unità statistica 2)p.1Con riferimento al quesito precedente, ciascun anno è (A)una frequenza (B) una modalità (C) una unità statistica 3)p.1Il valore massimo Hmax dell’indice di entropia è: (A) 1/m (B) log m (C) 1/log m 4)p.1Lo scostamento quadratico medio (standard deviation) dalla media aritmetica varia tra: (A) -‐1; +1 (B) 0; un max (C) 0; 1 5)p.1Se, in un insieme di 200 valori con scarto quadratico medio 18, sottraiamo 5 a ciascun valore, il nuovo valore dello scarto quadratico medio sarà: (A) 18-‐5 (B) (C) 18/5 (D) 18 6)p.1La probabilità di due eventi E1 e E2 indipendenti per il teorema delle probabilità composte è data da: (A) p(E1 e E2) = 0 (B) p(E1 e E2) = p(E1)p(E2 / E1) (C) p(E1 e E2) = p(E1)p(E2) 7)p.3Gli operai di una fabbrica sono raggruppati in 4 classi. Quale valore avrebbe l’indice di mutabilità di Gini (che si può calcolare sottraendo dall’unità la somma dei quadrati delle frequenze relative delle classi), se le classi contenessero tutte lo stesso numero di operai? (A) 0,35 (B) 0,75 (C) 0,85 (D) 0,25 (E) 0,55 (F) 0,50 Modulo II http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -195-
8)p.1Si chiede a tre esperti (A, B e C) di stabilire, ciascuno per suo conto, una graduatoria dei 15 partecipanti alla finale di un concorso di cucina, dopo aver assaggiato le pietanze preparate dai finalisti. Per sapere quale coppia di esperti concorda maggiormente nel giudizio dato si calcolano e si confrontano: (A) i tre coefficienti di correlazione r di Pearson (B) i due coefficienti di correlazione r di Pearson (C) i sei coefficienti di correlazione rho di Spearman (D) i tre coefficienti di correlazione rho di Spearman 9)p.1Se il coefficiente di correlazione r di Pearson calcolato tra due variabili è uguale a 0,32, allora la frazione di varianza spiegata è: (A) 16% (B) 64% (C) 10% (D) 32% 10)p.212imprese presentano i seguenti valori relativamente alle variabili X ed Y. 1 e 7; 2 e 8; 3 e 9; 3 e 5; 4 e 6; 5 e 7; 5 e 3; 6 e 4; 7 e 5; 7 e 1; 8 e 2; 9 e 9. Quanto vale il coefficiente di correlazione? A) .418 B) 1 C) 0 D)-‐.76
Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) – II Numero del compito: 01562 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__03/09/2009 __ 1)p.1Se nella regressione lineare semplice Y = Bo + B1X il coefficiente di determinazione R2= 0,9 vuol dire: (A) il 90% della variabilità di Y è spiegata dalla retta di regressione (B) il 10% della variabilità di Y è spiegata dalla retta di regressione (C) il 90% della variabilità di Y non è spiegata dalla retta di regressione 2)p.2In una tavola a doppia entrata sulle tre distribuzione parziali della variabile Y sono stati calcolati la media aritmetica e la media quadratica ottenendo i seguenti risultati: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -196-
n
10
20
25
μ0,1
4
5
8
6
6
10
Calcolare il rapporto di correlazione ηy,x (A)0,127 (B) 0,227 (C)0,327 (D)0,027 SOLUZIONE media aritmetica media quadratica , cioè la varianza si può calcolare come differenza fra i quadrati della media quadratica e della media aritmetica dei valori osservati. ;
;
;
;
n
10
20
25
4
5
8
20
11
36
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -197-
Si può dire che la varianza, somma della varianza,
, della distribuzione marginale di Y è uguale alla
, delle medie,
, delle distribuzioni parziali di Y e
della media aritmetica ponderata delle varianze, parziali, con pesi dati dai numeri, riferiscono, ossia
, delle distribuzioni
, di casi a cui tali distribuzioni si
,
dove si è supposto che vi siano k distribuzioni parziali.
la cui radice quadrata
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -198-
ossia il rapporto fra lo scarto quadratico medio delle distribuzioni parziali di Y e quelli della distribuzione marginale di Y, è detta rapporto di correlazione di Y su X. Risposta esatta: (C)0,327. 3)p.2Un ciclista percorre una prima tappa ad una velocità di 35 km/h; poi percorre una seconda tappa, lunga il quadruplo della prima, ad una velocità di 25 km/h, infine, percorre una tappa lunga quanto la prima ad una velocità di 15 km/h. Determinare la velocità che il ciclista avrebbe dovuto mantenere costantemente nelle due tappe per coprire il medesimo tragitto nel medesimo tempo. (A)24,88 (B)23,51 (C)25,86 (D)22,38 SOLUZIONE
Calcoliamo la Media Armonica ponderata (Ma):
;
. Se le distanze percorse non sono tutte uguali, si deve usare una media armonica ponderata delle velocità, dove i pesi sono le rispettive distanze. Si deve notare che se si fosse calcolata la media aritmetica delle velocità si sarebbe caduti in errore (28,33). In generale, se ai valori sono attribuiti dei pesi, la formula della media armonica semplice
va sostituita con quella della media armonica ponderata
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -199-
che si riduce alla
se i pesi sono tutti uguali a
1. Risposta esatta: (B)23,51. 4)p.1Il prezzo di acquisto di un dato prodotto era alla fine dell’anno 2000 di € 1000. Successivamente sono stati rilevati i seguenti incrementi unitari annui: 0,35; 0,40; 0,20; 0,25. Trovare l’incremento medio annuo ed il prezzo del prodotto alla fine del quarto anno. (A) 1835; 0,998 (B) 2835; 0,798 (C) 1835; 0,498 (D)2835; 0,298 SOLUZIONE Sommando 1 ai valori relativi degli incrementi otteniamo i saggi , , , . Si cerca una media, q, dei suddetti saggi, dalla quale, sottraendo 1 e moltiplicando il risultato per 100, si ricaverà il saggio medio annuo relativo. che si dice media geometrica. da cui si desume un saggio medio annuo relativo dello 0,2976=29,76%.
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -200-
Risposta esatta: (D)2835; 0,298. 5)p.2Il voto riportato dagli studenti ad un esame ha distribuzione approssimativamente normale con varianza 16. Determinare la differenza interquartile (tenendo presente che P(|z|<0,6745)=0,5). (A)9,1 (B)6,2 (C)5,4 (D)8,7 6)p.1Se il coefficiente di correlazione r di Pearson calcolato tra due variabili è uguale a 0,40, allora la frazione di varianza spiegata è: (A)64% (B)10% (C)16% (D)32%
Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) – II Numero del compito: 01543 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__17/07/2009 ___________ Modulo I 1)p.3Data la distribuzione delle ordinazioni settimanali ricevute da una ditta nell’anno 2005 X 0 1 2 3 4 5 P 0,030 0,161 0,322 0,309 0,140 0,032 Scegliere la distribuzione di probabilità che meglio si adatta alla distribuzione osservata e, supposto che la distribuzione scelta mantenga anche per l’anno 2009 la sua validità, calcolare la probabilità che la ditta riceverà almeno 3 ordinazioni settimanali. (A) 0,10 (B)0,80 (C)0,01 (D)0,20 SOLUZIONE http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -201-
Questa distribuzione è discreta poiché il numero osservato di ordinazioni è: X=0, X=1,…,X=5 La distribuzione che meglio si adatta ai dati osservati è la distribuzione Binomiale. Valore medio M(X) Varianza n=5 X=3; p=0,309; q=1-‐p=1-‐0,309=0,691 La probabilità richiesta è:
.
Distribuzione discreta: quando il parametro da misurarsi può assumere solo determinati valori, quali gli interi 0, 1, 2, …; ad es. la distribuzione di elementi non conformi o difettosi in un circuito stampato. Una distribuzione discreta appare come una serie di segmenti di altezza proporzionale alla probabilità. 2)p.1Supponendo che agli alunni di una classe di un istituto superiore venga somministrato un questionario contenente 10 domande, che il voto medio riportato sia stato di 6.7, lo scarto quadratico medio 1.2 e che i voti abbiano distribuzione normale, determinare la percentuale di studenti che ha ottenuto il voto 6. (A)50% (B)32% (C)12% (D)75% (E)15% (F) 27% 3)p.2La media della distribuzione di un gruppo di soggetti secondo la statura a è 174 cm e la varianza è 36 cm. Se si adatta alla distribuzione la curva normale, il 75% dei soggetti ha un’altezza h compresa tra 165 ed x, P(165>h>x)=75%. Determinare il valore di x. (A)179 (B)171 (C)166 (D)186 (E)175 SOLUZIONE che corrisponde a 0,17. P|Z|< 1,5= 0,4332 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -202-
1-‐(0,4332(valore tavola)+0,5=1-‐0,9332=0,0668 Per trovare x 0,0668+0,5=0,5668 che equivale a 0,17. I due valori più prossimi a 0,5668 sono: 0,5636 e 0,5675. 0,5668-‐0,5636=0,0032; 0,5675-‐0,5668=0,0007, quindi il valore più prossimo a 0,5668 è 0,5675. Oppure: i due valori più vicini a 0,5668 sono 0,5636 al quale corrisponde un valore di z pari a 0,16 (0,1+0,06) e 0,5675 al quale corrisponde un valore di z pari a 0,17 (0,1+0,07). Pertanto (x-‐174)/6=0,17
si può approssimare z con 0,165
4)p.1Se il coefficiente di correlazione r di Pearson calcolato tra due variabili è uguale a 0,40, allora la frazione di varianza spiegata è: (A)10% (B)32% (C)16% (D)64% 5)p.2Una macchina produce sferette d’acciaio il cui diametro si può assimilare ad una N(2500 micron, 400 micron). I limiti di tolleranza delle sferette vanno da 2450 a 2.550 micron. Qual è la probabilità che una sferetta non esca dai limiti di tolleranza? (A)0,78758 (B)0,98758 (C)0,88758 (D)0,68758 Soluzione Unione di due eventi incompatibili Considerando la variabile normale standardizzata
Tale probabilità diventa: che, data la simmetria della curva normale standardizzata intorno allo zero, diventa: http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -203-
che, in base alle tavole dell’integrale della curva normale standardizzata, diventa 1-‐0,0124=0,9876 Risposta esatta: (B)0,98758 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito)
Numero del compito: 01478 Cognome e Nome:_____________ ___________________ Matr.:_____________ Data compito:__07/03/09__ 1)Un quiz è composto da 5 domande, tra loro indipendenti, ciascuna con quattro possibili risposte di cui una sola corretta. Assumendo che un candidato scelga a caso la risposta ad ogni quesito, si calcoli la probabilità che questi risponda esattamente soltanto alle prime due domande oppure alle ultime due. (A)0,053 (B) 0,500 (C) 0,033 (D) 0,15 (E) 0,026 (F) 0,145 2)Viene condotta un’indagine tra gli studenti di una scuola per analizzare se vi sia relazione tra la loro abitudine al fumo e quella dei genitori. I dati raccolti, relativi a 100 intervistati, sono riassunti nella seguente tabella doppia:Abitudine al fumo dei genitori Lo studente fuma? Calcolare la frequenza prevista corrispondente alla coppia di modalità “entrambi” e “No” qualora vi fosse indipendenza tra abitudine al fumo degli studenti e quella dei genitori. (A)7,25 (B) 8,14 (C) 25,14 (D) 27,2 (E) 5,14 (F) 6,12 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -204-
3)In un triennio, il fatturato di un esercizio commerciale è passato da € 160.000 a € 240.000. Il tasso medio annuo d’incremento relativo è stato del: (A)6,25% (B) 8,7% (C) 2,5% (D) 14,5% SOLUZIONE saggio medio relativo di variazione che dipende soltanto dai valori ed . Quindi: n=4 (si deve contare anche il primo anno) Risposta esatta: (D) 14,5% 4)In un supermercato, l’importo degli scontrini emessi si distribuisce normalmente, con media µ = 65 euro e scarto quadratico medio σ = 30. Il 45% degli scontrini risultano superiori a: (A)19,47 (B) 61,23 (C) 84,12 (D) 68,77 5)Con riferimento ad una tavola di correlazione tra due variabili, X ed Y, se le varianze delle distribuzioni parziali di Y sono tutte nulle, indicare quale valore assume il rapporto di correlazione di Y su X. Spiegare per iscritto la ragione della risposta (A)10 (B) 1 (C) 0,5 (D) -‐1 6)Nella tavola di correlazione di due variabili, ciascuna delle quali può assumere, rispettivamente, r ed s modalità, le distribuzioni marginali sono in numero di (A)2 (B) r + s (C) r ° s (D) 2° r + s (E) (r + s)^2 (F) 3 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 1470 Cognome e Nome:_____________ ___________________ Matr.:_____________ Data compito:__13/02/09__ http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -205-
1)Sui dati della seguente tabella Anno 1990 1991 1992 1993 1994 1995 1996 Popol. 400 440 450 480 520 570 650 Calcolare il numero indice a base 1990 relativo al 1994 (A)1,12 (B) 1,625 (C) 1,08 (D) 1193 (E) 1,3 (F) 1995 SOLUZIONE Anni
Popol.
1990
400
1994
520
Indici
L’indice per il 1994 vale 130. Risposta esatta: (E) 1,3. 2)Con riferimento all’esercizio precedente, calcolare il numero indice a base mobile relativo all’anno 1996. (A)83,33% (B) 1,625 (C) 1,140 (D) 0,08333 (E) 1,925 (F) 1,725 SOLUZIONE Anni
Popol.
Indici
1995
570
-‐
1996
650
L’indice per il 1996 vale 114,04. Risposta esatta: (C) 1,140.
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -206-
3)Considerando che la media e lo scarto quadratico medio di un campione sono rispettivamente pari a 39 e a 9, quale sarà lo scarto ridotto z relativo a un soggetto che ha un valore pari a 2,5 volte lo scarto quadratico medio sotto la media? (A)-‐2 (B) 50 (C) 5 (D) 2,5 (E) -‐5 (F) -‐2,5 SOLUZIONE poiché
allora Risposta esatta: (F) -‐2,5. 4)In una distribuzione normale all’intervallo [µ, µ + k σ] (dove µ = media, σ = scarto quadratico medio, k > 0) è associata una probabilità: (A)Circa il 34% del totale (B) inferiore rispetto a quella dell’intervallo [µ -‐(k/2) σ , µ +(k/2) σ] (C) Uguale a quella compresa nell’intervallo [0, µ +(k/2) σ] (D) superiore rispetto a quella dell’intervallo [µ -‐(k/2) σ , µ +(k/2) σ] (E) inferiore rispetto a quella compresa nell’intervallo [0, µ +(k/2) σ] (F) uguale a quella compresi dell’intervallo [µ -‐(k/2) σ , µ +(k/2) σ] 5)Un venditore di enciclopedie riesce a stipulare mediamente 9 contratti di vendita al giorno, con coefficiente di variazione 1/3. Adattare un’opportuna distribuzione e calcolare la probabilità di vendere esattamente 10 enciclopedie. (A)13,72% (B) 5,44% (C) 19,12% (D) 11,86% 5)Un venditore di enciclopedie riesce a stipulare mediamente 9 contratti di vendita al giorno, con coefficiente di variazione 1/3. Adattare un’opportuna distribuzione e calcolare la probabilità di vendere esattamente 10 enciclopedie. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -207-
(A)13,72% (B) 5,44% (C) 19,12% (D) 11,86% SOLUZIONE Poiché media e varianza sono uguali, si applica la distribuzione di Poisson.
Risposta esatta: (D) 11,86%. 6)In un supermercato, l’importo degli scontrini emessi si distribuisce normalmente, con media µ = 65 euro e scarto quadratico medio σ = 30. Il 30% degli scontrini risultano inferiori a: (A)58,25 (B) 49,26 (C) 65,00 (D) 80,73 7)Proprietà distintiva del sistema numerico di una scala ordinale è quella di indicare: (A)L’entità del rapporto tra valori relativi a intensità diverse della caratteristica misurata (B)La posizione reciproca degli elementi rispetto a una caratteristica misurata (C)L’appartenenza a una stessa categoria o a categorie diverse (D)L’entità delle differenze di intensità della caratteristica misurata 8)Dati i seguenti gruppi, indicare la varianza totale Gruppo
N
A B
4 3
_ X 10 9,5
2 3
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -208-
C
6
11
3
(A)3,1 (B) 5 (C) 2,6 (D) 2,7 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01465 Cognome e Nome:_____________ ___________________ Matr.:_____________ Data compito:__ _____________________ 1)La condizione dei minimi quadrati consiste nel trovare il minimo di (spiegare per iscritto in cosa consiste tale condizione):
( B )
( C )
(A) 2)p.1Dati i seguenti gruppi, indicare la varianza totale Gruppo A B C
N 4 8 6
10 9,5 11
2 3 3
(A)1,7 (B) 2,8 (C) 3,2 (D) 4,5 3)p.1Considerando che la media e lo scarto quadratico medio di un campione sono rispettivamente pari a 28 e a 5, quale sarà lo scarto ridotto z relativo a un soggetto che ha un valore pari a 4 volte lo scarto quadratico medio sotto la media?
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -209-
(A) -‐2,5 (B) 2,5 (C) 4 (D) -‐4 (E) 8 (F) 5 SOLUZIONE poiché
allora Risposta esatta: (D) -‐4. 4)p.1Nella regressione lineare semplice se le due rette di regressione di Y a X e X a Y coincidono significa che tra X e Y vi è: (A) indipendenza (B) correlazione nulla (C) perfetta correlazione lineare 5)p.2Un medico, in base alla propria esperienza, è arrivato a stabilire che tra i suoi pazienti un terzo crede di essere malato mentre il resto si ritiene sano e si fa visitare per puro scrupolo. Inoltre, è arrivato a stabilire che il 55% di coloro che credono di essere malati lo è effettivamente, mentre il 5% di coloro che si ritengono sani è malato. Sulla base di questa esperienza, qual è la probabilità di credere impropriamente di essere malati o di credere impropriamente di essere sani?
(A) 0,33 (B) 0,84 (C) 0,55 (D) 0,05 (E) 0,23 (F) 0,18 SOLUZIONE Indichiamo con M l’evento “il paziente è malato” e con A l’evento “il paziente ritiene di essere malato”. Ovviamente, le negazioni di M e di A sono rispettivamente gi eventi: “il paziente è sano” ed “il paziente ritiene di essere sano”. http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -210-
Secondo l’opinione del medico (impostazione soggettiva della probabilità), risulta: P(A)=1/3=0,3333
La probabilità di credere impropriamente di essere malati è la probabilità che si verifichi l’evento A avendo osservato l’evento M negato. Applicando il teorema di Bayes risulta: La probabilità di essere sano per un individuo che si ritiene malato è uguale a: Analogamente, la probabilità di essere sano per un individuo che si ritiene sano è uguale a: Sostituendo questi al’interno della formula precedente, risulta: Risposta esatta: (F) 0,18. 6)p.1L’importo medio della spesa effettuata da ciascuno dei 20 clienti di un esercizio commerciale in una certa ora è stato di € 25, mentre nell’ora successiva i clienti sono stati 10 con una spesa media di € 70. Qual è la spesa media dei clienti che si sono rivolti a quel negozio nelle due ore di riferimento? http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -211-
(A) € 50 (B) € 60 (C) € 55 (D) € 40 (E) € 35 (F) € 55 7)p.2Un medico di base ha riscontrato che nel periodo invernale in media ogni cento pazienti che visita dieci presentano i sintomi dell’influenza. Posto che il medico visita circa 15 pazienti al giorno, qual è la probabilità che incontri tra 2 e 4 influenzati in un giorno?
(A) 12,85% (B) 43,82% (C) 26,68% (D) 4,28% Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01124 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__15/01/07__ 1)p.2In una lotteria i premi estratti sono uno ogni cinque biglietti venduti. Quanti biglietti e è necessario acquistare affinché la probabilità di vincere almeno un premio sia maggiore del 60%? (A) 4 (B) 7 (C) 6 (D) 5 2) p.1Se ad un certo capitale, vengono applicati gli interessi del 10% per 2 anni; successivamente il 12% per 5 anni ed infine per altri 3 anni il 13.50%, l’interesse medio sarà: (A) 13.6 (B) 12.05 (C) 12.64 (D) 11.98645 3) p.2La tabella seguente mostra le quantità di concime impiegato e la produzione di cinque campi di grano. Ipotizzando una relazione lineare tra le due variabili, quali sono le stime dei parametri α e β del modello di regressione? concime 38 produzione 41 di grano
56 63
59 70
64 72
74 84
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -212-
(A) y = –12,660 + 41,1969x (B) y = –9,660 + 4,1969x (C) y = –3,660 + 1,1969x (D) y = –2,660 + 1,1969x (E) y = –2,660 + 7,1969x 4) p.2Con riferimento all'esercizio precedente, calcolare il coefficiente di determinazione. (A) 0,45 (B) 0,65 (C) 0,98 (D) 0,68 (E) 0,35 (F) 0,75 5) p.1Quando il coefficiente di determinazione (A)
(B)
= 0 deve aversi:
(C)
6) p.2Mediante l'impiego delle tavole della curva normale standardizzata calcolare il valore di z0 per il quale si ha: Pr (0<z <z0) = 0,47500. (A) 0,06 (B) 4,75% (C) 1,96 7) p.1Nella regressione lineare multipla Y = Bo + B1,X, + B2X2 il coefficiente di regressione B1 indica: (A) all'aumentare di una unità di X1di quanto aumenta o diminuisce in media Y a parità di X2 (B) all'aumentare di una unità di Y di quanto aumenta o diminuisce in media X1 a parità di X2 (C) la correlazione esistente tra X1e Y 8) p.3E’ stato determinato che lo 0,2% della popolazione italiana è allergica ad un certo vaccino; determinare la probabilità che in un paese di 1.500 abitanti vi siano oltre 3 individui allergici. (A) 35,27% (B) 45,27% (C) 25,27% (D) 15,27% Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01114 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__15/12/06__ Modulo I http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -213-
1) p.1Il coefficiente di correlazione lineare semplice si avvicina in valore assoluto ad 1 quanto più è stretta la relazione tra le variabili : (A) sempre (B) se la relazione è lineare (C) se la relazione è non lineare 2) p.1La curva di Lorenz rappresenta (A) La relazione tra due variabili quantitative (B) Il grado di concentrazione di un carattere trasferibile (C) La variabilità di un carattere quantitativo (D) Il grado di concentrazione di un carattere qualitativo 3) p.2Nella tabella seguente sono riportati, con riferimento ai due anni 1980 e 2000, i clienti di un'impresa ripartiti per area geografica di appartenenza.Misurare il legame fra i dati relativi ai due anni mediante il coefficiente di regressione lineare Area geografica clienti 1980 clienti 2000 America del Nord 10 100 America Latina 22 80 Europa occidentale 35 100 Europa orientale 35 50 Africa 36 45 Medio Oriente 39 20 Asia e Oceania 43 12 Totale mondiale 220 407 (A) 32,15 (B) 4,23 (C) -‐5,3 (D) -‐2,37 (E) 8,77 (F) -‐3,24 4) p.2Calcolare la frazione di varianza spiegata dalla funzione di regressione (A) 0,26 (B) -‐0,56 (C) 0,8 (D) 0,74 (E) 0,56 (F) 3,1 5) p.2Si consideri la seguente tabella di dati relativi alle variabili quantitative X e Y. Si indichi qual è la covarianza tra x e y. id x y http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -214-
1 2 3 4 5
11.5 28.5 21.2 11.3 6.3
3.1 5.6 5.5 4.3 1.7
(A) 10,59 (B) 74,51 (C) 9,71 (D) 138,42 6) p.1Rispetto alla media geometrica delle varianze, la covarianza , in valore assoluto, è: (A) sempre uguale (B) sempre minore (C) minore uguale 7) p.1La covarianza è : (A) positiva o negativa (B) sempre negativa (C) sempre positiva 8) p.1Nella regressione si applica il concetto di dipendenza: (A) stocastica (B) matematica (C) in media 9) p.2L’indice di concentrazione di Gini calcolato sulle osservazioni della variabile X ={81, 83, 81, 82, 84, 80, 83} è pari a (A) 0 (B) circa 1 (C) 1 (D) circa 0 Modulo II 10) p.2Nella popolazione di una regione, la percentuale di fumatori è pari al 21,4%. Calcolare la probabilità che in un campione casuale di 5 residenti almeno uno sia fumatore. (A) 0,45 (B) 0,30 (C) 0,70 (D) 0,20 11) p.2Nella popolazione di una regione, la percentuale di fumatori è pari al 21,4%. In un campione casuale di 180 residenti, quale è la media e la varianza del numero di fumatori? (A) 68,52; 60,28 (B) 38,52; 23,28 (C) 38,52; 150,28 (D) 38,52; 30,28 (E) 48,52; 40,28 (F) 48,52; 30,28
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -215-
12) p.2Nella popolazione di una regione, la percentuale di fumatori è pari al 21,4%. Quale è la probabilità che in un campione casuale di 260 residenti, meno di un quinto siano fumatori? (A) 0,257 (B) 0,291 (C) 0,480 (D) 0,482 (E) 0,709 (F) 0,478 Compito di Statistica-‐ (motivare TUTTE le risposte, pena nullità compito) Numero del compito: 01578 Cognome e Nome:_____________ ___________________ Matric.:_____________ Data compito:__18/09/2009__ Modulo I 1)p.1Per un gruppo di atleti, si ha una statura media di m. 1,85 con σ2=2,28 ed un peso medio di kg. 80 con σ2=0,55. Calcolare il valore massimo possibile che la covarianza tra le due variabili può raggiungere. (A)0,67 (B) 1 (C) 1,12 (D) 0,45 SOLUZIONE
Risposta esatta: (C) 1,12. 2)p.112 imprese presentano i seguenti valori relativamente alle variabili X ed Y, 0 e 11; 2 e 8; 3 e 9; 3 e 5; 4 e 6; 5 e 7; 5 e 3; 6 e 4; 7 e 5; 7 e 1; 8 e 2; 9 e 9. Quanto vale il coefficiente di correlazione? A) 0,41 B) -‐ 0,76 C) -‐ 0,55 D) 1 (E) O (F)-‐0,39 SOLUZIONE X
Y
0
11 http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -216-
2
8
3
9
3
5
4
6
5
7
5
3
6
4
7
5
7
1
8
2
9
9
Totale 59
1)
70
;
Gli ingredienti necessari per il calcolo di r sono:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -217-
Risposta esatta: C) -‐ 0,55. 3)p.3Ogni inverno una malattia stagionale colpisce lo 0,05% dei 3000 residenti di una regione; determinare la probabilità che nel prossimo inverso vi siano oltre 2 malati. (A)57,68% (B) 94,90% (C) 54,27% (D) 54,32% (E)28,16% (F)19,12% SOLUZIONE Applichiamo la formula seguente
, detta esponenziale di Poisson:
In genere si considera una buona approssimazione quando n>50 e p<0,1. P(X>2)=P(X=3)+P(X=4)+…+P(X=300) È evidente che è molto più semplice calcolare il complementare di P(X>2) cioè calcolare Pertanto poiché P(A)=1-‐P(A)’
sì no Totale Nessuno 3 22 25 uno solo 8 34 42 Entrambi http://unict.myblog.it -‐ Blog degli Studenti 7 della Facoltà di Economia 26 e Commercio di Catania, 33 luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -218Totale 18 82 100
Risposta esatta: (F)19,12% 4)p.3In un supermercato, l’importo degli scontrini emessi si distribuisce normalmente, con media µ = 15,50 euro e scarto quadratico medio σ = 30. Il 45% degli scontrini risultano superiori a: (A)61,23 (B) 19,47 (C) 84,12 (D) 68,77 SOLUZIONE X∼N(15,50,900)
Cerchiamo il valore di y per cui Pr(X>x)=0,45 Partiamo dalla distribuzione normale standardizzata e poi applichiamo la trasformazione inversa alla standardizzazione. Si ha che: Pr(Z>z)=0,45 z=0,13 Il valore di z si dovrebbe individuare ricercando all’interno delle tavole della normale standard il valore di (0,5000-‐0,45) e risalendo da questo al valore di z. In questo caso, tuttavia all’interno delle tavole della normale standard non è possibile individuare un valore di pari a 0,05. I due valori di più prossimi a 0,05 sono: 0,0478 e 0,0517 corrispondenti, rispettivamente, a z=0,12 e z=0,13. Quindi:
Risposta esatta: (B) 19,47. 5)p.1Un quiz è composto da 5 domande, tra loro indipendenti, ciascuna con cinque possibili risposte di cui una sola corretta. Assumendo che un http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -219-
candidato scelga a caso la risposta ad ogni quesito, si calcoli la probabilità che questi risponda esattamente soltanto alle prime due domande oppure alle ultime due. (A)0,012 (B) 0,044 (C)0,0026 (D) 0,0053 (E)0,041 (F)0,0151 Risposta esatta:
http://unict.myblog.it -‐ Blog degli Studenti della Facoltà di Economia e Commercio di Catania, luogo di scambio di opinioni, materiale didattico e informazioni. Questi appunti sono stati condivisi da Francesco Alessi -220-