6/14
Brase | Brase
Estadística básica
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
FÓRMULAS Y TABLAS DE USO FRECUENTE n 5 tamaño de la muestra N 5 tamaño de la población f 5 frecuencia
Capítulo 2
Capítulo 5
Ancho de clase 5
Alto 2 bajo Número de clases
Punto medio de la clase 5
(aumente al entero siguiente)
Límite superior 1 límite inferior 2
Probabilidad del complemento del evento A PsAcd 5 2 PsAd Regla de multiplicación para eventos independientes P(A y B) 5 P(A) ? P(B)
Límite inferior 5 límite inferior de la clase anterior 1 ancho de la clase
Reglas generales de multiplicación
Capítulo 3
Regla de adición para eventos mutuamente excluyentes P(A o B) 5 P(A) 1 P(B)
ox Media muestral x 5 n
Regla general de la adición P(A o B) 5 P(A) 1 P(B) 2 P(A y B)
ox Media poblacional 5 N oxw Promedio ponderado 5 ow Rango 5 valor de datos más grande 2 valor de datos más pequeño Desviación estándar de la muestra s 5 Fórmula de cálculo s 5
Î
Î
osx 2 xd n2
Î
osx 2 d N
n r sn 2 rd
Capítulo 6 Media de una distribución de probabilidad discreta 5 oxPsxd
Para distribuciones binomiales
r 5 número de éxitos; p 5 probabilidad de éxito; q512p
Varianza poblacional
Distribución de probabilidad binomial P(r) 5 Cn,r prqn 2 r
2
Coeficiente muestral de variación CV 5
s # x
oxf Media muestral para datos agrupados x 5 n Desviación estándar muestral para datos agrupados
Î
Regla de combinación Cn r 5
5 Ïosx 2 d Psxd
Varianza muestral s2
s5
n sn 2 rd
Desviación estándar de una distribución de probabilidad discreta
ox 2 sod yn n2
Desviación estándar poblacional 5
Regla de permutación Pn r 5
osx 2 xd f 5 n2
Î
ox f 2 soxfd yn n2
Media m 5 np Desviación estándar 5 Ïnpq
Capítulo 7 Puntaje bruto x 5 z 1 m
Desviación estándar de la distribución x, x 5 Puntaje estándar para x
Coeficiente de correlación producto-momento de Pearson r5
noxy 2 ox oy Ïnox 2 ox Ïnoy 2 oy
Recta de mínimos-cuadrados y⁄ 5 a 1 bx donde b 5
noxy 2 ox oy nox 2 ox
a 5 y 2 bx b 5 r syysx Coeficiente de determinación 5 r2
x2
Media de la distribución x, x 5
Capítulo 4 Regresión y correlación
Puntaje estándar z 5
z5
x2
Ïn
yÏn Media de la distribución p⁄ , p⁄ 5 p
Desviación estándar para p⁄ , p⁄ 5
Î
pq q5 2p n
Capítulo 8 Intervalos de confianza
para m x2E, ,x1E cuando es conocida donde E 5 zc Ïn Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
1E1
E2
Estadística básica
6/14
s
E 5 tc
cuando no es conocida
donde p 5
Ïn con g.l. 5 n 2 1
Intervalo de confianza
p⁄ 2 E , p , p⁄ 1 E
Î
Para m1 2 m2 (muestras independientes)
p⁄ s 2 p⁄ d n
sx 2 x d 2 E , 2 , sx 2 x d 1 E
S D zc
proporciones
n5
SD zc E
SD E
con cálculo preliminar para p
s
cuando 1 y 2 se conocen cuando 1 y 2 no se conocen
n
para diferencia de proporciones p1 2 p2 p⁄ 2 p⁄ 2 E , p 2 p , p⁄ 2 p⁄ 1 E
sin cálculo preliminar para p
Î
p⁄ q⁄
1
p⁄ q⁄
n n p⁄ 5 r yn p⁄ 5 r yn
q⁄ 5 2 p⁄ q⁄ 5 2 p⁄
Estadístico muestral de prueba para pruebas de hipótesis
para m ( conocida) z 5
x2 yÏn
para m ( desconocida) t 5
x2 syÏn
para p (np . 5 y nq . 5) z 5 donde q 5 1 2 p; p⁄ 5 r/n
Capítulo 11
g.l. 5 n 21
sO 2 Ed donde O 5 frecuencia observada E Para pruebas de independencia y pruebas de homogeneidad 5
p⁄ 2 p Ïpqyn
o
E5
(Total de la fila)(Total de la columna) Tamaño de la muestra
Para bondad de ajuste E 5 (porcentaje dado)(tamaño de la muestra)
Capítulo 10
Pruebas de independencia g.l. 5 (R 2 1)(C 2 1)
Estadístico muestral de prueba para pruebas de hipótesis
para diferencias pareadas d, t 5
d 2 d sdyÏn
Prueba de homogeneidad g.l. 5 (R 2 1)(C 2 1)
; g.l. 5 n 2 1
Î
Regresión lineal
Estadístico muestral de prueba para r
para diferencia de medias, 1 o 2 desconocidas x 2x t5 s s 1 n n
t5
Î
p 2p pq pq 1 n n
Ï 2r
con g.l. 5 n 2 2
Î
oy 2 aoy 2 boxy n2
Intervalo de confianza para y: y⁄ 2 E , y , y⁄ 1 E
Nota: El software utiliza la aproximación de Satterthwaite para los grados de libertad (g.l.) ⁄
r Ïn 2
Error de estimación estándar Se 5
g.l. 5 más pequeño de n1 2 1 y n2 2 1
para diferencia de proporciones
Bondad de ajuste g.l. 5 (número de categorías) 21 Estadístico muestral de prueba para 2 sn 2 ds con g.l. 5 n 2 1 5
para diferencia de medias, 1 y 2 conocidas x 2x z5 1 n n
Î
n
Nota: El software utiliza la aproximación de Satterthwaite para grados de libertad (g.l.)
Capítulo 9
z5
1
n
donde E 5 zc
⁄
1
n
Con g.l. 5 más pequeño de n12 1 y n2 21
E
zc
s
E 5 tc
Tamaño de la muestra para calcular
n 5 ps 2 pd
Î Î
donde E 5 zc
r p5 n ⁄
medias n 5
yq5 2p
n 1n
p⁄ 5 r yn p⁄ 5 r yn
para p dado que np . 5 y n(1 2 q) . 5
donde E 5 zc
r 1r
donde E 5 tcSe
Î
1
n
1
nsx 2 xd nox 2 soxd
con g.l. 5 n 2 2 Estadístico muestral de prueba para pendiente b t5
b Se
Î
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
ox 2
n
14.06.2019
soxd con g.l. 5 n 2 2
Fórmulas y tablas de uso frecuente
6/14
E3
Valores críticos para la distribución t de Student c es un nivel de confianza
Área c
–t
0
Área de una cola
0.250 0.125 0.100 0.075 0.050 0.025 0.010 0.005
0.0005
Área de dos colas
0.500 0.250 0.200 0.150 0.100 0.050 0.020 0.010
0.0010
g.l. \ c
0.500 0.750 0.800 0.850 0.900 0.950 0.980 0.990
0.999
1
t
Área de una cola
Área de cola derecha
0
t
Área de cola izquierda
–t
0
Área de dos colas
Área
–t
0
t
2.414
3.078
4.165
6.314 12.706 31.821 63.657 636.619
2
0.816
1.604
1.886
2.282
2.920
4.303
6.965
9.925
31.599
3
0.765
1.423
1.638
1.924
2.353
3.182
4.541
5.841
12.924
4
0.741
1.344
1.533
1.778
2.132
2.776
3.747
4.604
8.610
5
0.727
1.301
1.476
1.699
2.015
2.571
3.365
4.032
6.869
6
0.718
1.273
1.440
1.650
1.943
2.447
3.143
3.707
5.959
7
0.711
1.254
1.415
1.617
1.895
2.365
2.998
3.499
5.408
8
0.706
1.240
1.397
1.592
1.860
2.306
2.896
3.355
5.041
9
0.703
1.230
1.383
1.574
1.833
2.262
2.821
3.250
4.781
10
0.700
1.221
1.372
1.559
1.812
2.228
2.764
3.169
4.587
11
0.697
1.214
1.363
1.548
1.796
2.201
2.718
3.106
4.437
12
0.695
1.209
1.356
1.538
1.782
2.179
2.681
3.055
4.318
13
0.694
1.204
1.350
1.530
1.771
2.160
2.650
3.012
4.221
14
0.692
1.200
1.345
1.523
1.761
2.145
2.624
2.977
4.140
15
0.691
1.197
1.341
1.517
1.753
2.131
2.602
2.947
4.073
16
0.690
1.194
1.337
1.512
1.746
2.120
2.583
2.921
4.015
17
0.689
1.191
1.333
1.508
1.740
2.110
2.567
2.898
3.965
18
0.688
1.189
1.330
1.504
1.734
2.101
2.552
2.878
3.922
19
0.688
1.187
1.328
1.500
1.729
2.093
2.539
2.861
3.883
20
0.687
1.185
1.325
1.497
1.725
2.086
2.528
2.845
3.850
21
0.686
1.183
1.323
1.494
1.721
2.080
2.518
2.831
3.819
22
0.686
1.182
1.321
1.492
1.717
2.074
2.508
2.819
3.792
23
0.685
1.180
1.319
1.489
1.714
2.069
2.500
2.807
3.768
24
0.685
1.179
1.318
1.487
1.711
2.064
2.492
2.797
3.745
25
0.684
1.178
1.316
1.485
1.708
2.060
2.485
2.787
3.725
26
0.684
1.177
1.315
1.483
1.706
2.056
2.479
2.779
3.707
27
0.684
1.176
1.314
1.482
1.703
2.052
2.473
2.771
3.690
28
0.683
1.175
1.313
1.480
1.701
2.048
2.467
2.763
3.674
29
0.683
1.174
1.311
1.479
1.699
2.045
2.462
2.756
3.659
30
0.683
1.173
1.310
1.477
1.697
2.042
2.457
2.750
3.646
35
0.682
1.170
1.306
1.472
1.690
2.030
2.438
2.724
3.591
40
0.681
1.167
1.303
1.468
1.684
2.021
2.423
2.704
3.551
45
0.680
1.165
1.301
1.465
1.679
2.014
2.412
2.690
3.520
50
0.679
1.164
1.299
1.462
1.676
2.009
2.403
2.678
3.496
60
0.679
1.162
1.296
1.458
1.671
2.000
2.390
2.660
3.460
70
0.678
1.160
1.294
1.456
1.667
1.994
2.381
2.648
3.435
80
0.678
1.159
1.292
1.453
1.664
1.990
2.374
2.639
3.416
100
0.677
1.157
1.290
1.451
1.660
1.984
2.364
2.626
3.390
500
0.675
1.152
1.283
1.442
1.648
1.965
2.334
2.586
3.310
1000 `
1.000
0.675
1.151
1.282
1.441
1.646
1.962
2.330
2.581
3.300
0.674
1.150
1.282
1.440
1.645
1.960
2.326
2.576
3.291
Para grados de libertad g.l. que no estén en la tabla, utilice el g.l. más cercano, es decir el menor. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
E4
6/14
Estadística básica
Áreas de una distribución normal estándar (a) Tabla de áreas a la izquierda de z
z
0
La entrada de la tabla para z es el área a la izquierda de z.
z
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09
23.4
.0003
.0003
.0003
.0003
.0003
.0003
.0003
.0003
.0003
.0002
23.3
.0005
.0005
.0005
.0004
.0004
.0004
.0004
.0004
.0004
.0003
23.2
.0007
.0007
.0006
.0006
.0006
.0006
.0006
.0005
.0005
.0005
23.1
.0010
.0009
.0009
.0009
.0008
.0008
.0008
.0008
.0007
.0007
23.0
.0013
.0013
.0013
.0012
.0012
.0011
.0011
.0011
.0010
.0010
22.9
.0019
.0018
.0018
.0017
.0016
.0016
.0015
.0015
.0014
.0014
22.8
.0026
.0025
.0024
.0023
.0023
.0022
.0021
.0021
.0020
.0019
22.7
.0035
.0034
.0033
.0032
.0031
.0030
.0029
.0028
.0027
.0026
22.6
.0047
.0045
.0044
.0043
.0041
.0040
.0039
.0038
.0037
.0036
22.5
.0062
.0060
.0059
.0057
.0055
.0054
.0052
.0051
.0049
.0048
22.4
.0082
.0080
.0078
.0075
.0073
.0071
.0069
.0068
.0066
.0064
22.3
.0107
.0104
.0102
.0099
.0096
.0094
.0091
.0089
.0087
.0084
22.2
.0139
.0136
.0132
.0129
.0125
.0122
.0119
.0116
.0113
.0110
22.1
.0179
.0174
.0170
.0166
.0162
.0158
.0154
.0150
.0146
.0143
22.0
.0228
.0222
.0217
.0212
.0207
.0202
.0197
.0192
.0188
.0183
21.9
.0287
.0281
.0274
.0268
.0262
.0256
.0250
.0244
.0239
.0233
21.8
.0359
.0351
.0344
.0336
.0329
.0322
.0314
.0307
.0301
.0294
21.7
.0446
.0436
.0427
.0418
.0409
.0401
.0392
.0384
.0375
.0367
21.6
.0548
.0537
.0526
.0516
.0505
.0495
.0485
.0475
.0465
.0455
21.5
.0668
.0655
.0643
.0630
.0618
.0606
.0594
.0582
.0571
.0559
21.4
.0808
.0793
.0778
.0764
.0749
.0735
.0721
.0708
.0694
.0681
21.3
.0968
.0951
.0934
.0918
.0901
.0885
.0869
.0853
.0838
.0823
21.2
.1151
.1131
.1112
.1093
.1075
.1056
.1038
.1020
.1003
.0985
21.1
.1357
.1335
.1314
.1292
.1271
.1251
.1230
.1210
.1190
.1170
21.0
.1587
.1562
.1539
.1515
.1492
.1469
.1446
.1423
.1401
.1379
20.9
.1841
.1814
.1788
.1762
.1736
.1711
.1685
.1660
.1635
.1611
20.8
.2119
.2090
.2061
.2033
.2005
.1977
.1949
.1922
.1894
.1867
20.7
.2420
.2389
.2358
.2327
.2296
.2266
.2236
.2206
.2177
.2148
20.6
.2743
.2709
.2676
.2643
.2611
.2578
.2546
.2514
.2483
.2451
20.5
.3085
.3050
.3015
.2981
.2946
.2912
.2877
.2843
.2810
.2776
20.4
.3446
.3409
.3372
.3336
.3300
.3264
.3228
.3192
.3156
.3121
20.3
.3821
.3783
.3745
.3707
.3669
.3632
.3594
.3557
.3520
.3483
20.2
.4207
.4168
.4129
.4090
.4052
.4013
.3974
.3936
.3897
.3859
20.1
.4602
.4562
.4522
.4483
.4443
.4404
.4364
.4325
.4286
.4247
20.0
.5000
.4960
.4920
.4880
.4840
.4801
.4761
.4721
.4681
.4641
Para valores de z menores de -3.49, utilice 0.000 para aproximar el área.
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Fórmulas y tablas de uso frecuente
6/14
E5
Áreas de una distribución normal estándar (continúa)
0
z
La entrada de la tabla para z es el área a la izquierda de z.
Áreas de una distribución normal estándar (continúa)
z
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09
0.0
.5000
.5040
.5080
.5120
.5160
.5199
.5239
.5279
.5319
.5359
0.1
.5398
.5438
.5478
.5517
.5557
.5596
.5636
.5675
.5714
.5753
0.2
.5793
.5832
.5871
.5910
.5948
.5987
.6026
.6064
.6103
.6141
0.3
.6179
.6217
.6255
.6293
.6331
.6368
.6406
.6443
.6480
.6517
0.4
.6554
.6591
.6628
.6664
.6700
.6736
.6772
.6808
.6844
.6879
0.5
.6915
.6950
.6985
.7019
.7054
.7088
.7123
.7157
.7190
.7224
0.6
.7257
.7291
.7324
.7357
.7389
.7422
.7454
.7486
.7517
.7549
0.7
.7580
.7611
.7642
.7673
.7704
.7734
.7764
.7794
.7823
.7852
0.8
.7881
.7910
.7939
.7967
.7995
.8023
.8051
.8078
.8106
.8133
0.9
.8159
.8186
.8212
.8238
.8264
.8289
.8315
.8340
.8365
.8389
1.0
.8413
.8438
.8461
.8485
.8508
.8531
.8554
.8577
.8599
.8621
1.1
.8643
.8665
.8686
.8708
.8729
.8749
.8770
.8790
.8810
.8830
1.2
.8849
.8869
.8888
.8907
.8925
.8944
.8962
.8980
.8997
.9015
1.3
.9032
.9049
.9066
.9082
.9099
.9115
.9131
.9147
.9162
.9177
1.4
.9192
.9207
.9222
.9236
.9251
.9265
.9279
.9292
.9306
.9319
1.5
.9332
.9345
.9357
.9370
.9382
.9394
.9406
.9418
.9429
.9441
1.6
.9452
.9463
.9474
.9484
.9495
.9505
.9515
.9525
.9535
.9545
1.7
.9554
.9564
.9573
.9582
.9591
.9599
.9608
.9616
.9625
.9633
1.8
.9641
.9649
.9656
.9664
.9671
.9678
.9686
.9693
.9699
.9706
1.9
.9713
.9719
.9726
.9732
.9738
.9744
.9750
.9756
.9761
.9767
2.0
.9772
.9778
.9783
.9788
.9793
.9798
.9803
.9808
.9812
.9817
2.1
.9821
.9826
.9830
.9834
.9838
.9842
.9846
.9850
.9854
.9857
2.2
.9861
.9864
.9868
.9871
.9875
.9878
.9881
.9884
.9887
.9890
2.3
.9893
.9896
.9898
.9901
.9904
.9906
.9909
.9911
.9913
.9916
2.4
.9918
.9920
.9922
.9925
.9927
.9929
.9931
.9932
.9934
.9936
2.5
.9938
.9940
.9941
.9943
.9945
.9946
.9948
.9949
.9951
.9952
2.6
.9953
.9955
.9956
.9957
.9959
.9960
.9961
.9962
.9963
.9964
2.7
.9965
.9966
.9967
.9968
.9969
.9970
.9971
.9972
.9973
.9974
2.8
.9974
.9975
.9976
.9977
.9977
.9978
.9979
.9979
.9980
.9981
2.9
.9981
.9982
.9982
.9983
.9984
.9984
.9985
.9985
.9986
.9986
3.0
.9987
.9987
.9987
.9988
.9988
.9989
.9989
.9989
.9990
.9990
3.1
.9990
.9991
.9991
.9991
.9992
.9992
.9992
.9992
.9993
.9993
3.2
.9993
.9993
.9994
.9994
.9994
.9994
.9994
.9995
.9995
.9995
3.3
.9995
.9995
.9995
.9996
.9996
.9996
.9996
.9996
.9996
.9997
3.4
.9997
.9997
.9997
.9997
.9997
.9997
.9997
.9997
.9997
.9998
(b) Valores críticos del intervalo de confianza zc
Para valores de z menores de -3.49, utilice 0.000 para aproximar el área.
Nivel de confianza c
Valor crítico zc
Áreas de una distribución normal estándar (continúa)
0.70, o 70%
1.04
0.75, o 75%
1.15
0.80, o 80%
1.28
0.85, o 85%
1.44
0.90, o 90%
1.645
0.95, o 95%
1.96
0.98, o 98%
2.33
0.99, o 99%
2.58
(c) Prueba de hipótesis, valores críticos z0 a 5 0.05
Nivel de confianza
a 5 0.01
Valor crítico z0 para una prueba de cola izquierda
21.645
22.33
Valor crítico z0 para una prueba de
1.645
2.33
61.96
62.58
cola derecha Valor crítico 6z0 para una prueba de dos colas
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
E6
6/14
Estadística básica
Distribución 2 Área de cola derecha x2 Para g.l. ≥ 3
Área de cola derecha x2 Para g.l. = 1 o 2
Área de cola derecha g.l.
.990
.975
.950
.900
1
0.04393
.995
0.03157
0.03982
0.02393
0.0158
.100 2.71
.050 3.84
.025 5.02
.010
2
0.0100
0.0201
0.0506
0.103
0.211
4.61
5.99
7.38
9.21 10.60
3
0.072
0.115
0.216
0.352
0.584
6.25
7.81
9.35
11.34 12.84
4
0.207
0.297
0.484
0.711
1.064
7.78
9.49
11.14 13.28 14.86
5
0.412
0.554
0.831
1.145
1.61
9.24 11.07
12.83 15.09 16.75
6
0.676
0.872
1.24
1.64
2.20
10.64 12.59
14.45 16.81 18.55
7
0.989
1.24
1.69
2.17
2.83
12.02 14.07
16.01 18.48 20.28
8
1.34
1.65
2.18
2.73
3.49
13.36 15.51
17.53 20.09 21.96
9
1.73
2.09
2.70
3.33
4.17
14.68 16.92
19.02 21.67 23.59
10
2.16
2.56
3.25
3.94
4.87
15.99 18.31
20.48 23.21 25.19
11
2.60
3.05
3.82
4.57
5.58
17.28 19.68
21.92 24.72 26.76
12
3.07
3.57
4.40
5.23
6.30
18.55 21.03
23.34 26.22 28.30
13
3.57
4.11
5.01
5.89
7.04
19.81 22.36
24.74 27.69 29.82
14
4.07
4.66
5.63
6.57
7.79
21.06 23.68
26.12 29.14 31.32
15
4.60
5.23
6.26
7.26
8.55
22.31 25.00
27.49 30.58 32.80
16
5.14
5.81
6.91
7.96
9.31
23.54 26.30
28.85 32.00 34.27
17
5.70
6.41
7.56
8.67
10.09
24.77 27.59
30.19 33.41 35.72
18
6.26
7.01
8.23
9.39
10.86
25.99 28.87
31.53 34.81 37.16
19
6.84
7.63
8.91
10.12
11.65
27.20 30.14
32.85 36.19 38.58
20
7.43
8.26
9.59
10.85
12.44
28.41 31.41
34.17 37.57 40.00
21
8.03
8.90
10.28
11.59
13.24
29.62 32.67
35.48 38.93 41.40
22
8.64
9.54
10.98
12.34
14.04
30.81 33.92
36.78 40.29 42.80
23
9.26
10.20
11.69
13.09
14.85
32.01 35.17
38.08 41.64 44.18
24
9.89
10.86
12.40
13.85
15.66
33.20 36.42
39.36 42.98 45.56
25
10.52
11.52
13.12
14.61
16.47
34.38 37.65
40.65 44.31 46.93
26
11.16
12.20
13.84
15.38
17.29
35.56 38.89
41.92 45.64 48.29
27
11.81
12.88
14.57
16.15
18.11
36.74 40.11
43.19 46.96 49.64
28
12.46
13.56
15.31
16.93
18.94
37.92 41.34
44.46 48.28 50.99
29
13.21
14.26
16.05
17.71
19.77
39.09 42.56
45.72 49.59 52.34
30
13.79
14.95
16.79
18.49
20.60
40.26 43.77
46.98 50.89 53.67
40
20.71
22.16
24.43
26.51
29.05
51.80 55.76
59.34 63.69 66.77
50
27.99
29.71
32.36
34.76
37.69
63.17 67.50
71.42 76.15 79.49
60
35.53
37.48
40.48
43.19
46.46
74.40 79.08
83.30 88.38 91.95
70
43.28
45.44
48.76
51.74
55.33
85.53 90.53
95.02 100.4 104.2
80
51.17
53.54
57.15
60.39
64.28
96.58 101.9
106.6 112.3 116.3
90
59.20
61.75
65.65
69.13
73.29
107.6 113.1
118.1 124.1 128.3
100
67.33
70.06
74.22
77.93
82.36
118.5 124.3
129.6 135.8 140.2
6.63
.005 7.88
Fuente: Biometricka, junio de 1964, The Distribution, H. L. Herter (tabla 7). Usada con permiso de Oxford University Press. 2
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
i
6/14
Estadística básica
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
iii 6/14
Estadística básica
Charles Henry Brase Regis University
Corrinne Pellillo Brase Arapahoe Community College Versión editada por
Aly El-Iraki Profesor emérito, Alexandria University, Egipto Revisión técnica
Á. Leonardo Bañuelos Saucedo Universidad Nacional Autónoma de México
Luis Medina Gual Universidad Iberoamericana José Arturo Tar Ortíz Peralta Tecnológico de Monterrey, Campus Santa Fe
Emmanuel Sandoval Reza Tecnológico de Estudios Superiores de Tianguistenco
Australia • Brasil • Estados Unidos • México • Reino Unido • Singapur Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Este libro estĂĄ dedicado a la memoria de un gran maestro, matemĂĄtico y amigo
Burton W. Jones Profesor emĂŠrito, University of Colorado
EstadĂstica bĂĄsica, primera ediciĂłn Charles Henry Brase y Corrinne Pellillo Brase Director Higher Education LatinoamĂŠrica: Renzo CasapĂa Valencia Gerente editorial LatinoamĂŠrica: -HVÂźV 0DUHV &KDFÂľQ Editores: Pablo Miguel Guerrero Rosas y Karen Estrada Arriaga Coordinador de manufactura: Rafael PĂŠrez GonzĂĄlez AdaptaciĂłn de portada: Eduardo ValdĂŠs Sandoval Imagen de portada: 7LHU XQG 1DWXUIRWRJUDČ´H - XQG & Sohns/Getty Images &RPSRVLFLÂľQ WLSRJUÂŁČ´FD Karen Medina
Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V., una CompaĂąĂa de Cengage Learning, Inc. &DUUHWHUD 0ÂŤ[LFR 7ROXFD QÂźP RČ´FLQD &RO (O <DTXL 'HO &XDMLPDOSD & 3 Ciudad de MĂŠxico. Cengage LearningÂŽ es una marca registrada usada bajo permiso. DERECHOS RESERVADOS. Ninguna parte de este trabajo amparado por la Ley Federal del Derecho de Autor, podrĂĄ ser reproducida, transmitida, almacenada o utilizada en cualquier forma o por cualquier medio, ya sea JUÂŁČ´FR HOHFWUÂľQLFR R PHFÂŁQLFR LQFOX\HQGR pero sin limitarse a lo siguiente: fotocopiado, UHSURGXFFLÂľQ HVFDQHR GLJLWDOL]DFLÂľQ JUDEDFLÂľQ HQ DXGLR GLVWULEXFLÂľQ HQ LQWHUQHW GLVWULEXFLÂľQ HQ UHGHV GH LQIRUPDFLÂľQ R DOPDFHQDPLHQWR \ UHFRSLODFLÂľQ HQ VLVWHPDV GH LQIRUPDFLÂľQ D H[FHSFLÂľQ GH OR SHUPLWLGR en el CapĂtulo III, ArtĂculo 27 de la Ley Federal del Derecho de Autor, sin el consentimiento por escrito de la Editorial. Traducido del libro: Understanding Basic Statistics, Eighth Edition, Metric Version Charles Henry Brase y Corrinne Pellillo Brase Š2019 Î&#x2013;6%1 'DWRV SDUD FDWDORJDFLÂľQ ELEOLRJUÂŁČ´FD Brase, Charles Henry y Brase, Corrinne Pellillo. EstadĂstica bĂĄsica 3ULPHUD HGLFLÂľQ ISBN: 978-607-526-821-7 Visite nuestro sitio web en: http://latinoamerica.cengage.com
Impreso en MĂŠxico 1 2 3 4 5 6 7 22 21 20 19
Reg. 403 VS Š D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Contenido Prefacio xvii Tabla de material de prerrequisitos 1
1
Empecemos
2
PROBLEMA CENTRAL: ¿Dónde han ido todas las luciérnagas?
3
1.1 ¿Qué es la estadística? 4 1.2 Muestreo aleatorio 13 1.3 Introducción a los diseños experimentales 22 Resumen 33 Palabras y símbolos importantes 33 Problemas de repaso 34 Datos importantes: proyectos grupales 37 Vincular conceptos: redacción por proyectos 37 USO DE TECNOLOGÍA
2
38
Organización de datos PROBLEMA CENTRAL: Dígalo con figuras
42 43
2.1 Distribuciones de frecuencia, histogramas y temas relacionados 44 2.2 Gráficas de barras, gráficas circulares y gráficas de series de tiempo 61 2.3 Gráficas de tallo y hojas 71 Resumen 80 Palabras y símbolos importantes 80 Problemas de repaso 81 Datos importantes: proyectos grupales 85 Vincular conceptos: redacción por proyectos 86 USO DE TECNOLOGÍA
3
87
Promedios y variación PROBLEMA CENTRAL: Agua: río Yellowstone
90 91
3.1 Medidas de tendencia central: moda, mediana y media 3.2 Medidas de variación 104 3.3 Percentiles y gráficas de caja y bigotes 123 Resumen 134 Palabras y símbolos importantes 134 Problemas de repaso 135 Datos importantes: proyectos grupales 138 Vincular conceptos: redacción por proyectos 139 USO DE TECNOLOGÍA
92
141
Problemas de repaso acumulados: capítulos 1–3
142
v Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
vi
6/14
Contenido
4
Correlación y regresión
144
PROBLEMA CENTRAL: Cambio demográfico y tasa de delincuencia
145
4.1 Diagramas de dispersión y correlación lineal 146 4.2 Regresión lineal y coeficiente de determinación 164 Resumen 184 Palabras y símbolos importantes 184 Problemas de repaso 185 Datos importantes: proyectos grupales 187 Vincular conceptos: redacción por proyectos 188 USO DE TECNOLOGÍA
5
189
Teoría elemental de probabilidad
192
PROBLEMA CENTRAL: ¿Con qué frecuencia los detectores de mentiras mienten?
5.1 ¿Qué es la probabilidad? 194 5.2 Algunas reglas de probabilidad: eventos compuestos 5.3 Árboles y técnicas de conteo 224 Resumen 236 Palabras y símbolos importantes 236 Problemas de repaso 237 Datos importantes: proyectos grupales 240 Vincular conceptos: redacción por proyectos 241 USO DE TECNOLOGÍA
6
205
242
Distribución de probabilidad binomial y temas relacionados
244
PROBLEMA CENTRAL: Tipos de preferencia de personalidad: ¿introvertido o extrovertido?
245
6.1 Introducción a las variables aleatorias y distribuciones de probabilidad 6.2 Probabilidades binomiales 258 6.3 Propiedades adicionales de la distribución binomial 273 Resumen 284 Palabras y símbolos importantes 284 Problemas de repaso 285 Datos importantes: proyectos grupales 287 Vincular conceptos: redacción por proyectos 289
246
USO DE TECNOLOGÍA
291
Problemas de repaso acumulados: capítulos 4–6
7
193
292
Curvas normales y distribución muestral PROBLEMA CENTRAL: Compras impulsivas
PARTE I: Distribución normal
295
296
7.1 Gráficas de distribuciones de probabilidad normal 296 7.2 Puntajes estandarizados y áreas bajo la distribución normal estándar 7.3 Áreas bajo cualquier curva normal 316 PARTE II: Distribuciones muestrales y la aproximación normal a la distribución binomial 330
7.4 Distribuciones muestrales
294
330
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
305
Contenido
6/14
7.5 Teorema central del límite 336 7.6 Aproximación normal a la distribución binomial y a la distribución p̂ Resumen 358 Palabras y símbolos importantes 359 Problemas de repaso 359 Datos importantes: proyectos grupales 362 Vincular conceptos: redacción por proyectos 363 USO DE TECNOLOGÍA
8
vii
347
365
Estimación
370
PROBLEMA CENTRAL: ¡Dulce o travesura!
371
8.1 Estimación de cuando se conoce 372 8.2 Estimación de cuando es desconocida 385 8.3 Estimación de p en la distribución binomial 399 Resumen 412 Palabras y símbolos importantes 412 Problemas de repaso 413 Datos importantes: proyectos grupales 415 Vincular conceptos: redacción por proyectos 417 USO DE TECNOLOGÍA
9
419
Pruebas de hipótesis
422
PROBLEMA CENTRAL: Ley de Benford: la importancia de ser el número 1
423
9.1 Introducción a las pruebas estadísticas 424 9.2 Prueba de la media 440 9.3 Prueba de una proporción p 456 Resumen 468 Determinar el valor P correspondiente a un estadístico muestral de prueba Palabras y símbolos importantes 469 Problemas de repaso 469 Datos importantes: proyectos grupales 472 Vincular conceptos: redacción por proyectos 472 USO DE TECNOLOGÍA
474
Problemas de repaso acumulados: capítulos 7–9
10
476
Inferencias sobre diferencias PROBLEMA CENTRAL: El problema con los patos joyuyos
480 481
10.1 Pruebas que implican diferencias pareadas (muestras dependientes) 10.2 Inferencias sobre la diferencia de dos medias 1 2 2 495 10.3 Inferencias sobre la diferencia de dos proporciones p1 p2 516 Resumen 528 Palabras y símbolos importantes 528 Problemas de repaso 529 Datos importantes: proyectos grupales 532 Vincular conceptos: redacción por proyectos 533 USO DE TECNOLOGÍA
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
468
534
14.06.2019
482
viii
6/14
Contenido
11
Temas adicionales usando inferencia
536
PROBLEMA CENTRAL: Arqueología en el Bandelier National Monument
PARTE I: Inferencias utilizando la distribución ji-cuadrada
537
538
11.1 Ji-cuadrada: pruebas de independencia y de homogeneidad 11.2 Ji-cuadrada: bondad de ajuste 553 11.3 Prueba de una sola varianza o desviación estándar 563 PARTE II: Inferencias relacionadas con la regresión lineal
539
571
11.4 Inferencias para la correlación y la regresión 572 Resumen 591 Palabras y símbolos importantes 591 Problemas de repaso 592 Datos importantes: proyectos grupales 594 Vincular conceptos: redacción por proyectos 595 USO DE TECNOLOGÍA
597
Problemas de repaso acumulados: capítulos 10-11
598
Apéndice: Tablas
A1
Tabla 1: Números aleatorios A1 Tabla 2: Distribución de probabilidad binomial Cn,r prqn2r A3 Tabla 3: Áreas de una distribución normal estándar A8 Tabla 4: Valores críticos de la distribución t de Student A10 Tabla 5: Distribución 2 A11 Respuestas y pasos importantes clave a problemas con numeración impar Respuestas a problemas seleccionados con numeración par Índice
I1
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
A45
A13
6/14
Pensamiento crítico Los estudiantes necesitan desarrollar un pensamiento crítico para comprender y evaluar las limitaciones de los métodos estadísticos. Estadística básica permite que los estudiantes estén al tanto de la pertinencia de los métodos, las suposiciones, los sesgos y las conclusiones justificadas.
PENSAMIENTO CRÍTICO
◀ Pensamiento crítico VALORES INUSUALES
El teorema de Chebyshev nos dice que no importa la apariencia de la distribución de datos, al menos 75% de los datos se encontrarán dentro de 2 desviaciones estándar de la media. Como veremos en el capítulo 7, cuando la distribución tiene forma de montículo y es simétrica, aproximadamente 95% de los datos están dentro de 2 desviaciones estándar de la media. Los valores de datos más allá de 2 desviaciones estándar de la media son menos comunes que los más cercanos a la media. De hecho, un indicador de que un valor de datos podría ser una diferencia es cuando está a más de 2.5 desviaciones estándar de la media (Fuente: Statistics, de G. Upton y I. Cook, Oxford University Press).
El Pensamiento crítico es una habilidad importante que los estudiantes deben desarrollar para evitar obtener conclusiones erróneas. Esta sección proporciona información adicional acerca de conceptos específicos para evitar la evaluación incorrecta de la información.
VALORES INUSUALES Para una distribución binomial es inusual que el número de éxitos r sea mayor que 1 2.5 , o menor que 2 2.5 .
Podemos utilizar este criterio para determinar si un número dado de éxitos de cada n ensayos en un experimento binomial es inusual. Por ejemplo, consideremos un experimento binomial con 20 ensayos para los cuales la probabilidad de éxito en un solo ensayo es p 5 0.70. El número esperado de éxitos es 5 14, con una desviación estándar de 2. Se consideraría inusual un número de éxitos superiores a 19 o inferiores a 9. Sin embargo, este número de éxitos es posible.
Interpretación ▶
Ya que deseamos conocer el número de desviaciones estándar de la media, queremos convertir 196 a puntajes estandarizados z.
SOLUCIÓN:
Las calculadoras y las computadoras se utilizan cada vez más para generar los resultados numéricos de un proceso estadístico. A pesar de ello, el estudiante necesita interpretar correctamente esos resultados en el contexto de una aplicación en particular. Esta sección enfatiza este importante paso que se incluye en los ejemplos, los ejercicios guiados y en los problemas.
z5
x2 5
2
52
Interpretación La cantidad de queso en la pizza seleccionada está a solo 2.21 desviaciones estándar debajo de la media. El hecho de que z es negativa indica que la cantidad de queso está a 2.21 desviaciones estándar debajo de la media. La pizzería no perderá su franquicia basada en esta muestra.
6. Interpretación Una serie de presentaciones en el campus incluyen grupos de música, de baile y comedia stand-up. El comité encargado de seleccionar los grupos que actuarán incluye tres estudiantes elegidos al azar de un grupo de voluntarios. Este año, los 30 voluntarios provienen de una variedad de especializaciones. Sin embargo, los tres estudiantes para el comité eran los mejores en música. ¿Esto indica que no hubo sesgo en el proceso de selección y que dicho proceso no fue aleatorio? Explique. 7. Pensamiento crítico Greg tomó una muestra aleatoria de tamaño 100 de la población de boletos de la temporada actual para los juegos de baloncesto varonil de la universidad estatal. Luego tomó una muestra aleatoria de tamaño 100 de la población de boletos de temporada actual para los juegos de baloncesto femenil de la misma universidad. (a) ¿Qué técnica de muestreo (estratificada, sistemática, por conglomerados, multietápica, conveniencia, aleatoria) utilizó Greg para muestrear la población de boletos de la temporada actual para todos los partidos de baloncesto varonil y femenil de la universidad estatal? (b) ¿Es apropiado agrupar las muestras y afirmar que tiene una muestra aleatoria de tamaño 200 de la población de boletos de la temporada actual para todos los juegos de baloncesto varonil y femenil para la universidad? Explique.
◀ Ejercicios de pensamiento crítico e interpretación Los problemas de Pensamiento crítico, que se incluyen en cada sección y al final de cada capítulo, proporcionan a los estudiantes la oportunidad de probar su comprensión de la aplicación de los métodos estadísticos, así como su interpretación de los resultados. Los problemas de interpretación permiten que los estudiantes apliquen resultados estadísticos en aplicaciones concretas.
ix Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Alfabetización estadística En ningún lenguaje, incluyendo el de la estadística, se puede hablar sin aprender el vocabulario. Estadística básica introduce términos estadísticos con considerado cuidado.
◀ ¿Qué nos dice (concepto, método, resultado estadístico)?
¿Qué nos dice el nivel de medición? El nivel de medición nos indica qué procesos aritméticos son apropiados para los datos. Esto es importante porque diferentes procesos estadísticos requieren varios tipos de aritmética. En algunos casos, todo lo que tenemos que hacer es contar el número de datos que cumplen los criterios especificados. En dichos casos, los niveles de datos nominales (y superiores) son apropiados. En otros casos necesitamos ordenar los datos, por lo que los datos nominales no serían adecuados. Muchos otros procesos estadísticos requieren división, por lo que los datos deben estar en el nivel de razón. Siempre tenga en cuenta la naturaleza de los datos antes de comenzar los cálculos estadísticos.
Características importantes de un (concepto, método o resultado) ▶
Características importantes de una muestra aleatoria simple
En estadística se utilizan muchos tipos de gráficas, muestras, datos y métodos analíticos. Las características de cada herramienta nos ayudan a seleccionar las más apropiadas y a interpretar la información que recibimos de las aplicaciones de las herramientas.
SECCIÓN 7.1 PROBLEMAS
Esta sección proporciona un breve resumen de la información que obtenemos de cada concepto, método o resultado estadístico.
Para una muestra aleatoria simple ● Cada muestra de tamaño dado n de la población tiene la misma probabilidad de ser seleccionada. ● No existe riesgo de sesgo al momento de seleccionar a los sujetos de una muestra. ● Una muestra aleatoria no siempre puede reflejar la diversidad de la población. Por ejemplo, de una población de 10 gatos y 10 perros, una muestra aleatoria de tamaño 6 podría consistir solo en gatos.
1. Alfabetización estadística ¿Cuál(es), si hubiese, de las curvas de la figura 7-7 parece(n) una curva normal? Si una curva no es una curva normal, diga por qué. 2. Alfabetización estadística Vea la curva normal de la figura 7-8, y encuentre , m 1 , y
FIGURA 7-7
FIGURA 7-8
◀ Alfabetización estadística y nuevos problemas de terminología En todas las secciones y problemas de los capítulos, los problemas de Alfabetización estadística prueban la comprensión del estudiante acerca de terminología, métodos estadísticos y condiciones adecuadas para el uso de los diferentes procesos. Los NUEVOS problemas de Terminología de cada capítulo incluyen preguntas de opción múltiple, así como de falso y verdadero relacionadas con la terminología.
8. Terminología Considere el siguiente enunciado: si usted contestó correctamente 90% de las preguntas en una prueba, entonces su puntuación está en el percentil 90. ¿El enunciado es verdadero o falso? Explique. 9. Alfabetización estadística (a) ¿Qué medida de variación indica la dispersión alrededor de la media? (b) ¿Qué representación gráfica muestra la mediana y los datos dispersos alrededor de la mediana?
Cuadros de definición ▶ Siempre que se introducen términos importantes en el texto, aparecen los cuadros de definición dentro de los análisis. Estos cuadros sirven como referencia de fácil acceso para revisar los términos a medida que se utilizan.
Gráficas de caja y bigotes Los cuartiles junto con los valores de datos bajos y altos nos dan un resumen de cinco números muy útil de los datos y su dispersión. RESUMEN DE CINCO NÚMEROS Valor más bajo, Q1, mediana, Q3, valor más alto Utilizaremos estos cinco números para crear un bosquejo gráfico de los datos llamados gráfica de caja y bigotes. Las gráficas de caja y bigotes proporcionan otra técnica útil del análisis de datos exploratorios (EDA, Exploratoy Data Analysis) para describir los datos.
x Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
◀ Palabras y símbolos importantes SECCIÓN 5.1 Probabilidad de un evento A, P(A) 194 Intuición 194 Frecuencia relativa 194 Resultados igualmente probables 194 Ley de los grandes números 196 Experimento estadístico 196 Evento 196 Evento simple 196 Espacio muestral 196 Complemento del evento Ac 198 SECCIÓN 5.2 Eventos independientes 206 Eventos dependientes 206 Probabilidad de evento A y B 206 Probabilidad condicional 206
Vincular conceptos: redacción por proyectos ▶
P(A | B) 206 Reglas de multiplicación de probabilidad 206 Más de dos eventos independientes 211 Probabilidad del evento A o B 211 Eventos mutuamente excluyentes 213 Reglas de adición (para eventos mutuamente excluyentes y generales) 213 Más de dos eventos mutuamente excluyentes 215 Tabla de contingencia 215 Reglas básicas de probabilidad 218
Las Palabras y símbolos importantes que se listan en los repasos de los capítulos, resumen los términos presentados en los cuadros de definición para que el estudiante los repase con rapidez. Para una fácil localización, se proporcionan los números de página de la primera aparición de cada término.
SECCIÓN 5.3 Regla de multiplicación del conteo 225 Diagrama de árbol 225 Notación factorial 229 Regla de permutaciones 229 Regla de combinaciones 231
VINCULAR CONCEPTOS: Discuta cada uno de los siguientes temas en clase o revise los temas por su cuenta. REDACCIÓN POR PROYECTOS Luego escriba un ensayo breve, pero completo, en el que resuma los puntos principales. Por favor incluya fórmulas y gráficas cuando sea apropiado. 1. ¿Qué significa decir que utilizaremos una muestra para obtener una inferencia sobre una población? ¿Por qué una muestra aleatoria es tan importante para este proceso? Si queríamos una muestra aleatoria de estudiantes en la cafetería, ¿por qué no podríamos simplemente elegir los estudiantes que piden Pepsi de dieta con su almuerzo? Comente sobre el enunciado “Una muestra aleatoria es como una población en miniatura, mientras que las muestras que no son aleatorias es probable que sean parciales”. ¿Por qué los estudiantes que piden Pepsi de dieta con el almuerzo no son una muestra aleatoria de los estudiantes en la cafetería? 2. Con sus palabras explique las diferencias entre las siguientes muestras técnicas: muestra aleatoria simple, muestra estratificada, muestra sistemática, muestra por conglomerados, muestra multietápica y muestra por conveniencia. Describa situaciones en la que cada tipo podría ser útil.
Gran parte de la Alfabetización estadística es la capacidad para comunicar conceptos de manera efectiva. En el apartado Vincular conceptos: redacción por proyectos, que se presenta al final de cada capítulo, se prueba tanto la alfabetización estadística como el pensamiento crítico al pedir al estudiante que exprese con palabras lo que ha entendido.
5. Cálculo básico: Teorema del límite central Supongamos que x tiene una distribución con una media de 8 y una desviación estándar de 16. Se sacan muestras aleatorias de tamaño n 5 64. (a) Describa la distribución x y calcule la media y desviación estándar de la distribución. (b) Encuentre el valor z correspondiente a x 5 9. (c) Encuentre P(x . 9). (d) Interpretación ¿Sería inusual que una muestra aleatoria de tamaño 64 de la distribución x tenga una media muestral superior a 9? Explique.
Amplíe su conocimiento ▶
30.
Los problemas del apartado Amplíe su conocimiento presentan información adicional que profundiza más en los temas que se abordan en cada sección. El vocabulario y los conceptos necesarios para resolver problemas se incluyen en el punto de uso, ampliando la alfabetización estadística de los estudiantes.
◀ Problemas de cálculo básico Estos problemas enfocan la atención de los estudiantes en las fórmulas relevantes, los requisitos y los procedimientos de cálculo. Después de practicar estas habilidades, los estudiantes se sienten más confiados conforme se aproximan a las aplicaciones del mundo real.
Amplíe su conocimiento: media geométrica Cuando los datos consisten en el porcentaje de edades, razones, tasas de crecimiento compuestas u otras razones de cambio, la media geométrica es una medida útil de tendencia central. Para valores de datos n, n Media geométrica 5 Ï Producto de n valores de datos , suponiendo que todos los valores de datos son positivos
Para encontrar el factor de crecimiento promedio de más de 5 años de una inversión en un fondo mutuo con tasas de crecimiento de 10% el primer año, 12% el segundo año, 14.8% el tercer año, 3.8% el cuarto año y 6% el quinto año, tome la media geométrica de 1.10, 1.12, 1.148, 1.038 y 1.06. Encuentre el factor de crecimiento promedio de esta inversión.
xi Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Dirección y propósito El conocimiento real se proporciona por medio de la dirección, no solo de los hechos. Estadística básica permite que los estudiantes conozcan los temas que se abordan y su relevancia ya que, en cada paso a lo largo del camino, hay alfabetización estadística.
Preguntas previas ▶
PARTE I ¿Cuáles son algunas de las características de una distribución normal? ¿Qué le dice la regla empírica acerca de los datos dispersos alrededor de la media? ¿Cómo se puede utilizar esta información en el control de calidad? (SECCIÓN 7.1) ¿Puede comparar manzanas y naranjas, o tal vez elefantes y mariposas? En la mayoría de los casos, la respuesta es no, a menos que primero se estandaricen las mediciones. ¿Qué es una distribución normal estándar y un puntaje z estandarizado? (SECCIÓN 7.2) ¿Cómo se convierte cualquier distribución normal en una distribución normal estándar? ¿Cómo encuentra probabilidades de “eventos estandarizados”? (SECCIÓN 7.3)
Pressmaster/Shutterstock.com
Curvas normales y distribución muestral
Las Preguntas previas que abren cada capítulo, proporcionan al estudiante un adelanto del tipo de preguntas que podrán responder al comprender la información que está por presentarse.
PROBLEMA CENTRAL
Ley de Benford: la importancia de ser el número 1
BRENDAN SMIALOWSKI/AFP/Getty Images
La ley de Benford establece que, en una gran variedad de circunstancias, los números tienen “1”, como su primer dígito distinto de cero en una frecuencia desproporcionada. Esta ley se aplica a asuntos tan diversos como las áreas de drenaje de ríos; propiedades de los productos químicos; habitantes de pueblos; cifras en periódicos, revistas e informes gubernamentales, ¡y la vida media de los átomos radiactivos! En específico, ese tipo de medidas comienzan con “1” en aproximadamente 30% de las veces, con “2” alrededor de 18%, y con “3”, cerca de 12.5%. Los dígitos más grandes se presentan con menos frecuencia. Por ejemplo, menos de 5% de los números en estas circunstancias empieza con el dígito 9. Esto contrasta drásticamente con el muestreo aleatorio, en el que cada uno de los dígitos del 1 al 9 tiene la misma posibilidad de aparecer. Los primeros dígitos distintos de cero de números tomados de grandes cuerpos de registros numéricos como declaraciones de impuestos, estudios de población, registros gubernamentales, etc., muestran las probabilidades de ocurrencia que se presentan en la tabla de la página siguiente. Hace más de 100 años, el astrónomo Simon Newcomb observó que las tablas logarítmicas de los libros estaban mucho más sucias al principio de estas. Parecía que la gente buscaba con más frecuencia números con un primer dígito bajo. Esto fue considerado como un fenómeno y una curiosidad extraños. El fenómeno fue redescubierto
▲ Problemas centrales En cada capítulo, después de las preguntas previas, se incluye un Problema central que sirve como un ejemplo más específico de las preguntas que el estudiante pronto será capaz de responder. Los problemas centrales se presentan con las aplicaciones apropiadas y se incorporan a los ejercicios de fin de sección, lo que da a los estudiantes la oportunidad de probar su comprensión.
8.
Problema central: ley de Benford Nuevamente, suponga que usted es auditor de una corporación muy grande. El archivo de ingresos contiene millones de números en un gran banco de datos de computadora (vea el problema 7). Tome un muestreo aleatorio de n = 228 cantidades de este archivo, y r = 92 que tienen un primer dígito distinto de cero de 1. Sea p la proporción de población de todas las cantidades en el archivo de computadora que tienen un dígito inicial de 1. i. Pruebe la afirmación de que p es mayor que 0.301. Use 5 0.01. ii. Si de hecho p es más grande que 0.301, parecería que hay demasiados números en el archivo que empiezan con 1. ¿Esto podría indicar que los libros se han “alterado” reduciendo artificialmente las cantidades en el archivo? Comente desde el punto de vista del Servicio de Impuestos Internos de Estados Unidos (IRS). Comente desde la perspectiva del Buró Federal de Investigaciones en busca del “robo de beneficios” por parte de empleados sin escrúpulos. iii. Comente la siguiente afirmación: “Si rechazamos la hipótesis nula al nivel de significancia , no hemos probado que H0 sea falsa. Podemos decir que la probabilidad es de que cometimos un error al rechazar H0”. Con base en el resultado de la prueba, ¿recomendaría investigación adicional antes de acusar a la compañía de fraude?
xii Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Puntos centrales ▶ Medidas de tendencia central: moda, mediana y media
SECCIÓN 3.1
Cada sección comienza con una lista de los Puntos centrales que describen los objetivos de aprendizaje principales de la sección.
PUNTOS CENTRALES ● Calcular la media, la mediana y la moda de los datos brutos. ● Interpretar lo que le indican la media, la mediana y la moda. ● Explicar cómo la media, la mediana y la moda pueden verse afectados por valores de datos extremos. ● ¿Qué es una media truncada? ¿Cómo se calcula? ● Calcular un promedio ponderado. El precio promedio de un gramo de oro es de 43 dólares estadounidenses (USD). El auto Zippy promedia 17 kilómetros por litro en carretera. Una encuesta mostró que el tamaño promedio de los zapatos para las mujeres es la talla 42. En cada uno de los enunciados anteriores se utiliza un número para describir toda la muestra o población. Este número es una medida de tendencia central y hay muchas maneras de calcularlas, pero estudiaremos solo tres de los principales. El promedio más fácil de calcular es la moda. La moda de un conjunto de datos es el valor que ocurre con mayor frecuencia. Nota: Si un conjunto de datos no tiene un valor único que ocurre con mayor frecuencia que cualquier otro, entonces ese conjunto de datos no tiene moda.
EJEMPLO 1
Moda Cuente las letras en cada palabra de esta oración y proporcione la moda. El número de letras en las palabras de la oración es 5
3
7
2
4
4
2
4
8
3
4
3
4
◀ Un avance
UN AVANCE En los últimos capítulos utilizaremos la información basada en una muestra y en un estadístico de muestra para calcular parámetros poblacionales (capítulo 8) o tomar decisiones sobre el valor de los parámetros poblacionales (capítulos 9 y 10).
Este recuadro indica a los estudiantes dónde se usará el material presentado más adelante. Esto motiva a los estudiantes a prestar un poco más de atención a temas clave.
REPASO DEL CAPÍTULO En este capítulo, usted vio que la estadística es el estudio de cómo recolectar, organizar, analizar e interpretar la información numérica de las poblaciones o muestras. En este capítulo se estudiaron algunas de las características de los datos y las formas de recolectar datos. En particular, en el capítulo se analizaron: ● Sujetos de un estudio y las variables asociadas a ellos. ● Clasificación de datos cualitativos o cuantitativos, y niveles de medición de datos. ● Muestra y datos poblacionales. Las mediciones resumidas de los datos de la muestra se denominan esta-
●
●
●
presentadas en este libro se basan en las muestras aleatorias simples. Métodos de obtención de datos: censo, simulación, estudios observacionales, experimentos y encuestas. Preocupaciones: cobertura inadecuada de una población, falta de respuesta, sesgo en los datos de las encuestas y otros factores, efectos de las variables de confusión u ocultas en otras variables, generalización de los resultados del estudio más allá de la población del estudio y el patrocinio del estudio. Las prácticas éticas en estadística son esenciales ya
▲ Resúmenes El Resumen de cada sección se presenta como parte del Repaso del capítulo como una lista con viñetas, para que los estudiantes puedan revisar de un vistazo lo que necesitan saber.
xiii Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Ética y habilidades del mundo real La estadística no se hace en el vacío. Estadística básica proporciona a los estudiantes habilidades valiosas para el mundo real con consideraciones éticas, instrucción tecnológica, aplicaciones genuinas, datos reales y proyectos grupales.
Discusión de la ética en estadística ▶
LA PRÁCTICA ÉTICA EN ESTADÍSTICAS REQUIERE
Hay muchas consideraciones éticas esenciales en la práctica del muestreo y la investigación basada en estadística. La American Statistical Association de los Estados Unidos ha publicado directrices éticas que se analizan en este libro de texto.
> Notas técnicas
• •
Suposiciones transparentes y abiertamente declaradas sobre la recopilación de datos y métodos estadísticos utilizados. Avance del conocimiento útil mientras se evita el daño a otros, especialmente de temas bajo estudio.
◀ Notas técnicas ¡REVISADAS!
Gráfica de caja y bigotes
Las Notas técnicas que aparecen a lo largo del libro proporcionan a los estudiantes sugerencias útiles para el uso de las calculadoras TI-84Plus y TI-nspire (TI-84Plus con teclado) y TI-83 Plus, Microsoft Excel 2013, Minitab, y Minitab Express para resolver problemas. Se incluyen capturas de pantalla para ayudar a los estudiantes a visualizar y comprender mejor la solución.
Tanto Minitab como las calculadoras TI-84Plus/TI-83Plus/TI-nspire soportan gráficas de caja y bigotes. En las TI-84Plus/TI-83Plus/TI-nspire, los cuartiles Q1 y Q3 se calculan como los calculamos en este libro. En Minitab y Excel 2013 se calculan utilizando un proceso ligeramente diferente. TI-84Plus/TI-83Plus/TI-nspire (TI-84Plus con teclado) Presione STATPLOT ➤On. Resalte el cuadro de gráfica. Utilice Trace y las teclas de flecha para mostrar los valores del resumen de cinco números. La pantalla muestra la gráfica de las calorías en las barras de helado.
Med = 221.5
Excel 2013. No produce gráficas de caja y bigotes. Sin embargo, se puede encontrar cada
valor del resumen de cinco números. En la cinta Inicio, haga clic Insertar función fx. En el cuadro de diálogo, seleccione Estadística como la categoría y desplácese a Cuartil. En el cuadro de diálogo, introduzca la ubicación de datos y, a continuación, introduzca el número del valor que desea. Por ejemplo, introduzca 1 en el cuadro cuartil del primer cuartil. Presione Graph ➤ Boxplot. En el cuadro de diálogo, configure Data View a IQRange Box.
Minitab
MinitabExpress Presione Graph
Uso de tecnología ¡REVISADA! ▶ Al final de cada capítulo, en la sección Uso de tecnología, se incluyen instrucciones tecnológicas adicionales. Se presentan problemas con datos reales de disciplinas diversas que se pueden resolver usando calculadoras TI-84Plus y TI-nspire (TI-84Plus con teclado numérico ) y TI-83Plus, Microsoft Excel 2013, Minitab y Minitab Express.
➤ Boxplot ➤ simple.
> USO DE TECNOLOGÍA 2.
Distribuciones binomiales Aunque las tablas de probabilidades binomiales se pueden encontrar en la mayoría de las bibliotecas, a menudo estas tablas son inadecuadas. O bien el valor de p (la probabilidad de éxito en un ensayo) que está buscando no está en la tabla, o el valor de n (el número de ensayos) que busca es demasiado grande para la tabla. En el capítulo 7 estudiaremos la aproximación normal al binomio. Esta aproximación es de gran ayuda en muchas aplicaciones prácticas. Aun así, a veces usamos la fórmula para la distribución de probabilidad binomial en una computadora o calculadora graficadora para calcular la probabilidad que queramos.
Los siguientes porcentajes se obtuvieron durante muchos años de observación por parte de la oficina meteorológica de los Estados Unidos. Todos los datos mencionados son para el mes de diciembre.
Ubicación
Usted puede encontrar que, usando probabilidades acumuladas y la sustracción apropiada de probabilidades, en lugar de adición de probabilidades, hará la búsqueda de las soluciones a las aplicaciones 3 a 7 más fáciles. 3. 4. 5. 6.
Aplicaciones
Media a largo plazo % de días despejados en diciembre
Juneau, Alaska
18%
Seattle, Washington
24%
Hilo, Hawái
36%
Para cada ubicación, ¿cuál es el valor esperado de la distribución de probabilidades? ¿Cuál es la desviación estándar?
7.
Estime la probabilidad de que Juneau tendrá como máximo 7 días despejados en diciembre. Calcule la probabilidad de que Seattle tendrá entre 5 y 10 días despejados (incluyendo 5 y 10) en diciembre. Calcule la probabilidad de que Hilo tendrá al menos 12 días despejados en diciembre. Calcule la probabilidad de que Phoenix tendrá 20 o más días despejados en diciembre. Calcule la probabilidad que Las Vegas tendrá de 20 a 25 (incluyendo 20 y 25) días despejados en diciembre.
Sugerencias tecnológicas TI-84Plus/TI-83Plus/TI-nspire (TI-84 Plus con teclado), Excel 2013, Minitab/MinitabExpress La nota técnica de la sección 6.2 proporciona instrucciones específicas para las funciones de distribución binomial en las calculadoras TI-84Plus/TI-83Plus/TI-nspire (TI-84Plus
xiv Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
EJEMPLO 11
Teorema central del límite Una cierta cepa de bacterias está presente en toda la leche cruda. Sea x el conteo de bacterias por mililitro de leche. El departamento de salud ha encontrado que si la leche no está contaminada, entonces x tiene una distribución que es más o menos en forma de montículo y simétrico. La media de la distribución x es m 5 2 500, y la desviación estándar es 5 300. En una lechería comercial grande, el inspector de salud toma 42 muestras aleatorias de la leche producida cada día. Al final del día, el conteo de bacterias en cada una de las 42 muestras es promediado para obtener el conteo de bacterias promedio por la muestra x. (a) Suponiendo que la leche no esté contaminada, ¿cuál es la distribución de x? SOLUCIÓN: El tamaño de la muestra es n 5 42. Puesto que este valor excede 30, se aplica el teorema central del límite y sabemos que x será aproximadamente normal, con media y desviación estándar
La mayoría de los ejercicios que se presentan en cada sección son problemas de aplicación.
◀ Aplicaciones ¡ACTUALIZADAS! Desde el principio se utilizan aplicaciones del mundo real para presentar cada proceso estadístico. En lugar de solo hacer cuentas, los estudiantes llegan a apreciar el valor de la estadística a través de ejemplos relevantes.
▶ 8.
Ganadería: ganado Usted es el capataz del rancho de ganado Bar-S en Colorado. Un rancho vecino tiene terneras a la venta y usted va a comprar algunos para añadir a la manada de Bar-S. ¿Cuánto debe pesar una ternera sana? Sea x la edad de la ternera (en semanas), y sea y su peso (en kilogramos). La siguiente información se basa en datos tomados del The Merck Veterinary Manual (una referencia utilizada por muchos ganaderos). x
1
3
10
16
26
36
y
42
50
75
100
150
200
Complete los incisos del (a) al (e), dado Sx 5 92, Sy 5 617, Sx2 5 2 338, Sy2 5 82 389, Sxy 5 13 642 y r 0.998. (f) Las terneras que quiere comprar tienen 12 semanas de edad. ¿Qué predice la recta de mínimos cuadrados para un peso saludable?
DATOS IMPORTANTES: Divídanse en grupos pequeños y discutan los siguientes temas. Organice un breve PROYECTOS GRUPALES ensayo en el que resuma los puntos principales de su discusión de grupo. 1. Examine la figura 2-20, “Todos están de acuerdo con que: las personas descuidadas son los peores compañeros de cuarto”. Esta es una gráfica de barras agrupadas ya que se dan dos porcentajes para cada categoría de respuesta: respuestas de los hombres y respuestas de las mujeres. Comente acerca de cómo la interpretación artística ha cambiado ligeramente el formato de una gráfica de barras. ¿Las barras parecen tener longitudes que reflejan con precisión los porcentajes relativos de las respuestas? En su opinión, ¿la interpretación artística mejora o confunde la información? Explique. ¿Qué característica de “peores compañeros de cuarto” parece ilustrar la gráfica? ¿Se puede considerar esta gráfica como un diagrama de Pareto para los hombres? ¿Y para las mujeres? ¿Por qué sí o por qué no? A partir de la información dada en la figura, ¿cree usted que la encuesta enlista las cuatro características molestas dadas? ¿Cree que un encuestado podría elegir más de una característica? Explique su respuesta en términos de los porcentajes dados y en términos de la explicación dada en la gráfica. ¿Podría esta información presentarse en una gráfica circular para hombres y otra para mujeres? Explique.
◀ Datos importantes: proyectos grupales Al participar en Proyectos grupales, los estudiantes obtienen experiencia al discutir un tema, analizar datos y colaborar en la formulación de su respuesta a las preguntas planteadas en el ejercicio.
FIGURA 2-20
Fuente: Advantage Business Research para Mattel Compatibility
xv Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Gran salto Es posible comprender el contenido de manera más rápida. Estadística básica proporciona el empuje que necesitan los estudiantes mediante la guía y el ejemplo.
◀ Procedimientos y requisitos
PROCEDIMIENTO Cómo encontrar un intervalo de confianza c para cuando se conoce
Los cuadros de presentación del Procedimiento resumen sencillas estrategias paso a paso para llevar a cabo procedimientos y métodos estadísticos a medida que se presentan. También se especifican los requisitos para el uso de los procedimientos. Los estudiantes pueden consultar de nuevo estos cuadros mientras practican la aplicación de los procedimientos.
Requisitos Sea x una variable aleatoria apropiada para su aplicación. Obtenga un muestreo aleatorio simple (de tamaño n) de valores x a partir de los cuales se calcula la media muestral x. El valor de ya se conoce (tal vez de un estudio anterior). Si puede suponer que x tiene una distribución normal, entonces cualquier tamaño de muestra n va a funcionar. Si no puede suponer esto, entonces utilice un tamaño de muestra de n $ 30. Procedimiento 1. En el contexto de la aplicación, enuncie las hipótesis nula y alternativa y defina el nivel de significancia . 2. Utilice conocida, el tamaño de muestra n, el valor de x de la muestra, y de la hipótesis nula para calcular el estadístico muestral estandarizado de la prueba. z5
x2
EJERCICIO GUIADO 10
Probabilidad con respecto a x
En un país montañoso, las carreteras principales a veces utilizan túneles en vez de caminos largos, sinuosos sobre pasos altos. Sin embargo, muchos vehículos en un túnel al mismo tiempo pueden causar una situación peligrosa. Los ingenieros de tráfico están estudiando un largo túnel en Colorado. Si x representa el tiempo para que un vehículo pase por el túnel, se sabe que la distribuUtilice la distribución normal estándar y eluna tipo dem prueba, de una cola estándar o ción x tiene media 5 12.1 minutos y desviación 5 3.8 minutos en condiciones normales de tráfico. A partir de un histograma de los valores deal x, se encontró que lade distribución x tiene forma de montículo con cierta simetría sobre la media. de dos colas, para encontrar el valor P correspondiente estadístico
Ïn
3.
prueba. Los ingenieros han calculado que, en promedio, los vehículos deben pasar de 11 a 13 minutos en el túnel. Si el tiempo es inferior minutos, el tráfico se mueve rápido para 4. Finalice la prueba. Si el valor P ≤ a ,11entonces, rechace Hdemasiado . Si el valor P un viaje seguro en el túnel. Si el tiempo es más de 13 minutos, hay un 0 > , entonces, no rechace a H0. problema de mala calidad del aire (demasiado monóxido de carbono y otros contaminantes). En condiciones ordinarias, en un momento hay alrededor de 50 vehículos en el túnel. ¿Cuál es la probabilidad de que el tiempo 5. Interprete su conclusión en el contexto de la aplicación. medio para 50 vehículos en el túnel será de 11 a 13 minutos? Responderemos a esta pregunta en pasos. (a) Sea x que represente la media muestral basada en muestras de tamaño 50. Describa la distribución x.
Del teorema central del límite, esperamos que la distribución x sea aproximadamente normal, con desviación media y estándar x 5 5 < x 5 5 Ïn Ï
(b) Encuentre P(11 , x , 13).
Convertimos el intervalo
Ejercicios guiados ▶ Los estudiantes obtienen experiencia con nuevos procedimientos y métodos mediante los Ejercicios guiados. Junto a cada problema de los ejercicios guiados se presenta una solución como refuerzo inmediato.
Jupiterimages/Stockbyte/Getty Images
11 , x , 13 a un intervalo z estándar y utilizamos la tabla estándar de probabilidad normal para encontrar nuestra respuesta. Ya que z5
x2 /Ïn
<
x2
x 5 11 convierta a z < y x 5 13 convierte a z <
2
52
2
5
Por lo tanto, P
(c) Interprete su respuesta al inciso (b).
5P2 5 5
,z, 2
Parece que alrededor de 93% de las veces, no debe haber peligro de seguridad para el flujo de tráfico promedio.
xvi Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
,x,
14.06.2019
6/14
Prefacio ¡Bienvenido al apasionante mundo de la estadística! Hemos escrito este libro para hacer que la estadística sea accesible para todos, incluyendo aquellos con antecedentes matemáticos limitados. La estadística afecta todos los aspectos de nuestras vidas. Ya sea que probemos nuevos dispositivos médicos o determinemos qué nos va a entretener, las aplicaciones de estadística son tan numerosas que, en cierto sentido, estamos limitados solo por nuestra propia imaginación en el descubrimiento de nuevos usos para la estadística.
Visión general Esta edición de Estadística básica enfatiza los conceptos de estadística. Los métodos estadísticos se presentan cuidadosamente con el objetivo de comprender tanto la pertinencia del método, como el significado del resultado. Los métodos estadísticos y las mediciones se desarrollan en el contexto de las aplicaciones. El pensamiento crítico y la interpretación son esenciales para entender y evaluar la información. La alfabetización estadística es fundamental para aplicar y comprender los resultados estadísticos. En esta edición hemos ampliado y destacado el tratamiento de la alfabetización estadística, el pensamiento crítico y la interpretación. Hemos conservado y ampliado los elementos que hicieron las primeras siete ediciones en inglés muy amenas. Los cuadros de definición resaltan los términos importantes. La presentación de los procedimientos muestra el resumen de los pasos para analizar datos. Los ejemplos, ejercicios y problemas aluden a aplicaciones apropiadas para una amplia gama de intereses.
Recursos adicionales Esta obra cuenta con recursos adicionales en línea; consulte a su representante local de Cengage para conocer los términos y condiciones.
Cambios importantes Con cada nueva edición, los autores reevalúan el alcance, la pertinencia y la efectividad de la presentación del texto y reflexionan sobre la extensa realimentación del usuario. A lo largo del libro se han realizado revisiones para aclarar las explicaciones de conceptos importantes y para actualizar los problemas.
Presentación de temas actuales Se presentan breves debates acerca de la ética en estadística (sección 1.3) y el uso apropiado de los valores P (sección 9.3), de acuerdo con lo recomendado por la American Statistical Association. También se incluye una breve presentación sobre ciencia de datos y grandes datos (Uso de tecnología, capítulo 2).
Nuevos problemas con terminología Estos se incluyen en los problemas del capítulo. Son principalmente de opción múltiple o verdadero/falso, destacan las principales características de los términos o conceptos.
xvii Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
xviii
6/14
Prefacio
Flexibilidad adicional al dividir los capítulos más largos en partes El capítulo acerca de curvas normales y distribuciones muestrales (capítulo 7) ha sido dividido en dos partes, lo que permite hacer una pausa, revisar y resumir el contenido. Cada parte tiene una breve introducción, un resumen y una lista de problemas del capítulo aplicables a la parte. Los mismos elementos se agregaron al último capítulo, que incluye aplicaciones de la distribución ji-cuadrada en la parte I e inferencias para la regresión lineal en la parte II.
Ejemplos revisados y nuevos problemas de sección Cuando fue necesario, los ejemplos, ejercicios guiados y conjuntos de problemas fueron actualizados y revisados.
Actualizaciones tecnológicas incluyendo Minitab Express En las Notas técnicas y Uso de la tecnología se incluyen instrucciones para Excel 2013, Minitab 17 y el nuevo Minitab Express.
Contenido continuo Pensamiento crítico, interpretación y alfabetización estadística Este texto continúa y amplía el énfasis en el pensamiento crítico, interpretación y alfabetización estadística. Las calculadoras y las computadoras son adecuadas para proporcionar resultados numéricos de los procesos estadísticos. Sin embargo, los números que presenta una computadora o calculadora no tienen sentido a menos que el usuario sepa interpretar los resultados y si el proceso estadístico es apropiado. Este libro ayuda a los estudiantes a determinar si un método o proceso estadístico es apropiado. Ayuda a los estudiantes a entender lo que mide la estadística así como a interpretar los resultados de un intervalo de confianza, una prueba de hipótesis o un modelo de regresión lineal.
Introducción de pruebas de hipótesis utilizando valores P En consonancia con el uso de la tecnología informática y la práctica estándar en la investigación, se introduce la prueba de hipótesis utilizando valores P. El método de la región crítica aún se sigue, pero no se le da el énfasis principal.
Uso de la distribución t de Student en intervalos de confianza y pruebas de medios Si la distribución normal se utiliza en intervalos de confianza y pruebas de medias, entonces se debe conocer la desviación estándar poblacional. Si no se conoce, entonces, en las condiciones descritas en el texto, se utiliza la distribución t de Student. Este es el procedimiento que más se utiliza en la investigación estadística. También se utiliza en software estadístico como JMP, Microsoft Excel 2013, Minitab, Minitab Express, SPSS y calculadoras TI-84Plus/TI-83Plus/TI-nspire.
Intervalos de confianza y pruebas de hipótesis de diferencia de medias Si se utiliza la distribución normal, entonces se deben conocer ambas desviaciones estándar poblacionales. Cuando este no es el caso, la distribución t de Student Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Prefacio
6/14
xix
incorpora una aproximación para t, con una opción conservadora comúnmente usada para los grados de libertad. También se analiza cómo usar la aproximación de Satterthwaite para los grados de libertad en software de computadora. La desviación estándar agrupada se presenta para las aplicaciones adecuadas ( 1 < 2).
Características Entradas de capítulos y secciones ● ●
●
Preguntas previas al principio de cada capítulo son clave en las secciones. Problemas centrales al inicio de cada capítulo muestran los tipos de preguntas que los estudiantes podrán responder una vez que dominen los conceptos y habilidades presentadas. Puntos centrales al principio de cada sección describen los principales objetivos de aprendizaje.
Pedagogía cuidadosamente desarrollada ● ●
● ●
●
●
●
● ●
●
●
●
●
●
●
Ejemplos que muestran cómo seleccionar y usar los procedimientos apropiados. Ejercicios guiados dentro de las secciones permiten trabajar con un nuevo concepto. Las soluciones completamente resueltas se presentan al lado de cada ejercicio para dar refuerzo inmediato. Cuadros de definición resaltan las definiciones importantes a lo largo del texto. Presentaciones de procedimiento resumen las estrategias clave para llevar a cabo procedimientos y métodos estadísticos. También se indican las condiciones necesarias para el uso del procedimiento. ¿Qué nos dice un concepto, método o resultado? resume la información que obtenemos de los conceptos y los procesos estadísticos mencionados y da perspectiva para aplicaciones adicionales. Características importantes de un concepto, método o resultado sintetiza las características del tema listado. ¡NUEVO! Se analizan las recomendaciones de la Statistical Association of America acerca de la importancia de la ética en la estadística y el uso adecuado de los valores P. Un avance ofrece una vista previa de cómo se utiliza un tema actual más adelante. Las etiquetas para cada ejemplo o ejercicio guiado resaltan la técnica, el concepto o el proceso ilustrado en el ejemplo o en el ejercicio guiado. Además, las etiquetas para los problemas de sección y de capítulo describen el campo de aplicación y muestran la amplia variedad de temas en el que se utiliza la estadística. Los problemas de sección y de capítulo requieren la aplicación de los conceptos presentados en la sección o capítulo. Los conjuntos de problemas incluyen una variedad de aplicaciones del mundo real con datos o situaciones de fuentes identificables. Los pasos clave y las soluciones a los problemas con números impares aparecen al final del libro. Los problemas de cálculo básico permiten la práctica por medio de fórmulas y métodos estadísticos en conjuntos de datos muy pequeños. Esta práctica ayuda a los estudiantes a entender qué mide una estadística. Los problemas de alfabetización estadística se enfocan en la terminología y procesos adecuados de los métodos estadísticos apropiados. Estos problemas se presentan en todas las secciones y capítulos del conjunto de problemas. Los problemas de interpretación implican la explicación del significado de los resultados estadísticos en el contexto de la aplicación. Los problemas de pensamiento crítico requieren el análisis y debate de diversos temas que surgen de la aplicación de métodos estadísticos y de la interpretación de los resultados. Estos problemas se presentan en todas las secciones y capítulos del conjunto de problemas. Los problemas de amplíe sus conocimientos presentan temas de enriquecimiento como gráficas de puntos, datos agrupados, cálculo de la desviación estándar de una gama de
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
xx
6/14
Prefacio
●
●
●
●
●
valores de datos, gráficas residuales, relación entre los intervalos de confianza y las pruebas de hipótesis de dos colas y más. ¡NUEVO! Los problemas de terminología al final de cada capítulo presenta preguntas del tipo verdadero/falso o de opción múltiple con respecto a las características o los términos o conceptos importantes. Los Problemas de repaso acumulados se presentan después de cada tercer capítulo e incluyen temas importantes de capítulos anteriores. Las respuestas a estos problemas se presentan al final del libro. Los Datos importantes y los Conceptos vinculados introducen proyectos de grupo y proyectos de redacción. Los Puntos de vista son breves ensayos que presentan diversas situaciones en las que se utiliza la estadística. Diseño y fotos atractivos que mejoran la legibilidad.
Problemas de Amplíe su conocimiento y descripción rápida de temas con aplicaciones adicionales Los problemas de Amplíe su conocimiento ¡hacen justamente eso! Estos son opcionales, pero tienen información muy útil tomada de la extensa literatura de la estadística. Estos temas no se abordan en el texto principal, pero se aprenden fácilmente utilizando material de la sección o de secciones anteriores. Aunque son temas opcionales, los autores consideran que agregan profundidad y enriquecen la experiencia de aprendizaje de un estudiante. Cada tema fue elegido por su presentación relativamente sencilla y sus aplicaciones útiles. Todos estos problemas y sus aplicaciones están marcados con un logotipo de un sol. Estos problemas agregan temas que forman parte de algunos cursos de colocación avanzados. Estos temas incluyen problemas de transformación logarítmica con aplicaciones de crecimiento exponencial y ley de potencia, funciones lineales de variables aleatorias e intervalos de confianza para la pendiente de la recta de mínimos-cuadrados. También son nuevos los problemas que implican el muestreo estratificado y el mejor cálculo para la media poblacional . Los temas que se presentan en los problemas de Amplíe su conocimiento o de descripción rápida incluyen gráficas de puntos, gráficas de dona, variaciones y valores atípicos en las gráficas de tallo y hojas; medias armónicas y geométricas; promedios móviles; cálculo de las probabilidades en favor y en contra; distribución uniforme continua, estimación rápida de la desviación estándar usando la regla empírica; cuatro intervalos de confianza adicionales para proporciones; aproximación de Satterthwaite para grados de libertad en intervalos de confianza y pruebas de hipótesis; relación entre intervalos de confianza y pruebas de hipótesis de dos colas; procedimientos de dos muestras agrupadas para intervalos de confianza y pruebas de hipótesis; remuestreo (también conocido como bootstrap); simulaciones de intervalos de confianza y pruebas de hipótesis utilizando diferentes muestras del mismo tamaño, y correlación serial (también llamada autocorrelación). Para localizar estos temas opcionales en el texto, consulte el índice del libro.
Tecnología ●
●
Las Notas técnicas dentro de las secciones proporcionan instrucciones breves acerca del uso de las calculadoras TI-84Plus, TI-83Plus y TI-nspire (TI- 84Plus con teclado), Microsoft Excel 2013, Minitab y Minitab Express. La sección Uso de tecnología muestra cómo utilizar SPSS, así como las calculadoras TI-84Plus, TI-83Plus y TI-nspire (TI-84Plus con teclado), Microsoft Excel 2013, Minitab 17 y Minitab Express.
Sistema operativo más reciente para las calculadoras TI-84Plus/TI-83Plus También se comenta sobre el último sistema operativo (v2.55 MP) para las calculadoras TI-84Plus/TI-83Plus, con nuevas funciones como la distribución inversa t y la Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Prefacio
6/14
xxi
prueba de bondad de ajuste ji-cuadrada descrita. Una característica conveniente del sistema operativo es que proporciona avisos en pantalla para las entradas requeridas para muchas probabilidades y funciones estadísticas. Este sistema operativo ya se encuentra en las nuevas calculadoras TI-84Plus/TI-83Plus y está disponible para su descarga en las calculadoras más antiguas del sitio web de Texas Instruments.
Rutas alternativas del texto Estadística básica está diseñada como una obra flexible que ofrece al profesor una opción entre las diferentes posibilidades de enseñanza. En la mayoría de los cursos de un semestre, no es práctico abordar todo el material en profundidad. Sin embargo, dependiendo del énfasis del curso, el profesor puede optar por cubrir varios temas. Para obtener ayuda en la selección de temas, consulte la tabla de prerrequisitos que se presenta justo antes del capítulo 1. • Regresión lineal. Puede posponerse el estudio del capítulo 4, Correlación y regresión, hasta después del capítulo 9. Los temas descriptivos de regresión lineal pueden ser seguidos inmediatamente por los temas inferenciales de regresión lineal presentados en el capítulo 11. • Probabilidad. Para los cursos que requieren conocimientos mínimos de probabilidad, será suficiente abordar la sección 5.1 y la primera parte de la sección 5.2.
Agradecimientos Es un placer para nosotros agradecer a los revisores de este libro. Todos sus puntos de vista y comentarios han sido muy valiosos para nosotros. Los revisores de este libro son: Bill Burgin, Gaston College Robert Faux, Pennsylvania State University Sharon Giles, Grossmont College Tammy Hoyle, Gardner-Webb University Dale Joyner, Caldwell Community College & Technical Institute Kewal Krishan, Hudson County Community College Theodore Lai, Hudson County Community College Marilyn Milovich, Missouri Valley College Stacy Reagan, Caldwell Community College Cynthia Roemer, Union County College Risharra Stulc, Colorado Mesa University Jason Willis, Gardner-Webb También nos gustaría reconocer a los revisores de las ediciones anteriores en inglés: Reza Abbasian, Texas Lutheran University Paul Ache, Kutztown University Kathleen Almy, Rock Valley College Polly Amstutz, University of Nebraska en Kearney Delores Anderson, Truett-McConnell College Robert J. Astalos, Feather River College Lynda L. Ballou, Kansas State University Kimberly Benien, Wharton County Junior College Mary Benson, Pensacola Junior College Larry Bemett, Benedictine University Kiran Bhutani, The Catholic University of America Abraham Biggs, Broward Commuity College Melissa Bingham, University of Wisconsin-La Crosse Kristy E. Bland, Valdosta State University John Bray, Broward Community College Bill Burgin, Gaston College Toni Carroll, Siena Heights University Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
xxii
6/14
Prefacio
Chand Chauhan, Indiana University-Purdue University-Fort Wayne Pinyuen Chen, Syracuse University Emmanuel des-Bordes, James A. Rhodes State College Jennifer M. Dollar, Grand Rapids Community College Larry E. Dunham, Wor-Wic Community College Andrew Ellett, Indiana University Ruby Evans, Keiser University Mary Fine, Moberly Area Community College Rebecca Fouguette, Santa Rosa Junior College Rene Garcia, Miami-Dade Community College Larry Green, Lake Tahoe Community College Shari Harris, John Wood Community College Janice Hector, De Anza College Tammy Hoyle, Gardner-Webb University Jane Keller, Metropolitan Community College Raja Khoury, Collin County Community College Diane Koenig, Rock Valley College Charles G. Laws, Cleveland State Community College Michael R. Lloyd, Henderson State University Beth Long, Pellissippi State Technical y Community College Lewis Lum, University of Portland Darcy P. Mays, Virginia Commonwealth University Charles C. Okeke, College of Southern Nevada, Las Vegas Peg Pankowski, Community College of Allegheny County Ram Polepeddi, Westwood College, Denver North Campus Azar Raiszadeh, Chattanooga State Technical Community College David Read, Paradise Valley Community College Traei Reed, St. Johns River Community College Michael L. Russo, Suffolk County Community College Janel Schultz, Saint Mary’s University of Minnesota Sankara Sethuraman, Augusta State University Stephen Soltys, West Chester University of Pennsylvania Ron Spicer, Colorado Technical University Winson Taam, Oakland University Jennifer L. Taggart, Rockford College William Truman, University of North Carolina en Pembroke Diane Van Deusen, Napa Valley College Daniel Weiner, Boston University Bill White, University of South Carolina Upstate Jim Wienckowski, State University of New York en Buffalo Stephen M. Wilkerson, Susquehanna University Hongkai Zhang, East Central University Shunpu Zhang, University of Alaska, Fairbanks Cathy Zucco-Teveloff, Trinity College En especial, quisiéramos agradecer a Roger Lipsett por su cuidadosa revisión de la precisión de este libro. Además, agradecemos el excelente trabajo de los profesionales de editorial y de producción en Cengage Learning. En particular, agradecemos a Catherine Van Der Laan, Spencer Arritt, Gabriela Carrascal y Andrea Wagner. Sin su perspicacia creativa y atención al detalle, un proyecto de esta calidad y magnitud no sería posible. Por último, reconocemos la cooperación de Minitab, Inc., SPSS, Texas Instruments y Microsoft. Charles Henry Brase Corrinne Pellillo Brase Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Tabla de material de prerrequisitos Capítulo
Secciones de prerrequisitos
1 Empecemos
Ninguno
2 Organización de datos
1.1, 1.2
3 Promedios y variación
1.1, 1.2, 2.1
4 Correlación y regresión
1.1, 1.2, 3.1, 3.2
5 Teoría elemental de probabilidad
1.1, 1.2, 2.1
6 Distribución de probabilidad binomial y temas relacionados
1.1, 1.2, 2.1, 3.1, 3.2, 5.1, 5.2 5.3 útil pero no esencial
7 Curvas normales y distribución muestral (omitir 7.6) (incluir 7.6)
1.1, 1.2, 2.1, 3.1, 3.2, 5.1, 5.2, 6.1 también 6.2, 6.3
8 Estimación (omitir 8.3) (incluir 8.3)
1.1, 1.2, 2.1, 3.1, 3.2, 5.1, 5.2, 6.1, 7.1, 7.2, 7.3, 7.4, 7.5 también 6.2, 6.3, 7.6
9 Pruebas de hipótesis (omitir 9.3) (incluir 9.3)
1.1, 1.2, 2.1, 3.1, 3.2, 5.1, 5.2, 6.1, 7.1, 7.2, 7.3, 7.4, 7.5 también 6.2, 6.3, 7.6
10 Inferencias sobre diferencias (omitir 10.3)
1.1, 1.2, 2.1, 3.1, 3.2, 5.1, 5.2, 6.1, 7.1, 7.2, 7.3, 7.4, 7.5, 8.1, 8.2, 9.1, 9.2 también 6.2, 6.3, 7.6, 9.3
(incluir 10.3) 11 Temas adicionales usando inferencia. PARTE I: Aplicaciones ji cuadrada: 11.1, 11.2, 11.3 (PARTE II: Inferencias para regresión lineal: 11.4)
1.1, 1.2, 2.1, 3.1, 3.2, 5.1, 5.2, 6.1, 7.1, 7.2, 7.3, 7.4, 7.5, 9.1 Capítulo 4, 8.1, 8.2, 9.1, 9.2 también
1 Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
1
1.1 ¿Qué es la estadística? 1.2 Muestreo aleatorio 1.3 Introducción a los diseños experimentales
Paul Spinelli/Major League Baseball/Getty Images
6/14
Bettmann/Historical/Corbis
Louis Pasteur (1822-1895) es el fundador de la bacteriología moderna. A la edad El azar favorece a la mente preparada. —LOUIS PASTEUR
Las técnicas estadísticas son herramientas del pensamiento... no sustitutos del pensamiento. —ABRAHAM KAPLAN
2
de 57 años, Pasteur estudiaba el cólera. Durante el verano, accidentalmente dejó sin supervisión un poco de un cultivo de bacilos en su laboratorio. En el otoño, inyectó animales de laboratorio con este bacilo. Para su sorpresa, los animales no murieron, de hecho, mejoraron y fueron resistentes al cólera. Cuando se examinaron los resultados finales, se dice que Pasteur permaneció en silencio durante un minuto y luego exclamó, como si hubiera visto una visión: ”¿No te das cuenta? ¡Han sido vacunados!”. La obra de Pasteur salvó en última instancia muchas vidas humanas. La mayoría de las decisiones importantes en la vida contiene información incompleta. Estas decisiones a menudo implican tantos factores complicados, al grado que un análisis completo no es práctico o incluso posible. A menudo nos vemos obligados a hacer conjeturas con base en información limitada. Como nos recuerda la primera cita, nuestras posibilidades de éxito mejoran mucho si tenemos una “mente preparada”. Los métodos estadísticos que aprenderá en este libro le ayudarán a tener una mente preparada para el estudio de muchos campos diferentes. La segunda cita nos recuerda que la estadística es una herramienta importante, pero no sustituye el conocimiento profundo del campo en el que se aplica. Los autores de este libro queremos que usted comprenda y disfrute de la estadística. El material de lectura le explicará sobre el tema y los ejemplos le mostrarán cómo funciona. Sin embargo, para comprender el tema, usted debe involucrarse. Los ejercicios guiados, las aplicaciones con calculadora y computadora, los problemas que se presentan a lo largo de la obra y los ejercicios de escritura están diseñados para involucrarlo en el tema. A medida que aumente su comprensión de la estadística, consideramos que disfrutará al aprender un tema que tiene un mundo lleno de aplicaciones interesantes. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Empecemos
iStock/Getty Images Plus/north-tail/Getty Images
¿Por qué es importante la estadística? (SECCIÓN 1.1) ¿Cuál es la naturaleza de los datos? (SECCIÓN 1.1) ¿Cómo se puede extraer una muestra aleatoria? (SECCIÓN 1.2) ¿Qué otras técnicas de muestreo existen? (SECCIÓN 1.2) ¿Cómo puede diseñar formas de recopilar datos? (SECCIÓN 1.3) ¿Por qué son importantes las consideraciones éticas? (SECCIÓN 1.3)
PROBLEMA CENTRAL
¿Dónde han ido todas las luciérnagas?
Cortesía de Corrinne y Charles Brase
Un artículo en el Wall Street Journal analiza la desaparición de las luciérnagas. En el artículo, la profesora Sara Lewis de la Universidad de Tufts y otros eruditos expresan su preocupación por la disminución de la población mundial de luciérnagas. Existen varias explicaciones posibles para la disminución, incluida la reducción del hábitat de los bosques, los humedales y los campos abiertos; pesticidas y la contaminación. La iluminación nocturna artificial podría interferir con el ritual de apareamiento de las luciérnagas, el cual es similar al código morse. Algunas compañías químicas pagan una recompensa por las luciérnagas debido a que estos insectos contienen dos productos químicos raros usados en la investigación médica y en los sistemas electrónicos de detección utilizados en las naves espaciales. ¿Qué tiene que ver todo esto con la estadística? A decir verdad, en la actualidad nadie sabe realmente (a) cuánto ha disminuido la población mundial de luciérnagas o (b) cómo explicar este hecho. La población de todas las luciérnagas es simplemente demasiado grande para estudiarla en su totalidad. En cualquier estudio de luciérnagas, debemos confiar en la información incompleta obtenida de las muestras. Además, de estas muestras debemos obtener conclusiones realistas que tengan integridad estadística. Este es el tipo de trabajo que utiliza métodos estadísticos para determinar cómo recolectar, analizar e investigar datos. Adaptado del logotipo de la Ohio State University. Suponga que realiza un estudio para comparar las poblaciones de luciérnagas expuestas a condiciones normales de luz diurna/oscuridad con poblaciones de luciérnagas expuestas a luz continua (24 horas al día). Ha instalado dos colonias de luciérnagas en un laboratorio. Las dos colonias son idénticas, excepto que una colonia está expuesta a condiciones normales de luz diurna/ oscuridad y la otra está expuesta a la luz continua. Cada colonia está poblada con Esta obra cuenta con recursos adicionales en línea; el mismo número de luciérnagas adultas. Después de 72 horas, usted cuenta el consulte a su representante local para conocer térnúmero de luciérnagas vivas en cada colonia. minos y condiciones. Al finalizar este capítulo, usted podrá responder las siguientes preguntas: (a) ¿Es esto un experimento o un estudio observacional? Explique. 3 (b) ¿Existe un grupo de control? ¿Hay un grupo de tratamiento? Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
4
6/14
Capítulo 1
Empecemos
(c) ¿Cuál es la variable en este estudio? (d) ¿Cuál es el nivel de medición (nominal, ordinal, intervalar o de razón) de la variable? (Vea el problema 11 de los problemas de repaso del capítulo 1).
SECCIÓN 1.1
¿Qué es la estadística? PUNTOS CENTRALES ● Identificar variables en un estudio estadístico. ● Distinguir entre variables cuantitativas y cualitativas. ● Identificar poblaciones y muestras. ● Distinguir entre parámetros y estadísticas. ● Determinar el nivel de medición. ● Comparar la estadística descriptiva y la inferencial.
Introducción La toma de decisiones es un aspecto importante de nuestras vidas; para decidir, nos basamos en la información que tenemos, nuestras actitudes y nuestros valores. Los métodos estadísticos nos ayudan a evaluar la información. Además, la estadística se puede utilizar para tomar decisiones en caso de incertidumbre. Por ejemplo, si deseamos estimar la proporción de personas que tendrán una reacción severa a una vacuna antiinfluenza, la estadística nos proporciona los métodos apropiados que nos permiten ver la información de una pequeña muestra de personas o artículos y hacer inferencias acerca de un mayor conjunto de estos. Los procedimientos para analizar datos, junto con las reglas de inferencia, son temas centrales en el estudio de la estadística. Estadística
Estadística es la disciplina de la recopilación, organización, análisis e interpretación de la información numérica de los datos. El tema de la estadística es multifacético. La siguiente definición de estadística se encuentra en la International Encyclopedia of Statistical Science, editada por Miodrag Lovric. El profesor David Hand del Imperial College London, presidente de la Royal Statistical Society, presenta la definición en su artículo “Statistics: An Overview”. La estadística es tanto la ciencia de la incertidumbre como de tecnología para extraer información de los datos. Los procedimientos estadísticos que aprenderá en este texto deben complementar su capacidad de realizar inferencias, es decir, los resultados de los procedimientos estadísticos y el sentido común deben encajar. Por supuesto, los métodos estadísticos no tienen el poder de hacer milagros. Estos métodos nos pueden ayudar a tomar algunas decisiones, pero no todas son posibles. Recuerde que, incluso un procedimiento estadístico debidamente aplicado no es más confiable que los datos, o los hechos, en los cuales se basa. Finalmente, los resultados estadísticos se deben interpretar por alguien que no solo entiende los métodos, sino también el tema de estudio. El prerrequisito general para la toma de decisiones estadísticas es la recopilación de datos. En primer lugar, necesitamos identificar los sujetos u objetos que se incluirán en el estudio o sus características. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Sección 1.1 ¿Qué es la estadística?
6/14
5
Sujetos son las personas u objetos incluidos en el estudio. Una variable es una característica del sujeto que se medirá o se observará.
Sujetos Variable
Por ejemplo, si queremos hacer un estudio sobre las personas que han escalado el monte Everest, entonces los sujetos en el estudio son todas las personas que han logrado llegar a la cima. Una variable puede ser la estatura de esas personas. Otras variables pueden ser edad, peso, sexo, nacionalidad, ingresos, etc. Independientemente de las variables que usemos, no se incluirán mediciones y observaciones de personas que no han subido a la montaña. Las variables en un estudio pueden ser de naturaleza cuantitativa o cualitativa. Una variable cuantitativa tiene un valor o medición numérica para la cual las operaciones, como la adición o el promedio, tienen sentido. Una variable cualitativa describe un sujeto al situar al mismo en una categoría o grupo, como hombre o mujer.
Variable cuantitativa Variable cualitativa
Para los escaladores del monte Everest, variables como estatura, peso, edad o ingresos son variables cuantitativas. Las variables cualitativas implican observaciones no numéricas como el género o la nacionalidad. A veces las variables cualitativas se denominan variables categóricas. Otra cuestión importante con respecto a los datos es su fuente. ¿Los datos contienen información de todos los sujetos de interés, o de solo de algunos? Datos poblacionales
En los datos poblacionales, los datos se obtienen de todos los sujetos de interés. En los datos muestrales, los datos provienen de algunos sujetos de interés.
Datos muestrales
Es importante saber si estos son datos poblacionales o muestrales. Los datos de una población específica son fijos y completos. Los datos de una muestra pueden variar de muestra a muestra y no están completos. Parámetro poblacional
Un parámetro poblacional es una medida numérica que describe un aspecto de una población. Un estadístico muestral es una medida numérica que describe un aspecto de una muestra.
Estadístico muestral
UN AVANCE En los últimos capítulos utilizaremos la información basada en una muestra y en un estadístico de la muestra para calcular parámetros poblacionales (capítulo 8) o tomar decisiones sobre el valor de los parámetros poblacionales (capítulos 9 y 10).
EJEMPLO 1
Por ejemplo, si tenemos los datos de todos los sujetos que han subido el monte Everest, entonces tenemos datos poblacionales. La proporción de varones en la población de todos los escaladores que han conquistado el monte Everest es un ejemplo de un parámetro. Por otro lado, si nuestros datos provienen solo de algunos de los escaladores, tenemos datos muestrales. La proporción de escaladores masculinos en la muestra es un ejemplo de una estadística. Observe que diferentes muestras pueden tener distintos valores para la proporción de escaladores masculinos. Una de las características importantes de los estadísticos muestrales es que pueden variar de muestra a muestra, mientras que los parámetros poblacionales se fijan para una población determinada.
Uso de terminología básica El Departamento de Agricultura Tropical de Hawái lleva a cabo un estudio acerca de piñas que están listas para cosechar en un campo experimental. (a) Las piñas son los objetos del estudio. Si los investigadores se interesan en el peso individual de cada piña en el campo, entonces, la variable es el peso. En este punto, es importante especificar las unidades de medida y los grados de Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6
Capítulo 1
Empecemos
exactitud de la medida. El peso se puede medir a la onza o redondearse al gramo más cercano. El peso es una variable cuantitativa porque es una medida numérica. Si el peso de todas las piñas listas para ser cosechadas en el campo se incluyen en los datos, entonces tenemos una población. El peso promedio de dichas piñas listas para cosechar es un parámetro. (b) Suponga que los investigadores también quieren datos sobre el sabor. Un panel de catadores clasifica las piñas según las categorías “pobre”, “aceptable” y “bueno”. Solo algunas piñas se incluyen en la prueba de sabor. En este caso, la variable es el sabor; esta es una variable cualitativa o categórica. Dado que solo algunas piñas se incluyen en el estudio, tenemos una muestra. La proporción de piñas en la muestra con una calificación de sabor “bueno” es un estadístico. Gallo Images/Landbouweekblad/Getty Images
6/14
EJERCICIO GUIADO 1
A lo largo de este texto, encontrará ejercicios guiados intercalados en el material de lectura. Estos ejercicios le permitirán trabajar inmediatamente con nuevas ideas. Las preguntas le guiarán a través del análisis apropiado. Cubra las respuestas en el lado derecho y, después de haber pensado o escrito su respuesta, revise las respuestas que se proporcionan en el libro. Si cada ejercicio se compone de varias partes, compruebe cada una antes de continuar. Usted debe ser capaz de responder a la mayoría de estas preguntas; no las omita ya que son importantes.
Uso de terminología básica
¿Qué importancia tiene la educación musical en la educación básica? The Harris Poll hizo un estudio en línea de 2 286 adultos (mayores de 18 años) en los Estados Unidos. Entre todas las preguntas se cuestionó a los encuestados si estaban de acuerdo o no con el enunciado". El aprendizaje y la educación musical proporcionan a la gente elementos para trabajar mejor en equipo en sus carreras”. En la encuesta más reciente, 71% de los participantes del estudio estuvieron de acuerdo con el enunciado. (a) Identificar a los sujetos del estudio y la variable.
Los sujetos son los 2 286 adultos que participaron en la encuesta en línea. La variable es la respuesta de acuerdo o en desacuerdo con el enunciado que indica que la educación musical proporciona a la gente elementos para trabajar mejor en equipo en sus carreras.
(b) ¿Los datos constituyen una muestra? Si es así, ¿cuál es la población a la que pertenecen?
Los datos constituyen una muestra de la población de respuestas de todos los adultos en los Estados Unidos.
(c) ¿La variable es cualitativa o cuantitativa?
Cualitativa; las categorías son las dos posibles respuestas: está “de acuerdo“ o “en desacuerdo“ con el enunciado de que la educación musical proporciona a la gente elementos para trabajar mejor en equipo en sus carreras.
(d) Identificar una variable cuantitativa de interés.
La edad o los ingresos podrían ser de interés.
(e) ¿La proporción de encuestados en la muestra que está de acuerdo con el enunciado sobre la educación musical y su efecto sobre las carreras es un estadístico o un parámetro?
Es un estadístico; la proporción se calcula a partir de los datos de la muestra.
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Sección 1.1 ¿Qué es la estadística?
6/14
7
Niveles de medición: nominal, ordinal, intervalo, razones Hemos categorizado los datos como cualitativos o cuantitativos. Otra forma de clasificar los datos es de acuerdo con uno de los cuatro niveles de medición, los cuales indican qué tipo de aritmética es apropiada para los datos, como ordenar, calcular diferencias u obtener razones. Niveles de medición
NIVELES DE MEDICIÓN
Nivel nominal
El nivel de medición nominal se aplica a los datos que constan de nombres, etiquetas o categorías. No existen criterios implícitos con los cuales los datos se pueden ordenar de menor a mayor.
Nivel ordinal
El nivel de medición ordinal se aplica a los datos que se pueden colocar en orden. Sin embargo, las diferencias entre los valores de los datos no pueden determinarse o carecen de sentido.
Nivel intervalar
El nivel de medición intervalar se aplica a los datos que se pueden ordenar. Además, las diferencias entre los valores de los datos tienen sentido.
Nivel de razón
El nivel de medición de razón se aplica a los datos que se pueden ordenar. Además, las diferencias entre los valores de los datos y las razones de los valores de los datos tienen sentido. Los datos en el nivel de razón tienen un cero absoluto.
iStockphoto.com/Korban Schwabi
Michelle Dulieu/Shutterstock.com
EJEMPLO 2
Niveles de medición Identificar el tipo de datos. (a) Taos, Acoma, Zuni y Cochiti son los nombres de cuatro pueblos nativos americanos de la población de nombres de todos los pueblos nativos americanos en Arizona y Nuevo México. SOLUCIÓN: Estos datos se encuentran en el nivel nominal. Observe que estos datos de valores son simplemente nombres. Al mirar solo el nombre, no podemos determinar si un nombre es “mayor o menor que” otro. Cualquier orden de los nombres numéricamente no tendría sentido. (b) En una clase de último curso de la escuela secundaria de 319 estudiantes, Jim clasificó en el lugar 25, June ocupó el 19, Walter ocupó el 10 y Julia ocupó el 4, donde 1 es el lugar más alto. SOLUCIÓN: Estos datos están en el nivel ordinal. Ordenar los datos claramente tiene sentido. Walter clasificó más alto que June; Jim ocupó el puesto más bajo, y Julia, el más alto. Sin embargo, las diferencias numéricas en las clasificaciones no tienen significado. La diferencia entre los lugares de June y Jim es 6, y esta es la misma diferencia que existe entre los lugares de Walter y Julia. Sin embargo, esta diferencia no es constante. Por ejemplo, si usted ve el promedio, Walter y Julia pudieron haber tenido una gran diferencia entre sus promedios, mientras que June y Jim pudieron haber tenido promedios más cercanos. En cualquier sistema de clasificación, solamente importa la situación relativa. Las diferencias calculadas entre los lugares no tienen sentido. (c) Temperatura corporal (en grados Celsius) de la trucha en el río Yellowstone. SOLUCIÓN: Estos datos están en el nivel intervalar. Ciertamente podemos ordenar los datos y calcular diferencias significativas. Sin embargo, para temperaturas en la escala Celsius, no hay un punto de partida absoluto. El valor 0 °C puede parecer un punto de partida, pero no indica la ausencia de calor. Además, no es correcto decir que 20 °C es el doble de caliente que 10 °C. (d) Tamaño de una trucha del río Yellowstone. SOLUCIÓN: Estos datos se encuentran en el nivel de razón. Una trucha de 45 cm es tres veces más larga que una trucha de 15 cm. Observe que podemos dividir 15 entre 45 para determinar una razón o proporción de sus tamaños. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
8
6/14
Capítulo 1
Empecemos
En resumen, hay cuatro niveles de medición. El nivel nominal se considera el más bajo, y en orden ascendente tenemos los niveles ordinal, intervalar y de razón. En general, los cálculos basados en un nivel de medición superior pueden no ser apropiados para uno inferior.
PROCEDIMIENTO Cómo determinar el nivel de medición
Los niveles de medición, enumerados del inferior al superior, son nominal, ordinal, intervalar y de razón. Para determinar el nivel de medición de datos establezca el nivel superior que puede justificarse para todo el conjunto de datos. Considere cuáles cálculos son adecuados para cada variable. Nivel de medición
Cálculo adecuado
Nominal
Podemos ordenar los datos en categorías.
Ordinal
Podemos ordenar los datos de menor a mayor o de “peor” a “mejor”. Cada valor de datos se puede comparar con otro valor de datos.
Intervalar
Podemos ordenar los datos y obtener las diferencias entre los valores de datos. En este nivel, tiene sentido comparar las diferencias entre los valores. Por ejemplo, podemos decir que un valor de datos es 5 más que o 12 menos que otro valor de datos.
Razón
Podemos ordenar los datos, calcular las diferencias, y también encontrar la razón entre los valores de datos. Por ejemplo, tiene sentido decir que un valor de datos es el doble de grande que otro.
¿Qué nos dice el nivel de medición? El nivel de medición nos indica qué procesos aritméticos son apropiados para los datos. Esto es importante porque diferentes procesos estadísticos requieren varios tipos de aritmética. En algunos casos, todo lo que tenemos que hacer es contar el número de datos que cumplen los criterios especificados. En dichos casos, los niveles de datos nominales (y superiores) son apropiados. En otros casos necesitamos ordenar los datos, por lo que los datos nominales no serían adecuados. Muchos otros procesos estadísticos requieren división, por lo que los datos deben estar en el nivel de razón. Siempre tenga en cuenta la naturaleza de los datos antes de comenzar los cálculos estadísticos.
EJERCICIO GUIADO 2
Niveles de medición
Los siguientes enunciados describen diferentes datos asociados con un senador del Estado. Para cada entrada de datos, indique el nivel de medición correspondiente. (a) El nombre del senador es Sam Wilson.
Nivel nominal.
(b) El senador tiene 58 años de edad.
Nivel de razón. Observe que la edad tiene un cero absoluto. Tiene sentido hacer divisiones en las edades. Por ejemplo, Sam tiene el doble de edad que alguien que tiene 29 años. Continúa Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Sección 1.1 ¿Qué es la estadística?
6/14
9
Ejercicio guiado 2 continuación
(c) Los años en que el senador fue elegido son 2000, 2006 y 2012.
Nivel intervalar. Las fechas pueden ser ordenadas y la diferencia entre fechas tiene significado. Por ejemplo, 2006 es 6 años más tarde que 2000. Sin embargo, las razones no tienen sentido. El año 2000 no es el doble de grande que el año 1000. Además, el año 0 no significa que “no existe el tiempo”.
(d) El ingreso gravable total del senador el año pasado fue de 878 314 dólares.
Nivel de razón. Tiene sentido decir que el ingreso del senador es 10 veces el de alguien que gana 87 831 dólares.
(e) El senador encuestó a sus electores con respecto a su proyecto de ley de protección del agua. Las opciones para la respuesta eran ayuda fuerte, ayuda neutral, en contra o fuertemente en contra.
Nivel ordinal. Las opciones pueden ser ordenadas, pero no hay diferencia numérica entre dos opciones.
(f) El estado civil del senador es “casado”.
Nivel nominal.
(g) Una revista importante de noticias afirma que el senador está clasificado en el séptimo lugar en su récord de votación en proyectos de ley con respecto a la educación pública.
Nivel ordinal. Las clasificaciones se pueden ordenar, pero las diferencias entre las clasificaciones pueden variar en significado.
PENSAMIENTO CRÍTICO
“¡Datos, datos, datos!” se lamentó impacientemente. “No puedo hacer ladrillos sin barro”. Sherlock Holmes dijo estas palabras en The Adventure of Cooper Beeches de Sir Arthur Conan Doyle.
Las conclusiones estadísticas confiables requieren datos de la misma naturaleza. Esta sección ha proporcionado parte del vocabulario utilizado para analizar los datos. Al leer un estudio estadístico o realizar uno, preste atención a la naturaleza de los datos y a las formas en que fueron recolectados. Cuando seleccione una variable a medir, asegúrese de especificar el proceso y los requisitos para la medición. Por ejemplo, si la variable es el peso de las piñas listas para cosechar, especifique la unidad de peso, la precisión de la medida y tal vez la escala particular que se utilizará. Si algunos pesos están en onzas y otros en gramos, los datos son bastante inútiles. Otro tema es si su instrumento de medición realmente mide la variable. Solo preguntar a la gente si sabe la ubicación geográfica de la isla Fiji no puede proporcionar resultados precisos. Las respuestas pueden reflejar el hecho de que los encuestados quieren que usted piense que están bien informados. Pedirle a la gente que localice Fiji en un mapa daría resultados más confiables. El nivel de medición también es un problema. Usted puede introducir números en una calculadora o computadora y hacer todo tipo de aritmética. Sin embargo, necesita juzgar si las operaciones tienen sentido. Para datos ordinales como la clasificación de restaurantes, no se puede concluir que un restaurante de 4 estrellas es “el doble de bueno” que un restaurante de 2 estrellas, aunque el número 4 es dos veces 2. Continúa Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
10
6/14
Capítulo 1
Empecemos
Pensamiento crítico continuación
¿Los datos son de una muestra o comprenden a toda la población? ¡Los datos de la muestra pueden variar de una muestra a otra! Esto significa que, si usted está estudiando el mismo estadístico a partir de dos muestras diferentes del mismo tamaño, los valores de los datos pueden ser diferentes. De hecho, la forma en que los estadísticos de la muestra varían entre diferentes muestras del mismo tamaño será el objetivo de nuestro estudio de la sección 7.4. INTERPRETACIÓN Cuando trabaje con datos de la muestra, se debe considerar cuidadosamente la población a partir de la cual se saca. Las observaciones y el análisis de la muestra son aplicables únicamente a la población de la que se obtiene la muestra.
La estadística descriptiva se refiere a los métodos para organizar, imaginar y resumir información de muestras o poblaciones. La estadística inferencial se refiere a los métodos para utilizar la información de una muestra para obtener conclusiones con respecto a la población.
Estadística descriptiva Estadística inferencial
UN AVANCE El propósito de recolectar y analizar datos es obtener información. Los métodos estadísticos nos proporcionan herramientas para obtener información a partir de los datos. Estos métodos se dividen en dos ramas.
Examinaremos los métodos de la estadística descriptiva en los capítulos 2, 3 y 4. Estos métodos se pueden aplicar a los datos de muestras o de poblaciones. A veces no tenemos acceso a toda una población. En otras ocasiones, las dificultades o los costos para trabajar con toda la población son prohibitivos. En estos casos, utilizaremos la estadística inferencial junto con la probabilidad. Estos son los temas de los capítulos 5 al 11.
PUNTO DE VISTA
El primer siglo medido
Durante el siglo XX se midieron algunos aspectos de la vida estadounidense que nunca antes habían sido estudiadas sistemáticamente. Las condiciones sociales que implicaban crimen, sexo, alimento, diversión, religión y trabajo fueron investigadas numéricamente. Las mediciones y las respuestas a la encuesta tomadas durante todo el siglo revelan tendencias estadísticas insospechadas. The First Measured Century es un libro de Caplow, Hicks y Wattenberg. También es un documental del servicio público de radiodifusión (PBS, Public Broadcasting Service) disponible en video. Para más información, visite el sitio web de PBS y encuentre el enlace al documental The First Measured Century.
SECCIÓN 1.1 PROBLEMAS
1.
Alfabetización estadística En un estudio estadístico, ¿cuál es la diferencia entre un sujeto y una variable?
2.
Alfabetización estadística ¿Los datos del nivel de medición nominal son cuantitativos o cualitativos?
3.
Alfabetización estadística ¿Cuál es la diferencia entre un parámetro y un estadístico?
4.
Alfabetización estadística Para una población, ¿cambian los parámetros? Si hay tres muestras diferentes del mismo tamaño de una población establecida, ¿es posible obtener tres valores diferentes para el mismo estadístico? Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Sección 1.1 ¿Qué es la estadística?
6/14
5.
11
Pensamiento crítico Con frecuencia se asignan números a datos que son de naturaleza categórica. (a) Considere estas etiquetas para artículos de categoría que describen formas electrónicas de expresar opiniones: 1 = Twitter; 2 = e-mail; 3 = mensaje de texto; 4 = Facebook; 5 = blog ¿Estas etiquetas se encuentran en el nivel de datos ordinal o superior? Explique. (b) Considere estas etiquetas para artículos de categoría que describen la utilidad del servicio al cliente: 1 = no útil; 2 = algo útil; 3 = muy útil; 4 = extremadamente útil ¿Estas etiquetas se encuentran en el nivel de datos ordinal? Explique. ¿Qué pasa en el nivel intervalar o superior? Explique.
6.
Interpretación Lucy llevó a cabo una encuesta pidiendo a algunos de sus amigos que especificaran su tipo favorito de entretenimiento televisivo de la siguiente lista de opciones: comedia; reality; documental; drama; caricatura; otro ¿Las observaciones de Lucy se aplican a todos los adultos? Explique. De la descripción del grupo de encuestas, ¿podemos obtener conclusiones sobre la edad, género o del nivel de educación de los participantes?
7.
Mercadotecnia: comida rápida En una encuesta se preguntó a 1 261 clientes adultos de comida rápida de los Estados Unidos qué comida (desayuno, almuerzo, cena, refrigerio) ordenaron. (a) Identifique la variable. (b) ¿La variable es cuantitativa o cualitativa? (c) ¿Cuál es la población implicada?
8.
Publicidad: kilometraje del auto ¿Cuál es el promedio de kilómetros por litro (km/L) para todos los vehículos pequeños híbridos nuevos? Utilizando Informes de consumo, una muestra aleatoria de estos vehículos dio un promedio de 15.2 km/L. (a) Identifique la variable. (b) ¿La variable es cuantitativa o cualitativa? (c) ¿Cuál es la población implicada?
9. Ecología: humedales Las agencias gubernamentales monitorean cuidadosamente la calidad del agua y su efecto en los humedales (Referencia: Environmental Protection Agency Wetland Report EPA 832-R-93-005). De particular preocupación es la concentración de nitrógeno en el agua que drena de las tierras fertilizadas. El exceso de nitrógeno puede matar peces y vida silvestre. Se tomaron aleatoriamente 28 muestras de agua de un lago y se determinó la concentración de nitrógeno (miligramos de nitrógeno por litro de agua) para cada muestra. (a) Identifique la variable. (b) ¿La variable es cuantitativa o cualitativa? (c) ¿Cuál es la población implicada? 10. Arqueología: Irlanda El yacimiento arqueológico de Tara tiene más de 4 000 años de antigüedad. La tradición dice que Tara era la sede de los Altos Reyes de Irlanda. Debido a su importancia arqueológica, Tara ha sido ampliamente estudiada (Referencia: Tara: An Archaelogical Survey de Conor Newman, Royal Irish Academy, Dublín). Suponga que un arqueólogo quiere calcular la densidad de artefactos ferromagnéticos en la región de Tara. Para este propósito, se utiliza una muestra aleatoria de 55 parcelas, cada una de 100 metros Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
12
6/14
Capítulo 1
Empecemos
cuadrados de superficie y se determina el número de artefactos ferromagnéticos para cada parcela. (a) Identifique la variable. (b) ¿La variable es cuantitativa o cualitativa? (c) ¿Cuál es la población implicada? 11. Vida estudiantil: niveles de medición Categorice estas mediciones asociadas con la vida estudiantil según el nivel: nominal, ordinal, intervalar o de razón. (a) Tiempo para completar un examen. (b) Duración de la primera clase. (c) Campo principal de estudio. (d) Escala de evaluación del curso: mala, aceptable, buena. (e) Puntuación en el último examen (con base en 100 puntos posibles). (f) Edad del estudiante. 12.
Negocios: niveles de medición Categorice estas mediciones asociadas con una compañía de robótica de acuerdo con el nivel: nominal, ordinal, intervalar o de razón. (a) Desempeño del vendedor: debajo del promedio, promedio, arriba del promedio. (b) Precio de las acciones de la compañía. (c) Nombres de los nuevos productos. (d) Temperatura (°C) en la oficina privada del director general. (e) Ingresos netos de cada uno de los últimos 5 años. (f) Color del empaque del producto.
13.
Pesca: niveles de medición Categorice estas mediciones asociadas con la pesca según nivel: nominal, ordinal, intervalar o de razón. (a) Especies de peces capturadas: perca, lubina, lucio, trucha. (b) Costo de la caña de pescar de carrete y varilla. (c) Hora de regreso a casa. (d) Guía de clasificación de pesca: pobre, razonable, buena. (e) Número de peces capturados. (f) Temperatura del agua.
14.
Educación: evaluación del profesorado Si se aplicaran métodos estadísticos para analizar las evaluaciones de los docentes, ¿qué forma de preguntas, A o B, sería mejor? Forma A: Con sus palabras, diga cómo se compara este profesor con otros que usted ha tenido. Forma B: Utilice la siguiente escala para clasificar a su profesor en comparación con otros que ha tenido. 1 El peor
15.
2 3 4 5 Debajo del Promedio Arriba El mejor promedio del promedio
Pensamiento crítico Usted está interesado en el peso de las mochilas que los estudiantes llevan a clase y decide realizar un estudio con base en las mochilas llevadas por 30 estudiantes. (a) Dé algunas instrucciones para pesar las mochilas. Incluya la unidad de medida, la exactitud de la medida y el tipo de escala. (b) ¿Cree usted que cada estudiante entrevistado le permitirá pesar su mochila? (c) ¿Cree que anunciar a los estudiantes con anticipación que usted va a pesar sus mochilas hará una diferencia en el peso? Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Sección 1.2 Muestreo aleatorio
6/14
SECCIÓN 1.2
13
Muestreo aleatorio Puntos centrales ● Explicar la importancia de las muestras aleatorias. ● Construir una muestra aleatoria simple usando números aleatorios. ● Simular un proceso aleatorio. ● Describir el muestreo estratificado, muestreo por conglomerados, muestreo sistemático, muestreo multietápico y muestreo por conveniencia.
Muestreo aleatorio simple ¡Coma cordero! ¡20 000 coyotes no pueden estar equivocados! Este eslogan se encuentra en ocasiones sobre calcomanías en las defensas de los autos en el oeste de los Estados Unidos. El eslogan indica el problema que los ganaderos han experimentado para proteger a sus rebaños de los depredadores. Con base en su experiencia con esta muestra de la población de coyotes, los ganaderos concluyeron que todos los coyotes son peligrosos para sus rebaños y ¡deben ser eliminados! Los ganaderos usaban un cebo venenoso especial para deshacerse de los coyotes. Este veneno no solo se distribuyó en el terreno del rancho, sino que con la cooperación del gobierno también se distribuyó ampliamente en terreno público. Los ganaderos encontraron que los resultados de la intoxicación generalizada no fueron muy beneficiosos. Los coyotes que comían ovejas continuaron aumentando mientras que la población general de coyotes y otros depredadores disminuyeron. ¿Cuál era el problema? Los coyotes que comían ovejas, que los ganaderos habían observado, no eran una muestra representativa de todos los coyotes. Sin embargo, los métodos modernos de control de depredadores se dirigen a los coyotes que comen ovejas. En cierta medida, los nuevos métodos se han venido acercando a través de un examen más detallado de las técnicas de muestreo utilizadas. En esta sección, examinaremos varias técnicas de muestreo ampliamente utilizadas. Una de las técnicas de muestreo más importantes es el muestreo aleatorio simple. Una muestra aleatoria simple de n mediciones de una población es un subconjunto de la población seleccionada de manera que cada muestra de tamaño n de la población tiene la misma posibilidad de ser seleccionada. En un muestreo aleatorio simple, no solo cada muestra de tamaño dado tiene la misma probabilidad de ser seleccionada, sino que cada sujeto de la población también tiene la misma posibilidad de ser seleccionado. Sin embargo, el hecho de que cada sujeto tenga la misma posibilidad de ser seleccionado no implica necesariamente una muestra aleatoria simple. Recuerde que para una muestra aleatoria simple, cada muestra de un tamaño dado debe tener también la misma posibilidad de ser seleccionada.
Características importantes de una muestra aleatoria simple Para una muestra aleatoria simple ● Cada muestra de tamaño dado n de la población tiene la misma probabilidad de ser seleccionada. ● No existe riesgo de sesgo al momento de seleccionar a los sujetos de una muestra. ● Una muestra aleatoria no siempre puede reflejar la diversidad de la población. Por ejemplo, de una población de 10 gatos y 10 perros, una muestra aleatoria de tamaño 6 podría consistir solo en gatos. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
14
6/14
Capítulo 1
Empecemos
Muestra aleatoria simple
EJERCICIO GUIADO 3
¿Es importante el espacio abierto alrededor de las áreas metropolitanas? Los jugadores de la lotería de Colorado podrían pensar así, ya que algunos de los ingresos del juego van a financiar espacio abierto y espacio de recreación al aire libre. Para jugar el juego se paga un dólar y se eligen seis números diferentes del grupo de números del 1 al 42. Si su grupo de seis números coincide con el grupo ganador de seis números seleccionados por muestreo aleatorio simple, entonces usted es un ganador de un gran premio de al menos 1.5 millones de dólares. (a) ¿Es más probable que se seleccione el número 25 en el grupo ganador de seis números que el número 5?
Sí. Porque los números ganadores constituyen una muestra aleatoria simple, cada número del 1 al 42 tiene igual posibilidad de ser seleccionado.
(b) ¿Podrían ser pares todos los números ganadores?
Sí, ya que seis números pares es uno de los grupos posibles de seis números.
(c) Su amiga siempre juega los números
Sí. En una muestra aleatoria simple, el grupo de seis números es tan probable como cualquiera de los 5 245 786 grupos posibles de seis números a seleccionar como el ganador. (Vea la sección 5.3 para aprender cómo calcular el número de grupos posibles de seis números que se pueden seleccionar a partir de los 42 números).
1
2
3
4
5
6
¿Podría ganar alguna vez?
¿Cómo conseguimos muestras aleatorias? Suponga que necesita saber si los sistemas de emisión del último envío de automóviles Toyota satisfacen estándares del control de contaminación. Usted quiere recolectar una muestra aleatoria de 30 vehículos de este cargamento de 500 autos y probarlos. Una manera de elegir una muestra aleatoria es numerar los autos del 1 al 500. Escribir estos números en las tarjetas, mezclar las tarjetas y luego sacar 30 números. La muestra consistirá en los autos con los números elegidos. Si mezcla las tarjetas suficientemente, este procedimiento produce una muestra aleatoria. Una forma más fácil de seleccionar los números es utilizar una tabla de números aleatorios. Usted puede hacer una; escriba los dígitos del 0 al 9 en tarjetas separadas y mézclelas en un sombrero. Luego saque una tarjeta, anote el dígito, regrese la tarjeta y mezcle las tarjetas de nuevo. Saque otra tarjeta, registre el dígito y así sucesivamente. La tabla 1 del apéndice es una tabla de números aleatorios (adaptada de Rand Corporation, A Million Random Digits with 100 000 Normal Deviates). Vamos a ver cómo elegir nuestra muestra aleatoria de 30 autos Toyota utilizando esta tabla de números aleatorios.
Tabla de números aleatorios
EJEMPLO 3
Tabla de números aleatorios Utilice una tabla de números aleatorios para elegir una muestra aleatoria de 30 vehículos de una población de 500 autos. De nuevo, asignamos a cada auto un número diferente entre 1 y 500. Luego usamos la tabla de números aleatorios para elegir la muestra. La tabla 1 del apéndice tiene 50 renglones y 10 bloques de cinco dígitos cada uno; puede ser considerada como una masa sólida de dígitos que se ha dividido en renglones y bloques para la conveniencia del usuario. Leemos los dígitos comenzando en cualquier lugar de la tabla. Dejamos caer un alfiler sobre la mesa, y la cabeza del alfiler cayó en el renglón 15, bloque 5. Empezaremos ahí y listaremos todos los dígitos de ese renglón. Si necesitamos más dígitos, nos movemos al renglón 16 y así sucesivamente. Los dígitos con los que empezamos son
Vibrant Image Studio/Shutterstock.com
SOLUCIÓN:
99 281
59 640
15 221
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
96 079 14.06.2019
09 961
05 371
15
Sección 1.2 Muestreo aleatorio
6/14
Puesto que el número más alto asignado a un auto es 500, y este número tiene tres dígitos, reagrupamos nuestros dígitos en bloques de 3: 992
815
964
015
221
960
790
996
105
371
Para construir nuestra muestra aleatoria, usamos los primeros 30 números de autos que encontramos en la tabla de números aleatorios cuando empezamos en el renglón 15, bloque 5. Omitimos los tres primeros grupos, 1 992, 815 y 964, ya que estos números son demasiado grandes. El grupo siguiente de tres dígitos es 015, que corresponde a 15. El auto número 15 es el primer auto incluido en nuestra muestra y el siguiente es el auto número 221. Nos saltamos los siguientes tres grupos y luego incluimos los números de auto 105 y 371. Para obtener el resto de los autos en la muestra continuamos al siguiente renglón y usamos la tabla de números aleatorios de la misma manera. Si nos encontramos con un número que hemos utilizado antes, lo omitimos.
COMENTARIO Cuando usamos el término muestra aleatoria (simple), tenemos criterios muy específicos en mente para seleccionar la muestra. Un método adecuado para seleccionar una muestra aleatoria simple es utilizar una computadora o una calculadora generadora de números aleatorios con base en una tabla de números aleatorios como lo hicimos en el ejemplo. El término aleatorio no debe confundirse con el azar.
PROCEDIMIENTO Cómo sacar una muestra aleatoria
1. Numere secuencialmente a todos los miembros de la población. 2. Use una tabla, calculadora o computadora para seleccionar números aleatorios de los números asignados a los miembros de la población. 3. Genere la muestra usando los miembros de la población con los números que corresponden a los seleccionados aleatoriamente. UN AVANCE Las muestras aleatorias simples son componentes clave en los métodos de estadística inferencial que estudiará en los capítulos 8-11. De hecho, para obtener conclusiones sobre una población, los métodos que estudiaremos requieren que tengamos muestras aleatorias simples de las poblaciones de interés.
Simulación
EJERCICIO GUIADO 4
Otro uso importante de las tablas de números aleatorios es la simulación. Usamos la palabra simulación para referirnos al proceso de proporcionar imitaciones numéricas de fenómenos “reales”. Los métodos de simulación han sido productivos en el estudio de diversos temas como reactores nucleares, formación de nubes, cardiología (y ciencia médica en general), diseño de carreteras, control de la producción, construcción naval, diseño de aeroplanos, juegos de guerra, economía y electrónica. Una lista completa probablemente incluiría algo de cada aspecto de la vida moderna. En el ejercicio guiado 4 realizaremos una simulación breve.
Una simulación es un imitación numérica o representación de un fenómeno del mundo real.
Simulación
Use una tabla de números aleatorios para simular los resultados al lanzar una moneda balanceada (es decir, sin truco) 10 veces. (a) ¿Cuántos resultados son posibles cuando lance una moneda una vez?
Dos; cara o cruz.
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
Continúa 14.06.2019
16
6/14
Capítulo 1
Empecemos
Ejercicio guiado 4 continuación
(b) Hay varias formas de asignar números a los dos resultados. Dado que suponemos una moneda sin truco, podemos asignar un dígito par al resultado “cara” y un dígito impar al resultado “cruz”. Entonces, comenzando en el bloque 3 del renglón 2 de la tabla 1 en el apéndice, enumere los primeros 10 dígitos.
7
(c) ¿Cuáles son los resultados asociados con los 10 dígitos?
Cr Cr Cr Ca Cr Ca Ca Ca Ca Cr
(d) Si usted comienza en un bloque y renglón diferentes de la tabla 1 en el apéndice, ¿obtendrá la misma secuencia de resultado?
Es posible, pero no muy probable. (En la sección 5.3 aprenderá cómo determinar que hay 1 024 secuencias posibles de resultados para 10 lanzamientos de una moneda).
> Notas técnicas Muestreo con reemplazo
1
5
4
9
4
4
8
4
3
La mayoría de los paquetes de software estadísticos, programas de hojas de cálculo y calculadoras estadísticas generan números aleatorios. En general, estos dispositivos hacen muestras con reemplazo. Muestreo con reemplazo significa que aunque se selecciona un número para la muestra, este no se elimina de la población. Por lo tanto, el mismo número puede ser seleccionado para la muestra más de una vez. Si necesita probar sin reemplazo, genere más elementos para la muestra que necesita. Luego ordene la muestra y elimine los valores duplicados. Procedimientos específicos para generar muestras aleatorias utilizando la calculadora TI-84Plus/TI-83Plus/ Tl-nspire (la TI-84Plus con teclado), Excel 2013, Minitab, Minitab Express y SPSS se muestran en “Uso de tecnología” al final de este capítulo. Más detalles se presentan por separado en las Guías tecnológicas para cada uno de estos dispositivos o software.
Otras técnicas de muestreo
Muestreo estratificado
Muestreo sistemático
Aunque supondremos que a lo largo de este libro se utilizaran muestras aleatorias (simples), también son muy usados otros métodos de muestreo. Existen técnicas estadísticas apropiadas para estos métodos de muestreo, pero están más allá del alcance de este libro. Uno de estos métodos de muestreo se llama muestreo estratificado. Los grupos o clases dentro de una población que comparten una característica común se llaman estratos. Por ejemplo, en la población de todos los estudiantes universitarios de licenciatura, algunos de los estratos pueden ser estudiantes de primero, segundo, tercer o cuarto año. Otros estratos podrían ser hombres o mujeres, estudiantes en instituciones públicas o privadas, etc. En el método de muestreo estratificado, la población se divide en al menos dos estratos distintos. Luego, de cada estrato, se extrae una muestra aleatoria (simple) de un determinado tamaño, y la información obtenida se ajusta cuidadosamente o se pondera en todos los cálculos resultantes. Los grupos o estratos suelen estar muestreados en proporción a sus porcentajes reales de ocurrencia en la población total. Sin embargo, otras formas (más sofisticadas) de determinar el tamaño óptimo de la muestra en cada estrato pueden dar mejores resultados. En general, el análisis estadístico y los ensayos basados en datos obtenidos de muestras estratificadas son algo diferente de las técnicas discutidas en un curso introductorio de estadística. Estos métodos de muestreo estratificado no se analizarán en este libro. Otro método popular de muestreo se llama muestreo sistemático. En este método, suponemos que los elementos de la población están dispuestos en algún orden secuencial natural. Luego seleccionamos un punto de inicio (aleatorio) y seleccionamos cada k-ésimo elemento para nuestra muestra. Por ejemplo, las personas que hacen fila para comprar boletos para conciertos de rock están “en orden”. Para generar una muestra sistemática de estas personas (y hacer preguntas sobre temas como la edad, los hábitos de fumar, el nivel de ingresos, etc.) podríamos incluir cada cinco personas en la fila. La persona “que comienza” se selecciona al azar de las primeras cinco. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Sección 1.2 Muestreo aleatorio
6/14
Muestreo por conglomerados
Muestreo multietápico
Muestreo por conveniencia
17
La ventaja de una muestra sistemática es que es fácil de conseguir. Sin embargo, hay peligros en el uso del muestreo sistemático. Cuando la población es de naturaleza repetitiva o cíclica, no se debe utilizar el muestreo sistemático. Por ejemplo, consideremos una tela con la que se produce un vestido. Supongamos que el telar que produce el material comete un error cada 6 metros, pero verificamos solo cada quinto metro con un escáner electrónico automatizado. En este caso, un punto de partida aleatorio puede o no detectar los defectos de la tela antes de que se produzca una gran cantidad de tela. El muestreo por conglomerados es un método muy utilizado por las agencias gubernamentales y ciertas organizaciones de investigación privadas. En el muestreo por conglomerados, comenzamos dividiendo el área demográfica en secciones. Luego seleccionamos aleatoriamente secciones o conglomerados. Cada miembro del conglomerado está incluido en la muestra. Por ejemplo, al realizar una encuesta de escolares en una gran ciudad, primero podríamos seleccionar cinco escuelas aleatoriamente y luego incluir a todos los niños de cada escuela seleccionada. Una población es a menudo muy grande o geográficamente extensa. En estos casos, las muestras se construyen a través del diseño de muestra multietápica de varias etapas, con la etapa final consistente en clústeres. Por ejemplo, el gobierno encuesta a la población actual de alrededor de 60 000 hogares en los Estados Unidos cada mes por medio de un diseño de muestra multietápica. Para encuestar a la población actual, la primera etapa consiste en seleccionar muestras de grandes áreas geográficas que no atraviesen las líneas estatales. Estas áreas se dividen en bloques más pequeños, que se estratifican según factores étnicos y otros. Luego se toman muestras estratificadas de los bloques. Por último, las unidades de vivienda de cada bloque se dividen en grupos de unidades de vivienda cercanas. Se selecciona una muestra aleatoria de estos conglomerados de unidades de vivienda y se entrevista cada hogar en el conglomerado final. El muestreo por conveniencia simplemente utiliza los resultados o los datos que se obtienen convenientemente y de forma fácil. En algunos casos, esto puede ser todo lo que está disponible, y en muchos casos es mejor que ninguna información en absoluto. Sin embargo, el muestreo por conveniencia corre el riesgo de estar severamente sesgado. Por ejemplo, considere a un periodista que desea obtener las “opiniones de la gente” sobre una propuesta de impuesto al asiento que se impondrá a los boletos para todos los eventos deportivos. Los ingresos del impuesto sobre el asiento se usarán para apoyar a la orquesta sinfónica local. El periodista se encuentra frente a una sala de conciertos y pregunta quién cooperará a las primeras cinco personas que salen después de una presentación de la orquesta. Este método de elección de una muestra producirá algunas opiniones y tal vez alguna historia de interés humano, pero sin duda tiene sesgo. Se espera que el Consejo Municipal no utilice estas opiniones como base única para una decisión sobre el impuesto propuesto. En efecto es un buen consejo ser muy cauteloso cuando los datos provienen del método de muestreo por conveniencia. TÉCNICAS DE MUESTREO Muestreo aleatorio: Utiliza una muestra aleatoria simple de toda la población. Muestreo estratificado: Divide a toda la población en distintos subgrupos llamados estratos. Los estratos se basan en una característica específica como la edad, los ingresos, el nivel de educación, etc. Todos los miembros de un estrato comparten la característica específica. Toma muestras aleatorias de cada estrato. Muestreo sistemático: Numera a todos los miembros de la población secuencialmente. Luego, desde un punto de partida seleccionado al azar, incluye cada k-ésimo miembro de la población en la muestra. Muestreo por conglomerados: Divide a toda la población en segmentos o conglomerados preexistentes. Los conglomerados son a menudo geográficos. Hace una selección aleatoria de conglomerados. Incluye a cada miembro de cada conglomerado seleccionado en la muestra. Muestreo multietápico: Utiliza una variedad de métodos de muestreo para crear sucesivamente grupos más pequeños en cada etapa. La muestra final consta de conglomerados. Muestreo por conveniencia: Genera una muestra utilizando datos de miembros de la población que están fácilmente disponibles. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
18
6/14
Capítulo 1
Empecemos
PENSAMIENTO CRÍTICO Marco muestral
Subrepresentación
La lista de sujetos de los cuales se selecciona realmente una muestra la llamamos marco muestral. Idealmente, este muestreo es toda la población. Sin embargo, desde una perspectiva práctica no todos los miembros de una población son accesibles. Por ejemplo, usar un directorio telefónico como marco de muestreo para los contactos telefónicos residenciales no incluye los números no listados. Cuando el marco muestral no coincide con la población, tenemos lo que se llama subrepresentación. En los estudios demográficos podría haber coberturas no adecuadas con los desamparados, fugitivos de la ley, etc., ya que no están incluidos en el estudio. Un marco muestral es una lista de sujetos de la cual se selecciona una muestra. La subrepresentación resulta de omitir miembros de la población del marco de muestreo.
En general, incluso cuando el marco de muestreo y la población coinciden, una muestra no es una representación perfecta de una población. Por lo tanto, la información obtenida de una muestra puede no coincidir exactamente con la información correspondiente de la población. Cuando la información de la muestra no coincida con la información demográfica tenemos un error, llamado error de muestreo. Error de muestreo
Un error de muestreo es la diferencia entre las mediciones de una muestra y las mediciones correspondientes de la población respectiva. Es causado por el hecho de que la muestra no representa perfectamente a la población. Un error no muestral es el resultado del diseño pobre de la muestra, recolección de datos descuidada, instrumentos de medición defectuosos, sesgo en cuestionarios, etcétera.
Error no muestral
¡Los errores no muestrales no representan errores! Son simplemente las consecuencias de usar muestras en lugar de poblaciones. Sin embargo, esté alerta de los errores de no muestreo, que a veces pueden ocurrir inadvertidamente.
PUNTO DE VISTA
¿Vida extraterrestre?
¿Cree que existe vida inteligente en otros planetas? Usando métodos de muestreo aleatorio, una encuesta de opinión de Fox News encontró que aproximadamente 54% de todos los hombres estadounidenses creen que hay vida inteligente en otros planetas, mientras que solo 47% de las mujeres estadounidenses creen que existe tal vida. ¿Cómo podría realizar una encuesta aleatoria a los estudiantes en su campus con respecto a la creencia en la vida extraterrestre?
SECCIÓN 1.2 PROBLEMAS
1.
Alfabetización estadística Explique la diferencia entre una muestra estratificada y una muestra por conglomerados.
2. Alfabetización estadística Explique la diferencia entre una muestra aleatoria simple y una muestra sistemática. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Sección 1.2 Muestreo aleatorio
6/14
19
3. Alfabetización estadística Marcie realizó un estudio sobre el costo del cereal de desayuno y registró los costos de varias cajas de cereales. Sin embargo, no tomó en cuenta el número de raciones en cada caja. Alguien le dijo que no se preocupara porque acaba de cometer solo un error de muestreo. Comente sobre ese consejo. 4. Alfabetización estadística A una muestra aleatoria de los estudiantes que utilizan el centro de recreación de la universidad se les preguntó si aprobaron el aumento de las cuotas estudiantiles para todos los alumnos con el fin de agregar una pared de escalada al centro de recreación. Describa el marco de muestreo. ¿El marco de muestreo incluye a todos los estudiantes matriculados en la universidad? Explique. 5. Interpretación En una muestra aleatoria de 50 estudiantes de una gran universidad, todos los estudiantes tenían entre 18 y 20 años de edad. ¿Podemos concluir que la población entera de estudiantes en la universidad tiene entre 18 y 20 años de edad? Explique. 6. Interpretación Una serie de presentaciones en el campus incluyen grupos de música, de baile y comedia stand-up. El comité encargado de seleccionar los grupos que actuarán incluye tres estudiantes elegidos al azar de un grupo de voluntarios. Este año, los 30 voluntarios provienen de una variedad de especializaciones. Sin embargo, los tres estudiantes para el comité eran los mejores en música. ¿Esto indica que no hubo sesgo en el proceso de selección y que dicho proceso no fue aleatorio? Explique. 7. Pensamiento crítico Greg tomó una muestra aleatoria de tamaño 100 de la población de boletos de la temporada actual para los juegos de baloncesto varonil de la universidad estatal. Luego tomó una muestra aleatoria de tamaño 100 de la población de boletos de temporada actual para los juegos de baloncesto femenil de la misma universidad. (a) ¿Qué técnica de muestreo (estratificada, sistemática, por conglomerados, multietápica, conveniencia, aleatoria) utilizó Greg para muestrear la población de boletos de la temporada actual para todos los partidos de baloncesto varonil y femenil de la universidad estatal? (b) ¿Es apropiado agrupar las muestras y afirmar que tiene una muestra aleatoria de tamaño 200 de la población de boletos de la temporada actual para todos los juegos de baloncesto varonil y femenil para la universidad? Explique. 8. Pensamiento crítico Considere a los estudiantes en su clase de estadística como la población y suponga que están sentados en cuatro filas de 10 estudiantes cada uno. Para seleccionar una muestra lance una moneda. Si sale cara, use los 20 estudiantes sentados en las dos primeras filas como su muestra. Si se trata de cruz, utilice a los 20 estudiantes sentados en las dos últimas filas como muestra. (a) ¿Cada estudiante tiene la misma oportunidad de ser seleccionado para la muestra? Explique. (b) ¿Es posible incluir a los estudiantes sentados en la fila 3 con los estudiantes sentados en la fila 2 en su muestra? ¿Su muestra es una muestra aleatoria simple? Explique. (c) Describa un proceso que podría usar para obtener una muestra aleatoria simple del tamaño 20 de una clase de tamaño 40. 9. Pensamiento crítico Suponga que le asignan el número 1 y a los otros estudiantes en su clase de estadística se les asignan números consecutivos hasta que cada persona en la clase tiene su propio número. Explique cómo puede obtener una muestra aleatoria de cuatro estudiantes de su clase de estadística. (a) Explique por qué los primeros cuatro estudiantes que entran caminando al aula no necesariamente forman una muestra aleatoria. (b) Explique por qué cuatro estudiantes que llegan tarde no necesariamente forman una muestra aleatoria. (c) Explique por qué cuatro estudiantes sentados en la fila de atrás no necesariamente forman una muestra aleatoria. (d) Explique por qué los cuatro estudiantes más altos no necesariamente forman una muestra aleatoria. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
20
6/14
Capítulo 1
Empecemos
10. Pensamiento crítico En cada una de las siguientes situaciones, el marco muestral no coincide con la población, lo que resulta en una cobertura inadecuada. Proporcione ejemplos de miembros de la población que se podrían haber omitido. (a) La población está formada por todos los 250 estudiantes en su clase de estadística. Usted planea obtener una muestra aleatoria simple de 30 estudiantes usando el marco muestral de los estudiantes presentes el próximo lunes. (b) La población está formada por todos los niños de 15 años que viven en el distrito de asistencia de una escuela secundaria local. Usted planea obtener una muestra aleatoria simple de 200 de estos residentes mediante el uso de la lista de estudiantes de la escuela secundaria como el marco de muestreo. 11. Muestreo: aleatorio Utilice una tabla de números aleatorios para generar una lista de 10 números aleatorios entre 1 y 99. Explique su trabajo. 12. Muestreo: aleatorio Utilice una tabla de números aleatorios para generar una lista de ocho números aleatorios de 1 a 976. Explique su trabajo. 13. Muestreo: aleatorio Utilice una tabla de números aleatorios para generar una lista de seis números aleatorios de 1 a 8 615. Explique su trabajo. 14. Simulación: lanzamiento de moneda Utilice una tabla de números aleatorios para simular los resultados de lanzar una moneda de 25 centavos, 25 veces. Suponga que la moneda está balanceada (es decir, justa). 15. Simulación de computadora: lanzamiento de dado Un dado es un cubo con puntos en cada cara. Las caras tienen 1, 2, 3, 4, 5 o 6 puntos. La siguiente tabla es una simulación con computadora (de Minitab) de los resultados obtenidos al lanzar un dado 20 veces. VISUALIZACIÓN DE DATOS C2 C3 C4
RENGLÓN C1
C5
C6
C7
C8
C9
C10
1
5
2
2
2
5
3
2
3
1
4
2
3
2
4
5
4
5
3
5
3
4
(a) Suponga que cada dígito en la tabla corresponde al número de puntos en la cara superior del dado. ¿Es apropiado que el mismo número aparezca más de una vez? ¿Por qué? ¿Cuál es el resultado de la cuarta tirada? (b) Si simulamos más lanzamientos del dado, ¿espera obtener la misma secuencia de resultados? ¿Por qué? 16. Simulación: problema de cumpleaños Suponga que hay 30 personas en una fiesta. ¿Cree que dos compartan el mismo cumpleaños? Use la tabla de números aleatorios para simular los cumpleaños de las 30 personas en la fiesta. Ignorando el año bisiesto, suponga que el año tiene 365 días. Numere los días. Asigne 1 para representar el 1 de enero; 2 para el 2 de enero, y así sucesivamente. De este modo, 365 representará el 31 de diciembre. Tome una muestra aleatoria de 30 días (con reemplazo). Estos días representan los cumpleaños de la gente presente en la fiesta. ¿Fueron dos de los cumpleaños iguales? Compare sus resultados con los obtenidos por otros estudiantes de la clase. ¿Espera que los resultados sean iguales o diferentes? 17. Educación: construcción de pruebas La profesora Gilí está diseñando una prueba de opción múltiple. Hay que hacer 10 preguntas. Cada pregunta tiene cinco opciones de respuestas. Las opciones deben estar designadas por las letras a, b, c, d y e. La profesora Gilí desea utilizar una tabla de números aleatorios para determinar qué opción de letra debe corresponder a la respuesta correcta para una pregunta. Use la correspondencia numérica 1 para a, 2 para b, 3 para c, 4 para d y 5 para e; utilice una tabla de números aleatorios para determinar la opción de la letra para la respuesta correcta para cada una de las 10 preguntas. 18. Educación: construcción de pruebas La profesora Gilí utiliza preguntas verdaderas y falsas. Ella desea poner 20 preguntas en la siguiente prueba. Para decidir si colocar un enunciado verdadero o un enunciado falso en cada una de las 20 preguntas, utiliza una tabla de números aleatorios. Ella Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
Sección 1.2 Muestreo aleatorio
6/14
21
selecciona 20 dígitos de la tabla. Un dígito par le dice que utilice un enunciado verdadero. Un dígito impar le dice que use un enunciado falso. Use una tabla de números aleatorios para seleccionar una secuencia de 20 dígitos y describa la secuencia correspondiente de 20 preguntas de verdadero-falso. ¿Cuál parece ser la clave de prueba para su secuencia?
Ariel Skelley/Blend Images/Getty Images
19. Métodos de muestreo: paquete de beneficios Una parte importante de la compensación de los empleados es un paquete de beneficios, que podría incluir el seguro de salud, seguro de vida, cuidado de niños, días de vacaciones, plan de jubilación, licencia parental, bonos, etc. Suponga que desea realizar una encuesta acerca de los paquetes de beneficios disponibles en negocios privados en Hawái, y usted quiere un tamaño de muestra de 100. A continuación se describen algunas técnicas de muestreo. Categorice cada técnica como muestra aleatoria simple, muestra estratificada, muestra sistemática, muestra por conglomerados o muestra por conveniencia. (a) Asigne un número a cada negocio en el directorio de negocios de la isla y, luego, utilice una tabla de números aleatorios para seleccionar las empresas que se incluirán en la muestra. (b) Utilice códigos postales para dividir el Estado en regiones. Escoja una muestra aleatoria de 10 áreas de código postal e incluya todos los negocios en cada área del código postal seleccionado. (c) Envíe un equipo de cinco asistentes de investigación a la calle Bishop en el centro de Honolulú. Permita que cada asistente seleccione una manzana o edificio y entreviste a un empleado de cada negocio encontrado. Cada investigador puede tener el resto del día libre después de recibir respuestas de 20 empresas diferentes. (d) Use el directorio local de empresas y numere todos los negocios. Seleccione un lugar inicial aleatorio, y después utilice cada negocio que aparezca como número 50 en la lista hasta que tenga 100 negocios. (e) Agrupe los negocios según tipo: médico, envío, venta al por menor, fabricación, financiamiento, construcción, restaurante, hotel, turismo, otros. Enseguida seleccione una muestra aleatoria de 10 empresas de cada tipo. 20. Métodos de muestreo: atención médica Modern Managed Hospitals (MMH) es una cadena estadounidense de hospitales con fines de lucro. La gerencia quiere examinar a los pacientes dados de alta el año pasado para obtener perfiles de satisfacción del paciente y desea utilizar una muestra de estos pacientes. A continuación, se describen varias técnicas de muestreo. Clasifique cada técnica como muestra aleatoria simple, muestra estratificada, muestra sistemática, muestra por conglomerados o muestra por conveniencia. (a) Obtenga una lista de los pacientes dados de alta de todas las unidades de MMH. Divida los pacientes de acuerdo con la duración de la estancia hospitalaria (2 días o menos, 3-7 días, 8-14 días, más de 14 días). Tome muestras aleatorias simples de cada grupo. (b) Obtenga listas de pacientes dados de alta de todas las unidades de MMH. Numere estos pacientes y a continuación utilice una tabla de números aleatorios para obtener la muestra. (c) Seleccione aleatoriamente algunas unidades de MMH de cada una de las cinco regiones geográficas, y después incluya a todos los pacientes en las listas de altas de los hospitales seleccionados. (d) Al comienzo del año, instruya a cada unidad MMH para que encueste a 500 pacientes dados de alta. (e) Instruya a cada unidad MMH para examinar a 10 pacientes dados de alta esta semana y enviar los resultados.
Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
22
6/14
Capítulo 1
Empecemos
SECCIÓN 1.3
Introducción a los diseños experimentales PUNTOS CENTRALES ● Discutir lo que significa realizar un censo. ● Describir simulaciones, estudios observacionales y experimentos. ● Identificar grupos de control, efectos placebo, experimentos completamente aleatorios y experimentos de bloques aleatorizados. ● Analizar los posibles peligros que podrían hacer que sus datos no sean confiables.
Planificación de un estudio estadístico La planificación de un estudio estadístico y la recopilación de datos son componentes esenciales para obtener información confiable. Dependiendo de la naturaleza del estudio estadístico, una gran experiencia y recursos pueden ser requeridos durante la etapa de planificación. En esta sección, veremos algunos de los fundamentos de la planificación de un estudio estadístico.
PROCEDIMIENTO Directrices básicas para la planificación de un estudio estadístico
1. En primer lugar identifique a los sujetos u objetos de interés. 2. Especifique las variables, así como los protocolos para tomar mediciones o hacer observaciones. 3. Determine si va a utilizar una población entera o una muestra representativa. Si utiliza una muestra, decida un método de muestreo viable. 4. En su plan de recopilación de datos, trate cuestiones de ética, confidencialidad, y privacidad. Si está recolectando datos en un negocio, tienda, universidad u otra institución, asegúrese de ser cortés y de obtener el permiso necesario. 5. Reúna los datos. 6. Utilice los métodos estadísticos descriptivos apropiados (capítulos 2-4) y tome decisiones utilizando métodos estadísticos inferenciales apropiados (capítulos 8-11). 7. Por último, considere cualquier preocupación que pueda tener acerca de sus métodos de recopilación de datos y enumere cualquier recomendación para futuros estudios.
Censo
Hay que considerar si se debe utilizar toda la población en un estudio o una muestra representativa. Si usamos datos de toda la población, tenemos un censo. En un censo se utilizan mediciones u observaciones de toda la población. Cuando la población es pequeña y de fácil acceso, un censo es muy útil porque da información completa sobre la población. Sin embargo, la obtención de un censo puede ser costosa y difícil. Cada 10 años, la oficina del censo del U.S. Department of Commerce Census Bureau está obligada a realizar un censo del país. Sin embargo, ponerse en contacto con algunos miembros de la población, como las personas sin hogar, es casi imposible. A veces, los miembros de la población no responden. En estos casos, a menudo se hacen estimaciones estadísticas para las respuestas que faltan. El sobreconteo, que se refiere a cuantificar a la misma persona más de una vez, es también un problema de la oficina del censo que lo está dirigiendo. De hecho, en el año 2 000, las personas contadas dos veces fueron más que el número estimado de personas omitidas. Por ejemplo, una estudiante universitaria que vive en el campus puede ser contada en la forma del censo de los padres, así como en su propia forma censal. Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019
6/14
Estadística básica aborda los conceptos fundamentales de una manera accesible incluso para quienes no han tenido una formación avanzada en la materia. Además, presenta, de forma cuidadosa, los métodos estadísticos para comprender la pertinencia de uso de cada uno, así como el significado de los resultados obtenidos. Características principales: • • • • •
• • •
Preguntas previas y problema central que introducen la información que se aborda en cada capítulo. Cuadros de definición que resaltan los términos importantes. Ejemplos que muestran cómo seleccionar y utilizar métodos apropiados para la resolución de un problema. Ejercicios guiados que explican, paso a paso, cómo utilizar cada procedimiento o método para resolver un problema. Varios conjuntos de problemas con diferentes aplicaciones al mundo real: problemas de cálculo básico, de interpretación, de pensamiento crítico, para ampliar conocimientos, de terminología y de repaso. Resumen conciso y de fácil acceso que sirve como repaso de los temas principales de cada capítulo. Uso de la tecnología con datos reales. Listado con palabras y símbolos importantes.
Esta obra ayuda a comprender qué mide la estadística. Asimismo, enfatiza el pensamiento crítico, la interpretación y la alfabetización estadística pues son esenciales en la comprensión y en la evaluación de la información.
ISBN-13: 978-607-526-831-6 ISBN-10: 607-526-831-6
Visite nuestro sitio en: http://latinoamerica.cengage.com Reg. 403 VS © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
14.06.2019