estadistica

Page 1

Ft"

,¿.

?c

EIS


)

E

srnd ísricn Descniprivn PARA LOS. CURSOS DE ESTADISTICA APLICADA A LA EDUCACION Y NOCIONES DE ESTADTSTICA

Guillenmo A. Chnperórrr MÉndez Especialista en Estadística de la Educación

rJ


7

QUINTA I.)DICION

Editorial "PIEDRA SANTA" Reservados todos los derechos

Guatemala, I977

,l


t

,

,/ 1

,{ I .

r A l,q.

\ : -

-

'- :r" .l-.

'ilr:

.Jrrlll

,: r,f i ยก ai" I I

ยก,(:^ ii-.ri,-i-r,

'


INDICE CONTENIDO Páginas

TEMA Agradecimiento Introducción,

PRIMERA PARTE: CONCEPTOS FUNDAMENTALES

1,1: 1.2: 1.3: II.

il.

Necesidad e importancia de Ia EstadGtica. Algunos de los fenómenos que se estudian en Estadfstica. 1' 21: Biol6gícos. 1.22; Pedagógicos. 1,23: Psicológicos. Problemas que aspira resolver la Estadfstica. Ejercicios.

2.1: Atributos y variables. 2.2: CategoÍas de clasificación. 2.3: Valores discretos y valores contt:¡os. 2.4: Medida de variables psicoldgicas y pedagógicas. 2.5: Limitaciones y carácter de la medida en psicologfa y

6

9

10

10 L2

pedagogfa. E-

jercicios.

t4

19

3: 3. 4:

Instrumentos de medÍción. Escalas de producción escolar. l¡s tests. 3.31: Desarrollo del método. CaracterGticas del test. 3.41: Yalídez. 3. 42:

3.5:

Las pruebas objetivas.

3.6:

Caracte¡fsticas de las pruebas obietivas. 3.61; Objetividad. 3.62 : U-

3.

1:

3.2: 3.

19 20

Fiabilidad.

3' 43:

Ti23 24

pificación.

nivocidad. 3.63: Adecuación. cabilidad. Ejercicios.

Iv.

4

3. 64: EconomicÍdad. 3. 65: Practi-

1: Muestras y poblaciones. 4.2: Estadfsticos y parámetros. 4.3: El proceso estadfstico. 4.4: Concepto de Estadfstica. Ejercicios. 4.

25

( ze) ')2e 1ao

hr

t

J

Ét


r P

1:

5.

V^

5.2:

3: 5.4: 5. 5:

5.

VI.

6.1: 6.2;

3:

6.

6.4:

t-iarácter aProximado de los números estadfsticos' Orden de 1as oPeraciones' Cifras significativas. Cifras exactas de 1as cantidades aproximadas' Redondeamiento de cantidades' Ejercicios'

3? JI

4l

tos datos, procedencia y ordenaci6n' Recuento de casos. Frecuencias absolutas y relativas' de vaDistribución de fiecuencias' 6.41: Distribución de fiecuencias agrude valores frecuencias de Distribución 6.42: lores sin agruPar' pados.

6.

5:

6.6: 6.

VII.

7:

Lfmites reales de 1os intervalos. 6'61: IntervalosdeamPlitudconstante y variable. Distribuciones acumulativas. Ejercicios'

1: Representación gráfica. Importancia' 7.2: Gtáfica de una distribucidn de frecuencias' ?'21: Fundamentación

43

48

57

de

la diagram átic a lineal'

3: 7.4: ?. 5: ?.6:

47

los interIntewalos y marca§ de clase. 6.51: Núnrero y amplitud de ¡ecodel CocÍente 6'53: distribución' de Ia Recorrido valos. 6.52: rrido ent¡e e] nflme¡o de inte¡valos. 6.54: Amplitud de ios intewalos'

?,

?,

áginas

59

Diagrama de bauas. Pollgono de frecuencias.

61

HÍstograma de Pearson. en Histo[rama de una distribución de frecuencias de valores agrupados distribuuna de Histograma 61: ?' colstarlte. de amplitud intervalos

ci6n de valores e.grupados en intervalos de amplitud variable' ?.7: Suavizaci6n o pulimento <le curvas: método aritmético' ?,8; Diagrama acumulativc. ?.81: Diagrama acumulativo de valoressjnagrupar" ?. 82 DiagramaacLrmulativodevalores agrupadcsen interva1os,

62

63 67

704 no

?. 9: Otros tiPos de gráficos. ?. l0: Diagrama de sectores. Ejetcicios.

SEGUNDA PARTE: LOS VALORES ESTADISTICOS

VIIL

8.11:

1, E.2z

8.

8,

3:

Promedios fírmes

y

"1. Definición y concepto' 8' 21;

. 8.22; Cá1cu1o ,le 1a

cuencias.

Propiedades de Ia

med

78

de Ia fórca' 8'221:

media' 8.31: serie simple' 8' 32: Dist¡ibución de fre-

?8

óJ

t,§


f-

8,4:

Cálculo abre!iado de la media. Fundamento.,8.4i: De¡nostración. 8.42; Distribución de fiecuetcias. 8,421: Valores sin agrupar. 8.422: Valores agrupados eD intervalos. 8.43: Notas de orden práctico. 8.44: Uso de la media aritmética.

8.5: La mediana. Concepto. E.6: Cálculo de 1a mediana. 8.61: ?: 8.8: 8.9:

8.

oo

9.3: 9.4: X.

,9 105

107

8.91:

SerÍe

simple. 8.92: Distribución

iie

frecuencias. 8.921: Valores sin agrupar. 8. 922: Valolcs aBrupados en intervalos. 8. 10: Uso de 1a moda. 8. 101 : Relacjonesentre lc,s p¡omedios. E.¡ercicios.

IX: 9.1: 9.2:

88

Serie simple. 8.62: Dist;ibuciórut;

frecuencias. 8.621: Valores sin agrupar. 8.622: Valo¡es agrupados en intervalos. Obtención razonada de Ia fdrmu1a. Casos especiales de la mediana. 8. ?1: Uso de la mediana. La moda. Concepto. Cálcu1o de Ia moda.

áqí ¡:as

Cuartiles y centiles (percentiles). Conceptos. Cálculo de cuartiles y cenriles. 9,21: DistribuciÍn de frecuencias, de valores agrupados en intervalos. 9.22: Distribución de frecuencias de valores sin agruper. Determinación gráfica de c-artiles y centiles, Ojiva de Galton. Significación de las puntuaciones centiles, EjercÍcios.

10, 1: Variabilidad o dispersÍón. 10,2: Medidas de variabilidad, 10.3: Recorrido o amplÍtud total. 10, 4¡ Amplitud semiintercuartil. 10.5: Desviación media, Concepto, 10.6: Cálculo de la desviacidn media. 10.61: Serie sÍmple. 10.62: DistrÍ-

108 111

11S

116

124 727

130 130 131 131

o")

buci6n de frecuencias, 10. 621: Valores sÍn agrupar. 10,622. Valores agrupados en

intervalos.

133

10.7: CáIculo abreviado de la desviación media. 10.71: Valores agrupados en intervalos de amplitud va¡iable. 10.72: Valores agrupados en intervalos de amplitud constante. 10.73: Observaciones sob¡e la des-

la desviación media. Definicióny concepto. 10.80: CálcuIo de la desviación tfpica. 10.81: Seiie simple. 10.82; Distribución

,{9

10.8:

de frecuencÍas. 10.821: Valores sÍn agrupar, 10.8222 VáIofes agrupados en

intervalos.

10.9: Cálcu1o abreviado de la desviaciórr tlpica, Fundamento. 10. 91: Obtención de Ia fórmula fundamental. 10.92: Valores sin agrupar. 10. 93: Valores agrupados en rLÍervalos de amplitud variabie. 10. 94: Valores agrupados en intervalos de amplitud constauie. 10. 95: prueba de Charlier. 10.96: ObservacÍones sobre la desviaci6n tfpica.

.145

r,§


l

*.\ I

PágÍnas

10, 10.

97: Uso de Ia desviaci6n tfpica. 10.98: Coeficiente 99: La asimetfa. 10.99. 1: Cálculo de la asimetrfa.

eficÍente de asimetrfa de Pearson.

XI. 11.1;

Curva de

de variación. 10. 99. 2: Co-

EjercÍcios,

150

distrrbucidn.

LL, 2: Idea elemental de

166

la curva norrnal. 11.21¡ Ecuaci6n de 1a curva Dor-

rral. Gráfica. 11.22: PropÍedades de la curva normal.

166

11. 3: Puntuaciones tfpicas o standard. 11, 31: Areas bajo la curva norm al. T a -

bla.

1L.4¡ Ejemplos de problemas que se resuelven por

168 1as áreas

de la curva nor-

mal. Ejercicios,

r,

XfI.

l-2.

1: VarÍable bi.dimensional. 12. 11: Concepto de correlación.

!72

t79

72.2tTipos o clases de correlación. 12,21: CorrelacÍdn simple, L2,22:Correlación y función matemátÍca. 12,3: El coeficiente de correlación. 12.4: Cáiculo dei coeficiente de correlaci6n simple linea1. 12,4L; E1 coeficiente de correlación en tabla de columnas. 72.42,: El coeficiente de cr;rrelación cuaudo se usa tabla rie doble eltt¡ada. 12.5: Coeficiente de correlacidn ordinal, 72,6: VaTo¡acidn del coeficiente "r" de correlaci6n. Ejercicios. APENDICE

I.

RESPUESTAS

179 180

181 193 195

FORMULAS EMPLEADAS.

199

A LOS EJERCICIOS DE ESTADISTTCA DESCRIPTIVA

n3

BIBLIOGRAFIA

227

6


AGRADECIMIENTO

Expresión de mi respeto y agrade.imiento ar Doctor Don José zaragozá A., Técnico de UNESC0 en orientación Escorar y vocacionar, a quien debo haberme iniciado en el estudio de la Estadística. Al mismo tiempo me complace fericitarre por la trascendente obra que ha realizado en nuestro país, plasmada en lo espiritual y en lo material. Su última

publicación "Estadística Aplicada a la Educaciónr, es a nuestra bibliografía.

un

valioso aporte

Agradezco de manera especial, la oportunidad que se me dió para efectuarestudios de Estadística aplicada a Ia Educación, amparados por la 0rganizaciín de ras Naciones unidas para la Educación, Ia biencia

y la cultura (uNESC0), y er Gobierno de España, realizados en Madrid, de 1958 a 1959.

Mi agradecimiento expreso al cuerpo de Maestros que tuvo a desarroilo de dicho curso: señores Don Joaquín iena A. y Don sixto Ríos, Organizadory Director respectivamente. profesores Don José Ros J imeno, Don Eduardo Garc ía España, Don José Martínez M. , Don Miguel Saura del Campo, Don Julio Martinez p., Don RamóndelVa Ile Fernández, Don Anselmo Calleja Siero, Don Darío Martínez Esterasl Don José Luis Tendero y Alvarez y Don Arfonso Barbancho, der rNaTrruT0 NAcI0NAL DE ESTADlsilcA. profesores DonAnger Alcaide 1., Don Gonzalo Arnaiz, Don Procopio Zoroa y Don Juan Sán Román, de la EScUELA DE ESTADlsrlcA de Ia universidad centrar de Madrid. Profesores Dr. Don Mariano yera y Don Marcero pascuar Quintana,de ra EScUELA DE PSlc0LOGlA de Ia universidad centratde Madrid.'profesores Don Pedro Avellanas C., y Don José Royo L., del CONSEJO sUPERl0R DE tNVESilGACt0NES ctENTrFtcÁS. V profesor Carriao del MINISTERI0 DE EDUCACION NACtONAL. su cargo

el

)

r.!


I¿ infrascrita Oficial Septüo del Departrento Adeinistrativo ilel

Despacho

del lfinisterio de liducación Púb1ica,

para eI efecto tuvo a ]a vista eI

"xpeaiette

CLI,|.t1¡-1uA: que

Registror

C-1136/oot.1

enel que aparece el Acuerdo Gubernati,vo No.503 de 14 de setlenbre de 1963¡ que,literalrente dice:

-

!'PALACIo I{ACI0NAL. l'fiIIST¡,RIo DE EDUoAUION PLtsrICA: GiJAT}}LlL.q.,

REGISTRO

Ng

t.ipnhr,e de 1963-- En

558101"1

vista del

]4 de se-

Dictamen V,/363 que con fecha 5 de setiembre

añotn cur§o eultiera eI Ministerio Público' v con fudmento en Io

que

.hreceptia-:lD.ecreto LegislatiYo lro3? de 8 de febrero de Ir954, EL JDI'I' DilL

Ac u ERDA ¡ Reconocer afavor clelPrcfesor 3ffiffi!*rororELA-¡EI'UBLr0A' , qilrrFnuo ARlltRo clIApEToN ]ÍDNDEZ, el derecho de autor de su obr¿ titulada l

,rf,!¡st¡nlsr¡catI^scarrrryail. c o MU r:

-¡lI x.i.i"tro de-&lucación Pública, I

r¿

i

a solicitrd-de

N

r q u !l s E,

(¡-F|

PUIiALTA Azuiu)rA.

CNEL. ROLANIO UHINCHILTtr¡. AGUILARI.

--

parte interesada y para los usos legales que J'e convcn-

I

r

¡ rgan, extien<lo

Ia pre§ente debidmente confronti'da

con su

origiml,

en wa

I

,. l¡oja út1 de paper ser-rado de }ey der. ¿ctuat quinq,enio, Registr§ ,1

E

l

;cn Ia

cj.r¡rlad de

1os Yeinti¡ueve dÍas

del res de jmio Je nil

.\\

Molim¿e /. Góre2

OBteÉIa, a

i-novecientos sesenta Y cBtro '

.\: .gtNttTtRrC Dt

No.5561.O,

" oficial

Po.CIEa

t'a

;'

-

-:

-\--

1-

I

7o.

fA(¡tIDA Yo.BO.:

,.1


INTRODUCCION

La Estadística es, hoy en día, una ciencia qr. tiun. irrdependencia propia y gran utilidad en tanto se aplica a resolver problemas privativos de las ciencias sociales y otras de carácter experimental. El análisls estadístico se aplica, por ejemplo,en Biología, Física, Química, Bacteriología, Agricultura, Economía, Demografía, Astronomía, Pedagogía, Psicología, 0rientación Escolar y Vocacional, etc. Aunquel.en sus principios los conceptos estadísticos depeirdieron de determinadas ciencias sociales, actualmente muchos de ellos son de uso diario.\ Por eso dice el Profesor Ríos querrEl carácter de ciencia básica que tiene hoy la Estaüística se debe les que resuelve, como a Ia frecuencia co¡- que algutanto a los problemas nos cle sus más sencil os se encuentran en la vida diaria'r. (1) .[Estos conceptos sencillos son, , la idea de promedlo, el índice de costo de la vida y el valor adquisitivo de la moneda, la idea de correlaclón, los porcentajes, Ias frecuencias, las razones y las proporciones, etc.: todos ellos usados a menudo en Ia conversación y negocios cotidianos y llevados al plano de la significación por la EstadísticC\ El éstudio y conocimiento de esta ciencia es fundamental en nuestro tiempo;no es uTÉsino muchas las Universidades del mundo donde la Estadística tiene lugarpreferenteen los estudios de profesionalizaciín. t Como otras ciencias, la Estadística también ha sufrldo burlas de quienes no la quisieron. Hoy, para forLuna de la investigación, ha quedado desvlrtuado y relegado el decir nralicioso de que las estadísticas sirven, entre otras cosas/ para aseverarfalsedades con base en los números. Es cierto que quienes asi'pensaron noestuvieronlejos de algunos hechos que infortunadamente ocurren Lodavía, cuales son Ios de vulnerar y falsificar las informaciones estadísticas; pero esto no afecta en absoluto Ia caLegoría que la ciencia estádística tiene actualmente, pues, como tal, opera sobre realidades y los resultados, debidamente interpretados, son suFicientes para elcrédito que

nos han de merecer.

La idea de dispersión y los cálculos que a ella conducen hacen patente Iamala fé de personas que han dicho: "... la Estadística demúestra que si Pedro se come un pollo y Juan ninguno, esto equivale a que ambos coman medio pollo'r. (2) Digamos, pues, que es falso que la Estadística pueda probar cualquier cosa. Esta ciencia neces¡la/ sobre Lodo, datos Iegítimos de confianza para poder establecer sus resultados. Sobre el particular dice el Profesor Wilks:'rEl único meCiode reducir esta confusión es utilizar los métodos científicos para coleccionar, analizar e interpretar datos. El hecho de que estadísticos expertos, impuestos en estos métodos, puedan extraer, y extraigan, de una serie de datos, conclusiones que difieren muy poco de un

¡.1


estadístico a o[ro, demuestra que no existe base real para la pretensión ingenua de Ia estadística puede probar cualquier cosa". (3)

que

Con Ias lÍneas preced.nt.s/r" permito ofrecer estos apuntes elementales sobre Estadística Deser.iTrtiva que, fundamentalmente, persiguen ayudar a aquellos alumnos y maestros que ñir una u otra causa, deban cursar algo sobre esta materia en tanto sea para ellos una iniciación. El alcance de esta obra no llega a más: se queda en la parte descriptiva de la Estadística. En todo caso/ en nuestro mercado hay tÍtulosque pro[undizan la materia. Por mi vocación de maes[ro he procuradoque eldesarrollode Iapresente se cifre sobre un problema real de nuestro medio:el rendimiento escolar, para locualheaprovechado algunas experiencias propias en el curso de mis servicios al Estadoenel Ramo de Educación Pública. La distribución básica que me sirve para ejemplificar y desarrollar el contenido de estos apuntes es auténtica. Se refiere a las puntuaciones alcanzadas por un grupo de 329 alumnos, en una prueba experimental de Ciencias Natl¡'ales I Curso del Ciclo Prevocacional, aplicada por la Sección de Evaluación Escolar en 1,958. No pretendo que por este hecho la presente pueda considerarse aplicada, pero sí ha sido mi intención darle preferencia al tratamiento estadÍsLico de un fenómeno peda góg ic o.

Aunque la Estadística es de base matemática, estos apuntes, por su misma elementalidad, no hacen uso de un gran aparato leórico, ya que para su comprensióny cálculos es suficiente el conocimiento de las operaciones fundamentales aritméticas y algebraicas. En el curso de estos apuntes aparecerá más de alguna repetición; pretendo con ello insistir sobre aspectos bás¡cos para Ia comprensión de ciertos óonceptos. Repetir -se dice- es saludab[e cuando se hace oportunamente,

Finalmente, mis excusas por Ios errores involuntarios que pudieran aparecer. En el deseo que estos apuntes cumplan su cometido, agradeceré en alto gradolas recomendaciones tendientes a su mejora.

GUILLERMO A. CHAPETON MENDEZ Guotemolq, Mqrzo de I965.

,.1


PRIMERA PARTE CONCEPTOS FUNDAMENTALES

,


TEMA

I

l.l' Necesidod e importoncio de lo Estodístico. 1.2t Algunos de los fenómenos que se estudion en E stodístico. l.2l: Biológicos. 1.22t Pedogógicos. 1.23: Psicoló9icos. 1.3: Problemos que ospiro re' solver lo Estodístico. Eiercicios.


l-

1.1:

NECESIDAD E ll\IPORTANClA DE LA ESTADISTICA

.

Hemos dicho que la Esladística es una c¡enc¡a necesaria en el conjunto actual de conocimlentos; naturalmente, decirlo es distinto que probarlo. Por eso,en laslíneas que siguen, trataremos de hacer nolar esa necesidad mediante algunos ejemplos senci-

llos, También se dice que Ia definición "a priorirrde una c¡enc¡a conviene, en especial, para aquellas personas que van a iniciar el estudio de ella, pues esto permite tener idea más o menos clara de sus límites. Por otra parte, también se sostiene que la definición cobra más significado I'a posteriorirr, es decir, después de haber recorrido el campo de su contenido. Para acercarnos a esa definición, debemos fundamentar Ianecesidad de la ciencia; y para esto último debemos remitirnos, aunque seaagrandes rasgos a ciertos hechos o fenómenos que nos lo faciliten.

Al hablar de estos fenómenos cuyo estudio se hace mediante el análisisestadíslico, nos ilustraremos, pr¡mero, con las palabras del Profesor Don José Ros Jimeno que, al comenlar cómo Colajanni considera Ia Estadística/ nos dice que: "Los hechos y fenómenos humanos se llaman atípicos porque del conocimiento de las cualidades Intelectuales y físicas, económicas y morales de un hombre no podemos deducir que los demás tendrán cualidades idénticas, ,Por eso, cuando se quiere estudiar Lln fenómeno en una determinada colectividad, hay que examinar el mayor número de casos, y por eso mismo, la EsLadíslica no se ocupa de Ios fenómenos singulares o particulares, sino de Ios colecLivos

".

(4)

La referencia anterior nos permite, en un primer intento, acercarnos nido de la Estadística en cuan[o trala:

al

conte-

a)

Del estudlo de ciertos fenómenos Ilamados aLípicos, o aquellos cuya manifestación singular no es posible generalizar; y

b)

Que para el estudio de dichos fenómenos es necesar¡o un colectivo, estoes conjunto de datos e infortraciones.

El Profesor Alejandro Galí, al referirse al hecho variable/ nos dice: "Los hechos humanos, entrando en la categoría de hechos biológicos, seproducensiemprecomo cantidades variables. En un tiempo dado, por ejemplo, no se obtiene nunca Ia misma cantidad de trabajo, ni una acción tiene la misma intensidad ni da los mismos resultados ", (5) Es dec ir que:

c)

Existen ciertos fenómenos que no se comportan inmutables,sino, al contra-

rio, cambian

en el tiempo y cambian en

el lugar. Deestos hechos mutables

r.Í


cuya cons¡deración y estudio solo cabe Ios que se ocupa la Estadística.

si

forman una colecl¡vidad, es de

Ahora bien, si comprendemosque Ia Estadística se ocupa del estudio de determinadosfenómenos que cambian, que difieren de uno a oLro caso, que son mutables a tal punto queaisladamente no tienen mayor significación, es naLural que nos hagamos estas preguntas: ¿Cuáles son/ o de qué clase son, esos fenómenos? ¿Cómo es posibleestudiar fenómenos que cambian continuamente?. A estas in[erroganLes se puedecontestar tomando algunos ejemplos de entre los muchos que se pueden citar.

I.2:

ALGUNOS DE LOS FENOMENOS QUE SE ESTUDIAN EN ESTADISTICA.

1.21: Biológicos. ¿ f s posibte, por ejemplo, predecir cuántos años puedevivir una persona determlnada? ¿Se puede calcular la longev¡dad? Naturalmente que en términos concretos no es posible/ pues por razón de las fuerzas Ilamadas de vitalidad y mortalidad, fa resultante no es determinable exactamente. Sinembargo, medianteelanáIisis estadístico se ha logrado establecer, con cierta probabilidad de acierto,rrseis funciones que llevan el nombre de funciones biométricas a una detefminada edad, y son supervivencia, fallecimientos, probabilidad de muerte, probabilidad de vida, vida media y vida probable". (6). Los resultados de estas funciones, debidamente[ratados,adquieren significación cuando se formulan Ias tablas de mortalidad, o, dicho deotromodo cuando se hace el estudio estadísLico y demográfico de cierlos componentesbiológicos. Nos pregLtntenros ahora: ¿ El desarrollo Físico de las personas es el mismo, invariablemente, a determinadas edades?. Si esto es cierto, en[onces todas las personas de idéntica edad tendrán el mismo peso, la misma estatura, igual funcionamiento de sus órganos, etc. Pero nosotros sabemos positivamente que no ocurre asíi y, no obstante, mediante el anáf isis estadístico se ha podido eslablecer, con más o menosaproximación ei curso del desarrollo de ciertos componenles físicos de las personas. Cuando decimos que la cantidad normal de glóbulos rojos en la sangre humana 4.5 millones por milímetro cúbico, es[amos aludiendo a un dato que se hafijado mediante el análisis estadÍstico.

es de unos

1.22: Pedaqóqicos: Apliquemos una prueba de conocimientos escolares a un grupo de alumnos, más de unavezt con cierto intervalo de tiempo. Es indudable que los resultados diferirán de una a otra experiencia y que los alumnos, individualmente, no responderán exactamente de la misma manera. Aunque cada alumno dé distinto resulLado en las experiencias, se puede analizar el conjunto de datos de cada una y establecer la situación general del grupo. ¿C6no es posible saber hasta dónde son comunes los resultadosobtenidos por Ios alumnos en materias diversas?. 0 bien, si el alumno A es elque más puntos alcan-

r"Í


za en Matemálicas, ¿Quiere decir que también lo será en Lenguaje ?. Por hipótesis el alumno que más rinde en una nrateria lohará en otra; pero esto hay qué comprobarlo mediante el anális¡s estadístico. En maLeria de casos individuales no podemos asegurar, tampoco/ que B0 puntos en Matemáticas significa lo mismo que B0 puntos en Lenguaje. Solo podremos decir que una calificación es ¡nlerior, igual o superior a otra,cuando hayanros hecho el estudio numérico def colectivo de resultados, Se tiene, por ejemplo, el problema siguiente: hemos confeccionado una prueba en la que los elementos (ítems, unidades o dificultades) fueron previamente seleccionados. Aplicada la prueba, ¿podremos fiarnos de los resultados? ¿Son válidos dichosresultados? La fiabilidad y validez de una prueba, problemas fundamentales para Iaconfección de un test, quedan resuelLos cuando se esludian estadísticamente los datos ob[enidos de la experlencia.

Hay muchos problemas educativos que solo son abordables en tanIo seanalicen por la Esladística, Esto se debe, entre otras razones, a la dificultad de medir los fenómenos psicopedagógicos que/ en general, se desconocen en su aspecto intrínseco. Ha habido mucha disparidad en Ios criterios para apreciar Ios resultados de la labor escolar o de un grupo de alumnos. AnLe Io grave de la subjetividad, se ha impuesto Ia necesidad de trabajar con técnicas que hagan objetiva la medición: De acá la imporlanciaque tiene la estadíslica para el traLamiento de fenómenos aiípicos en Ped4gogía. La ciLa de los siguientes casos, corrLrnes en Ia biblioqrafia, ilustrará mejor Io dicho:

a)

Dearborn pidió a dos nraestros M El resultado fue el siguienLe:

Maestro IVI

MaestroN

: :

y N que calificaran a un grupodealumnos. n

45 "f"; Suspensos, Sobresalientes, 0 ; Suspensos,

SobresalienLe s ,

b) Wilson pidió a dos maeslros

P

t4

T"

y Q, calificaran a dos grupos de escolares,

obteniéndose el vesultado que sigue: MAESTRO

ESCO LARES

(

r¡ pros.

P

1,671

3o

olo

O

2,196

3

o/o

15

-

79

80-84

85

-

89

90-94

olo

15

olo

14

olo

12

o/o

6q"

19

olo

36

olo

78

olo

1't


dos prolesores de una rnisrrra escuela, obtuvo distin[as nolas el mismo grupo escolar:

c) Johnson, con

sobre

AI)RO BADOS

REPROBADOS

N{AESTRO 1"

1ú 1;

+51

2'

(l ',i'

NoTABLES

11'

S

ALII]NTI]S

22

5 ";.

24', 0

OBRL-S

I

)0'ir tl

"i

1.23: Psicológicos: Sea, por ejenrplo, Lrn Lest de inteligencia que se ha aplicadoaungrupodealuntnos, SupongamosqueelalunnoAobtuvol00decalif)cación y que el alumno B obtLrvo 50, ¿ QLr iere decir esto que el alunrno A es el cloble cle inLef igente que el alLrmno B ? Es claro qrre no/ pero denlro de las normas deltesL, confeccionadas estadísLicamente, se puede delernrinar la siluación de ambos dentro del grtrpo.

Ejemplos como Ios citados los podenros tomar de lodas aquellas ciencias de carácLer experimenlal, pues en lodas ellas se hace indispensable la aplicación de la EstadísLica, Lo anterior no quiere decir qLre dichas ciencias se reduzcan, en laexperitrentación, al análisis estadÍstico, sino, al contrario, que este proceso es tundanrental y básico para la investigación experinrental, a tal pLrnto qLre hoy día es necesarioposeer dichos conocimientos para aprovechar nrejor la infornración bibliográfica correspondien-

te.

1.3:

PR0BLEIVIAS QUE ASPIRA RES0LVER LA ESTADISTICA.

La Estadística, con.ro podenros observar de los ejenrplos citados, es Ltna ciencia aplicada, En tanto se aplica al estLrdio de [enórnenos atípicos, aspira resolver tres prob lemas fundanrentales

a)

:

Descripción: Proceso de resumen nurnérico y exposición de las caracteríslicas de los hechos observados.

b) Análisis:

Relación comparativa enLre una experiencia

y

la teoría qtre

la

ha

provocado.

c)

Predicción: anticiparse aproximadamenLe a sucesos posteriores del tipoes-

r{

tudiado. En tema aparte examinarer.nos de qué clase son los resullados que mediante el estudio esiadísLico de Ios datos.

se

ob[ienen


EJERCICIO I

1

i I

En el paréntesis escriba la letra C o cho en las expresiones siguientes:

l,

según sea correcto o incorrectolo

1.

Es absolutamenLe necesario definir una ciencia desde para qrre su estudio se facilite

2.

Se Ilama fenómenos atípicos a aquellos que se pueden generalizar f:artiendo de un caso individual

()

3.

En Estadística se llama colectivo a un conjunto de datos referidos . a un fenómeno

(

Si un niño de clase media obtiene alta puntuación en un examen de Matemáticas, todos los niños de su nivel social también puntua rán alto, pues elrendimiento escolar es atípico

()

4, 5.

Si Juan tiene Q.

2.00 y Miguel Q. 25.00,

promedio de lo que tiene cada uno es de

6. 7. 8. 9. 10.

quiere

Q. 13.50

el principio,

decir

que el

El hecho variable es inmuLable intrÍnsecamente, pues lo quevaría es la manera como se manifiesta. La supervivenc¡a es una función biométrica que

se

puede estudiar

di-

()

(

)

)

() (

)

Si María obtuvo 40 puntos en Lenguaje y 40 en Matemálicas, quiere decir que en ambas materias sabe o rinde lo mismo

(

)

La Estadística no aspira a resolver ningún problema en la investigaci6n, ya que esto corresponde a Ia ciencia a que se aplica ....

(

)

estadísticamente

Una manera de unificar el criterio de distintos examinadores al caIificar a un grupo de alumnos sería, por ejemplo, haciendo el aná-

lisis estadístico de los resultados

()

¡l


TEMA

II

2.12 Atributos y voriobles. 2.2: Cotegoríos de closificoción. 2.3: Volo¡es discretos y volores continuos. 2.4: Medido devoriobles psicológicos y pedogógicos. 2.5: Limitociones y cor6cter de lq medi do en psicologío y pedogogío. Eiercicios.

rl

I

I I


L

2.1:

ATRIBUT0S

Y

VARIABLES'

Pensemos por un momentoen lo que es una población de habitantes.¿Qué Podemos decir, en forma tápida, de cómo está compuesta la población ? Pues, en primer lugar/ d¡remos que Se compone de hombres y mujeres. A los hombres y a las mujeres les ifarur.mos, en general, elementos de la población. En seguida podremos decir queestos elementos están diferenciados por ciertascaracterísticas, como son, el sexo, la ta-

Ila, el estado civil, el número de hijos, el color de los ojos, el color de la piel, las actividades u ocupacioneS a que se dedican, los salarios que perciben por su trabajo, la zona urbana o rural donde viven, etc. Estas caracterÍsticasque dan sentidoa la composición de la población pode(cualidades); y 2) mos aqruparlas de dos maneras: 1) Ias características cualitatlvas (cantidades)' Ias características cuantitativas

Soncaracterísticas de tipo cualitativo, porejemplo, el sexo, el estado civil, el color de Ia piel, lazona donde se vive, el ser alfabe[a o no, etc.

A las características cualitativas se las designaen Estadísticacon el

nombre

de atribuLos, Estos atributos,como se comprende, no admlten grados de comparación;en el caso del sexo, por ejemplo, se puede ser varón o hembra, pero nunca de otra modalidad. Se manifiesta la discontinuidad en los atributos porque la característica no sepreSenta en menos o en más; por ejemplo, no seesmáshombreni menoshombre;tampoco se es más mujer ni menos mujer, Luego, no existen grados de comparación entre las moda-

lldadesdeunatributo. Paratenerelsexomasculinonoseempiezaenun

ciertomomen-

[o o estadio.

Si nos fijamos ahora en las características de Iipo cuantitaLivo, por ejemplo peso, la estatura, el salario, etc., observamos que síse puede eompararalos indiel viduoS, ya que entonces ocurre que una persona Sea máS alta o menos alta que otra,que pese más o que pese menos/ que gane más dinero o menosdinero, etc. Enla estatura, por ejemplo, hay ciertos grados que se relacionan entre sí para darle continuidad a la caracterÍstica, Se puedenestablecer comparaciones de estatura entrevarias personasi y en muchos casos, la estatura, que es un fenómeno atípico, va(iatá,tomará distintosvalores. A este tipo de caracteríslicascuantificables o susceptibles de ser expresadaspor medio de cantidades se las denomina en Estadística con el nombre de variables. Vemos pues, en general, que los atributos no pueden relacionarsepor grados

de continuidad. Las características cuantitativas/ en cambio, sí pueden compararse pues admiten la continuidadya que vatían, en máS o en menos, de una persona a otra,de un caso a otro.

f',1


{

IO

Si tomamos o medimos el peso de un número rrunru de personas, o de objetos tendremos tantos datos como personas u objetoshayamospesado;y, sindu-

si se quiere,

da, habrá muchos pesos distintos. Estos datos distintos/ que se denominan valores,nos dicen que una característica cuantitativa varía, cambia, es inestable, y de ahíque se diga, entonces/ que variable es una característica gue puede tomar muchos valores. Los datos o Informaciones referentes a características cualitativas sedenominan estadísticas de atributos; y Ios referentes a características cuantitativas sedenominan estadísticas de variables.

2.2:

CATEGORIAS DE CLASIFICACI0N.

TanLo las estadísLicas de atributos como las estadísticas de variables pueden presentarse en grupos; así, Ias primeras Se agrupan en modalidades y las segundas en clases. Las modalidades y las clases responden, pues, a la necesidad de clasificar los ¿-atos. n esta manera de agrupar Ios datos se le denomina categorías de clasificación; y las reglas que Ia rigen son comunes a las modalidades y a las clases. Asísehaestablec

ido:

2.21: Definir claramente las clases, determinando en forma explícita y Iugaradudas,qué@aIidadoclase.Sisequierevercuán-

sln

tas personas hay económicamente activas, se ha de definir primero que se significacon personas en actividad económica.

2,222 Que las clases se excluyan mutuamente, para que más de una vez una modalidad o clase.

no

se clasifique

2.232 Que las clases sean exhaustivas, a fin que ningún caso quede fuera de clasificación. Es natural que si clasificamos Ia población por el trabajo a que se dedican suS elementos, no hemos de hacer únicamente dos grupos, por ejemplo, agricultores y ganaderos y trabajadores agrícolas. Quedan fuera de clasificación otras modalidades que deben ser consideradas. De lo dicho podemos resumir que una población está compuesta: a) deelemenb) tos; estos elementos poseen características que los diferencian entre sí; c) lascaracterísticas se subdividen en cualitativas o atributos y en cuantitativas o variables; d) los atributos y las variables pueden agruparse en modalidades y clases, respectivamente,atendiendo a Ias categorías de clasificación; y e) las variables pueden tomar muchos valores.

2.3:

.VALORES DISCRETOS Y VALORES C0NTINUOS

i

Los datos o valores numéricos con que se trabaja en Estadística son, en e-

tf


It sencia, med¡ciones, es decir, expresan medidas que se han tomado de larealidad. Así, por ejemplo, si contamos en un salóno en una clase elnúmero de alumnos que hayrtendremos una cantidad que expresa la medida del número de alumnos de dicha clase; de igual manera, si a estos alumnos se Ies aplica una prueba o examen, lascalíficaciones que obtengan serán también expresivas de una medida. ¡

Ahora bien, según el significado que tenga la medida hecha, Ias cantidades o valores numéricos puedenconsiderarse como discretas o continuas. Valores discretos son aquelloS que tienen un valor entero, esto, sin fraccionamiento de ninguna especie, Así, por ejemplo, si contamos el nÚmero de alumnos de una clasey obtenemos el número 30, debemos considerarlocomo tal, sin agregarle ni quitarle, pues jamás podríamos decir que en dicha clase hay 30.5alumnoso29 3/4, o sea que cuando una cantidad es discreta no admite subdivisiones, Vafores continuos son aquellos que sí pueden dividirse, fraccionarse, expresarseen una o más partes de Ia unidad de medida. La mayoría de los valores o medidas que se obtienen en Pedagogía y en PsicologÍason de tipo continuo. Ya sea que hayamos med¡do la estatura, el peso, la inteligencia, la

salud, el rendimiento escolar, etc. siempre será posible admitir el fraccionamiento de la unidad de medida, De esta cuenta, si el número 7 es una medida de tipocontinuo, no representa un valor aislado sino una parte de la unldad de medida, que puedeconsiderarse como el espacio comprendido entre 6.5 y 7.5 o entre 7 y B. Esta distancia que expresa la cantidad continua, ha sido llamadarrface vaIuerrpor Thorndike y se traduce como "valor extensión". En Ia práctica, sinembargo, se procura que los valores sean discretos, sin que por ello, los que no lo son,pierdan su continuidad, Esto se hace con el objeto de hacer más cómodoelcálculoperosin perder de vista la continuidad de los datos, Gráficamente podría expresarse lo discreto

y lo continuo de los valoresen

la

forma siguiente:

trtrtrtrtrtr DATOS

DISCRETOS

ffi723456 DATOS CONTINUOS

Volveremos sobre este aspecto cuando Lratemos lo relativo a los lÍmites reales de los números, para efectos de Ia agrupación de los datos. Lo dicho sobre atributos y variables (2.I) y sobre valores discretos y continuos (2.3), puede recordarse más fácilmente, haciendo uso del cuadro siguiente:

,,1


L2

t.

()

Diversas modalidades

Discler,,s y cotrtiltüos

2,4:

MEDIDA DE VARIABLES PSIC0LOGICAS

Y

PEDAGOGICAS:

La medición de esLas variables se halla rnuy unida al análisis esLadístico pues, en esencia/ es ésLe el que perm¡te el esLudio nurxérico y cuan[ilat¡vo de esos fenómenos. Una variable/ según se dijo, es una característica cuyos camblos son sLlsceptibles de ser expresados en Forma de cantidades. En este sentido los términosvariable y lenómeno son sinónimos, aunqueesmás propio IIamar var¡able a la expresión cuantitativa de un fenómeno. En lo físico, y en lo biológico, por ejemplo, encontrarnos fenórnenos susceptibles de ser medidos con más comodidad que otros, Así el caso de la medición de la Iongitud de una barra de meLal expuesta a diferentes grados de ternperatura; igualmente Ia estatura humana, que se puede expresar fácilmente por medio de cantidades. Hay variables/ como las de los ejemplos anteriores, que hacen posible la aplicación de medidas. No ocurre lo propio en las variables psicológicas y pedagógicas que, por su complejidad m¡sma, noes lan fácil expresarlasen forma de canLidades. Uno de los aspectos psicológicos que más interés ha promovido en la investigación científica es el de la inteligencia,Ocurre que Ia inteligencia no puede ser medida eon la objetividad que es posible en los fenómenos físicosy biológicos, y de igual manera el rendimiento escolar. No obstante, es evidenLe que tanto una como otro son fenómenos que cambian, que varían, pues no se presentan en la m¡sma intensidad en los individuos, de modo que por ese hecho consIituyen variables.A nadie escapa que las llamadas diferen-

rl


13

cias individuales se acusan/ entre otros rasgos, en Ia inteligencia y en el rendimiento escolar. EI problema consiste en medir esos fenómenos, El estudio de los principiosy métodos de esta medición es ef objeto de Ia Psicometría, ciencia auxiliar de lapsicología experimental. La medida psicológica y pedagógica es necesaria, aunque las posibilidades no son tan bondadosascomo en otros fenómenos:los físicosy Iosbiológicos, por ejemplo. Es necesariaen tanto fa Psicologíay Pedagogía tienenel carácter de ciencias ex-

perimentales. Es naturalque sideseamosconocer larelación que existe entre la longitud de un metal y la temperatura, debemos someter elmateriala distintosgradosdetemperatura e ir midiendo, en cada ocasión, los cambios que sufre en su longitud. La relación dicha será tanto más evidente en tanto sea más precisa la medición. En lo psicológico y pedagógico, din embargo, no es tan fácil encontrar esta precisiónen la medida. La raz6n es, entre otras, porque Ios fenómenos no son muy objetivables, son complejos; y luego, que no siemprees posibleencontrar instrumentos o medios quehagan posible la mensuración. Ahoi'a bien: la Psicología y PedagogÍa son ciencias experimentales por excelencia; esto es, las verdades científicas en estos órdenes deben ser producto de la investigación, de la experimentación. Si se desea conocer cómo es la inteligencia, o el rendimiento escolar, es necesario experimentari o sea hacer comprobaciones, establecerrelaciones, manejar datos reales, hacer experimentos. Mal se podría hablar,

científicamente, de diferencias individuales si no se contara con Ia medidade los rasgos psicológicos. Tampoco se podría decir que un alumno rinde más en unasmaterias que en otras, si no se tuviera para ello, criterios de comparación, productos de haber medido, de haber experimentado.

Hay, sin embargo, una cierta diferencia entre la necesidad de medir variables psicológicas y pedagógicas y la posibilidad de hacer esa medición, pues Ia necesidad no implica la posibilidad. Esta distinción nos plantea las interrogantes siguientes: ¿ Es posible la medida de lo psicológico y de lo pedagógico? Si es posible, ¿de qué manera se logra?; y también, ¿se mide realmente el fenómeno? ¿No son, acaso, intangibles los rasgos psicológicos?¿No es ciertoque difierenfundamentalmente de los rasgos físicos y biológicos en cuanto a la objetividad para captarlos? Para poder contestar a esas preguntas es necesario aceptar que la Psicología y la Pedagogía -más propiamente aquella que ésta- tratan de la conducta humana, de la manera como se conduce el hombre, de sus actos, de cómo sus movimientos son significativos, etc. Para que haya conducta debe haber motivosque Ia produzcan. AsÍ, por ejemplo, la fé religiosa es un motivo para que el hombre se conduzca de cierta manera y que sus movimientos sean significativos, Asistir a loscultos y ritosreligiosos, expresar mediante la acción ciertas creenciaS, son parte de la conducta del hombre en tanto está movido por su fé religiosa, Si nos agrupamos a un partido polÍtico, si ex-

'if


L4

presamos nuestra admiración hacia un candidato, es porque hay algo que nos impulsa a hacerlo.Participar en las actividades de una agrupación es demostrar con hechos, con actos nues[ros/ con nuestra conducla,que creemos en Io que esa agrupación significa para nues[ra ideología. En todo caso,nuestra conducta en lo religioso,en Io polÍtico, o en cualquier otro orden,estará referida a un motivo; y nuestra manera de actuar ha de ser significativa para que constituya realmente conducta.

Es evidente que Ios motivos que impulsan nuestra conducta, comoen los ejemplos dados, son psicológicos; la fé religiosa,la ideología, la admiración, el amor, la responsabilidad, Ia inteligencia, el rendimiento escolar, etc., no se pueden reducir a números en sí. No podríamos, por ejemplo, tomar el rendimiento escolar y someterlo a sucesivas modificaclones como haríamos con una barra de metal adistintastemperaturas; o tomar el amor y medirlo como se hace con una superf¡cie.

Si lo anterior es cierto, no lo es menos que en lo psicológico y pedagógico se manifiestan diferencias de intensidad apreciables a través de la conducta de los sujetos. A nadie escapa que se puede observar cuándo una persona demuestra más o menos fé religiosa/ que es arrorosa, responsable, inteligente , en más o en menos ' Por eso, aunque el fenómeno en sí no sea medible, cabe la posibilidad de medir la intensidad con que se manifiesta, esto es/ tratar de captar los camb¡os o variantes que presenta en Ia manera como se conducen los sujeLos. Lo anterior nos dice que loquesemide es la conducta de los individuos en este o en aquel aspecto; y. por lamisma raz6n, que se trata de medir el fenómeno. Este, pues, nosemideintrínsecamente; toque sehace es procutar medirlo por los movimientos significativos de las personas: Ia conducta.

Peto, ¿hasta dónde es posible medir esa conducta? Eso depende delconocimiento que se tenga del fenómeno y de los instrumentos de que se disponga para efectuar la medición. Tanto en lo psicológico como en lo pedagógico se utilizan fundamentalmente dos tipos de instrumen[os:las escalas de producción escolary Ios [ests y pruebas objetivas, a los cuales nos referiremos en el tema lll.

2.5t

LIMITACIONES Y CARACTER DE LA MEDIDA EN PSICOLOGIA

Y

PEDAGO-

GIA. La medición de Fenómenos en psicología y pedagogía es necesaria en tanto se considere estas disciplinas experimentalmente. Los valores que se obtienen nunca son exac[os; es más: su aproximación a la exactitud y precisión depende en muchode Ios instrumentos utilizados para medir. A esto hay que agregar Ios errores propios del análisis y cómpulo de resultados. Pero esta inexactitud no ocurre con exclusividad en Ias variables de estos tipos. Si varias personas miden la longitud de una mesa/ por ejemplo, eS seguro que no todas obtendrán el mismo resultado; unas medirán más, otras menos/ pero nunca será igual el resultado en todas las mediciones. Las diferenciaspo-

tl


15

drán ser ínfimas, insignificantes, pero ello no quita la inexactitudy el carácter de aproximación de la medida. Esto en cuanto a los encargados de medir; los otros errores se introducen por Ia imperfección de los instrumentos, por operaciones no exactas, etc.

Ante Ia diversidad de resultados de una med¡ción se plantea Ianecesldad de un número que/ a manera de índice, represente al conjunto de resultadosomedidas. Este índice representativo puede ser, por ejemplo, un promedio. Uno de Ios aspectos fundamentales que se resuelven por el análisis estadístico es precisamente laobtención de esos índices. Por estas circunstancias el carácter de lamedidaes aproximado, estadístico, marcando más bien una tendencia del conjunto de medidas que éstasaisladamente. Cuando se dice que el promedio de rendimiento escolar en una materia de estudios es de 40 puntos, se está indicando que esta puntuación es la que mejor represenla al conjunto de puntuaciones alcanzadas por un grupo de alumnos. Como se comprende, este número 40 es una medida, aproximada y estadística, en tanlo estásubstituyendo a un colectivo de resultados.

La medida de fenómenos psicológicos -y por extensión de Ios pedagógicos ha sido objetada porque lales rasgos de la personalidad es difícil captarlos íntegramente. En esencia son 4 las objeciones que se presentan, a saber: a) que si la medida exige objetos materiales de medición, no es posible efectuarla en lo p9íquico por su carácter espiritual; b) si Ia medida es una manera de abordar lo cuantitativo, no puede aplicarse a los aspectos psicológicos por ser cualitativos; c) para medires necesarioais-

lar los fenómenos, pero lo psíquico es un "todo continuo e indivisible"i y d) cuandose desea medir algo, se precisa que el objeto de medición permanezca fijo, esLáLico, pero en lo psicológico esto no es posible pues la vida psÍquica se halla en constante canrbio, en contintra transformación, es irrepetible, e incluso está modificándose en el momento mismo de la medición.

Estas objeciones, pues, quieren demosLrar la imposibilidad de aplicar la medida a lo psicológico por ser espiritual, cualitativo, indivisible y mutable. Aunque los argumentos que respaldan a esas objeciones contienen una gran verdad, los psicólogos y pedagogos experimentalistas han sabido demostrar que no es esa toda la verdad; que si lo psicológico efecLivamente tiene características que escapan a Ia medición, también es cierto que los aspectos orgánicos, lasdiferencias individuales, y todo aquello que pueda apreciarse a lravés de una realidad palpable, no obstante ser psÍquico, permite aplicarle la medida; y que, en todo caso, esLa medida debe ser interpretada en función de Ia "personalidad, biografía y circunstancias def sujeto'r. (7). Además de que la medida se hace necesaria, también es posible porque se efectúa sobre 'rla conducta físicamente registrable y observable'r (B).

ri


16

difícil

rrHay en los productos humanos -dice el Profesor Galí-un aspecto quees muy de traducir numéricamente:es el aspecto cualitativo. Es bajo esta facetaque se

sitúan los enemigos de

la psicología

experimental

al decir, y en este sentido

tienen

que el espíritu, como hecho viviente, no puede sujetarse a ninguna medida. Pero lo que no tienen en cuenta estos críticos es que en general solamente se aplica la medi-

raz6n,

da a aquello que se puede medir; el mismo fenómeno se da en las medidas escolares. que abar¿Cuando medimos la lectura por el número de palabras leídas en un minuto es un sólo aspectomaterial no; tomamos camos todo el hecho de leer? Evidentemente, que ofrece presa al instrumento cuantitativorr. (9)

"En resumen -dice el Dr. Yela- Ia medida psicológica es necesaria en psicología experimental. Solo ella permite la comprobación rigurosa de hipótesis acerca de la conducta. La medida psicológica es posible porque se verifica sobre la conductafísicamente registrable y observable. Esta medida es de carácterestadísticoy sólopermite avanzar pronósticos probables acerca de conjuntos y grupos. El carácter unitario de Ia conducla, Ia continuidad y cambio constante de la vida humana, exigen que lasmedidas sean interpretadas en función de la personalidad, biografía y circunstanciasdelsu-

jetorr. (10) "Una cifra -dice el Dr. Claparede- no posee en sí ningunaespeciede interés. Pero es un medio indispensable para el análisis de los fenómenos. No se mide por placer de medir; se mide pata analizar". (1I).

tl


1 I

L7

EJERCICIO

Escriba en el paréntesis Ia letra C o se a[irma a continuación.

1.

l,

2

según seacorrecto o incorrecto Io que

La raza es una característica cuantitaliva de la población, puesto que podemos hacer grupos numéricos de individuos según ese rasg0

2, 3. 4,

A Ias características cuyos cambios no se pueden expresar entérminos de medida se las denomina atributos

(

.)

Si varias personas miden todas la longitud de una mesa, podemos esLudiar estadísticamente el conjunto de medidas .......

(

)

Juan se examinó en Estudios Sociales y obtuvo 75 puntos,

Io

cual quiere decir que Juan sabe exactamente 75"k de la asignatu -

5. 6.

7

.

8.

ra

()

El concepto de rrvalor extensión'r de un número, que Thorndike lla ma I'face valLle'r, se refiere más bien a una cierta distancia que a-l número en valor absoluto

()

Al contar el número de alumnos de un grado le corresponde a Enrique el lugar 30. Este número es continuo puesto que Iaordenación continúa hasta 45 que es el total de niños

(

)

La medida de fenómenos en psicología y pedagogía es imposible, porque el hecho de medir demanda objetos de medición, ytanto lo psicológico como Io pedagógico es cualitativo.

(

)

Las diversas formas en que se manifiesta un atributo se llaman moda

9

.

Ii

dades

()

En la experimentación psicológica y pedagóqica no se miden los fenómenos en

10.

()

sí, sino la manera

como los sujetos se

conducen... (

Los valores continuos se pueden definir, matemáticamente, en el campo de los números

naturales

(

)

)

¡i


I

I

TEMA II!

3.1: lnst¡umentos de medición. 3.22 Escolos de producción escolor. 3.3: Los tests. 3.31: Desorrollo de el método. 3.4: Co¡oclerísticos del test. 3.41: Volidez. 3.42: F¡obilidod. 3.43 Tipificoción. 3.5: Los pruebos objetivos. 3.6: Corocterísticos de los pruebos obietivos. 3.ól: Obierividod. 3.ó2: Univocidod. 3.63: Adecuoción. 3.64: Economicidod. 3.65: Procticobilidod. Eiercicios.

Ét


t9

L

3.1: t

t

INSTRUMENT0S DE MEDICION.

Los instrumentos de medición que se usan en psicología y en pedagogÍa, son la consecuencia de la necesidad y posibilidad de medir, de expresar en formacuantitativa los aspectos de la personalidad que Io permiten. En Ia actualidad ya no basta que el maeslro, para desempeñar su misión, tenga vocación o'rdon de maestror. Escierto que lo vocacional, es el resorte fundamental para el buen desempeño de una actividad; pero a esta vocación y a Ia competencia docente debe agregarse que rrNi el buen sentido, ni la práctica, ni el golpe de vista, pueden por sí solos satisfacer al maestro; hay qué crear una conciencia técnica; proporcionar medidas exactas. El golpe de vista ejer: citado quizá no se equivoque, pero lo comprobado técnicamente es lo verdaderamente firmerr. (12) A efecto de ir más allá, de apreciardocumentariamente los logros en Iaeducación, se han introducido instrumentos, aparatos, escalas, que hacen posible Ia comprobación de resultados. Se exigeque Ia medidasea objetiva, precisa, tiable. para poder aplicar una medida debe existir previamente el instrumento. No se puede confiar en que Ia superficie de una mesa sea de 1.5 metros cuadrados porque asÍnos ha parecido al ojo. Se necesita aplicar una medida a sus dimensiones para hablarconmayorseguridad. Lo propio ha ocurrido en psicología y pedagogía. si fulano es un alumnó qr. iinde bajo, necesitamos forzosamente un instrumento que nos permita saberhasta quepunto es insatisfactorio en su rendimiento. Posiblemente en otras circunstancias fuese mejor. En este sentido, es la Estadística la que ha hecho posible Ia confección de lnstrumentos, si no perfectos, síaceptablesen alto grado;porque no se trata simplementedeelaborarlos o construirlos, sino, principalmente, comprobar que sirven al objeto y necesidad para que se introdujeron, esto es, que midan y que se pueda confiar en los resultados de Ia medición.

Los instrumentos de medida que se utilizan para Ia apreciación de Ia labor de los escolares, son corrientemente, de dos tipos: uno que mide un trabajo ya realizado y otro para trabajos que han de ser realizados. El primero es un instrumento de observación, mientras que el segundo es de experimentación, pues el trabajo a realizar deberá ser medido posteriormente. "Los instrumentos de observación son Ias escalas de producción escolar; los instrumentos de exper¡mentación son Ios tesLs y las pruebasobjetivas'r. (13)

3.2:

ESCALAS DE PR0DUCCI0N ESC0LAR.

Consisten en un conjunto de trabajos graduados que sirven para comparar el trabajo similar realizado por cualquier sujeto. Por ejemplo, una escala de estetipoes la de escritura, formada por un conjunto de 'rplanas de escritura quecomprende desde la

¡:í


20

peor hasta la más perfectaio[ro [anto acontece con las escalas de dibujo'¡. (14). Las escalas de producción escolar fueron introducidas por Thorndike y se les ha Ilamado también "métodos de ordenación'r por Wells.

La construcción de la escala de escritura de Thorndike se hizo mediante 1B I,000 escrituras, calificadas por 40 jueces, De cada grupo se tomó una plana o muestra representativa, estableciéndose 1B gradosde comparación que varían desde el inferior hasta el superior. Los grados se expresanmedianLe núnteros, así: 0 al inferior, 1 al que le sigue, luego 2, 3 ....Suaplicación aun casoparticular se hace comparandoel trabajo del sujeto con todos y cada uno de los lBtipos establecidos, comparación que se hace de menor a mayor y viceversa. EI grado o calificación que se asigna al trabajo es el que corresponde al tipo al que más se aprox¡ma en Ia escala. grupos de un total de

El número de grados de la escala depende del número de grupos que se hagan del total de trabajos -muestra, Así, la escala de Ayres es de B grados, la de Ballard de 10, y la confeccionada por el Dr. Zaragozáde 12, en dos escalas paralelas, osea un conjunto de 24 grupos que se repartió en dos subconjuntos de 12 grupos cada uno, después de establecer el rango u orden medro, Para la construcción de una escala de producción escolar hay que salvar dos problemas de por sídifíciles; uno se refiere al juicio objetivo para apreciar la calidad de los trabajos; y el otro a la ordenación gradual de esa calidad, pues Ia dificultad o calidad de un grado debe equidisLar de los grados anterior y posterior. La aplicación de las escalas es ilimitada, y en síntesis, gradúan el aspecto cualitativo de ciertos fenómenos. El cuadro siguiente resume lo dicho:

reda cc ió n

Escalas de producción escolar ( 15),

3.3:

de calidad

L0S TESTS.

Aunque la palabra test es inglesa ha sido incorporada al español y se traduce por prueba o reactivo; sirve para designar un cierto tipo de examen utilizado en ps¡cología y pedagogía. Figura a la vezen los vocablos españolescomo testigo,testimonio, atestiguar, etc. Aplicado a una persona o grupo de personas se pretende con él,cono-

rJ


2t

sLt conducta en un rasgo que interese, De ahíque se dlga -sin intención de definirque el Lest es un testigo de la conducta humana en un delerminado rasgo psicológico o

cer

pedagóg lco

.

Al contenido del test, o sea a los problemas que se proponen para su resoluítems, dificulLades o unidades. La condiciónfundamental que debe saLisfacer un lest es que su contenido ponga en evidencia o haga resaltar Ia caracterÍstica que se desea medir, Además, esle conLenido debe ser discriminativo para que se pueda apreciar la intensidad del rasgo en los sujetos.

ción,

sLrele llamársele elemenLos,

Logrado Io anterior se aplica el test a un grupo de personas. Supongamosque se Lrata de un test de inteligenciay que va a ser aplicado a la población de niños 9uaLemaltecos de ocho años de edad. Por diversas razonesno es posible examinara [odala

población, por lo que substituye ésta por una muesLra representativa, esto es/ una parte de la población, Al grupo de sujetos que compone la muestra se le llama grupo normaLivo. Asíque se les ha aplicado el test, se procede aanalizar estadísLicamente los resultados, Estos resultados se expresan en números, en medidas, y con ellose construye una tabla especial que recibe el nombre de normas o baremo con ia cual se comparan/ poster¡ormente, los resultados que obLenga un individuo cualquiera de esa población al aplicársele el test. Al proceso de elaboración de las normas del test se le IIama normalizaciín, standardización o tipificación, Para aplicar el'test - normalizado, por supuesLo, han de seguirse ciertas instrucciones, tanto de parte de qtrien lo aplica como de quien Io recibe. Con la información anterior se puede tenerlel conceplo de lest comorruna

si-

Iuación problemática, previamente dispuesla y esLudiada, a que el sujeLo ha de responder siguiendo ciertas instrucciones y de cuyas respuestas se est¡ma/ 'por comparación con las respues[as de un grupo normativo, la calidad, índole o grado de algún aspecto de su personalidad". (16)

3.31

DESARR0LL0 DEL MET0D0.

El test, como instrumento de cuantificación de Ios fenómenos psicológicos y pedagógicos, se utiliza en forma sisLemática desde finales del siglo XIX y, entantoes un mélodo, se distinguen en su evolución cinco períodos: 1)Tests sensoriales y molores; 2) Escalas de inteligencia;3) Tests colecIivos;4) Tests de personalidad; 5) Análisis lactorial. Siguiendo al Dr. Yela se pueden resumir Ios períodos mencionados en Iaforma siguiente:

,.1


22

Durante el primer período (LesLs sensorialesy motores) se hicieron por Francisco Galton, Ios primeros intenLos para estudiar la herencia de las aptitudes fÍsicasy mentales, en su laboratorio Antropológico de Londres, en 1882. Este período comprende hasta 1905 y a finales de él se inicia el siguiente, por la ineficacia de los instrumentos empleadosi pues Galton pensaba realizar su investigación sobre aspecLos antropométricos, sensoriales y motores. Es durante el primer período que se introduce el vocablo test por J. Mc. K. Caitell, hacia 1890. Se vió, asim¡smo/ la necesidad dequelos elementos de los tests debían provocar procesos más complejos para el fin propuesto.

El segundo período (escalas de inteligencia) está fundamenLalmente caracterizado por los trabajos de Binet, que es el creador de los LesLs de inLeligencia, Binet se dió cuenta que el fracaso de las investigaciones, realizadas durante el período anterior no consistía en el método (el test), sinoenelmaterialempleado(loselementos del test), Sus aciertos en este sentido son haber introducido dificultades que provocasen procesos psicológicos más complejos y superiores, y haber relacionado los Lestscon la edad de Ios sujetos. Tomando en consideración lales aspectos, construyó la primera escala de inLeligencia, determinando la Ilamada Edad IVental (E. M.) de los sujetos. La primera escala mental fue publicada en 1905, revisada y complelada en 1908, siendo ésta la que adquirió fama mundial. Una de las revisiones más famosas a la escalade Binet es Ia que se hizo en 19 16 por Terman, en la Universidad de S[anford (escala Stanford Binet). La utilizacióndel cociente intelectual (C.1.) que resulla de dividir Ia Edad Mental entre la Edad Cronológica (E.C.) Fue propuesta por Stern y por Kuhlmann.

El tercer período (tests colectivos) surge en Norte América en 1917 , cuando hubo necesidad de aplicar los tests colectivamente y no en forma individual comosevenía haciendo. Este período resulta de Ia participación de Estados Unidos en la primera guerra mundial, en la que hubo de reclutarse el ejército entiempo pordemás perentorio. Los tests fueron elaborados poreminentes psicólogos: Yerkes, Whipple,Terman y Goddard. Los hubo de dos tipos: Tipo AlFa para los nacionales alfabetos; y tipo Beta para los extranjeros y nacionales analfabetos.El tipo Al[a contiene dificultades que debían ser resueltas por escrito mediante palabras. Las dificultades del Iipo Beta consistían en figuras, dibujos,

etc. Este último difundió el uso de Ios tests manipulativosqueya el siglo anterior por el iLaliano Sancte de Sanctis.

habían sido usados desde

El cuarto período (tests de personalidad) se inicia en el año L917 con lostrabajos de Woodworth que, mediante una hoja de datos personales sobre hábitos, intereses, actitudes, temores, etc., buscaba hacer diagnósticos sobre Ia personalidad y problemas de la persona. Posteriormente(1921)aparece el Test Psicodiagnóstico de Herman Rorschach, psiquiatra suizo, que es uno de los instrumenlosmás utilizados actualmente en el campo de los tests proyectivos. El quinto período (análisis factorial) corresponde

a los trabajos de Spearman


23

desde

1904,

creador del método del análisis factorial,

y

publicados como teoría

en

L927 . Consiste en estudiarexperimentalmente el fenómeno que el testmide. Continuadores famosos de Spearman son Burton, Thomson y Thurstone. Resultado deestos trabajos es el establecimiento de un factor general (G)y de otros específicos (S)o aptitudes, en la estructura de la inteligencia humana.

3.4:

CARACTERISTICAS DEL TEST.

Todo test psicométrico debe Ilenar, como mínimo, tres exigencias o caracterÍsticas: a) validez; b) fiabilidad o precisión; y c) tipificación.

3.4\ Validez. Un test es válido si efectivamente mide o aprecia el rasgo para que ha sido construido. Así, un test para seleccionar mecánicos es válidosi discrimina entre los buenos y los malos. Forzosamente debe poneren evidencia el rasgo que se desea medir. SerÍa un test no válido aquel que pretendiendo medir inteligencia resultase midiendo otro fenómeno distinto. Un metro, por ejemplo, sirve para medir dimensiones o longitudes, pero no es bueno ni válido para medir el tiempo;en este ejemplo es evidente que se entiende por validez. En los tests psicopedagógicos, sin embargo, no es tan fácil determinar esta validez. La validez de un test contempla, previamente, la definición dél rasgo o fenómeno que se va a medir; la adecuación o representatividad que cons¡ste en que los ele-

mentos o dificultades hagan resaltar ese rasgoi lementos.

y Iaconveniente selección dedichos e-

Entre las características de un test, sin restar importancia a las otras, la validez es la básica; generalmentese determina a posteriori. Si se tratade un test de selección de mecánicos, por ejemplo, no se puede asegurar que el instrumento efectivamente seleccionó buenos mecánicos o personas aptas para el oficio, en tanto no seconozcan los resultados obtenidos por los sujetos en la vida profesional. Esto impone la necesidad de relacionar posteriormente los resultados alcanzados enel test por los sujetos examinados, con los resultados de su actividad profesional. Esta relación se establece estadísticamente mediante la correlación, o sea, estimar hasta quepunto son comunes los resultados en la selección y en Ia labor posterior. Es de esperarse que si el test realmente mide, habrá altay significativa correlación entre losresultados de ambas experienc ias

,

La validez impone, pues, la existencia de un criterio exterior pára establecer la correlación con los resultados de Ia aplicación del test. En el ejemplo de la selección de mecánicos, este criterio podríaser la calificación asignada por el jefe alos sujetos eneldesempeñode sus actividades, Enuntest de inteligenciapodría comprobarse Ia validez, efectuandola correlación entre los resultados alcanzados por los sujetos

rJ


24

durante el examen y el grado de inteligencia manifestado en su vida escolar, grado que sería apreciado por la califlcación de Ios maestros.

3.42: Fiabilidad. La fiabilidad o precisión de un test viene dadapor la conque fianza se pueda tener en Ios resultados obtenidos. Esta confianza se expresa porque los resultados sean constantes; esto es: aplicado el test varias veces, losresultados deben ser, si no Ios mismos, síaproximadamente semejantes. Si a unindividuo se le aplica un tesl varias veces y en cada ocasión los resultados difierensignificativamente, no se podría tener fé o confianza en el test; es decir, no puede confiarse en la precisión del instrumento pues cada vez que se aplica da resultados muy distintos. Para probar Ia fiabilldad o precisión de un test se utiliza también el método de las correlaciones, esto es, averiguar la relación que existe entre los resultadosde dos experiencias o aplicaciones del test. Para lograr esta caraclerística se han propuesto cualquiera de los procedimientos siguientes: a) aplicar dos veces el instrumento, con cierto intervalo de tiempo y correlacionar los resultados de la primera y segunda experiencias. Este procedimiento se llama de reaplicación o de re-test; b) aplicar dos formas paralelas del test, o sea, construir dos instrumentos con el mismo contenido. La correlación se establece entre los resultados de las dos formas y a este procedimiento se Ie Ilama de las formas paralelas; y c) aplicar un test y dividirlo endos partes: una que contiene las dificultades impares y otra que contiene las dificultades pares. La correlación se establece entre los resultados de los elementos pares e impares. Este procedimiento se llama de las mitades semejantes.

3.43: Tipificación. La tipificación, standardizaciín o normalización del test es posterior a la comprobación de su validez y fiabilidad. Consiste en determinar la significación de los resultados o puntuaciones del test. Es un proceso de generalizaciín por el cual se averiguan y ordenan las puntuaciones del test para lapoblación, con base en los resultados obtenidos en el grupo normativo o muestra que ha servido para Ia experiencia. Esta ordenación y signiflcación es Iatipificación. Lasnormaspropiamente, consisten en una escala valorativa de las puntuaciones y se puede hacer, de preferencia, utilizando normas cronológicas, centiles o típicas.

3.5:

LAS PRUEBAS OBJETIVAS.

Los tests se originaron en la investigación psicológica y, seguidamente,la técnica se extendió a lo pedagógico. En este campo, sin embargo, no se hanobtenido los mismos frutos. Ante las limitaciones que su aplicación presentó, se pensó en la construcción de un instrumento semejante pero más apropiado a los fines particulares de la escuela. Este nuevo instrumento es lo que conocemoscomopruebasobjetivas, similar al test, pero diferenciado fundamentalmente por no estar tipificado.

¡l


25

La prueba objetiva ha sido utilizada en especial para medir el rendimiento escolar. Se la denomina también: tests objetivos, tests escolares, tests informales,tests de respuestas breves, tests de nuevotipo, tests de instrucción, etc. A pesar que son más Fáciles de construir que los tests propiamente, esa facilidad es relativa. Requieren que se siga una ser¡e de instrucciones para su elaboración que, en suma, soncumplir con las exigencias mínimas para confiar en esos instrumentos. Estas exigencias o cualidades son Ias que siguen:

3.6:

CARACTERISTICAS DE LAS PRUEBAS OBJETIVAS

Además de las caracterÍsticas que damos a continuación, la pruebaobjetivade be satisfacer la de Ia fiabilidad que es determinable fácilmente mediante las correlacio nes, asícomo la de la validez, más difícil de establecer que la primera. El uso de Ia tipificación es más restringido en Ia prueba objetiva.

3.6L Objetividad: Se entiende por objetividad aquella condición que elimina la ambigüedad en la pregunta o elemento, o sea, que no haya lugar a dudasobre qué es lo que debe contestar el educando, asi'como que cualquiera persona que califique Ia prueba no pueda introducir su apreciación o criterio particular. La objetividad debeeliminar los contenidos ambiguos y Ia subjetividad del calificador. por

ta.

3.62t Univocidad: Esta cualidad está muy unida a la anterior y seestima que para contestar una pregunta hay exclusivamente una sola respuesta correcEn último caso se aceptan sinónimos perfectos.

tal,

3.63t Adecuación. Exige esta cualidad que el contenido de la pruebasea representativo de Ia materia o asignatura. Sedenominatambién representatividad y persigue que Ia prueba no deje aspectos sin abordar.

3,64:

Economicidad. Esta característica es secundariay busca quetanto pa-

ra la elaboración como para la aplicación y resolución no se use más esfuerzo(material, temporal, intelectual, etc.) que el aconsejable.

3.65

Practicabilidad. La prueba debe ser práctica, de fácil aplicacióny

computación de tos resuttados.

¡l


26

EJERCICIO

3

Escriba en el paréntesis Ia letra C o I según sea correcto o incorrecto se afirma a continuación:

1.

tos

3,

La validez de un test consiste en que al aplicarlo varias veces los mismos resultados

5.

da

Las escalas de producción escolar tienen como unidad demedidaun patrón de

4.

que

Es necesario que las escalas de producción escolar tengan siempre

el mismo número de grados, para poder aplicarlas atodos Ios suje-

2.

Io

calidad

La tipificación de un test consiste en la obtención estadística, de normas aplicables a la población de donde se extrajo el grupo normativo Un

test puede, incluso, estar tipificado sin que por ello esté com-

probadasuvalidez

.......

() (

)

(

)

() (

6.

Un concepto estadístico del reactivo

7.

Los tests Alfa y Beta corresponden al período de los tests colectivos en la evolución de este método

()

B.

Las pruebas objetivas de rendimiento escolar, se usaron con anterioridad a Ios tests propiamente

()

9.

La adecuación de una prueba objetiva consiste en que su contenido sea representativo de la asignatura

()

10.

Para etectos de Ia experimentación pedagógica, es preferible usar pruebas objetivas en vez de exámenes orales, en la medidadelren-

dimiento escolar

test sería decir que es una prueba o

)

()

()

rl


TEMA IV.

4.1:

4.2t Estodísticos y 4.3: El proceso estodístico. 4.4t Con

Muestrqs y poblociones.

porómetros.

cepio de Esfodístico. Ejercicios.

i,f


28

4.1:

MUESTRAS

Y P0BLACI0NES

Cuandose usa el términoestadísticas (con minúscula y en plural) se alude,generalmente, a ciertos cuadros numér¡cos que contienen datos de lipo cuantitativo, provenientes de mediciones hechas, por ejemplo, sobre la talla de un conjunto de individuos, sobre Ia edad, sobre la asistencia escolar, sobre el rendimiento escolar/ etc, En cambio el término Estadística (con mayúscula y en singular) se refierea la ciencia propiamente. AI hablar de los problemas que aspira resolver Ia EstadÍstica, apuntamos que son: descripción, análisis y predicción. Según eso, sepuedeconsiderar dos aspectos diferentes en Estadística, cada uno con sus fundamentos matemáticos de distinto nivel. Uno de tales aspectos es el que se designa comúnmente EstadÍstica Descriptiva; y que es, como dijimos en palabras introductorias, el contenido de estos apuntes, aunque no agotado. La Estadística Descriptiva se propone describiry resumir un conjunto de datos y tiene como fundamento las matemáticas elementales.

El otro aspecto es el que se designa como Estadística lnductiva, lnferencia o Estadística Muestral. El problema de fondo de la Estadística lnductiva es Ia generalizaciín de características obtenidas de una muestra o grupo de muestras. De ahíel nombre: de una parte de un todo (muestra) inferir conocimientos sobreel todo (población). La Estadística lnductiva requiere matemáticas más complicadas: elCálEstadística

culo de probabilidades o Teoría matemática de las probabilidades. I'Los resultados de ambas ramas de la Estadística conducenaunaseriedetécnicas que se aplican al estudio de los fenómenos aleatorios y que, en conjunto, sedenominan Métodos estadísticosr'. (17)

\

En Estadística ocurre/ generalmente, que los datos con los que se trabaja proceden de una muestra que se ha tomado de la población, por uno u otro procedimiento de muestreo. Supongamos que se quiere investig¿r Ia inteligencia de Ios niños guate-

mallecos de ocho años de edad. La población, en este caso/ la constituyen T0D0S Ios niños que hay, tanto en la capital como en los departamentos,de esa edad. Es natural que por razones de dinerolde tiempo y de lugar, no será posible investigar entoda la población; de ahíque se récurra a una muestra de dicha población. 0 sea: en vez de aplicar la prueba de inteligencia a los miles de niños de ocho años que hay en larepública, se toma una parte de esos miles, y esta parte que se toma de la población constituye una muestra. Lo mismo ocurulia con cualquiera otra investigación estadística que se quisiese realizar, Si Ia población es grande, entonces deberá acudirse al muestreo; de esta cuenta el muestreo es un método sumamente importante en lainvestigación estadística. Prácticamente todas las investigaciones se basan en muestras. El concepto de población en Estadística está referido siempre a Ia totalidad de elementos

¡J


29

que tienen el rasgo o fenómeno a investigar. Hay casos en los que sí se investiga la pobfación total: el caso típico es el censo. 'rConstituye el censo la operación más amplia de investigacióndemográfica, puesto que es el recuento o enumeraciónde todos Ios,habitantes existentes,en unci,erto momento, en un cierto espacio. Viene a ser el censocomo una fotografíainstantánea de Ia población". (18). Pero ¿cuánto cuesta levantarun censo?Por ser unainvestigación exhaustiva, quea la par ditmúttipteesfuerzo personal necesita gruesas sumas de dinero para su realización, se ha convenido internacionalmente, entre otras razones, levantar censos en períodos decenales, pronunciándose a favorde losaños terminados en cero.

De las muestras se extraen datos:eslo es indudable. Pero resulta quelos datos de las muestras pertenecen, en realidad, a una población. Entonces, ¿cómo saber si los datos obtenidos de la muestra se pueden generalizar a la población? Estacuestión y otras las resuelve el método del muestreo o Estadísticalnductiva, cuyoproblema fundamental es inferir, de una muestra, características de la población a la que ésta pertenece.

4.2i:

ESTADISTICOS

Y PARAMETR0S.

Los términos estadístico y parámetro se corresponden, es decir, aun cierto valor estadístico corresponde un cierto parámetro. Estos valores se distinguen en lo siguiente: estadísticooestadÍgrafo es todovalor obtenido de una muestra. Parámetroes todo valor característico de la población. Sea, por ejemplo, Ia medición de la estatura de losniños guatemaltecos de10 años de edad. Si fuera posible medir los miles de niños de dicha edad, o seatoda la población, los valores característicos obtenidos serían parámetros. Perocomoestono sucede asíse recurre a una muestra;y losvafores caracterÍsticosobtenidos de lamuestra son precisamente los estadísticos o estadígrafos. valores estadísticos, por ejemplo, las medidas de tendenciacentral (promedios) y otras, siempre que se obtengan de muestras. Estasmedidas, al obtenerlas de una población o generalizarlas a ella, serán los parámetros. LaEstadísticalnductiva, cuya base matemática es el Cálculo de probabilidades, nosenseñacomollegar a los parámetros por medio de los estadísticos. También se Ilama estadísticosa los profesionales de la Estadística, esto es, estadÍsticos facultativos. Son

t.l


30

4,3:

EL PR0CES0 ESTADISTIC0.

Es indudable que toda ciencia experimental necesita observar. Así, la Estadísque estudia los- fenómenos colectivos mediante la observación numérica, necesita organizat la recolección de datos sobre el fenómeno que se trata de investigar. Esta recolección forma parte de un plan que comprenderrla redacción de cuestionarios ,ladefinición del hecho, fenómeno o carácter que se quiera estudiar, la eleccióndel momento y de los órganos más adecuados para la recogida de datosrr. (f9)

tica,

El primer paso de una investigación estadÍstica es Ia definición del problema, rasgo o fenómeno a estudiar. Esto requiere, si no un dominio completo de la materia que es lo ideal, sÍel suficienteconocimiento para los buenos frutos de Ia investigación. En este conocimiento queda incluido lo relativo al grupo social o poblacional donde se quiera investigar, la delirnitación de Ias áreas correspondientes, etc. En segundo lugar, después de definido el problema, se deben elaborar los cuestionarios que discriminen el fenómeno de que se trata, asícomo la preparacióndel per-

sonal que haya de intervenir.

-

'Recogidos Ios datos, o sea, obtenida Ia información que interesa, deben ser sometidos al análisis de depuración. lla depuración -aspecto que muchas veces no se atiende debidamente - es básica para la interpretación posterior de Ios resultados. No basta que se haya confeccionado un instrumento dentro del máximo rigor ni que se haya instruido suficientemente al personal. Es necesarioque Ios datos sean depurados, pues la bondad de estos determinará la mayoro menoraproximación en laexactitud de lasconc lu

s

iones.

Depurar los datos consiste en estudiarlos,en observarlos, para versi se ajustan a la verdad, La Estadística, por el hecho detrabajar con números, dará números como resultado. Tales cifrascobran significado propio según el fenómeno de que se trate. Si Ios datos no son depurados, esseguro que losresultados finales motivaránuna interpretación un tanto alejada a la verdad. La depuración se hace desdedos puntos de vista: a) desde el punto de vista de la verdad;y b)desde el punto devista de Ia sinceridad o, en otras palabras: a) desde el punto de vista de la exactitud; y b) desde el punto de vista de la fé. En ambos casos se busca poseer material fegítimo para el trabajoesta-

dístico. Depurados los datos se procederá a ordenarlos, clasificarlos y labularlos. La ordenación y clasificación se hace de acuerdo a las necesidades, por ejemplo: edades, sexo, tallas, etc. La tabulación consiste en el recuentode casoso resultados y supresentación en tablas.


31

El paso siguiente es Ia sistematizaciín y cálculo estadístico. Se trata de encontrar los valores o medidasrepresentativas delconjunto de datos del fenómeno, por ejemplo, el rendimiento medio de los alumnos en un curso, Ia estatura media, etc. Finalmente, la interpretación de los resultados para investigar las leyes empíricas del comportamiento del fenómenoque es/ en esencia, tarea del investigador; pues como se dijo, Ia interpretación se hace en función del conocimiento de Ia variable o campo donde se investiga. Por esta raz6nel análisis estadístico no puede ir nás allá del estudio matemático de losdatos,ya que para su debidasignificación se necesita ser estadístico y algo más, por ejemplo, estadístico y psicólogo, estadístico y pedagogo, estadístico y economista, etc. Es decir, se impone que el experimentadorsea un estadístico, no en el sentido de hacer cálculos sino en el de interpretar vafores estadísticos; y, fundamentalmente, competente en la rama del fenómeno investigado.

La interpretación se complementageneralmentecon las representaciones gráficas que, además, satisfacen los efectos de la publicidad. Las gráficas dan una idea o visión de conjunto del fenómeno, en forma objetiva y clara.

,r,,4: C0NCEPT0

DE ESTADISTICA.

Etimológicamente la palabra EstadÍstica se hace derivar del latín status, situación de personas o cosasi del griego statera, balanza, por el hecho que mide o pesa los fenómenos de su competencia; y del alemán staat/ como expresión de la unidad política superior. Esta etimología no es/ en realidad, expresiva del concepto actual de Estad ística. De esta ciencia se han dadomuchas definiciones, lo cual es justiticable si

to-

mamos en cuenta que

la Estadística, desdesus inicios hasta lafecha, ha sufrido serias modificaciones. El Profesor García Pérez recoge los datos siguientes: "Desde el año 1,748 hasta I ,934 las definiciones que se handado de Ia estadísticaalcanzan un total de 117, de las cuales 3 fueron escritas en latín, 66 en alemán, 29 en inglés, t6 en francés y 3 en italiano". (20) El Profesor Ros Jimeno dice: 'r... vamos a ocuparnos/ siquiera seabrevemente, del concepto de EstadÍstica, disciplina de la que, según Engel, se habían dado ya a mediados del siglo pasado 180 definiciones". (21)

Y el Profesor González Bellido agrega: "Muchas son las definiciones de este concepto, debido a que las ciencia.s evolucionan constantemente y esto mismo ha ocurrido y ocurre con Ia Estadística. Probablemente Ia definición más completa sea la del Profesor Ros". (22)

t!


32

El Profesor Ros Jimeno ha hecho un análisis crít¡co de las definiciones dadas por los estadísticos más famosos; y, luego.de referirse a RUmelin, Gini, Colajanni, Pearson, Yule, y otros, dice: "En consonancia con los juicios críticos formulados iobre las definiciones expuestas, podríamos decir que Estadística es la ciencia la mediante la observación numérica, el análisis

lóqica, investiqando especialmente sus causas v

sus

,t. (23)

Ét


33

EJERCICIO 4

Escriba en el paréntesis la letra C o I según sea correcto o incorrecto loquese afirma a continuación.

1.

Se llama lnferencia estadística a los cálculos que sirven para generalizar a la población las características de una muestra .. ,.

2.

El censo es el caso típico de la Investigación exhaustiva de blación

3.

Un promedio obtenido en una muestra es lo que se llama parámetro

4,

EI conjunto de las técnicas de la EstadÍstica descriptiva ydelaEstadística muestral consLituye los métodos estadísticos, .....

5. 6. 7

,

Las estadísticas

9,

. (

y la Estadística aparecieron juntas como actividad

(

En el proceso estadÍstico es necesario depurar los datos, a eFecto que los resultados estén absolutamente asegurados contra errores ..

(

EI fundamento matemático de la Estadística inductiva es

el

Cálculo

La interpretación de los resultados de una investigación, debe hacerse en función de la Estadística y de Ia ciencia a Ia que se aplica

El concepto de Estadística ha evolucionado al evolucionar laciencia sr

Un concepto de actualidad sobre

plo, que procede del latÍn status

la Estadística es dec¡r, por ejem-

)

_

()

()

en

10.

po-

humana

de probabilidades

8.

la

(

)

)

)

() (

)

() () r.§


TEMA V

5.1:

Corócter oproximodo de los números estodís-

ticos. 5.2: Orden de los operociones.5.3: Cifros significotivos. 5.4: Cifros exoctos de los contido des oproximodos.

5.5:

Redondeomiento de contidq'

des. Eiercicios.

Fl


35

5.1:CARACTERAPRoXIMADoDELoSNUMERoSESTADISTICoS. siempre que expresen meLos números que se usan en el cálculo estadístico, o[ras causas, de cociendiciones, son aproxima;;:tri;.aroximación resulta, entre de la finura de los tes, de errores propios ¿. L r.lial, de unidades de tipo superior, un c'n-

por esta raz6n no es lo mismo el número 12 si se refierea junto de alumnos, que si se refiere a la lon

iniirr.rtor, .i".

metidos en un dictado. En el primer caso

e

men0s; de que

ra suce NOESU

óárliru¡u¡o

al sistema de numeestadístico propiamente, sino por ser algo inherente

ración decimat que a

r;;;;iil

demásiadai cifras pára representar alsunosnúmeros'

Al hablar de los valores discretos

ícter de aproximación de Ios números estapara la ordenación de cantidadesengruposocladísticosy de su continuidad es básico SCS.

5.2:

ORDEN DE LAS 0PERACI0NES'

el cálculo, es conveniente tenerencuenta 4x3 + 18:6' el resultado será" ¿^5'15-' de Ias operaciones es "" 4x3-13=15'

r t4,12 Si bien

c¡ertas

les' conviene tenerlas presentes:

a)Lapropiedadconmutativadelaadicióndicequeelordendecolocaciónde

los sumandos no altera el total. Ej:

2+4+9 +7 -- 4+g +7 *2=

9

+7 +2+4

"'

etc' v

en

general:

a*b=

¡,Í

b+a

b)Lapropiedadconmutativadelamultiplicacióndicequeelordendecolocación de los factores no altera el producLo' Ej:

2x4x9x7= 4x9x7x2= 9x7x2x4 neral.

""etc'yenge-


r

ab=ba c) Si en una operación indicada hay dos o más de las operaciones fundamentalec, efectúense primero los productos y cocientes y después las adiciones y restas.Ej:

7x4 +27:9- 4x5 (7x4)+(2729)-«x5)=

-

=

28+3-20=11

d)

Si una expresión está dentro de un paréntesis, debe considerársele como un ii) por la propie-

solo número, pudiéndosela tratar: i) efectuandoprimero la expresión; o dad distribuitiva de la multiplicación. Ej:

i ¡¡)

4 (L2-9) - 4x3=, 4 (L2 - 9) = 48'36=

-

12 12

e) La raya o línea de quebrado indica que ef numerador y el denominador deben ser operados separadamente. Ej:

18-3 = 15 =l 5 15

10+

40-L5 -25 B8 pero nunca:

- 5-15=-10

tesis,

0

El signo de radical también se debe entender con funciónsemejantealparénLratando como un solo número Ia expresión subradical. Ej:

,/36-=25 --A. pero nunca:

6-5

-1

rt


37

5.3:

CIFRAS SIGNIFICATIVAS'

distlntos de cero y al cero Se llaman cifras significat¡vas a todos los números mismo cuando estáentre dos números;o sea: ta un valor. Así, el número 8 tiene una cif 7t5 a B'5; el número 48 Liene dos cifras 47t5 a 4Br5; el número 314 tiene Lres ci

3l.4'5; el número 105 tiene [ambién tres c 105'5; pero el número 50 solo tiene una ci mero de 45 a 55, lo cual nos dice que cuan sino que sirve Para indicar Posi ro tenga significación Y no esté sí: 50. poñiendo un Punto desP

el número 0'0004 tiene una ci pues los ceros solo indican que el

5.4:

; t

4 es del

CIFRAS EXACTAS DE LAS CANTIDADES APROXIMADAS'

es necesariosabercuán Cuando en el cálculo intervienen números aproximados muchas cifras que, en con para Lrabajar no tas ciFras se han de retener en el resultado,

afectandemayoprecisióneSoSresultados.De2omásnúmenúmerode cifras

ados se dice

qíe

gnificativo el que tiene menor

aS,oelmenoseaproximaciones.Deacuerdoaestosecons¡deran para el cálculo Ios casos siguientes:

a)SivariossumandossonsignificativoshastaelmismoordenoúItimacifra

orden' Ejemplo: si las cande Ia derecha, entonces la suma es significativa hasta ese (unidades en este caso)'la orden último el hasta significativai tidades 6, 45 y 54 son

sumadeellas=l05tienetrescifrasexactasenmenosmásmediaunidaddelúltimo l-00' para-que se -enárJen. ta suma de los números 25, 37 y38 debe esqribirse = tiendaquelastrescifrassonsignificativas.lgualmentelasumade0,43,2'18y es válido 15,04 =!7,65 tiene fuatro cifias significativas. Este caso de la adición también para la resta.

ta el mismo orden o última ciino hasta el orden del número

Ia suma de 15' 62,143'0lB s en menos más media unidad ma no es significativa sino hasta la última . Estecaso de laadiciónesválidotambién para la resta.

ti


38

c) Para la mul[iplicación puede ocurrir: i) si los factores son números exactos, el producto también lo será; ii) si uno de los factores es aproximado y el otro exacto, el producto no puede tener más cifras exactas que las que tiene el número aproximado; iii) si los factores son números aproximados, el producto no puede tener más cifras exactas queel factor menos exacto o de menos cifras significativas. Estos casos son válidos para Ia división. En la práctica la observancia de estas reglas solo se aplicaalresultado final de Ia operación,

5.5:

RED0NDEAMIENT0 DE CANTIDADES.

El redondeamiento de cantidades consiste en eliminar una o más cifras, dejando el número Io más próximo posible del orden de su última cifra. EI redondeamiento se hace con base en las ciftas significativas. Para redondear el número 283 se dejaría en 280, pues 283 está más cerca de 280, que de otro número cualquiera expresadoen de cenas.

Con los decimales debe procederse en igual forma. Si se desea redondear 4t 384 hasta las centésimas sería 4r38 y hasta las unidades 4. En el redondeamiento se suprime o aumenta media unidad del orden de la cifra que se va a eliminar. Si sesuprime una cifra superior a5, la cifra anterior debe ser aumentada en una unidad; y si la cifra suprimida es inferior a 5, la cifra anterior queda sin alterar.

Si la cifra que se ha eliminado es el 5, se ha convenido queel redondeamiento d la cifra que precede al 5 es par: entonces queda inalterada. Ejemplo 28'5 redondeado hasta las unidades es 28. b) Ia cifra que precede al 5 es impar:enion ces se aumenta en una unidad. Ejemplo: 17'5 redondeado hasta las unidadeseslB. Lá regla, como se advierte, es arbitraria, no tiene fundamento matemático, pero es útil y se haga así:

práctica pues en varias operaciones es de esperarse que los redondeamientos por defec-

to (cuando la cifua precedente no se alterd y por exceso (cuando la cifra precedente

se

aumenta en una unidad), se compensen.

rj


F--

39

EJERCICIO

5

Escriba en el paréntesis la letra C o I según sea correcto o incorrectoloquese afirma a continuación:

1.

El número 10, que expresa una cierta medida, representa Ia dis-

tancia 915 a 10'5

2.

La propiedad distributiva de Ia murtipricación dice queerordende

colocacióndeIosfactoresnoa|teraeIproducto

3.

una de las razones por las cuares ros números estadísticos son aproximados, es Ia inexactitud de los instrumentos de medición

..

4. 5. 6. 7

,

B.

En la operación 5 x

6 + 24t 2 el resultado

correcto es

Según la propiedad conmutativa de la multiplicación,

40-L6=

24

B (5 - 2) =

()

El número 2t 0075 tiene cinco cifras significativas La raiz cuadradada

de - 64 es igual a -B

)

El número 7t 35 aproxinado hasta el orden de las décimas

igual a 7t 4

9.

27 ...

() ()

es )

El cero es cifra significativa si está indicando er lugar que ocupa otro número. Por ejemplo en el número 0' 005 los cáros'son sig_ nificativos

10.

si varios entonces

sumandos no son significativos hasta

el total

será significativo hasta que tiene menos cifras significativas

el

er mismo orden,

orden del sumando

f:l


TEMA Vt/

6.1, Los doios,procedencio y ordenoción. 6.2: Recuento de cosos.6.3: Frecuencios obsolutos y relotivos. 6.4: dist¡ibución de frecuencios. 6.41: Dist¡ibución de frecuen cios de volores sin ogrupor. 6.42: Distribución de frecuencios de volores ogrupodos. 6.# ln+e¡volos y morcos de closes. 6.51: Número y omplitud de tos inlervolos. 6.52:- Recorrido de lo distribución. 6.53: Cocientedel recorrido entre el número de intervolosl 6.54: Amplitud de los inte¡volos. 6.6: Límites reoles de los intervolos.6.6l: lnte¡volos de omplitud constonfe y vorioble.6.7: Di stribuciones ocumulo tivos. Eiercicios.

d


4t

6.1:

LOS DATOS, PROCEDENCIA Y ORDENACION.

Los datos se obtienen generalmente de observaciones empír¡cas (experiencias) otras veces existe una fuente que ya ha recogido las informac¡ones, por ejemplo el Departamento de Estadística Escolar del Ministerio de Educación Pública, la Dirección General de Estadística, las publicaciones de otra institución, etc. Los datos que presentamos a continuación corresponden a las puntuaciones alcanzadas por un grupo de 329 alumnos a los que les fue aplicada por la Sección de Evaluación Escolar, Ia prueba de rendimiento escolar en Ciencias Naturales lCurso Prevocacional, en 1958. Calificadas las pruebas seobtuvieron Iosresultados siguientes:

84, 86, 77, 90, 81, '7L, 88, 67, 90, 75, 36, 56, gL, 68, 52, 58, 59, 79, ,85, 22, 92, 7L, 16, gg, 85, gl ,

62,57,55,39,49, 48, 32, 42, 44, 39, 35, 47, 30, 40, 39, 46, 52, 39. Lo primero que ustedes observarán es que las puntuaciones anteriores están desordenadas/ o sea, no hay orden en su presentación. Es necesario ordenar los datos ya sea ascendentemente (de menor a mayor), o descendentemente (de mayor a menor). Los datos anteriores, ordenados ascendentemente quedan en la forma siguiente:

L6, !2, 32, 32, 37, 37,

23, 24, 32, 32, 37,

24, 25, 28, 28, 30, 3l , 3L, 3l , 3I , 33, 33, 34, 35, 35, 36, 36, 36, 36, 89, 90, gl, 91, 94, 95, 95, 97, gg.

La ordenación de los datos es imprescindible para el recuento de casos

y cál-

culos posteriores.

6.2:

RECUENTO DE CASOS.

El recuento de casos consiste en anotar cuántas veces aparece repetido cada

valor. Este recuento, que es parte de la tabulación, se puede hacer de distintas maneras; las recomendadas por más cómodas son las siguientes: a) Por tarjado. Consiste en asignar una rayita vertical o inclinada cada vez que aparece un valor, asi /= unavezi // = dos veces; /// = tres veces; //// = cuatro veces. Cinco casos se denotaconcuatro rayitas y una horizontall. t75? = c¡nco veces; ?rr1 / = seis vecesi ?rtq // =s¡ete veces

.

////-

diez veces,

etc. b)

por cada vez que aparece un valor, así:

Por puntos. Consiste en asignarun punto

rJ


42

una vez

dos veces

tres veces

:: = ': =

cuatro veces

cinco veces etc.

Los datos, ya ordenados, los escribiremos en columna. A la derecha de los vatores (puntuaciones en este caso), haremos el recuento de casos y, seguidamente, en otracolumna, la suma de los casos. En el ejemplo de las puntuaciones en laprueba de Ciencias Naturales, tendremos: Recuento

Valores

Suma

t6

I

22

1

37

,-t1/

55 *tq

15

Etcétera.

6.3:

FRECUENCIAS ABSOLUTAS Y RELATIVAS. Se llama frecuencia de un valor al número de veces que apareceen laexperi(tmero de veces que ha AsÍ, en o vemos q las Puntuaciones en Ia e 5 tiene es stl ftecuencia luego, o s 15 al la frecuencia del valor i6

ese punteo.

Tal como hemos considerado la frecuencia, esta se denomina frecuencia absoluta; número de veces que se repite un valor de la variable;ennuestroejemplo lava_riable es el rendimiento escolar en Ciencias Naturales. En la notación estadÍstica se

rl


43

suele deslgnar Ia frecuencia absoluta por rrf, que es Ia

inicial

de

frecuencia. EIto-

tal de casos es la sunta de las lrecuencias y se suele designarlo por N (ene mayúscuIa). Así, en nuesLro ejenrplo, N = 329.

Cuando la frecuencia absoluta "f" de un valor se divide entre el total N decasos/ a este cociente, indicado o efectuado, se Ie llama frecuencia relativa oraz6n frecuencial y se denota por fr(efe minúscula prima). De tal manera que en el ejemplo dado, la frecuencia relativa del valor 16 es l/329; la del valor 37 es5/329; ladelvaIor 55 es 15/329, etc. La suma de las frecuencias relativas de todos los valores de una variable es igual a Ia unidad, pues Ios numeradores son las frecuencias absolutas cuya suma es igual a N; y e I denominador es N/ resultando Ia suma N/I\l = 1. Vemos pues, que el recuento de casos nos sirve para obtener las frecuencias absolutas y relativas de los valores de la variable. En los libros de Estadística Matemática suele denominarse simplemente frecuencia a Ia frecuencia relativa. En es[os apuntes, sin embargo, Ilamaremos frecuencia a Ia frecuencia absoluta, ya que por losalcances Iimitados que tiene no trabajaremos con frecuencias relativas sino absolutas.

6.4:

DISTRIBUCI0N DE FRECUENCIAS.

"Cualquier manera de presentar los datos estadísticos, siempre que exista un lógico criterio de ordenación, puede recibir elnombre genérico de tabla estadística. Si los datos se presentan en dos columnas (o filas) conteniendo una de ellas los valores de Ia variable y la otra el número de observaciones -frecuencia absoluta o repeticiónque corresponden a cada valor o grupo de valores de aquella, se tiene una tabla denominada de distribución de frecuencias. EI mismo nombre seempleacuando Iasrepeticiones o frecuencias absolutas se sustituyen por las frecuencias relativas (o simplemente frecuencias) obtenidas dividiendo aquellas por el número total de observacionestt (24). La distribución de frecuencias es, pues, una tabla estadística en la que los valores se presentan siguiendo un orden lógico; este orden es, en general, presentar la tabla con 2 columnas: una para fos valores de la variable y otra para lasfrecuencias de esos valores. Cuando los datos no constituyen distribución de frecuencias se lesdenomina serie simple. Las distribuciones de frecuencias se pueden hacer, según el número de datos y las necesidades, de las maneras siguientes: a) DisLribuciones ordinarias de frecuencias de valores sin agrupari b) Distribuciones ordinariasdefrecuenciasdevalores agrupados; y c) Distribuciones acumulativas. Además de esLos casosestálaordenación de datos en serie simple, que es el más elemental.

rJ


44

6.41:

Distribución ordinaria

de

Cuando en Ltna variable aparecen 15 o nrenos valores diferentes, se pueden presentar Ios datos en una distribución ordinaria de frecuencias de valoressin agrupar' Para hacerla hemos de formar una labla con dos columnas: una que conLienelos valores de la variable y oLra que conLiene las Frecuencias absolutas o repeliciones de dichos valores. La columna de valores de Ia variable se designa por Xi (equis mayúscula subD y la columna cie frecuencias, como se dijo, por'rfrr. Generalmente se escribe arriba de la tabla la relación de losdatos que contieney en la parte inferior sealude a la fuente o se aclarasi los datos son no empíricos. La tabla siguiente con[¡ene Ia dislribución de frecuencias del porcentaje de errores cometido en un dictado en 50 niños de9años de edad.

TABLA

I

FRECL]ENCiA DEL TANTO POR CIENTO DE ERRORES DE DICTADO EN 50 NIÑoS DE NUEVE AÑOS

xi

,,f,,

3

2

5

1

6

1

7

3

8

4

9

4

10 11

2

t2

5

13

5

74

8

15

4

16

3

18

1

19

¡,1

1

N -ñFUENTE:

"La medida ob.jetiva de1 trabajo escolar' por

A.

Ga1f. Pág


45

6,42:

Distribución ordinaria de frecuencias de valores agrupados.

Si el número de valores que toma la variable es muy grande, siempreque se trate de valores distintos,conviene hacer una agrupación de dichos valores. Por ejemplo, lascalificaciones alcanzadas por los alumnos en Ia prueba de Ciencias Naturales ya citada, varÍan desde 16 puntos hasta 99 puntos. Obteniendo Ia diferencia que hay entre dichos valores,99'16, vemos que hay B3 valores distintos entre la puntuación menor y la mayor. Esta diferencia recibe el nombre de recorrido o amplitud de Ia distribución, aunque Lambién se le Ilama variación máxima. Cuando sucede que en la variable hay 15 o más valores distintos se debe hacer la agrupación de ellos. La agrupación se hace según los pasos siguientes:

6.5:

INTERVALOS Y MARCAS DE CLASE.

Cada grupo de valores de la variable recibe el nombre de intervalo. Los intervalos pueden ser de amplitud variable o constante. Amplitud del intervalo es el número de valores o unidades de medida que contiene. Aunque no hay reglas determinadas para hacer los intervalos o grupos de valo-

res, los autores recomiendan que la distribución no contenga más de veinte intervalos porque entonces Ia agrupaciónpierde su carácler de resumen, que es lo.quese persigue; y lampoco que contenga menos de 10 intervalos porqueentonces la distribuciónseresume demasiado.

Un intervalo cualquiera viene dado por dos números que forman sus límites. Por ejemplo, 16 - 20 es un intervalo donde el límite inferior es I6 y el superior 20; entenderemos que el intervalo 16 - 20 , incluyendo ambos límites, comprende todos Ios casos de valores que están entre 16 y 20.

El valor central de un intervalo, o sea la semisuma de sus lírnites, recibeel nombre de marca de clase o puntomedio. Si una distribución defrecuencias estáagrupada en intervalos, a las marcas de clase se les designa por Xi, tal como a los valores de la variable; o por Xm (equis mayúscula sub-eme) cuando se ledaelnombredepunto medio. Por ejemplo, la marca de clase o punto medio del intervalo L6-20 es Xi = 18, que es el valor que queda en el cenLro del intervalo, obtenidodedividirentredos la suma de ambos límites.

6.5I:

Aunque, como ya se dijo, no hay reglas fijas para la determinación del número y amplitud de los intervalos, esacon-

sejable, para formar una distribución de lrecuencias de valores agrupados, seguir Ios

)

J:I


46

pasos siguientes:a) determinar el recorridooamplitud a" lu A¡rtr¡Urción; b)dividir el recorrido entre el número de intervalos que se desee; y c) el cociente de la división anterior será la amplitud de los intervalos. De acuerdo a lo anterior, para dis[ribuir por intervalos la caliticación de la prueba de Ciencias Naturales, procederemos así:

El recorrido o amPlitud lo de6.52: notaremos por (A) y se definecomo la diferenciaentre el valor mayor menos el valor menor, más una urnidad, de Ia variable. Se expresa mediante la fórmula:

A=(Xs-Xi)+1

(1)

en la que:

A-

amplitud

Xs = valor

X¡ =

o

recorr¡do

máximo o mayor valor mínimo o menor

de la distribución. de la distribución, de la distribución.

la prueba de Ciencias Naturales, los valores de la va99. Luego, aplicando la fórmula (1), será: A= (99 -16)+l- = 83*1= 84

En nuestro ejemplo de

riable van desde

16

hasta

6.53: Cociente del recorrido entre el número de intervalos. En la distribución dicha deseamos t'rabajar con 15 intervalos. Dividiremos entonces la amplitud o recorrido entre el número de inLervalos y será 84/15 ='5r6. 6,54: Amplitud de Ios intervalos. El cociente5'6es Ia amplitud de los intervafos de la distribución. Podemos tomar ampli[ud 6 por excesoo amplitud 5 por defecto. Tomaremos la segunda. Nuestros intervalos, pues, tendrán amplitud igual a cinco unidades. Ya tenemos el dato sobre el número de intervalos y la amplilud de losmismos. El paso siguientepara obtener la distribuciónde frecuenciasdevalores agrupados es ordenar los grupos y fijar los Iímites de los intervalos. Para ordenar los intervalos comenzaremos por el primer intervalo de la distribución;éste, forzosamente, será a partir de la puntuación o valor más bajo que sehaobservado.Ya sabemosque estevalor es f6. F¡jamos como lÍmi[e inferior del primer intervalo el valor 16 y Ie agregamos 5 unidadesde amplitud, o sea:16, L7, 18, 19 y 20, con Io cual tenemos cinco unidades; por tanto, el primer intervalotendrá como límite inferior el número 16 ycomo superior el núme-

ro 20, esto es: L6

- 20.

,,

Después del primer intervalo haremosel segundo;éste tendrá como límite infe20, o sea 2L. Agregando siempre 5 unidades al valor2l

rior el número siguiente al

rJ


47

tendremos el segundo intervalo, es decir, 2L, 22,23,24, inferior y superior del segundo intervalo son 2l - 25.

26

y 25. Luego, Ios límites

De esta manera se sigue para los demás intervalos que son, consecutivamente:

- 30,31 - 35, 36 - 40, 4L - 45, etc. En el último intervalo quedará compren-

dida la máxima puntuaoión alcanzada en la prueba. Para ver cuántos casos (frecuencias absolutas o repeticiones) corresponden a cada intervalo, hemos de hacer el recuento de los casos comprendidos entre los valores de cada intervalo, incluyendo, como yahemos apuntado, los límites del mismo. Este recuento aparece a continuación: INTERVALOS

RECUENTO DE FRECUENCIAS

SUMA

t6-20 2r-25 26-30 3t-35 36-40 4t-45

46-50 51-55 56-60 6L-65 66-70

7t-75

76-80 81-85 86-90

9t-95

96-100, Nos han salido 17 intervalos en vez de 15; no importa. Se debe a que en vez de 5'6 que era la amplitud hallada hemos tomado 5; si en lugar de 5 hubiésemos tomado 6 de amplitud nos habrían salido menos de 15 intervalos. Por otra parte, estamos dentro de los límites recornendados, esto es, que no haya menos de 10 intervalos ni más de 20. Ahora solo nos resta presentar fos datos agrupados en forma de distribución de frecuencias. Para esto formaremos tres columnas: 1) la que contiene losintervalos; 2) la que contiene las marcas de clase; y 3) laquecontiene las frecuencias. Esta distribución la vemos en la tabla siguiente:

t:l


48 TABLA

II

DISTRIBUCION DE LAS PUNTUACIONES ALCANZADAS POR 329 ALUMNOS DE PRIMER EN UNA PRUEBA DE CIENCIAS NATUMLES (Intervalos de amplitud comtaDte)

GMDO PREVOCACIONAL,

INTERVALOS

MARCAS DE CLASE

FRECUENCIA

xi

f

16-20

18

26-30

28

1 5

4 AJ

36-40 4t-45 46-50 51-55 56-60 61-65 66-?0 7l - '15 76-80 81-85 86-90 91-95 96

38

20

43 48

39 51

58

4l

63

2'.1

68

20 ¡ó

16

83

2l

88

1

- 100

93 98

2

329

FUENTE: Secclón de Evaluaclón Escolar,Consejo Técnlco de EducacÍón

cional.

6.6:

LIMITES REALES DE LOS INTERVALOS.

Ya sabemos que los números estadísticos no son absolutamente exactos, pues síes aproximada, Iosnúmeros, en tanto significan medida, están afectados de ese carácter de aproximación o carácter estadístico. por razón de que la medida en

Por esta razón se ha convenido que si un número expresa medida, este número representa a todos aquellosque están más cercade su última un¡dad quecualquiera otra. Se exceptúa de esta condición a las frecuencias porque los números que indican tales, son números de valor absoluto, Io cual es evidente con solo pensar que las frecuencias indican casos o número de observaciones enteras. También sabemos que muchas de las medidas psicopedagógicasson, por una parte, aproximadas; y por otra continuas; y que en una variable continua, un valor cualquiera no representa nunca un punto aislado sino una cierta distancia.

En la práctica se suele trabajar con cantidades discretas, aún siendo conti-

r.l


49

nuas/ pero para Ios cálculos debemos tener en mente el carácter aproximado de los números y sucontinuidadsi se refierena mediciones. Por eso, en la distribución agrupada de Iatabla ll, aunque los intervalos se han hechosobre la base de números discretos (comodidad para cálculos), no debe olvidarse que esos números significan medidas de un fenómeno: rendimiento escolar; y, por tanto, debe considerárselos como aproximados y continuos. Así, el primer intervalo definido por los Iímites 16 - 20, expresado en su 'rvalor extensiónrr, serÍa 15'5 - 2O'5; esta manera de determinar los límites es Io que sé llama "límites realesrrde IoS valores continuos. Por ejemplo, el número

15 tiene, como medida, fos límites reales 14'5 a l-5'5¡ el número 16 los lÍmites 15'5 a 16'5; el número20los Iímites 19'5 a20t5. Luego, el intervalo 16 - 20tiene como límites reales 1515 - 20t5. EI siguiente intervaloque es el 2l-25, tiene como Iímites reales 20'5 a25t5¡el otro, que es 26 - 30 tiene de límites 25'5'30'5 , etc. Aunque estos Iímites no se escriben precisamente con sus límites reales, se sobreentiende, para loS cálculos, que eSoS números son aproximadosy continuos/ y por lo mismo, habrá de considerárseles como tales. Con esto se persigue mayor precisión en los resultados y respetar lacontinuidad de los valores. De esta forma, el límite real superior de un intervalo coincidirá con el límite real inferior del intervalo siguiente, y asísucesivamente. En la distribución de la Tabla ll podemos notar esta continuidad pues, considerando los límites reales, Ia intervalación queda: 15'5'- 20'5,20t5 -

2515,

..,

25',5

- 30'5,

3015

- 35t5, 35t5 - 40'5,

etc.

Cuando se adopta Ia forma continua para los Iímites de los intervalos, ya hemos visto que el Iímite superior de un intervalo coincide con el lÍmite Inferior del si-

guiente; el Iímite superior deéste coincide con el límite inferior del que le sigue, etc. Un caso de esta intervalación en grupos continuos, es por ejemplo, el siguiente: INTERVALoS 1 III

0- 5 5-15 15-35 35-85 85-95 Como ocurre que entoncesno sepamos concretamente si los casos o frecuencias correspondientes al valor 5 están contenidas en el intervalo 0-5oen el intervalo 5-15; y Io propio sucede con las frecuencias de los valoreS 15, 35, 85, se ha convenido que, al presentarse tablas en dicha Forma, sehagaunallamada indicando de que manera están tomadas las frecuencias de los valores límites. Generalmentesehaceexcluyendo las frecuencias de los valores que sirven de límite superior de un intervalo e

¡,f


50

incluyéndolas en el siguiente. En resumen: si los intervalos están en números discretos, como en la tabla ll, se deberán sobreentender los límites reales; y si están en forma continua, como enel ejemplo precedente, se deberá sobreentender que las frecuencias de losvaloresquesirven de límite superiora los intervalos estánexcluidas y Que, a su vezl se hallan inclui-

das en el intervalo siguiente. En todo caso, siempre se haceunallamada sobre este aspecto.

Los intervalos de la dis6.61: tribución de la tabla ll son de amplitud constante; en todos y cada uno la amplitud es la misma. Así, pues, una distribución de frecuencias de valores agrupados tiene amplitud

constante,cuandoentodoslosintervaloshayelmismonúmerodeunidades. ejemplo la amplitud es de

En nuestro

5 unidades.

Una distribución de valores agrupados también sepuede hacer utilizando intervalos de amplitud variable, o sea que los intervalos/ aunque sea sólo uno el que difiere, no tienen entre sus Iímites el mismo número de unidades o valores.

EI hecho de trabajar con intervalos de amplitud constante es sumamente út¡l en la práctica, pero esto no es de rigor. En realidad, tanto el número de intervalos como la amplitud de los mismos depende de las características del estudioque se quiera hacer. Es decir, hay ocasiones en las que conviene la amplitud variable y no la constante. Veamos, como ejemplos de lo dicho, dos distribuciones en las que, tratándose de los mismos valores y frecuencias, se han hecho intervalos de amplitud constanteprimero (tabla Ill) y de amplitud variable después (tabla lV).

,l


r" 51 TABLA III DISTRIzuCION DE tAS FABRICAS DEDICADAS EN SANTANDER A LA INDUSTRIALIZACION DE PRODUCTOS PESQUEROS. SEGUN EL NUMERO MEDIO

DE

PERSONAS OCUPADAS EN 1952. (Intervalos de amplitud constante)

PER§ONAS OCUPADAS

lINtpnvALos.

0306090 120' -

NUMERO

MARCAS DE

30 60 90 120 150

DE FABRICAS

CLASE

xi

f

15

72

45

8

75

4

105

3

135

3

N=

90

FUENTE: Vademecum de Estadftica. Instituto Nacional de EstadÉtica. Madrid 5?.

(')

En cada intewalo se excluyen las obse¡vaciones suPerro¡,

TABLA

cuyo valor sea igual aI lflnite

IV

DISTRIzuCION DE I¿,S FABR.ICAS DEDICADAS EN SANTANDER A LA INDUSTRIALIZACION DE PRODUCTOS PESQUEROS, SEGUN EL NUMERO MEDIO

DE

PERSONAS OCUPADAS EN 1952.

(Intervalos de amplitud variable).

NUIvIERO

PERSONAS OCUPADAS INTERVALOS

MARCAS DE CLASE

xi

0515306090 -

DE FABRICAS

f

5

z',5

15

10'0

31

30

22'5

14

60

45'0 75'0 1 20'0

8

90 150

4 D

N=6-

4


52

En Ia distribución de las tablas lll y lV podemos notar: a) que los intervalos están en forma continua, por lo cual se hace la llamada correspondiente sobre Iaforma como están tomadas las frecuencias de los valores que hacen de límites superiores; b) que en Ia tabla lll el primer intervalo, 0-30 casi contiene todas las frecuencias, mientras que en la tabla lV las observaciones se hallan mejor repartidas. Portanto, según las características del estudio, asíserá el tipo de intervalación queconvenga.

6.

7:

DISTRIBUCI0NES ACUMULATIVAS.

Se da este nombre a las distribuciones de frecuencias/ ya sea que los valores estén sin agruparo agrupadosen intervalos de amplitudconstante ovariable, en las que las repeticiones, observaciones o frecuencias se vansumandooacumulandoasí: la frecuencia acumulada del primer valor o del primer intervalo es su correspondiente frecuencia absoluta; Ia frecuencia acumulada del segundo valor o intervalo es lasuma de su frecuencia absoluta más la frecuencia absoluta del primer valor o intervalo; Ia frecuencia acumulada del tercervalor o intervalo es la suma de su frecúenciaabsoluta más la acumulada del segundo valor o intervalo; la acumulada del cuarto valoro intervalo es Ia suma de su frecuencia absoluta más la acumulada deltercero, etc,

Llamando "F" (efe mayúscula) a la frecuencia acumulada, ce/ en general, según el cuadro siguiente:

VALORES

xÍ x 1

FRECUENCIA ABSOLUTA

su obtención se ha-

FRECUENCIA ACUMULADA

f ,1

r,

1

f

1

x2

fz

xg

r^J

,3

+ *

f4

F,

f4

*FB

f2

E

'1 Fz

En la tabla Vdamos la distribuciónacumulativa de nuestro ejemplo de ba de Ciencias Naturales (tabla ll).

¡il la

prue


53

TABLA V DISTRIBUCION ACUMULATIVA DE LAS PUNTUACIONES ALCANZADAS

POR 329 ALUMNOS DE PRIMER AÑO PRTVOCACIONAL EN UNA PRUEBA

DE

CIENCIAS NATURALES (Intewalos de amplitud constante)

INTERVALOS

r.6

-

20

- óu 3L-35 36-40 41-45 46-50 51-55 56-60 61-65 66-10 7l-75 76-80 81-85 86-90 91-95

MARCAS DE

FRECUENCIAS

FRECUENCIAS

CLASE

ABSOLUTAS

ACUMULADAS

xi

f.

18

1

1 6

¿o

96 - 100

F.

4

10

13 38

20 24

4

43 67

106

53

51

15?

58

4t

198 225

68

258 20

?8

16

294

83

2L

315

88

,|

98

2

5

329

N=329 FUENTE: Tabla tr.

Es interesante tomar nota que Ia última frecuencia acumulada es ¡gual a N,total de casos o suma de las frecuencias absolutas. Esto puede servir para comprobar si la acumulación ha sido bien hecha.

La lectura de las frecuencias acumuladas se hace así:'rtantos casoshasta tal valorrr. Ejemplo: Vemos en Ia columna F que hay 198 casos hasta el valor60,060,5, que es el Iímite superior del intervalo 56-60. Una última observación sobre los intervalos de amplitud constante/ nos hace ver que los Iímites inferiores deben guardar entre sí Ia misma distancia: L6, 2l , 26, 3l ,36,41 , etc. Lo propio ocurre con los límites superiores: 20,25,30, 35,etc. Estas circunstancias se manifiestan también en las marcas de clase o punto medio de

los intervafos 1-8,

23, 28, 33, etc.

'.i


54

EJERCICIO

ó

a) Escriba en el paréntesis la letra C o I según sea correcto o incorrectoloque se afirma a continuación.

1.

Los datos que se usan en EstadÍstica pueden proceder de una tuen-

te que los haya recogido

2.

La serie:

previamente .

16,19,23, 20, 25, 30,

(

)

está ordenada ascendente-

mente

()

3.

La relación por cociente

4.

La suma de las frecuencias relativas de unadistribucióndefrecuencias es igual a la unidad

()

5.

La serie que aparece en el No. 2 de este ejercicio formaunadistribución de frecuencias

()

6.

Los términos "estadísticasrry rrEstadísticarrson

(

7.

Al número de veces que aparece repetido un valor Xi cualquierade

f/N

se llama raz6n frecuencial

sinónimos

Ia variable se Ie denomina frecuencia absoluta

B.

La serie:

30, 25, 23, 20, L9, 16, está

ordenada decrecien-

()

temente

()

9.

Cuando los datos no están en forma de distribución de frecuencias se les denomina serie simple

()

10.

En una prueba de Matemáticas/ la puntuación 55 se repite Bveces siendo el total de alumnos exam¡nados 204. Luego, el valor 55 tiene de frecuencia relativa B/204,

()

b)

Los datos (depurados) que se le dan a continuación, corresponden a una 190, de las puntuaciones alcanzadas porungrupo de alumnos en una prueba de rendimiento escolar, en Estudios Sociafes I Curso Prevocacional.

muestradetamaño N =

Con dichos datos efectúe las siguientes operaciones:

i)

Ordene los valores en sentido ascendente (menor a mayor).

)

ft,


55

ii) Determine el recorrido de la variable, aplicando la fรณrmula No. I. iii)

Agrupe los valores en intervalos de amplitud constante igual a tres (3)unidades, en ordenaciรณn ascendente, haciendo el recuento de casosofrecuencias correspondiente.

iv)

Construya una tabla o cuadro estadร stico de la distribuciรณn de la variable, conteniendo las columnas siguientes: 1) lntervalos; 2) Marcas de clase; Frecuencias relativas; y 5) Frecuencias 3) Frecuencias absolutas; absolutas acumuladas.

4)

DATOS

40 37 50 35 33 49 3t 46 36 43 38 39 29 40 37 43 45 36 32 39 42 "qz 46 39 37 40 45 35

46 38 28 33 29 4t 36 35 42 48 35 36 35 37

30 46 37 40 38 37 3t 38 33 42 40 37 45 39

33 4t 25 37 40 33 34 29 35 43 18 40 46 36 4t 37 48 30 34 27 37 28 36 47 32 4t 32 39 35 34 47 34 44 47 30 35 42 39 4t 32 40 49 39 32 4t 43 35 34 42 47 39 32 32 48 46 4t 35 36 43 42 4L 37 38 34 4t 35 38 34 35

27 27 38 40 38 49 28 35

42 34 40 37 27

33 42 25 50 30 43 39 35 47 38 35 32 36

3t 29 32 45 24 40 37 40 35 45 43 42 35

23 44 4t 38 36 3L 47 39 42 43 42 43 40

39

35 33 49

45 4L 29

42 33 36 33 39

36

nl


TEMA VII

7.12 Representoción 9ráf ico. lmportoncio. 7.2: Gróf ico de uno distribución de frecuencios. 7.21; Fundomentoción de lo dio' gromóti co lineol. 7.3; Diogromo de borros. 7.4: Pollgono de lrecuencios.7.5: THisiogromo de Peorson' 7.63 Histogromo de uno distribución ie frecuencios de volores ogrupodos en inter' volos de omplitud constonle' 7.ól: Histogromo de uno distribución de volores ogrupodos en intervolos de omplitud vo¡ioble. 7.7: Suovizoción o pulimento de curvos: método oritmético' 7,8: Diogromo ocumulolivo. 7.81 ¡ Diogromo ocumulotivo de volores ogrupodos en intervolo s- 7.9: Otros iipos de gróficos' 7.10: Diogromo de sectores. Eiercicios.

it


57

7.1:

REPRESENTACI0N GRAFICA. IMPORTANCIA.

Se llama representación gráfica a las diversas maneras de expresar Ios datos estadísticos utilizando los medios de representación que proporciona la Geometría. Para ello se estableceuna correspondencia entre los puntos, líneas, superficies, etc, geométricos y los datos empíricos: valores de la variable, frecuencias, etc. La representación gráfica de uno o más fenómenos es un valioso auxiliar en

la interpretación, si cons¡deramos:

a) b) c) d) 7.2:

Que permite hacerse idea, a simple vista, deldesarrollo del fenómeno; Que completa la descripción del hecho y refuena los datos calculados matemáticamente; Que en la mayoría de los casos es ¡mpresc ind ible su uso; Que satisface las necesidades de divulgación y de información a las masas.

GRAFICA DE UNA DISTRIBUCI0N DE FRECUENCIAS.

Aunque hay muchas maneras de hacer gráficos representat¡vos, los más usados en Estadística son los cartesianos. Aprovechando las coordenadas deun punto,se representan las distribuciones de frecuencias fundamentalmente de tres maneras: a) Diagrama de barras; b) PolÍgono de frecuencias, y c) Histograma de Pearson. 7 ,21:. Elfundamento de Ia representación gráfica es el métodode Iascoordenadascartesianas ortoganales. Dos rectas perpendiculares entre sídividen el plano en cuatro partes. A la recta horizontal se le llama eje de abscisas o eje de las X y se indica por las letras X, X', a Ia recta vertical se le llama eje de ordenadas o eje de las Y, y se Indica por las letras Y, Yr. EI punto donde se cortan se denomina origen y se indica por la letra 0. Todo punto situado en este plano puede ser medido en dos direcciones; la que lo separa del origen sobre el eje de abscisas y la que Io separa del origen sobre el eje de ordenadas. Las dos medidas reciben el nombre de coordenadas del punto dado.

Utilizando estas coordenadas se representa una distribución de frecuencias en la forma siguiente: en el eje de abscisas (X, X') se toman los valores Xi de la variable; y en

el eje de ordenadas (Y, Y') las frecuencias

de dichos

valores. De esta

cuenta habrá siempre un punto que indicará Ia frecuencia que corresponde a un cierto valor Xi de la variable. Los cuadrantes del plano se numeran o leen en sentido inverso al moviffiento de las agujas del reloj. Convencionalmente se han asignado las direcciones positiva

rJ


58

y negativa, según el cuadrante donde se halle el punto dado. Las coordenadas delpunto se indican mediante las letras minúsculas (x, y)escribiendo primero el valor de abscisas y luego el valor de ordenadas. En el primer cuadrante (l), las abscisas y las ordenadas son positivas, esto es/ (x, y); en el segundo cuadrante, (ll) Ias abscisas son negativas y las ordenadas positivas, o sea, (-x, y); eneltercercuadrante(lll), lasabscisas y las ordenadas son negativas, o sea/ (-x, -y); y en el cuarto cuadrante (lV) las abscisas son positivas y las ordenadas negativas/ es decir/ k, -y). De lo anterior resulta que las abscisas son positivas cuando se toman a la derecha del origeno del eje de ordenadas; y son negativas si se toman a la izquierda. De manera semejante, lasordenadas son positivas cuando se toman arriba del origen o del ejedeabscisas;ysonnegativas cuando se toman por debajo. Ejemplo: en el plano cartesiano localizar los siguientes puntos, cuyascoordenadas son: Punto Punto Punto Punto

A= B_ CD_

3,4 -5, 3

-4, -3 4, -5

Según se sabe, estos puntos se localizan en los cuadrantes.l, respectivamente, así:

ll, lll, y

lV

ú Fig. 1:

Coordenadas cartesianas ortogonales.


59

En la prácticat para los gráficos estadísticos, se utiliza en la mayoría de los casos el primer cuadrante (l) del plano, es decir, abscisas y ordenadas positivas, debido a que Ios fenómenos psicológicos y pedagógicos toman sólo valores positivos. Así, por ejemplo, las calificaciones asignadas a un grupo de alumnos son todas positivas, lo mismo que las foecuencias. Hay casos/ como veremos más adelante, en los que, considerando Ias medias arbitrarias dedos variablescomo ejes coordenados,sene cesita utilizar Ios cuatro cuadrantes. No hay reglas estrictas en cuanto a la representación gráfica, pero síexisten algunas recomendacionesque puedenser consultadas, por ejemplo, en los siguientes textos: rrElementos de método estadístico"del ProfesorAndrés García Pérezi " Estadística Comercialrrdel Profesor Ernesto Pino Quintana; y "Métodos Estadísticos aplicados a la Educación", de los Profesores Matías López Ch. y Pablo Ortega Mora-

les. Fuera de la información contenida en esas recomendaciones, agregamos las siguientes de orden práctico:

1. Los valores de la escala de abscisas para la representación gráfica, no forzosamente deben ser los inismos que se usen para Ios cálculos matemáticos, pero conviene que así sea. 2.

Previamente a hacer una gráfica se deberá medir

el papel de que se dis-

pone/ para calcular el espacio que ocuparán las escalas correspondientes.

3. La longitud del eje de abscisas es deseable que sea precisamente recorrido o amplitud de Ia distribución. 4. La longitud del eje de ordenadas es deseable que sea de un por ciento de la longitud del eje de abscisas. 5. 7.3:

la

del

60 a un 75

Preferentemente se debe usar papel milimetrado para la graficación.

DIAGRAMA DE BARRAS.

El diagrama de barras (Fig. 2) o diagrama de ordenadas, se utiliza para representar una distribución de frecuencias de valores sin agrupar, como la que aparece en la tabla l. En el eje de abscisas se escriben los valores de Xi de lavariableyen el eje de ordenadas las frecuencias rrfrrde esos valores. Sobre el eje de abscisas se levantan segmentos rectilíneos perpendiculares hasta laalturade las frecuencias; de esta cuenta habrá un segmento para cada valor de la variable, que se corta a la alturade

t'tt


60

la frecuencia de dicho valor, Ejemplo: representar mediante un diagrama de barras los datos de ladistribu-

ción de la tabla l. Procedimiento: Esa distribución tiene un recorrido o amplitud total de A=17 valores; así, pues, en el eje de abscisas escribiremos los I7 valores de la variable: 3, 4, 5, 6.... 19;y en el eje de ordenadas las frecuencias de esos valores: 1, 2,

3.... 8. En una hoja de papel -como

la presente- disponemos de unos13.5 cms= 135 nn. para la longitud del eje de abscisas. Como debemos representar lTvalores distintos, dividiremos l35t17 = 7,9 = Bmm. aproximadamente. Entre cadados valores habrá una distancia de B mm; de manera que la longitud del eje X, X' seráde 17

xB=136mm. Como es deseable que el eje de ordenadas mida de un 60 a un 75"/"delalongitud del eje de abscisas, ensayamos cualquiera de los porcientos comprendidos entre 60 y 75 para ver cuál es el que más conviene. Tomando aproximadamente el 60"k, el eje de ordenadas tendrá una longitud de 81 mm. Como la mayor frecuencia de la distribución es B, dividimos 81:8 = 10.1 o aproximadamente 10 mm., que serálaunidad de medida en eleje de ordenadas, o sea I cm. Con los datos anteriores solo nos resta hacer la gráfica, según vemos en la figura 2. t.

J

"iÍ 6

1

¡

DTAGRAN'IA DE

!

10 11

12 13 14 1¡

BARMS, DATOS DE L,{ TABI,A I

ltl

\1

lE


61

L 7.4: L

L

P0LlG0N0 DE FRECUENCIAS.

El polígono de frecuencias (fig. 3) se utiliza para representar variables de tipo continuo cuando los datos están formando distribución de frecuencias/ya sea de valoressin agrupar o de valoresagrupados en intervalos. Si la distribución no estáagrupada, -por ejemplo Ia de Iatabla I -, bastará marcar en abscisas losvalores; las frecuencias se escribenmarcando un punto sobre el valor de abscisas,a la altura delafrecuencia correspondiente. Seguidamente se unen los puntos entre sí, con lo cual se obtiene una línea -generalmenle quebrada- que recibe el nombre de polígono de ftecuenc

ias.

Cuando la distribución está agrupada en intervalos, se toman en abscisas sus marcas de clase o puntos medios; y sobre cada una y a la altura de las frecuencias se marcará un punto. Uniendo después esos puntos se obtiene Ia representaci6n gráfica.

Ejemplo: Representar mediante un polígonode frecuencias la distribuciónde la tabla ll . Procedimiento: Lo primero que haremos será ver cuántos intervalos o marcas de clase tiene Ia distribución y decuánto papel se dispone. En la distribución de Ia tabla ll hay 17 intervalos, lo que equivale a decir que en el ejede abscisas hemos de anotar 17 puntos medios o marcas de clase. Si damos al eje de abscisas la longitud de 136nm., cada intervalo ocupará l36t17 = 8 mmi o, bien, que las marcas de clase estarán separadas por una distancia consecutiva de 8 mm. El eje de ordenadas, para Ia escala de las Frecuencias, es deseable que ten-

ga una longitud que varíe entre 60 y 75/. de la longitud del eje de abscisas. Tenemos, entonces, que ensayar cualquiera de los porcientos comprendidos entre 60 y 75 para ver cuál es el que más conviene. Si tomamos el 75"/", la longitud del eje de ordenadas

será de l-36x75 =102 mm. Es aconsejable, pues, que 102 milímetros de longitud.

el eje de ordenadas

mida

Es natural que la mayor frecuencia de la distribución ocupe toda la longitud del eje de ordenadas. En nuestro ejemplo de la tabla ll la mayor frecuencia a representar eÁ 51, o sea Ia del intervalo 51-55. Dividiendo la longitud del eje de ordenadas entre Ia máxima frecuencia, esto es l-O2.5L = 2, obtendremos launidad de medida en dicho eje, que será igual a dos milímetros. De modo que para cada frecuenc¡a conviene asignar 2 nlm. de longitud en ordenadas. Con los datos anteriores solo nos resta hacer el polígono de la distribución, segúnaparece en la figura 3 siguiente.

t-l


62

15

I(]

13 18 2B 28 38

0

3E 48 48 53 5tt Fig. 3:

7.5:

63 6E ?3 75 E3 8s 93 9E

Pollgono de frecuencias. Dalos de la tabla

103

II

HISTOGRAMA DE PEARSON.

Esta gráfica se construye por medio de áreas (b x h) y se ut¡liza/ de preferentipo continuo cuando los valores están agrupados en intervalos. La representación varía según que los intervalos sean de amplitud constante o variable. La base (b) de los rectángufos fa constituyen los intervalos, que se escribenen el eje de abscisas; y sobre cada una se levanta un rectángulo de altura (h) cuya áreaes igual (o proporcional) a la frecuencia o repetición de los valores contenidos en dicho in-

cia,

para variables de

tervalo. Para Ia construcción del histograma debemosconsiderardoscasos: a) la amplitud constante de los intervalos; y b) la amplitud variable de los intervalos. Además,ver cómo están tomados los Iímites: torma discreta o forma continua, como los de lastablas

lll y lV y ll resPectivamente.

rl


63

7.6:

HISTOGRAMA DE UNA DISTRIBUCI0N DE FRECUENCIAS DE VALORES AGRUPADOS EN INTERVALOS DE AMPLITUD CONSTANTE.

Sila amplitud de los intervalos es constante, setoma dichaamplitudcomo base de los rectรกngulosen el eje de abscisas,y sobre cadauna se levanta un rectรกngulo de altura igual a la frecuencia de Ios valores contenidos en el intervalo Ejemplo: Repres'entar grรกficamente, mediante un histograma de Pearson, la distribuciรณn de la tabla lll. Procedimiento: Dicha distribuciรณn tiene cinco intervalos de tipo continuo y 20 nn. de longitud en abscisas, ten dremos un eje dr20 x 5 = 100 mm = 10 cms. Es deseable que el eje de ordenadas tenga de 60 a 75 por ciento de la longituddel eje de abscisas. Si tomamos 72'h tendremos un eje de ordenadas de 72 nm. Como la mayor frecuencia a representar es 72 (la def intervalo 0 - 30), la unidad en el eje de ordenadas serรก de 72J2 =1, o sea que para cada caso daremos 1 mm. de longitud en ordenadas. De esta cuenta la mayor frecuencia ocuparรก todo el eje y la grรกfica guardarรก proporcionalidad. amplitud constante. Si a cada intervaloasignamos

figura 4,

Con los datos anteriores procederemos a hacer la grรกfica, segรบn vemos en la

f.

rj ยกrrtยก,

0 Fig.

30 60 4: Histograma. Datos

90 de 1a tabla

120

III.


64

7.61:

Histograma de una distribución de frecuencias de valores agrupados en

.

Cuando la

histograma se construye tomando en abscisas la base según la amplitud de los intervaIos, pero la allura de los rectángulos no se puede tomar directamente de las frecuencias sino que hay qué calcularla. Esta altura se obtiene dividiendo la frecuenciaabsoluta de cada intervalo entre la amplitud del mismo, con Io cual las áreas de Iosrectángullos son proporcionales a las repeticiones o frecuencias. Si llamamos rrfrr a las frecuencias absolutas e rrirr a la amplitud del intervalo, la altura de Ios rectángulos será

el cociente

fl

.

Ejemplo: representar mediante un histograma de frecuencias la distribución de Ia tabla lV (pág. 51). Reproduciendo esa tabla y escribiendo a la derecha el cálculo de la altura de Ios rectángulos, tendremos: TABLA IV INTERVALOS

0-5 5 - 15 15-30 30-60 60-90 90 - 150

OPERACIONES ,i

N=

LOS INTERVALOS

A\,,IPLITUD DE

31

5

l4

10

8

15

4

30

6

30

90

60

ALTURA DE

LOS

RECTANGULOS 5',40

31:10= 14:15= 8:30-4:30= 6:60=

3'10 0'93 0'21 0'13 0'10

FUENTE: Vademecum de Estadfstlca. Insti¡rto Nacional de Estadfstica. Madrid 57.

Procedimiento: La distribución tiene 6 intervalos y un recorrido de 150 valores. Tomando en el eje de abscisas 150 mm. cada rectángulo lendrá como base tantos milímetros como su amplitud, Si para el eje de ordenadas tomamos un 72'/" de la longitud del eje de abscisas/ tendremos una Iongitud de 108 mm. Como la mayor altura a representar es de 5r40/ que corresponde a Ia frecuencia del intervalo 0-5, Ia unidad del eje de ordenadas será de 108:5'40 = 20 mm. El histograma puede verseen lafigura 5. Si en vez de calcular las alturas de los rectángulos como se ha hecho, hubieramos utilizado Ias frecuencias directas omitiendo el hecho de la amplitud variable de los intervalos, el histograma resultaría incorrecto. Puede observarse laincorrecciónen la figura 6, que es el histograma de Ia tabla lV pero sin calcular la altura de los rectángu los .

¡',i


65

15

30

Frs.

5.

60

90

Histograma (coยกrecto).

Datos

de Ia tabla IV

30

15

10

5

0 0

15 30

90

60

Fร quยกa 6: Hlstograma (incorrecto)

.

Datos de

150

la tabla IV.


66

Cuando los intervalos de la distribución nua, por ejemplo nuestra distribución de latabla

no tienen sus límites en forma

ll,el

conti-

histogramase construye tomando fos límiLes realesde los intervalos, pues no podríamos hacer la gráfica según los límites dados, o sea:16 - 20,21 - 25,26 - 30 .., ya que entre los límites superior de un intervalo e inferior del que le sigue, por ejemplo 20 y 21 ,25 y 26,etc. queda una unidad que rompe la continuidad del eje de abscisas. Adoptamos,entonces, los límites reales para lograr esa continuidad. Ejemplo: Representar mediante un histograma la distribución de frecuencias de la tabla ll. Como ya tenemos calculada la longitud de ambos ejes -abscisas y ordenadas-, simplemente repetiremos estas escalas/ con Ia diferencia que en vez de los puntos medios de los intervalos tomaremos en abscisas los lÍmites reales de ellos. Como la amplitud es constante, la base de los rectángulos es uniformey las alturas se toman directamente de las frecuencias. Esta gráfica la vemos en Ia figura siguiente:

f 50

15

J1,

15.'5 20'5 25'5 30'5 35'5 40'5 45'5 50'5 55'5 60'5 65'5 ?0'5 '75'5 80'5 85'5 90'5 95'ó 100'5 Fig.'7: Histograma. Datos de la tabla IL


67

7.7:

SUAVIZACI0N 0 PULIMENTO DE CURVAS. METODO ARITMETICO.

El polígono de frecuencias también se Ilama "curva" de frecuencias, Es fácil ver que sobre un histograma también se puede hacer el polígono con sólo unir los puntos medios de cada intervalo a la altura de las frecuencias. Si se observa la figura 3 @ág.62), podrá notarse que hay ciertos "picos'l

que se deben a las variaciones que sufre el fenómeno en su desarrollo. Estoocurregeneralmente en todas las distribuciones empÍricas, pues esos picos o saltosque se notan, nos indican que la variable no sigue un ritmo regular ni matemático en la toma de valores y frecuencias. Cuando se sabe que Ia distribución es aproximadamentenormal, como ocurre con Ia de la tabla ll, y a efecto de eliminar un poco las irregularidades o picos de la curva, se aconseja suavizarla o pulirla. Hay dos métodos para suavizar una curva de frecuencias: a) el métodoariLmético; y b) el método gráfico. Cualquiera de ambos que utilicemos nos llevará al mismo resultado. Si no se desea hacer cálculos conviene la suavización gráfica; pero s¡ se desea o prefiere el método aritmético, se aplicará la fórmula:

fS

fi-t+2f¡+fi+1

(2)

4

en Ia que:

f

frecuencia suavizada. S

f¡2f. I

f_t

r

frecuencia absoluta inmediata anterior a la que va a ser suavizada. doble de Ia frecuencia a suav¡zar. frecuencia absoluta inmediata posterior a la que va a ser suavizada.

De modo que para suavizar Lrnacurva tenemos qué suavizar las frecuencias. Esto se logra así: al doble de la frecuencia que se va a suavizar se le suman las frecuencias inmediatamente anterior y posterior; esta suma se divide entre cuatro.

La suma de las frecuencias suavizadas es siempre igual a la suma de lasfrecuencias absolutas o empírioas, pero deberemos agregar dos valores Xi o intervalos a la distribución: uno antes del intervalo inferior o sea el pr¡mero/ y otro despuésdelintervalo super¡or o sea el último. Estos valores o intervalos que se añaden tendrán ce-

¡:l)


68

ro de frecuencias pero deben ser suavizadas como las demás. Lo propio ocurre s¡ se usa el método gráfico. De esta cuenta, a estos valores o intervalos agregados les corresponderá una cierta frecuencia suavizada, aunque empíricamente sus frecuencias sean cero porque Ia variable no tomó esos valores; incluso, ningunade Ias frecuencias suavizadas es verdadera. Se trata simplemente de una ciertaaproximación artificiosa que se hace para que la curva quede más clara y se ayude a Ia interpretación. Como al suavizar una curva se alLeran Ias frecuencias empíricas o absolutas, debemos dejar señaladoen Ia gráfica cuáles son esas frecuenciasque han sido suaviza-

das. Esto se puedehacerdejando marcadasen la gráficalasfrecuencias absolutas o mediante una línea distinta, como en la figura B, a la que contiene la curva suavizada. Ejemplo: Suavizar Ia curva de frecuencia de la distribución de la tabla ll. Procedimiento: a) Utilizaremos el método aritmético, esto es, aplicando la fórmula 2; b) agregaremos dos intervalos, el 1l - 15 o sea el que va antes del intervalo inferiorde ladistribución, que es el 16 - 20 según ya sabemos;y elintervalol0l-105, o sea el queva despuésdelintervalo superior de la distribución, quees el96-100. 0btenidas las frecuencias suavizadas se procede a hacer Ia gráfica. Primero suavizaremos la frecuencia del intervalo l1 - 15, que, por ser uno de los que hemos agregado, tiene de frecuencia absoluta cero. Aplicando la fírmula 2,la frecuencia suavizada de dicho intervalo será:

0+ 2 x 0+

1

= 0'25

La fuecuencia suavizada del intervalo s¡gu¡ente (Lb

0+2 x 1*

5

=7_

-

20), se obtiene así:

L'75 4

La frecuencia suavizada del intervalo siguiente

f,

1+ 2x5+4

15

(2L -

=

zil,

3'75

se obtiene así:

¡.1


69

y asÍsucesivamente. En estos tres ejemplos no hemos hecho otra cosa que aplicar la fírmula 2, o sea, al doble de la frecuencia a suavizar hemos agregado las frecuenc¡as absolutas inmediatamente anterior y posterior, dividiendo rrru entre cuatro. La "ri tabla siguiente contiene la distribución dada y en la cuarta columna aparecen Ias frecuencias suavizadas.

TABLA YI

xi

INTERVAT,OS 11 16 2T

3I 36 4L 46 51 56 61 bb 7L

_15 -20

0 18

_30

28

_40 -45 -50

38

48

_60 -65 -70 -75 -80 -90

91 96 101

-

1'?5

4

6'50

13

12'50 19'25

20

43

81 86

I 5

26'75 39

38'25

51 58

4l

45'50 40'00

63

27

32'00

68

33

28',25

20

22',2s

78

16

83

2l

18'25 16'25

88

1

10'00

2'25 0'50

93

r00

98

2

105

103

0

329'00 FUENTE: Tabla

IL

La gráfica de,la tabla anterior podemos verla en Ia figura B, en Ia que lalínea punteada es el polígono de frecuenciasempíricas, mientraique el histográmay poIÍgono de frecuencias suavizadas están en la iÍnea unida. Cuando la distribución es perfectamente normal, Ia curva tiene la formade la figura 9 y recibe, en general, el nombre de curva normal, aunque también otros como curva normal de probabilidades, curva de errores, curva o campanade Gausse, etc. Aunque estudiaremos en tema aparte esta interesante distribución, puede observarse que una de sus características es la simetrÍa; todos losvalores y frecuenciasequi.distan del punto central. Esta curva, sin embargo, no es empírica. Responde a una ecua-

r"f


70

ción matemática y por ella se conoce la aproximación de las curvas empíricas a Iarrnormalidad"teórica. En la práctica/ pues, cas¡ no se obtiene una curva normal perfectao ideal. De ahíque sirva de comparación para las experimentaciones y que proporcione un modelo matemático de curva.

Polfgorn

de

frec ue ncí as

50

empfricas. 45

Polfgono

e

Histograma

N

de

ftocuen-

cras suavr zadas.

30

20

10.515.5 20.525.5 30.535.540.5 45.550.555.560.565.5 ?O.s?5.580.585'590.5 95.5100.5105.5 (suavizados). Datos de ]a tabia ElgtU¿.--q., Polfgorc e histograma

II'

d Figura 9: Curva rcrEiaI (teórica) o campana de Gauss.


704

7.8:

DIAGRAMA ACUMULATIVO.

EI diagrama acumulativo es la representación gráfica de Ia distribución acumuSe construye atendiendo a: 1) si Ia distribución de frecuencias es de valoressin agrupari y 2) si la distribución es de valores agrupados en intervalos de ampliLud constante o variable.

lativa.

7.81: Diagrama acumulativo de valores sin agrupar. Se toman losvalores de la variable en el eje de abscisas y las repeticiones o frecuencias acumuladas en el eje de ordenadas. Estas frecuencias permanecen invariablesentre cada dosvalores consecutivos porque la variable notoma más valores que los que aparecenen la distribución. Siguiendo siempre las recomendaciones para lograr la proporcionalidad del gráfico, entre cada dos valores consecutivos se traza un segmento horizontal, a la altura de la frecuencia acumulada, y que en conjunto forman un escalonado como el de Ia figura 10. Ejemplo: representar mediante un diagrama acumulativo la distribución de la ta-

bla Vll. TABLA VII ESCUELAS OFICIATES DE PARVULOS QIJE HAN FUNCIONADO EN LA REPUBLICA

DE GUATEMALA, DE 1950 ANOS

FRECUENCIA ABSOLUTA

A

1959

FRECUENCIA ACTIMULADA

xi 195 0

4'.t

195 1

§

t952

49

195 3

48

41 95

195 4

48

144 L92 240

195 5

49

9ao

1956

49

338

195 7

50

388

44t

1958

494

195 9

4r4 FUENTE: Info¡me de 1as labo¡es realizadas por la Seccidn de Estadfstica Escolar durante el año 1959. Ministerio de Educación Pública. Guatemala.

¡J


7t

400

250

150

100

Fig. L0. DÍagrama acumulativo. Datos de

1a

Tabla VII.

7 .82: La amplitud de los intervalos afecta la gráfica acumulada. La frecuencia acumulada varía porque la variable toma valores entre cada dos lÍmites consecutivos.

La gráfica se construye Ilevando en abscisas los intervalos, de los cuales se toman los límites reales superiores y no Ias marcasde clase o puntomedio de los intervalos. Las frecuencias acumuladas se llevan en el eje de ordenadas y se unen/ para cada dos Iímites consecut¡vos, por medio de segmentos rectilíneos. Esta gráfica recibe el nombre de diagrama o polígono acumulativo, Ejemplo: Representar mediante un diagrama acumulativo la distribución de Ia 53). Esta gráfica la vemos en la figura 11.

tabla V (pag.

El diagrama acumulativo es útil, especialmente, para construir la gráfica percentil, en la que las frecuencias acumuladas se expresan en forma de porcientos.

t#


72

210

150

15'5 20'5 25'5 30',5 35'5 40'5 45'5 5o'5 Fig. 11;

PolfSom

55',5 6o'5 65'5 ?0',5 ?5'ó 80'5

acumulativo'

Datos de

85'5 90',5 95'5

100'5

la Tabla V'

7.9: Otros tipos de gráticos. Existe gran variedad de gráficos estadi'sticos. En estas páginas hemos tratado solamente los principales y más comunes. AsÍ están, por ejemplo, los siguientes: a) Diagrama de bandas, que se utiliza cuando las series a representar forman parte de un total; b) Diagrama semilogaritmico, que se utiliza cuando los valores de una de las variables son números grandes, substituyéndolos por Ios logaritmos respectivos; c) Diagrama logarítmico, en el que los valores y fas frecuencias se expresan en logaritmos. En estos gráficos, para hallar el valor natural hay que encontrar el antilogaritmo de las escalas; d) Diagrama polar, que se construye sobre una circunferencia con base en un radio móvil Ilamado radio vector; e) Pictogramas,o sea gráficos en los que se usan figuras o dibujos alusivos al fenómeno; es útil para divulgaciones e información a las masas; fl Cartogramas omapas geográficos, en los que la intensidad del fenómeno en cada región se representa por rayados distintos o coloraciones; g) CartodiagramaS/ que también son mapas geográficos, pero las variantes del fenómeno se expresan mediantebarras o segmentos rectilÍneos; h) Estereogramas o diagramas de tres dimensiones. Etc. 7.10:

DIAGRAMA DE SECTORES. En vía de información

y

por ser uno de los gráficos más utilizados,

haremos

t'l


73

la construcción de un gráfico de sectores. Para ello se reparten proporcionalmente los 360grados (sexagesimales)de la circunferencia, de acuerdo a la intensidaddelfenómeno. Como usualmente esta intensidadse expresa en porcientos (para los efectosdel gráfico), resulta que dividiendo el total de grados entre 100, o sea 360:100 =3r6

tendremos el número de grados (3'6)quecorrespondea cadal'/"de lasvariantes del fenómeno. Este diagrama no es muy aconsejable, por ejemplo, cuandolasmodalidades pasan de 6, pues resultan demasiados datos para Ia claridad de la figura.

Ejemplo: Representar mediante un diagrama de sectores la matrícula escolar registrada en las escuelas oficialesde enseñanzaparvularia en 1959. Los datos correspondientes aparecen en la tabla Vlll que srgue: TABLA VIII INSCRIPCION ESCOLAR EN LAS ESCUELAS OFICIALES DE PARVULOS DE LA REPUBLICA DE GUATEMALA, EN EL ANO 1959

EDAD

NINOS

NINAS

SUMA

TOTALES:

6,12L

6,552

13,273

Años

990

7,062

Años Años

2,498

4 5

6

2,052 4,830 6.391

FUENTE: Informe de las labores tealtzadas por 1a SeccÍón de Estadlstlca Escolar du¡ante e1 año 1959. Miristerio de Educaci6t Pública. Guatemala.

Para hacer el diagrama de sectores de

la inscripción de

niñosdispondremos

los datos de la manera siguiente:

EDAD

NINOS

PORCENTNE

TOTALES

6,',tz\

100' 00

4 5 o

Años

aq^

L4',73

Años

2,498

Anos

GRADOS 360

134 48'

10

173

rl


74

La figura 12 nos da la expresiín gráfica pedida. Los grados para los sectores de esas edades, se obtienenmultiplicando el porcentaje por 3r6, que es Io que hemos hecho en el cuadro anterior,

Fig

. 12:

Gráfico de sectores. Datos de la Tabla Vlll

t"t


75

EJERCICIO 7

1.

Haga la representación gráfica, mediante un polígono de frecuencias y un histogra(pá5. ma de Pearson, de la distribuci6n cuyos datos se han dado en el ejercicio

6

54).

2.

Obtenga las ftecuencias suavizadas de esa distribución, no olvidando que debe agregar dos intervalos más: uno antes del intervalo inferior y otro después del inter-

valo superior. Aplique la f6rmula 2

3,

hág.70)

Haga la representación gráfica, mediante un polígono de trecuencias y un histograma de Pearson, no olvidando que debe dejar marcadas las frecuencias empíricas.

4.

Haga la representación gráfica, mediante un diagrama acumulativo, de lamisma dis tr ibuc ión .

5.

Utilizando los datos de la tabla Vlll (pag.73) exprese gráficamente, mediante diagrama de sectores, la inscripción de niñas en las escuelas de párvulos.

un


SEGUNDA PARTE LOS VALORES ESTADISTICOS


TEMA VIII Lo tendencio centrol. 8.ll: Promedios firmes y no firmes. Medio oritmético. Definición y concepro.8.2l: Obtención de lo fórmulo fundomentol de lo medio. 8.22: Fropiedodes de lo medio

8.1: 8.2t

oritmético. 8.221t Demostrociones. 8.3: Cálculo de lo medio.8.31: Serie simple. 8,32: Distribución de frecuencios. 8.4: Cólculo ob¡eviodo de lo medio. Fundomento. S.4l: Demostroción. 8.42: Distribución de frecuencios. 8.421: Volores sin ogrupor. 8.422: [qle¡s5 ogrupodos en iniervolos. 8.43: .Notos de orden próctico. 8.44: Uso de lo medio oritmético. 8.5: Lo mediono. Concepto. 8.ó: Cálculode lo mediono. 8.61: Serie simple. 8.62: Distribución frecuencios 8.621: Volores sin ogrupor. 8.ó22: Vqlores ogrupodos en inte¡volos' Obtención rozonodo de lo fórmulo. 8.7: 6osos especioles de lo mediono. 8.71: [Jso de lo mediono. 8.8: Lo modo. Concepto. 8.9: Cólculo de lo modo. 8.01: Serie simple. 8.92: Distribución de frecuenciqs. 8.921: Yolores sin ogrupor. 8.922: Volores ogrupodos en iniervolos. S.l0: Uso de lo modo.8.l0l: Relociones entre los promedios. Elercicios.

rl)


78

8.1:

LA TENDENCIA CENTRAL.

Ya hemos visto cómo, de los datos que poseÍamos originalmente, los fuimos ordenando, agrupando, tabulando y presentándolos en tablas para facilitarnos su manejo. Se ha venido haciendo un cierto procesode resumen, de reducción. se ve, entoncás, que la EstadÍstica, entre otras operaciones, reduce los datos, Ios condensa. Peronoes suficiente Io hecho; apenas si es el inicio del análisis. Aunque la lectura de las tablas y la inspección de Ias gráficas pudieran darnos idea de los fenómenos, es imprescindible obtener un valor o dato que represente atodas lasobservacioneshechas, pueshumanamente es imposible retener tantos números en la memoria. En los fenómenos que se estudian estadísticamente ocurre, de común, que la 'concenmayoría de los datos o valores, por mucha dispersión que presenten, tiendena trarse en un cierto valor o grupo de valores. Generalmente este valor ocupa el centro de la distribución. La obtención de ese valor, hacia el cual tienden los demás yque puede representarlos, se hace mediante el cálculo de las medidaTffindencia central o promedios, que también se llaman medidas de posición. En resumen, el problema a resolver en la medida de la tendencia central, esencontrar un cierto valor del centro de la distribución que los represente a todos.

8.11: central.

Hay varios índices numéricos de Ia tentomen en cuentatodos losvaloresde lavariable o no, pueden considerarse como firmes y no firmes respectivamente.Entre Ios promedios firmes (cuando dependen de todos los valores de la variable) el más utilizado es Ia media aritmética, que tiene el carácter estricto del promedio aritmético, o seaun determinado valor de una serie de números, comprendido entre el menor y er mayor, y que los representa atodos. Cuando en EstadÍstica se habla de la media, nos estamos refiriendo a la media aritmética. De los promedios no firmes (cuando no dependen de todos Ios valores de la distribución sino de uno o dos), se utilizan la mediana y la moda,pero no tienen, en rigor, el carácter del promedio aritmético y son mefFTii6les$EIá media. Cada uno de estos valores de tendencia central -hay otros, además de losdichos, pero que no estudiaremos- tiene su propia significación, uso y limitaciones. Veamos en qué consisten y la manera de calcularlos.

dencia

8.2:

LA MEDIA ARITMETICA. DEFINICI0N Y CONCEPT0.

Si tenemos, por ejemplo, las puntuaciones alcanzadas por un grupo de alumnos en una prueba de rendimiento escolar, habrá entre todas ellas una que las represente. Posiblemente esa puntuación representativa del grupo no haya sido obtenida, en la realidad, por ningún alumno; es lo de menos. Ocurre en más de un caso y ello no afecta. Lo que interesa es saber qué valor de la distribución es el que sirve de punto repre-

¡-j


79

sentativo, depuntomedio, yalrededor del cual giranor. ,rrrrun los demás. De Ios promedios o medidas de tendencia central el preferido y más utilizado es Ia media aritmética. Su uso es tan generalizado "que cuando se habla de media por antonomasia nos referimos a la media aritmética". (25)

Definición. La media aritmética de una serie de valores se define como el cociente de dividir la suma de los valores de la serie entre el número de términos. Esta definición se expresa mediante la fórmula:

¡ _ 2x¡

G)

N

en la que:

X=

media aritmética. (Se lee equis mayúscula suprarrayada).

) =

suma de (Es Ia letra griega sigma (S) mayúscula. Cada vez que usemos este signo deberá leerse como "suma de')

Xi =

denota los valores o conjunto de valores de la serie. Se lee equismayúscula sub-í.

N=

Número de términos, casos o frecuencias.

Concepto. El concepto que se debe tener de la media aritmética eselsiguiente: Ia media aritmética es la mejor y más significativa de las medidas detendenciacen-

tral,

pues por basarse en todos los valores es la que mejor los representa.

B,2L: 0btención de la fórmula fundamental de la media. La fórmulaanterior se basa en que si los valores de una serie los substituimos por eI promedio aritmético, la suma de los valores y Ia suma de los promedios son igualés. Esto es evidente con sólo pasar N al primer miembro de la igualdad. Ejemplo: sean las edades de cinco individuos que forman la siguiente serie:7, 9, 10, 11 y 13 años. La edad promedio del grupo es 10 años, que resulta de haber sumado las edades, esto es 7 +9 + 10+11 + 13 = 50 y dividido esa suma entre el número de individuos(términosde la serie) que es 5; es decir, 50 : 5 = 10. Substituyendo ahora cada valor o término (edad) de la serie por el promedioaritmético, las sumas serán iguales. Veamos:

7+ 9 + 10 10+ 10 + 10

+

11

13

50

+

10

10

50

,-t


80

Si la variable X toma los valores

fa serie será:

Xi = x1, x2, x3, x4, y la suma

xn

de esos valores será:

2X¡=*1*12* _

.t

*3 +x4+

Substituyendo ahora cada uno de los valores

tica X tendremos:

+ Xn x¡

(8.21.1)

de la serie por su media aritmé-

X+X+ X+....+ X =Xr* x21-x2+....+ LL)"

xn

como X es consLante resulta que:

NX pero por

= xI * *2*

x3t

*xn

B,2L,L

NX =)Xi y pasando

v

N

8.2L.2)

al segundo miembro de la igualdad anterior:

)xi N

fórmula que satisface la de[inición de la media aritmética de una serie, como la suma de los valores Xi dividida entre el número N de términos,casos, o frecuencias. Dicha fórmula es la fundamental. Las demás que usaremos son variantes. (*)

Por la gran utilidad que tienen para 8.22t el cálculode otros valores, enunciaremos dos de las propiedades de la mediaaritmética:

Primera: La suma algebraica de las desviaciones o diferencias de los valores de Ia variable respecto de la media aritmética es igual a cero. Se llama desviaciones a las distancias o diferencias que hay entre cada valorx. de Ia variable y la media aritmética. En esta propiedad se baia el óálculo abreviado dL (+)

Nota importante. La anteriorobterción de 1a fórmuta fundamental de la media aritmétÍca, la he tomado del lib¡o "Elementos de Método Estadlstico" del Profesor Andr& Garcfa Pétez, págína 34, Imprenta Uni-

versitada. México, 1945.

r'i


8I la media aritmética, del que nos ocuparemos después. Segunda: Lasuma de loscuadrados de las desviaciones de los varoresdeunase-

rie respecto de Ia media aritmética es un mínimo, en relación a la suma de los cuadrados de las desviaciones de los valores respecto de otro promedio cualquiera. Esta propiedad es ímportante porque en ella se basa la obtención de la principal medida de variabilidad, o sea la desviación típica, que veremos más adelante.

8.221: Demostraciones. 1) La suma algebraica de las desviaciones de los va lores respecto de Ia media aritmética es igual a cero. Llamaremos d¡ (d, minúscula sub-D a la desviación de un término x¡ cualquiera respecto de la media'aritmética:

*¡ -X =d¡ y restando a cada uno de los valores Ia media aritmética, será:

*I-X =dI x2-X =d2 xz r5 - X = d^ Xn-X=dn Sumando miembro a miembro

(x1+xr*x3* Pero por

B.2L.L,la

suma de los

las igualdades anteriores:

... + xn) -

NX

- dt+ d2+ d3+....+dn

expresión entre paréntesis del primer miembro de la igualdad es

fa

valores, o sea:

>Xi-NX =>d.

I

y por 8.21.2:

¡J

)xi =

NX

-

NX

Luego,

NX

= >d.

0=Id¡

I

G.22t.t)


83

Como

h2

siempre es mayor que cero, resrtta que,

2¿2

2¿,2

desigualdad que demuestra la segunda propiedad. (*)

8.3: I j

CALCUL0 DE LA MEDIA ARITMETICA. Para el cálculo de la media aritmética consideraremos los casos siguientes:

i

\

10. Los datos forman una serie simple. \ Zo. Los datos forman una distribución de frecuencias I Zo. Los datos forman una distribución de frecuencias ¡ntervalos de amplitud constante o variable. I

de valores sin agrupar; y de valores agrupados en

8.31: La media de una serie simple. Cuando los valores forman una serie simple, o sea que no presentan frecuencias repetidas, la media aritméLica se obtiene aplicando directamente la fórmula 3 (Pag. 71), sumando los valores y dividiendo entre el número de ellos. Ejemplo: calcular Ia media aritmética de la siguiente serie simple: 47, 43, 40, 38, 37,

35

La suma de los valores anteriores es 240 y el número de valores es substituyendo en Ia fórmula 3 tenemos:

6. Luego,

.

.Es8.32t La media de una distribución ta media se define como el cociente de dividir la suma de los productos de los valores multiplicados por sus frecuencias, entre Ia suma de casos o frecuencias. Se denomina media aritmética ponderada y se expresa segfu,l-a fórmula:

X- )r.

(')

xi

G)

N

Nota importante. La demostración anterior la he tomado del libro "Introducción a los Métodos Estádfsti-

cos", del Lic. Maruel Gotzález BellÍdo. Pág. 55, 1a. edicÍón. Madrid, 195?.

rl


84

en la que:

X = 2 f.Xi =

N-

media aritmética. suma de los productos de los valores por sus respectivas frecuencias. suma de frecuencias o total de casos.

La fórmula anterior es una variante de la fórmula 3. Consiste en lo siguiente:si x¡ de la variable aparece repetido "f'r veces, en lugar de sumarlo tantas veces como frecuencia tenga, se multiplicará el valor por su repetición. Si ese valor fuese 8, por ejemplo, y su frecuencia 5, en vez de sumar cinco veces elocho, haremos B x 5 = 40. De manera que si la variable X toma los valores: un valor cualquiera

Xi = *1, x3r x4t ^2, siendo sus repeticiones

xn

fI , f2, f3, f4,

fn

x1 está repetido f1 vecesi el valor x2 está repetido fl veces; el valor x3 está repetidi f3 veces, etc.- Según la definición, la media aritmética ponderada resultará de dividir la suma de los productos de los valores por sus repeticiones o frecuencias, entre la suma de frecuencias; o sea: vemos que el valor

.,

v-

xI .ft+ x2.f2+x3.f3+

ft+

f2+

>X.I .f , I

Er¡

..+xn.fn

f3+ ..+

>f.

fn

N

Ejemplo: Calcular la media aritmética de ladistribuciónde latabla l.(Pág.44). y las operaciones aparecen en Ia tabla lX según la disposición siguiente:

Los datos

a) Columna 1: b) Columna 2: c) Columna 3: c

ia.

Contiene los valores Xi de la variable o distribución. Contiene las frecuencias rrf rr o repeticiones de Ios valores. Contiene Ios productos de multiplicar cada valor por su frecuen -

t"t


La media aritmética se obtendrá dividiendo la suma de la columna 3 entre la suma de la columna

2.

Nota: En todas las tablas que se utilicen para cálculos, además de Ia notación estadística haremos uso de números arábigos para cada columna y para las operaciones que resulten de relacionar unas con otras. En la tabla lX podemos ver que:

If. x¡ = N-

594 50

Y substituyendo en la fírmula 4t

594

50 =

TABLA xÍ

f.

-E)

@

.3

11'88

1

12.

]X

I.

X1

(3) = (1x2)

2

5

1

6

1

5 o

2t

7

4

8

4

óo

t1

2

22

12

5

bU

13

5

65

t4

8

tt2

15

4

60

16

3

48

18

4

10

30

19

N=

I

19

50

594

FUENTE: Tabla I.

d


86

8.321La media de una distribuc intervalos. Cuando los valores están agrupadcs en intervalos, de amplitud variable o constante, la media se calcula aplicando la fórmula 4, s6lo que en vez de tomar por sí m¡smos los intervalos, se elige de ellos la marca de clase o punto medio. En este caso Ios valores Xi que se multiplican por las frecuencias serán las marcas de clase que, según ya se dijo, se obtienen dividiendo entre dos la suma de los límites inferior y superior del intervalo. El cálculo de la media en esta forma se basa en el supuesto que los valores contenidos en cadaintervalo formanuna progresión aritmética;y comola suma de los valores o términos de una progresión aritmética es igual al producto de multiplicar la semisuma del primero y último términos por el número de términos, seconsi-

dera que la semisuma de esos términoses la marca de clase y el número de ellos es la frecuencia respectiva del intervalo. Ejemplo:

d

calcular la media aritmética de la distribución de la tabla X, en la variable. Los datos y Ias operaciones sedisponen

que Ios intervalos son de amplitud as í:

a) b)

Columna Columna

1: 2:

c)

Columna

3:

d)

Columna

4:

contiene los intervalos de la distribución, contiene las marcas de clase Xi o punto medio de los intervalos. contiene las frecuencias rrfrr o repeticiones de los valores de Ios intervalos. contiene los productos de multiplicar cada marca de clase por la frecuencia respectiva,

La media aritmética se obtendrá dividiendo la suma de la columna4 entre lasuma de la columna

3.

rl


87 TABLA

X

MATRIMONIOS CELEBRADOS EN LA PROVINCIA DE ALAVA, DURANTE EL AÑO 1951, DISTRIzuIDOS SEGUN LA EDAD DE I,OS CONYUGES VARONES

EDAD EN AÑOS'

INTERVALOS Edad en años

de Clase

Nlm. de

Marcas

Productos

Matrimonios

xi Q)

f (3)

20-25 25-30 30-35

22',5 z'.t'5

104 415 185

2,340',0 11,412'5

-40

37'5

40-50 50-60

45'0 55'0

38 8 N = 823

1,710'0

(r)

35

f.xi G)

=

(zx})

6,012'5

440',0

24,652'5

FUENTE: Vademecum de EstadÉtica. Instituto Nacionai de Estadfstica. Madrid 1957.

()

En todos los interualos se excluyen las observaciones igualeJ a su

lfmite su-

perior.

En este ejemplo:

> f. Xi

= N-

24,65215

823,

Y substituyendo en la fírnula 4:

X

=

24

'95-?-15 = 29195 años 823

Obsérvese que en la distribución de la tabla X, Ios intervalos son de amplitud variable. Cuando esta amplitud es constante se procede en la misma forma, aplicando la fórmula 4 y disponiendo Ios dátos según se indicó anteriormente.

4».

Ejemplo b) calcular la media aritmética de la distribución de la tabla los datos y las operaciones aparecen en Ia tabla Xl.

ll (pág.

,#


88 TABLA

f. (3)

xi

INTERVALOS (1)

16

XI

(2)

_20

18

27 26 31 36

-30 -35 -40

46

61

81 86

4

tr2

-50

48

-60 -65 -70

760

51

2,',103

58

4t

63

27

2,378 1,701 2,244

68

-80 -85 -90

78

16

t,460 t,248

83

21

1,743

88

1

616

-

98

20

91 96

(2 x 3)

1,032 L,872

'71 ?6

18

115

43

51

56

I 5

20

38

+t

f. xi

(a) =

465 100

196

N= FUENTE: Tabla

329

19,092

II.

En este ejemplo:

> f. Xi N

= L9,092 =

329.

y substituyendo en la fírnula 4:

X_

8.4:

>f.xi

L9,092 329

=

5B'03=¿ 59.

CALCUL0 ABREVIAD0 DE LA MEDIA AR|TMET|CA. FUNDAMENTO.

Hemos visto ya la manera de calcular la media aritmética de un conjunto de valores, aplicando Ia fórmula 3 si constituyen una serie simple; o con la f6rmula 4 si

e

forman una distribución de frecuencias, ya sea que los valores estén sin agrupar grupados en intervalos de amplitud variable o constante.

res

o a-.

La fórmula 4, sin embargo, no es siempre apropiada. Es útil cuando los valoy las frecuencias son números sencillos pudiéndose hacer mentalmente las opera-

.

4


89

ciones, o bien si se tiene máquina de calcular. En el caso de usar la fórmula 4 la obtención de la ¡nedia se denomina método largo. Pero ocurre a veces que los valoresy las frecuencias ya no son números sencillos, como por ejemplo los de las tabfas X y Xl, y por lo mismo, las operaciones ya no pueden realizarse con facilidad. Se impone entonces, Ia necesidad de un método que, con la misma efectividad en losresultados, permita obtener en forma abreviada ese valor estadÍstico. Esta es larazíndel método abrev iado.

El fundamento del método abreviado para el cálculo de la mediaar¡tmét¡ca es la primera propiedad: la suma algebraica de Ias desviaciones de los valores deuna serie respecto de la media aritmética es igual a cero, según se demostró enB.22l.1 , página 81. Por el método abreviado, la media aritmética es igual a una media supuesta o arbitraria más una cierta corrección. Lo anterior quiere decir: de los valores de la distribución podemos suponerque un valor Xi cualquiera es la media supuesta. Si se obtiene la suma algebraica de las desviaciones de Ios valoresen relación a la media supuesta, dicha suma no será iqual a cero y nos dará la medida de Ia corrección que hay que hacerle a la mediasupuesta para que sea la verdadera. Tal es Ia lógica del método. Estas aclaraciones no tienen otro fin que ayudar a comprenderlo, ya que fácilmente se cae en Iamemorizacióndefórmu las marg inando e I fundamento. No hay regla alguna para tomar o elegir la media supuesta; se puede usarcualquier valor aunque resulte menor o mayor quelamediaverdadera. Esto Io sabremoshasta hacer la corrección y, por Io mismo, no importa que tomemos un valor menoromayor. Conviene, sin embargo, tomar uno de los valores del centro para estar más próximoal estadístico buscado. Si, por ejemplo, hemos tomado un valor menor que lamediaverdadera, la corrección nos dirá que hay que sumarcierta cantidad ala medla supuesta para que sea Ia verdadera; y si, al contrario, hemos tomado un valor mayor que la media verdadera, la corrección nos dirá entonces que a Ia media supuesta hay que restql le cierta cantidad para que sea la media verdadera.

8.41: Demostración. La media aritmética es igual a la media supuestaoarbitraria más una cierta corrección. Esto se expresa según la fórmula: X = Xs*C en la que:

X= Xs =

(5)

media aritmética verdadera de la muestra. media supuesta o arbitraria. Se lee rrequis mayúscula suprarrayada sub-eser.

f:f


CDe

Ia

corrección que se le hace a Ia media supuesta para que sea la verdadera. fórmula

(5)

se desprende que:

Xs

= X-c

(8.41.r)

Además, sea:

d=

x

-X

(desviación de un valor cualquiera de la variable respecto de la media verdadera).

dr= x - Xs(desviación

de un valor cualquiera de la variable respecto de la media supuesta).

Substituyendo:

d'= x-(X-C)= x-X* C= (x-X)+ C = d + Luego:

dr = d+ C >d' = >(d +

Sumando:

>dr = >d Pero, por

0

8.22I

sea:

Despejando C:

C.

C)

+NC

.l:

>d = 0

>d' =

NC

^ >d' u=_-ñiY substituyendo en la fórmula 5:

x = xs +

+

( 5.1).

N

que es la f6rmula fundamental para el cálculo abreviado de la media aritmética.

d


91 de frecuencias. Para callos casos sicons¡deraremos de datos, cular abreviadamente la media de un conjunto

8.422 La media -abreviadamente- de una distribución

gu

ientes:

1o. Los datos forman una distribución de frecuencias de valores sin agrupar. 20. Los datos forman una distribución de frecuencias de valores agrupadosen in-

3o.

tervalos de amPlitud variable. Los datos forman una distribución de frecuencias de valores agrupados en intervalos de ampfitud constante.

0mitimos el caso de la serie simple pues es impropio hablar de abreviaturas en casos tan elementales. Pa-

8.42t: ra este caso la fírmula

5.1

se transforma en Ia siguiente:

X=Xs

>f.dl

(6)

N

en la que:

X = Xs = >f.d, = N-

media aritmética media supuesta o arbitraria. suma algebraica de los productos de las frecuencias por nes de Ios valores, respecto de Ia media supuesta. suma de frecuencias o

las desviacio-

total de casos.

(pág. Ejemplo: calcular abreviadamente la mediade la distribución de Ia tabla I forma: la siguiente en la tabla Xll, 44 ). Los datos y operaciones aparecen en

a) b) c)

Columna Columna Columna

1: cont¡ene los valores Xi de la variable. 2: contiene las frecuencias rrfrr de los valores. 3: contiene las desviaciones de los valores Xi, respectode la me-

d)

Columna

4:

dia supuesta. contiene los productos de multiplicar las desviaciones arbitrarias respectode la media supuesta, por las respectivasfrecuenc

tas.

La media se obtiene sumando a la media supuesta, el cociente de Ia sumaalgebraica de la columna 4 entre la suma de frecuencias o casos de la columna 2.

f


92

Tomando como media supuesta Xs = de la distribución dada, según la tabla Xll:

10,

calculemos abreviadamente la media

TABLA XIl

xif

d'=xi-fs

(r)

(4

(3)

32 51 61

f. d'

(4)=rxB) (-

-7 -4 -3 -2 -1

ND

84 94 103 11 t25 135 t48 154 163 184 19

I-

4 5

0

12,

I

32

120 I 18

ls,

t-e

o

N=50

En este ejemplo:

tn

lrs ,r, !

8

FUENTE: Tabla

t

I

b

1

I

l-

1

2

t n

-nn)l-

0 2

14

%

I.

Xs=10 >f.dr = 94 N-50

Y substituyendo en la f6rmula 6:

X

= 10 *

94 50

ft

=10 + 1r8B=11rBB=12

resultado que ya habÍamos hallado (véase página número 85 ).

Nota:

Hemos tomado

el valor Xi = 10 como media supuesta, o sea Xs

Todos los valores Xi menores que

10

tendrán desviaciones negativas;

=

10.

y los mayores


93

tendrán desviaciones positivas. La me(ia supuesta ,. ,..onoa. inmediatamente puessu desviación siempre es cero. Lo dicho puedeobservarse en la columna 3, así:la desviación del valor 3 (columna 1) es igual a 3-10 =-7; la desviación del valor 5 es 5 -

I0 = -5; la desviación del valor 14 es 14 - l0 = 4¡ etc. Debe notarse también que hemos tomado como media supuesta un valor Xi del centro. Otras veces se acostumbra tomar aquel valor que tenga la mayor fuecuencia. La suma de Ia columna 4,que dividida entre el total de casos nos dá IacuantÍade Ia corrección,resulta algebraicamente de -44 + l3B = 94, y nos dice que, como hemos tomado un valor Xs menor que la verdadera media, hemos de agregar la corrección. Si se observa la tórmula 5.1 pág.90, se verá fácilmente que la corrección no es sino la media aritmética de las desviaciones respecto de lamedia supuesta. Por esta raz6n,la media,por el método abreviado también se enuncia asÍ: la media aritmética es igual a una media supuesta más lamediaaritmética de las desviaciones respecto de ella,

También debe notarse que, el hecho de multiplicar las frecuencias por las desvia: ciones arbitrarias, resulta de sumar abreviadamente las desviaciones de los valoressegún indique su frecuencia. 0 sea: un término o valor Xi cualquiera tendrá, respecto de la media supuesta, una desviación d'; pero si este valor aparece repetido másde una vez, su desviación será el producto f.d'.

8.4222 La media-abreviadamente- de una distribución

de frecuencias de valo-

able. En este caso la media se calcula aplicando la fórmula 6, solo que, en vezdetomar los intervalos por sÍ mismos, hemos de substituirlos por sus respectivasmarcasde clase o punto medio. De esta cuenta, los valores Xi que indica la flrmula, son lasmarcas de clase dichas.

Ejemplo: calcularabreviadamente la media aritmética de la distribución de la taB7 ). Losdatos y las operacionesaparecen en la tabla Xlll, en taforma si-

bla X (pág. gu

iente:

a) b) c) d) e)

Columna Columna Columna Columna Columna

1: contiene los intervalos de la distribución. 2: contiene las marcas de clase Xi de los intervalos. 3: cont¡ene las frecuencias rrfrr de los intervalos. 4: contiene las desviaciones arbitrarias de los valores Xi

5:

respecto

de la media supuesta elegida. contiene los productos de multiplicar las desviaciones por las respectivas frecuenc ias.

La media se obtiene agregando algebraicamente a la media supuesta,el cociente dividir la suma de los productos de la columna 5 entre Ia suma de frecuencias de la columna 3. Tomando como media supuesta el valor Xi = 3715 tendremos: de

,i


94

TABLA XI¡I

INTERVATOS Xi (1) (2)

f (3)

20 25 30 35 40 50

104 415 185 '.t1 38 8

-

25 30 35 40 50 60

22',5 27',5 32',5 3?'5 45,0 55,0 N=

d.

(4)

(5) = (3xa)

- t5 - 10

-

-5

1,560,0

4,150'0 925.0

0

7'5 17'5

285'0 140,0

-

823

6,210'0

FUENTE: Tabla X.

En este ejemplo:

Xs = 37'5

>f.dr =-6,635 + 425 = N-823

6,2L0.

Y substituyendo en la fórmula 6:

-6,2L0

x=37t5 + @

6,2L0

=37t5- @

resultado que ya habíamos calculado anteriormente (pág.

8.423:

=3715-7t55=29t95

qf ).

La media -abreviadamente- de una distribución de frecuencias de vaud constante.

Cuando la amplitud de los intervalos es constante la media se calcula más fácilmente. Para ello la f6rmula 6 se transforma en la siguiente:

X=Xs*Ef',,d' N en la que:

X= Xs =

media aritmética.

media supuesta o arbitraria.

i

(7)

*l


95

> f.d' =

i N -

suma algebraica de los productos de las frecuencias por las desviaciones de los valores respecto de la media supuesta.

valor numérico de la amplitud constante de lob intervalos. suma de frecuencias o total de casos.

Anles de resolver un ejemplo aplicando esta fórmula, es sumamente interesante

indicar que cuando la amplitud es constante, Ias desviaciones drreciben elnombrede desviaciones unitarias, porque cada desviación se divide entre Ia amplitud de los inter-

valos' o sea:

dr=

xi -

xs

(7. 1)

Por esta raz6n, como todas y cada una de las desviaciones se han divididoenre la amplitud, en la fírmula 7 aparece esta amplitud como factor para volver a la unidad de los intervalos. Vamos a resolver un caso, primero, y después haremos algunas otrasobserva ciones sobre este método abreviado. Ejemplo: calcular abreviadamente Ia media aritmética de la distribución de la Tabla ll (Pá9. 4A ). Los datos y las operaciones aparecen en la Tabla XlV, dispuestos asÍ:

1: 2: 3:

a) b) c) d)

Columna Columna Columna Cof umna

4:

e)

Columna

5:

contiene los intervalos de la distribución. contiene las marcas declase Xi o punto medio de losintervalos. contiene las frecuencias rrfrr o repeticiones de los intervalos. contiene las desvíaciones unitarias de los valores Xi respecto de la media supuesta. Estas desviaciones se han obtenido según indica la fórmula 7.1 contiene los productos de multiplicar las frecuencias por las desviaciones unitarias de los valores Xi.

5

La media aritmética se obtiene así: La suma algebraica de la columna la multiplicamos por la amplitud rrirrconstante y dividimos el producto entre la suma de

frecuencias de Ia columna 3, o sea entre mente a la media supuesta.

N. Este cociente lo sumaremos algebraica-

¡rl


96

Tomando como media supuesta

el valor Xi = 53, tendremos: TABLA XIV

INTERVAl,os (1)

xifd' (2)

16-20 2t-25 26-30 31-35 36-40 4t-45 46-50 51-55 56-60

181-7 235-6 284-5 13 33 20 38 24 43 §39-1 53510 584t1 63272 68333 ?3204 78165 832t6 88'.l 9358 9829 N= 329

frl

-

bD

66-10 71-?5 76-80 81-85 86-90 91-95 96 - 100

f. d'

(3)

(s) = (3x4)

(4)

_30

-20 -4

-60 -48 -39

-3 -2

4L

54 99 80 80

..

7

t26 49

q

18

331

FUENTE: Tabla tr.

En este ejemplo:

Xs = 53. >f.

dt =

+ 587 = 33L N -329 =5.

-256

rt

I

Y substituyendo en Ia f6rmula 7: 33L 1655 x x5 53+= 329 329

- 53+-

= 53 +

resultado que ya habíamos hallado anteriormente (pas. 9q

5103 = 58103

).

a¿ 58.


97

B.43lNotasdeordenpráctico.Segúnto,p,nt,dosobreelcálculodela

media aritméticalpodemos hacer el resumen siguiente:

cálculo de la media sereCuando los valores forman una serie simple, el duce a la aplicación de Ia fórmula 3, página79 '

1.

2.Cuandolosvaloresformanunadistribucióndefrecuencias,yaSeadeVale o constante

de lores sin agrupar o de valoies agrupados en intervalos (página 83 ), 4 rátrrl, lá la media se calcuta upiürrJo re peraciones las si verse deberá i;r;;. E"a;o "uro el usarse :be modo otro de de calcular, ñ;r; máquina

o del

método

s o si se tiene iado'

3.Cuandoladistribuciónestáagrupadaenintervalosdeamplitudvariable-se (pág'91)'

puede usar ta fórmula

a, p;;;;;;ás

rápiáo

"t

cálculo usando la fórmula 6

amplitud constante, 4. Cuando los intervalos de la distribución son de fórmula 7bág' 94 )' la utilizar preferible pero es o 6, 4 den usarse las fórmulas

pueque

es especial Para este caso.

5' es forzoso n

sea,

res, o virá de medi -f, -2,

-3

intervalos

^^^im¡. c o sea de mayor a menor,lentonces encima Ios valores -1-' cero' del debajo etc.l Y res!,2,3,4,..

alafírmulaT'no itarias de los valo-

l"''u]""il l:i.,::t: ,á'J:H::J1".1,"": escribirán los valo

'2' -3' -4' " ' €tc'

l-ataz6n de que esto se haga así olitud 'rirr es constante, todos los interval misma distancia dada por la amplitud' Est en las marcas de clase y distarán de la m constante como intervalos les separen de de clase respecto de la media supuesta., e entre las desviaciones será de una unidad; viación de la media supuesta), en tantas v

frf

de é1.

de de unidad la (f.d') no .tiin en , rias, o sea corrección multipl¡caiá iot-iá i'piii'J "¡" Ahora bien: como los productos

intervalos.

por las desviaciones unita-

en la f6rmula 7 aparece la

se vuelva a la unidad de los


Obsérvese la columna

4,

Tabla XlV,

pág

,

96 , y se notará

lo siguiente:es-

cribir encima del cero las desviaciones -1 , -2, -3, etc.; y debajo las desviaciones 1, 2, 3, etc.; es lo mismo que haber calculado esas desviaciones según la tírnula 7,'L. Ejemplo: Primer

intervalo.

Segundointervalo. Tercer intervalo. Noveno

intervalo

Décimointervalo Undécimointervalo

Etc. etc.

d' = lB - 53 : 5 = -35 5=-7 = 23-53t 5 = -30 5=-6 d' = 28 - 53 t 5 = -25 5=-5 dt

d' = 58 '53 : 5 =

d'= 63-53:5 = d' = 68 - 53 : 5 =

5

10 15

§= 55-

1

2

3

8.44 Uso de la media aritmética. Podemos resumir el uso de la media aritmética según las siguientes: Ve ntaj as,

a) Es fácil su caso

de calcular, ya que las operaciones aritméticas -oalgebraicas en

-

son elementales.

b) Su significación es universal.

c)

Es, entre los estadísticos de tendencia central, el más fiable y representativo de los valores de la variable, pues, según hemos visto, viene afectada por todos ellos.

d) Es imprescindible

para el cálculo y comprensión de otros valores represen-

tativos. Desventajas:

a)

Cuando los valores no se d¡stribuyen homogéneamente, o cuandolamuestra es muy pequeña,la media no será representativa. Por ejemplo en la serie 3, L0, 25 y 46 no podemos fiarnos que la media sea 21 pues los valores están muy distanciados.

b) Si la distribuci6n es incompleta

no se puede calcular la media. Estoquiere decir que si desconocemos uno de los valores límites o intervalos, ya sea el inferior o el superior, o ambos a la vez, no se puede calcular ese promedio. En este caso se utiliza la mediana.

¡,.1


99

8.5:

LA MEDIANA. CONCEPT0.

La mediana es el siguiente estadístico de tendencia central importante en la descripción de una muestra. Se entiende por mediana, un cierto valor de la serie que deja bajo sí el 50% de los casos y por encima el otro 50%. Es decir, dentrodeunconjunto de valores, ordenado en cualquiera de ambos sentidos, hay uno que delimitael 507, de los casos;o dicho de otro modo:un valor que parte exactamente pormitadaltotal de casos. Este valor es la mediana y se denota por Md, quese lee:rreme, mayúscu-

la, sub-d'r. Siordenamos un grupo de alumnos por orden de estatura, habrá uno entreellos

quetengaunaestaturatal queocupeel lugarmedianode laordenación,quedandolamitad de los casos por encima de él y la otra mitad por debajo, es decir, separará en dos mitades el grupo. La mediana es un promedio no firme, esto es su valor no depende de todos Ios datos sino de uno, o dos, a Io sumo, pero han de estar ordenados. Sucálculoes imprescindible cuando no se puede obtener la media aritmética.

8.6:

CALCUL0 DE LA MEDIANA. Para el cálculo de la mediana consideraremos los siguientes casos:

10.

Los datos forman una serie simple que puede ser: a)númeroimpar deda-

tos; y b) número par de datos.

2o.

Los datos forman una distribución ordinaria de frecuencias

de valores

sin agrupar.

3o.

Los datos forman una distribución ordinaria de frecuencias agrupados en intervalos de amplitud variable o constante.

de valores

8.61: La mediana de una serie simple: Para el cálculo de la mediana en una serie simple de número impar o par de datos, bastará ordenar los datos creciente o decrecientemente y ver cuál es el lugar que corresponde al valor que deba bajo sÍy por encima igual número de casos. Por convención, este puesto o lugar,de orden selocaIiza así: D_ r-2

N+

1

(B)

rf


100

en donde:

P-

puesto o lugar de orden donde se halla la mediana.

N=

número de casos.

Ejemplo: sean las series simples A, con número impar de datos; y B, con número par, ordenados de menor a mayor. Calcular la mediana de ambas series:

= 11, 12, L3, 14, 15, L6, 17,20,23. Serie B = 1I, 12, 13, !4, L5, 16, L7, 20.

SerieA

NN-

9 8

Substituyendo en la tórmula B:

Paralaserie

A: P=

Para la serie

B:

9+1

-5 =

P

415

Como P nos indica el puesto que ocupa la mediana estando ordenados los dahemos de contar en cualquiera de ambos-sentidos tantos puestos o lugaresde orden como indique P. En la serie A el lugar 5 o quinto puesto Io ocupa el valor 15, que 15. deja por encima y por debajo igual número de casos. Luego, en la serie A, Md En la serie B buscamos el lugar cuatro y medio. Este lugar se halla entre los puestos 4o. y 5o. ocupados por los valores 14 y 15 respectivamente. La mediana será la seL4 15. misuma de ambc"s valores, o sea 14 15

tos,

=

*

:2 =

Puede notarse que una de las diferencias fundamentales entre la mediaaritmé-

tica y la mediana es que, contrario a Ia primera, a la segunda no la afectan los valores extremos, ya que en las series A y B anteriores, Ios valores primero y último, u otros intermedios, pudieron haber sido totalmente distintos a los dados que iro habrÍa modificación en los lugares de orden, y, por consiguiente, en el valor de la mediana.

8.62t

La mediana de una distrib Cuando se tiene una distribución de frecuencias, además de las ya conocidas columnas de valores Xi y de frecuencias absolutas 'rf", lhemos de agregar una terceia columna donde escribiremos las frecuencias acumuladas rrF¡rr. El procedimiento para calcular la mediana es el siguiente:

¡=f


101

1o.

Hallar la mitad de los casos, o sea hacer N/2, con lo cual el total queel 50"k de casos.

da dividido en dos partes, siendo cada una

2o,

Buscar en la columna de frecuencias acumuladas N/2, o la primera que sea superior a N/2.

Fi, la primera

que sea

igual a

3o. Si hay alguna frecuencia acumulada igual a Ia mitad de los casos, o sea alguna Fi -- N/2, la mediana serรก Ia semisuma de el valor que tiene frecuencia acumulada Fi = N/2, y del siguiente, 4o. Si ninguna frecuencia supera a

aN/2,|a

acumulada es igual

lor de la distribuciรณn que corresponde

N/2.

a la

mediana serรกel va-

primera frecuencia acumulada que

Ejemplo: calcular la mediana de las distribuciones de Ias tablas l(reproduciXU y XVl.

da en la tabla

TABLA

xi

XV

TABLA XVI

f.

Fi

2

2

NUMEROS PREMIADOS EN

(SORTEODEL 5 DE ENERO DE 1952), CTASIFICADOS SEGUN SU ULTIMA CIFRA

1 1

4

8

4

11

9

4

15

6

1

1

LA LOTERIA NACIONAL

ULTIMA

NIJMEROS

FRECUENCIA

CIFRA

PREMIADOS

ACUMULADA Fi.

xi

f.

10

3

18

11

2

20

0

101

101

25

1

116

217 330

t2 13

5

30

113

t4

8

38

108

15

4

42

4

127

559

16

3

45

5

134

693

18

4

49

6

oa

?86

19

1

50

,1

902

8

116 727

1,029

I

101

1,130

ยก=

50

FUENTE: Tabla I.

N

=

1,130

FUENTE: Vademecum de Frtadfsdca, ya citado.

ยก"1


L02

En la distribución de Ia tabla XV tenemos N = 50 y N/2 = 50/2 = 25.Vemos que en la columna de frecuencias acumuladas¡ol una Fi iguala N/2= 25, quecorresponde al valor Xi=L2. Según Io dicho en el paso 3o de 8.62, la mediana será la semisuma del valor que tiene frecuencia acumulada igual a N/2 y del siguiente. En-

tonces, en la distribución de la tabla XV:

Md=

12+

L3

2

= 12t5.

En Ia distribución de la tabla XVI tenemos N =1,130vN/2 iguala L,l-30/2 = 565. Vemos en la columna de frecuencias acumuladas que no hav Fi = N/2.

Luego, según lo dicho en el paso 4o de 8.62, la mediana será el valo,rquecorrespon-. de a Ia primera frecuencia acumulada que supera aN/2. Esta frecuencia es693y corresponde al valor Xi = Entonces en Ia distribución de Ia tabla XVl,

5.

Md

8.6222

=

5.

La mediana de una distri

intervalos.

ula. El cálculo de la mediana es el mismo para valores agrupados e.n intervalos de amplitud variable o constante, puesto que, según se ha visto, no Ia afectan todos los valores de la distribución. en

Vamos a obtener la mediana aplicando una regla de tres; la f6rmula que se usa para este caso.

y

después haremos

Ejemplo: calcular la mediana de la distribución de la tabla ll, que reproducimos en la tabla XVll. Nótese que hemos acumulado las frecuencias en dossentidos:el primero o Fi es ascendente; y el segundo o Fi'es descendente. Veamos: TABLA XYII

NTRVArcS

16-2011329 2L-25563% 26-30410323 31 - 35 36-42Aq306 41-62461286 46 - 50 51 - 55 56 - 60 61 - 65 tr - ?0 ?1 - ?5 ?6-80162%51 81 - 85 86-90132214 91-9553211 96 -100 l=m ffiNTE.

Tábl¿

tr-

13

23

39 51 4t 21 33 2A

106 157 198 225 258 218

21

315

35

2

329

2

319

262 223

t12 131 104

1\

rJ


103

Vamos a calcular primero la mediana tomando Ia ordenac¡ón ascendente, esdefrecuencias acumuladas Fi de laterceracolumna. Procedimien-

cir, trabajaremos con las to y pasos:

10.

Hallamos

N/2.

En este ejemplo

N/2 = 329 /2 = l64t

5

2o. Buscamos el punto o valor que deja bajo síy sobre sí L64t5 casos, o sea el 50"h de los mismos. 0bservando Ia columna tercera, de frecuencias acumuladas Fi, notamos que hasta el intervalo 51-55 hay 157 casos; y que en el intervalo siguiente, 56 - 60 hay 198 casosi o sea que N/2 = 164'5 casos están comprendidos entre los I98 del intervalo 56 - 60 y que en este se halla la mediana.

3o. Hacemos la diferencia 164'5 - L57 = 715. Esto quiere decir que hasta el límite superior del intervalo 51-55 que es 55'5 hay 15Tcasosyquenecesitamos 7r5 casos más para llegar al valor de Ia mediana. Como 55'5 es también el límite real inferior del intervalo 56 - 60, se trata, entonces,de ver cuántas unidades de medida hay que agregar al valor 55'5 para esos 7r5 casos que faltan para N/2.

4o. Suponemos que los 4l del intervalo 56

- 60

casos (frecuencias absolutas o repeticiones rrf (véase columna 2) se distribuyen homogéneamente.

tr)

5o.

Ahora ya sabemos que los 7r5 casos que nos faltan para llegar a N /2 son parte de los 4l casos de intervalo 56 - 60. Sólo nos resta,entoncesrver cuántas unidades de Ias 5 del intervalo 56- 60 corresponden a 7'5 casos. Para ello hacemos la siguiente regla: si 5 unidades (o sea Ia amplitud del intervalo) corresponden a 41 casos, equis unidades corresponderán a 7r5 casos.

0 sea:

5 x

-----

4L

---- - 7t5

715x5 , oe00n0e,x-

37t5

= T

=

-T-

60.

0191.

0'9I

Quiere decir que 7r5 casos corresponden a 0'91 unidades. Estas unidades las debemos agregar al lÍmite real superior del intervalo 51 - 55 que es 5515 o lÍmite real inferior del intervalo 56 - 60 que es el mismo, y el resultado será la mediana. Esto es:

Md

= 5515 +

0r

91 = 56t41¡

Md

=

56' 41,

Si substituimos los valores usados por la correspondiente notación, podemos hacer la fórmula siguiente para el cálculo de la mediana, siempre que la ordenación sea

¡'l


104

ascendente así:

N -F I\4d

= L.l-r ir

f

i-l-

,

(e) : t

. I

en la que:

Li_I =

Límite real inferior del intervalo donde está la mediana.

N/2 =

Mitad de los casos o 50./".

Fi-l =

Frecuencia acumulada inmediata anterior al intervalo donde está la med

iana

.

[i

=

frecuencia absoluta del intervalo donde está la mediana.

i

-

valor numérico de la amplitud del intervalo donde está Ia mediana.

Cuando se aplica Ia fórmula

guientes:

1)

N/2,

Se hace

9,

los pasos para calcular la mediana son los si-

en nuestro ejemplo de la distribución de la tabla

= 329 /2 = l64t 5.

XVll,N/2

2) Buscar en la columna de frecuencias acumuladas Fi la primera que supera a N/2. En el ejemplo esta frecuencia es 198 y el intervalo que le corresponde es el que contiene la mediana. Este intervalo es el 56 - 60 y de él tomamos el límite real inferior. Es decir, L._, igual a 55'5. 3) Ver cuál es la frecuencia acumulada inmediata anterior al intervalo donde está la mediana. En nuestro ejemplo .r Fi_I = 157.

4)

Ver cuál es la frecuencia absoluta del intervalo donde está la mediana. En

el ejemplo,

5)

fi = 4I.

Ver cuál es Ia amplitud del intervalo donde está

plo,

i=

la mediana.

En el ejem-

§.

y substituyendo en Ia f6rmula 9:

Md

=

55,5

.W

.5

= 55,5

.T

=55'5 r

o'91

rl


105

Md

= 56141.

Cuando la distribución está ordenada descendentemente (mayor a menor) se razona la obtención de la mediana en forma análoga a como lo hemos hechopara laordenación ascendente/ con la salvedad que en vez de tomar el límite inferiordelintervalotomamos el límite real superior y le restamos el resultado de la regla de tres. Eneste caso la fórmula es:

Md

N- - t¡-I 2

= L.*,

.i

(10)

f. I

En nuestro ejemplo de la tabla XVll:

l+r = 60'5 N/2 = L6415 E ' i-1 = L3L. L.

=41

f. I

-5.

I

Y substituyendo en la fórmula 10: Md

= 6015 Md

8.7:

=

t64t 5

-

131

4t

5 =6015 -

l67t 4L

5

= 60f5 -4tO9

56141.

CASOS ESPECIALES DE LA MEDIANA. Fuera de los casos expuestos, que son los más comunes, puede ocurrir:a) que

íl

la mediana quede entre dos intervalos; y b) que la mediana quede en un intervaloque tie ne cero de ftecuencia absoluta.

tervalos. Calcular la med iana de la distribu-

-


10ó TABLA XVIII

f

INTERVALOS

2-5 6-9 10-13 t4-1?

4 5 8

13

18-21 22-25 26-29 30-33 En el ejemplo de la tabla

15 o

4 2

N=

OO

XVlll N/2 = 60 /2 = 30.

Acumulando las frecuencias ascendentemente, hallamos

Fi

N/2 = 30.

al llegar al intervalo 14

Acumulando las frecuencias descendentemente, hallamos

ltl/2 = 30.

-

17

al llegar al intervalo 1B - 21

La mediana queda limitada entre los intervalos 14 - 17 y 18 - 2L. En este caso se toma como mediana el lÍmite real superior del intervalo si la ordenaciónes ascendente; o el límite real inferior si laordenaci6nesdescendente. Esdecir, Md= 17'5. Puede observarse que 17t5 es el límite real superiore inferiordeambos intervalos, según la ordenación ascendente o descendente respectivamente. b)

Calcular la mediana de la distribución de la tabla XlX.

TABLA XIX

f

INTERVAI,OS

Fi

5-8 o

-

10

13-16

2L 25 29 33

-28 -32 -36

10

6

4

x

1

= -5e-

rl


107

En el ejemplo de la tabla

XlX, N/2

=

36/2

= LB.

Acumulando las frecuencias ascendente o descendentemente, al llegar al in- 20, cuya frecuencia absoluta es f = 0 vemos que por encima y por deba jo del mismo queda el 507" de casos, es decir, 18.

tervalo L7

La mediana será el punto medio o marca de clase del intervafo que tiene ce

ro de frecuencia absoluta. 0 sea:

Md B.7L:

=

1815.

Uso de la mediana. Para Ia mediana podemos resumir las siguientes:

Ventajas: 1)

Es el promedio a usar cuando no conviene calcular Ia media aritmética.

2) Puede utilizarse cuando la distribución sea incompleta, pues no tan todos los valores sino uno o dos de ellos.

3)

la afec-

Su cálculo es útil para describir en mejor forma la tendencia central del hecho variable, pues ayuda a la comprensión de los resultados.

Desventajas:

1)

La principal es que resulta menos significativa y fiable que la media aritmética.

2)

Que para la serie simple y distribución de frecuencias de valores sin agrupar, la fórmula no dá el valor de la mediana sino el lugar deorden para localizarla. Las fórmulas 9 y 10, en canibio, sídan el valor numéri-

co de la mediana.

B.B:

LA MODA. CONCEPT0. La moda es el tercer estadístico que permite conocer la tendenciacentraf de

un fenómeno o hecho variable. El concepto de moda es sencillo: es aquel valor de la variable que más se repite, el que tiene mayor frecuencia. También se ledenomina modo, aunque es más apropiado llamarle moda.

La moda se denota por Mo (eme, mayúscula sub-ó). Ademásdelconceptodado, algunos autores consideran que moda t es todo valor tal que su frecuencia, sea superior a las de los valores inmediatamente anterior y posterior. De esta cuenta, si

¡,J


108

en la distribución hay solamente un valor cuya frecuencia sea mayor que la de cualquier otro, tendremos una distribución unimodal o de una moda. Esto, más bien de acuerdo a considerar por moda el valor más repetido. Pero si entendemos por moda todo valor cuya trecuencia supere a las de los valores anterior y posterior, entonces puede ocurrir que encontremos distribuciones bimodales (dos modas) o plurimodales (más de 2 modas).

8.9:

CALCUL0 DE LA MODA. Para el cálculo de la moda consideraremos los casos siguientes:

10. Los datos forman una serie simple. 2o. Los datos forman una distribución de frecuencias 3o.

de valores sinagrupar;

v

Los datos forman una distribución de frecuencias de valores agrupados en intervalos de amplitud constante o variable.

8.91: La moda en una serie simple: En realidad no tiene caso determinar la moda de una serie simple, excepto cuando hay valores repetidos. Para eso la moda se determina por simple inspección. Ejemplo: hallar la moda de Ia serie simplequesigue:

B, 10, 11, 11, L5, L5, L5, 16, l-7. Según lo dicho, vemos que el valor más repetido es el 15, pues aparece más veces que cualquiera de los demás. Luego, en Ia serie anterior,

Mo

=

15.

8,92t La moda en una distribución de frecuencias. Puede ocurrirque la distribución de frecuencias sea de valores s¡n agrupár; d;lái;res agrupados int.rru"ñ los. Según el caso se procede de diferente manera. Veamos: 8.92L: La moda de una distribuc En este caso la moda se determina por simpte inspección. Para ello basta observar la columna de frecuencias absolutas y ver cuál de todas es la mayor. La moda será el valor Xi al que corresponda esa ftecuencia. Ejemplo: calcular la moda de la distribución de la tabla l@ág.4q, Observando la columna de ftecuencias absolutas vemos que la más grande de todas es ocho (B) y que el valor al que corresponde es Xi = 14. Luego, en la distribuci6n de la tabla l:

Mo

= 14.

,ú)


109

8.922t

lon

La moda

en_i!ierva]os_. cuando los valores están agrupados en intervalos, puede tomarse como p,rtto medio o marca de clase del intervalo que tiene Iamayorfrecuencia' A la "l "*.1, moda así obtenida se le denomina moda *uda. Ejemplo:obtener la moda crudade la distribuciónde latabla X(pág. B7 ). (3) o de frecuencias absolutas, vemosquelamayorfrecuencia t::415, que corresponde al intervalo 25 - 30. Según lo dicho, la modaserálamarca de ciase del intervalo, o sea: 0hservando la columna

Mo

= 27t5

pero si deseamos calcular la moda, debemos ver entonces si los intervalcs son de amplitud constante o variable, En este caso, es decir, cuando se calcula, la moda recibe el nombre de moda interpolada.

8.922.t: a fórmula:

fi* rvru -

L

¡-r

T

1

(11)

;----=-

ti_I + ti+1

en la que:

Mo

=

moda

L¡-t

límite real inferior del intervalo donde está Ia moda.

f.+1 I

frecuencia absoluta inmediata siguiente al intervalo dondeestá la

f¡-t

frecuencia absoluta inmediata anterior

moda.

al intervalo donde está

Ia

moda.

i

-

amplitud del intervalo donde está la moda.

Ejemplo: calcular la moda -interpolada- de la distribución de la tabla ll, (pág.48). Localizamos pr¡mero Ia mayor frecuencia que es 51y corresponde al intet valo 51 - 55, cuyo lími[e real inferior es Lt-1 = 5015. Lafrecuenciainmediataan-

ri


110

terior es f._., - 39; y la frecuencia inmediata posterior es f¡ a1 = del interváldes i= 5. Luego, substittyendo en la fórmula 11.

Mo

4t = 50'5 + g;q

La ampf itud

201

.5 = 50'5 t TO- = 50'5 + Mo

8.922,2:

4L.

La moda de

=

2t5L

53101

u

. Para este caso debemos hallar el cociente Llamando k. (k, minúsculasubuencia entre la amplitud, o sea f , la moda estará en el intervalo que tenga mayorlk, y se calculaapli-

div D a es cando

/i.

de

:

Mo

k¡+t , = L. -i-r, T k.. + k*" l+r l-I

(L2)

en la que:

Mo

=

tfbda

t = límite real inferior del intervalo dord e está Ia moda. k¡*,- = cociente f /i de la trecuencia entre Ia amplitud del intervalo s¡guiente al que contiene la moda. Más propiamente: f.+1 : i. Li-

k.l- r- = i. = X,

cociente f /i de la frecuencia entre Ia amplitud del intervaloanterior al que contiene la moda. Más propiamente: f,-1 : i. amplitud del intervalo donde está la moda.

Ejemplo: calcular la moda, interpolada, de la distribución de la tabla XX, en la lorma siguiente:

que reproducimos en la tabla

a) b)

Columna Columna

c)

cotumna

d)

Columna

1: 2:

contiene los intervalos de Ia distribución. contiene las frecuencias absolutas 'rfrr de los intervalos

r, Il,$'X,t;:olii',i;,,,r0

"i"

de tos intervalos.

4: contiene los coeientes k. de dividir las frecuencias Ia amplitud respectiva.

de

I

entre la

,.¡


111

TABLA

ki = i/1

fi

INTERVALOS

-30 30-35 35-40 4n-50 50-60

(2)

(3)

104 475 185

5

20,8

5

83'0

(a) = (2:3)

5

to

14,6

D

38 810 N=

En

XX

10

3'8

0'8

e23

este.,.rr;.,;ffi

es 83. y te corresponde er interv ato 25-30, cuLa amplitud del mismo es de 5 unidades. Los k, inmediataposterior al intervalo donde se halla la moda son 20,8y'37. Luego,

yo límite inferior es mente anterior

y

25.

substituyendo en la fírmula 12:

37 37 + 20tB Mo

185

5718

=

28120

Cuando los intervalos anterior y siguiente al que contiene la moda son de igual amplitud, (como en la tabla anterior), no es necesario calcular los cocientes f/i sino basta tomar directamente las frecuencias absolutas y aplicar Ia fórmula II.

8.10:

Uso de la moda: Podemos resumir

el uso de la moda en las siguientés:

Ventajas:

I.

Es útil cuando se quiere tener, de manera rápida, un dato sobre más típico, más frecuente de la distribución.

cia central, o el promedio

2.

Se

la

tenden-

utiliza para obtener un Índice de la asímetrÍa de Ia distribuci6n.

Desventajas:

1. Es menos fiable que los demás estadísticos de tendencia central: media y mediana. Sin embargo, ayuda a la comprensión de los cálculos. 2.

En rigor matemático, la moda es más

difícil

de calcular que los otros valo-

¡'J


Lt2 res pues, por razinde ser el valor al que corresponde la ordenada máxima, se requeriría conocer la función matemática de la distribución para calcular su máximo.

8.101: estadÍsticos

dos Por ejemplo, si conocemos la media a la fórmula:

Conocidos los valores numéricos de obtener, aproximadamente, el tercero. y la mediana, podemos estimar Ia moda deacuerdo

Mo

= 3Md -

2X

(13)

que nos dice que lamoda es igual al triple de la medianamenos el doble de la media aritmética. Esta fórmula es conveniente cuando no deseamos calcular la moda en las formas ya expuestas, o cuando resultan dos o más valores o intervalos con la misma frecuencia absoluta.

ft


113

EJERCIC]O 8

1. 2.

Calcule por el método largo, aplicando fa fórmula distribuci6n dada en el ejercicío 6, página 54. Aplicando Ia fórmula en el ejercicio

3.

página

83, la media

de la

obtenga ra media de la distribución dada

Siguiendo los pasos dados en lapág.54 obtenga la mediana de la distribución del ejercicio 6. Verifique fa corrección de su razonamiento aplicando la fórmula

4.

7, pág. 94,

6.

4,

9,

pág.L04,

En la misma distribución del ejercicio do la fórmula 1I, pág. 109 .

6,

obtenga la moda interpolada aplican,-

ft


t

TEMA IX y centi les. conceptos. 9.2: cólculo de cuo¡tiles y centiles. 9.21: Dist¡ibución de f¡ecuencios de volo¡es ogruPodos en intervolos. 9.22: Distribución de frecuencios de volores sin ogrupor. 9.3: Determinoción grófico de cuorliles y cqntiles. oiivo de Golton. 9.4: Significoción de los puntuociones centiles.

9.1: cuq¡tiles

Eiercicios '

4


115

9.1:

CUARTILES Y CENTILES. CONCEPTOS.

Estas medidas, que algunos autores_llaman de tendencia centr-al o de posición, contribuyen a la descripción de un hecho vañáElá."eri P"§icrjlólál-Pá¿ágoriíá jqn--de -suma impqrtancia, especialmenle los centiles o pqrcentiles, ya que permiten la confección de escalas que dan significado a las puntuaciones individuales.

Cuartiles. Son pun total de ned¡das o ár"ea de

si el

número

o valores de la distribución que

dividen el

total de casos de una d

tribución queda en cuatro partes iguales a las que se denomina cuartos. Como N es siempre igual a 100, cada cuarto es un 25'/" del total. A los puntos o valoresqueseparan un cuarto de otro se les llama cuartiles. 0 sea que en toda distribución podemos considerar que hay cuatro cuartos y tres cuartiles. Un cuartil se denota por Qi (Q., mayúscula sub-0; el subÍndice serefierealnúmero de*cüártós que delimita; Ia letra Q al nombre original: quartile. De esta cuenta, Q1 es el primer cuartil; Q2 el segundo y Q3 el tercero. De acuerdo a lodicho, elcuartiiprimero es el punto que'separa hasta el [rimer cuarto; el cuartil segundoseparahas: ta el segundo cuarto y el tercer cuartil separa hasta el tercer cuarto. Por ser N =100, más propiamente se dice: Q1 es el puntoque deja bajo sí el 25% de los casos; Q2

deja bajo sí el5O"/" de los cásos v Q3 deja bajo sí

el75/".

En conse'cuencia, encima del cuartil primero queda el 75'/. de casos; sobre el cuartil segundo queda el 50%; y sobre el tercer cuartil queda el 25"/" de los casos. Al cuartil segundo, por separar a ambos lados de él 50"/, de los casos se le considera

igual que la mediana. Gráficamente y en una distribución normal, la relación entre cuartos y cuartiles

es la siguiente:

;f 25olo

25olo 2solo

2570

qqQ3 Figura No. 14


116

Centiles, Los centiles o percentiles son puntos de la escala o valores de ladistribución que dividen el total de'medidas o área de Ia curva de frecuencias en cien partes iguales. Es decir, si el número total de casos de una distribución se divide entre 100, esto es, N/100, la distribución de los casos queda en 100 partes iguales. Como N es igual a 100 cada centésima parte es un 1'/" del total. A los puntos que separan una centésima de otra se les llama centiles. 0 sea que en toda distribución podemos considerar que hay 100 partes iguales y 99 centiles. Un centil se denota por Ci (C, mayúscula sub-O y, de manera semejante a los cuartiles, son aquellos puntos que separan un tanto por cien del total de casos. De esta cuenta: Cl deja bajo síel 1"/, de los casos y sobre sí el99%; C2 deja baio siel 2"/" y sobre sí el-98f" de los casos. C2q deja bajo sí el25/, y sobre si el75/" de los casos, etc. Es fácil ver, entonces, l-al igualdades siguientes:

Qr =

czs

Q2= C50 =

Md

Q3 = cls 9:2,

DE CUARTILESY CENTILES.

9AL9UL0 En nz6n de su importancia, vamos a considerar solamente el cálculo de los cuartiles y centiles de una distribución, cuando los valores están agrupados en intervaIos de amplitud variable o constante. No obstante, aclaro que en varios de lostextoscitados en la bibliografía que aparece al final de estos apuntes, setratasuficientementela

-.*

obtención de estos valores en las series simples.

-

9.2L

Cálculo de cuartiles v centiles en una distribución de frecuenciasdevalores agrupados en intervalos. De manera similar a la mediana, el hecho que los tntervalos sean de amplitud variable o constante no afecta el cálculo de los cuartiles y de los centiles. Ya se habrá observado, que estos valores no se basan, para obtenerlos uno a -uno, en todos los datos sino en uno o dos, a Io sumo. Las fórmulas correspondientes (14 y I5) se han obtenido mediante el mismo razonamiento hecho para la fórmula de la mediana en este tipo dedistribución;esdecir, localizando el punto o valor que deba bajo síy sobre síun determinado porcentaje de caSOS.

Para el cálculo de los cuartiles se

utiliza la fórmula:

-

¡"1


117

i$N Q¡

= Li_r

+

-F

4

L*'ra'fe

i-1

ri

&ttu' ,a¡

(14')

ab

la que:

a. = Li-1 = i N -

cuartil que se busca.

I

Fi-'l I ¿=

ui = fi =

lÍmite rear inferior der intervaro donde se haila er cuartir buscado. sub índice numérico del cuartil buscado. número de casos o suma de frecuencias.

frecuencia acumulada inmediata anterior

til

buscado.

al intervalo

donde está el cuar-

amplitud del intervalo donde está el cuartil que se busca. frecuencia absoruta der intervafo donde se haila er cuartir buscado.

Para el cálculo se procede de Ia manera siguiente:

I L

10.

se forma una tabra de tres corumnas que contenga: a) intervarosde ra distribución; b) frecuencias absolutas; y c) ftecueñ.iri u.rrrüdas.

2o-

S: h3..9 N/4. Este cociente se multiplica por el valor numérico sub Índice del cuartil que se va a obtáner, o sea, i xN/4.

,ri,

del

4o. f,l * y/ Ia ia acumutada inmedta al in uar e busca. Esta dife_ ren direm sol ntervalo y multiplicar ués e ud valo. 5o. El resultado de las operaciones indicadas en er paso anterior lo sumaremos al límite real. inferior del intervalo, lo cual nos dará el valor directo ' del cuartil buscado.

rl)


118

Ejemplo: calcular los cuartiles primero (Qt), segundo (Q2) y tercero (Q¡) de para lo que reproducimos Ia tabla XVllen lasiguienla distribución de la tabla

te:

ll,

t

,ABLA xxr Fi

INTERVAT,OS

16-20 2t-25 26-30 31-35 36-40 41-45 46 - 50 51-55 56-60 61-65 66-70 7L-75 't6 - 80 81-85 86-90 91-95 96 - 100

1o)

10

20

43

t9

106

51

15?

bt

4l

198

27

225

r

258 16

2't8 294

21

315

20

7 5

329

2

FUENTE: Tabla

.

o

4 13

N=

Cálculo de Q,

1

1

5

329

II.

Tenemos formada la tabla de tres colurnnas. 2")Hace-

nosN/@B2'25.Elcuartilprimeroselocaliza.muItiplicandoelsubíndice 1, de QI , por N/4, o sea, 1 x 82'25 = BZt 25, 3o) Vemosenlacolum-

a

B2t 25 na de frecuencias acumuladas que Ia primera de estas que iguala o supera = 106, cuyo intervalo es 46 - 50. De este intervalo, en el cualestáelcuartil primero, tomamos el límite real inferior, o sea 45'5; 4o) Del valor 82r25 r.g9es Fi

,o-9e3_-B!_r2!_

:

87--= 15r25. Es-

soluta del intervalo dicho, o sea 15t25 :39 = O'39. A continuación multiplico el cociente anterior porla amplitud del intervalo, o sea:0r39 x 5 =1t95¡ y 5") .El producto 1'95 lo añade al límite real inferior del intervalo, esto es: 45t 5 + L'95 = 47'45. De manera que QI = 47'45. Según el concepto dado,47'45 es el punto bajo el cual'queda el 25%de los casos y sobre él , el 75/". Substituyendo en la fórmula

QI = 45'50+

14 serÍa:

1 x 82r25 -67

x

5=

45'50

I

76t25

'39

= 47t45


1I9

Cálculo de Q2. Siguiendo los pasos dados en la pág.118y de manera similar a como hemos calculado el primer cuartil, tendremos, para el cuartil segundo, observando la tabla XXI:

ixN/4=2x329/4=

t64t50

L.r- l-- = 55r5

'

F¡-t =

157 '

f. a¡ =

4L.

I

5.

Y substituyendo en Ia fórmula 14:

" 164t 50.',- t57 -55150+:+x5=55'50+ v2-^

0'91 =56t41

'4L

que es

trata.

el mismo valor hallado en el cálculo de la mediana de Ia distribuciónde que (pág

Il7)

.

Cálculo de ra et cátculo

Q".

Según los datos de la tabla XXI tenemos:

y los

se

pasos ya indicados,pa-

dl6-uariil terJeró

ix N/4 = 3x329/4 = 246175 Li-I = 65'5. f.

-

33.

=

5'

I

ai

Y substituyendo en la fórmula 14:

Ét Q3

. I

= 65'50+246172--225 x5 = 65'50 +

En resumen,

.,

L dir,ri;3.i6n

los valores de los cuartiles son:

de la Tabla

ll,

3t3O= 68'80.

reproducida en

la Tabla XXl,


L20

Ql = 47'45,

deja bajo sí

el25/"

de casos

y sobre si 75'h.

= 56141, deja bajo sí el50% de casos y-sobre si 50'h. Q3 = 68'80, deja bajo sí el75%de casos y sobre si 25/", Q2

Cálculo de centiles. Para calcular los centiles o percentiles de una distribución de valores agrupados en intervalos, se aplica la fórmula:

ixN -F i-I 'u, loo c.I = L.l-I,*

(15)

en la que:

C. =

centil o percentil que se busca.

Li-1=

límite real inferior del intervalo donde se halla el centilbuscado.

i

-

sub-índice numérico del centil buscado.

[

=

número de casos o suma de frecuencias.

I

F,-, t-r --

frecuencia acumulada inmediata anterior al intgrvalo donde está

til

el

cen-

buscado.

a. =

amplitud del intervalo donde está el centil que se busca.

n, =

frecuencia absoluta del intervalo donde se halla el centil buscado.

I

I

Para el cálculo de los centiles se siguen exactamente los mismos pasosquepara el cálculo de los cuartiles (ver página 119), con la salvedad que en vez de N/4 será N/100, ya que, por el mismo concepto del centil, lo que buscamos es aquellos valores que dejan bajo síy sobre síun cierto porcentaje de casos.

Ejemplo: calcular los centiles primero, veinticinco, cincuenta, sesenta y cinco y noventa, de la distribución de la tabla ll, con los datos que aparecen en la tablá

XXl.(pág.118 ).

r'l)


L27

Cálculo de

C1. Io)

Tenemos formada Ia tabla de tres columnas. 2o) Hacemos

N/100 = 329/L00 = 3t29. El centil primero se localiza multiplicando el sub indice 1, de c1, por N/100 o sea r x 3t29 = 3t29. 3") Vemos en la columna de frecuencias acumuladas que la primera de estas que supera o iguala a 3'29 es Fi= 6,cuyo intervalo es 2l- - 25. De este intervalo, en el cual está el centil primero, tomamos el límite real inferior, o sea 20r5. 4") Del valor 3129 restamos lafrecuenciaacumulada inmediata anterior, o sea 3129 - l= 2t29. Esta diferencia la dividiremos entre la frecuencia absoluta del intervalo dicho, o sea 2t29:5 = 0146. A continuación multiplicamos el cociente anterior pol la amplítud del intervalo, o sea Ot46 x5 = 2t30. Y 5') EI producto 2t30 lo sumo al lÍmite real inferiordelintervalo, esto es: 2Ot5 + 2t 30 = 22t80. De manera que C1 = 22tBO es el punto o valor bajo el cual queda el 1'/" de los casos y por encima el 99'h. Substituyendo en la fórmula 15 sería:

'

CI = 20'50+

3t2g-l

x5 = 20150 + 2t3O =

Z2\BO.

5

(El valor del centil uno, según Ia fórmula, seúa 22t79 va que el divisor anula con el factor 5. La diferencia de 0'01 se debe a que el cociente 2t2g b, 0'458 que aproximamos, por exceso de 0'46).

5

se es

Cálculo de0r= Siguiendo el mismo procedimiento y de acuerdo a los datosde la

tabla

XXEEññT:¿r'

i x N,2100 = 25 x 329 /100 = 82'25 Li_I =

45t 50

Fi_I =

67.

39.

a.

5.

tt)

I

Y subsfituyendo en la fórmula 15:. C25

=

45'50

+82t25-67 39

x5 =

45t50

+79'25 39

=47t45

y como C25= Q1, este resultado es igual al que hallamos en la página 118.


Cálculo de

Cs6.

Siguiendo el mismo procedimiento y de acuerdo a los datos de

la tabla XXl, tenemos:

ix

N,2100

=

50

x 329/l-O0 -- 164t50

L¡-t F.t-I. fi ai

= = = =

55r5

157. 41. 5'

Y substituyendo en la fórmula 15: C5O

l-64',50 - t57 --x5

= 55t50+

=55'50* 0191 =56'41

y como C5O = Q2 = Md, este resultado es igual a los que hallamosanteriormente pael cuartil segun?o (pág. 119 ) y para la mediana, (pá9. 117 ).

, ra

Cálculo de fa tabla

CZ5.

Siguiendo el mismo procedimiento y de acuerdo a losdatos de

XXl, tenemos:

i x N/100 =

75 x 329

/L00 =

2461 75

= Fi-I = f¡ = '¡ =

65'50

L¡-1

225,

33.

5'

y substituyendo en la fórmula 15:

cls = 65f50+ ,.j1üfrU

rl

246175 _225

B

x5 = 65150 + 3130 = 68180

= Q3, este resultado es igualal obtenido para

el cuartiltercero. (pá9.


723 Cálculo de la tabla

XXl,

Ccn.

Siguiendo el mismo procedimiento y de acuerdo a los datosde

tenemos:

ixN/100=90

x 329/100 = 296'| Li-1

Fi-t ri-

c-

B0'50 =

294.

2t. 5.

d. I

Y substituyendo en la fórmula 15:

c9o = Bor50+

296't - 294 2t

x5 = Bo'50+

1o'5 21,

= 81100.

Asícomo calculamos los cuartiles y centiles de los ejemplos, para Ia distribución de la tabla ll, podemos seguir obteniendo los demás valores. En la tabla XXlldamos los percentiles del I al 99 , de la distribución dicha. Hemos marcado con asterisTABLA XXII co (*) los centiles quecorrespondena lostres cuartiles. PUNTUACIONES CENTILES

I 5

32',S

10

37',98

15

4t,82

20

45',25

25.

4'1,45

30

49'56 51'40 53'01

4.0

6

54',62

50r

á6'41

55

58',42

60

60'43

65

63'&

?0

75.

66'30 68'80

80

?1€0

85 90

76'02 81'00

95

84',v2

99

94',2L

No solamente por las fórmulas se puede obtener el valorde la distribución que corresponde a un cierto cuartil o centil; existe un procedimiento gráfico, que veremos en páginas siguientes, mediante la 0jíva de Galton, que con casi la misma precisión, permite obtener esos valores o puntos fácilmente.

fl

)


t24

9.22t 9ru par.

Cuartiles v centiles de una distribución de frecuencias de valores sin a-

Para este caso, que es el de Ia distribución de la Tabla l, página 44 aunque, Ia mayoría de autores no Io tratan, conviene usar las fórmulas L4 y L5, formando la tabla de valores, frecuencias absolutas y frecuencias acumuladas; y procederconforme los pasos que se indicaron yapara el cálculo de estos valores en distribución de frecuen-

cias con intervalos.

9.3:

DETERMINACI0N GRAFICA DE cUARTILESY cENTILES. 0JlvA DE GALToN.

Además del cálculo aritmético de los cuartiles y centiles, utilizando las fórmulas respectivas, pueden localizarse estos puntos mediante Ia Ojiva de Galton (fig. l5) que da, con suma facilidad esos valores. Eri cierto modo la ojiva es semejante al diagrama acumulativo, con la diferencia que las frecuencias acumuladas se substituyen por los porcentajes que les corresponden dentro del total de casos.

b

la,

as

Para la localización gráfica de que se trata, dispondremos los datos en una taÍ:

a) Columna l: contiene los intervalos de la distribución. b) columna 2:contiene los límites reales superiores de los intervalos. c) columna 3:contiene las frecuencias absolutas de los intervalos. d) Columna 4:contiene las frecuencias acumuladas que corresponden a los límie)

bla gue:

ll.

Columna

t,

tes reales superiores de los intervalos.

:9,j:,:H:il5:::.*r,"s

acumulativos de las respectivas trécuen-

Ejemplo: construir Ia 0jiva de Galton que corresponde a la distribuciónde la taLos datos, según los pasos indicados anteriormente, aparecen en latab[aquesrj

¡"f


t L25

L TABLA XXIII INTERVALOS

Li*1

f

(1)

(2)

(3)

L6

-20

20'5

2l 26 31

óo 4L 46 51 56 61

-30

30'5

16

86

9t 96

_+0 -45 - 50 - 55 -60 -65 - 70

(4)

40'5 45'5 50'5 55'5

70'5

- 80 - 85 -90 -95 - 100

1

0'3

6

1'8

4

10

3'0 7'0 13'1

43

24

6'.t

39

106

51

157

4L

198

2'.t

225

60'2 68'4 84'5

16

218 294

2l

315

95'8

97'9 99'4 100'0

90'5

,|

322

95'5 100'5

5

321

2

329

N=

20'4 32'2

78',4

óó

80'5 85'5

(5)

1

20

60'5 65'5

Pa.

5

20

FUENTE: T¿bta

i.

13

77 81

89',4

329

II

Los valores de las columnas 1a 4 ya los conocemos. Los de la columna5,porcentajes acumulados (Pa) se obtienen de la manera siguiente: sabemos que hasta el lÍmite superior del intervalo 36 40, o sea hasta 40r5 hay 43 casos hréasecolumna4). Eltotal de casos es N = 329¡ ahora, ¿qué porcentaje es 43 respecto de 329 ?. Será Podemos décir, entonces, que el 13rL/" de sujetosquedan 43 x 100 z 329 = por debajo de la puntuación 40'5. De igual modo, hasta el valor 60'5, que esellÍmite real superior del intervalo 56 - 60 hay 198 casos, que representan el 60r2"/" de 329. Podemos decir, entonces, que por debajo de la puntuaci6n 60'5 queda el 6Ot2%de casos. La fórmula práctica de obtener los porcentajes acumulados de la columna 5esmultiplicando cada frecuencia acumulada Fi, por el cociente 100/N que es constante. En nuestro ejemplo esL00/329 = 0r304 aproximado por exceso. De manera Quermultiplicando todas las frecuencias acumuladas de la columna 4 por elvalor 0'304 obtendremos los porcentajes acumulados de la columna 5.

-

]-3tl,

Vemos también que los valores de Ia columna 5sonpuntuacionescentilesquecorresponden a los límites realessuperiores de los intervalos, puesto que el centil,como ya se dijo, es aquel valor o punto que deja bajo sí un cierto porcentaje de casos. Así, por ejemplo, la puntuación 6015, de! intervalo 56 60, equivale a la puntuación cen-

-

"J


L26

t¡t 60r 2. Para hacer Ia gráfica marcamos en abscisas los lÍmites reales superiores de los y en ordenadas los centiles en una escala de 0 a r00. Esta gráfica se construye uniendo los porcentajes acumulados que corresponden a los límites realesdichos, tal como se hizo para el diagrama acumulativo.

intervalos;

De esta cuenta, para saber qué centil corresponde a un determinado valoro puntuación, o viceversa, bastará encontrar el punto donde el valor de abscisas corta a Ia curva de porcentajes acumulados -que se llama 0jiva de Galton- y leer en la escala óentil; o, al revés, si deseamos saber qué valor corresponde a un centil dado, bastará ver en qué puntos ese centil corta a Ia 0jiva y leer en el eje de abscisas.

La 0jiva de la tabla parece en la figura

15.

ll,

según losdatos que hemosanotado en la tabla

XXlll, a-

,Jl

15.5 20.5 25.5 30.5

¿55flt5 ñ'5 ffr'5

6á,s To,r, ?5.ó 80.5 85.5 90.5 95,5 100.5

Figura 15; Ojiva de Galton. Datos de

la tabla II.


.\

t L27

L

9.4:

SIGNIFICACION DE LAS PUNTUACI0NES CENTILES. La aplicación de los centiles en ciertos aspectos educativos es de

vital

impor-

tancia. Entre las conveniencias de su uso citaremos las siguientes:

I) Una puntuación centil se interpreta más fácilmente que una puntuación directa. Por ejemplo: si en una prueba de Matemáticas un alumno ha obtenido 65 puntos no se puede conocer cómo está el rendimiento del alumno en esa materia, yaque Iapuntuación 65, como puede ser afta calificación, puede ser también mediana o baja. Pero si se dice que el alumno obtuvo el centil 65, se desprende que ha obtenido una calificación que le sitúa por encima del 65% de sujetos de su grupo y que por encimade él hay el 35"/, de individuos. » La necesidad de asignar puestos a los alumnos según su rendimiento-práctica muy observada en otros tiempos- se satisfacía por la apreciación personal del maestro. Los centiles resuelven de manera más objetiva y justa ese problema. Además las calificaciones escolares son más significativas si se asignan en relación al grupo al que pertenece el alumno. Así, la puntuación directa 65, por ejemplo, es más significativa en un grupo de B0 alumnos que en uno de 25. Es evidente quemientras más numeroso sea el grupo, la competencia es más reñida. 3) De las puntuaciones directas obtenidas por un alumno en diversas materias no se puede saber en cuál está mejor. Así, no podemos ver en qué asignatura es superlor un alumno que obtuvo 45 en Matemáticas, 3B en Lenguaje y 60 enCienciasNaturales. Para averiguarlo necesitamos comparar esas puntuaciones en la mismaunidad de medida. Esta unidad de comparación pueden ser los centiles.

t,l


v LZB

EJERCICIO 9

Con los datos del ejercicio

1. 2. 3.

6, página 54 , calcule:

Los cuartiles primero, segundo y tercero. Haga una tabla que contenga los percentiles semejante a la tabla XXll, pág 123

.

y las puntuaciones respectivas,

Hasa una tabla que contenga los datos de tatabla XXlll (páq. 125 y ) después, obtenga la 0jiva de Galton de la distribución. Compruiebegráficámente algunos centiles obtenidos mediante la apf icaci6n de ra fdrmula 15.

ft


t_

TEMA X

l0.l: Voriobilidod o dispersión. I0.2: Medidos de voriobilidod. 10.3: Recorrido o omplitud totol. 10.4: Amplitud semiinlercuo¡ti l. 10.5: Desviovión medio. Concepto. 10.6: Cótculo de lo desvioción medio. 10.ól: Serie simple( 10.62: Dist¡ibución de frecencios. l0'621: Volores sin ogrupor. 10.6222 Volores ogrupodos en inte¡volos. t0.7: Cálculo obreviqdo de lo desvioción medio. 10.71: Yolores ogrupodos en inte¡volos de omplitud vorioble. 10.72: Volores ogrupodos en intervqlos de omplitud consfonte. 10.73: 0bse¡vociones sobre lo desvioción medio. 10.74: Uso de lo desviqción medio. I0.8i Desvioción típico o siondo¡d. Definición y concepfo. 10.80: Cólculo de lo desvioci,ón típico. 10.81: Serie simple. 10.82: Distribución de frecuen' cios. I0.82lr Yolo¡es sin ogrupor' 10.822: Vqlores ogrupodos en iniervolos. I0.9: Cólculo obreviodo de lo desvioción típico. Fundomen' to. t0.91: Obtenci,ón de lo fó¡mulo fundomentol. 10.92: Volores sin ogrupor. 10.93: Yolores ogrupodos en intervolos de omplitud vorioble. 10.94: Volores ogrupodos en intervolos de omplitud colstonte. 10.95: P¡uebo de Cho¡l ie¡. 10.96: Obse¡vociones sobre lo desvioción típico. I0.97: Uso de !o desviooión típico. 10.98: Coeficiente de vorioci6n. 10.99: Lo qsimetrío. 10.99.1: Cálculo de lo osimelrío. 10.99.2: Coeficienie de osimetrío de Peorson. Eiercicios.


130

10"1:

VARIABILIDAD 0 DISPERSI0N.

La variabilidad es otro de los conceptos fundamentales, asícomo su medici6n imprescindible, cuando se hace el análisis estadístico de un fenómeno. Este análisis no puede Iimitarse a la obtención de la tendencia central; dicho de otro modo: la tendencia central es necesaria pero no suficiente para el estudio de una distribución. Se impone la necesidad de conocer cómo es esa tendencia/ y en qué medida se relacionan, en más o en menos/ los valores de la variable con el promedio. Que la media aritmética, y en general las medidas de tendencia central no son suficientes para describir un fenómeno, se pone de manifiesto en los siguientesejem-

plos:

d

Sean dos matrimonios; en el primero las estaturas de mujer y maridoson de m; en el segundo l'53 n, y lt67 m. En ambos matrimonios la estatura media es la misma, X = 1r60 m; y, sin embargo, en primero las estaturas de los cónyuges distan más del promedio que en el segundo.

1'50 m. y Lt70

b)

el

Dos grupos de niños, rrArr

Grupo lr4rr

y

rrBrr, ahorraron, en quetzales, lo siguiente:

= L, 2, 4,5, 10.

GruporrBtr=

3,4,4,5, 6,

X

=

414

X =

4t4

en donde vemos también que/ a pesar que el promedio de ahorro es el mismo en ambos grupos, las diferencias de los valores de uno y otro grupo respecto de su promedio los

hace distintos. Casos como los de los ejemplos se presentan a menudo; luego, se necesita sa-

ber, dentro del análisis, cómo es la tendencia central, de cuánta variabilidad está a-

fectada la distribución y si los valores se hallan muy dispersos o no alrededor de la tendencia central. Este es, en síntesis, el problema que se trata de resolver midiendo la variabilidad o dispersión. Diremos, entonces, que la variabilidad es la manera como varían o se distribuyen los valores de una variable respecto desutendenciacen-

tral. Al conocer la dispersión se conoce también la concentración de los valores, pues ambos términos son opuestos. Una variable donde hay mucha concentración ne poca dispersión y viceversa.

L0.2:

tie-

MEDIDAS DE VARIABILIDAD. De las medidas de variabilidad que estudiaremos a continuación, una eslamás

t! )


131

importante: la desviación típica. 0curre algo similar a las medidasdetendenciacentral, o sea que no todas tienen el mismo rigor. LaS que comúnmente Se USan, cada una con

sus limitaciones, son:

1. 2. 3. 4. 5. 10.3:

El recorrido, amplitud total o variación máxima. El recorrido o amplitud semiintercuartil. La desviación o variación media. La desviación típica o standard; y

El coeficiente de variación.

RECORRIDO 0 AMPLITUD T0TAL.

Esta medida se obtiene agregando una unidad, a la diferencia entre los valores mayor y menor de Ia distribución. Es exactámente el recorrido de la variablequeyacalculamos anteriormente apficando la fórmula

1.

Ejemplos:

l.

, d

La variable (errores en Obtener el recorrido de la distribución de la tabla un dictado) toma valores desde 3 hasta 19. Su recorrido será, entonces:

A=(L9-3)

+ l=17.

Obtener el recorrido de la distribución de Iatabla ll. Lavariable(puntuaciones en una prueba de Ciencias Naturales) toma valores desde 16 hasta 99. Surecorrido será:

b)

A=(99-16)

+ l=84.

El recorrido o amplitud es útil, especialmente, para determinar el número de intervalos y su amplitud, tal como se indicó en el tema respectivo. Comomedidadevariabílidad áeja mucho qrl d.t.ut y sólo se usa cuando se quiere saber, en forma rápi: da, un dato sobre lavariabilidad. Tiene el inconveniente, pues, de ser pocofiable ya que se basa en los valores extremos (mayor y menor) de la distribución; esto hace que sea, además, una medida un tanto gruesa. Por otra parte, no se puede obtenerla cuando los valores están agrupados y se desconocen los datos originales, o sea, si no se sabe cuáles son el mayor y menor valores de la variable.

10.4: y

¡.,,

RECORRID0 0 AMPLITUD SEMIINTERCUARTIL.

Esta medida se obtiene dividiendo entre 2 la diferencia de los cuartiles tercero primero. Se expresa mediante la fórmula:

Q=

Q¡-Qr

(16)


L32

a = recorrido

en la que:

o amplitud semiintercuartil.

Q3

=

cuartil tercero de la distribución.

Q1

=

cuartil primero de la distribución.

A la diferencia entre los cuartiles tercero y primero se Ie denomina amplitud intercuartil. Debajo del primer cuartif queda el 25% de los casos; y debajo del tercer cuartil el 75"h¡ entre ambos queda, entonces, el 50% medio de los casos, como Ia am plitud semiintercuartil (Q) es la mitad de la amplitud intercuartil, según la fírnula 16, resulta que Q es la mitad de la porción de la escala que contiene el 50'h medio de los casos. En una distribución normal y simétrica, el punto medio de la amplitud intercuar til y la mediana coincidirán. De igual manera, la mediana será igual al cuartil primerl más la amplitud semiintercuartil.

Para obtener la amplitud semiintercuartilaplicamos Ia fórmula

d

16.

Ejemplos:

0btener la amplitud semiintercuartil de la distribución de Ia Tabla

ll.

Enes-

ta distribución ya sabemos que QI vale 47t45 gás. 48 ) y Q¡ vate 68'80 (pág.48 Substituyendo en la fírmula

0-

6Bf

16,

tendremos:

B0 - 47145

zlt

35

2

)

L

= lot67

La amplitud semiintercuartil es poco usada como medida de variabilidad pero ayuda a comprender e interpretar las distribuciones.

10.5:

DESVIACI0N 0 VARIACI0N MEDIA. C0NCEPT0.

Ya sabemos que desviación es la diferencia entre un valor Xi cualquiera de la distribución y uno cualquiera de los promedios o medidas de tendencia central: media, mediana o moda. Si Ia desviación se toma respecto de la media será Xi - X, y será negativa o positiva, según que el valor Xi sea menor o mayor que la media, aunque tam bién puede ser cero. En estas desviaciones de los términos respecto de un promedio s6 basa el cálculo de la desviación o variación media como medida de variabilidad.Se pue de usar cualquiera de tos valores de teridencia central, aunque se prefiere usar la media. Cuando se calcula la desviación media, las desviaciones de los valoresrespecto del promedio elegido se toman en valor absoluto, esto es, prescindiendo del signo. Este valor absoluto se denota escribiendo entre dos líneas verticales el dato o su expresión. l-a desviaci6n media (D.M.) o variaci6n media (V.M.) es Ia media aritméticade las desviaciones -en valor absoluto- de los valores de la variable respecto de un pro./ medio. E§to se expresa según la fórmula 17, respecto de la media, así:

ti


L33

D. M.

= -frrl

(t7)

en la que:

D.M. = >l¿ I =

desviación media. suma de las desviaciones -en valor absoluto- de los valores respecto del promedio elegido. Como hemos tomado Ia media, será: d = lxi -

XI

N 10.6:

-

total de casos o suma de frecuencias.

CALCUL0 DE LA DESVIACI0N MEDIA. Para ef cálculo de la desviación media consideraremos los casos siguientes:

10. 2o, 3o.

Los datos forman una serie simple. Los datos forman una distribución de frecuencias de valores sin agrupar. Los datos forman una distribución de trecuencias de valores agrupados en intervalos de amplitud variable o constante.

10.61: La desviación media de una serie simple. Para este caso, habiendo calculado uno de los promedios, dispondremos los datos en unatabla que contendrá: Columna Columna

1: 2:

contiene los valores de la serie simple. contiene las desviaciones -en valor absoluto- de los valores de la serie respecto del promedio elegido.

Ejemplo: calcular la desviación media, respecto de la media aritmética,

de Ia

serie simple siguiente:

2,3,4,5, 6,7,8, 9, 10.

En esta serie,

X = 54/9 =

6.

Según los pasos indicados, se hará la tabla respectiva y se aplicará

la

fórmu-

la 17¡ para este ejemplo los datos aparecen en la tabla XXIV. La desviación media se obtiene dividiendo la suma de la columna 2 entreel número de términos o valores de la serie.

tJ


I 1

i_

t34

I I

TABLA XXIV

ldl

(1)

(2)

o4 JU ^o

42 ó1 60 71 82 93 104 20

En este ejemplo:

>lul

=

20

N-9 Y substituYendo en la fórmula 17:

D. M.

= 2O:9 = 2t2'

t0.62t valores agrupaSi la distribución de frecuencias es de valores sin agrupar, de Para con litud e las aplicand io ede la var

ndientes

D. M.

>r.

lal

la es

(18)

)

rJl

en la que:

D. M.

>f.

ldl

desviación media. suma de los product¡¡s de las frecuencias por las desviaciones, en


I3s valor absoluto, de los valores de la vaiiable respecto del promedio eleg

N_

ido.

suma de frecuencias o total de casos.

L0.62l-:

La desviación media de una distribución de frecuencias de vafores

sin agrupar. Para este caso hemos de disponer los datos en una tabla, así:' Columna Columna Columna

1: contiene los valores Xi de la variable. 2: contiene las frecuencias rrfrrde los valores. 3: contiene las desviaciones, en valor absoluto,

Columna

4:

de los valores respecto del promedio elegido. contiene los productos de multiplicar las frecuencias por las des-

v

iac iones .

La desviación media se obtiene dividiendo la suma de los valores de la columna 4 entre el total de casos.,

''-€jemplo: calcular la desviación media en la distribución de latabfa l, respectode la media aritmética, que es X = 12 Los datos aparecen en la tabla XXV,siguiente:

TABLA XXY

xi

f

(1)

(2)

lll

(3)

1

b

1

OD

515 416 312 26 12 0' 15 2t6 312 4L2 6%L 17-

7

I

4 4

10

3

8

11 12 13

5

t4

a

15

4

16

3

18

4

19

I N =50

FUENTE: Table

(4)

?18 11

2

5'

l-ldl

0,

¡'i

158

I.


136

En este ejemplo:

I r. l¿l = 158 N-50 Y substituyendo en la fórmula 1B:

D. M. = 158 : 50 = 3tL6, L0,622:

La desviación media de una distribución de frecuencias de valoresa-

grupados en interva

18,

Para este caso también se aplica la fórmula sdlo que toman de las marcas de clase o punto medio de los intervalos.

las desviácionesse

El procedimiento es el mismo para intervalos de amplitud variable o constante. Los datos para el cálculo de la desviación media los dispondremos en una tabla, así: Columna

1: 2:

Columna Columna

3: 4:

Columna

5:

Columna

contiene contiene cton. contiene contiene

los intervalos de la distribución. las marcas de clase

Xi

de los intervalos de la distribu-

las frecuencias rrfrr de los intervalos. las desviaciones, en valor absoluto, de las marcas de clase respecto del promedio elegido. contiene los productos de multiplicar las frecuencias por las desviaciones.

La desviación media se obtiene dividiendo la suma de los valores de lacolumna

5 entre la suma de fiecuencias. Ejemplo: calcular, respecto de la media aritmética que es viaci6n media de la distribución de la tabla gu

ll.

f

= 58r03,, la desLos datos están en la tabla XXVI, si-

iente:

¡.1


, r37

TABLA XXVI

'

.i *

TNTERVALos xi (1) (2,

(3)

16 27 26 31 36 4t 46 51 56 61 66 ?1 16 81 86 91 96

1 5 4 13 20 24 39 51 4t z'.t gg zo 16 2t 1 5 2

-

20 25 30 35 40 45 50 55 60 65 ?o T5 80 85 90 95 100

18 23 28 33 38 43 4 53 58 63 68 ?s 78 83 88 93 98

r

N=Izs

r.lal

lal (4)

5 = (3x4)

40'03 35'03 30'03 25',03 20:03 15'03 10'03 5',03 0'03 4'97 9'9T L4's1 19'9? 24',97 29'91 34.97 39,97

40'03 1?5'15 720',12 325',39

400'60 360'?2 391'17 256'53

l'23 134'19 s29'01

zgg'40 319'52 524'.37 209',79

174'85

19'gL

Lr4r,or

UENTE; Tabla IL

En este ejemplo:

2

r. l¿l =

N -

4,t421 oL 329.

, Y substituyendo en la fdrmula 18:

'---".'

,\\

1

D.M.=4,L42.0L:329=12'59.

calcular, respecto de la media aritmética, que es "','E¡emplo: desviaiión media de la distribución de la tabla X @ág.87 ). Lós datos aparecen en la tabla XXVII siguiente, asf:

X= 29'95,

la

r{t


138

TABLA XXVll

xif (2)

INTERVALOS

(1)

l¿l (3)

(4)

104 415

l',45

25

30

22',5 21'.5

35

32'5

185

35

40

40

50

50

60

45'0 55'0

8

20

5

15'05 25'05

N=823

r.l¿ I =(S x 4) .I?4'80

1,016'75 41l'.15 551'15 571'90 200'40 3,586'75

F(IENTE: Tabla X.

En este ejemplo:

>

f.

lol

=

823.

Y substituyendo en la fórmula 1B:

D.M.

ho.z,

= 3,586t75 : 823 =

4t 36.

cALCULo ABREVtADo DE LA DESVIActoN MED¡A. Si se observan los cálculos'y operaciones contenidos en las tablasXXVly XXVII

para obtener la desviación media, se notará fo laborioso de este método aplicando.la f6r mula 18. Esto se debe a que, generalmente, intervienen números fraccionarios, 9":u¡.q ciones de alto valor numérico o frecuencias elevadas. ¡ Ante esta dificultad ha habido qué introducir métodos abreviados para el cálculo de la desviación media, demanera semeiante a como se abrevia el cálculo de la media aritmética. Consideraremos únicamente, para el cálculo abreviado de la

desviaci6n media.

los dos casos siduientes:

a)

La distribuci6n de frecuencias de valores agrupados en intervalos

rJ de ampli-

tud variable.

b)

La distribuci§n de frecuencias de valores agrupados en intervalos tud constante.

de ampli-


L39

Ns s\stas\s \s srs\s, a\,\ana\§ss q»t \a Ysrrl»\a q»E sE »sapara e\pr\mer ca_ so/ es también aplicable a las distribuciones de frecuencias'de valores sin agiupar,co: mo los de la tabla l.

Para este caso, la desviación media se obtiene aplicando la fórmula: rl >f. ld'l + c(fi -

D. M.

fs)

(19)

en la que:

D. M.

=

desviación media

>f. ld'l = suma de los productos de multiplicar las frecuenciasrrfrr 'l

de los

intervalos, por las desviaciones -en valor absoluto-de Ias mar-

cas de clase respecto de un promedio arbjtrario.

c

=

ri

=

fs

=

N

-

diferencia entre el promedio verdadero y el arbitrario o supuesto.

;:ffi:i;:1',HJ*ffi'J:l1lJ#:,::.i,1'l,l"T::

número de casos o frecuencias que quedan desde el intervalo siguiente al del promedio arbitrario, hasta el intervalo superior. número de casos o suma de frecuencias.

Los datos para el cálculo los dispondremos

d

Columna.

b)

columna

d)

Columna Columna

c)

e, primer inter-

I:

2: 3:

4:

asÍ

contiene los intervalos de la distribuci6n. contiene ras marcas de clase Xi de los intervalos. contiene las frecuencias rfr de los intervalos. contiene las desviaciones arbitrarias, en valor absoluto de las marcas de clase respecto de un promedio arbitrario. Las designaremos por dr.

e)

Columna

5: contiene los productos

de multiplicar las fuecuencias por

las desviaciones arbitrarias.

r:i


140

La desviación media se obtendrá de la m4nera siguiente:

1. El promedio arbitrario es la marca de clase del intervalo donde se halla el promedio verdadero. 2. 3.

Las desviaciones dr se toman en valor absoluto.

Todas las desviaciones dr se deben multiplicar por las frecuenciasrespectivas. Con estos productos se formará la columna 5 que ha de ser totalizada

4.

.

Contaremos cuántos casos o frecuencias hay entre ef primer intervalo y donde está el promedio arbitrario. Estos casos seráh Jos rrfi rl

el intervalo

de la fórmula.

5,

Contaremos también cuántos casos o frecuencias hay

entre el intervalo

siguiente al del promedio arbitrario y el intervalo superior. Estos casosserán los rrfsrr de la fórmula.

6. La diferencia fi-fs, la multiplicaremos por la diferencia entreel pfome: dio verdadero menos el promedio arbitrario, para obtener la "crrde lafórmula. Si Ia desviación media se calcula respecto de la media aritmética, setá

c=X-Xs. 7

.

El producto c (fi

lumna

- fs) Io sumaremos a la suma de los valores de la co5 y luego dividiremos entre el total de casos o N. El cocienteserála

desviación media.

Ejemplo: calcular abreviadamente, respecto de la media aritmética, ladesviación media de'la distribución de la tabla X. Los datos aparecen en la tabla XXV|ll. En esta distribución ya sabemos gue X = 29t95¡ y como el promedio arbis supuesto se toma de la marca de clase del intervalo donde se halla el promedio trario

verdadero, tendremos que Xs

= 2715, pues 29t95

se halla en el intervalo

25

- 30.

TABLA XXVIII

INTERVAI.OS (1)

20 - 2s - 30 Bo - as

I tr 50 -

Xi (2) 22 21 32

5 s s

í: I: 60

550

f.

fi =

',

s19

(4)

fro4

5

[41s

0

frrt

*-133 (

8

N=823 FUENTE. Tebla X-

ld1

(3)

10 1?',5 21'5

r'.J 520

?30 665

220 3. 060


14r

En este ejemplo:

>f. ld'l = 3,060 c = 29tg5 -27\5 =

2145

fi = 519 fs = 304

fi -fs=2L5 N=823 Y substituyendo en la fórmula 19:

3,060+2t45x2L5

D'M'=

=3,586t752823=4t36.

az3

resultado que ya habíamos hallado anteriormente.

Para este caso, la desviación media se obtiene aplicando la fórmula:

D.M.

=

) r.

ld'l

+ c (fi -

fs)

(20)

en la que:

D. M. desviación

media

) rla'l = ,rrn, de los productos de multiplicar las frecuencias I'f" intervalos, por Ias desviaciones -en valor absoluto-

de

de los

las mar-

cas de clase respecto de unpromedioarbitrario. Estasdesviaciones son unitarias.

c

=

diferencia entre el promedio verdadero arbitrario.

fi

=

número de casos o ftecuencias que quedan tlesde valo hasta el intervalo del promedio arbitrario.

y el

promedio supuesto o

el primer inter-

I,J


t42

número de casos o frecuencias que quedan desde el intervalo siguiente al del promedio arbitrario, hasta el intervalo superior.

fs

número de casos o suma de frecuencias.

i

-

amplitud constante de los intervalos,

Los datos para el cálculo, Ios dispondremos en una tabla, así:

Columna Columna Columna

1: 2: 3: 4:

Columna

5:

Columna

los intervalos de la distribución. las marcas de clase Xi de los intervalos. las frecuencias "fI de los intervalos. las desviaciones unitarias, en valor absoluto,de las marcas de clase respecto del promedio arbitrario. contiene los productos de multiplicar las Frecuencias por las desviaciones arbitrarias.

contiene contiene contiene contiene

Para obtener las desviaciones unitarias se sigue el mismo procedimiento utilizado para las desviaciones en el cálculo abreviado de la media aritmética. Ténganse presentes las recomendaciones dadas en el numeral 5, de B .43, página 97.

Ejemplo: calcular abreviadamente, respecto de la media aritmética,ladesviación media de la distribución de la tabla ll. En esta distribución X = 5B' 03 y como el promedio arbitrario se toma de la marca de clase del intervalo donde está el promedio verdadero, será Xs = 58, del intervalo 56- 60. Los datos se hallan en la tabla XXIX siguiente: TABLA XXIX

NTERVAPS

xi

(1)

(2)

16-20n(t 27 - 25 2q - 30 3r - 35 a6 _ 40 4t-454324 46-048139 51 - 55

Es

61 66 11 16 81 86 er s6

" 6J 60 13 rs 83 88 g¡ *

56

23 2F 33 T

65 ?0 ?5 80 85 90 sn 1oo

ruNTE: Tabla

ld1 (4)

f. ldl

5:

(3 x4) 8

15 14

fi =rq"

113

120

35

24 65

80 12

-60

-

f (3)

E.

78

1.,

l¡i (21 133 120

B

Jre

131 121

N=

51 21 66 60 64 105

11

42

329

l, L,

35 16

;!'


t43

En este ejemplo:

>f. c=

ld'l

=

B2B

- 58:5 = fi = 198 fs = 131

58103

01006

fi -fs=67

i = 5. N = 329. Y substituyendo en la fórmula 20:

'---\

D.M.

-

828 + 01006

x

67

329

.5 = 4,l42t0l-

z 329 =I2t59

resultado que ya habíamos hallado anteriormente. (pás. 141 ).

10.732 Observaciones sobre la desviación media. La desviación media como medida de variabilidad, es mucho más fiable que táaffi'rtud o recorrido yque la amplitud semiintercuartil, pues, como hemos visto, se basa en las desviacionesde todos los valores de la variable respecto del promedio elegido. Como se dijo, se puede calcular sobre cualquier promedio, aunque acá nos hemos limitado al cálculorespecto de la media aritmética. Cuando una distribución es aproximadamente normal, simétrica o de tipo gaussiano, ocufre que enlre el puntc o valor situado a una desviación media por debajo de la media aritmética, y el punto o valor situado a una desviación media porencimade la media aritmética, queda comprendido el 5B"h de los casos. 0 sea: restandoy suman do una D.M. a la media aritmética, los dos valores que resultan dejan comprendido en tre síel 587" de los casos. Esto es:

Xt r

O.

M. =

comprende

el

58"/" de los casos.

Comprobemos si en nuestra distribuci6n de las puntuaciones en la prueba se cumple la propiedad dicha. Tomemos, de Ciencias Naturales, dada en la tabla

ll,

para ello, la distribuci6n segfnaparece en Iatabla XXI (pág. 118 en esta distribuci6n X = 58'03 y D.M. 12'59. Entonces:

=

). Yá sabemos que

r-T


L44

X - 1 D.M. = 58103 - 12'59 = 45144

X+1D.M.

=58103 + L2t59 = 70t62

Si la distribución es aproximadamente normal, entre los valores 45t 44

y

70t 62 estará comprendido el 587" de los casos. Veamos: 45t44 se encuentra en el intervalo 41 - 45, hasta el cual hay (véase la columna Fi 67 casos. Como entre el lÍmite real superior del intervalo, que es 45r5 y el valor 45t 44 apenas hay la diferencia de 0.06 unidades, diremos que debajo del valor 45t 44 quedan 67 casos.

El otro valor, que es 70t62 se halla en el intervalo 7L-75 cuyo límite real superior es 75'5; Ia columna Fi nos dice que hasta dicho límite hay 278 casos. La diferencia entre ese límite y el valor 70t 62 es igual a 4'BB unidades. Debemos aver¡guar cuántos casos, de los 20 que hay en dicho intervalo según Ia columna 'rf'r, corresponden a 4tBB unidades y restarlos de los 278 casos que hay hasta el límite 75'5. Esto se averigua así: Si a 5 unidades (las del intervalo)corresponden ZOcasos, a 4'BB unidades corresponderán 20 x 4'88: 5 = L9t 52 casos. Entoncps, hasta el valor 70' 62 quedan 278 - Lgt 52 = 25Bt 48 casos; aproximadamente 258

e

casos. Entonces:

67

casos. Debajo del valor 45'44 hay aproximadamente Debajo del valor 70' 62 hay aproximadamente 258 casos .

Entre los puntos 70'62y 45t 44 quedan, aproximadamente, 258 - 67= 191 casos, que representan el 5B%.de los casos/ esto es, 5B"hde 329. Esteresultado nos dice que la distribución es aproximadamente normal.

10.74:

Uso de la desviacién

media. Es aconsejable utilizar Ia desvia-

ción media;

a)

Si se quiere saber et grado de aproximación de una distribución a la

curva notmal.

b) Si se desea comparar varias distribuciones, siendo mejor que más la de menor desviación media.

c)

-

sola prueba.

las

de-

Cuando se quieren formar grupos equivalentes con-la aplicaciónde una

't.l


L44

X

- 1 D.M. = 58103 - 12'59 =

X+1D.M. =58'03

+

12159 =

45t44 70t 62

Si la distribución es aproximadamente normal, entre los valores 45t 44 70' 62 estará comprendido el 5Bl. de los casos.

y

Veamos: 45t44 se encuentra en el intervalol 41 - 45, hasta el cual hay (véase la columna Fi 67 casos. Como entre el IÍmite real superior del intervalo, que es 45'5 y el valor 45t44 apenas hay la diferencia de 0.06 unidades, diremos que debajo del valor 45t 44 quedan 67 casos.

El otro valor, que es 70'62 se halla en el intervalo 7L-75 cuyo límite real superior es 75t5; la columna Fi nos dice que hasta dicho límite hay 278 casos. La diferencia entre ese límite y el valor 70'62 es igual a 4'BB unidades. Debemos averiguar cuántos casos, de los 20 que hay en dicho intervalo según Ia columna "f'r, corresponden a 4¡88 unidades y restarlos de los 278 casos que hay hasta el límite 75t 5. Esto se averigua asÍ: Si a 5 unidades (las del intervalo)corresponden 2Ocasos, a 4188 unidades corresponderán 20 x 4r88: 5 = 19'52 casos. Entoncps, hasta el valor 70'62 quedan 278 - L9t 52 = 258' 48 casos; aproximadamente 258 casos. Entonces:

67

casos. Debajo del valor 45t 44 hay aproximadamente Debajo del valor 70'62 hay aproximadamente 25Bcasos .

Entre los puntos 70'62 y 451 44 quedan, aproximadamente, 258 - 67= 191 casos, que representan el 58"/,.de los casos, esto es, 58% de 329. Esteresultado nos dice que la distribución es aproximadamente normal.

L0.74t

Uso de la desviacién

media. Es aconsejable utilizar la desvia-

ción media;

d

Si se quiere saber el grado de aproximación de una distribución

a

la

curva normal.

b) Si se desea comparar varias distribuciones, siendo mejor que más la de menor desviación media.

c) sola prueba.

las

de-

Cuando se quieren formar grupos equivalentes con-la aplicaciónde una

,,1


L45

10.8:

LA DESVIACI0N TIPICA 0 DESVIACI0N STANDARD.

típica o standard es la principal medida de variabilidad y deposible. Además de los nombres de standard o típicatamquesea siempre be calcularse bién se le llama: desviación tipo, desvío paY6n, cuadrado medio de la variaci6n y desviación cuadrática media.

, La desviación

'

griega(fque se lee rrSigma minúscula", aunque también se utiliza Ia letra castellana "srro las iniciales S.D. de Standard De' viation, nombre que le dió su introductor,,el Estadístico Karl Pearson en elañoLBg6. nEs universalmente usada, no solo por ser la más significativa y fiable de las medidas de variabilidad, sino por los muchos cálculos a los que se aplica, propiedades que la Se denota generalmente por la letra

caracterizan, etc.

'

CUando se calculó la desviación media pudo notarse que las desviaciones no setomaron con sus signos correspondientes sino en valor absoluto. Esto sehaceasí convencionalmente, ya que matemáticamente no tiene fundamentación, lo cual no deja de ser un inconveniente de la desviación media. I La desviación tÍpica o standard también también se calcula tomando las desviaciones de los valores de la variable respecto de la media aritmética. Estas desviaciones tendrán signo negativo unas y positivootras; también sabemos que la suma algebraica de las desviaciones es cero..Este inconvenien te se salva elevando esas desviaciones al cuadrado, con lo cual lodas se convierten en positivas, ya que toda cantidad, negativa o positiva, tienecuadradopositivo. La suma de los cuadrados de las desviaciones dividida entre el total N de casos es lo quese denomina varianza¡ si a esta varianza extraemos raizcuadrada el resultado será la desviac ión típica.

La raz6n de extraer raiz cuadrada es para volver las desviaciones a Ia unidad de medida de la variable. Es decir: si la unidad de medida fuera lineal, alcuadrar las desviaciones éstas ya no estarían en unidades Iineales sino cuadradas. Para retornarlas a la unidad de medida lineal debe extraerse raíz cuadrada.

-Definición; La desviación típica o standard se define como la ra(z cuadta' da de la med¡a aritnÉt¡ca de los cuadrados de las desviaciones. Y la f6rmula fundamental que la expresa es:

/_ >d2

\J =v/ c=.

*

en la que:

O-

desviación típica o standard.

eD

¡:í


L46

> d¿ =

suma de tos cuadrados de las desviaciones de los valores de lavariable respecto de la media aritmética.

N 10.80:

número de casos o suma de frecuencias.'

CALCUL0 DE LA DESVIACI0N TIPICA 0 STANDARD. Para el cálculo de la desviación típica consideraremos los casos siguien-

tes:

1.

Los datos torman una serie simple.

2.

Los datos forman una distribución de frecuencias de valoressinagrupar.

3.

Los datos forman una distribución de frecuencias de valores agrupados en intervalos de amplitud variable o constante.

10.81.

para este caso basta Los datos para el cálculo los hemos de disponer en una tabla, habiendo obtenido previamente la media aritmética, en Ia forma siguie.nte:

aplicar

laf6rmula2l. Columna Columna

1: 2:

contiene 'los valores Xi de la serie. contiene las desviaciones d de los valores Xi respecto de la

Columna

3:

media aritmética. contiene los cuadrados de las desviaciones.

La desviación típica se obtiene extrayendo aiz cuadrada al cociente de dividir la suma de los valores de la columna 3, entre el número de términos de la serie.

Ejempfo: calcular Ia desviación tÍpica de Ia serie TABLA XXX

s

TTT

xi

d.

d2

4,t 4s

1 s

4s s

4000 38-24 3?-39 35 -5

25 96

igu

iente:

47, 43, 40, 38,37, 35. En esta

serie, X =

40.

Los datos

el cálculo los vemos en la Tabla XXX.

para

ú


t47

En este ejemplo:

>d2 = 96 N =6. Y substituyendo en la fórmula 21:

q=V0; =r[; = 6

4.

10 . 82: Puede ocurrir que los plitud variable o cons una modificación de la fórmula

: aplica indistintamente a estos casos y es en el sentido que las desviaciones al cuadradosemul tiplicarán por las frecuencias correspondientes, es decir:

2!,

Q2)

en la que:

O-

)

-

f.d2=

N-

desviación tíPica o standard. suma de los productos de las frecuencias por los cuadrados de las_des

viaciones de los valores de la variable respecto de la mediaaritmética suma de frecuencias o total de casos.

10.B2L: Para este caso, y habiendo calculado previa datos en una tabla, así:

1: cont¡ene los valores Xi derrfrrla distribución. de los valores. Columna 2: contiene las ftecuencias Columna 3: contiene las desviaciones de los valores Xi respecto de la me' Columna

dia aritmética.

Columna Columna

4: contiene los cuadrados de las desviaciones 5: contiene los productos de multiplicar las frecuencias por los cuadrados de las desviaciones.

rl


148

Ejemplo: calcular la desviación típica de la distribución de Ia Tabla

la que X =

12.

l,

en

Los datos aparecen en la tabla XXXI.

La desviación típica se obtiene extrayendo raíz cuadrada, al cociente de dividir la suma de los valores de la columna 5 entre la suma de los valores de Ia columna 2, que es el total de casos. En este ejemplo:

2¡. a2 =

750

N-50. Y substituyendo en la fírmula 22: 750 50

= t/ 15

= 3t87.

TABLA XXXI

(

2

t.d 5 = (zx4)

f

d.

d

1)

(2)

(3)

(4)

3

z

81

1

49

162 49

b

1

36

36

8

4

16

64

I

4

I

36

10

3

4

12

11

2

1

t2

5 :1

13 L4

8

15

4

16

4 16

48

t44

18

4

óo

19

1

49

N=

50

FUENTE: Tabla I.

49 ?50


148

Ejemplo: calcular la desviación típica de la distribución de la Tabla

Ia que

X= 12.

l,

en

Los datos aparecen en la tabla XXXI.

La desviación típica se obtiene extrayendo raíz cuadrada, al cociente de dividir la suma de los valores de la columna 5 entre la suma de los valores de Ia columna 2, que es eltotal de casos. En este ejemplo:

2¡. a2 =

750

N-50. Y substituyendo en la fírmula 22t 750 50

= t/ 15

= 3t87.

TABLA XXXI

XII

(1)

(4

2

d.

d

(3)

(4)

Í. ¡2 5 -- (r"E

2

81

5

1

49

762 49

b

1

36

36

4 4

16

64

7 8

I 10

2

11

o

4

12

1

2

t2 :1

13 L4

8

15

4

4

I 16

16 18

4

19

1

N=

50

FUENTE: Tabla I.

48

t44 49

lo ?50

rJ


L49

d

ución de frecuencias de va10.822. La lores agrupados qqjnlg1y_alel Ya dijimos que para este caso se aplica lafírmula22,

@l¡tuddelosintervalosseavariableoconstante.Laúnica

salvedad es que los valores Xi serán las marcas de clase de los intervalos, de manera semejante a como hemos hecho para otros cálculos. Los datos, habiendo calculado previamente la media aritmética, pondremos en una tabla, así:

Columna Columna Columna

1: 2: 3: 4:

Columna Columna

5: 6:

Columna

los dis-

contiene los intervalos de Ia distribución. contiene las marcas de clase Xi de los intervalos. contiene las frecuencias 'rf'r de los intervalos. contiene las desviaciones (d) de las marcas de clase respecto de la media aritmética. contiene los cuadrados de las desviaciones. contiene los productos de multiplicar las frecuencias por los cuadrados de las desviaciones.

La desviación típica se obtiene extrayendo raíz cuadrada, al cociente de dividir la suma de los valores de la columna .6 entre la suma de frecuencias.

_ Ejemplo: calcular la desviación típica de la distribuc.ión de la Tablall, 58. Los datos para el cálculo aparecen en la tabla siguiente:

en la que X =

TABLA XXXII

r. ¿2 6=1sx5)

lNTERVAI,OS (1)

16-20 26-30 31-35 36-40 4t-45 46-50 51-55 56-60 61-65 66-?0 ?1-?5 't6 - 80 81-85 86-90 91-95 96 - 100

18 23 28 33 38 43 48 53 58410 63215 68 ?3 ?8 83 88730 93535 98240

1 5 4 13 20 24 39 51 33 20 16 21

N= 329 FUENTE: Tabla tr.

-40 -35

-30 -25

-20 -15

-10

-5 10 15

20 25

600 L,225 900 625 400 225 1oo 25 1,

25 100 225 400

1,600 6,125

3,600 8,125 8,000

5,400 3,900 7,275 6?5

3,300

4,500

6,400 625 13.125 900 6,300 t,225 6,125 1,600 3,200 81,650

jt,


150 En este ejemplo:

2f. d2 = N -

81,650. 329.

Y substituyendo en la fórnula 22:

81,650

o-10.9:

fz+e,rc = t5'75

CALCUL0 ABREVIADO DE LA DESVIACI0N TlPICA. FUNDAMENTO.

Es fácilobservar que aplicando la fórmula 22, el cálculo de Ia desviación típica resulta laborioso. Repetimos acá algo de lo dicho para la nredia aritmética: conviene abreviar la obtención de es[os valores, utilizando un procedimiento que/ con ia misma precisión, haga más rápido el cálculo. Además, si se puede obtener la media aritmética con base en las desviaciones de los valores respecto de una media supuesta, este principio fundamentelaobtención de Ia desviación típica abreviadamente. De esta cuenta, como veremosal finaf del presente tema/ en un solo cuadro podemos resumir todos los datos y operaciones para obtener los valores estadíslicos de una muestra.

10.91: Obtención de Ia fórmula Fundamental. La [órmula fundamental para el cálculo abreviado de Ia desviación típica se obtiene tomanclo las desviaciones de Ios valores Xi, respecto de una media supuesta Xs que ya conocemos. Demostrac ión (*)

En la figura

L3, pág. 82 ,

d = Xi - X -

sean:

desviación de un valor Xi respecto de la media aritmética verdadera.

dr= Xi h =X-

Xs

= desviación de un valor Xi respecto tica supuesta. (Xs

=

de la media aritmé-

P)

Xs = diferencia entre la media aritmélica verdadera y la meclia supuesta.

dr-d=(Xi -Xs)-(X¡ -ñ=Xi (.) Nota importanre:

-X-s-Xi +X=X-Xs=h.

La demost¡ación anterior la he tomado de "Introducción a los Métodos Estadfsticos", del Lic. Manuel Gonz|lez Bellido", ya citado.

t.l


151

Entonces:

dr=d+h(10.9I.1) d,2 = ¿2 + zdh + n2

¡0.9t.2)

Pero por ser la suma algebraica de las desviaciones respecto de Ia media gual a cero, Ia expresión anterior queda:

2¿'2 = 2¿2 +

trlh2

)¿'2 = >d2 +

¡2

i-

Dividiendo entre N:

NN De 10.91.1 se deduce

(10.91.3)

que:

>dr = >d+Nh Como en

el primer término del segundo miembro es

igu-al a

cero, Ia igualdad

anterior queda:

>d' = despejando h:

Nh

h -

Ia' N

Substituyendo en 10

2d'2

N =

.91,3 el valor de h, tendremos:

>o' - fZ1' \' N \N /

de donde:

>

d2 = >d,2 N

N-

_¡ |/> o,\2

\ru/

fl


t52

Extrayendo taíz cuadradat

es decir:

(23) que es la fórmula fundamental para el cálculo de Ia desviación

típica,

por

el método a-

brev iado.

l0 ,92t

La desviación típica -abreviadamente- de una distribución de fre-

Cuando se presente este caso, la fórmula 23 se modifica en el sentido afectar las desviaciones por las frecuencias correspondientes, o sea:

de

(24) en la que:

O- -

2

r'

d'

2

=

/ \^ () f.¿' ¡z = \ N / N -

desviación típica o standard.

¡,,xflil{';

i',".'J;:T, ff"

T

it'

iJ

r' i

:,'i: i' ilJ,l.T'

fJ i :' ;::1

;

dividir la suma algebraica de los productos de las frecuencias por las desviaciones, entre el número de casos. cuadrado del cociente de

suma de frecuencias o total de casos.

Los datos para el cálculo los hemos de disponer en una tabla, así: Columna

Columna Columna

1: 2: 3:

contiene los valores Xi de la distribucién. contiene las frecuencias (D de los valores. contiene las desviaciones (dr) arbitrarias ,de Ios valores respecto de la media supuesta.

rl


153

Columna

4:

contiene los productos de multiplicar las frecuencias por las

Columna

5:

desviaciones. contiene los productos de multiplicar las frecuencias por los cuadrados de las desviaciones.

La desviación típica se obtiene así: la suma de los valores de la columna restamos el cuadrado de dividir Ia suma algebraica de los valores de la columna 4entre Iasumadefrecuencias. A esta dilerencia se le extrae raiz cuadrada.

5 se divide entre la suma de lrecuencias. A este cocienter

Posiblemente en la distribución de frecuencias de valores sin agrupar no sea mucha Ia abreviatura/ pero al menos evita calcular los cuadrados de las desviaciones por separado. Nótese Io dicho en lo siguiente: en Ia columna 4 van los producLos (f,dr). Para formar Ia columna 5, no es menester cuadrar las desviaciones de Ia columna 3 y multiplicarlas.por Ias frecuencias, Bastará multiplicar los valores de Ia colur¡na 3 por los valores de Ia columna 4

Ejemplo: calcular Ia desviación típica -abreviadamente- de ción de Ia [abla

l,

tomando Xs

= 14.

Ia

distribu-

Los datos para elcálculo aparecen en la tabla

siguiente: TABLA XXXIII

xi (1)

f (2)

_d' (3)

é

Z

-II

5 1 1 6 3 't 4 8 4 9 3 10 2 11 72 5 13 s t480 154144 16326\2 18141664 1915525 N=

50

FUENTE: Tabla I.

¡--

-9 -8 -1 -6 -5 -4 -3 -2 -1

f.d' (4) -I -8 -21 -24 -20 -72 -6 -10 -5

- 106

f.¿'2 5

= (3 x 4) 81

64 l4',t 1-41

100 48 18 20

5

914

¡§


154

En este ejemplo:

2t '

d'2

)r.

d'

N

Y substituyendo en Ia fórmula

o-o-C-

t9t48

,B V

=

3'BB'7 3t

resulLado qLre ya habíamos hall ado anLer ormente (pá9.

10.93:

t52

).

La desviación típica -abreviadamente- de una distribución de fre-

Cuando se tiene este caso se aplica Ia fórmula 24, con la salvedad que para las desviaciones se usan las marcas de clase y de cada una seresta IamediasupuesLd.

Los datos para el cálculo se disponen en una tabla de 6 columnas, de las cuales Ia primera contiene los intervalos de Ia dis[ribución y las restantes en el mismo orden que se ha dado para el caso anterior.

1-0.94: La desviación típica -abreviadamente- de una distribución de frecuencias de valores agrupados en intervalos de amplitud constante. Para este caso, la fórmula 24 tiene la siguiente modificación: las desviaciones se toman unitarias respecto de Ia media supuestá, es decir, cada desviación se divide entre la amplitud que es conslanLe, tal como lo expresa la fórmula 7.L, Pág.95 aunque/ como ya se dijo, la forma de hacerlo en Ia práctica es escribir las desviacio nes unitarias, con sus signos respec[ivos, por encima y por debajo de Ia desviación ce ro. Por larazón apuntada, en Ia iórmula 25 aparece Ia amplitud como factor, así:

rl


155

cr -i

i

(25)

t

en la que:

2

o-

=

desviación típica o standard.

I

=

amplitud constante de los intervalos.

multiplicar las frecuencias por los unitarias. las desviaciones de cuadrados suma de los productos de

¡.¿',2

cuadrado del cociente de dividir la suma algebraica de los pro-

ductos de Ias frecuencias por las desviaciones unitarias,entre el total de casos. suma de frecuencias o

total de casos.

Los datos para el cálculo los hemos de disponer en una tabla, así: Columna Columna Columna Columna

1: contiene los intervalos de la distribución. 2: contiene los valores Xi o marcas de clase de los intervalos. 3: contiene Ias frecuencias (0 de los intervalos. 4: contiene las desviaciones unitarias de las marcas de clase,

Columna

5:

na

u'

c

o r um

respecto de Ia media supuesta. contiene los productos de multiplicar las frecuencias por las desviac iones unitarias.

::::',"":"

o;'i 1'o'"

:'.tT,i.', frxt' ll]iil,lx'.

t'""'

nc

i

as por

I

o

s

La desviación típica se obtiene así: a) Ia suma de los valores de la co6 se divide entre el tdtal de casos; b) A esta suma restamos el cociente de dividir la suma algebraica de los valores de la columna 5 entre el total de casos. Este cociente se ha de elevar al cuadrado; c) a la diferencia anterior se le extrae ta(zcuadrada y el resultado se multiplica por el valor numérico de la amplitud de losintervalumna

los. de la tabla g uiente:

N

Ejemplo: calcular abreviadamente la desviación típica de la distribuci6n tomando Xs = 53. Los datos para el cálculo aparecen en la tabla si-

ll,

¡i


15ó

TABLA XXXIV

INTERVALOS

(i)

f. (3)

Xi (2)

18 16 - 20 23 21 - 25 28 26. - 30 33 31 - 35 36 - 40 38 43 4! - 45 46 - 50 § 51-5553510 56-605841147 61-656327254 66-706833399 71-?57320480 '76-807816580 81-8583216126 86-90887'.l 91-95935840 96 -100 98 FUENTE: Tabla

1 5 4 13 20 24 39

f.d,

d' (4)

f.d'2

-G)

-7 -6 -5 -4 -3 -2 -1

6

;1+;5)

-7

49

-30 -20

180

-52

208

-60

180

100

-48

96

-39

39

4t 108

297 320 400 756 49

320

2 N= 329

I

762 3.599

18

331

II.

En este ejemplo:

2¡,d'2 =

>f.d'

=

t-

[

3,599. 33l-. 5.

=

329.

ú

Y substituyendo en la fírnula 25:

Tt c= 5 I lz,sqq

/33A I -= ) --rD \-rl l'l _l 0=5x3rl5=15t75

5


L57

resultado que ya habíamos hallado anteriormente (pág. 155 ).

Es interesante hacer notar que cuando se usa el método abreviado, no hay necesidad de hacer por separado los cuadrados de las desviaciones.0bsérveseelcua/dro o tabla XXXIV y se verá que tenemos:

a) b)

Columna Columna

5: 6:

los productos f .d' los productos (d')

(f.d') = f ,d'2,

obtenidosmultiplican-

do entre sí los valores de las columnas 4 y

5, -¡'

10.95: Prueba de Charlier. La prueba o comprobación de Charlier sirve para comprobar la exactitud del cálculo de la desviación típica. Llamando "d" a las desviaciones de los valores respecto de la media aritmética, y en virtud que:

) ¡ tA + D2 = 2r

ta2

+

2d

+ I) = 2fd2 + Z >fd + 2f

calcularemos, utilizando (tabla XXXIU los valores de la columna3(frecuencias)ycoIumna 4 (desviaciones), a) elcuadrado de la suma de las desviaciones más uno; y b)) el producto de las frecuencias por los cuadrados dados en d. Veamos:

(d + t)2 -7 -6 -5 -4

+ + + +

-2 + -1+ 0+ 1+

1) 1) 1) 1)

=

f(d + L)2 36

25

=

= =

)=

16 9

4 1 0

I 4 o

3+ 4+ u+ 6+ 7¡ 8+ 91

xI=36 x5=125 4= 16 x 64 o x13= 117 4 x20=80 I x24=24 0 x39= 0 1 x 5l = 51 4 x 41 -764 q x27=243 16 x33=523 x20=500 36 x16= 5?6 49 x 21 = 1,029 64 x7=W 81 x5=405 100 x2=200 óD

16 36

49 64 81 100

¿,Tgo

frl


158

Vemos que:

)r t¿ + t)2 = te,

4,590.

En la tabla XXXIV podemos ver, en Ias columnas que:

6, 5 y 3,

respectivamen-

2r. d2 = 3,599 2>f. 2x 33L = 662 662..

2f= N =

329,

Según el desarrollo del binomio dado,

y

contrados:

4,590 = 3,599 + 662 +

4,590 =

4

substituyendo por los valores en-

329

,590

igualdad que nos dice que el cálculo ha sido bien hecho.

LO.96t

gbservaciones sobre la desviación

tÍpica" La desviación típica o

standard es la más fiable y significativa de las medidas de varlabilidad. Enunadistribución aproximadamente normal, se cumple Io siguiente: Si a la mediaaritmética se leresta y suma una desviación típica, se encuentran 2.puntos o valores que comprenden entre si el 68'/" de los casos. Para determinar esta zona, se sigue un razonam¡ento análogo al utilizado para encontrar el 58% de casos que quedan comprendidos en el área limitada a una desviación media, por debajo y por encima, de la media aritmética.

10.97: diverso

ción típica es

citar algunas de estas aplicaciones, así:

1.

d

Ef uso y aplicaciones de ladesviay significación de esta medida.podemos

Cuando se desea conocer el grado de aproximación de una distribución

empÍrica, a Ia curva normal.

2. 3.

Cuando se desea igualar la variabilidad de dos o más distribuciones. Para

calcular otros valores, como los siguientes: sigma individual,

construcción de escalas, coeficiente de variaci6n, coeficiente de correlación lineal de

Pearson, lírnites de confianza, etc.

rl


159

Coeficientq de variación. Este coeficiente resulta de multiplicar r ^^.. ruu, por el,10:?8: cociente de dividir la desviación típica de una distribución entre h ar¡tmética correspondiente. Viene dado por la fórmula:

A^

;;;i;

C.

V=

0-

-=-

x

X

(26)

100

en Ia que: C.

V. =

fr

=

desviación típica

X

=

media aritmética

coeficiente de variación.

En nuestra distribución de ra tabra

calculados, tendremos:

C. V. =

l5t

75

58.

il,

substituyendo por los varores ya

xl0O=27

EI coeficiente de variación se calcula generalmente sobre la media aritmé-r.: o.el tanto porcientoque ladesviacióntípica ¿" i, ", aber, cuál de dos o óás J¡rii¡O*irn.r', es menos varia_ las variabres en las que hay cero absoruto, razón por ra que en la mayoría de ras variabres psicorógicas y pedagágicas no se recomienda.

interpr dia aritmética. Se ble' su uso se lim tica.

Sue,le

10.99.

LA ASIMETRIA.

La asimetría es o ística que, además de Ia tendencia central y la variabilidad, ayuda a comp se disiribuyen los valoies de una variable. una distribución es simétrica varores de su varor centrar;encaso contrario será asimétrica. La simetría perfecta"quidistan solo ocurre teóricamente, y por ex-

cepc

ión, en la

práct ica.

La asimetría puede ser de dos tipos: negativa o hacia a Ia izquierda y positiva o hacia la derecha. Es negativa cuando rnu-d. lur rrrá, ie la curva seex tiende más sobre la izquierda; y es positiva cuando una de las ramas se extiende sobre la derecha.

máE


160 t

l_ La asimetrÍa de una distribución se hace en comparación a la curva norma que es simétrica. Grál'icamente se puede expresar así:

I

16. a

Figura No.16

Distribución simétrica, como la que indica la fig. 16.a en la que los valores y frecuencias se distribuyen simétricamente respecto del valor central. en la que lo tendida sobre la izquierda. ra que tos vatores no se disrribuyen

tendida sobre Ia derecha.

como la que

se indica en la fig. 16.

b

icamente, y una de las rarnas está hás ex-

simétric#:[:]i,iH'd""'ljj1H:r':jU'^]3

X:

Son muchos los factores que influyen en la asimetría de una distribución; por ejemplo: instrumentos de medida impertectos, muestra poco representativa, influen cia del tactor subjetivo, Ia manera especial de conducirse un fenómeno, etc. Solo eñ

condiciones estrictamente ideales se puede encontrar una distribución simétrica. En síntesis, la asimetría consiste en el alejamiento, en más o en menos, de losvalores de una distribución empírica respecto de la forma simétrica de Ia curva normal dedistribuc ión.

1:

10 .99. Cálculo de Ia asimetría: De varias maneras se puede calcular Ia asimetría de una distribución, por ejemplo, mediante el momento central de tercer orden, o sea el cubo de las desviaciones de los valores de la variable respecto de la media aritmética. También mediante Ia desviación cuartilar, habida cuenta que en una

distribución normal los cuartiles 1o y 3o equidistan de la mediana o cuartilsegundo y en la medida que esta relaci6n difiera se conformará una mayor o menor asimetrÍa. Por otra parte, como en una distribución normal simétrica, Ios valoresde

rl


16r

tendencia central (media, mediana y moda) coinciden, se puede tomar Ia relaci6n entre la media y la moda para calcular la deformación. En este caso Ia asimetría se expresa por:

Sk = X -

(27)

Mo

en la que:

Sk =

asimetría (de skewness, nombre en inglés).

X =

media aritmética.

Mo =

moda.

Como la diferencia es algebraica, puede resultar de signo positivo(asimé-

trica positiva) o de signo negativo (asimétrica negativa), según que la media sea mayor o menor que la moda, respectivamente.

dia =

58.

Ejemplo: en nuestra distribución de la tabla ll, y con los valores de la mey moda = 53,|a asimetría, substituyendo en la fórmula 27, seríaz

Sk=58

53 -5.

que nos dice que la distribución es asimétrica positiva, esto es, los valores se extienden más sobre la derecha o por encima de la moda, Esto lo podemos comprobar observando las figuras 3, pág. 62 ¡ y 7 , pá9. 66

L0.99.2:

Coeficiente de asimetría de Pearson. La asimetría dada por la

ivamente, de preferencia fórmula 27 estáen térmi cuando se desea comparar la asimetría de dos o más distribuciones, se utiliza el coeficiente de asimetría de Pearson, que es:

S'=

X-Mo O_

-

(28)

rJ

en la que:

Sr

=

coeficiente de asimetría de Pearson.

X

=

media aritmética.

Mo =

moda


L62

O

=

desviación típica.

En nuestra distribución de la tabla

s,=

58-53 t5t

75

=

ll,

sería:

0'32

El valor numérico de comparación de este coeficiente es así:

Si S'es igual que cero, indica simetría. Es el caso de cuando la media

y

fa moda coinciden.

Si S' es menor que cero, indica asimetría negativa. Es el caso de cuando la media es menor que la moda. Si S' es mayor que cero, indica asimetría positiva. Es el caso de cuando Ia media es mayor que Ia moda. Para cerrar este tema, damos a continuación un modelo de cuadro o tabla estadÍstico que sirve para los datos y operaciones de los valores de tendenciacentraly variabilidad, especialmente cuando se usa una distribución de valores agrupadosen intervalos de amplitud constante y se procede conforme al método abreviado. Estecuadro como se verá, es un resumen de las tablas ya vistas y evita calcularlos separadamen-

te.

,J


163

I

NT ERVA LOS

Con los datos consignados en una tabla que contenga las columnas

de la

anterior, podemos calcular:

6¡ »

a) La tendencia central, asÍ: 1) La media: columnas números 2,3, La moda. Columnas 1, 3. La mediana: columnas L,3, y 4¡

y1

b)

»

Los cuartiles y percentiles: columnas

5,

-

y

L, 3 y 4.

c) La variabilidad, así: 1) La desviaci6n media: columnas La desviación típica: columnas 2, 3, 5, 6, 7.

2,3,5,y 6¡ -

,rl


I

164

l

EJERCtCto l0 ca lc

I. 2. 3. 4'

u

le:

con ros datos de Ia distribución que hemos dado en er ejercic io

La amplitud semiintercuartil. Use la fórmula

L6, pág,

,

La desviación media. Use la fórmufa

lB,

La desviación media. Use Ia fórmula

20, pág. 14L .

pág

134

7

'

9. 10.

y

sumando

r. indica en 10,73,

La desviación

típica.

Use la fórmula

22, pág.

La desviación

tÍpica.

Use la fórmula

25, pág. 155.

147

,

Compruebe si en dicha dístribución, restando y sumando una desviación la media aritmética, Ios puntos encontrados déjan

síer 68.,/"Je

tÍpica

l;;;;;;..

a

Verifique Ia exactitud del cálculo de la desviación típic.a, mediante la comprobación de Chartier. proceda como se ind¡ca en tó .é\i-iai.1if.- " Coeficiente de variación. Use la fórmula Haga un cuadro

26, página I5g.

otabla como er que se da en Ia página

la distribución del ejercicio 6.

11.

131

Compruebe si dicha distribución es aproximadamente normal, restando una desviación media a Ia media aritmética. Proceda.oro

entre

B'

pág.54

.

pág ina

5. 6.

6,

L63 , y resuma en él

coeficiente de asimetría de pearsonr use Ia fórmura28, página

16r

.

4


TEMA XI

ll.l:

ll.2: ldeo elementol Ecuoción de lo curvo

Curvo de distribuci,ón.

de lo curvo normol.

lI.2l:

normol. Grólico. 11.22: Propiedodes de lo cu¡vo normol. Il.3: Puntuociones típicos o stondord. ll.3 l: Areos bolo !o curvo no¡mol. Toblo. ll-4: E¡emplos de problemos que se resuelven or los óreos de lo curvo normol . E jercicios.

f{t


t66

11.1:

CURVA DE DISTRIBUCI0N.

Si nos fijamos en Ia distribución de la tabla ll y en las gráficas correspon3, 7 y B), podremos advertir que el fenómeno de que se trata, esto es,

dientes (figs.

puntuaciones alcanzadas por un grupo de alumnos en una prueba de Ciencias Naturales,

es un rasgo que no se halla repartido por igual entre los sujetos de ese grupo. Es fácil ver que entre los punteos 16y 99 hay toda una variedad de puntuaciones. La gráfica misma nos dice que un fenómeno de este tipotiende a formar una curva que seaproxima a la figura de una campana. Esta torma acampanada es Io que se llama curva de distribución y viene determinada porque los valores no se reparten por igual. Cuandoel grupo que sirve de muestra es representativo de la población, esta,curvatiendeasersimétrica notándose que la mayor frecuencia de valores se agrupa en torno a un punto medio y quedando en los extremos los casos menos numerosos. No todos, pero sÍgran parte de los fenómenos que hemos denominadoátípicos, se reparten en forma acampanada. A efecto de estudiar másafondo tasdistribuciones acampanadas se introdujo en Estadística la curva normal o curva ideal de estetipo de fenómeno§'. Vamos a ver/ somera y elementalmente en qué consiste dicha curva.

Ll.2:

IDEA ELEMENTAL DE LA CURVA NORMAL.

Se llama curva normal a la expresión gráfica de una ecuación matemática, que da lugar a una distribución teórica de frecuencias llamada distribuciónnormal. Esta distribución es, entre las teóricas, la que más se presta al estudio de fenómenosempíricos de tipo acampanado y se le ha definido como ¡rla descripción más probable de las frecuencias de ciertos acontecimlentos naturalesrr. Llamar normal a esta curva no indica, en r¡gor/ ninguna normalidad; el ca-

Iificativo es más cuestión de costumbre.

ella, pero es evidente síse comporten así.

yen conforme a

riables que

No todos los fenómenos atípicos se distribuque en psicologíay pedagogíaexistenmuchasva-

Lr..2l Ecuación de la curva normal. Qáfjqa, Al decir que la distribución normal es teórica, se quiere indicar que no es rETni Empírica, sino matemática;y tiene por ecuación la siguiente:

Y = Yo

_22

.e

2

e9)

en la que:

y

=

yo =

la ordenada correspondiente a un cierto valorrrz'r.. la ordenada máxima que corresponde a la media aritmética.

¡ri


167

e=

la base de los logaritmos neperianos. EI número'rerrvale

z=

2.71828.

puntuación típica o valor expresado en términos de la desviación

típica. La puntuación típica, que se denota por ¡lzrr (zeta minúsculd se obtiene mediante la f6rmula:

z==Xi - X

x

frr

en Ia que:

(30)

Xi

=

puntuación directa o valor directo en la variable; p.e.: ción 65 en un test.

X

= = =

media aritmética de la distribución.

r x

la

puntua

desviación típica de ladistribución.

(equis minúscula), puntuación diferencial o difeiénciaalgebraica entre una puntuación directa Xi menos la media aritmética.

La distribución normal tiene, por representación gráfica, normal, la siguiente:

o sea la curva

rt


168

I

L1.22,:

La distribución normaltiene las

propiedades o caracte

1.

Todas las ordenadas son siempre positivas.

2.

Es unimodal.

3.

Es simétrica respecto de su ordenada máxima, o sea, Ia ordenada que corresponde a Ia moda.

4. 5.

La media aritmética es igual a cero

y la desviación típica igual a uno.

Los valores de tendencia central coinciden, o sea que media aritmética =

mediana

= moda.

6.

La suma de todas las frecuencias o área total bajo la curva es iguala la unidad.

7.

Entre dos valores fijos queda siempre la misma área o número de casos.

B.

En el intervalo definido entre una desviación típica por encima y por debajo de la mediá aritmética, queda comprendido el 68"/" de los casos; o sea:

X 11.3:

t Í = 68%

PUNTUACIONES TIPICAS.

Si a un valor Xi cualquiera de una distribución de ftecuencias restamos la media aritmética y dividimos la diferencia entre la desviación típica, el valor obtenido se denomina puntuación típica. A la diferencia entre ese valor Xi y la media aritmética se le llama puntuación diferencial. Es decir, también, que una puntuación típicaesun valor empírico o puntuación directa expresado en términos dé variabilidad oenunidades

típicas. Paraobtenerlapuntuacióntípicadeunvalordirectobastasubstituirenlafórmula 30. (páS. L67 ). La puntuación típica puede ser negativa cuando el valor directo es menor que la media aritmética; igual a cero, o positiva.

,¿

Por ejemplo: en un test un alumno obtuvo la calificación Xi = 80, siendo = 10. La puntuación típica de este alumnose-

la media = 50 y la desviación tfpica ria,:

B0-50 10

30 10

_-

tl


L69

En este ejemplo, la puntuación típica 3 es positiva y nos indica que el asuperior a la media aritmética en 3 desviaciones típicas Iumno es

Dicha puntuaci6n'tz't también puede ser negativa, por ejemplo,

X=50 ,Í

si Xi =20

= 10. Esdecir:

z:

20 - 50

En este ejemplo, z

10 =

-3,

=

-30 10

-3.

nos indica que el alumno es inferior

a la media

aritmética en tres desviaciones típicas. La puntuación típica también se Ilama rrsigma de un sujetorry tiene, entre. otras ventajas, su significado universal y que permite Ia comparación de dosomás va-' lores de una distribución en las mismas unidades, o de dos o más distribuciones'Se interpreta como el número de signas ro desviaciones tÍpicas a que se encuentra una puntuación directa Xi por encima o por debajo de la media aritmética. Veamos un ejemplo sobre lo dicho: al alumno M Ie fueron aplicadas las ptuebas rrArr y rrBrr. En la prueba rrA'r obtuvo 42 puntos y en la prueba "8"32 puntos. Tenemos, pues, las siguienles puntuaciones direclas:

XA = 42¡ Xg = 32. En la prueba "A", la media aritmética es 30 y la desviación típica 12; y Aunque aparentemente el en la prueba rrB't, la media es 20 y la desviación típica alumno es superior en la prueba "At', la comparación solo será rigurosa en términosde la variabilidad, o sea, en puntuaciones típicas. Tenemos entonces, losdatossiguien-

6.

tes:

Prueba 'rA'r Prueba

rrB'l

XtrXi 30 12 20632

42

Obteniendo primero las puntuaciones diferenciales (x) tendremos:

xA = X4 - XA = 42- 30 =

L2.

,-t


170

Por Io que se ve, el alumno M tiene igual puntuación diferencial en ambas pruebas, siendo Superior a la media aritmética en las dos; petot ¿podemos decir que estas puntuaciones significan lo mismo? ¿que es tan superior en la prueba "A'r como en la prueba "B'r?. Para responder, debemos reducir las puntuaciones diferenciales a típicas, y, substituyendo según indica Ia fórmula 30, tendremos:

zA -

A

l2

O

L2

*B

z3= o

L2

-1

- z.

Los resultados anteriores nos dicen que en la prueba "A" el alumno M es superior a la media aritmética en una desviación típica; y que en la prueba 'rB"es superior en dos desviaciones típicas. En resumen, el alumno M es superior en la prueba t'Btt respecto de la prueba I'A".

Tabla. La tabla que damos a conti11.3I: la curva normal. Es de doble entrada, nuación (*) se conoc rrzrl así: en la primera fi Ia y en la primera columna contiene las puntuaciones típicas indicadas por x/Ü, y er el cuerpo de la tabla los porcentajes de casos que corresponden a las puntuaciones típicas. La tabla ha sido construida para dar el número de casos que se hallan entre la media aritmética y el valor tÍpico indicado por la fi la y lacolumna, enunamuestra de I0,000. Los valores del cuerpo de Ia tabla suelen interpretarse como probabilidades o como porcientos. En el primer caso se consideran como decimales, esto es, anteponiéndoles a cada uno el punto decimal. En el segundo caso basta con separar dos cifras de izquierda a derecha. Como Ia distribución normal es absolutamente simétrica, el área comprendida entre Ia media aritmética y la puntuación típica 'z = 1.00 es Ia misma que Ia rrzrr es positiva indicará el comprendida entre la media y la puntuación z = -1.00. Si número de casos que están a una desviación tÍpica por encima de la media; si esnegativa, el número de casos que están a una desviación tÍpica por debajo de la media.

(.)

Nota Ímpoft'ante: La tabla en mención la he tomado del Cu¡so de Estadfstica y Psicometrfadel Docto¡ Mariano Yela. Universidad Central de Madrid. España,

r.T


171

]'ABLAxxxv AREAS BA'O

x

IA

CIJRVA NORMAL ENTRE LA MEDIA YUN VAIOR TIPICO DADO

00

01

02

0.0 0. 1 o.2 0. 3 0.4

0000 0398 0193 11? I 1554

0040 0438 0832 t2r1 1591

0080 0418 08?1 1255 1628

0.5 0.6 0. ? 0.8 0.9

1915 2251 2580 2881 3159

1950 229t 2611 2970 3186

1985 2324 2642 2939 3272

1.0 1. 1 1.2 1.3 7.4

3413 3643 3849 4032 4792

3438 3665 3869 ¿¡49 4207

3461 3686 3888 4066 4222

1.5 1.6 1.1 1.8 1.9

4332 4452 45s4 4647 4173

4345 4463 4564 4649 4179

436't 43'10 4414 @4 613 +582 4656 4664 4'126 4132

2,0 2.1 2.2 2.3 2.4

4112 4821 4a61 ,1893 4978

4118 4A26 4€64 4896 4920

4783 4830 ,1U68 4898 4922

2.5 2.6 2.1 2.8 2.9

4938 4953 4965 4974 4987

4 0 4941 4955 4956 4966 4967 4915 49't6 4 2 4982

0

3.0 4986.5 4986.9 4981.4 s.t 4990.3 4990.6 4991.0 3.2 4993.129 3.3 4995. 166 3.4 4996. 631 3.5 4991.614 6 s.l 3.8 3. I 4.0

4998.409 4998.922 4999.211 4999.519 4999.683

4.5

4999.966

5.0

4999. 99?133

3.

.03 0120 051? 0910 1293 1664

20L9 2351 2673 2961 3238 3485 3?08

3m? 4¡82 4236

4't88 4€34 4a?1

4901 4925

4943 4951 4968 4977

4983

04

0160 055? 0948 1331 1?00

.05

06

.0?

08

1?36

02s9 0636 1026 1406 1112

0279 06f5 1064 7443 1808

0319 0114 1103 1480 Lg4l

2054 2389 2104 2995 3264

2088 2422 2'.r34 3023 3290

2t23 2454 2164 305 1 3315

2151 24a6 2194 30?8 3340

2190 25L1 %28 3106 3365

3508 3'.129 3925 4099 4251

3?49 3944 4265

3554 3??0 3962 4t31 4279

357? 3790 3980 474't 4292

3509 3810 s997 4762 4306

43 4505 4599 4678 4'.144

4406 4515 4608 4686 4750

4418 452s 4616 4693 4156

4929

4803 4É46 4881 4909 4931

4808 4850 €84 4911 4932

4946 4960 4910 4918 4984

4Ct8 4949 4951 4961 4962 4963 49?1 4912 4913 49',19 49?9 4980 4985 4985 4986

438 3

4495 4591 4671 4138

4194 4838 4375 4904 4921 4945 4959 4969 49'.11 4984

4987.8 4988.2 4991,3 4991.6

01 99

0596 0987 1368

3531

4115

4798

4a42 48?8 4906

4429

.09 0359 0753 1141 151? 18?9

2224 2549 2852 3133

3389 3621 3830 4015

411't 4319 4441

11535

4545

4625 4699 4'16r

4633 4106

4a12 4854 4887 4913 49

4988.6 4988.9 4989.3 4989.? 4991.8 4992,1 4992.4 4992.6

4'.t6'.1

481? 4É51

4890 4916 4936

4952 4964 49't4 4981 4986

4990.0 4992.9

Él


!72

Para manejar la tabla de la curva normal, hemos de leer en fi la y columna el valor típico rrzrrdado; y luego, ver en el cuerpo de la tabla el númerodecasos

o porcentaje correspondiente.

Ejemplo: hemos hallado una puntuaciónz= 0.5; buscamos en laprime0.5 y en la primera fi la el valor 0.00; vemos en el cuerpode la

ra columna el valor

tabla el punto donde se cruzan Ios valores 0.5 y 0.00, hallando que es 1915; este valor, expresado en probabilidades es 0.1915 y en porcientos 19.15"/", Sepuede decir, entonces, que entre la media aritmética y la puntuaci6n z = 0.5 estácomprendido el 19

.

l5'/"

de casos.

I.B +

0.05. Buscamos Otro ejemplo: hemos hallado que z = 1.85 = en Ia primera columna el valor 1.8 y en la primera fila el valor 0.05. Elpunto donde se cruzan nos da el valor 4678 que en porcientos es 46.78h¡ es decir, entrela media y la puntuación z = 1.85 queda el 46.18'k de los casos. En los ejemplos anteriores hemos asignado a 'rz" el signo más; pero si fuera negativo, se interpretaría como porciento de casos por debajo de la media hasta el valor rrzI dado.

LI.4: EJEMPLOS

DE PROBLEMAS QUE SE RESUELVEN POR LAS AREAS DE LA CURVA NORMAL.

La aplicación de la tabla XXXV, que da el porciento de casos comprendido entre la mediay una puntuacióntípica dada, procede siempre que se sepaquela variable o fenómeno estudiado se distribuye aproximadamente en forma normal.En tal sentido, los problemas a los que se aplica son, en general, de losdostipossiguien-

.

tes:

1) Dado uno o más puntos de la distribución, averiguar que les corresponden. (Problema directo),

las

2) Dada una o más frecuencias, averiguar los puntos de que les corresponden. (Problema inverso).

frecuencias

la distribución

Además de estos casos generales, que a su vez se subdividen casos, está la aplicación de la curva en el interesante caso de:

en

nueve

3) Distribuir un grupo de sujetos en grupos menores o subgrupos, de acuerdo al rendimiento o capacidad en un rasgo dado.

rJ


t73

Para no salirnos de lo elemental de estos apuntes, vamos a resolver solamente dos subcasos del caso 1; y dos del caso 2, mediante los ejemplos siguientes:

a) Dado un punto, averiguar Ia frecuencia de casos que está por debajoo por encima de dicho punto. Ejemplo: en una muestra que se distribuye normalmente, que tiene media = 40 y desviación típic¿ = 7, averiguar Ia freouencia que está por debajo y por encima de la puntuación directa Xi = 50. Lo primero será transformar la puntuáción50en puntuación típica. Substituyendo en Ia fórmula 30:

50-40

= I0/7 =

L'43.

Ahora debemos ver en Ia tabla qué valor corresponde a Ia puntuazión

z

1.43¡ buscamos 1.4 en la primera columna y 0.03 en la primera fila, pues !.43== 1.4 + 0.03. EI punto donde se üuzan es 4236 = 42,36%, pero 42.36 es el porciento de casos entre la media y Ia puntuación z = L.43. C omo la distribución es

simétrica, a ambos lados de la media queda

el 5o"h de los casos, de modo que hasta

l.43hay 50 * 42.36 = 92.36%. Se puede asegurar entoncesquepordebajo de z = I.43 queda el 92.36% y por encima 10O.O0 - 92.36 7,6,4"/"'queson, = z=

respectivamente, las frecuencias por debajo y por encima del punto dado.

b) Averiguar Ia frecuencia dia¡ 2)

que queda entre dos valores dados.

Pueden suceder estos casos: I) ambos valores están por debajo de Iameambos valores están por encima de la media; y la med¡a queda entre am-

3)

bos valores.

Ejemplo: 1: en una muestra que se distribuye normalmente, con media = 40 y desviación típica = 7, averiguar el número de casos o frecuencias que tienen puntuaciones comprendidas entre X1 = 25 y X, = 35. Transformando las puntuaciones directas en típicas, serán:

r-J

25-40 =L

zz=

7

35-40

=

n5/7

=-2.L7

- -5/7 = -0.77


t74

Vemos que ambas puntuaciones son negativas/ es decir, están por debajo de la media. Hallamos en la tabla los porcientos que corresponden a esas puntuacio-

nes típicas, siendo: para -2.17 el 48,507" y para - 0.71 el 26,l1-h,Ahora bien estos porcentajes son Ios comprendidos entre Ia media aritmética y las puntuaciones 'rzrrdadas. Es natural, entonces, que la frecuencia o porcentaje de casosentreambos puntos sea la diferencia de porcentajes, esto es: 48.50 - 26,lL = 22,39"/",loque significa que entre las puntuaciones 25 y 35 queda 22.39'/" de casos.

Si ambas puntuaciones hubiesen salido positivas/ o sea, por encimade Ia media, se procedería de igual manera/ es decir, haciendo la diferenciade porcentajes. Ejemplo

2:

en una muestra que se distribuye normalmente, con media iguaf

40 y desviación típica igual 7, averiguar la frecuencia o casos que tienenpuntuaciones comprendidas entre XL= 25 y X2= 55. Transformando las puntuaciones directas en típicas, serán:

zL= z2=

25-40 7

55-

40

= -15/7 = -2.L7

= l5/7 =

2,17

Vemos que siendo las puntuaciones una negativa y otra positiva, la media queda entre ambas. Hallamos en la tabla el porciento que les corresponde, siendo para- 2.17 el 48.50"/oy para2.l7 también el 48,50"/". Pero como -2.L7está por debajo de la media y 2.L7 por encima, el porcentaje de casos entre esos puntoses Ia suma de porcentajes, o sea 48.50 + 48.50 = 97.00"/".

c)

Averiguar el punto que está por debajo o por encima de una frecuencia

dada. (lnverso del caso a). Puede

que'sea inferior

al

ocurrir: 1) que la trecuencia dada supere al 50"/" de casos;

y

2)

50"/".

tl

1:

en una nluestra que se distribuye normafmente, averiguar el punto que deja bajo si el 68"/" de casos, siendo la media = 40 y la desviación típica Ejemplo

igual a 7. Primero vemos que

68l" = 50%

+

1B%; buscamos ahora en el cuerpo


L75

de la tabla el área que esté más próxima al lB%= f AOO hallando que es 1808 por exceso. Como t80B está en la intersección de 0.4 (Ia. columna) y 0.07 (1a. fila), diremos que le corresponde el valor típico z = 0.47. Por la fórmula 30 sabemos que: v

i z = -= 0-

;

ii)x= Xi -X;

luego,

x = 2.0- = 0.47 x 7 = 3.29

luego,X¡

=X+ x=40+3t29=43.29

Es decir, que 43.29 es la puntuación que deja bajo sí el6B"h sos; y sobre él queda el 32"/" restante.

de los ca-

Ejemplo 2: en una muestra que se distribuye normalmente, con media = 40 y desviación típica = 7, averiguar la puntuación que deja bajo sí el 33"/.de los casos. Vemos que 33"/" es menor que 50%¡ el punto que buscamos está dado por aquel valor que, con la media, deje comprendido el L7"/" de los casos. Vemos enelcuerpo de la tabla cuál es el valor más próximo a 1700, hallando que es exactamente elde puntuación Entre z = -0.44 y la media queda el l7"hde casos; luego, z 0.44 es superior o deja bajo sí el 33"/" de casos. Por la fórmula 30 sabemos que:

--

z='0.44.

x=2.0--(-0.4qx7=-3.08 x = Xi -X - -3.08 Xi = X*x = 40 + (-3.08) = 36.92 Es decir,

36.92 es la puntuación directa que deja

bajo

síe\33% de los

casos.

d)

Averiguar los puntos que dejan entre

sí una frecuencia dada.

(inverso

del caso b).

Ejemplo: en una muestra que se distribuye normalmente, con media aritmética = 40 y desviación típica = 7, averiguar los puntos que dejan entre sí, a ambos lados de la media, el 5B'h medio de los casos.

-

A cada lado de Ia media quedará 58 ¡ 2 29T" de los casos. Buscamos en el cuerpo de la tabla el área más próxima a 29.00 y nos da el valor 29.L0 porexce so, que le corresponde la puntuac i 6n z = 0 . B 1.

-

=

t-t


L76

Como la distribuciĂłn es simĂŠtrica, tendremos que:

z-I = ,Z =

0.81 0.81

Hallamos ahora las puntuaciones diferenciales

(x), sabiendo que:

xI = -0.81 x 7 = -5.67 0.81 x7 = 5.67 x2= Y las puntuaciones directas:

*1 = 40 + G5.67) = 34.33 *2 = 40 + 5.67 = 45,67 Entre

34.33 y 45.67

queda

el

5B"h medio de los casos.

r!


t77

Ejercicio 11

INSTRUCCI0NES. Utilice la tabla XXXV para resolver los ejercicios siguientes:

1. 2, 3. 4. 5. 6, 7,

z = a la puntuación z = a la puntuación z =

¿Qué valor corresponde a la puntuación

1.00?

¿Qué vafor corresponde

2.58?

¿

Qué valor corresponde

1.96?

¿A qué puntuación típica corresponde el valor 3920?

¿A qué puntuación típica corresponde el valor 4484? ¿A qué puntuación típica corresponde el valor 0120

?

En una muestra que se distribuye normalmente, con media aritmética = 5By des = 16, qué porcentaje de casos quedan por debajo de lapuntuación

viación típica

Xi = 74.

B.

En una muestra que se distribuye normalmente, con media aritmética = 5By des= 1-6, cuál es la puntuación que deja bajo sí el 43"/" de casos.

viación típica

9. 10.

En una muestra que se distribuye normalmente, con media aritmética = 58ydesviación[Ípica = 16, qué porcentaje de casos queda entre las puntuaciones35y 80. En una muestra que se distribuye normalmente, con media aritmética =58 y des16, averiguar las puntuaciones que a ambos lados de la media dejan el 68"/" de casos.

viaci6n típica =

rl


I

TEMA XlI

I2.l:

Vo¡ioble bidimensionol.

12. t I r

:

Concepto

de

co¡relo-

ción. I2.2: Tipos o cloies de correloci,ón. 12.21: Cor¡eloci,ón simple. 12.222 Cor¡eloción y función motemótico. 12.3: El coe{iciente de co¡reloci,ón. 12.4: Cílculo del coeficignte de co¡¡eloeión simple lineol. 12.41: El coeficienie de correloción

en toblo de columnqs. 12.422 El coeficienle de correloci,ón cuondo se uso toblo de doble entrodo. I2.5: Coeficiente de correloci,ón o¡dinol. 12.6: Valo¡ocíón 'del ce ficiente "r" de correlqción. Eiercicios.

tɡ


L79

L2.lz

VARIABLE BIDIMENSIONAL.

Qtro de los aspectos importantes del análisis estadÍstico, es el que se refiere a la relación que existe entre dos o más rasgos o fenómenos; o sea, tratar de medir hasta dónde son comunes dos o más variables. Por ejemplo, conocer si hay relación entre el peso y la estatura de las personasi entre el peso y la edad, o entre la inteli-

gencia y el rendimiendo escolar, etc. Cuando en una misma muestra o grupo de sujetos se estudia larelación entre dos rasgos distintivos, se dice que se está estudiando una variable bidimensional. Si los datos los escribimos en una tabla que contenga los valores de ambasvariables y las frecuencias, tendremos una distribución bidimensional de frecuencias. Esta tabla recibe el nombre de tabla de doble entrada, en la que, en un reticulado, seescribenlos datos asÍ: en sentido horizontal (abscisas) los valores de una variable; y en sentido vertical (ordenadas) los valores de la otra variable. En el cuerpo de la tablase escriben las frecuencias de cada par de valores.

Generalmente, cuando se iestudia una distribución bidimensional de frecuenciaS, o simplemente dos variables, Se trata de conocer la conexión o grado de asociación que puede existir entre los fenómenos. Esto se estudia a través de Ia corre-

lación, para obtener un índice numérico que indique el grado de esa asociación.

12.L]-: Concepto de correlación. La correlación pgede conceptuarsecomolatendenciadedosffiiarconcomitantemente.Siloscambiosen

las variables son concomitantes, entonces puede decirse que entre ellas hay correlación. Es natural que a mayor covariación corresponde úayor correlación. Unejemplode fenómenos que varían concomitantemente es este: la estatura de las personas aumenta de acuerdo a la edad cronológica, por lo menos hasta Ia edad de 25 años. Quiere decir, entonces, que hay relación entre los cambios de una variable (edad) y losdela o-

tra.

(estatura)

Aunque inicialmente el estudio de la dependencia de dos variabhs no sp llamó correlación sino regres¡ón, corresponde a Galton la paternidad de lacorrelación. El coeficiente de correlación, o sea el índice numérico que dá la cuantfa de laasociación entre dos variables, debe su desarrollo a los trabajos de Yule' Edgeworthy Pearson.

l-2.2t

TIPOS 0 CLASES DE CORRELACI0N. Hay varios tipos o clases de correlación, según

la asociación que exista

entre las variables. En estos apunles trataremos solamenLe Ia correlación simple neal.

li-

rl


180

L2.21: Correlación simple. En este tipo de correlación se estudian dos variables nada más, de las cuales una es independiente y la otra dependiente. En la correlación simple se distinguen dos modalidades: Ia lineal y la no lineal. La correlación simple lineal o rectilÍnea consiste en que los cambiosde la variable dependiente respecto de Ia independiente, están en relación constante. Puede ser, a su vezl positiva o negativa. La correlación simple Iineal es positiva cuando

al crecer o

decrecer una

variable, la otra también crece o decrece. Por ejemplo, la relación que existeentre la fongitud cje la circunferencia y el diámetro de la misma: si aumenta el diámetro también aumenta la longitud; y si disminuye el diámetro también disminuye la longitud. La correlación simple lineal es negativa cuando al crecer una variable la otra decrece, o viceversa. Por ejemplo, la relación que existe entre la presiónejercida sobre un gas a temperatura constante y el volumen del gas: al aumentar fa presión disminuye el volumen; y si disminuye la presión aumenta el volumen.

12.22t Correlación v función matemática. Tanto en la correlación como en la función matemática se trata de la relación que existe entre dos variables, pero hay una diferencia quedeberesaltarse: mientras que la correlación expresa latendencia de dos fenómenos a variar concomitantemente, la función expresafarelaciónmatemática que liga a las variables. La correlación se usa en las ciencias no exactas porque se desconoce la relación funcional entre los fenómenos. Por la mismaraz6n, en ciencias exactasnose habla de correlación sino de función matemática. Por ejemplo: la relación entreeldiámetro y la longitud de la circunferencia se expresa matemáticamentei pero la relación entre Ia edad y el peso de las personas no se puede expresar con rigor matemático. Ahora bien, como es necesario conocer en alguna forma esa relación entre losfenómenos atípicos, se recurre a un índice numérico que se llama coeficiente de correlación.

72.3:

EL COEFICIENTE DE CORRELACI0N.

El coeficiente de correlación sirve para expresalnuméricamente, la relación o asociación entre dos variables estadísticas. lndica, en general, elgradoenque los valores (medidas) de dos variables tienden a variar coniuntamente en torno de las med ias arit-méticas respectivas. Su valor numérico varía en el intervalo -1 .00 a 1. 00 . El coeficiente se denoia por [a letra rrr'¡ y se escribe r¡y qüe se lee: coeficiente de correlación entre las variables X e Y. Según su valor, puede ser:

r=r= r=

1.00 0.00 1.00

que indica correlación perfecta negativa. que indica correlación nula. que indica correlación perfecta positiva.

rJ


181

En la práctica no existe la correlación perfecta; y solo por remota excepción se encontraría. El valor numérico del coeficiente es,por locomún, decimal, expresando que Ia correfación es imperfecta, ya sea negativa o positiva. Será meno3 imperfecta cuanto más se aproxime a la unidad. En la figura 17 podemos ver el campo numérico de posibles valores del coefic iente:

Valores positivos

Valores negativos

-1.00 -o9 -0.8 -0.7 -0.6

Figura

{.5 -04 -0.3 -O2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.? 0.8 0.9 1.00

17:

Campo numérico de posibles valores del coeficiente de correlac ión.

12.4t

CALCUL0 DEL COEFICIENTE DE CORRELACI0N LINEAL SIMPLE.

El procedimiento más empleado es el del método de Pearson. Para suobtención consideraremos los casos siguientes:

a) b)

Usando tabla de columnas. Usando tabla de doble entrada.

L2,41:

El coeficiente de correlación en tabla de columnas.

La tabla de columnas se usa, generalmente, cuando los datos o medidas en las dos variables están en forma de serie simple, y siempre que nd sean muchos. Se obtiene aplicando la fórmula:

rxy

=

2x.Y r,l.

r.-Jt

(31)

ar. ry

en la que:

rxy =

coeficiente de correlación entre las variables X e Y.


182

2*.y

= suma algebraica de los productos de las desviaciones (x) en la variable X, por las desviaciones (y) en la variable Y, respectode las medias aritméticas respectivas.

0-x

desviaci6n típica o standard de la variable X.

ry

desviación típica o standard de la variable Y.

N

número de casos.

La fórmula

31 puede simplificarse

(también es demostrable matemáticamen-

te) en la siguiente:

2x.v txY

2x4 (

(32\

Zv2t

en la que, en el denominador, está laraíz cuadrada del producto de multiplicar entresí las sumas de los cuadrados de las desviaciones respecto de la media en ambasvariables. Esta fórmula es exactamente Ia 31 y resulta más cómoda. Para el cálculo del coeficiente de correlación hemos de disponer los datos, en una tabla de ocho columnas, así: Columna Columna Columna

es

1: 2: 3:

contiene los individuos de la muestra. contiene los valores de la variable X. contiene los valores de la variable Y .

Con estos datos calculamos la media aritmética de las dos variables, esto formaremos las demás columnas en el orden indicadoa con-

X y Y; y seguidamente

li nuac ión:

(il de los valores de la variable X respecto de Ia media. contiene las desviaciones (y) de los valores de Ia variable Y respecto de la media. contiene los cuadrados de las desviaciones de losvalores de la variable X. conbiene los cuadrados de las desviaciones de los valoresde la variable Y. contiene los productos de multiplicar entre sÍ, las desviaciones (x) por las desviaciones (y).

Columna

4: contiene las desviaciones

Columna

5:

Columna 6: Columna-

7:

Columna B:

rJ


193

l

Ejemplo: calcular el coeficiente de correlación simple lineal de Pearson, entre las puntuaciones de un grupo de 10 alumnos, en las pruebas de ldioma Castellano y Ciencias Naturales. Llamando X = puntuaciones en ldioma Castellano; eY = puntuaciones en Ciencias Naturales, tendremos:

TABLA XXXVI

x (21

ALUMNOS

(l)

Y (s)

x (4)

C.E.A.M. 18 10 1 o.c.A.s.111601010 M.R.A.G. 12 -5 17 L,G.A.R. 19 t4 2 L.A.A,M. 16 15 -1 F.N.A.G. t4 L2 -3 E.A.B.E. 15 11 -2 23 I.A.B.E. 16 6 R.H.B.S. tl 19 o M.E.B.L. 19 20 2 1701ó000t/-9816

y (5)

*2 (6)

-5 2 -t 0 -3 -4 1 4 5

_t_ (7)

x.y

|

25

-5

25 4 1 9 4 36 0 4

4 t 0 9 16 I 16 ?5

-10

(8)

-2 0

I 8 6 o 10

En este ejempfo:

X= Cx2*2 = 2x.y =

L7. 2.90 84. 16.

Y substituyendo en la fórmula 31:

V= @= ZyZ = N-

15.

3.13 98. 10.

ít


184

Y substituyendo en la fírmula 32;

=

0.176

resultado que nos dice que entre las puntuaciones en ldioma Castellano y Ciencias Naturales de ese grupo, hay correlación imperfecta positiva indicada por el coeficiente r= 0

.t7 6.

L2.42:

EI coeficiente de correlación cuando se usa tabla de doble entra-

da. Hemos visto la manera de calcular el coeficiente de correlación utilizando una tabla de columnas. Esa Labla es cómoda cuando los datos no son muchos;porejemplo, no más de 15 o 20. En caso contrario, conviene utilizar una tabla dedobleentrada que igual se aplica a series simples y a distribuciones de frecuencias.

tilizar

Para el caso de muchos valores y repeticiones de los mismos, conviene uIa tabla de doble entrada. Además, las desviaciones de los valores de Ia varia-

ble no se obtienen directamente o sea respecto de las medias verdaderas/

sino que

se

utilizan medias arbitrarias. Esto se hace así, generalmente, para facilitar el cálculo. Para formar una tabla de doble entrada nos basamos en losejescartesianos. Una de las variables se escribe en el eje horizontal y la otra enelejevertical, Siguiendo la notación de los ejes, la variable X se escribe horizonta'lmente y IavariableYverl t ica Imente

.

El cuadrante formado por los ejes X e Y se divideencompartimientosocuadritos; en la parte superior horizontal y en cada cuadrito se escriben cada uno de los valores de la variable X; y en la parte izquierda o vertical los valores de la variableY. Si los valores están sin agrupar, cada cuadrito de la escala Xy de la escaY contendrá un va.lor de cada variable; y si los valores está'n agrupados en intervalos, en cada cuadrito se escribirá un intervalo, esto es, Ios límites. la

Cuando se utiliza el cuadro de doble entrada y desviaciones respectode las medias supuestas/ el coeficiente de correlación se obtiene aplicando Ia fórmula:


185

2t.x'y'

á t\

r. u'\

N/

)

txY

o3)

en la que,

r= XY 2

coel'iciente de correlación entre las variables X e Y.

t.r'y'=

suma algebraica de los productos de Ias frecuencias por las desviaciones de los valores respecto de la media supuesta, en Iavariable X y en la variable Y.

) f. x' =

suma algebraica de los productos de las frecuencias por las desviaciones de los valores respecto de la media supuestaen Ia variable X.

I f. y' =

suma algebraica de los productos de las frecuencias por las desviaciones de los valores respecto de la media supuesta, en lava-

riabte

Z- f .x'2 =

y

por los cuadrados de las desviaciones respecto de la media supuesta en la va'riable

suma de los productos de las frecuencias

X.

Z t.t'2 N -

suma de los productos de las frecuencias por loscuadrados de las desviaciones respecto de la media supuesta en la variable y. número de

casos o suma de frecuencias.

Ejemplo: calcular el coeficiente de correlación simple lineal de Pearson,

mediante una tabla de doble entrada y conforme la fórmula (33)*, entre las puntuaciones alcanzadas por un grupo de 131 alumnos en las pruebas de Ciencias Naturales e ldioma Castellano, primer curso prevocacional. (t)

La fdrmula 33, que es la más cdmoda para e.l cflculo del coeficiente usando tabla de doble entrada,se deduce matemáticamente de la f6¡mula 31, El lecto¡ interesado en conocer la deduccidn, puede consultarl,a ob¡a "PsÍcometrfa y EstadGtÍca" del Dr, don Mariano Yela.

J.l


186

¡

Llamaremos = puntuaciones en la prueba de Ciencias Naturales e Y=puntuaciones en la prueba de ldioma Castellano. Los datos aparecen en la tabla o cuadro XXXVII siguien[e. Los alumnos están colocados por orilen alfabético, pero substituidos por un número ordinal. Como los pasos para este cálculo son más laboriosos, losdamosacontiñua; ción de los datos. El lector podrá observar que el proceso es idéntico al que se utiliza para el cálculo abreviado de la media y de la desviación tÍpica.

TABLA XXXVI! ALUMNOS X

IO 11

t2 13

l4 16 1? 18 20 27 22 23

26

29 30 31

35 3? 38 39

q

4L

42 43

44

Y

45 54 49 63 42 65 81 55 51 38 50 29 52 66 51 50 64 66 51 80 51 61 41 60 1t 't2 41 4't 64 58 55 68 52 't! 55 12 69 66 66 63 69 80 61 12 63 't4. 63 63 56 ?1 51 62 4? 38 50 15 ,I5 59 ?0 ?6 66 83 s9 53 58 73 54 60 64 60 69 ?8 404¡8121 40 31 52 25 4{! 3? 41 51 s04¿86?0 42 50 ?1 53

AUJMNOS X 45 46 41 48 49 50 51 52 53 54 55 56 s? 58 59 60 61 62 63 64 65 66 6? 68 69 70 ?1 '.tz 13 14 ?5 16 11 18 79 80

Y

ALT'MNOS

63 55 43

54

69 ?0

55

80

61

15 13 66 68

34

51

54

?0

6',t

50

53

't4 43

52

58

41

69

4'.1

41

?3

51

60

11

a2

65

5'I 't2

55 69

64

64

48

57

49

54

4l

61

't4

49 4',1

48

56

59

49

4t

',t8

56

16

4l 5?

53

42

62 42

82 83 84 85

62

59

61

5l

?6 66

64 50

81 88

41

59

38

6

FUENIE: secldD de Ev¡lu¿cióD Esol¡¡

89 90 91 92 93 94 95 96 91 98 99 100 101 t02 103 L04 105 106 10f 108 109 110 111 112 113 114 115 116 11? 118 119 L20 Lzl 122 723 L24 125 726 r2't r28 L29 130 131

X

Y

53 41 41 65 62 59 56 62 12 5? 56 45 51 46 50 52 52 42 73 5? 84 31 46 55 76 ,$ 68 60 52 75 60 4 ?1 80 51 41 61 60 69 ?7 51 59 80

4 33 54 61 36 52 60 s6 56 61 82 40

i3 62 3? 69 10

4 56 52 54

41 50 4? 65 50 60 63 58 55 36 64 58 ',r?

62

64 58

4 4l 61 50 69 ?0

t.d


187

Para calcular el coeficiente de correlación mediante una tabla de'doble en-

trada seguiremos los pasos siguientes: Paso l-: Consiste en un cuadro donde tabulamos las frecuencias de cada par de valores. La tabulación. puede hacerse por puntos o por tarjas. Este diagrama (que es la forma inicial de la tabla de dobleentrada) se hace así: sobre un plano cuadriculado y en la.primera fi la, escribiremos los

valores o intervalos de la variable X, de izquierda a derechay en sentidoascendente;y en la primera columna/ de arriba hacia abajo,y en sentido descendente Iosvaloresointervalos de la variable Y. Para la tabulación o registro de frecuencias localizamos los valoresen ambas escalas y en el cuadrito donde se crucen marcaremos un punto o una rayita; de esta cuenta, cada caso estará referido a dos valores o a los dos intervalos donde quede la puntuación dada. La nube de puntos o diagrama de dispersión de los datos de IatablaXXXV|l Ios vemos en la tabla XXXVlll. Ejemplo: para tabular Ias puntuaciones delprimeralumno, buscamos la puntuación 45 (intervalo 45 - 49) en la escala horizontal y la puntuación 54 (intervalo 50 - 5q en Ia escala vertical. En el cuadrito donde se cruzan estos intervalos marcamos un punto; y así sucesivamente.

-

Paso 2: Cuadro de correlación, Después de tabular los casos de cadapar de valores o intervalos, se substituyen los puntos o rayitas por el número defrecuéncia respectivo. Por ejemplo, (véase tabla XXXIX), en el cuadro donde se cruzan los intervalos 55 - 59 de la variable X y 50 - 54 de la variable Y, hemos escritoel númeto 6, para substituir los seis puntos que aparecen en ese cuadrito en el diagrama de dispersión; o sea, la frecuencia de ese par de intervalos es 6 por que seis alumnosobtuvieron calificaciones comprendidas en dichos intervalos. A partir de estepasosegundo, todas las operaciones se hacen en el cuadro de conelación, que damosen latabla

XXXIX. Paso 3: Fila v columna de frecuencias. tObtenidas las frecuencias para cada par de valores o de intervalos, se han de sumar las frecuencias de cada fila (sentido horizontal) para formar la columna de frecuencias que aparece con el número 1 en la tabla XXXIX; en igual forma se hace sumando las frecuencias de las columnas para formar la fila de frecuencias que aparece con el número 1. Las trecuencias de la columna l constituyen la distribución de Ia variable Y; las de la fi Ia I constituyen la distribución de la variable X. La suma de las frecuencias de la columna y fi la 1 debe ser la misma. Si esta suma no es igual deberán revisarse los registros de frecuencias.

¡..1


188

TABLA XXXVIII

Ciencias Naturales

\X

25 29

30 35 34 39

40 44

45 49

50

54

55 59

60

64

I

75

-79

70

-74

74

oo

75 79

o

o

o

BO

B4

o

o

o

o

ยก

o

70

o

B0-84 d

65 69

oo

o

o

o

m

a

C

a

65-69 o

60-64

o

o

o

oo

oo

o

oo

o

oo

o

oo

oo

oo

o

oo

o

oo

o

oo

o

o

oo oo

oo oo oo

oo

o

oo

oo

o

oo

o

S

t

o

55- 59

oo

e oo

I

I

o

oo o

50 -54

oo oo

oo oo

o

o

oo oo oo

oo

oo

o

o

o

o

a n

o

o

o

o

oo

o

o

o

oo

45 49

40-44 35-39

30-34

o

o

oo oo

oo

o

o

o

oo

oo

o

o

o

o

Diagrama de dispersiรณn, nube de puntos o forma inicial de la tabla de doble entrada. Datos de la tabla XXXVll.

rt


189

Paso 4: Desviaciones. Las desviaciones respecto de las medias supuestas en ambas variables, se determinan de manera igual a como se hace para el cálculo de Ia media aritmét¡ca y Ia desviación tÍpica por el método abreviado, o sea: se fija qué valor va a servir de media supuesta. En la variable X hemos puesto esa media en el intervalo 50 - 54. A partir de este intervalo y a Io largo del cuadro, trazamos dos líneas paralelas de arriba hacia abajo. En la variable Y hemos puesto esa mediaen el intervalo 55 - 59. A partir de este intervalo y a Io largo del cuadro, trazamosdos lÍneas paralelas de izquierda a derecha. Fijadas las medias supuestas, escribimos las desviaciones arbitrarias así: en la columna 2 las de la variable Y o sea lasyr;en lafila 2 las de la variable X o sea las xr. Ya sabemos que la desviaci6n del intervalo don de está la media supuesta es cero. Paso 5: Productos de frecuencias por desviaciones. Estos productos se obtienen así: multiplicamos entre sí los valores de las columnas I y 2 para formar la columna 3 =f . y'i y los valores de las fi las 1y 2 para formar la fi la 3 = f.x'. Paso 6: Productos de las frec Estos productos que van en Ia columna 4 (para la variable Y) se obtienen multiplicando entre sí los valores de las columnas 2y 3; y los de la fi la 4, multiplicando entre sí los valores de las'fi las 2 y 3, para la variable X.

re,

Paso 7: Productos cruzados de las desviaciones. Los productoscruzados de las desviaciones entre sÍ, o sea x'. y' se obtienen rmultiplicando las distancias a que cada cuadrito se halla respecto de la fila y columna de las medias supuestas. Por ejemplo: el cuadrito donde se cruzan los intervalos 65-69 de Ia variable X y B0 - B4 de la variable Y, se halla o dista 3 intervalos de Ia columna cero y 5 de la fila cero. EI producto xry' será 3 x 5 = L5 , Este número 15 lo escribiremos en elángulo superior derecho del cuadrito dicho. Otro ejempfo: el cuadrito donde se uuzan los intervalos B0-84 de Ia variable Xy 70-74 de Ia variable Y, dista 6 intervalos de la columna cero y 3 de la fila cero. El producto xry' será 3 x 6 = 18, número que aparece en el ángulo superior derecho del cuadrito dicho.

EI signo de los productos cruzados de las desviaciones, o seax'yr,sedetermina fácilmente recordando los signos de las abscisas y ordenadas del plano cartesiano. Nótese que la fila cero y la columna cero dividen el cuadro de correlación en cuatro partes/ cuyas desviaciones conservan los signos de las coordenadas. Veamos:

el primer cuadrante sabemos que las abscisas y las ordenadas son positivas; luego, el producto es positivo. Vemos también que en ese cuadranteysegún el cuadro de correlación7 (véase columna 2 y fila 2) son también positivas las desviac iones x' y' .

.

a)

En

b)

En

el segundo cuadrante sabemos que las abscisas son negativasy las

r"l


190

ordenadas positivas; luego, el producto es negativo, Vemos también que en dicho cuadrante y según el cuadro de correlación, las desviaciones xr (fila 2) y las yr (columna

2) son negativas y positivas, respectivamente.

c) En el tercer cuadrante sabemos que las abscisas y lasordenadassonnegativas; fuego, el producto es positivo. Vemos también que en dicho cuadrante y según el cuadro de correlación, las desviaciones x' (fi la 2) y las desviaciones (y') (columna 2) son negativas, por lo que el producto es positivo. d) En el cuarto cuadrante sabemos que las abscisas son positivas y las ordenadas negativas; Iuego, el producto es negativo. Vemos también que en dicho cuadrante y según el cuadro de correlación, las desviaciones x' (fila 2) y las yr (columna 2) son positivas y negativas, respectivamente, Paso

B:

Productos cruzados

m

Asiqueha-

yamos escrito los productos cruzados de las desviaci'ones x'y'consusrespectivossignos, obtendremos los productos de las frecuencias por los productos cruzados de las desviaciones, es decir f.x'y'. Para esto, basta multiplicar el producto xryrescrito en el ángulo superior derecho de cada cuadrito, por la frecuencia que aparece en el centro del cuadrito. Estos resultados los anotamos en la columna 5 de la rnanera siguiente:

a) La columna 5 está dividida en dos subcolumnas: una con el signomás (*)Votraconelsignomenos(-); losproductosf.x'y'positivoslosescribiremos en la columna de signo más;

y los productos f.xryr negativos en Ia columna de signo

menos.

b)

Para anotar los productos

fila de los cuadrantes

f.xryl positivos,

hemos de sumarlos en cada

ly lll; y para los negativos en los cuadrantes ll y lV. Veamosal-

gunos ejemplos:

- 84; x' y' = 15; producto f.xryr = I x 15 = 15. - 84; x'y' = 25; producto f.xryr=l-x25 = 25. En la subcolumna 5 de signo más escribiremos la suma ., = 40. lntervalo 75 - 79¡xt yt - 12; producto f.x'y' - 1-xL2= L2, lntervalo 75 - 79¡ x'y' = 24;producto f .x'y' -1x24-- 24, En la subcolumna 5 de signo más escribiremos la suma .. = 36.

lntervalo B0 lntervalo B0

Paso 9: Suma de filas y columnas. Luego de haber hecho todas las operaciones anteriores/ procederemos a sumar los valores de las columnas y de las Filas, de

r.l


191

la manera siguiente: a) la fila 1y la columna 1, cuya suma debe ser igual por tratarse de las frecuencias; b) la fila 2 y Ia columna 2 no deben sumarse pues son lasdesviaciones en ambas variables; c) la fila 3y la columna 3 deben sumarse, porseparado, algebraicamente; d) la fi la 4 y Ia columna 4 deben sumarse también separadamente; e)finalmente, Ias subcolumnas 5/ y hacer por último fa reducción respectiva. Paso 10: Cálculo del coeficiente de correfación de Pearson. EIúltimo paso cons¡ste en substituir en la fórmula 33, los valores hallados según el cuadroo tabla de corre lac ión , En nuestro ejemplo, resolviendo según Ios datos que nos dáelcuadrodeco-

rrclaci'n (tabla XXXIX) tenemos:

Z f. x'y,

=

lf'Y' = I f'Y'2 -

255. lf. x' = 191 ^ lL67 -35. ) f,x'¿= 607. If=N = l3L.

Y substituyendo en la fírmula 33:

255 \131/ z 191r r-35', \131l -

131

.XY_

L.95 +

v=

2,34 G.56)

0.39

(6.78)

'XY ,XY

2

_34

1@

= 2.34 t 5.56 =

r

=

0.42

resultado que nos dice que entre las puntuaciones en Ciencias Naturales e ldioma Castellano, alcanzadas por 131 alumnos en las pruebas de primer año prevocacional, hay correlación positiva, imperfecta, cuyo coeficiente es i = 0.42. En la tabla XXX+X que sigue/ damos el cuadro de correlaciónyadicho,contorme los pasos indicados.

t,f


L92

TABLA XXXIX

Y=

§U)I§H

ld

ioma Castellano

X il C)

m

z. C)

tLn_ z -t C t-

m

(¡)

M

t

x ñ,

il

il

* Pil

{ o

r¡ a<

X

r.4

t-

a @ N

@

ñ

o

2 o

ñ

M

N

q o

N

§

@

@

§

N

N o

N

o

ñ

M

M

I

9 ñ

lvl

a

ñ

a N

p

@

N

a

N N

@

§

@

H

N

rv N

o

&

o

t» Y N

§

,.Í


793

12.5:

COEFICIENTE DÉ CORRELACION ORDINAL.

El coeficiente de correlación por el método de rangos u ordinal, se obtiene aplicando la fórmula de Spearman:

6

?= 1-

>d2

N (N2

G4)

- r)

en Ia que:

P_

coeficienle de correfación ordinal o de rangos.

=- 12 .ZU

suma de fos cuadrados de las diferencias de rangos.

N_

ner

número de casos.

Para el cáfculo del coeficiente de correlación por rangos hemos

de

dispo-

los datos, en una tabla así: Columna Columna Columna Columna Columna

1: 2: 3: 4: 5:

contiene los individuos de la muestra. contiene los rangos de los individuos en una de lasvariables. contiene los rangos de los individuos en la otra variable. contiene las diferencias entre los rangos. contiene los cuadrados de las diferencias entre los rangos.

Como se ve, Ia correlación se basa en asignar los rangos o puestos de orden que corresponde a fos valores

Ejemplo: calcular el coeficiente de correlación ordinalentre las puntuaciones alcanzadas por un grupo de alumnos en las pruebas "A" y "Br', según losdatos si-

guientes:

ALUMNO§

PRUEBA ''A"

PRUEBA "B''

H.A.E.S.

8

12

M. E. D. S. l. J. v. F. J. A. D. C.

6

27

A.G.M.

74 6

77

11

18

D. E. J. F.

11

22

I, L. P. O. O,M. L. L.

16

19

L4

21

R. L. S. B.

11

22

10

19

J.

L,

R.M. C.

rl


t94

Antes de trasladar los datos a la tabla, hemos de asignar a los sujetos los rangos según sus puntuaciones. Ordenando descendentemente las puntuaciones y rangueando, tendremos:

L4 14 11 1. 2.5 2.5 5. 23 22 22 PRUEBA "B": 27 RANGo 1. 2. 3.5 3.5 PRUEBA

"A": 16

RANGo

11 5. 21 5.

11 5. 19 6.5

10 7. 19 6.5

B B, 18 B.

6 6 9.5 9.5 17 L2 9. 10

Con los datos anteriores procederemos a hacer la tabla ya dicha, segúnvemos a continuación,

TABLA XL

ALUMNOS

PRUEBA

"A''

PRUEBA

(2)

(1)

H.A. E. S. M.E.D.S. l. J. v. F. J. A. D. C. J. A. G.M. D.E.J.F. I. L.P.O. o.M.L. L.

"B"

(3)

8 9.5 2.5 9.5 5.

10 1

2

I 8

3.5 6.5 5. 3.5 6,5

5, 1.

2.5

¿ (4)

A2

(5)

2.0 8.5 0.5 0.5 3.0 l. 5 5. 5 2.5 1.5 0.5

4.00 72.25 0.25 0.25 9. 00

2,25 30. 25

6.25

2.25 0.25 I 27. 00

En este ejemplo:

Z¿2 = 127.

N=10.

Y substituyendo en la fírmula 34;

Q= r-

6xL27 10 (100 -

1)=L-

762 990

tq

-1-0.77=0.23

resultado que nos dice, que entre las puntuaciones alcanzadas por

el

grupo de 10 a-


195

lumnos, en las pruebas rrArr

L2.6:

y 'rBI hay correlación

imperfecta positiva.

VAL0RACI0N DEL C0EFICIENTE 'rrI DE C0RRELACt0N. La interpretación def coeficiente de correlación plantea dos problemas, Ios

cuales, aunque no es posible examinarlos en estos apuntes, conviene dejarlos consignad os .

El primero es si el coeficiente 'rrrrexpresa o no que haya efectiva asociación o relación entre las variables. Este probfema y su resolución correspondea Ia Estad

ística muestral.

El segundo, que se deriva del primero, se refiere a la intensidadde Ia correlación. Para este problema hay que considerar el valor de "r" dentro de Ia situación concreta en función de los sujetos, de los instrumentos de medida, de la naturaleza de los fenómenos, etc. También conviene tener presentes algunas recomendaciones a efecto de no dar una interpretación errónea al coeficiente, as¡':

a) Los coeficientes de correlación no torman una escala de intervalos; no se puede decir que r = 0.20 es la mitad de un r= 0,40; ta:npoco es correcto decir que Iadiferencia entrer= 0.60 y r= 0.45 es lamisma queentrer = 0.90 y r=0.75. b)

El coeficienterrr'r no expresa porcentaje; es falso, por ejemplo que r = Cuando se desee conocer el porciento de varia-

0.20 signifi que 20"/. de correlación.

ción común de dos variables, conviene utilizar el cuadradode "r". Así, en nuestroejem-rplo de Ia tabla XXXIX (véase resolución en pág , ), tenemos r = 0 .42; el porcentaje de variación común entre ambas variables será el cuadrado de "r", osea;17.64"/".

c) En el ejemplo dicho, hemos hallado r = 0.42 de correlación entre las puntuaciones en Ciencias Naturales e ldioma Castellano. Esto no quieredecirquelacorrelación entre esasmaterias sea de r = 0.42 y que siempre que se trate de ellas encontraremos el mismo coeficiante. Significa, nada más. que en el grupo de sujetos exa minados se halló r = 0.42. No obstante lo dicho, se puede considerar cierta interpretación del coeficiente de correlación según el criterio de algunos autores. Así, por ejemplo, tomamcs Ia Tabla de Darley, (citado por el Lic. Luis Arturo Lemus en su obra: rrManual de Evaluación del rendimiento escolarrr, pág. 197) y la tabla de Rugg y Gavett (citadapor el Dr, José Zaragozá en su obra: rrEstadística aplicada a la Educaci6n't, pá9. BI), que reproducimos en la página siguiente. Sin descuidar los dos problemas citados al princi pio, se puede interpretar la intensidad de la relación entre las variables de acuerdo a los valores de "r" que dan las tablas dichas.

fr,i


L96

de de de de de

0.80 en adelante ..... 0.50 a 0,80 0.30 a 0.50 0.20 a 0.30 0.00 a 0, 20

(x) Tabla de

Darley. R

muy a lta corre lac ión substanc ial correlac lón

alguna correlación

ligera correlac ión prácticamente ninguna correlación

lnterpretación del coeficiente de correlación,

UGG

Desatend ib le

Baja

Franca

GAVETT

r

0.10 0.14 0,20 0.28 0.30 0.37 0 .40 0.44 0.50 0,60 0.70 0.75

Carece prácticamente de

0, B0

Alto grado de relación

0

significado.

Grado moderado de rela-

ción.

Marcada

.87

0.9 0

0.93 0.95 0.96 0.97 0.98 0.99 1.00

Alta

(

r.*)

TABLA DE

RUGG

Alto grado de dependencia entre las variables.

Y GAVETT. lnterpretación del coeficiente de correlac ión

.

(.)

Tomado de "Manual de Evaluacidn del RendimÍento escolar" por

*)

Tomado de " Estadfstica AplÍcada a Ia Educación"

,

Lic. Luis Arturo Lemus, PÁg. L91,

por Doctor losé Zangozá

A.

Pá9.

81

r,J


]-97

E-ierc ic

io I2

INSTRUCCIONES. Se le dan a continuación los datos correspondientes a las puntuaciones de un grupo de 54 alumnos/ en ras pruebas de Matemáticas y Estu-

dios Sociales.

1.

0btenga el coeficiente de correlación simple Iineal entre las puntuaciones en ambas pruebas, llamando X = Matemáticas e y =Estudios sociales. A-

plique la fórmula 33

2,

hág.

185

)

y los pasos indicados (págs. 187).

Tome a los primeros diez afumnos y sus puntuaciones, para calcularelcoeficiente de correlación ordinal. Utilice Ia fórmula 34 hág, ;-94 ). DATOS

Alumnos 1

X.

L9

9

7

37

L4

9

t4

6 9

11

ó

38 39 40

11

23

7

8

10

4t

6 9 7

24

9

7

25

4 5

6

16 10

B

9

11 IO

t3

L4

26 27

t6

I4 73

45

11 11

2B

8

L4

29

7

6

10 11

46 47 48

t3

9

8

30

B

15

3L

7

6

t2

L2

32 33

16

7 4 7

1B

T3 L2

T3 11

15

t7

9

42 43 44

10

t4

Alumnos

20 2L 22

3 4 5 6 7 8

12 L3

Y.

15

t2

10 11

X.

t2

5

2

9

Alumnos

B

34 35

36

t4

L2 10

9

6 4

7

B

9

49

50 51

52 53 54

Fuente: Sección de Evaluación Escolar

X.

11 10 9l-3 8B 6t4 15 t3 129 510 67 L4 11 10 11 69 t3B 11 L2 t26 6]-4 510 11 9 t3 10

¡Í


APENDICE

I. Fórmulas

emPleadas

La mediana. Distribución de frecuencias de valores agrupados en intervalos de am -

Recorrido o amplitud de la distribución

I

Pág.

46

plitud yariable o constante. Ordenación

A= (Xs - Xi) + r

ascendente. Pág. 104

2. Frecuencias suavizadas, tico. Pá9. 67 f

3

fi-l

=

+ 2fi

+f r+

Media aritmética. Serie simple. Pág. 79

l0

plitud variable o constante. Ordenación 105

- Fi-t

N.

Media aritrnética ponderada. Distribución de frecuencias de valores sin agrupar o agrupados en intervalos. Método largo. Pág. 83

-^= Er.xi N 5.

.i

La mediana. Distribución de frecuencias de valoresagrupadosen intervalos de am -

Md = Li*L 4.

i- I f.I

descendente. Pág.

>Xi

-^=

N_F 2

Md = L.r-+

Método aritmé-

Media aritmética. Método abreviado Pág. 89

.r

-

fi

La moda. Dis[ibución de frecuencias de valores agrupados en intervalos de amplitud constante. Pág. 109

Mo=L., l-1

'i+I fi-r t fi

+

.i +I

X = Xs+C Media aritmética. Método abreviado. Distribución de frecuencias de valores sinagrupar o agrupados en intervalos de am-

plitudvariable. Pág.

Er.a'

X=XS

7

91

N

te. Pá9, ^

=

-

^s

+

L.l-r

k

i+l ki_t i ki + I -i

lación de promedios. Pá9.

lI2

Mo=3Md-2X

94

,>f.d'

f

. t

N

res sin agrupar. Pág.

N+1 2

Cuartiles. Distribución de

frecuencias

agrupa.dos en i.ntervalos de am plitud variable o constante. C)rdenación de valore

La mediana -(lugar que ocupa).Seriesimple y distribución de frecuenciasdevalo-

P=

Mo=

13. La moda. Estimaciónaproximada porre-

Media aritmética. Método abreviado. Dis tribución de lrecuencias de valores agru pados en intervalos de amplitud constan-

?

La moda. Distribución de frecuencias de valores agrupados en intervalos de ampiitud variable. Pág. J 10

99

s

ascendente.

Pág.

i.N 4 o-i = l,r-t +-.a 'Ii

r-¡

117

E

"

r-1

i


APENDICE

I5

Centiles o F€rcentiles. Distribución de frecuencias de valores agrupaáos en intervalos de amplitud variable o constan te. Ordenación ascendente. Pág 120

C.=L. I ]-I 16

I.N 100 -

+

I.

Continuación

22

go. Pág

F,

.

_,

t=

ai

- _ / > r.

fi

V

23

Pá9.13r

.)o *a -

147

1- I

Amplitud o recorrido semiintercuartiL.

a=

Desviación tipica o standard. Distribución de frecuencL¿s devalore. qinagrupar, o agrupados en intervalos de am plitud variable o constante. Método tar-

d

N

Desvlación tÍpica o standard. Serie sim pte Método al¡reviado. Pág. 152

'l

v ,,? zo'

o-

2

2

N

Desviacióno variaciónmedia. Serie sim-

ple. Pág. D. M.

133

24

tldl N

18

tud variable.Método abreviado, Pág. t52

Desviación o variaclón media. Distribu ción de frecuencias de valores sinagrupar, o agrupados enintervalos deamplitud variable o constatrte. Método largo. Pá9. I34

5-r.

25

tdt

Desviación tipica o standard. Distribución de frecuencias de valores agrupados en intervaLos de ampLitud constante Método abreviado Pág. 155

f

Coeficiente de variación Pág

N

.Er. td'l + c(ri-rs) D.M. =

0-

C

I

27

Sk=X 28

pte. Pág.145

r00

-Mo

Cocficiente de asimetrÍa de Pearson. Pá9. 161

X-

S'

29.

59

Asimetría. Pág. Ió1

21. Desviación tÍpica o standard. Serie sim -

0--

r. ¡'2 N

(ri -rs)

Desviación o variación media. Distribu ción de frecuencias de valores: agrupados en intervalos de amplitudconstante. Método abreviado. Pág. 141

|

\¡¡/

N

Desviación o variaclón media. Distribución defrecuenclas de valores agrupados en intervalos de amplitud variable. Método abreviado. Pág. 139

tr. ld'l + c

20

I r. a'2 -t-/>r. o'\'

o

N r9

Desviación tÍpica o standard. Distribución de frecuuncias devalores sinagru par o agrupados en intervalosdeampli-

Ecuación de [a curva normal. yo

Mo

e-

Pág

1ó5


)"

30.

Puntuación típica o puntuación

xi-x o6

z. Pág.

167

x

31. CoeficÍente

de correlación simple 1ineal. Fórmula para tabla de columnas. Pág. 181

Z*.v

rxY

N.Ox. Oy

32. Coeficiente

de correlación simple lineal. Fórmula simplificada de Pearson paratabla de columnas. Pág. I82

>x.y ^I-,-

( Zx') \,/ V

( f

yz)

33. Coeficlente

de correlación simple lineai. Fórmula para cálculo abreviado utilizando cuadro de doble entrada. Pág. I85

I¡.

*'y'

- fEi-r_) \N/\N/

lr, ,')

34. Coeficiente

de correlación ordinal o por el método de rangos. Fórmula deSpearman.

Pág.193

o_ ,

tÉl

r fa2 N

(ts2

-

r)


RESPUESTAS

A LOS EJERCICIOS DE

ESTADISTICA DESCR IPiIVA PR

EJERCICIO

1. (l)

1

IMERA PARTE: CONCEPTOS FUNDAMENTALES

(página 7)

lncorrecto, porque no es absolutamente necesario; se trata de

un

asunto de metodología.

2. (l)

lncorrecto, porque los fenómenos atípicos se estudian en masas

o

colectivos de datos.

3. (C)

Correcto. En Estadística se requiere siempre un colectivo de datos.

4. (l)

lncorrecto. lgual argumento que en el item 2.

5. (l)

lncorrecto, porque las cantidades distan mucho entre sí; sería como promediar el sueldo de O 100.00 mensuales de un maestro, con el de O 1,500.00 de un alto funcionario.

6. (l)

lncorrecto; los hechos variables se llaman así, precisamente porque varían de un caso a otro.

7. (C) 8. (l)

Correcto.

lncorrecto, porque es necesario reducir los punteos a una base común de comparación.

9. (l)

lncorrecto. La función principal que se asigna

a la

Estadística

es

servir de instrumento de predicción científica.

10. (C)

Correcto.

EJERCICIO 2 (pásina 17l,

1. (f)

lncorrecto; desde el punto de vista estadístico, la raza es un carácter cualitativo.

2. (C)

Correcto; t

3. (C)

la

denominación es para distinguirlas de las cantidades

ípicamente variables.

Correcto; por diversas causas las personas darán medidas diferentes.

r{


v"

4. (l)

lncorrecto. Si en el examen se aplicó una prueba escrita, valorada de cero a cien, 75 puntos pueden ser 75olo'de la prueba, pero no de la asignatu ra.

5. (C)

Correcto; para los números que se refieren a mediciones, se conviene en que cada uno es el punto medio de la distancia entre otros dos, que se hallan, respectivamente. a media unidad por debajo y por encima del número de que se trate.

6. (l)

lncorrecto; lo consecútivo de los números ordinales es distinto concepto de continuidad de las variables.

7. (l)

lncorrecto; la medición es posible con base en el registro estadístico de la conducta de las personas ante reactivos y pruebas válidos y

al

confiables.

8. (C)

Correcto; también se les llama clases (de clasificación) cualitativas, para distinguirlas de las clases numéricas o intervalos.

9. (C)

Correcto; porque la naturaleza de los fenómenos psicopedagógicos

es

intrínseca a la conducta humana.

10. (l)

lncorrecto; los valores continuos se

def

inen en el campo de

los

números reales. Los números naturales son los que sirven para contar, desde 1 en adelante.

EJERCICIO 3 (pásina 26)

1.

) 2. (l) (l

lncorrecto.

lncorrecto; la producción de resultados semejantes en apl¡caciones diferentes se denomina fiabilidad.

3. (C)

Correcto.

4. (C)

Correcto.

5. (C)

el punto de vista

numérico o estad ístico. Sin embargo, científicamente carece de interés un test cuya validez no Correcto, desde

haya sido comprobada.

6. (l)

lncorrecto; prueba o reactivo es una traducción instrumento.

y no un concepto

del

J,!


7. (C)

Correcto.

8. (l)

lncorrecto.

9. (C)

Correcto.

10. (C)

Correcto.

EJERCICIO 4 (pásina 33) 1

.

(C)

Correcto;

la

inferencia

estad

ística constituye

la

más ¡mportante

metodología de la Estadística. 2.

(c)

la población puede ser cualquier totalidad de elementos investigables: población de habitantes, de viviendas, de industrias, de cult¡vos. etc.

3.

()

lncorrecto; las medidas características de las muestras se llaman estadísticos o estadígrafos. Los parámetros son medidas características poblacionales.

(C)

Correcto.

(t)

I

4. 5. 6.

(t)

Correcto;

ncorrecto.

lncorrecto. La depuración es indispensable, pero no asegura contra cualquier clase de errores, por ejemplo los inherentes al sistema decimal, o los que se cometen por estudiar una muestra y no la población, etc.

7'

(c)

Correcto.

8.

(C)

Correcto.

e.

(c)

Correcto.

10.

(l)

lncorrecto; incluso, hay discusión respecto de si es una ciencia, un método, una técnica o simplemente un instrumento.

EJEBCICIO 5 (página 39) 1

(C)

Correcto.

il


2. (l)

lncorrecto.

3. (C)

Correcto.

4. (l)

lncorrecto; el resultado es 42

5. (l)

lncorrecto; d

la

operación indicada corresponde

a la

propiedad

istributiva.

6. (C)

Correcto.

7. (l)

lncorrecto.

8. (C)

Correcto.

9. (l)

lncorrecto.

10. (C)

Correcto.

EJqRC¡ClO 6, parte a) {página 54)

1. (C)

Correcto.

2. (l)

lncorrecto; el número 20 no está ordenado.

3. (C)

Correcto.

4. (C)

Correcto.

5. (l)

lncorrecto.

6. (l)

lncorrecto.

7. (C)

Correcto.

8. (C)

Correcto.

9. (C)

Correcto.

10. (C)

Correcto

4


EJERCICIO 6, parte

i)

bl

(páginas S4l55)

Ordenación ascendente de los datos:

18 23 24 25 25 27 27 27 27 28 28 28 29 29 29 29 29 30 30 30 30 31 31 31 31 32 32 32 32 32 32 32 32 32 33 33 33 33 33 33 33 33 33 34 34 34 34 34 34 34 U 35 35 35 35 35 35 35 35 35 35 35 35 35 35 35 35 35 35 36 36 36 36 36 36 36 36 36 36 36 37 37 37 37 37 37 37 37 37 37 37 37 37 38 38 38 38 38 38 38 38 38 38 39 39 39 39 39 39 39 39 39 39 39 39 40 40 40 40 40 40 40 40 40 40 40 40 40 41 41 41 41 41 41 41 41 41 41 41 42 42 42 42 42 42 42 42 42 42 42 42 43 43 43 43 43 43 43 43 43 43 44 44 45 45 45 45 45 45 46 46 46 46 46 46 47 47 47 47 47 47 48 48 48 49 49 49 49 50 50 Recorrido de la variable:

)

)

A :(50

-

18)

+ I :33.

La agrupación en clases o intervalos de amplitud constante de 3 unidades, es uno de los varios arreglos que se pueden hacer con los datos. La amplitud teórica sería de 3.85 puntos, pero lo grueso de las medidas no permite ese afinamiento. Llamaremos Arreglo No. 1 al de amplitud 3, y Arreglo No.2 al de amplitud 4, así: Arreglo No.

1

Punteos t

Punteos

18-20 21 -23 24 -26 27 -29 30-32 33-35 36-38 39-41 42-44 45-47 48-50

A¡reglo No. 2

1 1

3 12 17

35

34 36 24

18-21 22-25 26 -29 30-33 34-37 38-41 42-45 46-49 50-53

1

4 12

26 50

46 30 19

18

I

N:190

N:190

2

ri


v iv)

Empleando el primer arreglo, el cuadro queda así:

h:f/N 18 - 20

19

21 -23

22 25 28

24 -26

27 -29

30-32 33-35 36-38 39-41 42-44 45-47 48-50

1

1

3

31

12 17

34

35

37

34 36 24

40 43 46 49

N:

F

0.0053 0.0053 0.0158 0.0632 0.0895 o.1842 0.1 789 0.1 895

1

2 5 17

34 69 103 139 163

18

263 0.0947

9

o.o474

190

190

1.000'l

xxx

0.1

18',1

EJERCICIO 7 (pásina 75)

1.

Polígono de frecuencias e histograma de Pearson (para el primer arreglo); columnas empleadas: límites reales y frecuencias absolutas. f

;l ::l

r.l 17

.5 20.5

23

5

26.5 29.5

32

5 35.5 38.5 41 .5 44.5 o intervalos)

Punteos (límites reales de las clases

47

.5

50.5


il

2.

I

Para las frecuencias suavizadas, empleando el primer arreglo de los detos, se agregarán los intervalos siguientes: 1s - 17 al principio, y s1 - 53 al final, ambos con frecuencia absoluta' observada igua'l a cero. El siguiente cuadro muestra dicha distribución. Punteos

f

fs

15-17

16 19 22

0

25 28

3

o.25 0.75 1.50 4.15 1 1.00 20.25 30.25 34.75

18-20 21 -23 24-26 27-29 30-32 33-35 36-38 39-41 42 .44 45-47 48-50 51 -53

1 1

'

12 17

31

34

35 34 36 24

32.50 25.50

46 49

18

17.25

52

0

37

40 43

I

9.00 2.25

N:190 epo lígono e

3.

r

histograma está trazado

90.00

con las'

frecuencias

Las frrecuencias absolutas están marcadas con puntos.

i

'rj

16

t2

8

Él

¿

0

145 175 205 '!35 265

295

325

355 385 415 .A.5 475 505

Punteos (límites reales de ios int:rvi¡los o clascr;¡

535


El diagrama acumulativo (o.iiva de Galton) del Arreglo No.'l , mostrando en el eje de ordenadas las frecuencias absolutas acumuladas y su expresión

4

porcentual, es el siguiente: F

oO NO oo

!c oo

Punteos (límites reales de los intervalos)

Para los datos de que se trata, las operaciones y el diagrama de sectores son: (el gráfico se dispone de mayor a menor, y se lee en el sentido del movimiento de las agujas del reloj, a partir de las 12.00 h.)

5.

'

Edad Niñas

Grados

6 años 3,158

olo 16.2 35.6 48.2

Total: 6.552

100.0

360

4

años

1,062

5 años 2,332

58

128 174

t.l


SEGUNDA PABTE: LOS VALORES ESTADTSTTCOS EJERCICIO 8 (página 113) Adve¡tencia: en este Ejercicio operaremos con los dos arreglos de los datos, según aparecen en el item iii), Parte b), Ejercicio 6, de estas respuestas.

1.

Cálculo de la media aritmética, aplicando Fórmula 4. (Referencia: Ejemplo b, Tabla Xl, pp. 871881..

1.1)Con el primer arreglo:

t"'

* :'

-'''ut,,,:

N

37.7 ptos.

190

1.21 Con el segundo arreglo:

x :2.

) fX¡

7,165

:

ptos.

N

190

-:37,7

Cálculo de la media aritmética, aplicando Fórmula], (Referencia: Ejemplo y Tabla XlV, pp. 94/96).

2.1)Con el primer arreglo: a) Tomando Xs

X

:

> fd'

Xs

:

>

Xs

236

:34 +-(3)

+-(i) N

b) Tomando Xs

X

:34

+-

ptos.

190

:40

fd' (i)

N

:37.7

r"f

2

:40

144

(3) 190

:

37.7 ptos.


2.21 Con el segundo arreglo: a) Tomando Xs

:

35.5

» rd' : Í i, +-(i) N b) Tomando

is :

>

x : [ +3.

Cálculo de

la

105

:37.7

:35.5 +-(4)

ptos.

190

39.5

rd' (i)

:

8E

39.5

N

: --(4) 190

mediana, aplicando Fórmula

desarrollado en páginas 1021105l..

37.7 ptos.

$

(Referencia: Ejemplo

3.1) Con el primer arreglo:

Md

:

N n -'i- t

L¡-'¡

+-(i)

:35.5

9E-69 (3)

:37.8

(4)

:

ptos.

34

3.2) Con el segundo arreglo:

Md

4.

:

Cálculo

L¡-1

*

I!-- F,_,, ' ' 2 f¡

(i) :37.5 +

95-93

37.7 Ptos.

46

Fórmula 11. de la moda interpolada, aplicando

(Referencia:

Ejemplo desarrollado en páginas 109/1 10).

4.1) Con el primer arreglo: Advertencia: en este arreglo no está claramente definida la clase modal, o sea, el intervalo donde está la moda, que podría ser cualquiera de los interválos 6o, 7o, 8o, cuyas frecuencias absolutas son muy parecidas. En casos como éste, y siempre que se necesite obtener el valor modal, puede hacerse una estimación del mismo

¡.1


utilizando la "relación empírica de promedios" según Fórmula página

1

13,

12; resolviendo así, se tiene:

Mo:3Md -2X:3(37.8)

-2(37.71 :'113.4 -

75.4:38

p.

4.2) Con el segundo arreglo: a) Fórmula 11:

ri

+r

Mo

:

Mo

:33.b +_(4) 26+46

L¡_1

+_________(i) (fi-1) + (fi+l) 46

b)

:36.1

ptos.

Advertencia: para el cálculo de la moda interpolada, también existe otra fórmula (que damos a continuación porque no figura

en el texto), y que, por razones geométricas, se considera que permite una mejor interpolación que la Fórmula i 1, siendo la

siguiente:

fr-f. Mo :

L¡-1

*

(am)

(11A)

(fm-fa) +(fm-fp)

en la cual:

Mo :

moda, modo, valor modal o promedio típico.

L¡-l :

límite real inferior del intervalo modal.

fm :

frecuencia absoluta del intervalo modal.

fa

:

frecuencia absoluta anterior

a la del intervalo modal

(cuando

los

intervalos son ascendentes)

fp

:

frecuencia absoluta posterior intervalos son ascendentes)

am :

amplitud del intervalo modal.

a la del intervalo modal (cuando tos

r.j


En el segundo arreglo que estamos tratando, se tiene:

Li-l : 33'5; fm : 50;

f

a

:26; f ,:46;

d'm

:4

Substituyendo en la Fórmula 11 A:

Mo

:

50-26 33.5

*

(4) (50-26)

+

:

36.9 ptos.

(50-46)

EJERCICIO 9 (página 128)

1.

Cálculo de los cuartiles primero, sequndo atercero, aplicando Fórmula 14. (Referencia: ejemplos desarrollados en páginas 1181120]. Con el primer arreglo de los datos:

47.5

01 :32.5 +-(3)

-

34

:33.6

puntos

35

95-69

:37.8

02:35.5 +-(3)

puntos

(:Md)

34

Q3

:41.5 +

142.5

-

139

(3)

:41.9

puntos

24

2.

Tabla de percentiles y puntuaciones equ¡va]gps, aplicando Fórmula (Referencia: Tabla

3.

XXll.

Tabla de estructura semejante a la Tabla Galton.

15.

página 123)

XXlll

(página 125l.

y

Ojiva de

ít


Con el primer arreglo, se tiene, respectivamente: Centiles

18-20

23.2

1

10 15

21 -23 24 -26 27 -29

20

32.8

30-32

25*

33.6

30

34.5 35.3

35 40 45 55

60 65

37.8 38.6 39.4 41.0

75*

41.9

80 85 90 95 99

43.1

38.5

39 - 41

41.5 44.5

47.5 50.5

La Oiiva de Galton aparece en Ejercicio 7 de estas resPUestas.

40.2

7A

38

42-44 45-47 48- 50

37.0

50*

35

33 36

36.1

23.5 26.5 29.5 32.5 35.5

Pa

110.5 2 1 352.6 17 12 34 . 1l 69 35 34 103 36 139 24 163 18 ',r81 I 190

20.5

27.6 29.8 31.5

5

Fi

Punteos Li +1

Punteos

',1.0

8.9 17.9

36.3 54.2 73.2

85,8 95.3 100.0

el item

4

44.3

45.8 47.4 49.9

EJERCICIO 10 (página 164)

Advertencia: en este ejercicio operaremos con la distribución del primer ar*gl,c y .lgunos de sus resultados que ya conocemos. 1.

Ampl¡tud semiintercuartil, aplicando Fórmula. 16. (Referencia: eiemplo

en

página 132)

og-or

41.9

u--

-

33.6

:

4.2 ptos.

2 2.

Dsviación media (D.M.), aplicando Fórmula 18. (Referencia: eiemplo y Tabla XXVI en páginas 13611371 Habiéndose calculado

X:37.7

puntos, se tendrá:

rl


tlol

» D.M.

:

s17.2

4.8 ptos.

N 3.

190

Desviación media (D.M.), aplicando Fórmula Tabla XXIX, en páginas 1421143], a

Tomando

Xs :

37

,

puesto

4

(Referencia: ejemplo

que X : 37.7 (véase numeral 1

y.

-

de

prdcedimiento en página 140), el cuadro de cálculo da:

31.7 - 37

2 f [,:'l :3O2; c :-:O.23;

f¡ :

103; fs

:87; i -

3

3

Substituyendo en la Fórmula 20:

D.M.

:

302

+ 0.23(103-87) (3)

:

302

4.

Comprobación

190 917.O4

:4.8

puntos

190

del intervalo del 58o/o centra! de casos. (Referencia:

ejemplo y procedimiento en páginas 1431144l, Siendo

3.68 (3)

190

305.68 : D.M.:-(3) 190

+

X:37.7 y D.M. :4.8,

.

los dos extremos del intervalo son:

:37.7 - 4.8 :32.9 superior :37.7 * 4.8:42.5

Límite inferior Límite

El límite inferior (32.9) está en el intervalo 33-35 de la distribución; límite superior (42.51 está en el intervalo 42-44; el cómputo de casos da:

el

De 32.9 a 35.5 puntos hay (35.5 - 32.9) (35/3) : 30.3 casos 70.0 De 35.5 a 41.5 puntos hay . De 41.5 a 42.5 puntos hay (42.5 - 41.51 l24l3l: 8.0

Sumando: de 32.9 a 42.5 puntos hay Porcentaje de normal

.

.

¡.1

108.3

casos: (108.3:190) (100) :57.Oolo, que es próximo al

58o/o


5

tiplg

De¡yiqeiqr

aplicando Fí¡rmula 22. (Referencia: ejemplo

y

XXXII en páginas 149/1S0). Tomando desviaciones de la forma:

d

:

X - X', el cuadro de cálculo dará:

-t8538 Desviación típica, aplicando Fórmula

XXXIV en páginas 155/156). Tomando

X, : 49, y

desviaciones

Tabla

§

:

5.9 pts.

(Referencia: ejemplo

de la forma d' :

y

Tabla

,.

faqr.

obtuvieron para el cálculo de la media aritmética, según respuesta en item del Ejercicio 8, el cuadro de cálculo da:

)td'2 :8S6; >fd' :-144;

i

: 3;

N

2

:190

Substituyendo en la Fórmula 25:

856

ó-:

3

190

6:3

7.

t

/-Á

h

4.5053 - 0.5776

:rI

4.5053 - (-O.76P

I :.f

Comorobación del intervalo del 6Jo/o_centfa]_de 10.96. página 158). Siendo

X :37.7 yo-:5.9

:3(1.98)

@.

= 5.9 P.

(Referencia: item

los dos extremos del intervalo son:

r.j

Límite inferior :37.7 - 5.9 : 3'l .8 Límite superior :37.7 + 5.9 :43.6

El límite inferior (31.8) está en el intervalo 30-32 de la distribución; límite superior (43.6) está en el intervalo 42-44; el cómputo de casos da:

el


De 31.8 a 32.5 puntos hay (32.5 - 31.8) De 32.5 a 41.5 puntos hay . . De 41.5 a 43.6 puntos hay (43.6 - 41.5)

Sumando: de 3'l .8 a 43.6 puntos hay . Porcentaje de casos : (125.77 respecto del porcentaje normal.

8.

:

de Charlier para la pés"* lSZfiSe).

Prueba

(1713:

3.97 casos

105.00 l24l3l: 16,99

.

125.77

190) (100)

:

66.2o1o, que difiere en 2olo

desviación típica. (Referencia: ejemplo

en

Del cuadro de cálculo de la desviación típica, con Xs :40, tomamos las desviaciones (d') positivas y negativas; a cada d' sumaremos una unidad positiva y el resultado se eleva al cuadrado; cada uno de estos cuadrados se

multiplica por

la

frecuencia absoluta respectiva

y se suman dichos

.-

productos. Esta suma resultará ser:

> f(d' r

1\2

:758

Siendo:

Zt(O'

¡

1¡2

: »fd'2 + 2 »fd' + > f

tomaremos los valores del desarrollo (segundo miembro de la igualdad anterior), ya sea del cuadro de cálculo o de la substitución en la Fórmula de la desviación típica (item 6. Ejercicio 10) y se tiene: 758 758 758

9.

:856 +

-

2(-144l. +190

:856 288 + 190 : 1046 - 288 :758

.Coeficiente de variación, apl¡cando Fórmula 26. (Beferencia: ejemplo en página 159).

5.9

C.V.

:-(100) 377

rJ :

15.6o/o


.Nota: El C.V. no es aconsejable o aplicable cuando la variable carece

de

cero absoluto; en el caso de las puntuaciones escolares no existe dicho cero.

10.

Cuadro de cálculo según modelo en página 163. Este cuadro debe haberlo fiecf'o et estu¿¡ante cuan?lcalcut,ó t'a media y desviación típica, según numerales 2 del Ejercicio 8, y 6 del Ejercicio 10.

11.

Coeficiente de asimetría, aplicando Fórmula

28. (Referencia: ejemplo

en

páginas 16111621

37.7 -

38

-0.3 :-:-V.VJ

:-

\)

5.9

5.9

La distribución es ligeramente asimétrica negativa, lo cual observamos también en la gráfica del item 1, Ejercicio 7, ya que la rama izquierda de la curva se extiende más que la rama derecha.

EJERCICIO 11 (página 177l.

1.

Para

z:1.00,

2.

Para

z

3.

Para

z :1.96,

4.

área

:0.3413 :34.13o1o

:2.58, área:0.4951 :49.51o1o

Para área

:

corresponde

área

:

0.3920,

(se conviene en 49.50)

0.4750 :47.50o1o

el valor más próximo en la Tabla

az:1.24

5.

Para área

:

0.4484, la Tabla de z

:

1.63

6.

Para área

:0.0120, la Tabla de z

:

Q.03

7.

Lo primero es hallar el valor tipificado de X mula 30 (pásina 'l 67), es:

' 741 :

74-58 16

:

:74,

1'oo

es 0.3925, que

que conforme a la Fór-

"t


Entre la media y

z:1.00

hay 34.13o/o de casos (según Tabla); por debajo

de la media hay 50.00o/o de casos. Luego, .por debajo de 74 puntos quedan 50.00 +34.13 :84.'l 3o/o; así, 74 puntos equivalen al percentil g4. La gráfica siguiente ilustra este problema:

34.13o1o de casos entre la media y z : 1.00

58 8.

74:z:1.00

Para que una puntuación X deje bajo sí el 43olo de casos, se necesita que entre dicha puntuación y la media quede el complemento a 50o/o, o sea 7olo. En la Tabla xxxv buscamos el área más próxima aTolo,que resulta ser 0.0714 : 7.14o1o, y que corresponde a z:-O.lB; aquí se pone signo menos, porque el valor X de que se trata es menor que la media. Ahora, procedemos según se ve en el ejemplo 2, página i75, y se tiene:

X

:58 - 0.18(16) :58 - 2.88 :55.12 :

55 pts. aprox.

Luego, por debajo de 55 puntos queda 43olo de los estudiantes. La siguiente gráf ica ilustra este problema:

rl z:-0.18 X :55

58


o

Convirtiendo los punteos directos (35 (Fórmula 30)

z1g5¡

:-

v 80)

en punteos típicos, se tiene

z13g¡

:-

35-58 -1 '44;

80-58 1'38 16

16

Por la Tabla XXXV se ve que: a) entre la media y z:- 1.44, el área es b) entre la media y z : 1 .38, el área es

o.4251 o.4162

c) Luego, entre ambas zeta, el área es:

084.',t3

Entre los punteos 35

y 80 queda 84.13o/o central de estudiantes.

La

siguiente gráfica ilustra este problema:

35

10.

80

58

Para que quede el 68o/o central de casos, entre dos puntuaciones que están una por debajo de la media y otra por encima, por simetría de la curva quedará la mitad de casos (34o/o) entre la media y cada punteo. Por la Tabla XXXV, se ha convenido -para efectos prácticos- que 34olo equivale al área 0.3413, cuya z:1.00 es negativa para el punteo menor que la

media,

y

positiva para

el

punteo mayor que

la

media. Por tanto,

procediendo conforme al ejemplo 2, página 175, se tiene:

X1

:58 -

v ^2-

58

+

1.00(16)

:

1.00(16)

58

-

16

:42

t.i

:58 f 16:74

Por tanto, entre 42, y 74 puntos queda comprendido el 68o/o central los casos o estudiantes.

de


EJERCICIO 12 (Página 197)

1.

Coeficiente de correlación s¡mple lineal, aplicandb Fórmula 33. (Referencia: ejemplo y Tablas XXXVlll y XXXIX en páginas 18511921.

Los punteos de Matemáticas (variable X), van de 4 a 16; y en Estudios Sociales (variable Y), van de 6 a 15; por tanto, no se justifica agruparlos en clases o intervalos. Dichos punteos y sus frecuencias, son: (como referencia)

:4, 5, 6,7,8, 9, 10, 11, 12, 13, 14, f : 3, 4, 6,5, 4,6,6,4,6,4,3, 1,2. X

1

5, 16. N :54

Y : 6, 7, 8, 9, 1O, 11, 12, 13, 14, 15. f :5, 5,7, 8,5, 8, 3, 5, 6,2. N : 54.

Diagrama de dispersión o nube de puntos (para recuento de casos).

,t En el dispersigrama anterior podemos ver: a) la distribución de frecuencias de X en la primera y última filas; b) la distribución de frecuencias de Y en la primera y última columnas; y c) que la suma de frecuencias debe cuadra r.


33. (Xs:10; Ys :11)

Cuadro de cálculo para la Fórmula

x

x

x

o

o

I

u I

§

I

§

o

I

o

I

§

I

I

ó

@

o o

N o

@

o

N

o

u

(d

o

o

N

o)

o

o

o

§

§

N

N

N

o o

ñ

o

I

I

I

{

o)

N

I

¡O

o

o

N

o

o

§

o

! N

N

o

I

o §

NI o il

o

O

I

N

Nl

@

JN

o

o

o

o

N

N

o

o

§

-t @

o

o N

a

O)

§

o

o

-o N

z

{

q

q

o

I

o

I

@

q

I

I

6

o

o

6

N

o

N

il

o I

O-

-l o

JN

o

u

N

{

N

o

I

o

I

NJ

o

O)

o

o

o

@

o

o

I

o

N

ñ u

o o

q

N 6

§

O)

o

N

@

rl N

NJ

a,/ /x

o

o

N

N

o

I

o

o

@

@

§ o

l+

N @(, @N

I

I

I

I

N

o

I

N

o

N o

N

o

N

o

qI

o

o

o

o

N o

@

o o

o N

o

o

o

N

o

o)

§

N

{

N

N

o

@

O

o

o

O

o (!

o

N

N

o

§

@

N

@

N

+x_

l<

)

r .t¡


Con los totalés del cuadro anterior, se tiene:

fx' : -34

» fy' : » fy'2 :

:

580

N-

54

1*'2

-48; 414;

Substituyendo en la Fórmula 33:

133 _ l34l t-481 54 ' 54 ',54 rxY

rxY

2.46

- (-0.63) (-0.8e)

2.46

-

:

rxY

: ]tro.z+ '1.9

'xY

-

-

1.9

0.56

o.4o) (7.67

-

o.7el

(10.34) (6.881

1.9

o.226 8.4

El coeficiente r:O.226 denota baja correlación, según la Tabla de Rugg, o que prácticamente carece de significado, según la Tabla de Gavett (página 1

2

96).

Coeficiente de correlación ordinal. aplicando .Fórmula ejemplo

y Tabla XL en páginas 193/194).

34.

(Referencia:

f4


Los primeros 10 alumnos, sus punteos en X, en Y,

y

sus respectivos rangos,

son:

Rangos Alumnos 1

2 3

4 5

6 7

8 9

I-

10

X.

Y.

512 12 15 16 14 10 8 14 l',I 10 6 89 97 1'.l 13 't0 1'l

.-

dd2 6.0 2.O 1.0 2.O 3.5 4.0 2.O 1.0 1.0 0.5

Y.

1.0 7.O 10.0 't0.0 9.0 5.0 3.0 9.0 5.5 8.0

5.0 1.0

2.O

3.0

t.o

5.0

4.O 2.O

8.0 5.5

) d2 :

36.00 4.00 1.00

4.00 12.25 16.00

4.00 1.00 1.00

0.25 79.50

Substituyendo en la Fรณrmula 34:

g: 1

477 :'l --: 10(100 - 1) 990 6(79.5)

- 477 513 --:0.518 990 990

990

,$


BIBLIOGRAFIA

CLAPAREDE, E.

"PsÍcologfa del niño y Pedagogfa Experimental,,.

Cia, Edi-

torial Continental, S.A. México, f9S8. (11) CANSADO MACEDA. E.

"Curso Elemental de Estadfstica". InstÍtuto Nacionalde

Es

-

radÉtica. Madrid, 1955. CMMER, H. "Métodos Matemáticos de Estadfstica". Aguilar, S,A. de ediciones. Madrid, I 95-s. CRAMER, H.

"Elementos de Ia Teorfa de P¡obabilidades

y aplicaciones",

Aguilar, S.A. de edlcÍones, Madrid, 1958. CROXTON, F.E. y COWDEN,

D.l. "Estadfstica general aplicada", Fondo de Cultu¡a Económi-

ca. México,1957. FISHER, R. A.

''Métodos EstadGticos para investigadores,, de EdicÍones. Madrid, 1949.

. Aguilar, S.

A.

GALI, A. "La Medida Objetiva del Trabajo Escolat,,. Aguilar, de Ediciones, Madrid, 1934. (5) (9)

S. A.

GARCIA HOZ, V.

"Formulario y tablas de Estadfsdca aplicada a la pedagogfa'l jo Super ior de Inv esti gac iones Cientfficas. Ma drid. I 944.

Conse

GARCIA HOZ, V. "No¡mas Elementales de Pedagogfa Empfrica,,. Ed. Escuela,

Madrld. 1946. (13) (14) GARCIA PEREZ. A. "

Elementos de Método Estadfstico", Imprenta

U

niversitaria.

México, 1945. (20)

"Curso de Estadfstica", Ed. Labor. Barcelona. 1958-

Ét


G,NZALEZ BELLID.'

\4' "Introducción a 1os Métodos EstadÉticos". Talleres Tipográficos Heraldo de Z4mora.. Madrid, 195'1. (6) (22)

GRASSAU, E.

"Elemertos de Btadñtica". Editorial UúveNitarla.

San

-

tiago, Chi]e.1959. LE\,IUS,

L. A. "lr{anua1 de Evaluación dei Rendimiento Esco1ar". Publi caciones Cultural, S. A. La Habana.

LIORZOU, A.

"InicÍación Práctica a 1a Estadfstica". Francisco Casano vas, Editor. Barcelona. 1959. LOPEZCH, M; y oRTEGA P. 'Métodos Estadfsticos Aplicados a la EducacÍón". Sec¡etarfa de Educaclón Pública. México, 1946.

I\4]RA Y LOPEZ, E,

"Manual de orientación profesional". Ed. Kapelusz. BueAires, ArgentiDa. 1952,

nos

\400D,

A. M.

"Int¡oduccÍ6n a 1a Teorfa de de Edlciones. Mad¡id, 1955.

(

nl.ro eurNTANA,

1a

Estadfstlca" Aguilar, S. A.

E

"EstadÉtica Comercial", La Habana, 1955. RICO QUIROA, H.

"Lecciones de EstadfstÍca Pedagógica". Ed. Universo, La

Paz, BolivÍa.1957. RIOS, S.

"Iniciación Estadfstica". Ed, Industrias Gráficas Bpaña, L. MadrÍd, 1957. (1) (2) (1?)

s. RIOS, S.

"Introducción a los Métodos de 1a EstadfstÍca". t¡ias G¡áfÍcas Bpaña, S,L. Mad¡id, 195?. ROS

IIMENO,

Ed. Indus-

J.

"Apuntes de Estadfstica Demográfica". Universidad Cen-

tral de Madrid. Escuela de Estadfstica. Madrid, 1958.(18) (1e)

ü


ROS

IIMENO,

J, "E1 concepro de Estadfstica'

. (4) (21) (23)

TIRADO BENEDI, D, "PsicotecDiá de la Educació1". Secretarfa de Educaclón Pdblica, México, 1946.

WILKS,

S. S.

"Aná1isis Estadfstico Elemental' . Corsejo SuPerior de Investigaciones Cientfficas. Madrid, 1952. (3)

YELA, M. "Los tests". (16)

YELA, M. "Psicometrla y Estadfstica". Ed. Escuela de PsÍcologlay Psicotecúca. Madrid, 1958. (?) (8) (10) ZARAGOZA, I.

"Gnoso8rama", Departamento de OriertacióD Escolar y

Voceclonal". Guatemala, 1958. (12) (15) ZARAGOZA,

J,

"Psicograma". Depaftamento de O¡ientación Escolar y

Vocacional". Guatemala, 1958. ZARAGOZA, I. "Estadfstica Aplicada a 1a Educación". DePartamentode Orientación Escolar y Vocacional"' Guatemala, 1960'

,,Vademecum de Estadfstica. " Distribuciones deFrecuencias y series cronoldgicas, Instituto Nacional de Estadfstica. Madrid, 1957. (24)

r'dt


ESTADISTICA DESCRIPTIVA Se terminó de imprimir en los talleres de Editorial "Piedra Santa" el día 3 de noviembre de ).977. Guatemala, C. A. 2,000 ejemplares


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.