UNIVERSIDAD AUTÓNOMA DE ZACATECAS
FACULTAD DE PSICOLOGÍA “FRANCISCO GARCÍA SALINAS” LICENCIATURA EN PSICOLOGÍA
Curso: Estadística II Docente: Diana España Montoya ENSAYO: “PERCENTILES Y VARIANZA” Alumna: Perla Lizbeth Núñez Martínez Segundo semestre Grupo “B”
INDICE
Índice………………………………………………………………………………………….. 2 Introducción………………………………………………………………………………….. 3 Desarrollo………………………………………………………………………………….....4 -8 Conclusión……………………………………………………………………………………. 9 Bibliografía…………………………………………………………………………………… 10
Gráficos Gráfica de escalera para datos……………………………………………...5
percentiles
de
diez
2
Introducción "La estadística es el único tribunal de apelación para juzgar el nuevo conocimiento.” P.C. Mahalonibis La estadística descriptiva tiene como objetivo proveernos de herramientas gráficas y numéricas para interpretar y resumir datos. Es por eso que la estadística se ve reflejada en nuestro entorno, aunque no la observemos objetivamente, ya que en la mayoría de los casos se trabaja transversalmente y no nos damos cuenta de que estamos haciendo uso de ella, por ende se maneja en los espacios escolares, en niveles educativos como medio superior ya que son complejas de asimilar en un principio pero con su uso cotidiano y contextualizado es sumamente fácil de entender. Por ello en el nivel superior aun la seguimos utilizando, y en lo que rescato del por qué se lleva a cabo en la licenciatura de psicología, es debido a que todo psicólogo debe llevar un análisis, evaluación, etcétera de todos sus pacientes, por una parte, es el primer paso que conduce a la planeación de la intervención y, por otra, sirve como punto de comparación para determinar el éxito de la terapia. El objetivo de este escrito es proporcionar al lector conocimientos acerca de la relación que lleva la estadística en nuestra práctica como futuros o ya psicólogos, haciendo énfasis en la medida estadística llamada percentiles y en una técnica muy utilizada para varios propósitos que es la varianza.
3
Primeramente proporcionaré el concepto de percentil que es una medida de posición muy útil para describir una población. En forma intuitiva podemos decir que es un valor tal que supera un determinado porcentaje de los miembros de la población. Este proviene de las medidas de posición no centrales, estas encuentran su razón de ser en la necesidad de encontrar información característica asociada a una serie de datos agrupados, la información que se busca no se encuentra en datos centrales, es por eso que se encuentra en grupos porcentualmente equivalentes, los valores que se encuentran en esta distribución se llaman cuantíles y de aquí surgen los principales cuantiles que son los cuartiles, los quintiles, deciles y entre ellos los percentiles, aquí podemos percibir su origen. Este crea 99 valores estratégicos que permiten distribuir la serie en 100 partes iguales. Los percentiles se emplean comúnmente cuando tenemos tamaños muestrales muy grandes, este para su resultado se divide en tres percentiles, percentil 25, este contiene uno de cada cuatro datos, percentil 50, este contiene dos de cada cuatro datos y percentil 75, que comprende tres de cada cuatro datos, y esto se resuelve atreves de la mediana de cada serie de datos. al relacionarla con las pruebas psicológicas menciona Aragón (2004), “no es factible que toda prueba construida se distribuya normalmente al aplicarla a la población meta -que son la mayoría-, las puntuaciones que se utilizan son los percentiles (o centiles), que son las puntuaciones derivadas de una distribución de frecuencia acumulada y dividida en 100 partes, encontrándose en cada parte o percentil de la distribución el mismo número de casos... Algunos percentiles importantes son la mediana y los cuarteles primero y tercero.”
4
La mediana representa el valor de la variable de posición central en un conjunto de datos ordenados. Su formula sería la siguiente:
.
Ejemplo. Considere los siguientes datos de una muestra de tamaño 10. 4 8 11 12 13 16 18 19 21 22 En una muestra de tamaño n, cada dato representa 1 enésimo del total. En este caso, en que hay diez datos, esta proporción es un décimo. En el gráfico, puede observarse que la gráfica muestra un salto de un décimo (10%) en cada dato muestral. El primer salto se observa en el número 4, el menor de los datos. Antes del valor 4, la curva asume el valor cero y a partir de él, un décimo. El segundo salto se produce en 8, a partir del cual la gráfica comienza a valer dos décimos. Así se producen los saltos hasta alcanzar el valor uno (100%) a partir del último dato muestral 22:
Pero hablando psicológicamente ¿Qué vamos a medir?, la respuesta a esta pregunta vendría siento principalmente, la conducta o el comportamiento, aunque sabemos que no todas las conductas las podemos cuantificar, entonces como afirma Aragón (2004), lo que medimos son “atributos de la conducta” o “atributos psicológicos”.
5
De esta manera, si al aplicar una prueba a la población meta sus puntuaciones no se distribuyen normalmente, entonces es conveniente elaborar una distribución de frecuencias acumuladas y determinar los diferentes percentiles, tomando en cuenta que los percentiles de comparación serán el 25 y el 75, ya que entre ellos se encuentra el 50% de la población con puntuaciones intermedias, es decir, es la mitad de la población que se encuentra en medio de la distribución, y con ella se va a comparar la ejecución de los demás evaluados. Así, si un sujeto al aplicarle una prueba de inteligencia se encuentra en el percentil 60, esto querría decir que se encuentra por arriba del 60% de la población en el rasgo evaluado y que a su vez el 40% tiene una ejecución mejor que él; si se encuentra en el percentil 85, su ejecución se encuentra por arriba del 85% de los jóvenes de su edad y sólo por abajo del 15% de la población, y si su percentil es de 20, entonces esto indicaría que su ejecución se encuentra por abajo del 80% de la población normativa. Si estamos evaluando ansiedad, entonces encontrarse en el percentil 25 o menos no sería un problema, pero sí encontrarse en el percentil 75 o más arriba, ya que indicaría que el sujeto evaluado sobrepasa al 75% o más de la población en ansiedad. Las normas aceptadas universalmente para determinar lo adecuado o no de un rasgo medido son el percentil 25 y 75, esto es, si el evaluado obtiene una puntuación percentil entre 25 y 75 se encuentra en la norma, acercándose a la norma alta de 60 a 75 y a la norma baja de 35 a 25; puntuaciones mayores a 75 serían consideradas altas e indicarían en qué porcentaje sobrepasa el evaluado a la población en el rasgo evaluado (inteligencia, ansiedad, depresión) y puntuaciones menores a 25 son consideradas bajas e indicarían al restarse de 100, el porcentaje por abajo del cual se encuentra el evaluado en el rasgo con respecto a la población de comparación (inteligencia, ansiedad, depresión). Es un claro ejemplo de cómo emplearíamos esta forma eficaz de evaluar a diversos pacientes o personas, como nos pudimos percatar los percentiles no es más que sacar el porcentaje de cierta población, pero está dividida es grupos debido a que es una medida de posición no central. Ahora bien, hablaremos de la técnica llamada varianza, es un método para comparar dos o más medias, que es necesario porque cuando se quiere comparar más de dos medidas es incorrecto utilizar repetidamente el contraste basado en la t de Student como afirma 6
Salvarrey (2000) “la prueba t de Student es aplicable a mas de dos medidas simultáneamente. Pero existe una relación entre ambos y si aplicamos el análisis de varianza a la comparación de dos medias, obtenemos resultados concordantes t2 = F.” La varianza (que suele representarse como
) de una variable aleatoria es una medida de
dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. Una idea que se ha demostrado útil a la hora de cuantificar la variabilidad es la de trabajar con las distancias desde los valores hasta algún poste centra, que podría ser la media aritmética y basar la medición de la dispersión en algún tipo de “separación promedio” hasta ese poste
Una solución al problema de que las distancias con respecto a la media sumen cero consiste en elevar al cuadrado esas distancias antes de hallar su promedio, dado que los cuadrados son siempre positivos. El índice basado en esta idea se llama varianza y se representa por la expresión S2x, donde el subíndice recoge la letra con la que se representa la variable. Al cálculo del promedio de las desviaciones cuadráticas con respecto a la media:
S2x = ( X - X )2 n
S2x = x2 n
7
La cuestión que puede surgir es la de cómo valorar el grado de dispersión cuantificado mediante este índice. En realidad no tiene mucho sentido hablar de niveles altos o bajos de dispersión en términos absolutos, sino, en todo caso, en términos comparativos. La varianza sirve sobre todo para comparar el grado de dispersión de dos o más conjuntos de valores en una misma variable, llegando a conclusiones como la siguiente: “La población de hombres presenta una mayor variabilidad en su estatura que la población de mujeres, que son más homogéneas en esa característica” El valor 27,2 no parece un número claramente relacionado con lo que se pretendía medir. Las mayores distancias que presentan esos valores con respecto a la media son de 8 puntos y parece que una representación numérica de la magnitud general de esas distancias estaría bastante alejada de 27,2. La razón de esta discrepancia es que las distancias no se han tratado como tales, sino que para evitar el problema de que las diferenciales sumen cero se han elevado éstas al cuadrado. Por ello es frecuente que, con objeto de retornar las unidades originales de esas distancias, se calcule la raíz cuadrada de la cantidad obtenida. Al índice así hallado se le llama desviación típica, se representa por Sx y se define sencillamente como la raíz cuadrada de la varianza:
Sx = ( Xi - X)2 n La desviación típica es un mejor descriptor de la variabilidad, aunque la varianza tenga algunas notables propiedades que la hacen idónea para basar en ella los análisis estadísticos complejos. La variabilidad de los datos está reflejando el hecho incuestionable de las diferencias individuales y éstas son uno de los objetos de estudio primordiales de la psicología. Cuasivarianza: dividiendo por n – 1, representamos por S’2x n · S2x = (n – 1) · S’2x
8
Conclusión En resumen, utilizar el percentil para analizar datos es muy útil. Es un ejercicio excelente para utilizar indicadores en proyectos, fácil de definir y de analizar, y hablando en el área de psicología ayudara a facilitar el trabajo del especialista para mantener sus datos ordenados y agrupados de una manera fácil, efectiva y eficaz. El cálculo de un percentil de una muestra presenta algunas dificultades por tratarse de un conjunto de datos en que se producen incrementos de la proporción acumulada en forma de saltos, y no suavemente como en el caso de una variable continua. Estos saltos representados por un gráfico de escalera son los que producen situaciones indefinidas. La varianza, es un índice muy sensible a las puntuaciones extremas. En los casos que no se pueda hallar la media tampoco será posible hallar la varianza. La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado. Es por eso que como futuros psicólogos debemos aprender todo este tipo de técnicas debido a que tenemos que tener registros de nuestros futuros pacientes, análisis de ellos, y de la 9
sociedad en general, esto permite saber probabilidades de comportamientos de las personas y asi basarnos en ellas para nuestros exámenes psicológicos.
Bibliografía Salvarrey Luis (2000), Curso de estadística básica, Regional Norte Universidad de la Republica,Salto Uruguay. http://www.ucv.cl/web/estadistica/percentil.htm https://www.youtube.com/watch?v=dB-QwndRdDc http://www.iztacala.unam.mx/carreras/psicologia/psiclin/vol7num4/Art3-2005-1.pdf http://books.google.es/books? id=oqOCiEyEjYcC&printsec=frontcover&hl=es&source=gbs_ge_summary_r#v=onepage& q&f=true
10