Análisis descriptivo univariado

Page 1

1. Clarificación conceptual     

Estadística censal =/= estadística muestral Diversidad = varianza normal Pronósitico probabilístico: estimación Muestra: ¿Representativa de la población objetivo? Instrumentos de medida: - Tests   -

Cuestionarios 

-

-

Hipótesis deductivas: fundamentadas en la revisión teórica de la literatura Hipótesis inductivas: surgen de las observaciones o reflexiones

Científicas/estadísticas  

Objetivos Descripción superficial de la respuesta Conjunto de preguntas dicotómicas: si/no

Técnicas de análisis de datos (qué trabajaremos en los seminarios) - AF confirmatorio - AF exploratorio - Análisis dimensional de los instrumentos de medida Las hipótesis: - Deductivas/inductivas  

Para medir un rasgo concreto, constructo o dimensión Tipo Likert

Inventarios   

Cuestiones más generales: hábitos, actitudes…

Escalas  

-

Subjetivos Ítems de respuesta cerrada: verdadero/falso, bien/mal

Hipótesis científicas: descriptivas/correlacionales/diferencia de grupos/causales Hipótesis estadísticas Nula H0: X1-X2=0  Se pone a comprobación  No hay diferencias entre los grupos AlternativaH1: X1-X2≠0  Diferencias estadísticamente significativas

Constructo: abstracciones mentales del ámbito psicológico. Es la idea no observable que subyace al conjunto de valores. Siempre que medimos dos errores - El error de medición de la escala hay que fijar siempre el error del instrumento - El error del observador al observar Centro de distribución de datos: Punto de equilibrio o centro del conjunto de datos Representación de grupos de observaciones Medida o parámetro de tendencia central/centralización -

Mediana Media Moda


2. Importancia de la delimitación del objeto de investigación   

Tesis  limitaciones del estudio Qué instrumentos puedo/voy a utilizar Acotarlo

Modelo de tres pasos o en cascada para definir el objeto de investigación

FACTOR 1

VARIABLE 1

OBJETO DE ESTUDIO

Atención

Intrínseca Motivación

Un conjunto de indicadores medibles Puntajes

INDICADOR 1

Le ampliar conocimientos

Extrínseca

3. La descripción univariada: gráficos y coeficientes principales 

Tipo de escalas (instrumentos de medida) Todas las escalas son subconjuntos de la anterior

A

B

C

A.

ESCALAS NOMINALES o Clasifican o Los objetos son iguales o diferentes  a=b, a≠b o La forma más sencilla de aproximarse a la realidad o Observar  categorizar  clasificar o Sexo (biológico)= mujer o hombre

B.

ESCALAS ORDINALES o Ordenan o Operaciones posibles: a≤b, a≥b y las operaciones anteriores

C.

ESCALAS DE INTERVALO o Las distancias están graduadas o Las proporciones se conservan  relación lineal o Operaciones posibles: a+b, a-b y las operaciones anteriores o No tiene cero o Utilizamos medidas relativas y ponemos cero por convención o Ej. escalas de inteligencia

D.

ESCALAS DE RAZÓN o Establecen proporciones o Tiene cero o Ej. temperatura

MEDIANA

MEDIA

MODA

En las ciencias sociales las escalas son nominales u ordinaels (Se manipulan las escalas ordinales como si fueran de intervalo)

D


Mediana, media y moda

MEDIANA 

   

Uso en escalas Ordinales De intervalo De razón Representa a la mayoría Error absoluto Valores outsiders no influyen Es más precisa para representar la centralidad de un conjunto de datos, si hay valores extremos

MEDIA      

Uso en escalas De intervalo De razón Representa a todos los datos Error cuadrático Valores outsiders influyen Es más precisa para representar la centralidad de un conjunto de datos, si no hay valores outsiders No debería utilizarse en ciencias sociales, ya que sólo utilizarían escalas nominales y ordinales

MODA    

Uso en todas las escalas pero especialmente en nominales Representativo de la moda Muy sensible a variaciones muestrales No siempre se sitúa hacia el centro de la distribución


PERCENTIL MEDIANA

MEDIDAS DE POSICIĂ“N

CUANTILES: PERCENTILES,CUARTILES, DECILES Centiles: Percentiles: P1, P2‌P99 Q1: P25. Cuartil primero. Deja el 25% de los valores por debajo Q2: P50: Md (mediana). Cuartil segundo. Deja la mitad de los valores por encima y por debajo Q3: P75. Cuartil tercero Deciles: P10, P20‌P90 Cuantiles pertenecen a nĂşmeros reales ďƒ es posible P19,3

+ Ă­ndice de posiciĂłn + Ă­ndice de distribuciĂłn

Para caracterizar un grupo de datos son necesarios:

MEDIDAS DE DISPERSIĂ“N O VARIABILIDAD ABSOLUTAS Distancia de cada valor respecto a la medida de tendencia central DISPERSIĂ“N DE LA DISTRIBUCIĂ“N ďƒ VARIABILIDAD ďƒ Se mide con la varianza 

Recorrido/rango: R = xn - x1



Recorrido/rango intercuartĂ­lico: RI = Q3 - Q 1



Medida de dispersiĂłn en valor absoluto ďƒ Mediana Median absolute deviation: masa total de desviaciĂłn respecto a la mediana DesviaciĂłn absoluta respecto a la mediana: ∑│Xi -Md│ DesviaciĂłn media con respecto a la mediana: ∑

Escalas nominales y ordinales

│Xi −Md│ n

Medida de dispersiĂłn en valor absoluto ďƒ Media DesviaciĂłn absoluta respecto a la media: ∑│Xi-X│ DesviaciĂłn media con respecto a la media: ∑



│Xi−X │ n

Medida al cuadrado ďƒ Media Variabilidad cuadrĂĄtica: ∑(Xi- X)2 Varianza: đ?‘† 2 = ∑

(Xi− X )2 n

ďƒ alterando el sentido de la medida 2

DesviaciĂłn tĂ­pica o estĂĄndar: S= đ?‘† = ∑ Cuasi-varianza: đ?‘†n2−1 = ∑

(Yi− Y )2 n−1

2

(Xi− X) n

mejor indicador de la variabilidad global de la distribuciĂłn

ďƒ mejor indicador para muestras/grupos

RelaciĂłn entre varianza y cuasi-varianza:

2 đ?‘› − 1 đ?‘†đ?‘›âˆ’1 = đ?‘› đ?‘†đ?‘›2


MEDIDAS DE DISPERSIÓN RELATIVAS para que no afecten las unidades de medida de la variable y para que puedan hacerse comparaciones entre las dispersiones de conjuntos de datos dispares 

Recorrido semi-intercuartĂ­lico: Rs = Q3-Q1/(Q3+Q1)



Ă?ndice de dispersiĂłn respecto a la mediana: VMe = D/Me



Coeficiente de variación de Pearson: � = �0 =

Escalas nominales y ordinales

� �

MOMENTOS DE UNA DISTRIBUCIÓN 



Indicadores genĂŠricos de una distribuciĂłn Dos distribuciones son iguales, si tienen todos sus momentos iguales, y son tanto mĂĄs parecidas cuanto mayor sea el nĂşmero de momentos iguales que tengan RelaciĂłn entre momentos ordinarios y centrales ďƒ đ?‘šđ?‘&#x; = (a − đ?‘Ľ )(đ?‘&#x;)



Momentos ordinarios respecto al origen ďƒ đ?‘Žđ?‘&#x; =



∑đ?‘˜đ?‘–=1 đ?‘‹đ?‘–đ?‘&#x; .đ?‘› đ?‘– đ?‘

Se ven afectados por los cambios de origen y de escala (unidad) en los valores de la variable đ?‘Ž0 =1 para cualquier distribuciĂłn đ?‘Ž1 =đ?‘‹ ; media aritmĂŠtica



∑đ?‘˜đ?‘–=1 đ?‘‹ đ?‘– −đ?‘‹ đ?‘&#x; .đ?‘› đ?‘–

Momentos centrales de orden p respecto a la media aritmĂŠtica ďƒ đ?‘šđ?‘&#x; =

đ?‘

Sólo se ven afectados por los cambios de escala �0 = 1 �1 = 0 �2 = � 2

TRANSFORMACIONES LINEALES DE UNA VARIABLE ESTAD�STICA 

Dada una variable estadĂ­stica x una nueva variable estadĂ­stica y, serĂĄ una transformaciĂłn lineal de x cuando cada valor de y (đ?‘Śđ?‘– ) dependa de cada observaciĂłn de x (đ?‘Ľđ?‘– ) segĂşn una funciĂłn lineal, manteniĂŠndose la asignaciĂłn de frecuencias. r

mr(y) = b .mr(x) ďƒ comportamiento de los momentos centrales de orden r yi = a + b xi 

TipificaciĂłn canĂłnica ďƒ para comparar conjuntos de diferentes caracterĂ­sticas đ?‘Śâˆ’đ?‘‹ đ?‘?= đ?‘†đ?‘Ś Z=0 ďƒ 50% de la distribuciĂłn đ?‘?= 0 ďƒ media de la nueva variable DistribuciĂłn normal đ?‘†đ?‘§ = 1 ďƒ desviaciĂłn tĂ­pica de la nueva variable


MEDIDAS DE FORMA 

Medidas de asimetrĂ­a respecto a la media Momento central de orden impar≼3 (p=1 ďƒ se anula) ďƒ Depende de la unidades p impar ďƒ đ?‘šđ?‘? > 0 ďƒ la distribuciĂłn es asimĂŠtrica positiva p impar ďƒ đ?‘šđ?‘? = 0 ďƒ la distribuciĂłn es simĂŠtrica p impar ďƒ đ?‘šđ?‘? < 0 ďƒ la distribuciĂłn es asimĂŠtrica negativa Permite hacer comparaciones de carĂĄcter universal Momento central de tercer orden de la variable tifipicada: đ?‘”1 = đ?‘š3 (t) =



� 3 (�) ��3

Medidas de curtosis o apuntamiento Mayor o menor apuntamiento con independencia de la varianza Considerar momento central de orden 4 ďƒ đ?‘š4 =

∑đ?‘›đ?‘–=1 (đ?‘‹ đ?‘– −đ?‘‹ )4 .đ?‘› đ?‘– đ?‘

ďƒ depende de la unidades

Para la comparaciĂłn universal ďƒ momento de cuarto orden tipificado Comparar el apuntamiento de la distribuciĂłn con el de la distribuciĂłn normal (đ?‘š4 đ?‘Ą = 3) Coeficiente de curtosis ďƒ đ?‘”2 = đ?‘š4 đ?‘Ą − 3 =

� 4 (�) ��4

-3

đ?‘”2 > 0 ďƒ LeptocĂşrtica ďƒ MĂĄs apuntalada que la normal đ?‘”2 = 0 ďƒ MesocĂşrtica ďƒ Igual de apuntalada que la normal đ?‘”2 < 0 ďƒ PlaticĂşrtica ďƒ MĂĄs aplanada que la normal

MEDIDAS DE CONCENTRACIÓN Miden el mayor o menor grado de igualdad en el reparto de la totalidad de los valores de la variable Dos situaciones extremas: A. Igualdad en el reparto - Suponemos la distribución agrupada por intervalos -La proporción del monto total que se haya acumulado en el n intervalo es igual a la proporción sobre el total de los individuos que se lo reparten B. Måxima concentración - Sólo un individuo acumula el total del monto y el resto de los individuos no tienen nada 

Curva de Lorenz Suponemos la distribuciĂłn agrupada por intervalos đ?‘˘1 = đ?‘Ľ1 . đ?‘›1 ďƒ Monto acumulado en el primer intervaloďƒ đ?‘Ľ1 : marca de clase de cada intervalo o punto medio đ?‘˘2 = đ?‘Ľ1 . đ?‘›1 +đ?‘Ľ2 . đ?‘›2 ďƒ Monto acumulado hasta el segundo intervalo đ?‘˘3 = đ?‘Ľ1 . đ?‘›1 +đ?‘Ľ2 . đ?‘›2 + đ?‘Ľ3 . đ?‘›3 ďƒ Monto acumulado hasta el tercer intervalo đ?‘˘đ?‘› = ∑ đ?‘Ľđ?‘– . đ?‘›đ?‘– ďƒ Monto acumulado hasta el Ăşltimo intervalo đ?‘žđ?‘– = đ?‘?đ?‘– =

đ?‘˘đ?‘– đ?‘˘đ?‘› đ?‘ đ?‘– đ?‘

.100 ďƒ Porcentajes del monto total acumulados hasta cada intervalo .100 ďƒ Porcentaje de individuos que integran el intervalo sobre el total de individuos

Curva de Lorenz ďƒ GrĂĄfico de ejes coordenados en el que se representen los pares de puntos (qi , pi)

ďƒ MĂĄx igualdad en el reparto= MĂĄx homogeneidad ďƒ Curva de Lorenz = Coincide con la diagonal


−1 ∑𝑛𝑖=1 (𝑝 𝑖 −𝑞 𝑖 )

Índice de Gini 𝐼𝑔 =

−1 ∑𝑛𝑖=1 𝑝𝑖

Indicador numérico de la concentración Equivale al doble del área encerrada entre la curva de Lorenz y la diagonal 𝐼𝑔 =1; Máxima concentración 𝐼𝑔 =0; Máxima uniformidad

REPRESENTACIONES GRÁFICAS NOMINAL

DIAGRAMA DE BARRAS DIAGRAMA EN ESCALERA PICTOGRAMA DE SECTORES

ORDINAL DE INTERVALO DE RAZÓN

HISTOGRAMA POLÍGONO DIAGRAMA DE CAJAS Y BIGOTES DIAGRAMA ACUMULATIVO

ANÁLISIS ESTADÍSTICO DESCRIPTIVO Análisis de datos unidimensionales MEDIDAS DE POSICIÓN MEDIDAS DE NO CENTRAL TENDENCIA CENTRAL  MODA  MÍNIMO  MEDIANA  MÁXIMO  MEDIA  CUANTILES

MEDIDAS DE DISPERSIÓN          

RANGO RANGO INTERCUALTÍLICO DESVIACIÓN MEDIA CON RESPECTO DE LA MEDIANA DESVIACIÓN MEDIA CON RESPECTO DE LA MEDIA CUASI-VARIANZA VARIANZA DESVIACIÓN TÍPICA RECORRIDO SEMIINTERCUARTÍLICO ÍNDICE DE DISPERSIÓN RESPECTO DE LA MEDIANA COEFICIENTE DE VARIACIÓN DE PEARSON

http://www.uv.es/ceaces/base/descriptiva/Descrip1.htm http://www.uv.es/ceaces/

MEDIDAS DE FORMA 

COEFICIENTE DE ASIMETRÍA: MOMENTO DENTRAL DE TERCER ORDEN LA VARIABLE TIPIFICADA COEFICIENTE DE CURTOSIS: MOMENTO CENTRAL DE CUARTO ORDEN DE LA VARIABLE TIPIFICADA

MEDIDAS DE CONCENTRACIÓN ÍNDICE DE GINI


ďƒ¨ DistribuciĂłn normal/Gaussiana ďƒ˜ ďƒ˜

DistribuciĂłn de variable continua Queda especificada por dos parĂĄmetros de los que depende su funciĂłn de densidad La media: Âľ La desviaciĂłn tĂ­pica: Ďƒ

ďƒ˜ ďƒ˜

FunciĂłn de densidad de la distribuciĂłn normal general FunciĂłn de densidad de la distribuciĂłn tipificada SimĂŠtrica respecto a đ?‘?= 0 đ?‘?= 0; presenta un mĂĄximo đ?‘?=+ −1; presenta dos puntos de inflexiĂłn La distribuciĂłn normal reducida (tipificada) es una funciĂłn de distribuciĂłn de probabilidad FunciĂłn generatriz de momentos (F.G.M.) de la normal general y aplicar đ?‘‹ = đ?‘†. đ?‘? + đ?‘š

ďƒ˜ ďƒ˜

1

FGM de la normal general: đ?œ‘đ?‘§ đ?‘Ą = đ?‘’ đ?œ‡đ?‘Ą + 1

ďƒ˜ ďƒ˜ ďƒ˜

2 2 2đ?œŽ đ?‘Ą 2

FGM de la normal reducida: đ?œ‘đ?‘§ đ?‘Ą = đ?‘’ 2đ?‘Ą La media: el momento ordinario de primer orden La varianza: ďƒ đ?‘Ž2 : momento ordinario de segundo orden Coeficiente de asimetrĂ­a de la normal reducida o tipificada: đ?›ž1 đ?‘§ = đ?œ‡3 đ?‘§ = đ?‘Ž3 đ?‘§ = 0 Media=mediana: momento ordinario de tercer orden de la variable tipificada Coeficiente de curtosis: đ?›ž2 = đ?œ‡4 đ?‘§ − 3 = đ?‘Ž4 đ?‘§ − 3 = 0 Teorema de adiciĂłn Dado un conjunto de variables aleatorias normales independientes de distintas medias y distintas varianzas , la variable suma de todas ellas se distribuirĂĄ segĂşn una distribuciĂłn normal con media, la suma de las medias; y con varianza , la suma de las varianzas

ďƒ˜

Teorema fundamental de las distribuciones normales Cualquier combinaciĂłn lineal de variables aleatorias normales independientes es una variable aleatoria normal con media la misma combinaciĂłn lineal de las medias y con varianza la combinaciĂłn lineal de las varianzas con los coeficientes que las acompaĂąan al cuadrado

ďƒ˜

Distribuciones normales-transformadas Una variable aleatoria x sigue una distribuciĂłn normal-transformada si, no siendo ella misma normal, si lo es una cierta funciĂłn de ella donde el jacobiano


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.