1. Clarificación conceptual
Estadística censal =/= estadística muestral Diversidad = varianza normal Pronósitico probabilístico: estimación Muestra: ¿Representativa de la población objetivo? Instrumentos de medida: - Tests -
Cuestionarios
-
-
Hipótesis deductivas: fundamentadas en la revisión teórica de la literatura Hipótesis inductivas: surgen de las observaciones o reflexiones
Científicas/estadísticas
Objetivos Descripción superficial de la respuesta Conjunto de preguntas dicotómicas: si/no
Técnicas de análisis de datos (qué trabajaremos en los seminarios) - AF confirmatorio - AF exploratorio - Análisis dimensional de los instrumentos de medida Las hipótesis: - Deductivas/inductivas
Para medir un rasgo concreto, constructo o dimensión Tipo Likert
Inventarios
Cuestiones más generales: hábitos, actitudes…
Escalas
-
Subjetivos Ítems de respuesta cerrada: verdadero/falso, bien/mal
Hipótesis científicas: descriptivas/correlacionales/diferencia de grupos/causales Hipótesis estadísticas Nula H0: X1-X2=0 Se pone a comprobación No hay diferencias entre los grupos AlternativaH1: X1-X2≠0 Diferencias estadísticamente significativas
Constructo: abstracciones mentales del ámbito psicológico. Es la idea no observable que subyace al conjunto de valores. Siempre que medimos dos errores - El error de medición de la escala hay que fijar siempre el error del instrumento - El error del observador al observar Centro de distribución de datos: Punto de equilibrio o centro del conjunto de datos Representación de grupos de observaciones Medida o parámetro de tendencia central/centralización -
Mediana Media Moda
2. Importancia de la delimitación del objeto de investigación
Tesis limitaciones del estudio Qué instrumentos puedo/voy a utilizar Acotarlo
Modelo de tres pasos o en cascada para definir el objeto de investigación
…
FACTOR 1
VARIABLE 1
…
OBJETO DE ESTUDIO
Atención
Intrínseca Motivación
Un conjunto de indicadores medibles Puntajes
INDICADOR 1
Le ampliar conocimientos
Extrínseca
3. La descripción univariada: gráficos y coeficientes principales
Tipo de escalas (instrumentos de medida) Todas las escalas son subconjuntos de la anterior
A
B
C
A.
ESCALAS NOMINALES o Clasifican o Los objetos son iguales o diferentes a=b, a≠b o La forma más sencilla de aproximarse a la realidad o Observar categorizar clasificar o Sexo (biológico)= mujer o hombre
B.
ESCALAS ORDINALES o Ordenan o Operaciones posibles: a≤b, a≥b y las operaciones anteriores
C.
ESCALAS DE INTERVALO o Las distancias están graduadas o Las proporciones se conservan relación lineal o Operaciones posibles: a+b, a-b y las operaciones anteriores o No tiene cero o Utilizamos medidas relativas y ponemos cero por convención o Ej. escalas de inteligencia
D.
ESCALAS DE RAZÓN o Establecen proporciones o Tiene cero o Ej. temperatura
MEDIANA
MEDIA
MODA
En las ciencias sociales las escalas son nominales u ordinaels (Se manipulan las escalas ordinales como si fueran de intervalo)
D
Mediana, media y moda
MEDIANA
Uso en escalas Ordinales De intervalo De razón Representa a la mayoría Error absoluto Valores outsiders no influyen Es más precisa para representar la centralidad de un conjunto de datos, si hay valores extremos
MEDIA
Uso en escalas De intervalo De razón Representa a todos los datos Error cuadrático Valores outsiders influyen Es más precisa para representar la centralidad de un conjunto de datos, si no hay valores outsiders No debería utilizarse en ciencias sociales, ya que sólo utilizarían escalas nominales y ordinales
MODA
Uso en todas las escalas pero especialmente en nominales Representativo de la moda Muy sensible a variaciones muestrales No siempre se sitúa hacia el centro de la distribución
PERCENTIL MEDIANA
MEDIDAS DE POSICIĂ“N
CUANTILES: PERCENTILES,CUARTILES, DECILES Centiles: Percentiles: P1, P2‌P99 Q1: P25. Cuartil primero. Deja el 25% de los valores por debajo Q2: P50: Md (mediana). Cuartil segundo. Deja la mitad de los valores por encima y por debajo Q3: P75. Cuartil tercero Deciles: P10, P20‌P90 Cuantiles pertenecen a nĂşmeros reales ďƒ es posible P19,3
+ Ăndice de posiciĂłn + Ăndice de distribuciĂłn
Para caracterizar un grupo de datos son necesarios:
MEDIDAS DE DISPERSIĂ“N O VARIABILIDAD ABSOLUTAS Distancia de cada valor respecto a la medida de tendencia central DISPERSIĂ“N DE LA DISTRIBUCIĂ“N ďƒ VARIABILIDAD ďƒ Se mide con la varianza 
Recorrido/rango: R = xn - x1

Recorrido/rango intercuartĂlico: RI = Q3 - Q 1

Medida de dispersiĂłn en valor absoluto ďƒ Mediana Median absolute deviation: masa total de desviaciĂłn respecto a la mediana DesviaciĂłn absoluta respecto a la mediana: ∑│Xi -Md│ DesviaciĂłn media con respecto a la mediana: ∑
Escalas nominales y ordinales
│Xi −Md│ n
Medida de dispersiĂłn en valor absoluto ďƒ Media DesviaciĂłn absoluta respecto a la media: ∑│Xi-X│ DesviaciĂłn media con respecto a la media: ∑

│Xi−X │ n
Medida al cuadrado ďƒ Media Variabilidad cuadrĂĄtica: ∑(Xi- X)2 Varianza: đ?‘† 2 = ∑
(Xi− X )2 n
ďƒ alterando el sentido de la medida 2
DesviaciĂłn tĂpica o estĂĄndar: S= đ?‘† = ∑ Cuasi-varianza: đ?‘†n2−1 = ∑
(Yi− Y )2 n−1
2
(Xi− X) n
mejor indicador de la variabilidad global de la distribuciĂłn
ďƒ mejor indicador para muestras/grupos
RelaciĂłn entre varianza y cuasi-varianza:
2 đ?‘› − 1 đ?‘†đ?‘›âˆ’1 = đ?‘› đ?‘†đ?‘›2
MEDIDAS DE DISPERSIÓN RELATIVAS para que no afecten las unidades de medida de la variable y para que puedan hacerse comparaciones entre las dispersiones de conjuntos de datos dispares 
Recorrido semi-intercuartĂlico: Rs = Q3-Q1/(Q3+Q1)

Ă?ndice de dispersiĂłn respecto a la mediana: VMe = D/Me

Coeficiente de variación de Pearson: � = �0 =
Escalas nominales y ordinales
� �
MOMENTOS DE UNA DISTRIBUCIÓN 

Indicadores genĂŠricos de una distribuciĂłn Dos distribuciones son iguales, si tienen todos sus momentos iguales, y son tanto mĂĄs parecidas cuanto mayor sea el nĂşmero de momentos iguales que tengan RelaciĂłn entre momentos ordinarios y centrales ďƒ đ?‘šđ?‘&#x; = (a − đ?‘Ľ )(đ?‘&#x;)

Momentos ordinarios respecto al origen ďƒ đ?‘Žđ?‘&#x; =

∑đ?‘˜đ?‘–=1 đ?‘‹đ?‘–đ?‘&#x; .đ?‘› đ?‘– đ?‘
Se ven afectados por los cambios de origen y de escala (unidad) en los valores de la variable đ?‘Ž0 =1 para cualquier distribuciĂłn đ?‘Ž1 =đ?‘‹ ; media aritmĂŠtica

∑đ?‘˜đ?‘–=1 đ?‘‹ đ?‘– −đ?‘‹ đ?‘&#x; .đ?‘› đ?‘–
Momentos centrales de orden p respecto a la media aritmĂŠtica ďƒ đ?‘šđ?‘&#x; =
đ?‘
Sólo se ven afectados por los cambios de escala �0 = 1 �1 = 0 �2 = � 2
TRANSFORMACIONES LINEALES DE UNA VARIABLE ESTAD�STICA 
Dada una variable estadĂstica x una nueva variable estadĂstica y, serĂĄ una transformaciĂłn lineal de x cuando cada valor de y (đ?‘Śđ?‘– ) dependa de cada observaciĂłn de x (đ?‘Ľđ?‘– ) segĂşn una funciĂłn lineal, manteniĂŠndose la asignaciĂłn de frecuencias. r
mr(y) = b .mr(x) ďƒ comportamiento de los momentos centrales de orden r yi = a + b xi 
TipificaciĂłn canĂłnica ďƒ para comparar conjuntos de diferentes caracterĂsticas đ?‘Śâˆ’đ?‘‹ đ?‘?= đ?‘†đ?‘Ś Z=0 ďƒ 50% de la distribuciĂłn đ?‘?= 0 ďƒ media de la nueva variable DistribuciĂłn normal đ?‘†đ?‘§ = 1 ďƒ desviaciĂłn tĂpica de la nueva variable
MEDIDAS DE FORMA 
Medidas de asimetrĂa respecto a la media Momento central de orden imparâ&#x2030;Ľ3 (p=1 ď&#x192; se anula) ď&#x192; Depende de la unidades p impar ď&#x192; đ?&#x2018;&#x161;đ?&#x2018;? > 0 ď&#x192; la distribuciĂłn es asimĂŠtrica positiva p impar ď&#x192; đ?&#x2018;&#x161;đ?&#x2018;? = 0 ď&#x192; la distribuciĂłn es simĂŠtrica p impar ď&#x192; đ?&#x2018;&#x161;đ?&#x2018;? < 0 ď&#x192; la distribuciĂłn es asimĂŠtrica negativa Permite hacer comparaciones de carĂĄcter universal Momento central de tercer orden de la variable tifipicada: đ?&#x2018;&#x201D;1 = đ?&#x2018;&#x161;3 (t) =
ď&#x201A;§
đ?&#x2018;&#x161; 3 (đ?&#x2018;Ľ) đ?&#x2018;&#x2020;đ?&#x2018;Ľ3
Medidas de curtosis o apuntamiento Mayor o menor apuntamiento con independencia de la varianza Considerar momento central de orden 4 ď&#x192; đ?&#x2018;&#x161;4 =
â&#x2C6;&#x2018;đ?&#x2018;&#x203A;đ?&#x2018;&#x2013;=1 (đ?&#x2018;&#x2039; đ?&#x2018;&#x2013; â&#x2C6;&#x2019;đ?&#x2018;&#x2039; )4 .đ?&#x2018;&#x203A; đ?&#x2018;&#x2013; đ?&#x2018;
ď&#x192; depende de la unidades
Para la comparaciĂłn universal ď&#x192; momento de cuarto orden tipificado Comparar el apuntamiento de la distribuciĂłn con el de la distribuciĂłn normal (đ?&#x2018;&#x161;4 đ?&#x2018;Ą = 3) Coeficiente de curtosis ď&#x192; đ?&#x2018;&#x201D;2 = đ?&#x2018;&#x161;4 đ?&#x2018;Ą â&#x2C6;&#x2019; 3 =
đ?&#x2018;&#x161; 4 (đ?&#x2018;&#x2039;) đ?&#x2018;&#x2020;đ?&#x2018;Ľ4
-3
đ?&#x2018;&#x201D;2 > 0 ď&#x192; LeptocĂşrtica ď&#x192; MĂĄs apuntalada que la normal đ?&#x2018;&#x201D;2 = 0 ď&#x192; MesocĂşrtica ď&#x192; Igual de apuntalada que la normal đ?&#x2018;&#x201D;2 < 0 ď&#x192; PlaticĂşrtica ď&#x192; MĂĄs aplanada que la normal
MEDIDAS DE CONCENTRACIĂ&#x201C;N Miden el mayor o menor grado de igualdad en el reparto de la totalidad de los valores de la variable Dos situaciones extremas: A. Igualdad en el reparto - Suponemos la distribuciĂłn agrupada por intervalos -La proporciĂłn del monto total que se haya acumulado en el n intervalo es igual a la proporciĂłn sobre el total de los individuos que se lo reparten B. MĂĄxima concentraciĂłn - SĂłlo un individuo acumula el total del monto y el resto de los individuos no tienen nada ď&#x201A;§
Curva de Lorenz Suponemos la distribuciĂłn agrupada por intervalos đ?&#x2018;˘1 = đ?&#x2018;Ľ1 . đ?&#x2018;&#x203A;1 ď&#x192; Monto acumulado en el primer intervaloď&#x192; đ?&#x2018;Ľ1 : marca de clase de cada intervalo o punto medio đ?&#x2018;˘2 = đ?&#x2018;Ľ1 . đ?&#x2018;&#x203A;1 +đ?&#x2018;Ľ2 . đ?&#x2018;&#x203A;2 ď&#x192; Monto acumulado hasta el segundo intervalo đ?&#x2018;˘3 = đ?&#x2018;Ľ1 . đ?&#x2018;&#x203A;1 +đ?&#x2018;Ľ2 . đ?&#x2018;&#x203A;2 + đ?&#x2018;Ľ3 . đ?&#x2018;&#x203A;3 ď&#x192; Monto acumulado hasta el tercer intervalo đ?&#x2018;˘đ?&#x2018;&#x203A; = â&#x2C6;&#x2018; đ?&#x2018;Ľđ?&#x2018;&#x2013; . đ?&#x2018;&#x203A;đ?&#x2018;&#x2013; ď&#x192; Monto acumulado hasta el Ăşltimo intervalo đ?&#x2018;&#x17E;đ?&#x2018;&#x2013; = đ?&#x2018;?đ?&#x2018;&#x2013; =
đ?&#x2018;˘đ?&#x2018;&#x2013; đ?&#x2018;˘đ?&#x2018;&#x203A; đ?&#x2018; đ?&#x2018;&#x2013; đ?&#x2018;
.100 ď&#x192; Porcentajes del monto total acumulados hasta cada intervalo .100 ď&#x192; Porcentaje de individuos que integran el intervalo sobre el total de individuos
Curva de Lorenz ď&#x192; GrĂĄfico de ejes coordenados en el que se representen los pares de puntos (qi , pi)
ď&#x192; MĂĄx igualdad en el reparto= MĂĄx homogeneidad ď&#x192; Curva de Lorenz = Coincide con la diagonal
−1 ∑𝑛𝑖=1 (𝑝 𝑖 −𝑞 𝑖 )
Índice de Gini 𝐼𝑔 =
−1 ∑𝑛𝑖=1 𝑝𝑖
Indicador numérico de la concentración Equivale al doble del área encerrada entre la curva de Lorenz y la diagonal 𝐼𝑔 =1; Máxima concentración 𝐼𝑔 =0; Máxima uniformidad
REPRESENTACIONES GRÁFICAS NOMINAL
DIAGRAMA DE BARRAS DIAGRAMA EN ESCALERA PICTOGRAMA DE SECTORES
ORDINAL DE INTERVALO DE RAZÓN
HISTOGRAMA POLÍGONO DIAGRAMA DE CAJAS Y BIGOTES DIAGRAMA ACUMULATIVO
ANÁLISIS ESTADÍSTICO DESCRIPTIVO Análisis de datos unidimensionales MEDIDAS DE POSICIÓN MEDIDAS DE NO CENTRAL TENDENCIA CENTRAL MODA MÍNIMO MEDIANA MÁXIMO MEDIA CUANTILES
MEDIDAS DE DISPERSIÓN
RANGO RANGO INTERCUALTÍLICO DESVIACIÓN MEDIA CON RESPECTO DE LA MEDIANA DESVIACIÓN MEDIA CON RESPECTO DE LA MEDIA CUASI-VARIANZA VARIANZA DESVIACIÓN TÍPICA RECORRIDO SEMIINTERCUARTÍLICO ÍNDICE DE DISPERSIÓN RESPECTO DE LA MEDIANA COEFICIENTE DE VARIACIÓN DE PEARSON
http://www.uv.es/ceaces/base/descriptiva/Descrip1.htm http://www.uv.es/ceaces/
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRÍA: MOMENTO DENTRAL DE TERCER ORDEN LA VARIABLE TIPIFICADA COEFICIENTE DE CURTOSIS: MOMENTO CENTRAL DE CUARTO ORDEN DE LA VARIABLE TIPIFICADA
MEDIDAS DE CONCENTRACIÓN ÍNDICE DE GINI
ď&#x192;¨ DistribuciĂłn normal/Gaussiana ď&#x192;&#x2DC; ď&#x192;&#x2DC;
DistribuciĂłn de variable continua Queda especificada por dos parĂĄmetros de los que depende su funciĂłn de densidad La media: Âľ La desviaciĂłn tĂpica: Ď&#x192;
ď&#x192;&#x2DC; ď&#x192;&#x2DC;
FunciĂłn de densidad de la distribuciĂłn normal general FunciĂłn de densidad de la distribuciĂłn tipificada SimĂŠtrica respecto a đ?&#x2018;?= 0 đ?&#x2018;?= 0; presenta un mĂĄximo đ?&#x2018;?=+ â&#x2C6;&#x2019;1; presenta dos puntos de inflexiĂłn La distribuciĂłn normal reducida (tipificada) es una funciĂłn de distribuciĂłn de probabilidad FunciĂłn generatriz de momentos (F.G.M.) de la normal general y aplicar đ?&#x2018;&#x2039; = đ?&#x2018;&#x2020;. đ?&#x2018;? + đ?&#x2018;&#x161;
ď&#x192;&#x2DC; ď&#x192;&#x2DC;
1
FGM de la normal general: đ?&#x153;&#x2018;đ?&#x2018;§ đ?&#x2018;Ą = đ?&#x2018;&#x2019; đ?&#x153;&#x2021;đ?&#x2018;Ą + 1
ď&#x192;&#x2DC; ď&#x192;&#x2DC; ď&#x192;&#x2DC;
2 2 2đ?&#x153;&#x17D; đ?&#x2018;Ą 2
FGM de la normal reducida: đ?&#x153;&#x2018;đ?&#x2018;§ đ?&#x2018;Ą = đ?&#x2018;&#x2019; 2đ?&#x2018;Ą La media: el momento ordinario de primer orden La varianza: ď&#x192; đ?&#x2018;&#x17D;2 : momento ordinario de segundo orden Coeficiente de asimetrĂa de la normal reducida o tipificada: đ?&#x203A;ž1 đ?&#x2018;§ = đ?&#x153;&#x2021;3 đ?&#x2018;§ = đ?&#x2018;&#x17D;3 đ?&#x2018;§ = 0 Media=mediana: momento ordinario de tercer orden de la variable tipificada Coeficiente de curtosis: đ?&#x203A;ž2 = đ?&#x153;&#x2021;4 đ?&#x2018;§ â&#x2C6;&#x2019; 3 = đ?&#x2018;&#x17D;4 đ?&#x2018;§ â&#x2C6;&#x2019; 3 = 0 Teorema de adiciĂłn Dado un conjunto de variables aleatorias normales independientes de distintas medias y distintas varianzas , la variable suma de todas ellas se distribuirĂĄ segĂşn una distribuciĂłn normal con media, la suma de las medias; y con varianza , la suma de las varianzas
ď&#x192;&#x2DC;
Teorema fundamental de las distribuciones normales Cualquier combinaciĂłn lineal de variables aleatorias normales independientes es una variable aleatoria normal con media la misma combinaciĂłn lineal de las medias y con varianza la combinaciĂłn lineal de las varianzas con los coeficientes que las acompaĂąan al cuadrado
ď&#x192;&#x2DC;
Distribuciones normales-transformadas Una variable aleatoria x sigue una distribuciĂłn normal-transformada si, no siendo ella misma normal, si lo es una cierta funciĂłn de ella donde el jacobiano