ESTADÍSTICOS Rcmdr http://uce.uniovi.es/CURSOICE/Informese4.html#tailInformese4.html MENÚS DATOS Y MODELOS ACTIVOS
VENTANA DE INTRUCCIONES
VENTANA DE RESULTADOS
MENSAJES
MENÚ DATOS NUEVO CONJUNTO DE DATOS Crear a mano y activar un nuevo conjunto CARGAR CONJUNTO DE DATOS abrir fichero *.rda IMPORTAR DATOS Texto puro/SPSS/Minitab/STATA/Excel/Access
MENÚ ESTAD�STICOS RESÚMENES CONJUNTO DE DATOS ACTIVOS   
MĂn./MĂĄx, m, me, 1Âş cuartil, 3Âş cuartil Variables cuantitativas (descriptivos) Variables cualitativas (frecuencias absolutas)
RESÚMENES NUMÉRICOS 


Tabla con los estadĂstico m, me, DT Para comparar varias variables


TABLA DE ESTAD�STICAS 
Los mismos estadĂsticos que en la pestaĂąa conjunto de datos activos DistribuciĂłn tĂpica (DT)
DISTRIBUCIĂ“N DE FREC.
MATRIZ DE CORRELACIONES 
Calcula las matrices de correlaciones de Pearson o de Spearman entre las variables seleccionadas
Para calcular las frecuencias de los casos observados en una variable categĂłrica Bondad de ajuste (đ?‘‹ 2 ) para una variable TEST DE CORRELACIĂ“N


Contraste para la asociaciĂłn entre variables emparejadas Se pueden calcular distintos coeficientes: Pearson;Tau de Kendall;Rho de Spearman

NÂş DE OBSERVACIONES AUSENTES Se muestra el nĂşmero de observaciones ausentes por cada variable
TEST DE NORMALIDAD DE SHAPIRO-WILK  Realiza el contraste de normalidad de ShapiroWilk  La salida serĂĄ el valor del estadĂstico y el correspondiente P-valor
TABLAS DE CONTINGENCIA Permite hallar las frecuencias de la distribución conjunta de dos variables categóricas. Es decir, el número de casos en que se manifiestan simultåneamente cada combinación de valores de cada variable. TABLA DE DOBLE ENTRADA 
TambiĂŠn se puede calcular đ?‘‹ 2 del contraste de independencia de homogeneidad
TABLA DE ENTRADAS MÚLTIPLES 
Construir tablas para la distribuciĂłn de frecuencias conjunta de tres o mĂĄs variables
INTRODUCIR Y ANALIZAR UNA TABLA DE DOBLE ENTRADA  Los estadĂsticos utilizados en el anĂĄlisis de la tabla introducida son el cĂĄlculo de porcentajes y test de hipĂłtesis: - đ?‘‹2 - Frecuencias esperadas - T exacto de Fisher
MEDIAS TEST t PARA UNA MUESTRA 
Para hacer contrastes de hipĂłtesis para la media de una variable cuantitativa con distribuciĂłn normal - Tipo de contraste: bilateral(igualdad)/unilaterales (menor/mayor) - Valor de la media bajo đ??ť0 - Nivel de confianza para el intervalo de estimaciĂłn
TEST t PARA MUESTRAS INDEPEENDIENTES  Realiza un contraste de hipótesis de igualdad de medias entre dos muestras  Depende de la homoscedasticidad en las dos muestras (igualdad de varianzas) - Variable cuantitativa - Variable dicotómica (cualitativa o factor) con sólo dos modalidades que indique los dos grupos (por ej. sexo)

TEST t PARA DATOS EMPAREJADOS Para contrastar dos variables en que los datos se suponen relacionados como al comparar dos variables observadas sobre los mismos individuos
ANOVA DE UN FACTOR  

AnĂĄlisis de varianza Contrastar la igualdad de medias en varias muestras independientes mediante un anĂĄlisis de varianza ÂżLas muestras son independientes?
VARIANZAS 
TEST F PARA DOS VARIANZAS Realiza un contraste F para comparar la varianza de dos muestras, suponiendo que la variable sigue una distribuciĂłn normal

TEST DE BARTLETT Es similar a la prueba F de Snedecor pero permite contrastar mĂĄs de dos muestras independientes
TEST NO PARAMÉTRICOS 
TEST DE WILCOXON PARA DOS MUESTRAS Contraste no paramĂŠtrico correspondiente al contraste t de medias

TEST DE KRUSKALL-WALLIS Contraste no paramĂŠtrico correspondiente al contraste de igualdad de medias de dos o mĂĄs poblaciones
ANà LISIS DIMENSIONAL 
ANĂ LISIS DE AGRUPACIĂ“N JERĂ RQUICA Para agrupar variables en una nueva y realizar el correspondiente dendrograma

AGREGAR LA AGRUPACIĂ“N JERĂ RQUICA Agregar la agrupaciĂłn jerĂĄrquica al conjunto de datos
AJUSTE DE MODELOS Cómo construir modelos de regresión lineal para los datos 
REGRESIĂ“N LINEAL Una vez fijadas la variable por explicar y todas las variables explicativas, el programa calcula el valor de los coeficientes y realiza una primera evaluaciĂłn del ajuste

MODELO LINEAL En este modelo se pueden incorporar tambiĂŠn variables categĂłricas
MENĂš MODELOS Herramientas bĂĄsicas para la evaluaciĂłn de modelos estadĂsticos RESUMIR EL MODELO 
Muestra las caracterĂsticas bĂĄsicas del modelo - FĂłrmula del modelo - Coeficientes para cada variable explicativa: Coeficiente/DesviaciĂłn tĂpica/Valor estadĂstico t/P-valor - InformaciĂłn sobre el ajuste: đ?‘… 2 /F y su P-valor
SELECCIÓN DEL MODELO PASO A PASO
Refinar un modelo con distintos procedimientos - Probar a quitar y a añadir variables a un modelo ya existente - Evaluar los efectos de dichos cambios y elegir qué variables mantener y cuáles omitir Para la evaluación de la bondad del ajuste - BIC: criterio de información bayesiano - AIC: criterio de información de akaike Técnicas para quitar/añadir variables - Atrás/adelante - Adelante/atrás: Arranca el modelo sin variables explicativas y va añadiendo una a una las variables hasta que quede con el mejor ajuste - Atrás - Adelante
GRÁFICAS BÁSICAS DE DIAGNÓSTICO 1.
RESIDUOS FRENTE A AJUSTADOS Para detectar heteroscedasticidad/falta de independencia/ falta de linealidad Representa los residuos (diferencias entre el valor real y el valor ajustado o predicho) frente a los valores ajustados Si la regresión es simple, sería equivalente a un gráfico de residuos frente a la variable independiente Los valores atípico están muy por encima o por debajo de la recta horizontal
2.
RESIDUOS TIPIFICADOS FRENTE A CUANTILES TEÓRICOS DE UNA DISTRIBUCIÓN GAUSSIANA Una hipótesis de los modelos de regresión es que los residuos tienen distribución normal El gráfico cuantil-cuantil sirve para diagnosticar el cumplimiento de la hipótesis Todos los puntos estarán en la línea recta si se cumple
3.
ESCALA-POSICIÓN: RAÍZ DE VALOR ABSOLUTO DE RESIDUO FRENTE A VALORES AJUSTADOS Facilita el diagnóstico de la homoscedasticidad Dificulta la diagnosis de linealidad Toma el valor absoluto para compara la magnitud del residuo independientemente del sentido arriba/abajo Se toma la raíz cuadrada para disminuir la asimetría
4.
RESIDUOS TIPIFICADOS FRENTE A PALANCAJE El palancaje es una medida de la influencia que tiene un punto en el cálculo de los coeficientes del modelo Se basa en las aportaciones del punto a las varianzas de las variables independientes Los puntos a la derecha de la gráfica tienen gran palancaje - Poseen una influencia notable si el residuo correspondiente se separa mucho del cero - Se considera muy influyente si supera la distancia de Cook igual a uno
MENÚ GRÁFICAS DIAGRAMA DE CAJA
Diagrama de cajas y bigotes para una variable cuantitativa Diagrama de cajas y bigotes para variables cuantitativas segmentadas con respecto a otras variables categóricas
HISTOGRAMA
Construir histogramas para variables numéricas Comandos R para añadir etiquetas de las variables y del título La etiqueta que llevará el eje horizontal
Título
Hist (Turisguay$gasdia, main=~Gasto total diario~, xlab=~Euros~, ylab=~Porcentajes (%)~, scale=~percent~, breaks=~Sturgas~, col=~darkgray~)
La etiqueta que llevará el eje vertical
GRÁFICA DE BARRAS
Para representar las frecuencias de las variables categóricas/ordinales
MENÚ DATOS
FILTRAR EL CONJUNTO DE DATOS ACTIVO - Para restringir la base de datos a un subconjunto de casos que cumplen una determinada condición ELIMINAR LOS CASOS CON VALORES OMITIDOS GUARDAR EL CONJUNTO DE DATOS ACTIVO RECODIFICAR VARIABLES - Transformar una variable numérica/categórica en una categórica CALCULAR UNA NUEVA VARIABLE CONVERTIR VARIABLE NUMÉRICA UN FACTOR - Para convertir una variable numérica en variable categórica SEGMENTAR VARIABLE NUMÉRICA - Obtener una variable categórica a partir de los valores numéricos de la variable REORDENAR NIVELES DE UN FACTOR - Reordenar las categorías de variables categóricas - Para presentar un gráfico con barras RENOMBRAR-ELIMINAR VARIABLES