Conceptos básicos de la estadística STA 2000
• La estadística es un lenguaje nuevo y poco conocido para la mayoría de las personas pero, al igual que cualquier idioma nuevo, la estadística puede parecer agobiante a primera vista. Pero, una vez aprendido y entendido el lenguaje de la estadística veremos que es una poderosa herramienta para el análisis de datos en numerosos y distintos campos de aplicación. (Mendenhall, 2015)
• La estadística se encuentra en casi todos los aspectos de nuestras vidas. Desde los sondeos de opinión hasta las pruebas clínicas en medicina; la estadística influye y da forma al mundo que nos rodea. • Por eso, para conocer y entender bien la estadística, debemos comenzar definiendo unos conceptos para más adelante presentar una visión general del proceso que conlleva la realización de un estudio estadístico. • Veamos…
• Estadística: Es la ciencia que se encarga de planear estudios y experimentos, obtener datos y luego organizar, resumir, presentar, analizar e interpretar esos datos para obtener conclusiones basadas en ellos. (Triola, 2018)
• Población: Es el conjunto completo de todos los individuos, las cosas o los eventos sobre los que se quiere investigar con respecto a una particularidad dada. A la población le correspondería la colección completa de datos, casi siempre imposible de elaborar por su tamaño u otras condiciones, sobre los cuales se harán inferencias. (Triola, 2018)
• Población finita: Está formada por un número finito de elementos que pueden contarse, del primero al último si es necesario. Deben referirse a una fecha específica para que tengan un significado real. (Rodríguez, 2014) • Población infinita: Se forma por un número de elementos que no pueden enumerarse en su totalidad, ya que no se conoce el último elemento que forma la población. (Rodríguez, 2014)
• Muestra: Es un subconjunto de miembros seleccionados de una población.(Triola, 2018) • Estadística descriptiva: Es la estadística que está formada por procedimientos empleados para resumir y describir las características importantes de un conjunto de mediciones. No obstante, podría ser demasiado costoso o llevaría demasiado tiempo enumerar toda la población. Por éstas y otras razones, usted puede tener sólo una muestra de la población. (Mendenhall, 2015)
• Estadística inferencial: Es la estadística que está formada por procedimientos empleados para hacer inferencias acerca de características poblacionales, a partir de información contenida en una muestra de la población. Su objetivo es hacer inferencias (es decir, obtener conclusiones, hacer predicciones, tomar decisiones) acerca de las características de una población a partir de información contenida en una muestra. (Mendenhall, 2015)
• Datos: Son el conjunto de observaciones como mediciones, géneros o respuestas de encuestas. (Triola, 2018)
• Dato estadístico: Es una medición numérica que describe algunas características de una muestra. (Triola, 2018) • Parámetro: Es una medición numérica que describe algunas características de una población. (Triola, 2018)
• Variable: Es una característica que cambia o varía con el tiempo o para diferentes personas u objetos en estudio. (Mendenhall, 2015) • Los datos categóricos (o cualitativos o de atributo) consisten en nombres o etiquetas (no números que representan conteos o mediciones). (Triola, 2018) • Los datos cuantitativos (o numéricos) consisten en números que representan conteos o mediciones. (Triola, 2018)
• Los datos cuantitativos se dividen en discretos, que son los que resultan cuando el número de valores es finito –cuando “puede contarse”– (si hay una infinidad de valores, la colección de valores puede contarse si es posible contabilizarlos individualmente, como el número de lanzamientos de una moneda antes de obtener una cruz). (Triola, 2018) • Los datos continuos (numéricos) resultan de una cantidad infinita de valores cuantitativos posibles, en los que la colección de valores no puede contarse. Es decir, es imposible contar los elementos individuales porque al menos algunos de ellos están en una escala continua, como las longitudes de las distancias entre 0 y 12 cm. (Triola, 2018)
• Otra forma común de clasificar datos es usar cuatro niveles de medición: nominal, ordinal, de intervalo y de razón, que se definen a continuación. Cuando se aplica la estadística a problemas reales, el nivel de medición de los datos ayuda a decidir qué procedimiento debe utilizarse. (Triola, 2018) • El nivel nominal de medición se caracteriza por datos que consisten únicamente en nombres, etiquetas o categorías. Los datos no se pueden organizar en algún orden (por ejemplo, de bajo a alto). (Triola, 2018)
• Los datos están en el nivel de medición ordinal si pueden colocarse en cierto orden, pero las diferencias (obtenidas por sustracción) entre los valores de los datos no se pueden determinar o carecen de significado. (Triola, 2018) • Los datos están en un nivel de medición de intervalo si se pueden poner en orden y es posible encontrar diferencias significativas entre los valores de los datos. Los datos en este nivel no tienen un punto de inicio cero natural en el que no hay ninguna cantidad presente. (Triola, 2018)
• Los datos tienen un nivel de medición de razón si se pueden poner en orden, es posible encontrar diferencias significativas, y hay un punto de inicio cero natural (donde cero indica que no hay ninguna cantidad presente). Para los datos con este nivel, las diferencias y las razones son significativas. (Triola, 2018)
Triola, 2018)
(
• Fuentes de datos: Se refiere a la procedencia de los datos. Es necesario considerar si esa fuente es objetiva, o si existe alguna razón para pensar que está sesgada o equivocada. Inventar datos o resultados es una falta evidente de ética.
• Experimento: Es cualquier proceso que proporciona datos, numéricos o no numéricos. • Registro: Es un conjunto de datos que pertenecen a una misma tabla y que se ubican en diferentes columnas (campos), según su tipo.
• Encuesta: Es un instrumento organizado para conocer o encontrar hechos, es decir, proporciona datos que son necesarios para la investigación. • No debe ser larga para que el entrevistado no pierda el interés. • No debe omitir preguntas importantes.
• No debe tener redacciones confusas. • No debe usar tecnicismos, sin haberse definido con anterioridad. (Rodríguez, 2014)
• Muestreo: Cuando se utiliza la estadística en un estudio, la planificación es muy importante y resulta esencial utilizar un método apropiado para recopilar los datos muestrales o o usar un muestreo.
• Si los datos muestrales no se recopilan de manera apropiada, pueden ser tan inútiles que ni la aplicación de innumerables trucos estadísticos pueda rescatarlos. (Triola, 2018)
• Una muestra aleatoria simple de n sujetos se selecciona de modo que cada muestra posible del mismo tamaño n tiene la misma posibilidad de ser elegida. (Con frecuencia, una muestra aleatoria simple se denomina muestra aleatoria, pero en sentido estricto una muestra aleatoria tiene el requisito más débil de que todos los miembros de la población tengan la misma posibilidad de ser seleccionados. (Triola, 2018)
• En el muestreo sistemático, seleccionamos un punto de inicio y luego elegimos cada k-ésimo (por ejemplo cada quincuagésimo) elemento de la población. • Con el muestreo por comodidad, de conveniencia o sin norma, simplemente utilizamos los datos que son muy fáciles de obtener. (Triola, 2018)
• En el muestreo estratificado, subdividimos la población en al menos dos subgrupos diferentes (o estratos) de modo que los sujetos dentro del mismo subgrupo compartan las mismas características (como el género). Luego, se extrae una muestra de cada subgrupo (o estrato). (Triola, 2018) • En el muestreo por conglomerados, primero dividimos el área de la población en secciones (o conglomerados). Después seleccionamos aleatoriamente algunos de esos grupos y elegimos todos los miembros de los grupos seleccionados. (Triola, 2018)
(Triola, 2018)
• Estudio por observación: • Estudio transversal, los datos se observan, se miden y se recolectan en un momento dado, no durante un período determinado. (Triola, 2018) • Estudio retrospectivo (o de control de caso), se recolectan datos correspondientes a un periodo del pasado (a través del análisis de registros, entrevistas, etcétera). (Triola, 2018) • Estudio prospectivo (o longitudinal o de cohorte), los datos se recolectan en el futuro a partir de grupos que comparten factores comunes (estos grupos se denominan cohortes). (Triola, 2018)
(Triola, 2018)