17 minute read
3.4. TAMAÑO DE LA MUESTRA
Dra. Cristina Esquinas López
INTRODUCCIÓN
Todo estudio epidemiológico lleva implícito, en la fase de diseño, la determinación del tamaño muestral necesario para la ejecución del mismo. No realizar dicho proceso puede conducir a dos situaciones diferentes. La primera es que se realice el estudio sin el número adecuado de pacientes, con lo cual no se podrá ser preciso al estimar los parámetros y además no se encontrarán diferencias signifi cativas cuando en realidad sí existen. La segunda es que la inclusión de un número excesivo de sujetos encarece el estudio tanto desde el punto de vista económico como de los recursos humanos y físicos. Además, puede ser considerado poco ético, ya que un mayor número de pacientes estará sometido innecesariamente a determinadas exploraciones o recibirá la intervención menos efi caz.
Para determinar el tamaño muestral de un estudio, deben considerar diferentes situaciones:
(a) Estudios para determinar parámetros, es decir, cuando se pretende hacer inferencias de valores poblacionales (proporciones, medias…) a partir de una muestra. Por ejemplo, el porcentaje de pacientes con
EPOC que hayan presentado agudizaciones en el año previo). (b) Estudios para contraste de hipótesis, es decir, cuando se pretende comparar si las proporciones o las medias de dos o más muestras o grupos son diferentes. Por ejemplo, evaluar cuál de dos pautas terapéuticas consigue un mayor porcentaje de éxitos).
El resultado del cálculo debe considerarse como orientativo, ya que se basa en asunciones que pueden ser incorrectas.
ESTIMACIÓN DE PARÁMETROS
Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra.
Es importante reconocer que puede existir un error de muestreo en función de la muestra seleccionada. Así, si se desea estimar el valor medio de glucosa en sangre en una población, se escoge una muestra de 100 sujetos en los que se observa una media de 95 mg/dL, con una desviación estándar de 10 mg/dL. Si se hubiera
estudiado una muestra diferente, seguramente se habrían obtenido cifras distintas aunque los criterios de selección hubiesen sido los mismos. Por lo tanto, a partir del valor observado en una única muestra no puede conocerse exactamente el verdadero valor en la población de origen, ya que es tan sólo una aproximación (estimación puntual).
Para conocer entre qué límites es más probable que se sitúe este verdadero valor, debe calcularse el intervalo de confi anza (IC).
El método de cálculo del IC en las situaciones más frecuentes se desarrolla en los capítulos dedicados al análisis de los datos. Cuanto menor sea la variabilidad del parámetro y mayor el número de sujetos, mayor precisión existirá en la estimación para un grado de confi anza determinado. Cuanta más confi anza se desee obtener, más amplio será el IC y menor la precisión obtenida.
Para calcular el tamaño de la muestra, deben tenerse en cuenta:
• La variabilidad del parámetro que se desea estimar. Si no se conoce, puede obtenerse una aproximación a partir de datos propios o de otras investigaciones, o un estudio piloto. En el caso de las variables cuantitativas, se mide por la variancia, y en el de las cualitativas, por el producto P x (1 – P). • La precisión con que se desea obtener la estimación, es decir, la amplitud del IC. Cuanto más precisa se desee, más estrecho deberá ser este intervalo y más sujetos deberán ser estudiados. La precisión debe fi jarse previamente, en función de la fi nalidad de la estimación. En algunos casos, puede requerirse una gran precisión, mientras que en otros, si sólo se necesita conocer aproximadamente entre qué valores se encuentra el parámetro, se requerirá una menor precisión y, consecuentemente, menos sujetos. • El nivel de confi anza deseado, que habitualmente se fi ja en el 95%, correspondiente a un valor α de 0,05.
Este valor indica el grado de confi anza que se tiene en que el verdadero valor del parámetro en la población se sitúa en el intervalo obtenido. Cuanta más confi anza se desee, menor será el valor de α y más elevado el número de sujetos necesario.
De estos tres elementos, sólo debe conocerse la variabilidad del parámetro, ya que tanto la precisión como el nivel de confi anza se fi jan a partir de los intereses del investigador.
Estimación de una proporción
Si se desea estimar una proporción, debe conocerse:
a) El nivel de confi anza o seguridad (1−α). El nivel de confi anza prefi jado da lugar a un coefi ciente (z )α.
Para un nivel de seguridad del 95 %, α = 1,96, para un nivel de seguridad del 99 %, α = 2,58. (Véase Tabla 3.4.1). b) La precisión que se desea para el estudio. c) Una idea del valor aproximado del parámetro que se quiere medir (en este caso, una proporción). Esta idea se puede obtener revisando la literatura o mediante estudios piloto previos. En caso de no tener dicha información, se utilizará el valor p = 0,5 (50 %).
Por ejemplo, ¿a cuántas personas tendría que estudiarse para conocer la prevalencia de la hipertensión?
Seguridad = 95 % Precisión = 3 %
Proporción esperada = asumiendo que puede ser próxima al 5 %; si no se tuviese ninguna idea de dicha proporción, se utilizaría el valor p = 0,5 (50 %) que maximiza el tamaño muestral:
n z2 = α x p x q
d2
donde:
z2 = 1,962 = 3,84, ya que la seguridad buscada es del 95 %α p es la proporción esperada (en este caso 5 % o 0,05) q = 1− p (en este caso 1 – 0,05 = 0,95) d es la precisión deseada (en este caso un 3 %):
1,962 x 0,05 x 0,95 n = = 203 0,032
Estimación de una medida
En este caso también debe fi jarse el nivel de confi anza y la precisión de la estimación, que se traduce en la amplitud del intervalo alrededor de la media que se desea estimar. En las variables cuantitativas, la medida de la variabilidad viene proporcionada por la variancia de su distribución en la población.
Si se desea estimar una media, habrá que conocer:
(a) El nivel de confi anza o seguridad (1−α). El nivel de confi anza prefi jado da lugar a un coefi ciente (z)α.
Para un nivel de seguridad del 95 %, α = 1,96, para un nivel de seguridad del 99 %, α = 2,58. (b) La precisión con que se desea estimar el parámetro (2 × d es la amplitud del intervalo de confi anza). (c) Una idea de la varianza s2 de la distribución de la variable cuantitativa que se supone existe en la población.
z2 n = α s2
d2
Por ejemplo, si se desea conocer la media de la glucemia basal de una población con una seguridad del 95 % y una precisión de ± 3 mg/dl y se tiene información a través de un estudio piloto o de una revisión bibliográfi ca de que la varianza es de 250 mg/dl:
1,962 x 250 n = = 203 32
Si no se dispone de una estimación de la variabilidad, puede utilizarse una regla práctica, que consiste en determinar la diferencia entre los valores máximo y mínimo esperables. Dado que se asume que esta variable es de distribución normal, el intervalo m ± (2s), siendo m la media y s la desviación estándar de la distribución, incluye aproximadamente el 95% de los valores posibles, por lo que al dividir dicha amplitud de valores entre 4, puede obtenerse una cierta aproximación al valor de la desviación estándar s.
Corrección para poblaciones fi nitas
En los cálculos anteriores no ha intervenido el tamaño de la población, ya que en ellos se ha asumido que es infi nito. Sin embargo, en muchas ocasiones es preciso obtener una muestra de una población de tamaño conocido (fi nito). En esta situación, puede aplicarse la siguiente fórmula, que ajusta el número de individuos necesarios según el tamaño de la población:
na = n / [1 + (n/N)]
donde:
na es el número de sujetos necesarios, n es el número de sujetos calculado para poblaciones infi nitas, N es el tamaño de la población.
PRUEBAS DE CONTRASTE DE HIPÓTESIS
Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes. Desde el punto de vista estadístico, el investigador se enfrenta al problema del contraste de una hipótesis realizando la asunción de que no existen diferencias en la efi cacia de los dos fármacos A y B (hipótesis nula). A partir de los resultados observados en la muestra, el investigador utilizará las pruebas de signifi cación estadística para evaluar si existe la sufi ciente evidencia que le permita rechazar esta hipótesis nula y, consecuentemente, aceptar la hipótesis alternativa de que sí existen diferencias entre ambas terapéuticas.
El error tipo I, conocido también como error α (Tabla 3.4.2) se comete cuando el investigador rechaza la hipótesis nula cuando esta es verdadera en la población. Es equivalente a encontrar un resultado falso positivo, ya que el investigador concluye que hay una diferencia, cuando en realidad no existe.
El error tipo II, o error ß (Tabla 3.4.2) se comete en la situación contraria, cuando el investigador no rechaza la hipótesis nula pero esta es falsa en la población. Es equivalente a un resultado falso negativo, ya que el investigador concluye que ha sido incapaz de encontrar una diferencia que existe en la realidad. Si ß representa la probabilidad de un resultado falso negativo, su complementario 1 – ß, conocido como poder o potencia estadística, representa la probabilidad de observar en la muestra una determinada diferencia o un efecto, si existen en la población.
Para calcular el tamaño de la muestra, se fi jan a priori los riesgos de cometer estos errores que se está dispuesto a asumir (ver Tabla 3.4.2).
Para el cálculo del tamaño muestral se precisa:
(a) Magnitud de la diferencia a detectar que tenga un interés clínicamente relevante. Se pueden comparar dos proporciones o dos medias. Este punto tiene un gran impacto en el tamaño de la muestra, ya que si la diferencia es muy amplia (por ej., si la efi cacia del fármaco A es el doble que la del B) se podrá detectar con más facilidad que si es de escasa magnitud, y requerirá un número menor de sujetos. Esta diferencia debe fi jarse en términos realistas, dentro del rango de valores esperables. (b) Tener una idea aproximada de los parámetros de la variable que se estudia (a través de la bibliografía o de estudios previos). (c) Garantizar la seguridad del estudio (riesgo de cometer un error α). (d) Tener potencia estadística (1−β) (riesgo de cometer un error β). (e) Defi nir si la hipótesis va a ser unilateral o bilateral:
• Bilateral: cualquiera de los dos parámetros a comparar (medias o proporciones) puede ser mayor o menor que el otro. No se establece ninguna dirección. • Unilateral: cuando se considera que uno de los parámetros debe ser mayor que el otro, indicando por tanto una dirección de las diferencias.
La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera).
El tamaño de la muestra requerido es mayor cuanto más pequeña sea la diferencia que se desea detectar y menos elevados sean los riesgos α y β que se acepten. Es importante destacar que una misma diferencia del 5 % entre dos porcentajes requiere el máximo número de pacientes cuando éstos se sitúan alrededor del 50 %. Ello se debe a que, si el porcentaje del grupo de referencia es del 5 %, una diferencia del 5 % implica que el grupo de estudio debe pasar a un 10 %, es decir, dobla la efi cacia. En cambio, si el porcentaje del grupo de referencia es del 50 %, una diferencia del 5 % implica solamente un incremento relativo del 10 %.
Tamaño muestral para comparación de dos proporciones
donde:
n es el número de sujetos necesarios en cada una de las muestras zα es el valor z correspondiente al riesgo α zβ es el valor z correspondiente al riesgo β p1 es el valor de la proporción en el grupo de referencia, placebo, control o tratamiento habitual p2 es el valor de la proporción en el grupo del nuevo tratamiento, intervención o técnica p es la media de las dos proporciones 1 p y 2 p:
p1 + p2 p = 2
Ejemplo
Se desea evaluar si el tratamiento 2 T es mejor que el tratamiento 1 T para el alivio del dolor, para lo que se diseña un ensayo clínico. Se sabe por datos previos que la efi cacia del fármaco habitual está alrededor del 70 % y se considera clínicamente relevante si el nuevo fármaco aliviara el dolor en un 90 %. El nivel de riesgo se fi ja en 0,05 y se desea una potencia estadística de un 80 %.
Estimación de un riesgo relativo
Si el objetivo del estudio es determinar la magnitud de la asociación en términos relativos, la medida que se utilizará en los estudios prospectivos (ensayos clínicos y estudios de cohortes) es el riesgo relativo (RR). Lo que debe fi jarse en este caso es la mínima magnitud del RR que se quiere detectar. En esta situación, puede utilizarse la misma fórmula que en el caso de la comparación de dos proporciones, teniendo en cuenta que: RR = P2/P1.
La magnitud de la asociación que se quiere detectar corresponde al mínimo RR que se considerará de importancia clínica, donde:
P1 es el riesgo de desarrollar la enfermedad en el grupo no expuesto P2 es el riesgo de desarrollar la enfermedad en el grupo expuesto (P2 = P1·RR).
A partir del cálculo de la P2 se podría utilizar la fórmula:
El resultado nos indicaría el número en cada grupo (grupo expuesto y grupo no expuesto) necesario para detectar este RR establecido, pero debemos tener en cuenta la prevalencia de la exposición. Un punto importante es estimar cuántos sujetos se deben evaluar para conseguir el número de expuestos necesarios. Por ejemplo, si la frecuencia de la exposición en la población general (f) fuera de un 20 % y nuestro calculo indicara que necesitamos incluir a 199 expuestos, sería necesario examinar a N/f = 199/0,2 = 995 sujetos para encontrar a 199 expuestos.
ESTIMACIÓN DE UNA ODDS RATIO
En los estudios de casos y controles, la magnitud de la asociación se estima mediante la odds ratio (OR). Se trata de una situación similar a la de la estimación de un RR, en la que debe conocerse la proporción de exposición esperada en los controles (P1) y fi jar la magnitud de la OR que se desea detectar. La proporción esperada de exposición entre los casos es:
P2 = (P1·OR) / [1 + P1·(OR – 1)].
A partir del cálculo de la P2 se puede utilizar la fórmula para la comparación de proporciones:
Tamaño muestral para la comparación de dos medias
donde:
n son los individuos necesarios en cada una de las muestras zα es el valor z correspondiente al riesgo deseado zβ es el valor z correspondiente al riesgo deseado
s2 es la varianza de la variable cuantitativa que tiene el grupo control o de referencia d es el valor mínimo de la diferencia que se desea detectar (datos cuantitativos).
Los valores zα según la seguridad y zβ según la potencia del test se indican en la tabla 3.4.1.
Ejemplo
Se desea utilizar un nuevo fármaco antidiabético y se considera que sería clínicamente efi caz si lograse un descenso de 15 mg/dl respecto al tratamiento habitual con el antidiabético estándar. Por estudios previos, sabemos que la desviación típica de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Se acepta un riesgo de 0,05 y se desea una potencia estadística del 90 % para detectar diferencias, en el caso de existir.
Se precisan, un total de 40 pacientes (20 en cada grupo).
EQUIVALENCIA DE DOS INTERVENCIONES
En ocasiones se diseña un estudio para determinar si una nueva intervención, que ofrece alguna ventaja, como ser menos costosa o producir menos efectos secundarios, es tan efi caz como la terapéutica habitual. El concepto de equivalencia requiere descartar pequeñas diferencias en la respuesta a las intervenciones. Para considerar equivalentes dos intervenciones, la diferencia entre ellas debe ser menor que la mínima diferencia clínicamente relevante.
Concepto de diferencia clínicamente relevante: La relevancia clínica de un fenómeno va más allá de cálculos aritméticos y está determinada por el juicio clínico. La relevancia depende de la magnitud de la diferencia, la gravedad del problema a investigar, la vulnerabilidad, la morbimortalidad generada por el mismo, su coste y su frecuencia, entre otros. La reducción relativa del riesgo relativo es una medida de utilidad en el cálculo de la relevancia clínica. Unas reducciones del riesgo relativo del 50 % casi siempre y del 25 % con frecuencia son consideradas clínicamente relevantes con independencia de la signifi cación estadística
La relevancia clínica se defi ne como la diferencia entre los resultados que induciría a adoptar la mejor terapia. El procedimiento que se sigue es el de utilizar este valor como la diferencia que se desea detectar en el cálculo del número de sujetos.
Fórmula para el cálculo del tamaño de la muestra en un estudio de equivalencia:
Variable cualitativa Variable cuantitativa
2 P (1 - P) • (Zα + Zβ)o N = do 2σ2 (Zα + Z β)2 n = d2
N: número de sujetos necesarios en cada uno de los grupos Zα: valor de Z correspondiente al riesgo α fi jado Zβ: valor de Z correspondiente al riesgo β fi jado P: proporción que se espera en el grupo control d: diferencia máxima entre la efi cacia de ambos tratamientos que se tolerará para concluir que son equivalentes σ2 : varianza de la variable principal cuantitativa
EL TAMAÑO MUESTRAL AJUSTADO A LAS PÉRDIDAS
En todos los estudios es preciso estimar las posibles pérdidas de pacientes por razones diversas (pérdida de información, abandono, no respuesta…), por lo que se debe incrementar el tamaño muestral en proporción a dichas pérdidas. El tamaño muestral ajustado a las pérdidas se puede calcular con la fórmula:
muestra ajustada a las pérdidas =
donde:
n: número de sujetos teórico R: la proporción esperada de pérdidas.
Calculadoras de tamaño de muestra
Considerando lo complicado que resulta aplicar los algoritmos de cálculo manualmente, es útil disponer de un programa informático que permita a usuarios no especialistas realizar las estimaciones más habituales de un modo fi able y rápido. En la actualidad existen calculadoras en línea gratuitas que nos facilitan los cálculos, pero es importante entender los conceptos que se han tratado en este capítulo e identifi car la información y los datos que se deben incluir en estas calculadoras.
PUNTOS CLAVE
• Todo estudio epidemiológico conlleva, en la fase de diseño, la determinación del tamaño muestral necesario para la ejecución del mismo, y de ello puede depender el éxito del estudio y obtener conclusiones válidas. • El cálculo de muestra es una estimación a priori, y pueden estimarse parámetros a partir de una muestra (diseños observacionales descriptivos) o estudios para contraste de hipótesis (diseños observacionales transversales, analíticos y experimentales). • El resultado del cálculo debe considerarse como orientativo, ya que se basa en asunciones que pueden ser incorrectas.
BIBLIOGRAFÍA
Argimón J, Jiménez J. Métodos de investigación. Madrid, Harcourt, 2000. Gordis L. Epidemiology. Philadelphia, Saunders-Elsevier, 4ª ed., 2009. Szklo M, Nieto J. Epidemiología Intermedia. Conceptos y aplicaciones. Madrid, Ediciones Díaz Santos, 1a ed., 2003. Milton S. Estadística para Biología y Ciencias de la Salud. Madrid, McGraw Hill-Interamericana, 3ª ed., 2001.
Montesano JR. Manual del protocolo de investigación. México, Editorial Auroch, 1999. Lwanga SK, Lemeshow S. Sample size determination in health studies. A practical manual. Ginebra, Organización Mundial de la Salud, 1991. Laupacis A, Sackett DL, Roberts RS. An assesment of clinically useful measures of treatment. N Engl J Med. 1988;318(26):1728-1733. Guyatt GH, Sackett DL, Cook DJ. Users´ guides to the medical literature. II. How to use an article about therapy or prevention. B. What were the results and will they help in caring for my patients? Evidence Based Medicine Working Group. JAMA 1994; 271(1):59-63. Cook RJ, Sackett DL. Th e number needed to treal: a clinically useful measure of treatment eff ect. BMJ. 1995;310(6977):452-454.
TABLAS Y FIGURAS
Tabla 3.4.1. Valores de Zα y Zβ más frecuentemente utilizados
Zα
α Test unilateral Test bilateral
0.200 0.150 0.100 0.050 0.025 0.010 0.842 1.036 1.282 1.645 1.960 2.326 1.282 1.440 1.645 1.960 2.240 2.576
Potencia
β (1-β) Zβ
0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.99 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 2.326 1.645 1.282 1.036 0.842 0.674 0.524 0.385 0.253 0.126
Tabla 3.4.2. Tipos de error aleatorio en una prueba estadística de contraste de hipótesis
H0
Verdadera
Falsa Aceptamos Rechazamos
Decisión correcta Error tipo I α
Error tipo II β Decisión correcta