SOBRE O AUTOR
Petrônio Fagundes de Oliveira Filho Professor aposentado de Pediatria, Epidemiologia e Bioestatística da Universidade de Caxias do Sul (UCS), RS. Mestre em Saúde Pública pela Universidade de São Paulo (USP). Especialista em Estatística Aplicada pela UCS, RS. Especialista em Pediatria pela Sociedade Brasileira de Pediatria (SBP). Graduado em Medicina pela UCS, RS.
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica – 2a edição foi concebida como uma introdução à epidemiologia e à bioestatística, salientando os assuntos que se constituem em uma instrumentação básica para a leitura crítica de artigos científicos na área da saúde. Para esta nova edição, houve a atualização de alguns capítulos e acréscimo de novos exemplos e mais 50 exercícios resolvidos. Entretanto, foi mantida a preocupação de não torná-lo muito complexo, focando naquilo que é mais encontrado na literatura científica biomédica. O objetivo é que ele continue a ter uma assimilação fácil tanto para o aluno da graduação quanto para o de pós-graduação, como também para os professores e outros profissionais da área da saúde. A finalidade, portanto, desta segunda edição do livro continua a ser a mesma: ajudar a evitar a intoxicação causada pela pseudociência.
Áreas de interesse Epidemiologia Bioestatística
9 786588 340363
Oliveira Filho - Epidemiologia.indd 1
01/06/22 14:40
00-Disfagia Orofaringea.indd 12
11/02/2022 09:23:46
Petrônio Fagundes de Oliveira Filho Professor aposentado de Pediatria, Epidemiologia e Bioestatística da Universidade de Caxias do Sul (UCS), RS. Mestre em Saúde Pública pela Universidade de São Paulo (USP). Especialista em Estatística Aplicada pela UCS, RS. Especialista em Pediatria pela Sociedade Brasileira de Pediatria (SBP). Graduado em Medicina pela UCS, RS.
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica, 2a edição Copyright © 2022 Editora Rubio Ltda. ISBN 978-65-88340-36-3 Todos os direitos reservados. É expressamente proibida a reprodução desta obra, no todo ou em parte, sem autorização por escrito da Editora. Produção Equipe Rubio Capa Bruno Sales Imagem de Capa ©iStock.com/arthobbit Editoração Eletrônica Edel
CIP-BRASIL. CATALOGAÇÃO NA PUBLICAÇÃO SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ O47e 2. ed. Oliveira Filho, Petrônio Fagundes de. Epidemiologia e bioestatística: fundamentos para a leitura crítica/Petrônio Fagundes de Oliveira Filho. – 2. ed. – Rio de Janeiro: Rubio, 2022. 272p. : il.; 24cm Inclui bibliografia e índice ISBN 978-65-88340-36-3 1. Epidemiologia. 2. Bioestatística. I. Título. 22-78004 Grabriela Faray Ferreira Lopes – Bibliotecaria – CRB-7/6643
Editora Rubio Ltda. Av. Franklin Roosevelt, 194 s/l. 204 – Centro 20021-120 – Rio de Janeiro – RJ Telefax: 55(21) 2262-3779 • 2262-1783 E-mail: rubio@rubio.com.br www.rubio.com.br Impresso no Brasil Printed in Brazil
CDD: 614.4 CDU: 616-036.22
Dedicatória
Este livro é dedicado à minha esposa, Lena; às minhas filhas, Nathalia e Andressa; e aos meus netos, Felix e Gabriel.
Agradecimentos
Obrigado aos nossos alunos na Universidade de Caxias do Sul que, nestas quatro décadas de magistério, facilitaram nosso trabalho, tornando-o uma diversão diária. Obrigado às crianças e aos adolescentes caxienses que, sem exigir recompensas, nos brindam com seus sorrisos. Obrigado aos Professores Wilson Paloschi Spiandorello e Emerson Rodrigues da Silva que gentilmente leram este livro, desde o início, apontando erros, dando ótimas sugestões e enriquecendo o resultado final. Obrigado aos amigos Professor Valter Teixeira Motta, parceiro em outra publicação (SPSS: Análise de Dados Biomédicos) e Professor Mário Bernardes Wagner, da Universidade Federal do Rio Grande do Sul, com quem muito aprendi. Obrigado aos colegas do Comitê de Ética em Pesquisa da Universidade de Caxias do Sul que, a cada reunião, nos enriquecem com seus conhecimentos. Obrigado à Editora Rubio por tornar possível este livro e colocar pessoas gentis para me orientar na sua confecção. Finalmente, um especial obrigado ao Professor José Mauro Madi, incansável incentivador e padrinho deste livro.
Apresentação
Este livro foi concebido como uma introdução à epidemiologia e à bioestatística, salientando os assuntos que se constituem em uma instrumentação básica para a leitura crítica de artigos científicos na área da saúde. Para a segunda edição, houve atualização de alguns capítulos e adição de novos exemplos e exercícios. Entretanto, foi mantida a preocupação de não tornar o livro muito complexo, focando naquilo que é mais encontrado na literatura científica biomédica, como mencionado na apresentação da primeira edição, acescido de algumas atualizações e com mais 50 exercícios resolvidos. O objetivo é que ele continue a ter uma assimilação fácil tanto para o aluno da graduação quanto para o de pós-graduação, mas também para os professores e outros profissionais da área da saúde.
A importância de separar a boa da má ciência se escancarou de maneira acentuada durante a pandemia de coronavírus, onde assistimos diariamente a divulgação de notícias sem nenhum fundamento científico e a publicação, mesmo por conceituadas revistas, de artigos científicos de qualidade duvidosa, criando grande confusão que alimenta os negacionistas da ciência. Como disse, Ben Goldacre, em seu interessante livro Bad Science (2008): “para essas pessoas a ciência é um monólito, um mistério e uma autoridade, em vez de um método”. A finalidade, portanto, desta segunda edição do livro continua a ser a mesma: ajudar a evitar a intoxicação causada pela pseudociência. O Autor
Prefácio da 1a edição
Há mais de 35 anos conheço Petrônio Fagundes de Oliveira Filho, médico formado pela Universidade de Caxias do Sul, professor e especialista em Pediatria, diretor de Ensino do Hospital Geral da Universidade de Caxias do Sul (UCS) e clínico ligado à Pediatria, à Bioestatística e à Epidemiologia. Mestre em Saúde Pública Materno-Infantil pela Universidade de São Paulo, o Professor Petrônio atua como pesquisador e faz parte do Núcleo de Capacitação e Consultoria em Bioestatística e Epidemiologia, onde realiza a análise estatística e epidemiológica de trabalhos de alunos e professores da UCS. Entre as suas principais obras, merece citação a publicação SPSS: Análise de Dados Biomédicos, publicado em 2009, em coautoria com o professor Valter Motta. Quando consultado, gentil e honrosamente, sobre a possibilidade de elaborar o Prefácio deste Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica, a ser lançado pela sempre excelente Editora Rubio, confesso que hesitei por alguns instantes, não só pela importância do livro que já se delineava, mas também pela responsabilidade de prefaciar uma publicação específica advinda de um profissional de estirpe. Some-se a este fato a grande admiração científica, ética, intelectual e pessoal que tenho por ele. Ao aceitar a incumbência, de imediato tive acesso aos trinta capítulos, elaborados magistralmente de modo didático, o que auxilia bastante no entendimento da Epidemiologia e da Bioestatística, pela clareza na exposição das
informações. Merecem ênfase as inovações na área estatística incluídas na Parte VI – Leitura Crítica e a proposição de exercícios aos leitores. Ficou explícito durante a leitura dos vários itens que o objetivo primordial foi o de fornecer uma referência de inestimável valor científico, não apenas para médicos e estudantes de Medicina, como também para outros profissionais da área da saúde. Além disso, o Professor Petrônio, tomado pela grande experiência adquirida ao longo de sua vida profissional e docente, decidiu traduzir sob a forma de texto o progresso alcançado, apresentando um livro de conteúdo abrangente e, acima de tudo, atualizado e ombreado com os congêneres internacionais. É um privilégio ter sido envolvido, de algum modo, com o surgimento deste bem-sucedido e importante compêndio. Isso porque, atualmente, o tema central desenvolvido nesta obra tem ocupado espaço amplo na área da pesquisa e fundamenta-se como relevante disciplina norteadora no campo da saúde. Espero que as atualizações e os conceitos expostos nos diversos capítulos deste livro sejam duradouros e se mantenham até que possamos reunir novos saberes para uma aperfeiçoada versão. Prof. Dr. José Mauro Madi
Professor Titular de Ginecologia e Obstetrícia na Universidade de Caxias do Sul (UCS). Professor do Programa de Pós-graduação em Ciências da Saúde da UCS. Mestre, Doutor e Pós-doutor pela Universidade Federal do Rio de Janeiro (UFRJ).
Prefácio da 2a edição
Há cerca de seis anos, a convite do professor Petrônio, me foi concedida a extremada regalia de preambular a 1a edição do Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica (Rio de Janeiro: Rubio, 2015. 248p. ISBN 978-85-8411-030-8). Para escrever o breve, mas sincero prólogo, confesso que compulsei o manuscrito que me foi encaminhado por várias vezes. E o fiz com a mesma ansiedade de um (jovem) aluno do curso de Medicina que folheia o livro da especialidade que recebe das mãos do seu professor, embora aquela não fosse a primeira vez que me havia sido conferida tal distinção. E, com base no que depreendi daquela observação crítica, tive a oportunidade de aprimorar, em muito, as minhas noções da especialidade que o professor Petrônio sempre dominou e discorreu com tanta maestria. A clareza e a objetividade que foram proporcionadas naquela 1a edição abrandaram, com certeza, os meus parcos conhecimentos de Epidemiologia e Bioestatística, obscurecidos com o decorrer dos anos. Na realidade, reconheço, à época, me esforcei muito para distinguir o autor da obra do meu querido amigo de cerca de 40 anos. Tentei, e confesso que em vão, interpretar e analisar exclusivamente a obra que estava sendo-me apresentada tal a dificuldade de dissociar o professor do amigo a quem sempre nutri tão grande afeição científica, moral, ética e intelectual. Conheço de sobejo o professor Petrônio Fagundes de Oliveira Filho, médico de estirpe, formado pela Universidade de Caxias do Sul, professor e especialista em Pediatria, ligado à Bioestatística e à Epidemiologia, e Mestre em Saúde Pública Materno-Infantil
pela Universidade de São Paulo. Some-se a todo o exposto, o fato de conhecer o professor Petrônio e toda a sua história familiar, profissional e de pesquisador, suas obras e análises estatísticas e epidemiológicas de trabalhos de alunos e professores da Universidade de Caxias do Sul, e a sua principal publicação, o SPSS: Análise de Dados Biomédicos, publicado em 2009. Agora, estou sendo apresentado a não menos importante 2a edição do Epidemiologia e Bioestatística, de novo apadrinhada pela sempre excelente Editora Rubio. Acréscimos, pequenas alterações, diminutas correções de rota, tornaram o texto mais aprazível, prazeroso e requintado. Tive a oportunidade de reavivar a minha memória com nótulas e orientações, agora mais encorpadas que as expostas na 1a edição. Enfim, repito, em parte, as minhas palavras incluídas nas primeiras páginas da versão anterior: continua sendo um privilégio e uma honra ter sido envolvido, mais uma vez e de algum modo, com o surgimento deste já bem-sucedido e importante compêndio. Isso porque, atualmente, o tema central desenvolvido nesta obra tem ocupado espaço amplo na área da pesquisa. Espero que as atualizações e os conceitos expostos nos diversos capítulos deste livro possam ser, por muitos anos ainda, reavaliados pela sapiência e competência do sempre estimado mestre. Prof. Dr. José Mauro Madi
Professor Titular de Ginecologia e Obstetrícia na Universidade de Caxias do Sul (UCS). Professor do Programa de Pós-graduação em Ciências da Saúde da UCS. Mestre, Doutor e Pós-doutor pela Universidade Federal do Rio de Janeiro (UFRJ).
Sumário
PARTE I DEFININDO DADOS, 1 1 Natureza dos Dados, 3 Variáveis e dados, 3 Tipos de variáveis, 3 Leitura complementar, 6
PARTE II DESCREVENDO OS DADOS, 7 2 Tabelas, 9 Introdução, 9
5 Resumo dos Dados Numéricos, 25 Introdução, 25 Medidas de tendência central, 25 Medidas de dispersão, 28 Leitura complementar, 31
PARTE III MEDIDAS BÁSICAS EM EPIDEMIOLOGIA, 33 6 Medidas de Frequência, 35 Razões, taxas e proporções, 35
Tabela de frequência para variáveis nominais, 9
Prevalência, 35
Tabela de frequência para variáveis ordinais, 10
Incidência, 36
Tabela de frequência para variáveis numéricas, 10
Relação entre prevalência e incidência, 38
Tabelas cruzadas, 12
Leitura complementar, 40
Leitura complementar, 12
3 Gráficos, 13
Epidemia e endemia, 38
7 Medidas de Associação, 41 Risco relativo, 41
Introdução, 13
Odds ratio, 42
Gráficos para dados ordinais e nominais, 13
Razão de prevalência, 44
Gráficos para dados numéricos discretos, 13 Gráficos para dados numéricos contínuos, 15 Dados cumulativos, 17 Curva de frequência percentual cumulativa, 17 Leitura complementar, 19
4 Distribuição dos Dados, 21
Tamanho de efeito padronizado, 44 Leitura complementar, 46
8 Medidas de Impacto, 47 Risco atribuível ou redução absoluta do risco, 47 Risco atribuível proporcional, 48 Redução relativa do risco, 48
Introdução, 21
Número necessário para tratar, 49
Distribuição normal, 22
Número necessário para causar dano, 50
Outras formas de distribuição, 22
Risco atribuível populacional, 50
Leitura complementar, 24
Leitura complementar, 51
9 Análise de Sobrevida, 53 Introdução, 53 Dados censurados, 53 Método de Kaplan-Meier, 53 Curva de Kaplan-Meier, 55 Mediana do tempo de sobrevida, 56 Comparando a sobrevida em dois ou mais grupos, 56 Leitura complementar, 59
Protocolo de uma revisão sistemática com metanálise, 82 Análise quantitativa de uma revisão sistemática (metanálise), 84 Uso de software, 84 Leitura complementar, 88
14 Testes Diagnósticos, 89 Introdução, 89 Sensibilidade e especificidade, 90 Valor preditivo, 91
PARTE IV DELINEAMENTOS DE PESQUISA, 61
Razão de probabilidades, 92
10 Delineamentos de Pesquisa, 63
Múltiplos testes, 97
Testes com variáveis contínuas, 95
Introdução, 63
Acurácia de um teste diagnóstico, 99
Questão de pesquisa, 63
Coeficiente de kappa, 99
Tipos de delineamentos, 64
Leitura complementar, 100
Elementos básicos de um delineamento, 64 Leitura complementar, 64
11 Estudos Observacionais, 65
15 Vieses, 101 Introdução, 101 Viés de seleção, 101
Introdução, 65
Viés de aferição, 102
Relato de caso ou série de casos, 65
Viés de confusão, 102
Estudos ecológicos, 65
Validade, 104
Estudos transversais, 66
Leitura complementar, 105
Estudos caso-controle, 67 Estudos de coorte, 69 Vantagens e desvantagens dos estudos de coorte, 72 Leitura complementar, 72
12 Ensaios Clínicos, 73 Introdução, 73 Características do ensaio clínico, 73 Elementos básicos de um ensaio clínico, 74
PARTE V INFERÊNCIA ESTATÍSTICA, 107 16 População e Amostra, 109 Introdução, 109 Tipos de amostras, 109 Estatísticas e parâmetros, 110 Tamanho amostral, 110 Leitura complementar, 112
17 Distribuições de Probabilidades, 113
Ensaios clínicos de equivalência e não inferioridade, 77
Distribuição normal, 113
Outros tipos de ensaios clínicos, 77
Distribuição t de Student, 116
Fases de experimentação, 79
Distribuição binomial, 118
Leitura complementar, 79
Leitura complementar, 121
13 Revisão Sistemática, 81
Distribuição normal padronizada, 115
18 Intervalo de Confiança e Valor P, 123
Introdução, 81
Introdução, 123
Revisões tradicionais (narrativas) e sistemáticas, 81
Intervalo de confiança, 123 Teste de hipótese, 127
Intervalo de confiança versus valor p, 132
Força da recomendação, 181
Leitura complementar, 133
Leitura complementar, 183
19 Testes Paramétricos, 135
25 Análise de um Estudo Terapêutico, 185
Introdução, 135
Introdução, 185
Teste t para amostras independentes, 135
Validade dos resultados, 185
Teste t para amostras emparelhadas, 137
Quais são os resultados?, 187
Análise de variância, 138
Aplicabilidade dos resultados, 187
Correlação e regressão, 143
Escala de Jadad, 188
Leitura complementar, 151
Leitura complementar, 189
20 Teste Qui-Quadrado, 153
26 Análise de um Estudo Diagnóstico, 191
Introdução, 153
Introdução, 191
Uso e restrições do χ2, 154
Validade dos resultados, 191
Correção para a continuidade de Yates, 154
Quais são os resultados?, 192
Teste exato de Fisher, 154
Aplicabilidade dos resultados, 192
Leitura complementar, 156
Leitura complementar, 194
21 Testes Não Paramétricos, 157
27 Análise de um Estudo Prognóstico, 195
Introdução, 157
Introdução, 195
Teste de Mann-Whitney, 157
Validade dos resultados, 195
Teste de Wilcoxon, 159
Quais são os resultados?, 197
Teste de Kruskal-Wallis, 161
Aplicabilidade dos resultados, 197
Coeficiente de correlação de Spearman, 163
Leitura complementar, 197
Leitura complementar, 165
PARTE VI LEITURA CRÍTICA, 167 22 Medicina Baseada em Evidências, 169 O que é medicina baseada em evidências?, 169 Etapas da medicina baseada em evidências, 170 Leitura complementar, 173
28 Análise de um Estudo Etiológico, 199 Introdução, 199 Validade dos resultados, 199 Quais são os resultados?, 200 Aplicabilidade dos resultados, 200 Leitura complementar, 201
Introdução, 175
PARTE VII EXERCÍCIOS RESOLVIDOS, 203
Estrutura de um artigo científico, 175
29 Exercícios, 205
23 Artigo Científico, 175
Esquema geral de avaliação de um artigo científico, 178 Leitura complementar, 179
Referências, 223
30 Respostas dos Exercícios, 225 Referências, 248
24 Avaliação da Qualidade da Evidência, 181 Qualidade da evidência, 181
Índice, 249
PARTE
I
Definindo Dados
Capítulo 1
Natureza dos Dados, 1
CAPÍTULO
1
^^ VARIÁVEIS
Natureza dos Dados
E DADOS
Variável é a característica de interesse medida em cada elemento da amostra ou da população. Conforme o nome diz, seus valores variam de elemento para elemento. As variáveis podem ter valores numéricos ou não numéricos. Por exemplo, idade, sexo e tipo sanguíneo são variáveis. Dados são informações obtidas quando se mede uma variável. Por exemplo, na Tabela 1.1, 32 anos é um dado para a variável idade e feminino (F) é um dado para a variável sexo. O termo “medida” é utilizado aqui em um sentido mais amplo, pois não se mede o gênero de alguém. TABELA 1.1 Variáveis e dados Paciente
Idade
Sexo
Grupo sanguíneo
Paciente 1
45
M
A
Paciente 2
32
M
O
Paciente 3
18
F
B
Isso porque obtemos tal informação observando-se o indivíduo ou solicitando ou aplicando um questionário a este. Em contrapartida, a altura e a pressão arterial são variáveis que podem ser mensuradas. ^^ TIPOS
DE VARIÁVEIS
Existem dois tipos principais de variáveis – as categóricas e as numéricas. Estas são subdivididas em dois subtipos, conforme mostrado na Figura 1.1, que também resume suas características principais.
Variáveis nominais Uma variável nominal é aquela cujos dados se enquadram em categorias que não podem ser colocadas em ordem numérica. Um exemplo desse tipo de variável é o tipo sanguíneo. Observe na Tabela 1.2 a distribuição hipotética dos quatro tipos sanguíneos (O, A, B e AB), em uma amostra de 100 indivíduos.
Variáveis categóricas
Variáveis numéricas
Nominal
Ordinal
Discreta
Contínua
Valores em categorias arbitrárias
Valores em categorias ordenadas
Valores inteiros em ordem numérica
Sem unidade
Sem unidade
Unidade de contagem
Valores contínuos em ordem numérica ou escala
FIGURA 1.1 Tipos de variáveis
Unidade de medida
4
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
TABELA 1.2 Tipo sanguíneo de 100 pacientes (dados hipotéticos) Grupo sanguíneo
Número de pacientes
O
65
A
15
B
12
AB
8
Total
100
Essa configuração de tabela é chamada de tabela de frequência. Ela mostra como o número ou a frequência dos tipos de sangue é distribuído entre as quatro categorias. Dessa maneira, 65 pacientes têm sangue do tipo O; 15 do tipo A e assim por diante. As variáveis nominais têm duas características: 1. Os dados não têm quaisquer unidades de medida. 2. A ordenação das categorias é completamente arbitrária. Pertencer a uma categoria não significa ter maior importância do que pertencer à outra. Quando uma variável nominal têm duas possibilidades, ela é dita dicotômica ou binária [p. ex., sexo (masculino/feminino), doente (sim/ não)]. As variáveis dicotômicas são bastante utilizadas em Epidemiologia.
Variáveis ordinais Uma variável é dita ordinal quando há uma ordem inerente ou uma hierarquia entre as categorias. Um exemplo de variável ordinal bastante conhecido é a Escala de Coma de Glasgow (ECG) – uma variável categórica ordinal. Tal escala mede o grau de comprometimento cerebral (p. ex., após traumatismo craniano). Na ECG, o paciente é avaliado por sua capacidade de resposta em três áreas: resposta à abertura ocular, resposta verbal e resposta motora. A pontuação da ECG pode variar de 3 (morte cerebral ou lesão grave) a 15 (sem lesão ou lesão leve). Em outras palavras, existem 13 possíveis valores ou categorias de lesão cerebral. Imagine que seja determinada a pontuação utilizando-se a ECG dos últimos 90 pacientes
com traumatismo craniano admitidos em uma unidade de emergência. Os resultados estão na tabela de frequência mostrada na Tabela 1.3. As variáveis ordinais têm duas características importantes: 1. Os dados não têm quaisquer unidades de medida (do mesmo modo que as variáveis nominais). 2. A ordenação das categorias não é arbitrária, como nas variáveis nominais. Assim, é possível ordenar as categorias de uma forma lógica, com sentido. Em outras palavras, pode-se dizer que um paciente na categoria “15” tem menor grau de lesão do que um na categoria “14”. Da mesma maneira, um paciente na categoria “14” tem menor grau de lesão do que aquele na categoria “13” – e assim por diante. No entanto, há outra característica muito importante desses escores (ou de qualquer outro conjunto de ordinais): a diferença entre dois escores adjacentes não é necessariamente a mesma entre qualquer outro par de escores adjacentes. Por exemplo, a diferença no grau de lesão entre os escores da ECG 5 e 6 não é necessariamente a mesma dos escores 6 e 7. Também não se pode dizer que um TABELA 1.3 Distribuição dos escores da Escala de Coma de Glasgow em 90 pacientes com traumatismo craniano Escala de Coma de Glasgow
Número de pacientes
3
8
4
1
5
6
6
5
7
5
8
7
9
6
10
8
11
8
12
10
13
12
14
9
15
5
Total
90
PARTE
II
Descrevendo os Dados
Capítulo 2
Tabelas, 9
Capítulo 3
Gráficos, 13
Capítulo 4
Distribuição dos Dados, 21
Capítulo 5
Resumo dos Dados Numéricos, 25
CAPÍTULO
3
Gráficos
^^ INTRODUÇÃO
A escolha adequada do tipo de gráfico ajuda a descrever os dados e visualizar as informações de maneira clara. O que é adequado depende, principalmente, do tipo de dados, bem como das características particulares do que se quer explorar. Um gráfico de frequência, por exemplo, pode ser utilizado para ilustrar, explicar uma situação complexa em que palavras ou uma tabela podem ser confusos, extensos ou de outro modo insuficiente. Além disso, um gráfico em um relatório pode causar um efeito positivo no leitor ou fazê-lo abandonar a leitura. Por outro lado, deve-se evitar usar gráficos nos quais poucas palavras expressam claramente o que se quer mostrar. ^^ GRÁFICOS
PARA DADOS ORDINAIS E NOMINAIS
Gráfico de setores ou pizza Cada segmento (fatia) do gráfico de pizza deve ser proporcional à frequência da categoria que representa. Por exemplo, a Figura 3.1 é um gráfico de pizza para a distribuição da escolaridade de um grupo de gestantes. A desvantagem de um gráfico de pizza é que ele só pode representar uma variável (na Figura 3.1, escolaridade). Portanto, há necessidade de um gráfico separado para cada variável que se deseja representar. Ademais, um gráfico de pizza pode perder clareza se for usado para representar mais do que quatro ou cinco categorias. Na
maioria das vezes, em um artigo científico ou relatório não há necessidade de se usar esse tipo de gráfico. Como regra, não se deve utilizar gráficos de pizza. Ele é usado mais no mundo dos negócios.
Gráfico de barras Uma alternativa para o gráfico de pizza para os dados nominais é o gráfico de barras. Este é um gráfico que costuma apresentar a frequência no eixo vertical e a categoria no eixo horizontal. O gráfico de barras simples é apropriado se apenas uma variável for mostrada. A Figura 3.2 é um gráfico de barras simples para os dados apresentados na Figura 3.1. Vale lembrar que todas as barras devem ter a mesma largura. Do mesmo modo, os espaços iguais devem ser iguais entre as barras. Esses espaços enfatizam a natureza categórica dos dados. Se houver mais de um grupo, pode-se usar o gráfico de barras agrupadas. A Tabela 3.1 mostra a frequência de parto normal e cesariana de acordo com a faixa etária de 866 partos a termo em uma maternidade. A Figura 3.3 apresenta os dados da tabela, em forma de um gráfico de barras agrupadas. Uma alternativa ao gráfico de barras agrupadas é o gráfico de barras empilhadas (Figura 3.4). ^^ GRÁFICOS
PARA DADOS NUMÉRICOS DISCRETOS
Os gráficos de barras podem ser utilizados para representar os dados numéricos discretos da
14
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica 2,4%
0,3%
Analfabeta
29,6%
Fundamental incompleto 46,0%
Fundamental completo Médio Superior
21,6%
FIGURA 3.1 Gráfico de setores mostrando a distribuição da frequência da escolaridade de 962 gestantes do Hospital Geral de Caxias do Sul (RS), em 2008
50%
Porcentagem
40%
30%
20%
10%
0% Analfabeta
Fundamental incompleto
Fundamental completo
Médio
Superior
Escolaridade
FIGURA 3.2 Gráfico de barras simples mostrando a distribuição da frequência da escolaridade de 962 gestantes do Hospital Geral de Caxias do Sul (RS), em 2008
Gráficos
TABELA 3.1 Distribuição da frequência de parto normal e cesariana de acordo com a faixa etária da parturiente, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008 Faixa etária
Tipo de parto Normal
Cesariana
<20 anos
104 (68,0%)
49 (32,0%)
20 a 35 anos
439 (61,9%)
270 (38,1%)
>35 anos
49 (49,5%)
50 (50,5%)
Total
592 (61,6%)
369 (38,4%)
mesma maneira que os dados ordinais. Teoricamente, os dados numéricos discretos deveriam ser representados por linhas verticais e não por barras, já que são valores “pontuais”, porém os pacotes estatísticos mais comuns não oferecem essa facilidade. Na Figura 3.5 vê-se, representado por um gráfico de barras, o número de consultas realizadas durante o pré-natal por 861 gestantes.
15
^^ GRÁFICOS
PARA DADOS NUMÉRICOS CONTÍNUOS
Histograma Uma variável numérica contínua pode ter um grande número de valores e é, geralmente, impraticável fazer um gráfico sem primeiro agrupar os valores. Os dados agrupados são representados utilizando um histograma de frequência, o qual é delineado no eixo vertical, com a amplitude do grupo no eixo horizontal. Um histograma parece um gráfico de barras, mas sem quaisquer espaços entre as barras adjacentes. Isso enfatiza a natureza contínua da variável. Se os grupos da tabela de frequência são todos da mesma largura, as barras do histograma também vão ter a mesma largura. A Figura 3.6 é um histograma dos dados agrupados de uma amostra aleatória da hemoglobina de 70 gestantes e possibilita que se examine o formato da distribuição dos dados. Observe que a distribuição é relativamente simétrica.
80%
70%
60%
50% Normal
40%
Cesariana
30%
20%
10%
0% <20 anos
20 a 35 anos
>35 anos
FIGURA 3.3 Gráfico de barras agrupadas mostrando a distribuição da frequência de parto normal e cesariana de acordo com a faixa etária da parturiente, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008
16
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
100% 90% 80% 70% 60% Normal
50%
Cesariana
40% 30% 20% 10% 0% <20 anos
20 a 35 anos
>35 anos
FIGURA 3.4 Gráfico de barras empilhadas mostrando a distribuição da frequência de parto normal e cesariana de acordo com a faixa etária da parturiente, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008
125
Frequência
100
75
50
25
0 0
1
2
3
4
5
6
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Número de consultas no pré-natal
FIGURA 3.5 Gráfico de barras mostrando a distribuição do número de consultas realizadas no pré-natal por 861 gestantes de partos a termo, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008
CAPÍTULO
5
Resumo dos Dados Numéricos
^^ INTRODUÇÃO
Conforme visto nos capítulos anteriores, é possível descrever o conjunto de dados brutos, organizando-os em forma de tabelas e de gráficos. Além disso, pode-se examinar a forma de sua distribuição. Esses procedimentos farão com que os dados deixem de ter uma imagem confusa e passem a fazer sentido. No entanto, muitas vezes é mais útil resumir ainda mais os dados numéricos, apresentando um ou alguns valores que sejam representativos desses dados. As maneiras mais utilizadas para resumir o conjunto de dados são: nn Primeiro, um valor em torno do qual os dados têm uma tendência para se reunir ou se agrupar, denominado medida sumária de localização ou medida de tendência central. nn Em segundo lugar, um valor que mede o grau em que os dados se dispersam, denominado medida de dispersão ou variabilidade. É possível comparar diferentes conjuntos de dados quantitativos com esses dois valores resumidores. ^^ MEDIDAS
DE TENDÊNCIA CENTRAL
Costuma ser empregada uma das seguintes medidas de posição central: a moda, a mediana ou a média.
Moda A moda (Mo) é a categoria ou valor dos dados que tem a maior frequência. A moda não é particularmente útil com dados contínuos
numéricos em que não há dois valores iguais. Outra desvantagem desta medida é que pode haver mais de uma moda em um conjunto de dados. Como exemplo, observe a Tabela 5.1 que mostra o volume expiratório forçado em 1s (VEF1) de 42 escolares asmáticos. Verifica-se que há dois valores que aparecem com maior frequência: 0,91 e 0,99L. Cada um deles ocorre três vezes na amostra. Nesse caso, tem-se uma amostra bimodal. Se houvesse um valor que ocorresse com maior frequência, teríamos uma distribuição unimodal. Caso não haja observação mais frequente, a distribuição é amodal.
Mediana A mediana (Md) representa o valor central em uma série ordenada de valores. Assim, metade dos valores será igual ou menor que o valor mediano e a outra metade igual ou maior do que ele. Suponha que se disponha de n valores dispostos em ordem crescente. Então, a mediana é o valor localizado na posição dada pela fórmula: 1 Md (n 1) 2
A equação correspondente à mediana dos dados da Tabela 5.1 é: 1 46 Md ( 42 1) 21, 5 valor 2 2
26
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
TABELA 5.1 Valores do VEF1 (L) de 42 escolares asmáticos no início do tratamento, no Ambulatório de Doenças Respiratórias Pediátricas (Adrep), Caxias do Sul (RS), em 1998 Paciente
VEF1
Paciente
VEF1
1
0,61
22
1,02
2
0,65
23
1,02
3
0,65
24
1,03
4
0,66
25
1,04
5
0,77
26
1,05
6
0,80
27
1,06
7
0,82
28
1,10
8
0,82
29
1,11
9
0,89
30
1,17
10
0,91
31
1,21
11
0,91
32
1,21
12
0,91
33
1,23
13
0,93
34
1,25
14
0,95
35
1,28
15
0,95
36
1,29
16
0,97
37
1,29
17
0,98
38
1,32
18
0,98
39
1,35
19
0,99
40
1,36
20
0,99
41
1,49
21
0,99
42
1,79
VEF1: volume expiratório forçado em 1s.
Portanto, a mediana é o 21,5o valor. Este é obtido somando-se o 21o valor com o 22o e dividindo por dois. Ou seja, a mediana (0,99 + 1,02)/2 = 1,005L. Consequentemente, pode-se afirmar que, nessa amostra de 42 escolares asmáticos em início de tratamento, 50% tiveram um VEF1 abaixo de 1,005L e 50% tiveram um VEF1 acima desse valor. A mediana é útil para resumir dados assimétricos, pois ela não é sensível aos valores extremos. No exemplo apresentado, se houvesse a substituição do valor 0,61 por 0,061, a mediana permaneceria a mesma.
Média A média é o resultado da razão entre a soma de todos os valores observados e o número total de observações. A média da população é
representada pela letra grega µ e a média da amostra pelo símbolo (leia-se, x barra). x 1 i xi N N
Média populacional
x 1 x i xi n n
Média amostral
Em que: N = número total de valores observados na população. n = número total de valores observados na amostra. xi = conjunto de valores observados, x1, x2, x3,..., xn. Como normalmente não se consegue trabalhar com toda a população, calcula-se . A média tem indicação de uso em distribuições simétricas. Possui o maior poder matemático e é a medida descritiva mais utilizada (e preferida). A média não é necessariamente igual a algum dos valores da amostra. Ela é apenas uma expectativa matemática. A média dos valores da Tabela 5.1 é igual a: 0 , 61 0 , 65 0 , 65 ... 1, 49 1, 79 42 43, 80 1, 04L 42
x
Uma das propriedades da média é que, se ela for subtraída de cada um dos valores da amostra, a soma destas diferenças é zero (Tabela 5.2). Quando o número de observações no conjunto de dados é pequeno e/ou a distribuição assimétrica, a média pode representar uma informação distorcida. Isso porque a média é muito sensível aos valores extremos. Por exemplo, se o valor 0,61 da Tabela 5.1 fosse substituído, por erro de digitação, por 0,061, a média diminuiria para 1,03L. Se esse erro fosse cometido com o valor 1,79, digitando-o 17,9, a média subiria para 1,43. Isto mostra a tendência da média em acompanhar os valores extremos. Conforme aumenta o número de observações, diminui a influência dos extremos.
27
Resumo dos Dados Numéricos
TABELA 5.2 Diferença entre os valores e a média Paciente
xi
x
d = xi – x
1
0,61
1,04
–0,43
2
0,65
1,04
–0,39
3
0,65
1,04
–0,39
4
0,66
1,04
–0,38
5
0,77
1,04
–0,27
6
0,80
1,04
–0,24
FIGURA 5.1 Distribuição simétrica
7
0,82
1,04
–0,22
x: média da amostra; Md: mediana.
8
0,82
1,04
–0,22
9
0,89
1,04
–0,15
10
0,91
1,04
–0,13
—
—
—
—
21
0,99
1,04
–0,05
22
1,02
1,04
–0,02
—
—
—
—
32
1,21
1,04
0,17
33
1,23
1,04
0,19
34
1,25
1,04
0,21
35
1,28
1,04
0,24
36
1,29
1,04
0,25
37
1,29
1,04
0,25
38
1,32
1,04
0,28
39
1,35
1,04
0,31
40
1,36
1,04
0,32
41
1,49
1,04
0,45
42
1,79
1,04
0,75
Soma das diferenças
0,0
x: média da amostra; xi: conjunto de valores observados, x1, x2, x3,..., xn; d: diferença.
Além disso, a média não pode ser usada com os dados ordinais, pois, por não serem números reais, eles não podem ser somados ou divididos. Em distribuições simétricas, a média e a mediana têm o mesmo valor (Figura 5.1). No exemplo, a média e a mediana têm valores muito semelhantes. Isso leva a supor que a distribuição dessa amostra é simétrica. Quando a média é maior que a mediana, a distribuição tem assimetria positiva, pois a média tende a acompanhar os valores mais altos; quando a média é menor do que a mediana, diz-se que a distribuição tem assimetria negativa (Figura 5.2).
x Md
+
Md
x
–
x
Md
FIGURA 5.2 Distribuições assimétricas x: média da amostra; Md: mediana.
Qual a medida de localização mais apropriada? O principal aspecto a ser lembrado é que a média não pode ser utilizada com os dados ordinais. Isso porque estes não são números reais e a mediana pode ser usada para os dados ordinais e numéricos, particularmente quando os últimos têm distribuição assimétrica. A Tabela 5.3 resume a utilização das medidas de tendência central. TABELA 5.3 Escolha da medida de posição mais apropriada Tipo de variável
Medida de tendência central Moda
Mediana
Média
Nominal
Sim
Não
Não
Ordinal
Sim
Sim
Não
Discreta
Sim
Sim
Contínua
Não
Sim, se a distribuição for assimétrica
Sim
28
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
^^ MEDIDAS
DE DISPERSÃO
Amplitude É a diferença entre o maior e o menor valor do conjunto de dados. No conjunto de medidas da Tabela 5.1 dos escolares asmáticos, a amplitude é igual a: Amplitude = 1,79 – 0,61 = 1,18L A amplitude é uma medida simples de dispersão, de variabilidade dos dados, mas é pouco informativa. Pode acarretar informações distorcidas da verdadeira variabilidade, pois são usados apenas dois dados da amostra para calculá-la. A amplitude não é afetada pela assimetria, mas é sensível à adição ou à remoção de um valor atípico.
Intervalo interquartil
1,75
P75
P25
–3s
–2s
–1s
1,25
1,00
0,75
25% 25%
25%
42
1,50
VEF1
Os percentis são valores específicos de uma distribuição que servem para dividi-la em 100 partes. Já os quartis são valores específicos de uma distribuição que a dividem em quatro partes. O primeiro quartil (percentil 25) delimita o primeiro quarto, ou seja, o ponto abaixo do qual temos 25% dos dados e acima do qual temos 75%. A mediana – ou percentil 50 – (segundo quartil) divide a série na metade e o quartil superior (P75 ou percentil 75) delimita a quarta parte restante (Figura 5.3). A distância entre o primeiro e o terceiro quartil é denominada intervalo (ou amplitude) interquartil (IIQ). Considere a frequência de distribuição de uma variável (p. ex., os valores do VEF1 dos 42 asmáticos mostrados na Tabela 5.1). O percentil
(P) é o valor na posição equivalente a P/100 (n + 1). Logo, a posição na série ordenada dos dados o P25 é igual a 25/100 (42 + 1) ≅ 11. O 11o valor é 0,91; logo, o P25 é igual a 0,91. Da mesma maneira, conclui-se que o P75 é igual a 1,21. Consequentemente, o IIQ é igual a 0,91 a 1,21L. Isto significa que 50% (75% – 25%) dos asmáticos, quando iniciaram o tratamento, tinham VEF1 variando de 0,91 a 1,21L. Além disso, costuma-se representar o intervalo interquartil por meio do box-and-whisker-plot, em que a borda superior da caixa representa o P75 e a borda inferior o P25. A altura da caixa é o IIQ. A linha média (Figura 5.4) representa a mediana (P50). As linhas que se projetam para fora da caixa em ambos os lados foram chamadas por John Wilder Tukey (1915-2000), idealizador do boxplot, de whiskers (“bigodes de gato”, em inglês). Em distribuições simétricas, as linhas representam os valores mínimos e máximos. Em conjunto de valores assimétricos, os dados dos valores mínimo e máximo podem se distanciar de forma substancial dos percentis 25 e 75. Assim, seus valores são assinalados separadamente no boxplot e as linhas são recolhidas para posições mais próximas. As linhas, ou whiskers, situam-se até 1,5 IIQ acima ou abaixo dos percentis 25 e 75. Os valores acima de 1,5 IIQ são considerados
25% Média
FIGURA 5.3 Intervalo interquartil
1s
2s
3s
FIGURA 5.4 Valores do VEF1 no início do tratamento em 42 escolares asmáticos VEF1: volume expiratório forçado em 1s (L).
PARTE
III
Medidas Básicas em Epidemiologia
Capítulo 6
Medidas de Frequência, 35
Capítulo 7
Medidas de Associação, 41
Capítulo 8
Medidas de Impacto, 47
Capítulo 9
Análise de Sobrevida, 53
CAPÍTULO
7
^^ RISCO
Medidas de Associação
RELATIVO
O risco relativo (RR) é a razão entre a incidência do desfecho em indivíduos expostos e a incidência do desfecho em indivíduos não expostos. O RR estima a magnitude da associação entre a exposição e o desfecho (doença). Em outras palavras, compara a probabilidade de ocorrência do desfecho entre os expostos com a probabilidade de ocorrência do desfecho nos não expostos. A partir da tabela de contingência 2 × 2 (Tabela 7.1), tem-se que o estimador do RR é dado por: RR =
a/(a + b) Incidência em expostos = Incidência em não expostos c/(c + d)
Observando os resultados do estudo da Tabela 7.2, modificada, verifica-se que os autores usaram a taxa de incidência ou a densidade de incidência em função de que nem todos os indivíduos estiveram expostos pelo mesmo tempo. Por isso, a expressão pessoas-tempo (pessoasano) aparece como denominador no cálculo da incidência. TABELA 7.1 Tabela de contingência 2 × 2, para o cálculo do risco relativo Durante o acompanhamento Doença
Sem doença
Expostos
a
b
a+b
Não expostos
c
d
c+d
a+c
b+d
Apesar do enfoque dos autores do artigo estar correto ao usarem a taxa ou a densidade de incidência, os dados serão utilizados com objetivo didático, sem levar em consideração o tempo a que cada indivíduo ficou exposto. Também será calculado o RR, usando a incidência cumulativa. Nessa coorte de 2.889 indivíduos com transtornos de sono, encaminhada para avaliação em uma clínica do sono, 1.579 tinham, na avaliação inicial, apneia obstrutiva do sono (AOS) e se constituíram no grupo exposto. No acompanhamento evolutivo, no grupo exposto (com AOS), 627 indivíduos desenvolveram hipertensão arterial; no grupo controle de 310 indivíduos, sem AOS, 78 tornaram-se hipertensos (Tabela 7.3). 627 0, 397 1.579 78 0, 252 Inão exposto 310 I exposto 0, 397 RR Inão exposto 0, 252 Iexposto
1, 578 ( IC 95%: 1, 290 1, 930 )
Isto sugere que os indivíduos com AOS têm risco maior de desenvolver hipertensão quando comparados com os controles. Quanto maior o RR, mais forte é a associação entre a doença em questão e a exposição ao fator de risco. Um RR igual a 1 indica que a doença e a exposição ao fator de risco não estão relacionadas. Valores menores que 1 indicam uma associação negativa entre o fator de risco e a doença (efeito protetor).
42
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
TABELA 7.2 Taxa bruta de incidência de hipertensão em controles e em pacientes com apneia obstrutiva do sono tratados ou não tratados com pressão positiva contínua nas vias respiratórias Pacientes com AOS Controles n = 310
Inelegíveis para CPAP n = 462
Recusaram CPAP n = 195
Não aderiram ao CPAP n = 98
Tratados com CPAP n = 824
Hipertensão, n
78
175
119
53
280
Total de pessoas-ano, n
3.563
5.239
2.037
1.015
9.149
Densidade de incidência bruta, n por 100 pessoas-ano (IC95%)
2,19 (1,71 a 2,67)
3,34 (2,85 a 3,82)
5,84 (4,82 a 6,86)
5,12 (3,76 a 6,47)
3,06 (2,70 a 3,41)
AOS: apneia obstrutiva do sono; CPAP: pressão positiva contínua nas vias respiratórias. Fonte: adaptada de Marin et al., 2012.
TABELA 7.3 Tabela 2 × 2 modificada do estudo de Marin et al., 2012 Durante o acompanhamento desenvolveram Hipertensão
Não
AOS
627
952
1.579
Controles
78
232
310
Total
705
1.184
1889
AOS: apneia obstrutiva do sono.
^^ ODDS
Razão de chances A odds ratio (OR), ou razão de chances, é a razão entre dois odds. A OR costuma estar associada a estudos retrospectivos do tipo caso-controle com desfechos dicotômicos. Ela expressa a razão entre a odds de exposição entre os que têm o desfecho (casos) e a odds de exposição nos livres de desfecho (controles). Usando a Tabela 7.4, pode-se calcular a OR, também descrita como razão dos produtos cruzados, pela fórmula:
RATIO
A odds (chance) é a razão entre o número de observações em um grupo que tem determinada característica e aqueles que não a possuem. Representa a probabilidade de um caso ter sido exposto dividido pela probabilidade de um caso não ter sido exposto. A odds é a razão entre duas características complementares, ou seja, a probabilidade de que um evento ocorra (p) dividido pela probabilidade de que o evento não ocorra (1 – p). odds
p 1 p
OR =
a a× d = c = Oddsexposição Não doentes b c × b d Oddsexposição Doentes
Em um estudo caso-controle de base populacional (Tabela 7.5) para verificar a associação entre o uso de chupeta durante o sono e risco de síndrome da morte súbita infantil (SIDS; do inglês, sudden infant death syndrome), foi encontrada uma OR bruta igual a (ver também Capítulo 11, Estudos Observacionais, no item Estudos Caso-controle). TABELA 7.4 Tabela de contingência 2 × 2 para cálculo da odds ratio
Consequentemente: odds p 1 odds
Doença
Sem doença
Expostos
a
b
a+b
Não expostos
c
d
c+d
a+c
b+d
Medidas de Associação
TABELA 7.5 Tabela 2 × 2 da associação entre o uso de chupeta durante o sono e risco de SIDS Uso de chupeta
Casos* (SIDS)
Controles
Sim
7
73
Não
162
236
Total
169
309
*Os números na tabela não correspondem aos números totais (185 casos versus 312 controles), em razão de dados perdidos. SID: síndrome da morte súbita infantil (do inglês, sudden infant death syndrome) Fonte: adaptada de Li et al., 2006.
7 7 236 1.652 162 OR 0 ,14 73 162 73 11.826 236 IC95% 0 , 06 0 , 31
A OR varia de 0 ao infinito. Quando o valor da OR se aproxima de 1, a doença e o fator de risco não estão associados. Acima de 1, significa que existe associação e valores menores de 1 indicam uma associação negativa (efeito protetor). No exemplo citado, as crianças que usaram a chupeta na noite anterior tiveram efeito protetor para a SIDS. A distribuição da OR é assimétrica (skewed). Por isso, às vezes, utiliza-se o logaritmo natural (ln) OR, em vez da OR. Um exemplo é o ln OR comparando crianças que morreram de SIDS e sem SIDS com relação à chupeta – ln (0,14) = –2. Um ln OR igual a 0 significa que não há associação entre o fator de risco e o desfecho. Um ln OR acima de 2 indica grande associação entre o fator e o desfecho. No exemplo, tem-se um efeito protetor, pois o ln OR é negativo (–2).
Odds ratio e risco relativo A OR não deve ser entendida como uma medida aproximada do RR, exceto para doenças raras (doenças, em geral, com prevalência menor do que 10%). Caso contrário, a OR tenderá a superestimar a magnitude da associação e a OR afasta-se da hipótese nula da não associação (OR = 1), independentemente de ser um fator de risco ou de proteção. O viés responsável pela discrepância entre as estimativas do RR e da OR – built-in bias – pode ser definido como a razão entre a OR e o RR estimados. Multiplicando o built-in bias pelo RR, obtém-se a OR: 1 p doença não expostos OR RR 1 p doençaexpostos c 1 c d RR 1 a a b
Se o built-in bias é igual a 1, não há viés. No exemplo da provável proteção contra a SIDS pelo uso da chupeta, o viés é igual a: c 162 1 c d 1 162 236 0, 65 Viés 1 a 1 7 a b 7 73
Logo, multiplicando o RR = (7/80)/(162/398) = 0,215 pelo built-in bias, obtém-se: OR = RR × viés = 0,215 × 0,65 = 0,14 Na Tabela 7.6, é mostrada uma relação entre a OR e o RR.
TABELA 7.6 Força de associação do risco relativo comparado com a odds ratio Insignificante
Pequena
Moderada
Muito grande
Grande
Quase perfeita
Perfeita
RR
1,0
1,2
1,9
3,0
5,7
19
∞
OR
1,0
1,5
3,5
9,0
32
360
∞
Fonte: adaptada de http://www.sportsci.org/resource/stats/.
43
44
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
^^ RAZÃO
DE PREVALÊNCIA
Com o mesmo princípio das duas medidas anteriores, a razão de prevalências (RP) compara a prevalência do desfecho entre os expostos com a prevalência do desfecho entre os não expostos. Matematicamente, a RP é calculada de maneira semelhante ao RR. Apenas, deve-se ter em mente que o desfecho e a exposição foram medidos no mesmo momento, enquanto para o cálculo do RR há necessidade de estimar a incidência que exige passagem de tempo. Usando uma tabela de contingência 2 × 2 (Tabela 7.7), tem-se: a (a b) RP c Prevalência de doençanão expostos (c d) Prevalência de doençaexp ostos
Também é possível verificar a prevalência de exposição entre doentes e não doentes: RP
Prevalência de exposiçãodoentes Prevalência de exposiçãonão doentes
a (a c ) b (b d)
Em um estudo transversal, os autores encontraram maior prevalência de infecções congênitas entre as puérperas com idade acima de 20 anos, em comparação com as mulheres com menos de 20 anos (Tabela 7.8).
P 20 anos
129 0 ,102 1.266
TABELA 7.7 Tabela de contingência 2 × 2, para o cálculo da razão de prevalências No momento Doença
Sem doença
Expostos
a
b
a+b
Não expostos
c
d
c+d
a+c
b+d
TABELA 7.8 Infecções perinatais e idade da gestante Gestante infectada Sim
Não
>20 anos
129
1.137
1.266
≤20 anos
9
225
234
Total
138
1.362
1.500
Fonte: adaptada de Madi et al., 2010.
P 20 anos
9 0 , 038 234
129 RP 1, 266 2, 649 (IC95% : 1, 368 5,132) 9 234
A frequência de infecções congênitas entre as puérperas com mais de 20 anos de idade foi, aproximadamente, 2,7 vezes maior do que entre as com 20 anos ou menos. No Capítulo 2, Tabelas, na Tabela 2.8, é mos trado outro exemplo do uso da razão de prevalências. ^^ TAMANHO
DE EFEITO PADRONIZADO
O tamanho de efeito padronizado (TEP) compara a diferença das médias de dois grupos e estima a magnitude dessa diferença. Tal como as medidas anteriores, é considerada uma estatística de efeito para a avaliação das associações e suas magnitudes. Possui outros nomes: d de Cohen, tamanho de efeito (originado do inglês effect size) e diferença de médias padronizada. Ao contrário do RR, da OR e da RP, que são estatísticas usadas em variáveis categóricas, o TEP foi concebido para ser utilizado com variáveis quantitativas. TEP(d)
x1 x2 sc
CAPÍTULO
8
Medidas de Impacto
^^ RISCO
ATRIBUÍVEL OU REDUÇÃO ABSOLUTA DO RISCO
Diferentemente das medidas apresentadas anteriormente (risco relativo [RR], odds ratio [OR] e tamanho de efeito padronizado [TEP]), o risco atribuível (RA) tem características de medida de impacto. O RA, em vez de concentrar-se na associação em si, refere-se mais às consequências e às repercussões da exposição sobre a ocorrência do desfecho. O RA é a medida do excesso ou do acréscimo absoluto de risco que pode ser atribuído à exposição. Com o RA, é possível estimar o número de casos que podem ser prevenidos se a exposição for eliminada e, assim, mensurar a magnitude do impacto em termos de saúde pública imposto por essa exposição. O risco de desenvolver o desfecho (incidência) está aumentado em RA nos indivíduos expostos em comparação com os que não estão expostos. Nos estudos de coorte, costuma-se usar mais a expressão “risco atribuível” ou “diferença de risco”. Nos ensaios clínicos, emprega-se mais a expressão redução absoluta do risco (RAR), pois se espera que a intervenção reduza o risco. Calcula-se o RA ou a RAR pela diferença absoluta entre as incidências dos expostos (Ie) e não expostos (Ine): RA ou RAR = |Ie – Ine| Utilizando a tabela de contingência 2 × 2 (Tabela 8.1), fica expressa da seguinte maneira:
TABELA 8.1 Tabela de contingência 2 da RAR
× 2 para o cálculo do RA ou
Durante o acompanhamento Doença
Sem doença
Expostos
a
b
a+b
Não expostos
c
d
c+d
a+c
b+d
a c RA ouRAR a b c d
No Capítulo 7, Medidas de Associação, no estudo de coorte sobre apneia obstrutiva do sono (AOS) e hipertensão, verificou-se que a incidência de hipertensão arterial em indivíduos portadores e não portadores de AOS foi respectivamente: = Ie
627 78 = 0 , 397 = Ine = 0 , 252 1579 310
Dessa maneira, o RA é igual a: RA 0 , 397 0 , 252 0 ,145 IC95% : 0 , 091 a 0 ,199
Este resultado mostra que os indivíduos expostos (portadores de AOS) têm 15% a mais de risco (Figura 8.1) comparado com os não expostos de apresentar o evento em questão (hipertensão).
48
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
Logo,
45% 40% 35%
RAP
15%
30% 25%
RR 1 RR
Substituindo no exemplo anterior, em que o RR = 0,397/0,252 = 1,575, tem-se:
20% 15% 10%
RAP
5% 0%
Incidência em expostos
Incidência em não expostos
FIGURA 8.1 Risco atribuível
^^ RISCO
ATRIBUÍVEL PROPORCIONAL
O RA expresso com relação à incidência nos expostos e apresentado em percentual é denominado risco atribuível proporcional (RAP) ou fração etiológica nos expostos. O RAP informa qual a proporção de desfecho, expressa em porcentagem, entre os expostos que poderiam ter sido prevenidos se a exposição fosse eliminada. É dada pela fórmula: RA
Ie Ine 100 Ie
^^ REDUÇÃO
0 , 397 0 , 252 100 0 , 365 100 36 , 5% 0 , 397
Dessa maneira, 36,5% da incidência de hipertensão nos expostos pode ser atribuída à AOS. Outra forma de se chegar a esse mesmo resultado é por meio do RR (ver Capítulo 7, Medidas de Associação), usando a seguinte fórmula: I I I I RAP e ne 100 e ne 100 I e Ie Ie 1 1 100 1 100 I RR e I ne
RELATIVA DO RISCO
O RAP é calculado quando o RR é maior do que 1, ou seja, quando a exposição é um fator de risco para a doença. Quando o RR é menor do que 1 e, portanto, a exposição é um fator de proteção, como se espera que ocorra nos ensaios clínicos, pode-se calcular a redução relativa do risco (RRR): RRR
Ine Ie 100 Ine
Como a incidência nos expostos é igual à taxa de eventos nos expostos (TEE) e a incidência em não expostos é igual à taxa de eventos nos controles (TEC), pode-se escrever a fórmula da seguinte maneira: RRR
Portanto, no exemplo mostrado no RA, tem-se: RAP
1, 575 1 100 36 , 5% 1, 575
TEC TEE 100 TEC
O Physicians’ Health Study (1989) é um ensaio clínico randomizado controlado, duplo-cego, desenvolvido com o objetivo de determinar se uma dose baixa de aspirina (325mg a cada 48h) diminui a mortalidade cardiovascular e se o betacaroteno reduz a incidência de câncer. Participaram desse estudo 22.071 indivíduos por uma média de 60,2 meses (Tabela 8.2). O estudo TABELA 8.2 Resultados do Physicians’ Health Study Desfechos por ano IAM
Sem IAM
Aspirina
139
10.898
11.037
Placebo
239
10.795
11.034
IAM: infarto agudo do miocárdio.
Medidas de Impacto
do componente aspirina mostrou os seguintes resultados: Calculando-se a incidência de infarto agudo do miocárdio (IAM) em ambos os grupos, tem-se: TEE(Ie ) =
Número de eventosexp ostos Total sujeitosexp ostos
=
139 = 11..037
= 0 , 0126 por ano
TEC(Ine ) =
Número de eventosnão exp ostos Total sujeitosnão exp ostos
=
239 = = 0 , 0217 por ano 11.034
Logo, a RRR encontrada é: RRR
0 , 0217 0 , 0126 100 0 , 42 100 42% 0 , 0217
49
^^ NÚMERO
NECESSÁRIO PARA TRATAR
O número necessário para tratar (NNT) é sempre um número inteiro e significa a estimativa do número de indivíduos que devem receber uma intervenção terapêutica, durante um período específico de tempo, para evitar um efeito adverso ou produzir um desfecho positivo. O NNT equivale à recíproca da redução absoluta do risco (RAR) ou diferença de risco: NNT =
1 RAR
Conhecer o NNT ajuda os médicos no processo de pesar os benefícios e os riscos de um tratamento. No exemplo, mostrado no Physicians’ Health Study (ver Tabela 8.2), tem-se que: RAR = |0,0126 – 0,0217| = 0,0091
Da mesma maneira que o RAP, a RRR pode também ser calculada facilmente pela seguinte fórmula, usando o RR: TEC TEE TEC TEE RRR 100 100 TEC TEC TEC (1 RR ) 100
No exemplo do Physicians’ Health Study, o RR = TEE/TEC = 0,0126/0,0217 = 0,58, consequentemente: RR = (1 – RR) × 100 = (1 – 0,58) × 100 = = 0,42 × 100 = 42% Ou seja, os resultados mostram redução de 42% no risco de IAM no grupo que usou aspirina e a conclusão dos autores foi que esse ensaio clínico evidenciou, com relação à prevenção primária de doença cardiovascular, diminuição no risco de IAM. No entanto, as evidências quanto ao acidente vascular encefálico (AVE) (dano) permanecem inconclusivas. Quando o risco de dano é muito alto ou esse dano é muito grave, deve-se fazer um balanço entre o risco e o benefício.
Logo, o NNT é igual a: NNT
1 109 , 9 110 0 , 0091
IC95% : 80 177
No exemplo, NNT igual a 110 significa que é necessário tratar 110 pacientes com aspirina para evitar IAM. Suponha que determinada doença tenha letalidade de 100% em indivíduos não tratados e 50% nos tratados. O RR é igual a 0,5; a RRR, a 0,5; a RAR, a 0,5; e o NNT, a 2. Agora, se a letalidade dos não tratados for igual 10% e 5% nos tratados, haverá o mesmo RR de 0,5 e a mesma RRR igual a 0,5 e RAR de 0,05 e NNT de 20. Portanto, com RRR constante, o NNT está inversamente relacionado com a proporção de indivíduos no grupo-controle que têm um evento adverso. O NNT também é inversamente proporcional à RRR. Com um mesmo risco basal, um tratamento mais efetivo com o dobro de RRR reduzirá o NNT pela metade. O NNT pode ser calculado também pela recíproca da multiplicação da TEC pela RRR. NNT
1 ( TEC RRR )
50
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
^^ NÚMERO
NECESSÁRIO PARA CAUSAR DANO
ARA = |TEE – TEC| = 0,0108 – 0,0089 = 0,0019
Deve-se comparar o NNT com o número necessário para causar dano (NND). O NND deve ser interpretado como o número de pacientes tratados para que um deles apresente um efeito adverso e é calculado pela recíproca do aumento do risco absoluto (ARA), equivalente à diferença de risco ou risco atribuível: NND =
ARA = |Ie – Ine| ou ARA = |TEE – TEC| No Physicians’ Health Study sobre o uso de aspirina na prevenção de IAM, foram verificados também os efeitos colaterais da aspirina (Tabela 8.3), como o AVE.
=
TEE (Ine ) = =
Número de eventosexp ostos Total de sujeitosexp ostos
=
9 119 = 0 , 0108 por ano 11.037
Número de eventosnão exp ostos Total de sujeitosnão exp ostos 98 = 0 , 0089 por ano 11.034
1 = 526 0 , 0019
Ou seja, para evitar um IAM, há a necessidade de tratar 110 pacientes. Além disso, a cada 526 tratados espera-se um caso de AVE, havendo um benefício bem maior. ^^ RISCO
1 ARA
O ARA é calculado da mesma maneira que a RAR:
TEE (Ie ) =
= NND
ATRIBUÍVEL POPULACIONAL
O RA estima o impacto da exposição em estudo apenas sobre os expostos, sem informar o excesso de casos em toda a população. O risco atribuível populacional (RApop) mede o excesso de incidência da doença em uma população total que está associada à exposição, informação útil no planejamento em saúde pública. O RApop é dado pela diferença entre a incidência da doença na população total (Ipop) e a incidência em não expostos (Ine). RApop = Ipop – Ine A incidência populacional (Ipop) é dada conhecendo-se a proporção da população que está exposta (p = prevalência) e a proporção não exposta na população (q = 1 – p). Dessa maneira, a Ipop é igual a: Ipop = (Ie × p) + (Ine × q)
=
Retornando ao exemplo mostrado no RA sobre AOS e hipertensão (ver Tabela 8.1), verificouse que o RA é igual a 0,145. Portanto, supondo que a prevalência de AOS na população seja de 4%, a Ipop é igual a: 627 = 0 , 397 1579 78 = Ine = 0 , 252 310
= Ie TABELA 8.3 Physicians’ Health Study: efeitos colaterais da aspirina (número necessário para causar dano) Desfechos por ano AVE
Sem AVE
Logo, o RApop é igual a:
Aspirina
119
10.918
11.037
Placebo
98
10.936
11.034
AVE: acidente vascular encefálico.
Ipop = (0,397 × 0,04) + (0,252 × 0,96) = 0,258
RApop = Ipop – Ine = 0,258 – 0,252 = = 0,006 ou 0,6%
PARTE
IV
Delineamentos de Pesquisa
Capítulo 10
Delineamentos de Pesquisa, 63
Capítulo 11
Estudos Observacionais, 65
Capítulo 12
Ensaios Clínicos, 73
Capítulo 13
Revisão Sistemática, 81
Capítulo 14
Testes Diagnósticos, 89
Capítulo 15
Vieses, 101
CAPÍTULO
12
Ensaios Clínicos
^^ INTRODUÇÃO
Experimentos são os estudos em que o pesquisador manipula a variável preditora (a intervenção) e observa o efeito no desfecho avaliado ao longo do tempo. A abordagem experimental, especificamente o ensaio clínico randomizado controlado, é a ferramenta de escolha para comparar terapêuticas ou intervenções. Os estudos experimentais podem também comparar os cuidados prestados por serviços de saúde, programas de educação em saúde e estratégias administrativas. Os estudos experimentais realizados com seres humanos são denominados ensaios clínicos. Nos ensaios clínicos não controlados, os indivíduos servem como seus próprios controles (antes e depois). Os resultados desses estudos estão sujeitos a vários problemas: nn Melhora previsível: o paciente melhora espontaneamente e não pelo tratamento. nn Flutuação na gravidade da doença: o paciente melhora não pela intervenção, mas por oscilação na gravidade da doença. nn Efeito Hawthorne: o indivíduo melhora pela atenção e não pela terapêutica. Uma limitação importante surge quando se quer avaliar a evolução de um grupo selecionado por estar no extremo de uma distribuição sem que haja um grupo-controle. Empiricamente, observa-se que indivíduos encontrados em determinado momento, em um dos extremos de uma distribuição, tendem a estar menos distantes da média em um momento posterior, sem que qualquer intervenção se tenha
desenvolvido. Esse fenômeno é conhecido como efeito de regressão à média. Por exemplo, uma pessoa com doença crônica tem dias piores e outros melhores. Se ela é medicada com gotas homeopáticas ou faz uso de florais nos dias em que se sente excepcionalmente mal, vai notar frequente melhora, ao seguir esses “tratamentos”. Não que eles funcionem, mas eles atendem à regressão à média. ^^ CARACTERÍSTICAS
DO ENSAIO
CLÍNICO Um ensaio clínico deve ter algumas características fundamentais (Figura 12.1). Os indivíduos devem ser designados por meio de randomização para os grupos de comparação: nn A randomização é a melhor abordagem no delineamento de um ensaio clínico. ll Randomizar significa sortear (por meio de computadores, tábua de números aleatórios) os indivíduos para decidir a alocação destes em um dos grupos de estudo. O elemento decisivo da randomização é a imprevisibilidade da próxima alocação. nn O pesquisador compara o grupo de estudo com um grupo-controle apropriado. nn O investigador manipula a variável independente (preditora).
Exemplo de ensaio clínico Dexametasona oral para bronquiolite: um ensaio clínico randomizado.
74
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
População definida
Randomização
Grupo experimental
Desfecho clínico
Sem desfecho clínico
Grupo-controle
Desfecho clínico
Sem desfecho clínico
FIGURA 12.1 Desenho de um ensaio clínico randomizado controlado
RESUMO nn Objetivo:
determinar se o tratamento com dexametasona adicionado ao salbutamol reduz o tempo para alta em pacientes com bronquiolite e possível asma. nn Métodos: comparamos a eficácia e segurança da dexametasona, 1mg/kg, depois 0,6mg/kg por mais 4 dias, com placebo para bronquiolite aguda em pacientes com risco de asma, conforme determinado por eczema ou história familiar de asma em um parente de primeiro grau. Todos os pacientes receberam salbutamol inalado. O tempo rapidez para alta foi o resultado primário de eficácia. (Figura 12.2). nn Resultados: duzentos bebês previamente saudáveis com diagnóstico de bronquiolite, idade mediana de 3,5 meses, foram incluídos. Cinco lactentes que receberam placebo precisaram de internação na unidade de terapia intensiva durante o tratamento na enfermaria (p = 0,02). Entre 100 lactentes que receberam dexametasona, a média geométrica de tempo até a alta foi de 18,6h (IC95%, 14,9 a 23,1h); entre 90 pacientes controle, 27,1h (IC95%, 21,8 a 33,8 h). A proporção, 0,69 (IC95%, 0,51 a 0,93), revelou redução média de 31% do tempo de internação, favorecendo a dexametasona (p = 0,015). Vinte e dois pacientes com dexametasona e 19 pacientes controle foram readmitidos para a curta permanência na enfermaria na semana após a alta (p = 0,9). Nenhuma hospitalização ou efeitos colaterais foram relatados durante sete dias de observação. nn Conclusões: dexametasona com salbutamol encurtou o tempo permanência hospitalar durante episódios de bronquiolite em pacientes com eczema ou história familiar de asma em um parente de primeiro grau. As visitas à clínica na semana subsequente ocorreram de forma semelhante para os dois grupos. Fonte: adaptada de Alansari et al., 2013.
^^ ELEMENTOS
BÁSICOS DE UM ENSAIO CLÍNICO
Seleção dos sujeitos Os autores devem determinar e explicar detalhadamente os critérios de inclusão e exclusão (Tabela 12.1). O grau de detalhamento deve ser suficientemente preciso para que outros reproduzam o estudo. O tamanho da amostra é determinado pelo poder do teste estatístico. Poder é a habilidade de o teste estatístico detectar diferenças entre os grupos, uma vez existindo tais diferenças na população em estudo. Vale lembrar que resultados não significativos podem ser apenas uma evidência para um inadequado tamanho amostral. O grupo-controle deve ser selecionado utilizando-se os mesmos critérios do grupo experimental. Convém prestar atenção a possíveis armadilhas que podem gerar vieses: nn Uso de grupo-controle histórico (não concorrente). nn Grupo-controle selecionado de outros locais (outras clínicas, outros hospitais). O grupo-controle adequado é um grupocontrole concorrente, tratado no mesmo momento e no mesmo local do grupo experimental. O característico é o grupo-controle não receber tratamento. Mais comumente, recebem um placebo, indistinguível do tratamento experimental, porém sem componente ativo. Mesmo assim, pode haver melhora dos participantes do grupo-controle (efeito placebo). Quando não
Ensaios Clínicos
75
Avaliados para seleção (n=560)
Inscrição
Excluídos (n=360) Não atenderam os critérios de inclusão (n=200) Recusaram-se a participar (n=126) Outras razões (n=34)
Análise
Seguimento
Alocação
Randomizados (n=200)
Grupo dexametasona (n=102)
Grupo placebo (n=98)
Receberam a intervenção (n=101) Não receberam (n=1) Motivo: recusa após randomização
Receberam a intervenção (n=97) Não receberam (n=1) Motivo: recusa após randomização
Perda no seguimento (n=0)
Perda no seguimento (n=1) mas incluído na análise primária
Abandonou a intervenção (n=1) Motivo: excluído por critério: teve apneia antes da apresentação
Analizados (n=100) Excluídos da análise (n = 2), ver razões anteriores
Abandonou a intervenção (n=7) Motivo: 5 necessitaram de UTI; 2 excluídos por critério: sem eczema ou história familiar de asma
Analisados (n=90)
Excluídos da análise (n=8) Motivos: 5 necessitaram de UTI, 2 excluídos por critério, 1 recusou após randomização
FIGURA 12.2 Delineamento do estudo do exemplo de um ensaio clínico UTI: unidade de terapia intensiva.
TABELA 12.1 Função dos critérios de inclusão e exclusão nn Objetivos
dos critérios de inclusão e exclusão: ll Restringir a heterogeneidade da amostra ll Diminuir o número de variáveis independentes ll Fazer com que exista uma probabilidade maior de as diferenças nos desfechos estarem relacionadas com os tratamentos ll Melhorar a validade interna, ou seja, o grau em que os resultados do estudo são consistentes para aquela amostra particular de indivíduos. Ela depende, basicamente, do rigor metodológico usado para delinear o ensaio clínico, podendo ser ameaçada por dois tipos de erros: sistemático e aleatório ll Tornar a generalização (validade externa) mais precisa
nn Critérios
de inclusão e exclusão muito rígidos: a capacidade de generalização ll Reduzem a validade externa ll Diminuem
for ético suspender o tratamento e administrar placebo, o grupo-controle pode ser constituído por indivíduos que recebem o tratamento padrão.
Alocação A alocação deve ser aleatória. A randomização é a principal técnica para reduzir o viés, criando grupos homogêneos. Como foi visto, é uma das características fundamentais dos ensaios clínicos. O poder da randomização depende da ocultação da sequência de alocação. A randomização pode ser: nn Completa: os indivíduos que obedecem ao critério de inclusão e exclusão são randomizados de modo a todos terem a mesma probabilidade de pertencer a cada um dos grupos. Isto maximiza o poder. Pode ser feita por blocos para assegurar a igualdade numérica dos grupos (estudos multicên tricos). nn Estratificada: os participantes são estratificados de acordo com possíveis variáveis de confusão (gravidade da doença, idade, sexo etc.) e a randomização é realizada dentro de cada estrato.
76 nn
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
Randomização alocação desigual: os sujeitos têm maior probabilidade de ser randomizados em um grupo (em geral, grupo experimental) do que o outro (placebo). Este tipo de randomização tem menor poder.
Condução/seguimento/avaliação Em um ensaio clínico, deve estar assegurado de que o estudo tem um tempo de seguimento adequado, pois nem todos os indivíduos participam conforme o planejamento original. Podem ocorrer perdas de alguns pacientes durante o acompanhamento, seja porque com o tempo se descobre que eles não têm a doença em estudo ou porque não aderiram ao tratamento ou intervenção e abandonaram o estudo. Quanto maior o número de pacientes perdidos e menos informações sobre eles, há menos confiança nos resultados do estudo. De modo geral, não se deve tolerar perdas maiores que a incidência do desfecho no estudo. Uma regra simples é que perdas menores que 5% produzem pouco viés e perdas maiores que 20% são uma ameaça importante à validade do estudo. As perdas entre 5% e 20% devem ser avaliadas com cuidado, se possível utilizando-se uma análise de sensibilidade e pior cenário. Principalmente, pelo maior risco de viés, se as perdas forem diferentes nos grupos. Neste tipo de análise, nos estudos com resultado positivo, todos os pacientes perdidos no grupo experimental, inicialmente, são considerados como tendo o desfecho. Posteriormente, analisa-se como se nenhum dos indivíduos perdidos no grupo-controle tivesse alcançado o desfecho. Se o resultado permanecer positivo, as perdas não afetarão a validade do estudo. Estudos sem relato adequado ou nenhum relato de perdas ou exclusões devem ser avaliados com muito cuidado. Outro aspecto importante, no seguimento dos sujeitos da pesquisa, é o tratamento igual de todos os grupos. Para garantir este princípio, utiliza-se da técnica de cegamento ou mascaramento. Tal técnica impede que os participantes da pesquisa (pesquisadores, avaliadores e participantes) tomem conhecimento de qual grupo de tratamento o participante se encontra. Esse conhecimento antecipado pode influenciar as
expectativas, as opiniões e as crenças com relação aos resultados do estudo. O cegamento tem como principal finalidade a eliminação do viés de aferição, além de melhorar a adesão ao tratamento, reduzir as perdas de seguimento e diminuir o viés causado por cointervenções (assistência suplementar maior para um dos grupos). Quando o cegamento ocorre nos pacientes e nos pesquisadores, diz-se que o estudo é duplocego. Se ele também incluir os avaliadores do estudo, ele é triplo-cego. Um ensaio clínico em que não há cegamento é dito aberto (open label, no caso de estudos com fármacos). A avaliação dos desfechos também pode afetar os resultados. É importante garantir-se que aqueles que registram os desfechos estejam cegados com relação a que grupo o sujeito da pesquisa pertence. Os autores devem estabelecer regras cuidadosas para decidir se um desfecho ocorreu ou não e despender esforços iguais para identificar desfechos para todos os pacientes no estudo.
Intenção de tratar Os pesquisadores prejudicam a randomização se omitirem da análise os pacientes que não receberam a intervenção designada. Pior ainda, se contarem eventos ocorridos nos sujeitos não aderentes que foram designados para a intervenção contra o grupo-controle. Os sujeitos de uma pesquisa, para evitar tal viés, devem ser analisados dentro do grupo para o qual eles foram alocados pela randomização. Ou seja, a análise deve incluir todos os indivíduos que iniciaram o ensaio clínico, independentemente se eles concluíram a intervenção e o período de seguimento. Esse princípio é denominado intenção de tratar.
Análise da magnitude do efeito Calcula-se uma série de parâmetros quantitativos para analisar a magnitude do efeito da intervenção em um ensaio clínico. Entre eles, destacam- se o risco relativo (RR), a redução relativa do risco (RRR) e o número necessário para tratar (NNT)/ número necessário para causar dano (NND), conforme foi visto no Capítulo 7, Medidas de Associação e no Capítulo 8, Medidas de Impacto.
CAPÍTULO
15
Vieses
^^ INTRODUÇÃO
Uma diferença encontrada entre duas amostras aleatórias independentes deve ser analisada com cautela. Sob o ponto de vista estatísti co, essa diferença pode ser em decorrência do “acaso”. Os testes estatísticos e o intervalo de confiança informam se as variações podem ou não ser resultantes do acaso (aleatoriedade) (ver também Capítulo 17, Distribuições de Probabilidades). Por outro lado, tais diferenças podem ser decorrentes de erros sistemáticos, denomina dos vieses, e devem ser investigadas. Os vieses podem ocorrer: nn Na seleção dos indivíduos que compõem os grupos. nn Na aferição dos eventos. nn Por efeitos dos fatores de confusão. ^^ VIÉS
DE SELEÇÃO
Ocorre quando são feitas comparações entre grupos de indivíduos que diferem em outros determinantes de desfecho, além daquele que está sendo estudado. Os procedimentos para a seleção dos indiví duos de uma pesquisa dependem de inúmeros fatores: nn Delineamento do estudo. nn Condições do estudo. nn Doença e exposição de interesse. É comum os indivíduos serem selecionados de modo conveniente ao pesquisador. Isto acarreta conclusões corretas para esse grupo, mas estas não podem ser extrapoladas para a
população (validade externa). Outro problema é o voluntariado, pois os indivíduos selecionados podem diferir dos não voluntários em vários aspectos, como idade, etnia, condições socio econômicas, nível educacional e gênero. Além disso, os voluntários podem ser mais saudá veis do que aqueles que não concordam em participar do estudo. Pessoas que trabalham, em geral, são mais saudáveis que as que não traba lham. Clínicas especializadas tendem a ter um perfil muito diferente dos ambulatórios gerais. Outro aspecto importante a ser considera do é que estudos de coorte e ensaios clínicos tendem a ter uma perda no acompanhamento. Os indivíduos podem decidir descontinuar sua participação. Certos tipos de pessoas são mais prováveis do que outras a desistirem do estudo. As pessoas também podem morrer por outras causas que não o evento de interesse. O viés de seleção é de particular interesse nos estudos caso-controle, nos quais o pesqui sador seleciona dois grupos em que a exposição já ocorreu. Há necessidade de selecionar casos prevalentes ou casos incidentes. Se o fator de risco também é um fator prognóstico, o uso de casos prevalentes pode resultar em conclu sões com viés. Os estudos caso-controle que envolvem pacientes hospitalizados também estão su jeitos a viés de seleção. Pacientes com duas condições clínicas tendem a ser mais hospitali zados dos que aqueles com uma condição. Esse tipo de viés costuma ser denominado viés de Berkson.
102
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
^^ VIÉS
DE AFERIÇÃO
O viés de aferição pode surgir quando há um erro sistemático na mensuração. Ele ocorre quando as medições individuais ou classifica ções de doenças ou exposições são imprecisas. Ou seja, elas não medem corretamente o que deveriam medir. Existem muitas fontes de viés de aferição. Por exemplo, as dosagens laborato riais bioquímicas ou fisiológicas podem não ser completamente precisas e, muitas vezes, produ zem resultados diferentes na mesma amostra. Se as amostras dos grupos exposto e controle são analisadas de modo aleatório por diferentes laboratórios, há menor probabilidade de erro sistemático de aferição do que na situação em que todas as amostras do grupo exposto são analisadas em um laboratório e as do grupocontrole são analisadas em outro. Um tipo de viés de aferição de particular im portância nos estudos caso-controle é conheci do como viés de memória. Isso ocorre quando as informações são lembradas de maneira di ferente por casos e controles. Os casos podem ser mais propensos a recordar exposições do passado, sobretudo se elas são amplamente co nhecidas por estarem associadas à doença em estudo – por exemplo, falta de exercício e doen ças cardíacas. O viés de memória pode exagerar ou subestimar o tamanho do efeito associado à exposição. As pessoas afetadas por doenças car díacas são mais propensas a admitir a falta de exercício no passado. Por outro lado, os casos tendem mais que os controles neguem a expo sição passada. Se o viés de aferição ocorre igualmente nos grupos que estão sendo comparados, quase sempre resulta em uma subestimação da ver dadeira força de associação. Tal viés não dife rencial pode explicar aparentes discrepâncias nos resultados de diferentes estudos epidemio lógicos. Se o investigador, técnico de laboratório ou o participante conhece o status de exposição, isso pode influenciar as medições e causar um viés de observação. Para evitar esse viés, as medições devem ser feitas de maneira cega ou duplo-cega. Nos estudos cegos, os investi gadores não sabem como os participantes são
classificados ou alocados quando há interven ção. Em um estudo duplo-cego, nem os pes quisadores, nem os participantes, sabem como ocorreu a classificação. ^^ VIÉS
DE CONFUSÃO
Os fatores de confusão constituem-se em im portante preocupação na análise de estudos epidemiológicos. Em um estudo de associa ção entre a exposição a uma causa (ou fator de risco) e a ocorrência da doença, pode ocorrer confusão quando existe outra exposição na po pulação em estudo e ela está associada tanto à doença quanto à exposição estudada. O pro blema surge quando esse fator estranho – em si um determinante ou fator de risco para o des fecho – é distribuído de forma desigual entre os subgrupos de exposição. Ocorre confusão quando o efeito de duas exposições (fatores de risco) não foi separado e a análise conclui que o efeito é decorrente de uma variável em vez da outra. Para ser um fator de confusão, ele deve estar associado tanto à exposição quanto à do ença (Figura 15.1). Muitas vezes, idade, condição socioeconômi ca e hábitos são fatores de confusão em estudos epidemiológicos. No exemplo da Figura 15.1, uma vez sabido que o consumo de café está associado ao tabagismo, a confusão pode ser a explicação para a relação demonstrada entre o consumo de café e o risco de doença cardíaca: pessoas que bebem café são mais propensas a fumar do que aquelas que não bebem café. Sa be-se que o tabagismo é uma causa de doença cardíaca. Assim, é possível que a relação entre o consumo de café e a doença cardíaca reflita apenas a associação causal conhecida do uso do tabaco e a doença do coração. Nessa situação, o tabagismo confunde o relacionamento aparen te entre o consumo de café e a doença cardíaca, pois o tabagismo está correlacionado com be ber café e é um fator de risco, mesmo para aque les que não bebem café.
Controle dos vieses de confusão O controle dos fatores de confusão pode ser fei to pelo delineamento do estudo ou durante a
Vieses
Exposição (ingestão de café)
Associação por confusão
103
Doença (doença cardíaca)
Verdadeira associação à doença
Duas exposições associadas entre si
Fator de confusão (tabagismo)
FIGURA 15.1 Confusão: relação entre o consumo de café (exposição), a doença cardíaca (desfecho) e uma terceira variável (tabagismo)
análise dos resultados. No desenho do estudo, os métodos comumente usados são: nn Randomização. nn Restrição. nn Emparelhamento. Na etapa de análise, os fatores de confusão podem ser controlados por: nn Estratificação. nn Modelagem estatística.
Randomização Em estudos experimentais, a randomização é o método ideal para garantir que as poten ciais variáveis de confusão sejam distribuídas igualmente entre os grupos que estão sendo comparados. O tamanho da amostra precisa ser suficientemente grande para evitar má dis tribuição aleatória de tais variáveis. A randomi zação evita a associação entre a potencial vari ável de confusão e a exposição que está sendo considerada.
Restrição Uma forma de controlar fatores de confusão é restringir o estudo para as pessoas que têm características especiais. Por exemplo, em um estudo sobre os efeitos do café na doença coro nária, a participação no estudo pode ser restrita aos não fumantes, o que elimina qualquer po tencial efeito de confusão pelo tabagismo.
Emparelhamento O pareamento é utilizado para controlar a con fusão. Nele, selecionam-se os participantes do estudo de modo a garantir que os potenciais fatores de confusão estejam distribuídos uni formemente entre os dois grupos comparados. Por exemplo, em um estudo caso-controle que busque associar exercício à doença coronariana, cada paciente com doença cardíaca pode ser combinado com um controle da mesma faixa etária e sexo para garantir que confusão por idade e sexo não ocorra. O emparelhamento tem sido bastante uti lizado em estudos de caso-controle, mas isso pode ocasionar problemas na seleção dos con troles se os critérios de correspondência forem muito rigorosos ou muito numerosos, o que é chamado de overmatching. Ele pode ser caro e consumir tempo, mas é particularmente útil se existe perigo de não haver sobreposição entre os casos e controles, como em uma situação em que os casos tendem a ser mais velhos do que os controles.
Estratificação e modelagem estatística Em grandes estudos, geralmente, é preferível controlar o confundimento na fase analítica. O confundimento pode, então, ser controlado por estratificação, o qual envolve a medição da força
104
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
de associação em categorias bem definidas e homogêneas (estratos) da variável de confusão. Se a idade é um dos fatores de confusão, a asso ciação pode ser medida em grupos de idade de 10 anos; se o sexo ou a etnia é um fator de con fusão, a associação é medida separadamente em homens e mulheres ou em diferentes gru pos étnicos. Estão disponíveis métodos para resumir a associação geral por meio de uma mé dia ponderada das estimativas calculadas em cada estrato separado. Embora a estratificação seja conceitualmen te simples e relativamente fácil de realizar, é muitas vezes limitada pelo tamanho do estudo e pode não ajudar a controlar muitos fatores de maneira conjunta. Nessa situação, é necessária a modelação estatística multivariada para calcular a força da associação, controlando para diversas variáveis de confusão, simultaneamente. Várias técnicas estatísticas estão disponíveis para essas análises. ^^ VALIDADE
A validade é uma expressão do grau de men suração de um teste. Um estudo é válido se os resultados correspondem à verdade. Assim, não deve haver nenhum erro sistemático, ou seja, deve ter acurácia, e convém o erro aleatório (precisão) ser o menor possível. A Figura 15.2 indica a relação entre a acurácia e a precisão. Normalmente, a acurácia e a preci são andam juntas. Existem dois tipos de validade: interna e ex terna.
Alta precisão Baixa acurácia
FIGURA 15.2 Precisão e acurácia
Baixa precisão Alta acurácia
Validade interna A validade interna está relacionada com o grau de certeza de que os resultados de um estudo estão corretos para o grupo específico de pessoas que estão sendo avaliadas. Ou seja, a validade interna é definida pelos limites do estudo propriamente dito. Para um estudo ser de alguma utilidade, deve ser válido internamente – embora um estudo seja perfeitamente válido internamente, ele talvez não tenha nenhuma relevância, pois os resultados não podem ser comparados com outros estudos. A validade interna pode ser ameaçada por todas as fontes de erro sistemático, mas melhorada por um bom delineamento e atenção aos detalhes.
Validade externa A validade externa, ou generalização, é a ex tensão na qual os resultados de um estudo se aplicam a pessoas que não participaram dele. A validade interna é necessária, mas não garante a validade externa. A validade externa é de particular interesse aos clínicos que precisam decidir se um resultado de uma pesquisa é aplicável a seus pacientes. Determinar se os resultados de um estudo são generalizáveis envolve a seguinte análise sobre: nn As características dos indivíduos incluídos no estudo. nn As características dos pacientes do clínico. nn Diferenças clinicamente significativas entre as pessoas do estudo e outras populações. A validade externa é garantida por desenhos de estudos que examinam hipóteses claramen te definidas em populações bem definidas. Ela é
Alta precisão Alta acurácia
Baixa precisão Baixa acurácia
PARTE
V
Inferência Estatística
Capítulo 16
População e Amostra, 109
Capítulo 17
Distribuições de Probabilidades, 113
Capítulo 18
Intervalo de Confiança e Valor P, 123
Capítulo 19
Testes Paramétricos, 135
Capítulo 20
Teste Qui-Quadrado, 153
Capítulo 21
Testes Não Paramétricos, 157
CAPÍTULO
17 ^^ DISTRIBUIÇÃO
Distribuições de Probabilidades
NORMAL
As medidas biológicas contínuas seguem, com frequência, um padrão de dispersão em suas distribuições de frequência que pode ser descrito como a distribuição normal de probabilidades. Essa distribuição também é conhecida por distribuição de Gauss, em homenagem ao cientista alemão Johann Carl Friedrich Gauss (17771855), considerado um dos maiores gênios da matemática (Figura 17.1). Atualmente, a lei de Gauss da distribuição normal de erros, com sua curva em formato de sino, é um dos fundamentos da estatística.
FIGURA 17.1 Johann Carl Friedrich Gauss (1777-1855)
A distribuição normal, graficamente, é descrita como uma curva em forma de sino, simétrica em torno da média (µ). A área total da curva vale 1, pois ela corresponde à probabilidade de a variável aleatória (aquela que tem um componente que varia ao acaso) assumir qualquer valor. Em decorrência da simetria da curva, os valores maiores que a média e os valores menores do que a média ocorrem em igual probabilidade. A distribuição normal é descrita por dois parâmetros: a média da população (µ) e o desvio padrão (σ). Vários testes estatísticos pressupõem que os dados sejam provenientes de uma distribuição normal. A altura é uma variável aleatória com distribuição normal. De acordo com a Organização Mundial da Saúde (OMS) (http://www. who.int/childgrowth/en/), a altura média de um jovem de 19 anos é 176,5cm e o desvio padrão é 7,3cm (Figura 17.2). Observa-se que a curva apresenta uma aparência típica, simétrica, cujo formato depende dos parâmetros avaliados. Mudando a média, altera-se a posição da distribuição. Mudando o desvio padrão, altera-se a dispersão da distribuição. Suponha outra população com média de 173cm e com o mesmo desvio padrão de 7,3cm e observe a mudança de posição da distribuição (Figura 17.3). A curva normal apresenta as seguintes características (Figura 17.4): nn A média, a mediana e a moda coincidem. nn Conforme visto, a curva normal é simétrica em torno da média.
114 nn
nn
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
As extremidades da curva, em ambos os lados da média, estendem-se cada vez mais próximas do eixo x (abscissa) sem jamais tocá-lo. Se houver perpendiculares a uma distância de 1 desvio padrão acima e abaixo da média, a área entre essas perpendiculares corresponde a 68% da área total. Se as perpendiculares forem estendidas até ±2 ou 3 desvios padrões, a área entre as perpendiculares será, respectivamente, 95% e 99,7% da área total da curva.
Por exemplo, durante uma consulta de um rapaz de 19 anos de idade, constata-se que a sua altura é 168cm. Como a média é 176,5cm e o desvio padrão 7,3cm, o intervalo que compreende 95% dos jovens dessa idade vai de 161,9 a 191,1cm, ou seja, a média ±2 desvios padrões (arredondamento do valor correto de 1,96). Assim, o jovem da consulta, apesar de ter uma estatura 8,5cm abaixo da média, está dentro da faixa esperada.
0,06
0,05
0,04
0,03
0,02
0,01
0 154,5
158,5
162,5
166,5
170,5
174,5
178,5
182,5
186,5
190,5
196
FIGURA 17.2 Gráfico da distribuição da altura de jovens de 19 anos de idade, sexo masculino µ: média; σ: desvio padrão.
0,06 0,05 0,04 0,03 0,02 0,01 0 149
153
157
161
165
169
173
177
FIGURA 17.3 Distribuição de duas populações com médias diferentes
181
185
189
193
Distribuições de Probabilidades
115
0,06
0,05
0,04 1s
–1s 0,03 68% 0,02
0,01
2s
–2s 95%
0 154,5
158,5
162,5
166,5
170,5
174,5
178,5
182,5
186,5
190,5
196
FIGURA 17.4 Subdivisões da área sob a curva normal (áreas aproximadas)
^^ DISTRIBUIÇÃO
PADRONIZADA
NORMAL
A distribuição normal padronizada, ou distribuição normal reduzida, é um caso especial da distribuição normal. A distribuição normal padronizada tem média igual a zero e desvio padrão igual a 1 e a área sob a curva igual a 1 (100%). Na abscissa, em vez de x (p. ex., valores da altura em centímetros), tem-se a transformação de x em um escore padronizado, denominado escore z. Este é derivado da seguinte fórmula: z
x
Dessa maneira, o escore z mostra realmente quantos desvios padrões um determinado valor x afasta-se da média. Qualquer distribuição de uma variável normal pode ser transformada, “reduzida”, a uma distribuição de z. Para isso, basta subtrair de cada valor de x a sua média (µ) e dividir esses resultados pelo desvio padrão da média (σ). A Figura 17.5 mostra a curva da distribuição normal padronizada da Figura 17.2. Desse modo, uma altura de 169,2cm é equiva lente a um escore igual a 1 desvio padrão abaixo da média: z
169 , 2 176 , 5 1 7, 3
Uma das vantagens da distribuição z é que a probabilidade de um valor estar em qualquer lugar entre dois pontos é igual à área sob a curva entre esses pontos. Isto determina que a área à direita de, aproximadamente, 2 desvios padrões corresponde a uma probabilidade de 0,025 ou 2,5% do total da curva. Como a curva é simétrica, a probabilidade do escore z ser menor do que –2 é também 0,025. De acordo com a lei da adição de probabilidades, a probabilidade de o escore z estar tanto abaixo quanto acima de 2 desvios padrões é 0,025 + 0,025 = 0,05. Transformando-se o escore z em x, pode-se dizer que a probabilidade de um jovem de 19 anos de idade ter altura fora de 2 desvios padrões da média é 0,05. Ou seja, somente 5% desses jovens têm altura abaixo de 161,9cm ou acima de 191,1cm. Um importante uso da distribuição z deriva do fato de que, ao se conhecer o escore z, pode-se encontrar a probabilidade de os valores estarem acima e abaixo dele. Por exemplo, deseja-se obter a probabilidade de um jovem de 19 anos de idade ter altura entre 180 e 190cm. Em primeiro lugar, transformam-se estes valores em escores z: z1
180 176 , 5 0 , 48 7, 3
z2
190 176 , 5 1, 85 7, 3
116
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica 0,06
0,05
0,04
0,03
0,02
0,01
0 -2
-1
0
1
2
Z
FIGURA 17.5 Distribuição z
A probabilidade de ocorrer um valor entre 0,48 e 1,85 desvios padrões corresponde à área escura (Figura 17.6). Essa probabilidade é encontrada na tabela de distribuição normal padronizada, vista na maioria dos livros de estatística ou no software Excel (Microsoft). Utilizando-se, no Excel, a função DIST.NORMP.N, encontra-se que a probabilidade de um jovem de 19 anos ter altura abaixo de 0,48 desvio padrão é 0,684 e de ter altura abaixo de 1,85 desvio padrão é 0,968. Logo,
a probabilidade de se encontrar um jovem de 19 anos de idade com altura entre 0,48 e 1,85 desvios padrões é igual a: 0,968 – 0,684 = 0,284 ou 28,4% ^^ DISTRIBUIÇÃO
t DE STUDENT
Trabalhando com amostras pequenas, utiliza-se a distribuição t de Student. Student era o pseudônimo de William Sealy Gosset (1876-1937),
0,06
0,05
0,04
0,03
0,02
28,4%
0,01
0 0
0,48
FIGURA 17.6 Probabilidade de ocorrer um valor entre 0,48 e 1,85 desvios padrões
1,85
CAPÍTULO
19
Testes Paramétricos
^^ INTRODUÇÃO
Alguns testes de hipóteses são adequados apenas para os dados numéricos, uns para dados numéricos e ordinais e outros para dados ordinais e nominais. Às vezes, exigem que os dados tenham uma distribuição normal e são denominados testes paramétricos. Aqueles que não têm esse pressuposto rigoroso de distribuição chamam-se testes de distribuição livre ou testes não paramétricos. Para verificar rapidamente a normalidade dos dados, algumas informações podem ser usadas, como: nn Observar o formato dos dados por meio de um histograma. Se demonstrar uma distribuição parecida com a curva normal, a distribuição provavelmente é simétrica (ver também Capítulo 4, Distribuição dos Dados). nn Comparar a média e a mediana. Se elas forem semelhantes, é provável que os dados tenham distribuição simétrica. nn Comparar o desvio padrão com a média. Se ele for maior que 50% da média, os dados tendem à assimetria (coeficiente de variação = s/ x). nn Observar os valores do coeficiente de assimetria e do coeficiente de curtose. Valores entre –1 e +1 indicam distribuição aproximadamente normal. Qualquer valor acima de +3 ou abaixo de –3 indica que a variável não é simétrica. nn Dividir o coeficiente de assimetria (skewness) e o coeficiente de curtose por seus respectivos erros padrões. Se o resultado for maior do que +1,96 ou menor do que –1,96, é um indicativo de assimetria. Valores entre ±1,96 indicam distribuição normal.
nn
Observar se as amostras são grandes (acima de 60), pois elas não exigem grande preocupação com relação à normalidade dos dados.
t PARA AMOSTRAS INDEPENDENTES
^^ TESTE
O teste t de Student é utilizado para testar se a diferença entre duas médias amostrais independentes é ou não igual a zero, ou seja, se as duas médias são iguais. A hipótese nula (H0) afirma que a diferença entre as duas médias é igual a zero. Ambas as variáveis devem ser numéricas e normalmente distribuídas. Ademais, os dois des vios padrões devem ser semelhantes. Quando o tamanho amostral é grande, esse pressuposto torna-se menos importante. Serão usados, como exemplo, os dados da Ta bela 19.1 que mostra o volume expiratório força do em 1 segundo (VEF1) de 42 escolares portadores de asma não controlada no início de um tratamento com um novo corticosteroides inalatório. A H0 discutida no capítulo anterior, mas fica estabelecida como: nn H0: o VEF1 dos meninos é igual ao VEF1 das meninas no início do tratamento da asma brônquica. H0 : x1 = x2
A hipótese alternativa, com direção bilateral, é igual a: H1 : x1 ≠ x2
136 nn
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
H1: o VEF1 dos meninos é diferente do VEF1 das meninas no início do tratamento da asma brônquica.
Apesar de haver uma diferença de 0,054L entre entre os VEF1 dos escores, sabe-se que, tanto no grupo 1 (meninos) quanto no grupo 2 (meninas), há uma variabilidade dos valores em torno da média de cada um dos grupos. O que se precisa verificar é se a variabilidade entre as duas médias amostrais ao redor da grande média de todos os pesos é maior do que a variabilidade dos pesos dentro dos grupos ao
redor de suas próprias médias. Se há tanta variação dentro dos grupos, como entre os grupos, então, provavelmente, eles provêm da mesma população. Em outras palavras, precisa-se analisar se a diferença observada entre os grupos é decorrente, ou não, apenas do acaso. O valor t do teste é calculado pela diferença dos valores das médias dos dois grupos dividida pelo erro padrão da diferença. A distribuição t foi discutida no Capítulo 17, Distribuições de Probabilidades. t=
TABELA 19.1 VEF1 (L) de escolares com asma não controlada Identificação
Grupo 1 – Meninos
1
1,29
1
0,93
2
0,95
2
1,04
3
0,65
3
1,35
4
1,03
4
1,25
5
0,99
5
0,61
6
1,36
6
0,66
7
1,21
7
1,06
8
1,17
8
0,91
9
1,21
9
1,49
10
1,10
10
1,02
11
1,23
11
0,95
12
0,91
12
1,32
13
0,65
13
0,82
14
1,11
14
0,98
15
0,80
15
1,29
16
1,28
16
0,89
17
0,82
17
0,97
18
0,77
18
1,79
19
0,99
20
0,98
21
0,91
22
0,99
23
1,02
24
1,05
x1
1,020
x2
1,074
s1
0,194
s2
0,294
Identificação
Grupo 2 – Meninas
| x1 = x2 | EPd
Em que x1 = média do grupo x2 e = média do grupo 2 e EPd é o erro padrão da diferença obtido pela fórmula: EPd sc
1 1 n1 n2
O desvio padrão combinado sc é calculado por: (n 1) s12 (n2 1) s22 sc 1 (n1 n2 2)
Para se calcular o valor t, precisamos encontrar o numerador, que é igual a: | x1 x2 | | 1, 020 1, 074 | 0 , 054
O desvio padrão combinado sc é igual a: sc =
(24 1) 0 ,194 2 (18 1) 0 , 294 2 24 18 2 0 , 0584 0 , 2416
Dessa maneira, o erro padrão da diferença, EPd, é igual a: 1 1 24 18 0 , 07533
EPd = 0,2416
Testes Paramétricos
Logo, o valor de t é igual a: = t
0 , 054 = 0 , 72 0 , 07533
Utilizando a função do Excel DIST.T.BC (retorna a distribuição t de Student bicaudal), obtém-se o valor P que é igual a 0,4757. Apesar de os cálculos para se chegar ao valor serem simples, é mais fácil usar um software, como IBM SPSS Statistics ou R project for Statistical Computing (Tabela 19.2), que rapidamente fornece os resultados. Chegou-se a esse resultado supondo que exista igualdade das variâncias (homogeneidade das variâncias) e, de fato, se for realizado um teste F para verificar a igualdade das variâncias, verificar-se-á que é possível assumir essa igualdade (P = 0,065). Os resultados do teste t têm evidências que impedem rejeitar a H0 ou, em outras palavras, o teste t revela que a diferença entre as médias não é suficientemente grande para ser atribuível a uma diferença real (Tabela 19.3). Assim, pode-se dizer que não existe diferença, no início do tratamento da asma, com um novo corticosteroide inalatório, no valor do VEF1 entre meninos e meninas. A estimativa da diferença média é fornecida pelo intervalo de confiança de 95% (-0,098 a 0,207L), no qual se verifica que o valor zero não está contido, confirmando a significância estatística. O tamanho do efeito (d de Cohen) seria uma medida interessante de ser calculada, caso houvesse uma diferença estatisticamente significativa (Capítulo 7, Medidas de Associação). TABELA 19.2 Resultado do computador: teste t para duas amostras independentes Two Sample t-test data: vef1 by sexo t = 0.72, df = 40, p-value = 0.4757 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.09813194 0.20674305 sample estimates: mean in group Fem mean in group Masc 1.074 1.020
137
TABELA 19.3 Resultados do tratamento com corticosteroide inalatório em um grupo de 15 escolares asmáticos antes e após 120 dias
Indivíduos
VFE1 inicial (L) xi
1
1,30
VFE1 final (L) xf 1,53
Diferença d = xf – xi
– (d – d )2
0,23
0,022
2
1,47
1,63
0,16
0,047
3
2,06
2,35
0,29
0,008
4
1,95
2,70
0,75
0,139
5
1,47
2,01
0,53
0,027
6
1,13
1,53
0,40
0,001
7
1,48
1,66
0,18
0,039
8
0,94
1,59
0,65
0,075
9
1,05
1,50
0,45
0,005
10
0,87
1,61
0,74
0,132
11
0,75
1,17
0,42
0,002
12
1,26
1,30
0,05
0,113
13
1,21
1,41
0,20
0,031
14
0,78
1,00
0,22
0,025
15
1,99
2,37
0,37
0,000
Soma
5,64
0,664
Diferença média = d =
∑ d 5, 64 n
=
15
= 0,377litros
VEF1: volume expiratório forçado em 1 segundo.
t PARA AMOSTRAS EMPARELHADAS
^^ TESTE
Na situação em que as amostras dos dois grupos estão correlacionadas, não é possível usar o teste t de Student, uma vez que ele presume que os dois grupos são independentes. Essa situação surge quando se coletam duas medidas dos mesmos indivíduos em momentos diferentes. Por exemplo, considere um grupo de 15 crianças escolares asmáticas que receberam tratamento com corticosteroide inalatório por determinado período. Mediu-se o VEF1 no início e após 120 dias de tratamento. Os dados são mostrados na Tabela 19.3. A hipótese estatística a ser testada é: H0 : d = 0
138
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
Consequentemente: H1 : d ≠ 0 O valor de t é dado por: t=
d EPd
O erro padrão da diferença (EPd) é calculado por: EPd =
5c n
O desvio padrão combinado é dado por: sc
(d d)2 n 1
0 , 664 0 , 218 15 1 0 , 218 EPd 0 , 056 15 sc
Assim, = t
d 0 , 377 = = 6 , 697 EPd 0 , 056
Voltando a usar a função do Excel DIST.T.BC (retorna a distribuição t de Student bicaudal), obtém-se o valor P que é igual a 0,00001, que pode ser escrito simplesmente P <0,0001. Fazendo os cálculos com o R project for Statistical Computing temse as informações apresentadas na Tabela 19.4. TABELA 19.4 Resultado do computador: teste t para duas amostras independentes Paired t-test data: basal and final t = -6.6969, df = 14, p-value = 0.00001016 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.4973000 -0.2560333 sample estimates: mean of the differences -0.3766667
Os resultados do teste t emparelhado mostram que há evidências para rejeitar a H0 ao nível de significância de 95% e pode-se afirmar que houve diferença significativa entre o VEF1 inicial e o VEF1 do fim do tratamento. O tamanho do efeito é igual a 1,729, o que caracteriza um grande efeito, conforme demonstrado pela fórmula: TEP(d )
| x1 x 2 | | 1, 314 1, 691| 1, 729 0 , 218 sc
^^ ANÁLISE
DE VARIÂNCIA
O problema de vários testes de significância Foi mostrado anteriormente que, quando se quer comparar as médias de dois grupos, usa-se o teste t. Quando há três ou mais grupos, o teste t não é apropriado. Se vários testes t são usados para comparar várias médias, a probabilidade de erroneamente detectar pelo menos uma diferença significativa entre o conjunto de comparações é maior que o nível de significância, α, selecionada para cada teste. Suponha que se pretenda testar o efeito de três diferentes tratamentos para diabetes. Os pacientes do grupo 1 recebem uma medicação, por exemplo, uma sulfonilureia; os do grupo 2 recebem outra medicação (p. ex., uma biguanida) e os pacientes do grupo 3, um placebo. O objetivo é saber se as substâncias utilizadas são melhores para reduzir os níveis de glicemia do que o pla cebo e se elas têm efeitos diferentes entre si. Têm-se três comparações para serem feitas: 1. Grupo 1 versus grupo 3 (para verificar se a sulfonilureia é melhor que o placebo). 2. Grupo 2 versus grupo 3 (para verificar se a biguanida é melhor que o placebo). 3. Grupo 1 versus grupo 2 (para observar se a sulfonilureia é diferente da biguanida). O nível de significância, α, escolhido foi 0,05, ou seja, aceita-se, no máximo, uma probabili dade de 5% de cometer um erro tipo I (rejeitar H0 quando ela é verdadeira). Logo, a probabilidade de não rejeitar H0 quando ela é verdadeira é igual a 1 – 0,05 (= 0,95).
PARTE
VI
Leitura Crítica
Capítulo 22
Medicina Baseada em Evidências, 169
Capítulo 23
Artigo Científico, 175
Capítulo 24
Avaliação da Qualidade da Evidência, 181
Capítulo 25
Análise de um Estudo Terapêutico, 185
Capítulo 26
Análise de um Estudo Diagnóstico, 191
Capítulo 27
Análise de um Estudo Prognóstico, 195
Capítulo 28
Análise de um Estudo Etiológico, 199
CAPÍTULO
22
Medicina Baseada em Evidências
^^ O
QUE É MEDICINA BASEADA EM EVIDÊNCIAS?
Os profissionais da saúde, principalmente médicos, sempre consideraram suas decisões baseadas em evidências e origens filosóficas remontam a Paris do século XIX. Entretanto, o conceito de “evidência” era uma combinação de estratégias bem sucedidas em pacientes prévios, conselhos de outros profissionais mais experientes ou uma impressão geral baseada em artigos aleatórios, congressos e propagandas. O que modificou portanto é o conceito de evidência, da melhor evidência, que significa dizer informações provenientes de uma pesquisa clinicamente relevante, muitas vezes provenientes das ciências básicas da medicina, especialmente da pesquisa clínica centrada no paciente. Ou seja, pesquisas sobre a exatidão e precisão dos testes diagnósticos, incluindo exame clínico, poder dos marcadores prognósticos e a eficácia e segurança das estratégias preventivas, terapêuticas e de reabilitação. Credita-se o termo medicina baseada em evidências (MBE) a um grupo liderado por Gordon Guyatt na Universidade McMaster, Hamilton, Canadá em 1992. A partir daí passou a ser um tema cotidiano na vida dos profissionais da saúde. Em 1996, Sacket et al., em um short report, define a MBE como “o uso consciente, explícito e criterioso das melhores evidências atuais na tomada de decisões sobre o cuidado de pacientes individuais. A prática da medicina baseada em evidências significa integrar a experiência clínica individual com a melhor
evidência clínica externa disponível de pesquisa sistemática. Por especialização clínica individual, queremos dizer a proficiência e o julgamento que os médicos individuais adquirem por meio da experiência clínica e da prática clínica. O aumento da experiência se reflete de muitas maneiras, porém especialmente em diagnósticos mais eficazes e eficientes e na identificação mais cuidadosa e no uso compassivo das condições, direitos e preferências individuais dos pacientes na tomada de decisões clínicas sobre seus cuidados”. Entretanto, deve-se ter cuidado porque a MBE não é uma “receita de bolo” e requer uma abordagem estratificada, suportada conhecimentos em Epidemiologia e Bioestatística para a avaliação adequada da evidência para evitar que se fique escravo dos manuais e diretrizes no atendimento ao paciente (Figura 22.1).
Medicina baseada em evidências
Identifica
Avalia
Sintetiza
Informações científicas de alta qualidade
Evidências científicas
FIGURA 22.1 Medicina baseada em evidências (MBE)
170
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
Em última análise, a MBE visa à aplicação da melhor evidência científica no cuidado do paciente, como mostrado na representação clássica da Figura 22.2.
nn nn nn
^^ ETAPAS
DA MEDICINA BASEADA EM EVIDÊNCIAS
A MBE segue etapas bem definidas, a saber como: nn Formular uma pergunta que precisa ser respondida. nn Rastrear as melhores evidências. nn Avaliar criticamente as evidências quanto a: ll Validade. ll Impacto (magnitude do benefício). ll Aplicabilidade. nn Integrar a evidência com a experiência clínica e valores do paciente. nn Avaliar nossa eficácia e nossa eficiência.
Formulação da pergunta clínica Antes de formular a pergunta clínica, o fundamental é a necessidade de se admitir que não se saiba algo, que se tenha uma dúvida. Em MBE, a formulação da questão ou pergunta clínica é fundamental. Ela deve ser focada. Em geral, na prática da Medicina, as dúvidas estarão relacionadas sobre os seguintes tipos de perguntas: nn Intervenção: “O que devo fazer sobre essa condição ou esse problema?”.
Preocupações do paciente
MBE
Melhor evidência
nn
Etiologia e fatores de risco: “O que causa o problema?”. Diagnóstico: “Esta pessoa tem a condição clínica ou o problema?”. Prognóstico: “Quem irá desenvolver a condição clínica ou o problema?”. Frequência e taxa: “Quão comum é o pro blema?”.
Estratégia PICO Recomenda-se do formato PICO (ou PICOTT) para desenvolver questões clínicas específicas e passíveis de serem respondidas. Os quatro elementos básico deste formato são mostrados na Tabela 22.1. Os termos identificados a partir desta estratégia serão a base da estratégia de busca da evidência. Quanto mais específica for a pergunta, mais precisos serão os resultados da pesquisa (ver Capítulo 13, Revisão Sistemática).
Paciente, população ou problema Descrever com clareza o grupo populacional ao qual pertence o paciente. Por exemplo, “Crianças com 8 anos de idade com amigdalite estreptocócica”.
Intervenção ou exposição Mostra a estratégia de manejo, a exposição ou o teste sobre os quais se quer ter informações quanto ao problema clínico. Se o problema clínico está relacionado com um tratamento, pode ser uma medicação. Em caso de diagnóstico, pode ser um exame laboratorial ou um programa de triagem. Em uma questão clínica relacionada com a etiologia ou um risco, pode ser uma exposição ou agente ambiental. Um exemplo: TABELA 22.1 Estratégia PICO
Experiência clínica
FIGURA 22.2 Medicina baseada em evidências (MBE)
Princípio PICO P
População
I
Intervenção
C
Comparação
O
Outcome (desfecho)
Medicina Baseada em Evidências
“Uso de amoxicilina em dose única diária para tratamento de amigdalite estreptocócica”.
Comparação ou intervenção (se apropriado) Apresenta uma estratégia alternativa para a comparação que se pretende estudar. O que poderia acontecer se não houvesse a intervenção? Por exemplo: “A amoxicilina em dose única diária é tão eficaz quanto a penicilina benzatina ou a penicilina V?”.
Outcome (desfecho) O que se espera que aconteça com a intervenção, com a exposição, com o uso de um determinado teste diagnóstico? Há necessidade de se verificar qual o desfecho realmente é importante para o paciente. Por exemplo: “O uso da amoxicilina em dose única diária é tão eficaz quanto a penicilina benzatina no tratamento da amigdalite estreptocócica em crianças?”.
Elaborando a pergunta clínica Juntando os exemplos de cada componente do princípio PICO, tem-se a pergunta clínica que será a estratégia de busca da melhor evidência: Em crianças com amigdalite estreptocócica, a amoxicilina em dose única diária comparada com a penicilina benzatina tem a mesma eficácia terapêutica?
Significado dos tipos de questão e tipo de desenho nn nn
Tipo de questão clínica: diagnóstico, etiologia/dano, terapêutica, prognóstico, prevenção. Tipo de desenho de estudo para responder à pergunta: qual seria o melhor delineamento de estudo (revisão sistemática, RCT, estudo de coorte, controle de caso etc.).
A Tabela 22.2 mostra os tipos de estudo geralmente recomendados para responder determinado tipo de pergunta clínica.
Busca da melhor evidência Após a elaboração da pergunta clínica, convém selecionar os termos que serão incluídos
171
TABELA 22.2 Estratégia PICO Tipo de pergunta
Tipo de delineamento
Diagnóstico
Ensaios controlados
Terapêutica
Ensaio clínico controlado randomizado duplo-cego, revisões sitemáticas/metanálises
Prognóstico
Estudos de coorte, caso-controle, série de casos
Dano/etiologia
Estudos de coorte, caso-controle, série de casos
Prevenção
Ensaio clínico randomizado controlado, estudos de coorte
Melhoria da qualidade
Ensaio clínico randomizado controlado
na busca. Usando a pergunta elaborada anteriormente, há os termos listados na Tabela 22.3. Isto ajudará a estabelecer uma busca dirigida a cada elemento antes de combiná-los na busca definitiva. Ter sempre em mente o tipo de estudo que melhor responde à pergunta clínica e aos níveis de evidências científicas. Para resposta mais rápida para a pergunta clínica, antes de buscar em bancos de dados bibliográficos, convém verificar se a resposta à pergunta clínica não está acessível em fontes secundárias, como ACP Journal, ClinicalKey, Bandolier, UpToDate e TRIP Medical Database, ou em revisões sistemáticas encontradas na biblioteca Cochrane ou ACCESSSS (Smart Search – Best Evidence for Health Care). É possível confiar nas fontes secundárias? Recomenda-se uma estratégia simples para veri ficar se é possível confiar caso se responda “sim” aos seguintes itens: nn Não há conflitos de interesse. nn Ela explica claramente a questão clínica. nn Há uma metodologia explícita e baseada em evidências subjacente à procura e à verificação da informação. nn A fonte é regularmente revisada e atualizada. Quando não for possível obter a resposta em bancos secundários, parte-se para a busca em fontes primárias disponíveis na internet.
172
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
TABELA 22.3 Termos-chave de pergunta clínica População nn Crianças
amigdalite
nn Estreptocócica
Intervenção nn Amoxicilina
Comparação
dose única
nn Penicilina
Desfecho
benzatina
nn Eficácia
terapêutica
diária
Estratégia de busca para o PubMed Identifica os termos que serão incluídos na pesquisa (thesaurus searching e textword searching), combinando-os, usando operadores booleanos (or, and, not, near) e colocando-os no buscador escolhido. No PubMed, utilizando o exemplo da Tabela 22.3, há os seguintes termos de busca e a tradução para o inglês dessas palavras (Tabela 22.4) O PubMed é um sistema de pesquisa bibliográfica desenvolvido pelo National Center for Biotechnology Information (NCBI), ligado à National Library of Medicine (NLM), dos EUA. O acesso ao PubMed é livre e se constitui em um poderoso sistema de busca e recuperação. O MedLine é o principal componente do PubMed e a principal base de dados da NLM. A maioria dos registros provém de fontes em língua inglesa e todos os resumos estão em inglês. O PubMed, da mesma maneira que outros recursos de busca, como o Google, tem apenas uma caixa de busca (Figura 22.3). Digite os termos de busca criados na estratégia PICO. Depois disso, clica-se no botão Search. Ele retorna os resultados da busca. Nesse caso, acrescentaram-se filtros (idade: 0 a 18 anos; humanos, língua inglesa e ensaios clínicos). Independentemente da habilidade do pesquisador, as citações recuperadas, inevitavelmente, incluirão algumas
que não estão relacionadas com a pergunta que gerou a busca. Junto com as citações encontradas com a pergunta, retorna artigos relacionados com o encontrado. Nem sempre esses artigos relacionam-se com a pergunta inicial. Utilizando-se os filtros mencionados e os seguintes termos Streptococcal pharyngitis AND Amoxicillin AND benzathine penicillin, a busca retornou apenas um artigo: nn Rimoin AW, Hoff NA, Fischer Walker CL et al. Treatment of streptococcal pharyngitis with once-daily amoxicillin versus intramuscular benzathine penicillin G in low-resource settings: a randomized controlled trial. Clin Pediatr (Phila). 2011 Jun; 50(6):535-42. Em Similars articles, encontram-se outros artigos relacionados, que podem ser úteis. Outra maneira de pesquisar no PubMed é por meio do botão Advanced, localizado abaixo da caixa de busca da página principal do PubMed (ver Figura 22.3). O próximo passo é avaliar a qualidade dessa evidência científica, analisando sua validade, sua magnitude e sua aplicabilidade ao nosso paciente, conforme seus valores (ver Capítulos 24, Avaliação da Qualidade da Evidência; 25, Análise de um Estudo Terapêutico; 26, Análise de um Estudo Diagnóstico; 27, Análise de um Estudo Prognóstico; e 28, Análise de um Estudo Etiológico).
TABELA 22.4 PICO e determinação dos termos de busca PICO
Elemento
Termos de busca para o PubMed
População
Crianças Amigdalite estreptocócica
Limit by age to 0 a 18 year Streptococcal pharyngitis
Intervenção
Amoxicilina dose única diária
Amoxicillin once-daily
Comparação
Penicilina benzatina
Benzathine penicillin
Outcome (desfecho)
Eficácia terapêutica
Treatment outcome Limit to humans, English, clinical trial
CAPÍTULO
26
Análise de um Estudo Diagnóstico
^^ INTRODUÇÃO
Na prática clínica diária, os médicos têm necessidade de interpretar testes diagnósticos. A proliferação contínua de tecnologia médica coloca diante deles uma grande quantidade de novos testes, dificultando bastante sua escolha. Entretanto, a detecção precoce da doença é um contínuo desafio. Permanentemente, o médico convive com resultados falso-positivos ou falsonegativos pelo fato de que em poucas ocasiões o teste utilizado é o padrão-ouro. Em um procedimento diagnóstico, o teste escolhido deve ser válido, de baixo risco e aceitável pelos pacientes. Até certo ponto, essa avaliação é uma questão de opinião. Por exemplo, no que diz respeito ao câncer do cólon, o teste de sangue oculto nas fezes não tem tanta precisão, mas é de baixo risco e relativamente bem-aceito pelos pacientes. Por sua vez, a colonoscopia é precisa, mas não é de baixo risco nem amplamente aceita. Seus riscos são infecções, perfurações, hemorragia; geralmente, há a necessidade de sedação; e são relatados problemas cardiovasculares e aqueles relacionados com a limpeza do cólon. Diante dessa dificuldade, fica evidente que os estudos diagnósticos devem ser avaliados criticamente. ^^ VALIDADE
DOS RESULTADOS
Perguntas primárias ou eliminatórias O estudo diagnóstico foi orientado por uma pergunta claramente definida? A pergunta da pesquisa foi colocada em termos da população estudada? (Ver também Capítulos
10, Delineamentos de Pesquisa; 13, Revisão Sistemática e 22, Medicina Baseada em Evidências.)
A presença ou ausência da doença foi confirmada com teste validado de referência? É importante saber se houve ou não uma com paração independente e cega do teste diag nóstico com um padrão de referência. O padrão de referência ou padrão-ouro é utilizado para definir a presença ou a ausência de doença. Sem a comparação do teste diagnóstico com o padrão-ouro, não é possível verificar o benefício do teste diagnóstico. A coleta de dados do estudo e a análise devem ser cuidadosamente planejadas e execu tadas para garantir que, de maneira inconsciente (ou consciente), os vieses sejam reduzidos. Em outras palavras, aqueles que realizam testes e aqueles que interpretam os resultados devem ser independentes um do outro. Os dois grupos de pesquisadores devem ser cegos para os resultados do teste diagnóstico e para o padrão-ouro.
Os pacientes do estudo representam o espectro completo daqueles com este problema clínico? Os médicos clinicam em várias áreas geográficas e em diversas especialidades. Em consequência, seus pacientes têm características distintas. Para um estudo ser aplicável a um paciente de um determinado médico, os sujeitos do estudo e
192
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
esse paciente precisam ter características basais semelhantes. Quando se avalia um artigo sobre diagnóstico, a questão a considerar é se o teste foi realizado no tipo característico de paciente em que ele seria realizado na vida real.
O padrão-ouro e o teste em avaliação foram aplicados a todos os pacientes? O leitor deve ter certeza de que os pesquisadores aplicaram o padrão-ouro, bem como o teste em avaliação, de forma independente em todos os indivíduos participantes do estudo diagnóstico.
Perguntas secundárias Os resultados do teste a ser avaliado influenciaram a decisão de realizar o padrão-ouro? As propriedades de um teste de diagnóstico serão distorcidas se seus resultados influenciam a decisão de quais pacientes serão submetidos ao padrão de referência. Tal situação é denominada viés de verificação e se aplica, por exemplo, quando os pacientes com suspeita de doença coronariana e testes ergométricos positivos são mais propensos a sofrer cineangiocoronariografia (padrão de referência) do que aqueles com testes ergométricos negativos.
As pessoas que aplicaram e interpretaram o teste e o padrãoouro eram cegas com relação aos resultados? Isto é importante para evitar que um resultado positivo para um padrão-ouro influencie a interpretação do teste em avaliação e vice-versa.
Os métodos para a realização do teste foram descritos com suficientes detalhes a fim de possibilitar a replicação? Se os autores concluíram que o teste diagnóstico pode ser usado, eles devem dizer como usá-lo. Essa descrição deve abranger todos os
aspectos importantes na preparação do paciente (dieta, quais medicamentos devem ser evitados, precauções após o teste), o desempenho do teste (técnica, possibilidade de dor) e da análise e a interpretação dos resultados. Na replicação dos testes, os pesquisadores devem medir a concordância dos resultados, aplicando testes estatísticos de concordância, como o kappa (ver Capítulo 14, Testes Diagnósticos). Uma vez o leitor estando confiante de que os resultados do artigo constituem uma estimativa imparcial das propriedades do teste, ele pode determinar exatamente quais e quão úteis são as propriedades do teste. ^^ QUAIS
SÃO OS RESULTADOS?
A rigor, um teste deve produzir uma alta taxa de verdadeiros-positivos e de verdadeiros-negativos e uma baixa taxa de falso-positivos e de falso-negativos. Essas características do teste são determinadas pela sensibilidade e pela especificidade do teste (ver também Capítulo 14, Testes Diagnósticos). A sensibilidade é a capacidade de o teste detectar pessoas com doença e a especificidade é a capacidade do teste em identificar pessoas sem a doença. Tais medidas podem ser combinadas em uma medida global denominada razão de probabilidades (LR, likelihood ratio). A LR indica a probabilidade de um dado resultado de um teste em indivíduo com a doença comparada com a probabilidade do mesmo resultado em indivíduo sem a doença. É a medida mais útil na interpretação de resultados do teste para pacientes individuais. Quando a LR é igual a 1, não existe impacto do teste na probabilidade de doença. Quanto maior a LR, maior a probabilidade da doença, diante de um resultado positivo do teste (Figura 26.1). Os possíveis desfechos de um teste que devem aparecer em um estudo diagnóstico estão ilustrados na Tabela 26.1. ^^ APLICABILIDADE
DOS RESULTADOS
A decisão para usar ou não o teste diagnóstico com base na avaliação dos resultados dependerá das questões a seguir.
Análise de um Estudo Diagnóstico
193
Impacto na probabilidade de doença
LR=0,01 menos provável
LR=0,1 menos provável
LR=0,2 menos provável
LR=0,3 menos provável
LR=3 mais provável
LR=10 mais provável
LR=5 mais provável
LR=100 mais provável
0 Impacto
Impacto
LR=1 Sem impacto na probabilidade de doença
FIGURA 26.1 Razão de probabilidades (LR)
TABELA 26.1 Características para avaliar um teste diagnóstico Doença
Presente Teste Diagnóstico
Positivo
Ausente
Total
a
b
a+b
Negativo
c
d
c+d
Total
a+c
b+d
a+b+c+d
Sensibilidade
a/(a + c)
Especificidade
d/(b + d)
Valor preditivo positivo
a/(a + b)
Valor preditivo negativo
d/(c + d)
Probabilidade pré-teste
(a + c)/(a + b + c + d)
Razão de probabilidade para um teste positivo (LR+)
Sens/(1 – espec)
Razão de probabilidade para um teste negativo (LR–)
(1 – sens)/espec
Acurácia do teste
(a + d)/(a + b + c + d)
A reprodutibilidade do resultado do teste e sua interpretação serão satisfatórias no meu local de trabalho? O valor de qualquer teste depende de sua capacidade de produzir o mesmo resultado quando reaplicado a pacientes estáveis. A baixa reprodutibilidade pode ser resultado de problemas com o teste em si. Uma segunda causa para os diferentes resultados do teste em pacientes
estáveis surge sempre que um teste requer interpretação. A rigor, um artigo sobre um teste diagnóstico deve informar aos leitores quão reprodutíveis os resultados dos testes são. Se a reprodutibilidade de um teste, no cenário do estudo, for pobre e for comum a discordância entre os observadores, mas mesmo assim o teste ainda discriminar bem quem tem ou não a doença, ele pode ser útil. Nessas circunstâncias,
194
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
é provável que o teste possa ser facilmente aplicado a seu ambiente clínico. Se a reprodutibilidade de um teste for muito alta e a variabilidade entre observadores, muito baixa, ou o teste for simples e inquestionável ou aqueles que o interpretam forem altamente qualificados, o teste tende a ser útil. Entretanto, se a sua interpretação for realizada por profissional menos qualificado em seu próprio ambiente clínico, pode não obter resultados tão bons.
doença de interesse. Assim, um teste pode ter utilidade diferente, dependendo da prevalência da doença. Por exemplo, se a prevalência aumenta, eleva-se o valor preditivo positivo (ver Nomograma de Fagan, Figura 14.4, no Capítulo 14, Testes Diagnósticos).
Os resultados do estudo são aplicáveis ao meu paciente?
Aqui, é importante verificar se os benefícios adicionais do teste para os pacientes são maiores que os riscos associados a ele.
Caso o clínico trabalhe em um contexto similar ao do estudo e o paciente em questão satisfaça todos os critérios de inclusão do estudo, é possível confiar na aplicabilidade dos resultados. Ao contrário, haverá necessidade de se fazer um julgamento criterioso.
Os resultados do teste mudarão a estratégia de manejo de pacientes? Convém ter em mente que a utilidade de um teste diagnóstico é fortemente influenciável pela proporção de pacientes com suspeita da
Os pacientes ficarão em melhor situação com o resultado do teste?
^^ LEITURA COMPLEMENTAR Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet. 2005; 365(9469):1500-05. Grimes DA, Schulz KF. Uses and abuses of screening tests. Lancet. 2002; 359(9309):881-4. Heneghan C, Badenoch D. Evidence-based medicine toolkit. 2. ed. Malden, MA: Blackwell Publishing Inc; 2006. Appraising diagnosis articles. p. 34-41. Spix C, Blettner M. Screening. Dtsch Arztebl Int. 2012; 109(21): 385-90. Straus SE, Glaszious P, Richardson WS et al. Evidence-based medicine: how to practice and teach EBM. London: Elsevier; 2019. Diagnosis and screening. p. 185-218.
PARTE
VII
Exercícios Resolvidos
Capítulo 29
Exercícios, 205
Capítulo 30
Respostas dos Exercícios, 225
CAPÍTULO
29
Exercícios
1. Em determinado hospital, foram encontrados os seguintes resultados provenientes da análise de 25 pacientes, dos quais 54% são homens (Tabela 29.1). Com base nos dados apresentados na Tabela 29.1: A. Classifique as variáveis da tabela e diga qual seria a melhor forma de apresentação. B. Um dos médicos do hospital quer saber se a duração da hospitalização foi afetada pelo uso de antibióticos. Procure responder a ele, usando os dados da tabela e uma representação gráfica. 2. Uma minoria populacional compreende 10% da população. Se forem sorteados aleatoriamente 12 indivíduos da população, qual a probabilidade de a amostra não conter ninguém da minoria? 3. Em um estudo que comparou a dosagem sérica de colesterol em obesos (n = 25) e não obesos (n = 25), encontraram-se os resultados da Tabela 29.2. A. Pela descrição das informações, comente os dois conjuntos de dados com relação à sua simetria. B. Qual o melhor modo de representar esses dados para facilitar a visualização? 4. O tempo médio de internação de pacientes com pneumonia em determinado hospital é de quatro dias, com desvio padrão de 1,5 dia. Qual é a probabilidade de que o tempo médio de internação de uma amostra seja inferior a 2,5 dias e superior a 5,5 dias?
5. Os dados da Tabela 29.3 representam as idades (em anos) de 40 pacientes admitidos em determinado hospital. A. Calcule a média, a mediana, o desvio padrão e o intervalo interquartil (IIQ). B. Como você descreveria a forma da distribuição desses dados? 6. Dois pediatras querem investigar um novo teste de aplicação rápida que identifica infecções do trato urinário (ITU), cuja prevalência local é de 5%. O Doutor A utiliza um teste, existente há vários anos, que tem sensibilidade de 80% e especificidade de 85%, e o Doutor B faz uso de um novo teste que é 90% sensível e 95% específico. Para comparar a validade, aplicam o teste independentemente em 200 crianças com sintomas urinários e febre. Com base nessas informações, responda: A. Qual dos dois pediatras tem maior acurácia para diagnosticar uma criança com ITU? Calcule fazendo arredondamentos para tornar os números inteiros. B. Se uma criança, atendida pelo Doutor B, com sintomas urinários e febre, tiver resultado negativo do teste rápido, qual a probabilidade de que esteja com ITU? C. Se o teste fosse usado em outro local em que a prevalência fosse, por exemplo, de 15%, mantendo-se as mesmas características dos testes, haveria modificação no valor preditivo positivo (VPP) dos pediatras? Justifique sua resposta.
25
8,1
8,0
4,1
0,835
0,464
3,0
18,0
5,0
11,0
n
Média
Mediana
Desvio padrão
Assimetria
Erro padrão da assimetria
Mínimo
Máximo
Percentil 25
Percentil 75
Permanência geral (dias)
14,0
7,0
18,0
3,0
0,794
0,489
4,9
8,0
9,9
7
Permanência com antibióticos (dias)
TABELA 29.1 Análise de 25 hospitalizações (dados hipotéticos)
10,3
4,8
17,0
3,0
0,536
0,938
3,7
6,5
7,4
18
Permanência sem antibióticos (dias)
11,0
5,0
14,0
3,0
0,464
0,510
3,2
7,00
7,84
25
Leucócitos (1.000 células/mm3)
37,1
36,7
37,5
36,0
0,464
–0,212
0,4
36,8
36,8
25
Temperatura (oC)
57,5
23,5
82,0
4,0
0,464
0,186
20,1
41,0
41,2
25
Idade (anos)
60,0
22,0
82
19
0,794
0,889
22,3
36
42,7
7
Idade com antibióticos
56,8
24,3
73
4,0
0,536
–0,091
19,8
42,0
40,7
18
Idade sem antibióticos
206 Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
Exercícios
TABELA 29.2 Dosagem sérica de colesterol em obesos e não obesos s
Mediana (P50)
P25
P75
48
Realizou-se um estudo sobre a capacidade de os clínicos diagnosticarem infecção estreptocócica em 149 pacientes que se apresentaram na Emergência de um hospital com dor de garganta. As impressões clínicas dos médicos foram comparadas aos resultados de culturas orofaríngeas para estreptococos do grupo A. Dos 37 pacientes que apresentaram cultura orofaríngea positiva, em 27 os médicos diagnosticaram faringite estreptocócica. Entre 112 pacientes com cultura negativa, os médicos diagnosticaram que 35 tinham a doença. Fonte: adaptado de Fletcher & Hamann, 1976.2
Obesos
216,2
20,0
214,3
202,1
231,9
Eutróficos
172,0
24,0
168,9
154,6
190,3
TABELA 29.3 Idade (em anos) de 40 pacientes no hospital 32
63
33
57
35
54
38
53
42
8. Leia o resumo a seguir e responda às perguntas:
43
46
61
53
12
13
16
31
30
28
25
23
23
22
21
17
23
14
34
16
17
27
21
24
22
13
61
29
42
26
7. Leia o estudo a seguir e responda às per guntas: nn Justificativa:
cefaleia afeta a maioria das crianças e representa a terceira maior causa de absenteísmo à escola relacionado a doenças. Embora o desfecho a curto prazo para a maioria das crianças pareça favorável, poucos estudos relataram desfechos em longo prazo. nn Objetivo: avaliar o prognóstico em longo prazo de cefaleia infantil 20 anos após o diagnóstico inicial em um grupo de crianças do Canadá Atlântico que tiveram cefaleia em 1983. nn Métodos: 95 pacientes com cefaleia que se consultaram com um dos autores em 1983 foram previamente estudados em 1993. A situação clínica dos 77 pacientes contatados em 1993 foi revista em 2003, por meio de um protocolo de entrevista padronizado. nn Resultados: 60 (78%) de 77 pacientes responderam à entrevista (60 dos 95 do grupo original). Na revisão de 2003, 16 (27%) estavam livres de cefaleia, 20 (33%) tinham cefaleia do tipo tensional, 10 (17%) tinham enxaqueca e 14 (23%) tinham enxaqueca e cefaleia do tipo tensional. Ter mais de um tipo de enxaqueca foi mais prevalente do que no diagnóstico ou seguimento inicial (P <0,001) e o tipo de cefaleia variou ao longo do tempo. nn Conclusões: 20 anos após o diagnóstico de cefaleia pediátrica, a maioria dos pacientes continua a ter cefaleia, embora a classificação da cefaleia costume mudar ao longo do tempo.
A. Qual o tipo de delineamento utilizado no estudo? B. Se um médico examinar um paciente e diagnosticar amigdalite estreptocócica, qual a probabilidade de estar certo, com base nesse estudo? 9. Observe as curvas de indivíduos normais e de diabéticos da Figura 29.1. A. O que ocorrerá com relação ao diagnóstico de diabetes se o ponto de corte for mudado de 1 para 4? 10. Paciente do sexo feminino, de 50 anos de idade, comparece a uma consulta médica com queixas de dor intermitente no lado esquerdo do tórax mediante esforço, há vários meses. A paciente tem histórico de doença Pontos de corte 1
2
3
4
Normais
Porcentagem (%)
Colesterol (mg/dL)
207
Diabéticos
Fonte: adaptado de Brna et al., 2005.1
A. Qual o enfoque desse estudo? B. Qual o tipo de delineamento utilizado pelos autores?
0 Glicemia
FIGURA 29.1 Curvas de indivíduos normais e de diabéticos
208
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
cardíaca na família e nenhum outro fator de risco conhecido para doença cardíaca, a não ser uma hiperlipidemia moderada. A pressão arterial e a frequência cardíaca estão normais. O exame cardíaco não apresenta nada de excepcional. Considera-se que a dor possa representar uma angina pectoris e toma-se a decisão de iniciar uma investigação. A estimativa da probabilidade de a dor ser indício de angina é de 10% e um eletrocardiograma não revela anormalidades específicas. Decide-se, então, solicitar um teste ergométrico, que tem sensibilidade de 70% e especificidade de 75%. O teste resulta negativo. A. Qual a probabilidade de a paciente ter angina pectoris antes e depois de se submeter ao teste ergométrico? 11. Um paciente idoso foi submetido a um procedimento de redução aberta e fixação interna para uma fratura de quadril, sofrida durante uma queda. Após 12h de pós-operatório, ele apresentou subitamente dispneia, taquipneia e taquicardia. A saturação de oxigênio caiu de repente para 80% e o eletrocardiograma revelou um padrão de esforço cardíaco no lado direito. É quase certo que o paciente sofreu uma embolia pulmonar e estima-se em 90% a probabilidade de ocorrência dessa condição. Realiza-se, então, uma cintilografia de perfusão, que tem sensibilidade de 83% e especificidade de 88%. O exame resultou positivo. A. Qual é a probabilidade de embolia pulmonar agora? 12. Na pergunta anterior, se o exame de cintilografia tivesse sido negativo, dadas as características da operação descritas, qual seria a probabilidade posterior de embolia pulmonar? 13. Suponha que pesquisadores realizem um estudo epidemiológico com pacientes de uma clínica especializada no tratamento de doenças sexualmente transmissíveis. Selecionaram 200 pacientes com gonorreia e 105 pacientes com uretrite não gonocócica. No grupo com gonorreia, 160 pacientes tiveram uretrite prévia e, no grupo de uretrite não gonocócica, 50 tiveram previamente
episódios de uretrite. Com base nessas informações: A. Construa uma tabela 2 × 2 com os resultados. B. Qual a medida de associação a ser usada? C. Calcule a medida de associações e o intervalo de confiança de 95% (IC95%). D. A uretrite prévia pode estar associada à uretrite gonocócica? E. Que tipo de estudo é esse? 14. Em um estudo com mulheres de 50 a 69 anos de idade, 10.000 fumantes e 40.000 não fumantes foram acompanhadas duran te cinco anos. Cinquenta das mulheres fumantes e 10 das não fumantes desenvolveram câncer de pulmão nesses cinco anos. Com base nas informações apresentadas, responda: A. Qual o delineamento desse estudo? B. Qual o tipo de medida a ser adotada para mensurar a magnitude do efeito? C. Calcule essa medida com o intervalo de confiança de 95% (IC95%). D. Interprete os resultados. E. Suponha que, na população, 20% das mulheres entre 50 e 69 anos sejam fumantes. Qual a proporção de câncer de pulmão que pode ser atribuída ao hábito de fumar? 15. Há suspeita de associação entre câncer de pulmão e consumo pesado de bebida alcoólica (definido como consumo de duas doses ou mais por dia). Assim, é realizado um estudo prospectivo com 4.000 indivíduos. O status de alcoolismo é determinado no início do estudo e os indivíduos são seguidos durante 10 anos. A Tabela 29.4 mostra os resultados do estudo: TABELA 29.4 Associação entre câncer de pulmão e alcoolismo Consumo pesado de bebida alcoólica (≥2 doses/dia)
Câncer de pulmão em 10 anos Sim
Não
Sim
33
1.667
Não
27
2.273
CAPÍTULO
Respostas dos Exercícios
1. Resposta com base nas informações dos Capítulos 2, 3, 4 e 5 A. A Tabela 30.1 mostra a classificação das variáveis e as melhores formas de representá-las: B. Aparentemente, o uso de antibiótico não interferiu na permanência no hospital, pois a representação gráfica por meio de box plot (Figura 30.1) mostra que são praticamente coincidentes. Os dados estão na Tabela 29.1 (ver Capítulo 29, Exercícios). TABELA 30.1 Classificação das variáveis Melhor forma de apresentação
Variável
Classificação
Permanência geral (dias)
Variável numérica contínua
nn Mediana
Idade (anos)
Variável numérica contínua
nn Média
e desvio padrão nn Mediana e IIQ nn Gráfico de barra de erro nn Box plot
Variável nominal dicotômica
nn Apenas
Leucócitos (×1.000 células/mm3)
Variável numérica discreta
nn Média
Uso de antibiótico (sim/não)
Variável nominal dicotômica
nn Apenas
IIQ: intervalo interquartil.
15
10
5
e IIQ
nn Box plot
Gênero (masculino/ feminino)
20
Permanência hospitalar (dias)
30
escrever o percentual
e desvio padrão nn Mediana e IIQ nn Gráfico de barra de erro nn Box plot escrever o percentual
0
Sim
Não Recebeu antibiótico?
FIGURA 30.1 Box plot
2. Resposta com base nas informações do Capítulo 17 k 0
n 12 0 ,10 n! p(k ) k (1 )n k k !(n k )! 12 ! 0 ,1 100 (1 0 ,10 )12 0 p(k ) 0 !(12 0 )! 479.001.600 1 (0 , 90 )12 0 , 28 ou 28% p(k ) 479.001.600
226
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
3. Resposta com base nas informações dos Capítulos 2 a 5 A. Observando-se os dados, conclui-se que provavelmente existe uma razoável simetria, uma vez que as médias (x) e as medianas são muito parecidas e o coeficiente de variação (CV) dos obesos é igual a s/média = 20/216,2 = 0,09 ou 9%, e o dos eutróficos, 24/172 = 0,14 ou 14%. Ou seja, os CV são pequenos. É preocupante quando o CV é >50%. B. Para visualizar essa diferença, podem ser utilizados a própria tabela apresentada, o box plot e o gráfico de barra de erro (Figura 30.2). A diferença pode ser observada nos gráficos e confirmada por um teste t para amostras independentes que retornam um valor P <0,001. 4. Resposta com base nas informações dos Capítulos 4 e 17
250
Como z = (x – )/s, então z = (2,5 – 4)/1,5 = –1 e z = (5,5 – 4)/1,5 = 1. Pela curva de distribuição normal, a probabilidade de se encontrar um valor entre –1 e +1 desvios padrões é igual a aproximadamente 68% (Figura 30.3). Portanto, temos 100% – 68% = 32%, ou seja, 16% menos que 2,5 dias e 16% acima de 5,5 dias. 5. Resposta com base nas informações do Capítulo 5, Resumo dos Dados Numéricos x 1.288 A. x i 32, 20 anos 40 n 8.752, 4 ( x1 x )2 1.498 anos 40 1 n 1
s
A. Para o cálculo da mediana (Md), é neces sário colocar todos os valores em ordem crescente. Depois, verifica-se qual valor está na ½(n + 1) posição, ou seja, ½(40 + 1) = 20,5a posição. Como n = 40 é um nú mero par, tomam-se o 20o e o 21o valores (29 e 30 anos) e extrai-se a média dos dois:
Colesterol (mg/dL)
200
Md
150 100
IIQ P75 P25 42, 75 21, 25 21, 50 anos
50
A
0
P25 Eutróficos
Grupo
25 100
(n 1) 0 , 25 ( 40 1)
0 , 25 a posição
Obesos
A 10a posição é igual a 21 anos; a 11a posição é 22 anos. Entre elas, há uma
300
Colesterol (média +/- 2DP)
(28 29 ) 28 , 50 anos 2
200
100
0
B
68%
Eutróficos
Grupo
Obesos
FIGURA 30.2 (A e B) Box plot e gráfico de barra de erro
-2
-1
0
1
FIGURA 30.3 Curva normal padronizada
2
Z
Respostas dos Exercícios
diferença de 1 ano. Logo, a 0,25a (¼) po sição é igual a 0,25 ano. Então:
Seguindo o mesmo raciocínio para o P75, temos: 75 100
(n 1) 0 , 75 ( 40 1)
A 30a posição é igual a 42 anos; a 31a posição é 43 anos. Entre elas, há uma diferença de um ano. Logo, a 0,75a (¾) posição é igual a 0,75 ano. Então: P75 42 0 , 75 42, 75 anos IIQ P75 P25 42, 75 21, 25 21, 50 anos ou u IIQ 21, 25 a 42,75 anos
B. Como a média é maior que a mediana, o intervalo interquartil (IIQ) tem uma amplitude grande e o coeficiente de variação (CV = 14,98/32,20 = 0,465 ou 46,5%) é também grande (quase 50%), tem-se assimetria positiva. 6. Resposta com base nas informações do Capítulo 14, Testes Diagnósticos A. Construindo a Tabela 30.2, tem-se: Concluindo: a tabela do doutor B tem uma acurácia maior que a do doutor A. B. Observando a Tabela 30.3 do doutor B: pD+|T– = probabilidade de doença, uma vez que o teste é negativo (falso-negativo) c 1 5, 5 10 3 ou 0 , 55% (c d) (1 181)
TABELA 30.2 Acurácia do doutor A Sensibilidade = 80%; especificidade de 85%
Sim
Não
Positivo
9
9
Negativo
1
181
Total
10
190
Concluindo: a criança tem 0,55% de probabilidade de apresentar ITU, mesmo com o teste rápido negativo. C. O valor preditivo positivo (VPP) dos pediatras com a prevalência de 5%, utilizando as tabelas 2 × 2, Tabelas 30.4 e 30.5, é: Doutor A: VPP = 8/(8 + 28) = 0,22 ou 22%. Doutor B: VPP = 9/(9 + 9) = 0,50 ou 50%. Supondo que a prevalência aumente para 15%, temos: Doutor A: VPP = 24/(24 + 25) = 0,49 ou 49%. Doutor B: VPP = 27/(27 + 8) = 0,77 ou 77%.
TABELA 30.4 Validade do doutor A com prevalência de infecção urinária de 15% Sensibilidade = 80%; especificidade de 85%
Sim
Não
Infecção urinária
Teste do doutor A
Sim
Não
Positivo
24
25
Negativo
6
145
Total
30
170
TABELA 30.5 Validade do doutor B com uma prevalência de infecção urinária de 15% Sensibilidade = 90%; especificidade de 95%
Infecção urinária
Teste do doutor A
Infecção urinária
Teste do doutor B
Acurácia = (9 +181)/200 = 0,95 ou 95%
30 , 75 a posição
pD | T
TABELA 30.3 Acurácia do doutor B Sensibilidade = 90%; especificidade de 95%
P25 = 21 + 0,25 = 21,25 anos
P75
Infecção urinária
Teste do doutor B
Sim
Não
Positivo
8
28
Negativo
2
162
Positivo
27
8
Total
10
190
Negativo
3
162
Total
30
170
Acurácia = (8 + 162)/200 = 0,85 ou 85%
227
228
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
Ambos os pediatras melhoram o VPP. Isso mostra que o VPP aumenta conforme o aumento da prevalência. Se o resultado do teste for positivo, ambos os pediatras têm maior probabilidade de atender uma criança com infecção do trato urinário (ITU). 7. Resposta com base nas informações do Capítulo 11, Estudos Observacionais A. Prognóstico. B. Estudo de coorte. 8. Resposta com base nas informações dos Capítulos 11, Estudos Observacionais e 14, Testes Diagnósticos A. Estudo observacional transversal ou de prevalência B. Primeiramente, transformaremos os dados do resumo na Tabela 30.6. Agora, calcula-se o valor preditivo positivo: VPP =
27 = 0 , 44 ou 44% 62
Probabilidade (p) pré-teste (prevalência) = 10%
TABELA 30.6 Validade diagnóstica dos clínicos diante de uma amigdalite estreptocócica Amigdalite estreptocócica Sim
Não
espec (1 prev ) [(1 sens) prev ] [espec (1 prev )] 0 , 75 (1 0 ,10 ) VPN 0 , 96 [(1 0 , 70 ) 0 ,10] [0 , 75 (1 0 ,10 )] (1 VPN) 1 0 , 96 0 , 04 ou 4% VPN
Outra maneira de calcular:
Se o teste for positivo, o médico está diante de 44% de probabilidade de que o paciente tenha amigdalite estreptocócica. 9. Resposta com base nas informações do Capítulo 14, Testes Diagnósticos A. Conforme o ponto de corte se desloca de 1 para 4, diminui a taxa de falso-positivos (aumenta a especificidade), mas eleva a taxa de falso-negativos (baixa a sensibilidade). Em consequência, aumenta o valor preditivo positivo (VPP), ou seja, se alguém tem teste positivo (acima do ponto de corte 4), receberá o diagnóstico de diabéti co. Nesse ponto de corte, muitos diabéticos deixarão de receber o diagnóstico.
Impressão diagnóstica
10. Resposta com base nas informações do Capítulo 14, Testes Diagnósticos A probabilidade de a paciente ter angina pectoris antes do teste ergométrico é a prevalência da doença na população com as características dessa paciente, que é de aproximadamente 10%. Após realizar o teste e sendo este negativo, a probabilidade é igual a (1 – VPN). O valor preditivo negativo (VPN) pode ser calculado por meio da seguinte equação, sabendo-se a sensibilidade (0,70), a especificidade (0,75) e a prevalência (0,10):
Total
Positivo
27
35
62
Negativo
10
77
87
Total
37
112
149
oddspré
p pré 1 p pré
0 ,10 0 ,11 (1 0 ,10 )
oddspós LR( ) oddspré (1 sens) (1 0 , 70 ) 0 , 40 0 , 75 esp LR( ) oddspré 0,, 40 0 ,11 0 , 044
LR( ) oddspós p pós
odds pós 1
oddspós
0 , 044 0 , 04 (1 0 , 044 )
ou 4%
11. Resposta com base nas informações do Capítulo 14, Testes Diagnósticos Conhecendo-se a sensibilidade (0,83), a especificidade (0,88) e a prevalência (0,90), calcula-se o valor preditivo positivo (VPP) por meio da seguinte equação: sens prev (sens prev ) [(1 espec ) (1 prev )] 0 , 83 0 , 90 VPP (0 , 83 0 , 90 ) [(1 0 , 88 ) (1 0 , 90 )] 0 , 09 ou 98% VPP
Índice
A Acurácia de um teste diagnóstico, 99 Alocação, 75 - completa, 75 - estratificada, 75 Amostra(s), 109 - aleatória ou probabilística, 109 - de conveniência, 110 - representativa, 196 - semiprobabilística, 110 - tipos de, 109 Amplitude, 28 Análise - da magnitude do efeito, 76, 187 - de sensibilidade, 196 - de sobrevida, 53 - de um estudo - - diagnóstico, 191 - - etiológico, 199 - - prognóstico, 195 - - terapêutico, 185 - de variância, 138 - dos estudos - - caso-controle, 69 - - de coorte, 72 - - transversais, 67 - por intenção de tratar, 186 - quantitativa de uma revisão sistemática, 84 ANOVA de fator único, 139 Aplicabilidade dos resultados, 187, 192 Aplicação de critérios de inclusão e exclusão, 83 Apresentação da metanálise, 86 Artigo científico, 175
Autores, 175 Avaliação, 76 - crítica - - de um artigo original, 179 - - dos artigos, 83 - - geral de um artigo científico, 178 - da magnitude do efeito do tratamento, 187 - da qualidade da evidência, 181
B Busca - da melhor evidência, 171 - na literatura, 82
C Cálculo - - da ANOVA, 139 - do intercepto (b0) e da inclinação da reta (b1), 148 - do intervalo de confiança, 125 - do tamanho amostral para - - a diferença entre duas proporções, 111 - - testar a diferença entre duas médias, 111 Casos incidentes ou prevalentes, 68 Coeficiente - de correlação de Spearman, 163 - de determinação, 147 - de kappa, 99 Combinação de valores P, 84 Comparação, 171 - da sobrevida em dois ou mais grupos, 56 Conclusões, 177 Condução, 76
250
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
Contagem de votos, 84 Controle(s) - dos vieses de confusão, 102 - emparelhados, 68 Coorte - concorrente ou longitudinal, 70 - não concorrente, 71 - tipos de, 70 Correção para a continuidade de Yates, 154 Correlação, 143 - linear, 144 Cuidados na interpretação de dados de estudos transversais, 66 Curva - de frequência percentual cumulativa, 17 - de Kaplan-Meier, 55 - ROC, 96
D Dados, 3 - censurados, 53 - cumulativos, 17 - definindo, 1 - descrevendo, 7 Definição da questão de pesquisa, 82 Delineamento(s) - de pesquisa, 61, 63 - elementos básicos de um, 64 - fatoriais, 78 - tipos de, 64 Desenho de estudo para responder à pergunta, 171 Desfechos, 64, 188 Detecção de viés de publicação, 86 Diagnóstico, 170 Discussão, 177 Distribuição(ões) - amostral das médias, 123 - binomial, 118 - de probabilidades, 113, 128 - dos dados, 21 - normal, 22, 113 - - padronizada, 115 - outras formas de, 22 - t de Student, 116
E Efeito(s) - adverso, 201 - Hawthorne, 73 - temporal, 66 Elaborando a pergunta clínica, 171 Emparelhamento, 103 Endemia, 38 Enfoque, 64 Ensaio(s) clínico(s), 73 - características do, 73 - com delineamento cruzado (crossover design), 77 - de equivalência e não inferioridade, 77 - elementos básicos de um, 74 - exemplo de, 73 - tipos de, 77 Epidemia, 38 Erros de decisão, 131 Escala de Jadad, 188 Escolha dos controles, 68 Especificidade, 90 Esquema geral de avaliação de um artigo científico, 178 Estatística, 110 - I2, 85 Estimativa da precisão do tamanho do efeito, 187 Estratégia - de busca para o PubMed, 172 - pico, 170 Estratificação, 103 Estrutura de um artigo científico, 175 Estudos - caso-controle, 67 - - de base populacional, 68 - de coorte, 69 - - misto, 71 - - prospectivo, 70 - - retrospectivo ou histórico, 71 - - vantagens e desvantagens dos, 72 - ecológicos, 65 - observacionais, 65 - transversais, 66 - - que parecem longitudinais, 66 - - repetidos, 66 Etiologia, 170
Índice
Exposição, 64, 170 Extração de dados relevantes, 83
F Fase(s) - clínica, 79 - de experimentação, 79 - I, 79 - II, 79 - III, 79 - IV, 79 - não clínica, 79 Fator(es) - bibliométrico, 175 - de impacto, 175 - de risco, 170 - que interferem na amplitude do intervalo de confiança, 127 Flutuação na gravidade da doença, 73 Fontes de heterogeneidade, 86 Força da recomendação, 181, 182 Formulação da pergunta clínica, 170 Frequência relativa, 9
G Gráfico(s), 13 - de barras, 13 - de setores ou pizza, 13 - para dados - - numéricos - - - contínuos, 15 - - - discretos, 13 - - ordinais e nominais, 13 Grupo-controle, 74 Grupos - abertos, 11 - similares, 186
H Hazard ratio, 58 Heterogeneidade, 84 Hipótese nula, 130 Histograma, 15
I Identificação, 175
Imprecisão, 182 Imunidade coletiva, 38 Incidência, 36 - cumulativa, 37 Inconsistência, 182 Inferência estatística, 107, 127 Informações indiretas, 182 Instituição, 175 Intenção de tratar, 76 Interpretação - da ANOVA, 142 - do intervalo de confiança, 126 Intervalo - de confiança, 123 - - versus valor P, 132 - interquartil, 28 Intervenção, 170, 171
L Limitações dos estudos caso-controle, 68
M Média, 26 Mediana, 25 - do tempo de sobrevida, 56 Medicina baseada em evidências, 169 - etapas da, 170 Medida(s) - básicas em epidemiologia, 33 - de associação, 41 - de dispersão, 28 - - apropriada, 30 - de frequência, 35 - de impacto, 47 - de localização mais apropriada, 27 - de tendência central, 25 Melhora previsível, 73 Metanálise, 84 Método de Kaplan-Meier, 53 Metodologia, 177 Moda, 25 Modelagem estatística, 103 Modelo de riscos proporcionais, 58 Motivos que alteram a qualidade da evidência, 182 Múltiplos testes, 97
251
252
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica
N
Q
Natureza dos dados, 3 Número - necessário para causar dano, 50 - necessário para tratar, 49 - reprodutivo básico, 38
Qualidade da evidência, 181 Questão - clínica, 171 - de pesquisa, 63
O
Randomização, 73, 103 - alocação desigual, 76 - dos grupos, 185 Razão(ões), 35 - de chances, 42 - de prevalência, 44 - de probabilidades, 92 - - para um teste negativo, 93 - - para um teste positivo, 93 Redução - absoluta do risco, 47 - relativa do risco, 48 Referências, 177 Regra de decisão e o valor P, 130 Regressão, 143 - de Cox, 58 - linear simples, 147 Relação entre prevalência e incidência, 38 Relato de caso, 65 Reprodutibilidade do resultado do teste, 193 Restrição, 103 Resultados, 177, 187 Resumo, 176 - dos dados numéricos, 25 Revisão(ões) - sistemática, 81 - tradicionais (narrativas) e sistemáticas, 81 Risco(s) - atribuível, 47 - - populacional, 50 - - proporcional, 48 - de vieses, 182 - relativo, 41
Odds ratio, 42 - e risco relativo, 43 Outcome (desfecho), 171
P Paciente, 170 Padrão-ouro, 192 Parâmetros, 110 Pergunta(s) - claramente definida, 185 - ética, 64 - factível, 63 - interessante, 63 - nova, 64 - primárias ou eliminatórias, 185, 191, 195 - relevante, 64 - secundárias, 186, 192, 196 Periódico, 175 Ponderando o efeito das estimativas, 84 Pontuação de Jadad, 188 População, 109, 170 Potencial benefício ao paciente individual, 201 Precisão das estimativas, 197 Pressupostos - da ANOVA de fator único, 139 - para a realização da correlação, 147 Prevalência, 35 - pontual, 35 - por período, 35 Problema, 170 - de vários testes de significância, 138 Processo do teste de hipótese, 130 Prognóstico, 170 Proporções, 35 Propriedades do desvio padrão, 30 Protocolo de uma revisão sistemática com metanálise, 82 PubMed, 172
R
S Seguimento, 76 - dos pacientes, 196 Seleção - dos casos, 67 - dos sujeitos, 74
Índice
Sensibilidade, 90 Série de casos, 65 Significado dos tipos de questão e tipo de desenho, 171 Sistema de pontuação de qualidade de Oxford, 188 Soma dos quadrados - do fator, 141 - residual, 141 - total, 140
- t para amostras - - emparelhadas, 137 - - independentes, 135 Título, 175
T
V
Tabela(s), 9 - cruzadas, 12 - de frequência para variáveis - - nominais, 9 - - numéricas, 10 - - ordinais, 10 Tamanho - amostral, 110 - - para os controles, 68 - de efeito padronizado, 44 Taxas, 35 Temporalidade, 64 Teste(s) - com variáveis contínuas, 95 - de heterogeneidade, 85 - de hipótese, 127 - de Kruskal-Wallis, 161 - de log-rank, 56, 58 - de Mann-Whitney, 157 - de significância para a regressão, 149 - de Wilcoxon, 159 - diagnóstico, 89 - do sinal (sign test), 84 - em avaliação, 192 - exato de Fisher, 154 - não paramétricos, 157 - paramétricos, 135 - post-hoc, 142 - qui-quadrado, 153 - sequenciais, 97 - simultâneos, 98
Validade, 104 - externa, 104 - interna, 104 Valor - F, 141 - P, 123 - preditivo, 91 Variância e desvio padrão, 29 Variáveis, 3 - como identificar o tipo de, 6 - componentes, 64 - contínuas, 10 - discretas, 11 - nominais, 3 - numéricas - - contínuas, 5 - - discretas, 5 - ordinais, 4 - tipos de, 3 Viés(es), 101 - de aferição, 102 - de análise, 71 - de atrito, 83 - de confusão, 102 - de desempenho, 83 - de informação, 71 - de não resposta e perdas de acompanhamento, 71 - de publicação, 182 - - seletiva, 83 - de seleção, 83, 101 - em estudos de coorte, 71 - na avaliação dos desfechos, 71
U Uso - de software, 84 - e restrições do χ2, 154 Utilidade da razão de probabilidades, 94
253
SOBRE O AUTOR
Petrônio Fagundes de Oliveira Filho Professor aposentado de Pediatria, Epidemiologia e Bioestatística da Universidade de Caxias do Sul (UCS), RS. Mestre em Saúde Pública pela Universidade de São Paulo (USP). Especialista em Estatística Aplicada pela UCS, RS. Especialista em Pediatria pela Sociedade Brasileira de Pediatria (SBP). Graduado em Medicina pela UCS, RS.
Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica – 2a edição foi concebida como uma introdução à epidemiologia e à bioestatística, salientando os assuntos que se constituem em uma instrumentação básica para a leitura crítica de artigos científicos na área da saúde. Para esta nova edição, houve a atualização de alguns capítulos e acréscimo de novos exemplos e mais 50 exercícios resolvidos. Entretanto, foi mantida a preocupação de não torná-lo muito complexo, focando naquilo que é mais encontrado na literatura científica biomédica. O objetivo é que ele continue a ter uma assimilação fácil tanto para o aluno da graduação quanto para o de pós-graduação, como também para os professores e outros profissionais da área da saúde. A finalidade, portanto, desta segunda edição do livro continua a ser a mesma: ajudar a evitar a intoxicação causada pela pseudociência.
Áreas de interesse Epidemiologia Bioestatística
9 786588 340363
Oliveira Filho - Epidemiologia.indd 1
01/06/22 14:40