Seção III INTERPRETAÇÃO+DOS+RESULTADOS+
68
18 INTERPRETAÇÃO DOS RESULTADOS 18.1 OBJETIVOS ! !
Introduzir conceitos para interpretação dos resultados apresentados por diferentes evidências científicas. Introduzir conceitos para análise crítica de evidências científicas.
18.2 MATERIAL COMPLEMENTAR Material complementar está disponível no site do workshop (www.ebcp.com.br/simple) nas páginas Teaching Tips, Videos e Users Guides. Material complementar para o entendimento de topicos relacionados a este tema também está disponível na página Supplements tais como desfecho combinado e análise de subgrupos.
18.3 MEDIDAS DE FREQUÊNCIA, EFEITO, IMPACTO E PRECISÃO Os resultados podem ser categorizados em medidas de frequência, efeito, impacto e precisão. Tais medidas são encontradas em diferentes tipos de estudos e utilizadas para apresentar os resultados encontrados com a análise dos desfechos do estudo. A Figura 3 abaixo relaciona as diferentes medidas com os diferentes tipos de estudos para cada domínio de ação clínica: Terapia, Diagnóstico, Prognóstico e Dano.
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
69
Figura 3. Medidas de frequência, efeito, impacto e precisao de acordo com os domínios de ação clínica (terapia, diagnóstico, prognóstico e dano) e com os quatro principais desenhos de estudos individuais
RR: Risco Relativo HR: Harzard Ratio OR: Odds Ratio ou Razão de Chances DR: Diferença de Risco Absoluto ou Risco Atribuível LR: Likelihood Ratio ou Razão de Verossimilhança IC: Intervalo de Confiança
18.4 INTERPRETAÇÃO DAS MEDIDAS DE FREQUÊNCIA
18.4.1 Risco Absoluto O risco absoluto de um evento refere-se ao percentual de pacientes que apresentaram aquele evento durante o acompanhamento, em um periodo de tempo pré-estabelecido. Por exemplo, se acompanhássemos 100 patientes com estenose aortica grave por 1 ano e destes 30 apresentassem síncope neste período, então o risco absoluto de síncope nesta população seria de 30%. Se acompanhássemos uma outra população de 100 pacientes semelhantes a estes, com a mesma gravidade de estenose aórtica, mesmo tratamento clinico, mas que fossem submetidos a uma intervenção cirúrgica e que tivesse ao final de 1 ano apenas 20 dos 100 pacientes com síncope, então teríamos um risco absoluto de síncope nos pacientes tratados cirurgicamente de 20%. Isso quer dizer que a intervenção cirúrgica pode ter reduzido o risco de síncope de 30% para 20% nesta população, ou seja, pode ter causado um impacto de 10% na redução do risco absolute de síncope.
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
70
A diferença de risco absoluto é uma medida amplamente utilizada para o cálculo do número necessário para tratar (NNT), para “screenar” (NNS) ou para causar dano (NND). A grande limitação da utilização da diferença de risco absoluto é que não podemos extrapolá-lo indiscriminadamente para outras populações uma vez que estas variam em caracteristica e em gravidade. Tais extrapolações são feitas geralmente com base no risco relativo, conforme veremos a seguir. 18.4.2 Probabilidade Pré-Teste e Limiar de Decisão A probabilidade pré-teste de uma condição foi definida pelo teorema de Bayes como a estimativa do quão provável é que aquela pessoa tenha ou não a condição de interesse. Esta probabilidade está relacionada ao conhecimento da doença e das suas manifestações clínicas e é altamente dependente da intuição profissional no momento da solicitação do teste. Os limiares de decisão diagnóstica e de decisão terapêutica estão representados na Figura 4. A primeira zona de certeza é demarcada pelo limiar diagnóstico e a última pelo limiar terapêutico. Quando a probabilidade pré-teste está abaixo do limiar diagnóstico, significa que o teste não é necessário para afastar aquela condição, uma vez que a probabilidade pré-teste é tão baixa que o teste será incapaz de baixá-la ainda mais, a um nível clinicamente mais significativo. Da mesma forma quando a probabilidade pré-teste está acima do limiar terapêutico, significa que o teste não é necessário para confirmar aquela condição, uma vez que a probabilidade pré-teste é tão alta que o teste será incapaz de aumenta-la ainda mais, a um nível clinicamente mais significativo.47 Pacientes com dor torácica, por exemplo, que tem como manifestação sintomática a presença de dor típica, como fatores de risco a presença de diabetes, dislipidemia e tabagismo, estão acima da 6a década de vida e são do sexo masculino, têm alta probabilidade pré-teste de doença coronariana e nestes pacientes nenhum exame adicional é necessário para que se opte pelo tratamento clínico e pela coronariografia quando o tratamento invasivo está indicado.48 Isso acontece por que os exames disponíveis para confirmação da presença de doença coronariana não vao modificar a probabilidade pré-teste de doença. Pelos critérios de Diamond e Forrester a probabilidade pré-teste de um doente com estas características é acima de 95%. Não há teste disponível que seja capaz de aumentar esta probabilidade pré-teste para 100% e, portanto, nestas situações eles se tornam desnecessários e até prejudiciais, quando o intuito é único e exclusivo para se confirmar a presença da doença.48 Nenhum teste isoladamente é capaz de nos dar 100% de certeza em relação a presença ou ausência da condição clínica e lidar com algum grau de incerteza é inerente a prática assistencial. O clínico com base nas informações disponíveis e na sua experiência profissional precisa saber decidir quando interromper a investigação e quando iniciar o tratamento independentemente de qualquer investigação adicional. Diversas regras de decisão clínica vem sendo estudadas e validadas em todo o mundo para dar suporte ao clínico na estimativa da probabilidade pré-teste de forma mais precisa. Entretanto existem muitas situações clínicas que não contam com regras de predição e nestas situações o clínico conta somente com o seu conhecimento da doença, com sua experiência profissional e com o conhecimento da prevalência daquela condição na sua localidade, quando disponível. Trabalhar com quartis de 25%, 50% e 75% é uma opção para estimar baixa, moderada e alta probabilidade pré-teste. Solicitar ou não o teste nestas situações vai depender do quanto estes testes podem podem modificar esta probabilidade pré-teste em uma probabilidade pós-teste útil para tomada de decisão se o resultado do teste vier positivo ou negativo. Esta capacidade do teste depende de sua razão de verossimilhança quando o resultado do teste é positivo e quando o resultado é negativo, conforme será discutido a seguir. A sustentabilidade do sistema de saúde depende da adequada utilização dos recursos disponíveis de forma Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
71
eficiente e segura para os pacientes. A superutilização de recursos, tais como o arsenal de testes diagnósticos disponíveis, além de insustentável pelo sistema é perigosa pois pode estar relacionada a efeitos deletérios para o indivíduo e para a sociedade.
Figura 4. Limiar de decisão diagnóstica e terapêutica
Chance! Pré!
Ausência!
RV!
Chance! Pós!
Zona!de!Incerteza!
! Limiar Diagnóstico
Presença! ! Limiar Terapêutico
18.5 INTERPRETAÇÃO DAS MEDIDAS DE EFEITO
18.5.1 Razão de Verossimilhança (Likelihood Ratio) A avaliação da acurácia de um teste ou regra de predição para detecção de uma determinada condição de saúde depende do entendimento do que significa sensibilidade, especificidade e razão de verossimilhança e como elas se correlacionam com as probabilidades pré e pós-teste de doença. Conforme demonstrado na Tabela 6, a sensibilidade de um teste diagnóstico refere-se a capacidade daquele teste de detectar pacientes verdadeiramente com a condição clínica de interesse (doentes) quando o resultado do teste é positivo, ou seja, é a proporção de pacientes com resultado do teste verdadeiramente positivo quando a doença está presente.47 E a especificidade de um teste diagnóstico refere-se a capacidade daquele teste de detectar pacientes verdadeiramente sem a condição clínica de interesse (sadios) quando o resultado do teste é negativo, ou seja, é a proporção de pacientes com resultado do teste verdadeiramente negativo quando a doença não está presente.47
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
72
Tabela 6. Cálculo das razões de verossimilhança com base na proporção de verdadeiros positivos e negativos e falsos positivos e negativos
Teste + Teste -
% com a condição clínica* %V(+) %F(-) S = %V(+)
% sem a condição clínica* %F(+) %V(-) E = %V(-)
RV(+) RV(-)
= %V+ / %F+ = %F- / %V-
V+ = Verdadeiro positivo; V- = Verdadeiro negativo; F+ = Falso positivo; F- = Falso negativo; S = Sensibilidade; E = Especificidade (*) O Diagnóstico definitivo é dado pelo critério de referência utilizado. Algumas condições não possuem um critério de referencia ou “padrão ouro” específico. Nestes casos o acompanhamento por um período de tempo suficientemente longo pode ser utilizado para definição do diagnóstico.
A razão de verossimilhança positiva, ou seja, quando o resultado do teste é positivo [RV(+)], é uma razão entre a proporção de resultados positivos em pacientes com e sem a condição clínica de interesse [%V(+) / %F(+)].47 A razão de verossimilhança negativa, ou seja, quando o resultado do teste é negativo [RV(–)], é uma razão entre a proporção de resultados negativos em pacientes com e sem a condição clínica de interesse [%F(-) / %V(-)].47 Portanto, conforme demonstrado na Tabela 6, basta conhecer a sensibilidade e a especificidade do teste para que o cálculo da RV possa ser rapidamente efetuado. RV(+) = Sensibilidade / (100 – Especificidade) RV(–) = (100 – Sensibilidade) / Especificidade
A razão de verossimilhança de um teste permite transformar a probabilidade pré-teste de doença em uma probabilidade pós-teste de doença, dessa forma movendo o observador da zona de incerteza de definição da condição clínica de interesse para a zona de certeza da ausência ou da presença da condição clínica, uma vez que o resultado do teste é liberado. Portanto, a razão de verossimilhança de um teste é importante para se estimar a probabilidade pós-teste da doença com base na sua probabilidade pré-teste (Figura 5).
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
73
Figura 5. Nomograma de Fagan para estimar a probabilidade pós-teste de doença com base na probabilidade préteste e na razão de verossimilhança
18.5.2 Risco Relativo O risco relativo refere-se a razão entre o risco absoluto observado no grupo exposto e o risco absoluto observado no grupo não exposto (Tabela 7). Por exemplo, em pacientes com infarto agudo do miocárdio o risco de um novo infarto no grupo tratado por angioplastia é de 5% e no grupo tratado por trombolítico é de 8%. O risco de um relativo ao do outro é de 5%/8% = 0.625. Podemos dizer então que a angioplastia reduziu o risco de um novo infarto em 37,5% (1 – 0.625 = 0.375) em relação ao trombolítico. O risco relativo é frequentemente utilizado para demonstrar o efeito de diferentes intervenções e ele quase sempre dá uma impressão de que o impacto da intervenção é alto. Entretanto, o risco relativo sozinho não pode informar o impacto da intervenção ou exposição. Impacto refere-se a diferença de risco absoluto e para calcula-la precisamos saber o risco absoluto de base daquela população, ou seja, o risco sem a intervenção ou exposição. Ao aplicar o risco relativo sobre o risco de base da população, aí sim podemos estimar o impacto da intervenção ou exposição naquela população específica em termos absolutos.
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
74
Tabela 7. Cálculo do risco relativo utilizando a tabela 2x2
Intervenção Controle
N com desfecho a c
N sem desfecho b d
RAI RAC RR
= a/(a+b) = c/(c+d) = RAI / RAC
RAI = Risco Absoluto no grupo intervenção; RAC = Risco Absoluto no grupo controle; RR = Risco Relativo
O risco relativo sempre se refere a um risco de base e em prática clínica baseada em evidências este conceito é extremamente relevante. Por exemplo, se avaliarmos 3 populações com risco de base diferentes, e submetermos estas 3 populações ao mesmo tipo de intervenção e ao mesmo tipo de controle, observaremos que os riscos absolutos irão variar de uma população para outra, mas os riscos relativos permanecerão parecidos (Figura 6). Isto é importante como medida de efeito uma vez que podemos aplicar o RR observado na população do estudo em uma outra população de interesse, levando em consideração o risco de base daquela população de interesse. Da mesma forma podemos agrupar os resultados de diferentes estudos de forma a aumentar a precisão dos resultados, como é usualmente feito em meta-análises de estudos individuais (Figura 7). Dessa forma, aplicando o RR e sabendo o risco de base, podemos calcular a diferença de risco absoluto e aí sim avaliar o impacto da intervenção na população de interesse. Este é o princípio utilizado nas revisões sistemáticas para realização de meta-análises, onde as medidas relativas de diferentes estudos são somadas para obtenção de uma média das medidas relativas que representam o efeito da intervenção.
Figura 6. Redução de risco relativo versus redução de risco absoluto em diferentes populações recebendo o mesmo tipo de intervenção RR: Risco Relativo; RRA: Redução de Risco Absoluto; RRR: Redução de Risco Relativo
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
75
Figura 7. Meta-análise dos estudos All-Sirius, Pache e Ravel, que compararam stents farmacológicos com stents convencionais para redução da taxa de infarto agudo do miocárdio em pacientes com doença coronariana obstrutiva RR (IC 95%)
Estudos
All - Sirius
% Peso
1,32(0,63-2,78)
48
Pache
1,40(0,45-4,35)
19,9
Ravel
1,72(0,75-3,95)
32,1
IC 95%
1,47 (0,89-241) 0,23
4,35
1
IC: Intervalo de Confiança; RR: Risco Relativo
18.5.3 Harzard Ratio Hazard Ratio tem um significado semelhante ao Risco Relativo, mas incorpora a taxa de eventos ao longo do tempo ao invés da taxa de eventos em um único momento no tempo. De uma forma didática podemos dizer que o Hazard Ratio é a média dos riscos relativos observados em cada unidade de tempo, ao longo do acompanhamento (Figura 8).
Figura 8. Demonstração do cálculo do Hazard Ratio com base nas curvas de sobrevida de dois grupos hipotéticos 100
100
100
95 90
Sobrevida (%)
80
75
70
68
70
50
RR1 = 5/30 = 0,17
50 RR2 = 10/50 = 0,20
25
35 RR4 = 30/65 = 0,46
30
RR5 = 32/70 = 0,46
HR = Média dos RR = 0,32
0 2005
40 RR3 = 20/60 = 0,33
2006
2007
2008
2009
2010
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
76
18.5.4 Razão de Chances (Odds Ratio) Odds ou chance tem um significado diferente de risco. A chance refere-se a quantas vezes é mais provável um evento acontecer do que não acontecer, ou seja, é a razão entre a probabilidade do evento acontecer (P), sobre a probabilidade do mesmo evento não acontecer (1 – P). Matematicamente pode ser representada como P / (1 – P).
Se jogarmos um dado, por exemplo, a probabilidade de obtermos o número 3 é 1/6 (probabilidade do evento acontecer) e a probabilidade de não obtermos o número 3 é 5/6 (probabilidade do evento não acontecer). A chance, portanto, é (1/6)/(5/6) = 1/5, ou seja, é 5 vezes mais provável que o número 3 não aconteça.
Da mesma forma, quando estamos estudando um evento clínico, também podemos calcular a chance daquele evento (probabilidade de acontecer/probabilidade de não acontecer), conforme demonstrado na Tabela 8, abaixo.
Tabela 8. Cáluco da razão de chances utilizando a tabela 2x2
Exposição Controle
Tiveram o desfecho a c
Não tiveram o desfecho b d
ChanceE ChanceC RC
= a/b = c/d = ChanceE / ChanceC
C = Controle; E = Exposto; RC = Razão de Chances
A chance geralmente é um número de maior valor que o risco e por isso dá uma impressão superestimada do efeito da intervenção. Por esta razão é uma medida preferida por alguns pesquisadores quando estes estão comprometidos com a necessidade de valorizar o resultado da sua pesquisa. De uma forma geral quando a taxa de eventos em cada grupo é inferior a 10%, a chance e o risco se aproximam oferecendo valores muito semelhantes, e, portanto, a razão de chances nesta situação pode ser lida e interpretada da mesma forma que o risco relativo. Isso é facilmente demonstrável utilizando-se a conversão de risco em odds conforme descrito abaixo: Risco = 80% Risco = 60% Risco = 40% Risco = 20% Risco = 10% Risco = 5%
Odds = 80/20 = 4 Odds = 60/40 = 1.5 Odds = 40/60 = 0.67 Odds = 20/80 = 0.25 Odds = 10/90 = 0.11 Odds = 05/95 = 0.05
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
77
18.6 INTERPRETAÇÃO DAS MEDIDAS DE IMPACTO
18.6.1 Diferença de Risco Absoluto ou Risco Atribuível A diferença de risco absoluto, também chamada de risco atribuível, é a diferença entre os riscos de ocorrência do desfecho nos grupos exposto (intervenção) e não exposto (controle). Por exemplo, se o risco de um novo infarto no grupo tratado com trombolítico é de 8% e o risco de um novo infarto no grupo tratado com angioplastia primária é de 5% no primeiro mês após o primeiro infarto, então a diferença de risco é de 3% em 1 mês. Estes 3% significam que, se um paciente semelhante aos pacientes que foram estudados é tratado por angioplastia, a probabilidade dele ter um novo evento em 1 mês diminui em 3% em termos absolutos em relação ao trombolítico. Para saúde pública isso significa dizer que para cada 100 pacientes tratados por angioplastia primária, ao invés de trombolítico, 3 re-infartos serão evitados no horizonte de tempo de 1 mês; para cada 1.000 pacientes tratados, 30 re-infartos serão evitados; para cada 10.000, 300 re-infartos serão evitados e assim por diante. A diferença de risco absoluto é considerada uma medida de impacto pois ela diz com que magnitude o sistema de saúde pode ser impactado se aquela intervenção for aplicada ou se aquela exposição acontecer. Para um paciente individual é importante frisar que apesar do risco dele diminuir com a angioplastia, ele continua tendo uma probabilidade de 5% de ter um re-infarto em 30 dias e que por isso ele deve estar orientado quanto ao tratamento e quanto ao que fazer se novos sintomas aparecerem. Entretanto, a diferença de risco absoluto observada em uma população somente pode ser generalizada para outras populações com características muito semelhantes as daquela população que foi estudada. Para contornar este problema normalmente utilizamos as medidas relativas observadas em um estudo e transportamos aquelas medidas relativas para o risco de base da população que estamos avaliando. 18.6.2 Número Necessário para Tratar (NNT) ou para causar Dano (NND) O Número Necessário para Tratar (NNT) significa o número de pacientes que precisam ser tratados para que um evento seja evitado, em um período de tempo pré-estabelecido. O Número Necessário para causar Dano (NND) signica o número de pacientes que precisam ser expostos a uma intervenção ou fator ambiental ou comportamental para que um dano seja causado, em um período de tempo pré-estabelecido. Tanto o NNT quanto o NND são calculados a partir da Diferença de Risco de Absoluto. Por exemplo, se o risco absoluto diminui em 3%, isso significa que para cada 100 pacientes tratados, 3 eventos serão evitados. Logo, por regra de três simples, concluímos que é necessário tratar aproximadamente 33 pacientes para que 1 evento seja evitado. O NNT, portanto, é 33. Se o risco absoluto de um dano aumenta em 2% com a intervenção, então para cada 100 pacientes tratados, 2 terão um evento adverso por causa da intervenção. Logo, também por regra de três simples, para cada 50 pacientes tratados 1 terá um dano provocado pela intervenção. O NND, portanto, é 50. Como podemos utilizar o NNT para calcular a razão risco e benefício?
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
78
19 APLICABILIDADE DOS RESULTADOS 19.1 OBJETIVOS ! !
Introduzir conceitos para aplicabilidade da evidência na tomada de decisão em saúde Introduzir o conceito de comparação de PICOs para análise de evidência indireta
19.2 EVIDÊNCIA DIRETA VERSUS INDIRETA A aplicabilidade da evidência é uma das etapas mais importantes no processo de tomada de decisão e começa com a interpretação da evidência científica, integração deste evidência com o conhecimento de base da fisiopatologia da doença e análise da exequibilidade da aplicação daquela informação na circunstância em questão. Nesta etapa inicial da aplicabilidade, a evidência é avaliada com base na questão respondida pela pesquisa e é comparada à questão que foi estruturada com base no problema em questão (Figura 9). A magnitude do benefício da intervenção é pesada contra a magnitude do risco oferecido pela mesma e do custo da sua realização e / ou implementação. A aplicabilidade dos resultados com base na análise crítica de diferentes estudos sera abordada no final de cada capítulo referente a um desenho de estudo.
Figura 9. Avaliação de quão direta é a evidência para a resolução do problema em questão
Outro capítulo dentro da aplicabilidade refere-se a implementação e aos vários aspectos considerados no campo da tradução do conhecimento para aplicação no sistema de saúde, tais como a problematização, a identificação de necessidades, o mapeamento de barreiras, a elaboração de estratégias, a implementação e o
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
79
monitoramento de resultados. Todos estes aspectos referem-se a ciência da implementação. O capítulo XXII desta apostila mostra um exemplo de alguns processos envolvidos na implementação de uma diretriz clínica. Outra face da aplicabilidade relaciona-se as iniciativas oriundas de diversas sociedades médicas, instâncias governamentais e não governamentais que deram origem a elaboração de guidelines de forma a estimular e facilitar o uso da evidência na tomada de decisão. Entretanto, o que se observa em tais guidelines muitas vezes são métodos heterogêneos e não sistematizados de revisão da literatura e elaboração de recomendações, frequentemente com enorme influencia de fontes financiadoras. Dessa forma torna-se importante que o profissional de saúde também saiba analisar a qualidade destas diretrizes antes da sua implementação.
Silva, S. A. e Wyer, P. 8o Workshop de Prática Clínica Baseada em Evidências para Tomada de Decisão Clínica e Gerencial em Saúde. Rio de Janeiro: Apostila; 2014: 1–100.
80