MEDICINA E ESTATÍSTICA: Uma questão de linguagem 1.1 - Para começar 1.2 - Uma situação típica 1.3 - A fórmula de Bayes 1.4 - Para pensar Maurício Abreu Pinto Peixoto Doutor em Medicina, FM – UFRJ Professor Adjunto do Laboratório de Currículo e Ensino Núcleo de Tecnologia para a Saúde (NUTES) Universidade Federal do Rio de Janeiro Ed. do Centro de Ciências da Saúde • Bloco A • Sala 26 Cidade Universitária • CEP 21949-900 Rio de Janeiro • Brasil • Tel: (021) 270-5449 • Telefax: (021) 270-3944 www.geac.ufrj.br
Rio de Janeiro Dezembro de 2006
MEDICINA E ESTATÍSTICA: Uma questão de linguagem
Maurício Abreu Pinto Peixoto
"mesmo eu, que passo por matemático, fatigo o cérebro ao ler minha própria obra..." Kepler, Astronomia Nova, 1609.
1- PARA COMEÇAR: Estatística é fácil; basta usar as palavras certas. Você duvida? Procuraremos nesta conversa inicial demonstrar este ponto de vista. Tomando como modelo o caso do diagnóstico médico, será possível perceber como médicos e estatísticos têm muitos pontos de contato. Ainda mais, que o raciocínio é basicamente semelhante, vez que ambos bebem de uma fonte comum; o paciente. Tais semelhanças são, entretanto mascaradas pelo uso de linguagens diferentes. Médicos e estatísticos observam o mesmo fenômeno, raciocinam de maneira similar; falam dele, porém, com os seus próprios códigos.
2 - UMA SITUAÇÃO TÍPICA: Imagine-se que você é obstetra e está de plantão. A seu lado, está um acadêmico. Chega à triagem uma paciente no terceiro trimestre de gravidez, apresentando entre outros sinais; edema, hipertensão e convulsões. Não há muita dúvida; o quadro é típico de eclampsia. O diagnóstico é fácil, e você toma as providências necessárias. E a seguir, explica tudo para o acadêmico. Mas ele não fica satisfeito e questiona; será mesmo eclampsia? Não poderia ser outra doença; epilepsia, por exemplo? Ambas cursam com convulsões, diz ele. Você então para, organiza seus pensamentos e fundamenta assim o seu diagnóstico:
Figura 1 – Raciocínio clínico: Diagnóstico diferencial Eclampsia / Epilepsia 2
Grupo de Estudos em Aprendizagem e Cognição
1. 2. 3. 4. 5. 6. 7.
Em resumo são estes os seus argumentos: A eclampsia cursa freqüentemente com este quadro, logo; Pacientes que apresentam este quadro geralmente tem eclampsia Ainda mais; na maternidade freqüentemente aparecem pacientes com eclampsia A epilepsia raramente cursa com este quadro, logo; Pacientes com este quadro dificilmente tem epilepsia Ainda mais; a epilepsia aparece muito raramente na maternidade Certeza absoluta em medicina não existe, mas você tem grande confiança no seu diagnóstico, em função das razões apresentadas.
Pronto! Agora, duas coisas aconteceram; o acadêmico ficou satisfeito e você lançou a base da teoria matemática da decisão, também conhecida como Teoria Bayesiana da Decisão. Thomas Bayes foi um sacerdote inglês, que morreu em 1761, dois anos antes de ver publicada a sua obra, que continha a posteriormente chamada fórmula de Bayes. Esta é uma fórmula de aplicação geral, que permite calcular a probabilidade de um conjunto de eventos ter um significado específico. Traduzindo em linguagem médica, a fórmula de Bayes permite calcular qual é a probabilidade do médico acertar o diagnóstico de uma doença qualquer, na presença de um quadro clínico determinado.
3 - A FÓRMULA DE BAYES: A seguir, apresentaremos um desenvolvimento da fórmula de Bayes. Algumas etapas serão omitidas. Não se preocupe com isto, principalmente se você não entender como se passou de uma etapa para outra. Meu objetivo não é apresentar as manipulações algébricas envolvidas no desenvolvimento da fórmula; mas sim estabelecer relações entre o raciocínio clínico e a linguagem estatística. Vejamos antes, algumas definições. Lembre-se que os matemáticos têm uma maneira de se expressar muito específica, assim como nós temos a nossa. Existem razões para isto, que não cabe no momento discutir. Uma característica é a de que usam letras como símbolos de números e de eventos diversos. Neste caso, representando as diferentes probabilidades. Assim por exemplo: • • •
P = Representa probabilidade. Assim P(acertar na loteria) significa a probabilidade de acertar na loteria. E = Representa a doença em tela. Neste caso, a eclampsia. S = Representa a síndrome que o médico percebe. Neste caso, a hipertensão surgida na gravidez, convulsão, etc, etc, etc...
Seguiremos aqui desenvolvendo, do ponto de vista da linguagem Estatística, o questionamento feito pelo acadêmico. Ele queria saber da sua segurança no diagnóstico feito. Como argumentação, apresentou um diagnóstico diferencial. Em termos estatísticos, ele desejava saber o valor da probabilidade de acertar o diagnóstico da eclampsia, frente à síndrome apresentada. Em notação estatística: •
P(E|S) = Lê-se: A probabilidade condicional de E dado que S. É a pergunta do acadêmico. Neste caso, a probabilidade da síndrome apresentada pela paciente 3
Grupo de Estudos em Aprendizagem e Cognição
(S), significar que ela sofre de eclampsia (E). Quantifica, portanto, o seu grau de certeza no diagnóstico. • •
P(ES) = Lê-se: probabilidade da ocorrência simultânea de P e S. Ou seja, a freqüência com que a doença (E) apresenta o quadro clínico verificado (S). P(S) = Probabilidade de ocorrência do quadro clínico percebido pelo médico(S), ou seja, a prevalência da síndrome. Começaremos apresentando uma versão mais simples da fórmula de Bayes.
Assim:
P (E | S ) =
P(ES ) P(S )
( Equação 1)
Desta maneira, ela expressa que a sua certeza diagnóstica - P(E|S) - depende da um lado, da freqüência com que ocorrem juntas a eclampsia e o quadro clínico verificado - P(ES) - e de outro da freqüência com que este quadro ocorre - P(S). Assim quanto maior P(ES), maior é o valor de P(E|S). É isto o que acontece na clínica, e foi isto que você disse ao justificar o seu diagnóstico. Lembra? "A eclampsia cursa freqüentemente com este quadro"
A seguir, vamos ampliar a fórmula, partindo oo seu numerador. O desenvolvimento da probabilidade da síndrome [P(S)] será feito depois. Assim: P (E | S ) =
P (S | E ) ⋅ P (E ) P( S )
( Equação 2)
Onde; • P(S|E) = Neste caso representa a probabilidade que pacientes com eclampsia tem o quadro clínico verificado. É diferente de P(E|S), que representa a probabilidade de pacientes com o quadro clínico verificado, apresentarem eclampsia. É, portanto o inverso. • P(E) = Neste caso representa a probabilidade de ocorrência da doença, ou seja, a sua prevalência. A novidade nesta versão, é que P(ES) - ocorrência simultânea de E e S- significa na realidade um conjunto de probabilidades. A saber; a freqüência com que a eclampsia cursa com o quadro clínico verificado [P(S|E)] e a prevalência da doença [P(E)]. Mas você já tinha expressado isto antes: “Pacientes que apresentam este quadro geralmente tem eclampsia, e “Na maternidade freqüentemente aparecem pacientes com eclampsia”
Vamos finalmente representar a nossa ultima versão da fórmula de Bayes. Nela trabalhamos o denominador, como prometido anteriormente. Ampliamos o significado da probabilidade da ocorrência da síndrome apresentada [P(S)]. Assim:
4
Grupo de Estudos em Aprendizagem e Cognição
P (E | S ) =
P(S | E ) ⋅ P(E ) P(S | E ) ⋅ P(E ) + P(S | − E ) ⋅ P(− E )
( Equação 1.3)
Onde; • P(-E) = Representa a prevalência das doenças que fazem o diagnóstico diferencial. Neste caso, a epilepsia. • P(S|-E) = Significa, neste caso, a freqüência com que a epilepsia cursa com o quadro clínico verificado Aqui, percebemos que a P(S) do denominador, na versão anterior, transformouse naquele amontoado de probabilidades. Vamos explicar isto. Sabemos que P(S) representa a probabilidade de ocorrência do quadro clínico verificado. O nosso quadro clínico (hipertensão, convulsão, etc, etc..), pode neste caso significar tanto a presença de eclampsia como de epilepsia. A probabilidade de ocorrência deste quadro clínico, portanto, resulta da soma da probabilidade de ocorrência de eclampsia [P(S|E). P(E)] com a probabilidade de ocorrência de epilepsia [P(S|-E). P(-E)], ou seja [P(S|E). P(E) + P(S|-E). P(-E)]. Mas isto, você também já tinha levado em conta no seu raciocínio: "A epilepsia raramente cursa com este quadro" [P(S|-E)] "A epilepsia aparece muito raramente na maternidade" [P(-E)] Concluindo; sabemos da teoria das probabilidades que os valores possíveis de uma probabilidade qualquer, variam de zero a um. Um evento absolutamente certo tem P = 1, enquanto que o impossível é igual a zero. Tais valores extremos, em geral, só acontecem em casos teóricos. No mundo real, é muito difícil encontrar não só algo que seja absolutamente seguro de acontecer como também um evento impossível. No mundo real, portanto, os valores das probabilidades variam freqüentemente de algo ligeiramente superior a zero até alguma coisa quase chegando a um. É isto que os estatísticos nos dizem, e é também isto que você havia afirmado antes: “Certeza absoluta em medicina não existe, mas você tem grande confiança no seu diagnóstico, em função das razões apresentadas.”
4 - PARA PENSAR: Neste exemplo, é possível perceber, que uma das grandes barreiras para o médico na Estatística é a linguagem. Acreditamos que qualquer médico pode aprender estatística; "basta usar as palavras certas". Neste ponto no entanto, cabem dois alertas. A ciência da Estatística é vasta e complexa; assim como a medicina. Não é possível pretender saber medicina, senão após longo período de estudo e prática. Mesmo após, o aprendizado, teórico e prático, continua. O mesmo ocorre com a Estatística.
5
Grupo de Estudos em Aprendizagem e Cognição
Aqui, utilizamos o conceito "aprender Estatística", significando ser capaz de entender os princípios básicos e realizar algumas operações e interpretações estatísticas mais rudimentares. Significando saber quando usar, e principalmente quando não usar a Estatística na sua prática de consultório ou de pesquisa. Significando finalmente, que ao perceber a necessidade de seu uso e a sua prática limitação, o pesquisador poderá solicitar o auxílio do estatístico de maneira racional e adequada. É freqüente a solicitação de auxílio estatístico para dados colhidos de maneira inadequada, ou para fornecer a este ou aquele trabalho uma "roupagem mais técnica", sem que isto signifique qualquer melhoramento na pesquisa. O segundo alerta se refere às diferenças de enfoque. Tomemos como exemplo o diagnóstico da eclampsia. Usando as técnicas adequadas (não necessariamente a fórmula de Bayes), o estatístico pode quantificar perfeitamente a probabilidade de acerto. Pode determinar o nível aceitável de erro. Nisto ele é imbatível. Neste sentido ele sempre acerta. Se a paciente tem realmente eclampsia, não é surpresa, vez que o alto valor da probabilidade assim o indicava. Se, ao contrário, não se trata de eclampsia, porém de epilepsia, ele também acertou, pois incluiu no seu raciocínio esta possibilidade. Calculou inclusive o valor desta probabilidade. Os erros e desafio dos estatísticos estão em outras áreas. O médico, entretanto, não tem esta tranqüilidade. Diagnosticar como eclampsia um quadro de epilepsia é absolutamente indesejável. A perfeição é para o médico, um ideal, ao mesmo tempo, sempre desejado e nunca alcançado. Neste sentido, para o médico, a Estatística não é tanto uma ciência, e sim, mais uma das ferramentas que ele se utiliza na busca deste ideal. Como foi dito no início, estatística é fácil. A dificuldade está em se conseguir aprender a "falar a língua do estatístico". Médicos e estatísticos tem cada um sua linguagem própria. Mas ao voltar seus olhos para o paciente, especulam a respeito de um objeto comum. Médicos e estatísticos podem e devem, portanto, caminhar juntos, vez que a interação recíproca traz benefícios para todos; profissionais e pacientes. É lamentável que tão pouco esforço se faça neste sentido.
6