Estatística: Conceitos Preliminares

Page 1

ESTATÍSTICA: Conceitos Preliminares 1 - Introdução 2 - Por que Estatística? 3 - O que é Estatística? 4 - As duas funções da Estatística 5 - Como a Estatística explica os fatos 6 - Como se organiza o pensamento estatístico 7 - Um alerta final

Maurício Abreu Pinto Peixoto Doutor em Medicina, FM – UFRJ Professor Adjunto do Laboratório de Currículo e Ensino Núcleo de Tecnologia para a Saúde (NUTES) Universidade Federal do Rio de Janeiro Ed. do Centro de Ciências da Saúde • Bloco A • Sala 26 Cidade Universitária • CEP 21949-900 Rio de Janeiro • Brasil • Tel: (021) 270-5449 • Telefax: (021) 270-3944 www.geac.ufrj.br

Rio de Janeiro Dezembro de 2006

1


ESTATÍSTICA:

Conceitos Preliminares Maurício Abreu Pinto Peixoto

“Se a experimentação é a Rainha das Ciências, indubitavelmente os métodos estatísticos devem ser considerados como os Defensores da Virtude Real..." (de uma carta de Myron Tribus à revista Science)

1 - Introdução: Deveria um médico interessar-se por Estatística? Existe alguma associação entre números e seres humanos? Médias e variâncias podem ajudar no diagnóstico ou tratamento dos seus pacientes? Estas, entre outras, são perguntas que surgem de imediato, na mente de todo o profissional da saúde que se depara com dados numéricos, e em particular com argumentos estatísticos. É preciso demonstrar claramente que a resposta a estas perguntas é positiva, se pretendemos que o médico se interesse pela Estatística. A seguir, é necessário que ele tenha uma vaga noção ao que é Estatística, sua razão de ser e campos de atuação. Desta maneira, ele poderá perceber como, na sua prática, a estatística pode ajudá-lo. Para o pesquisador isto é ainda mais importante. Este artigo foi escrito tendo em mente tais pressupostos. É dirigido ao médico e ao pesquisador iniciante. Nele, a partir de um enfoque médico, discutiremos o que consideramos fundamental para o profissional que inicia seus primeiros contatos com a Estatística.

2 – Por que Estatística? Imagine que você é um pesquisador de uma expedição espacial que entrou em contato, pela vez primeira, com uma forma de vida extraterrestre. Após algumas pesquisas preliminares, você descobre que a característica mais marcante destes "extraterrestres" é que são todos absolutamente iguais. Não há em nenhum dos espécimes estudados, qualquer vestígio de diferença. Em conseqüência, ao voltar a Terra, você pode escrever um abrangente e enciclopédico "Tratado Geral dos ExtraTerrestres", a partir do estudo de um único espécime. Continue imaginando, e suponha que esta forma de vida é inteligente, e um deles, estimulado pelo seu trabalho resolve vir a Terra para estudar os terrestres e escrever um "Tratado Geral dos Humanos". Imagine agora a tarefa que este "extraterrestre" teria pela frente. Como lidar com seres humanos altos e baixos, masculinos e femininos, brancos, negros, mulatos, cafuzos, nórdicos, mediterrâneos,

2


Grupo de Estudos em Aprendizagem e Cognição

anglo-saxões, judeus, católicos, muçulmanos, oligofrênicos, intelectuais, emotivos, racionais, fanáticos e tolerantes, etc, etc, etc. Para ele seria tarefa impossível. Por um lado em função de sua magnitude, mas principalmente porque lhe faltaria o instrumental teórico indispensável. Em uma sociedade de iguais, não há como lidar com o diferente. Como entender que apesar de todas as diferenças visíveis, só existe uma única espécie humana. Como estudar essas diferenças? O ser humano, assim como a natureza, tem como uma de suas características básicas a variabilidade. De uma maneira geral seja qual for o parâmetro estudado, sempre se encontrará um mínimo de variação. Neste sentido então, estudar o homem é estudá-lo na sua multiplicidade, na sua variabilidade. É quantificar as suas semelhanças e diferenças. É verificar se dois valores numericamente diferentes, tem o mesmo significado biológico. Ou então o seu oposto; se esta diferença numérica indica em real diferença no fenômeno estudado. Eis aí, a razão de ser da estatística. Fornecer ao homem o instrumental teórico para lidar com a variabilidade. Utilizando-se de instrumentos estatísticos é possível descrever um fenômeno. É possível perceber semelhanças e diferenças. É possível não tomar por diferente o que é igual, um erro decorrente da variabilidade intrínseca do fenômeno estudado. É possível finalmente imaginar o todo, a partir da análise de ou sua parte.

3 - O que é Estatística? Uma primeira definição pode ser a do dicionário enciclopédico "Larousse du XXe Siècle", editado décadas atrás. Nele, estatística é definida como "Ciência que tem por objeto o agrupamento metódico, por uma época determinada, dos fatos sociais que se prestam a uma avaliação numérica (impostos, condenações, produção industrial e agrícola, população, etc.). O sentido desta palavra, mais tarde ampliou-se para a classificação de fatos de todo o tipo; estatísticas médicas, metereológicas, etc...". Se assim é, a Estatística tem pouco significado para o médico! Interessa mais aos administradores, políticos, etc. Vista desta maneira, realmente pouca ajuda dá ao médico. Mas foi esta uma das suas primeiras funções. Muito embora a palavra "Estatística" ainda não existisse, há indícios de censos sendo realizados há 6.000 anos atrás, na Babilônia, China e Egito. Por quê? Ora, qual é o governo que sobrevive sem impostos? Não é por acaso que a palavra "censo" deriva do latim "censëre" que significa "taxar". Não foi por causa de um censo que, conta a Bíblia, Jesus nasceu em um estábulo? E por falar em Bíblia, veja este trecho retirado do Livro Quatro do Antigo Testamento (número 4 e seguintes): "Disse o Senhor a Moisés a Aarão: Levanta o censo dos filhos de Coate, do meio dos filhos de Levi, pelas suas famílias, segundo a casa de seus pais;..."

Pode-se falar de uma origem "divina" da Estatística? Há toda uma série de referências históricas adicionais que poderiam ser feitas, mas acho que estas bastam. São o suficiente para mostrar como, nas suas origens a estatística foi usada com funções de auditoria, controle, alistamento e impostos. Isto explica talvez, o incômodo que o termo nos provoca. Assim é que Estatística poderia ser definida como uma disciplina que objetiva a realização de censos. É verdade, mas não é apenas isto. Na realidade, para o médico, 3


Grupo de Estudos em Aprendizagem e Cognição

este é o aspecto que menos importa. Há outra maneira de defini-la, muito mais significativa. Para isto usemos a definição de Noether; "A estatística trata de idéias e métodos que visam aperfeiçoar a obtenção de conclusões a partir de informações numéricas na presença de incerteza". Quando um médico foz um diagnóstico, dificilmente ele tem certeza absoluta da sua afirmativa. Não é por acaso que utilizamos o termo "hipótese diagnóstica". Esta hipótese é uma espécie de "aposta", e o diagnóstico correto, o "prêmio" que ele tenta obter o maior número de vezes possível. Maior a competência do médico, maior o número de "apostas" que recebem o "prêmio". Esta competência deriva de dois fatores; do quando ele sabe, e de quantos pacientes ele já examinou. Assim é que o seu diagnóstico se baseia sempre em dados incompletos. Por mais que se estude, novos conhecimentos são gerados e outros abandonados. Atualizar-se é uma necessidade. Ainda mais; mesmo após longos anos de vivência clínica, sempre haverá mais um paciente a examinar, mais um doente com quem aprender. E assim vive o médico, tentando o tempo todo aumentar não só a sua base de decisão (conhecimento e prática), como também sua capacidade de tirar dela os diagnósticos mais precisos. E é exatamente este um dos objetivos da Estatística. Ela é uma ciência que permite tirar conclusões válidas, baseadas em informações incompletas. No jargão estatístico isto se chama de inferência. A capacidade de fazer inferências é para o médico um dos aspectos mais úteis da Estatística.

4 - As duas funções da Estatística A Estatística lida com números. Sendo mais específico lida com conjuntos de números. Por exemplo, todas as dosagens de bilirrubina feitas na ultima semana, ou então os pesos dos pacientes em tratamento da obesidade. Tais conjuntos podem também estar relacionados. Por exemplo, os valores do diâmetro biparietal do feto e a sua idade gestacional, ou então o ganho ponderal materno e sua curva tensional. O resultado final é um amontoado de números, que em sua forma bruta informa muito pouco. Um dos primeiros passos do pesquisador é modificar este "amontoado", para que faça sentido. Ele precisa começar a descrever os seus números (Fig. 1). Uma das formas possíveis é escrever todos os números em ordem crescente. Outra maneira é construir uma tabela com duas colunas; a primeira contendo os valores ordenados do menor para o maior; e a segunda com as suas respectivas freqüências. Pode-se também calcular um valor único que seja considerado o mais típico daqueles números. Uma vez determinado este valor, pode ser útil verificar o grau de afastamento dos dados ao seu redor. É muitas vezes útil verificar se dois conjuntos de dados mantém alguma relação entre si. Se este for o caso, pode-se construir um gráfico que mostre como é esta relação. Desta maneira, o pesquisador está se utilizando dos recursos da Estatística Descritiva. Em termos estatísticos, ao escrever os valores em ordem crescente, ele está construindo um Rol dos valores, ordenados do menor para o maior. A tabela de duas colunas acima, se chama de Tabela de Freqüências. O valor típico denomina-se de Medida de Tendência Central, sendo a Medida de Dispersão a que se refere ao grau de afastamento do centro. Relacionar dois conjuntos de dados significa medir sua Correlação, e o gráfico subseqüente é construído usando técnicas de Regressão. Estas

4


Grupo de Estudos em Aprendizagem e Cognição

são algumas das possibilidades da Estatística Descritiva. Com elas, repetimos, o pesquisador está descrevendo os seus dados. Assim sendo, esta fase permite transformar um amontoado de números em um conjunto ordenado de dados. Deste conjunto então, é possível não só extrair um significado, como também tirar conclusões válidas relativas aos dados estudados.

Fig 1- Estatística Descritiva Entretanto, na maioria das vezes não basta tirarmos conclusões restritas ao grupo estudado. É necessário ampliar o alcance destes dados (Fig 2). Quando se mede o diâmetro biparietal em um grupo de fetos; o que se deseja na verdade é determinar, no futuro, a idade gestacional em fetos que não participaram nem jamais participarão de qualquer estudo semelhante. É necessário, portanto que os dados obtidos em um grupo de estudo, sejam utilizados em todos os outros. No jargão estatístico, podemos dizer que é necessário que os dados obtidos em uma amostra, sejam utilizáveis na população.

Fig 2- Estatística Inferencial

A parte da Estatística que fornece os recursos para tal é chamada de ESTATÍSTICA INFERENCIAL. Aqui entramos em um campo novo. Quando fazemos afirmativas sobre a população baseados no estudo de uma de suas amostras, estamos na realidade fazendo uma INFERÊNCIA ESTATÍSTICA. (Fig 3)

5


Grupo de Estudos em Aprendizagem e Cognição

Digamos por exemplo; que preocupado com o crescimento intra-uterino retardado (CIR) um pesquisador estuda diversos fetos saudáveis em diversas idades gestacionais. Na sua casuística, verificou que com 34 semanas de gravidez os fetos pesavam 2,3 + 0,2 kg.

Fig 3 – Inferência Estatística Seria este valor suficiente para o diagnóstico do CIR? Poderá ele agora afirmar, que todo o feto, com idade gestacional de 34 semanas, e peso inferior a 2,1 kg apresenta deficiência de crescimento? A resposta é não. É preciso calcular o intervalo de confiança. Veja por que: O pesquisador sabe qual é a média do seu grupo de fetos. Mas se ele repetir o seu trabalho com outro grupo de fetos, provavelmente encontrará outro valor para a média. Tantos grupos diferentes ele fizer, tantas médias diferentes ele provavelmente obterá. Este fenômeno denomina-se erro amostral. Serão quase todos, valores muito próximos, mas ainda assim, diferentes. Assim, como afirmar que qualquer destas médias será a verdadeira média da população? Mesmo que uma o seja; qual delas? E como conseqüência, como pode este pesquisador usar o seu dado para afirmar o CIR? Há uma solução; a média da população é desconhecida, mas calculando-se o seu intervalo de confiança é possível estimar uma faixa de valores que inclui a verdadeira média. Assim substitui-se um único valor por uma faixa que pode ser utilizada no atendimento à gestante. Vejamos outro exemplo. Aquele pesquisador, agora preocupado com o diabete, dosa a glicemia em pacientes saudáveis e diabéticos. Ele deseja verificar se o paciente diabético tem ou não valores elevados de glicemia. Por hipótese, em sua pesquisa, obtém nos pacientes saudáveis uma dosagem média de 100 mg%, já nos diabéticos esta

6


Grupo de Estudos em Aprendizagem e Cognição

atingiu 200 mg%. Parece, portanto que realmente os diabéticos têm glicemia mais elevada que os saudáveis. Mas surge uma questão. Em função do erro amostral, o fato da média de um grupo ser diferente da de outro, não significa que um grupo seja verdadeiramente diferente do outro (no sentido de que tenham sido extraídos de populações diferentes). Se assim é, como verificar se a diferença verificada da glicemia deveu-se ao fato de que elas provem de populações diferentes (a dos normais e a dos diabéticos)? Não poderia ser esta diferença explicada pelo simples fato de que são duas amostras de uma mesma população (que inclui tanto pacientes normais como os diabéticos)? A resposta a estas questões só será dada após a realização de um teste de hipótese (Fig 4)

. Fig 4 – Teste de Hipótese

5 - Como a Estatística explica os fatos Uma vez que você já sabe o que é e o que pode fazer a estatística, precisa entender no que consiste uma afirmativa do ponto de vista estatístico. Estamos falando de uma explicação que usa argumentos estatísticos. Estamos nos referindo a uma "explicação probabilística". Todas as explicações têm uma estrutura comum; respondem a uma pergunta do tipo - Por que “p”?- onde "p" pode ser qualquer evento. Por exemplo: • • •

Por que o paciente apresenta úlcera péptica? Por que esta gestante desenvolveu toxemia? Por que a aspirina previne o infarto agudo do miocárdio?

Para responder a tais perguntas, ou seja, explicar os fatos é possível recorrer a vários tipos de explicação. Podemos oferecer uma explicação dedutiva, na qual se utiliza alguns fatos como premissa, deduzindo-se a partir daí a explicação. Isto é muito comum em Matemática. Outra possibilidade é responder explicitando os objetivos; temos então uma explicação do tipo teleológico. Por exemplo, para explicar por que o aluno foi à biblioteca, basta informar que ele foi lá para estudar. 7


Grupo de Estudos em Aprendizagem e Cognição

A história se utiliza muito das explicações genéticas. Para explicar por que houve a proclamação da república, é necessário descrever os eventos que a precederam fazendo-se as inter-relações necessárias. Todas estas explicações; uma vez aceitas pelo interrogador, não comportam dúvida. "Isto ocorre desta maneira por causa deste ou aquele fato". Neste caso "este ou aquele fato" explica inteiramente por que "Isto ocorre desta maneira”1. Mas há circunstâncias em que esta certeza absoluta não existe. Vejamos o exemplo seguinte: • •

Pergunta: Por que esta gestante apresenta toxemia gravídica? Resposta: Porque ela apresenta um quadro clínico compatível

Assim sendo, o que explica a presença da toxemia é o seu quadro clínico. Esta é uma resposta é satisfatória, porém parcial. Como sabem os obstetras, há quadros clínicos que embora compatíveis com a toxemia, podem ocorrer na presença de outra doença. Existe aqui um nível de incerteza inerente ao processo de pergunta e resposta. Mesmo ao eliminar possíveis diagnósticos diferenciais, não é possível eliminar de todo a insegurança. O que existe então entre a pergunta e a resposta é um liame de natureza probabilística. Afirmo que tal doente tem toxemia gravídica por que o seu quadro clínico, em um alto nível de probabilidade, sinaliza naquela direção. As "explicações probabilísticas", portanto explicam o mundo natural com afirmativas que tem no seu bojo um nível de incerteza. Este nível de incerteza é quantificado por meio das ferramentas fornecidas pela Estatística. Neste sentido, a estatística nunca prova nada, apenas apresenta probabilidades (Fig 5). Cabe ao médico interpretálas da maneira adequada. Fig 5- Explicação Probabilística

6 - Como se organiza o Pensamento Estatístico? Isto posto, é necessário entender o processo de raciocínio da estatística. Já foi visto que ela lida com números. O pensamento científico, na sua forma inicial, lida com idéias. É necessário então estabelecer uma ponte entre estes dois tipos de pensamento. Vejamos por exemplo a relação existente entre a toxemia gravídica e o nível social. Empiricamente, tem-se a impressão que as gestantes que tem melhor nível social apresentam menos toxemia que as outras; e quando são toxêmicas a gravidade é menor. Do ponto de vista científico, poder-se-ia enunciar a seguinte hipótese:

1

Enfatize-se que aqui não se afirma a verdade de uma explicação. Apenas se afirma que não há dúvida no sentido em que ambos os interlocutores, tendo aceitado completamente a explicação, não têm mais dúvidas sobre ela. Se ela é verdadeira ou não, depende de outros fatores externos a esta discussão.

8


Grupo de Estudos em Aprendizagem e Cognição

"Gestantes com maior nível social são menos sensíveis a toxemia que aquelas situadas em estratos mais baixos da sociedade."

Nesta hipótese há pelo menos dois conceitos teóricos; nível social e sensibilidade a toxemia. Só que estes conceitos não são operacionais. Assim, há que se transformá-los. Para o conceito "nível social" utilizaremos renda familiar e para "sensibilidade a toxemia" faremos uso de prevalência de toxemia na população. Desta maneira podemos enunciar outra hipótese, esta agora passível de tratamento estatístico: •

"Gestantes com maior renda familiar apresentam menor prevalência de toxemia gravídica que aquelas cuja renda é mais reduzida."

Em termos estatísticos estamos enunciando uma hipótese que afirma que existe uma correlação negativa entre renda familiar e prevalência da toxemia em uma dada população. Ressalte-se que não estamos afirmando que Maria é mais sensível a toxemia que Lucia porque esta é mais rica que aquela. Não estamos fazendo hipóteses individuais. Trabalhamos com grupos de indivíduos. Ou seja, fizemos a hipótese de que, em um dado grupo, as "Marias" serão mais sensíveis que as "Lucias" desde que estas sejam mais ricas que aquelas. Uma vez estabelecida à hipótese, a obediência ao método estatístico leva a um estudo da correlação entre renda familiar e prevalência de toxemia. Os resultados obtidos no grupo experimental são analisados, e a seguir estendidos para toda a população. Berquó et col (1980) apresentam de forma esquemática o encadeamento lógico do raciocínio estatístico: 1. Formulação da Hipótese Estatística: A partir de uma hipótese científica se deduz (por inferência dedutiva) uma hipótese estatística, fazendo usos de definições operacionais que se referem a afirmações sobre parâmetros populacionais. 2. Enunciação dos resultados esperados: Obtida por dedução (inferência dedutiva) da hipótese formulada. Os resultados são a conseqüência lógica da veracidade ou falsidade da Hipótese Estatística. 3. Estabelecimento das Regras de Decisão: Indispensável para a execução de qualquer teste de hipótese. São elas que determinam se a hipótese será verdadeira ou falsa. No exemplo em tela, uma das regras poderia ser "Se a hipótese for verdadeira, as gestantes com rendas familiares altas terão menor prevalência de toxemia do que aquelas cujas rendas familiares são baixas". 4. Planejamento do estudo: Fixam-se as normas de coleta dos dados, bem como as técnicas apropriadas de análise dos dados. 5. Coleta de dados: Efetua-se o trabalho de campo. 6. Transformação Estatística: Os dados obtidos são trabalhados. Obtêmse as médias, freqüências, graus de correlação, etc. 7. Realização do teste de hipótese: De acordo com as regras de decisão estabelecidas induz-se (inferência indutiva), a partir dos resultados empíricos e com base na teoria das probabilidades, a veracidade ou falsidade da hipótese estatística.

9


Grupo de Estudos em Aprendizagem e Cognição

8. Verificação da hipótese científica: Da veracidade ou falsidade da hipótese estatística induz-se (inferência indutiva) a veracidade científica correspondente.

7 - Um alerta final Neste artigo apresentamos uma visão panorâmica da Estatística. Mostramos como ela pode dar um significado aos fenômenos da natureza, seja por meio de sua descrição, ou então a partir das inferências adequadas. Mostramos também a natureza da explicação probabilística, ressaltando a sua impossibilidade de fornecer provas absolutas do que quer que seja. Este aspecto é algo de fundamental para o pesquisador. É necessário que ele tenha consciência dos limites impostos pelas suas ferramentas. A Estatística surgiu no século XVII com os estudos de Fermat e Pascal. Ela era e ainda é, um ramo da matemática, de natureza predominantemente dedutiva. Desenvolveu-se durante muito tempo como uma disciplina teórica e especulativa, sem objetivar aplicação prática. Só mais tarde, na astronomia, que surgiram as primeiras tentativas de utilização do método estatístico. Tudo o que a teoria da probabilidade pretendia resolver eram questões do tipo "uma vez que o baralho foi bem embaralhado e os jogadores são honestos, qual a probabilidade de se obter 4 ases consecutivos?". Ou seja, estabelecidas algumas hipóteses, desejava-se calcular as probabilidades de algumas observações, em uma assertiva dedutiva de probabilidade direta. O objetivo do cientista é outro. Ele tem outro tipo de questão. Por exemplo, "baseado em meu grupo experimental, posso afirmar que a morfina é um analgésico mais forte que a aspirina?". Ou seja; dadas algumas observações, deseja-se calcular as probabilidades de algumas hipóteses, em uma assertiva indutiva de probabilidade indireta. Os caminhos da Estatística e da Ciência Natural só recentemente se encontraram. Há de ambos os lados um esforço no sentido de um diálogo produtivo. No momento, entretanto, é uma ciência que construiu para si um mundo teórico. A afirmativa da Estatística tem, portanto o sustento e as limitações deste mundo; nem sempre espelhando adequadamente a realidade. Fig 6- Formas do pensar estatístico Concluindo, cabem aqui as palavras de Noether: - “... Elas são válidas dentro de um determinado contexto. Quanto mais realistas forem as condições deste contexto, mais confiáveis serão as conclusões. Um determinado método estatístico pode ser apropriado em determinada situação, mas completamente inadequado em outras. Uma parte importante do trabalho do estatístico é a seleção de um modelo probabilístico razoável e a seguir a utilização dos métodos de análise estatística que são apropriados para esse modelo..."

10


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.