ESTATÍSTICA E ORGANIZAÇÃO DE DADOS
• Como sabemos, a estatística é o ramo da Matemática que de modo geral coleta, organiza, analisa e fornece informações quantitativas sobre uma determinada população ou coleção de elementos.
•Como quase sempre não é possível obter as informações sobre todos os elementos da população, nos limitamos a pesquisar uma pequena parte dela, a qual chamaremos de amostra.
• Assim, a amostra representará a população e por isso deve ser formada de modo imparcial, sem privilegiar ou diminuir nenhum de seus componentes, de modo que as conclusões sejam imparciais e consistentes.
• Ainda em relação à amostra, estudaremos as variáveis, ou seja, as características da população representada pela amostra que queremos analisar.
MEDIDAS DE TENDÊNCIA CENTRAL
SITUAÇÃO PROBLEMA
• Em uma turma de uma escola de Medicina, um aluno registrou o batimento cardíaco por minuto de seus colegas, obtendo os seguintes dados:
•Observe que nesta tabela, muitos valores aparecem repetidas vezes.
•Mais ainda, os dados encontram-se dispostos de modo aleatório, complicando uma análise mais detalhada de seus elementos.
.
• Assim, somos levados a produzir um tipo especial de tabela, a fim de facilitar o entendimento e a análise dos seus dados. A esse tipo de tabela chamaremos de distribuição de frequências
• A frequência de um valor será o número de vezes que esse valor aparece na amostra (tabela):
SITUAÇÃO PROBLEMA
• Desse modo, podemos expressar os dados de acordo com a seguinte distribuição de frequências:
Número de batimento cardíacos por minuto
76 77 78 79 80 85 88 90 92 Frequência
• Observamos, por exemplo, que ao todo 5 alunos da turma apresentaram 77 batimentos cardíacos por minuto.
• Observamos ainda que a menor frequência cardíaca observada foi 75 batimentos por minuto e que a maior foi 92 batimentos por minuto, correspondendo a 3 e 4 alunos, respectivamente.
• Mais ainda, podemos afirmar que 76 batimentos por minuto foi a frequência cardíaca que apareceu mais vezes na tabela.
MEDIDAS ESTATÍSTICAS
• Como vimos, a distribuição de frequências é uma ferramenta que facilita a descrição de um modo mais resumido de nossa população ou amostra e proporciona uma primeira análise que valores de uma determinada variável em estudo pode assumir.
• Para obter uma análise mais aprofundada, podemos fazer uso de medidas que expressam tendências de determinada característica ou valores de nossa amostra.
• Desse modo, estudaremos algumas medidas de tendência central, que de modo simplificado, trazem consigo informações do comportamento geral da população ou amostra estudada. Assim, consideramos as seguintes medidas estatísticas:
Média Aritmética Média Aritmética Ponderada Moda Mediana
MÉDIA ARITMÉTICA
• Existem dois tipos de Média mais utilizados: aritmética Simples e aritmética Ponderada.
• A Média aritmética Simples, chamada normalmente apenas de “Média Aritmética”, é a mais utilizada no nosso dia a dia.
• Consiste na soma dos valores coletados e divididos pela quantidade de fatores considerados.
• A média aritmética dos números x1, x2, x3, ..., xn, é dada pela fórmula:
MÉDIA ARITMÉTICA
• Exemplos de utilização da média aritmética no cotidiano:
• Média das notas escolares.
• Média de gols num campeonato de futebol.
• Média de público nos jogos dos campeonatos.
• Média da idades dos alunos da turma.
• Renda Per Capita de um país (total da renda de um país dividido pelo número total de seus habitantes).
MÉDIA ARITMÉTICA
MÉDIA ARITMÉTICA
• Assim, podemos ver que a média aritmética, ou simplesmente a média, será dada por:
• De modo geral, podemos dizer que na média a frequência cardíaca dos alunos da turma foi de 82 batimentos por minuto. Isso significa dizer que se todos os batimentos fossem iguais, esse seria o valor encontrado.
• Observe ainda que o valor da média aritmética é sempre maior ou igual que menor valor e menor ou igual que o maior valor da lista de números.
MÉDIA ARITMÉTICA
MÉDIA ARITMÉTICA
•Analisando o gráfico verificamos:
• 4 alunos com média 4;
• 10 alunos com média 5;
• 18 alunos com média 6;
• 16 alunos com média 7;
• 2 alunos com média 8;
• Total de 50 alunos.
•Portanto, 38 alunos possuem média igual ou maior que 6.
•Calculando a porcentagem dos aprovados através do método da regra de três, temos:
•Resposta: E
MÉDIA ARITMÉTICA PONDERADA
• A Média Aritmética Ponderada, chamada simplesmente por: “Média Ponderada”, é calculada atribuindo-se pesos aos valores coletados (Ponderação é sinônimo de peso).
• Também é utilizada em cálculo de notas, normalmente em provas de concursos onde determinadas disciplinas tem maior importância que outras para certas áreas.
• A média aritmética ponderada dos números x1, x2, x3, ..., xn, com pesos p1, p2, p3, ..., pn, respectivamente, é dada pela fórmula:
MÉDIA ARITMÉTICA PONDERADA
Questão com Média Aritmética Ponderada: (Matemática Aplicada – Gelson Iezzi e Outros) Em um dia de pesca nos rios do Pantanal, uma equipe de pescadores anotou a quantidade de peixes capturada de cada espécie e o preço pelo qual eram vendidos a um supermercado de Cuiabá. Qual o preço médio por quilo?
Tipo de Peixe Peixe pescado (kg) Preço por quilo
Peixe A 18 R$ 3,00 Peixe B 10 R$ 5,00 Peixe C 6 R$ 9,00
• Neste caso o fator ponderação (peso) é a quantidade, em quilos de peixe pescado de cada espécie.
MÉDIA ARITMÉTICA PONDERADA
Para calcular a média aritmética ponderada dos dados numéricos de uma tabela de distribuição de frequências, dividimos a soma desses números, multiplicados pelas suas respectivas frequências, pela quantidade total dos dados, isto é, pela soma de todas as frequências.
• Voltemos à nossa situação-problema:
• Agora, consideramos as frequências cardíacas que apareceram na tabela de distribuição de frequências, bem como suas respectivas frequências.
• Ou seja, calculamos a média aritmética ponderada utilizando os valores dos batimentos cardíacos que aparecem na tabela, bem como suas respectivas frequências.
MÉDIA ARITMÉTICA PONDERADA
Assim, temos que sua média aritmética
será dada por:
Observe que este
de
tabela.
dá a devida contribuição de
MODA
• Por definição, a moda de uma coleção de dados amostrais ou populacionais é simplesmente o valor que aparece o maior número de vezes, isto é, aquele que apresenta a maior frequência observada na tabela de distribuição de frequências.
• Em amostras grandes ou com valores muito repetidos, há casos em que a moda não é única, situações em que dois ou mais valores amostrais tenham ocorrido com a mesma frequência e esta quantidade de ocorrências seja máxima.
• Assim, dependendo de cada caso, podemos ter distribuições monomodais, ou simplesmente modais, bimodais, trimodais ou ainda multimodais.
• Pode acontecer ainda o caso em que todos os valores amostrais tenham apresentado o mesmo número de ocorrências, significando que neste caso não há moda, pois nenhum valor se destacou, configurando assim uma distribuição amodal
MODA
MODA
• Agora, considerando uma outra distribuição de frequências, poderíamos obter resultados diferentes:
Número de batimento cardíacos por minuto 75 76 77 78 79 80 85 88 90 92
• Neste caso, temos uma distribuição trimodal com os valores de 77, 80 e 90 batimentos cardíacos por minuto.
• Por outro, lado a distribuição abaixo é amodal, visto que todos os valores apresentam a mesma frequência:
Frequência 2 4 8 7 2 8 6 2 8 4 Número de batimento cardíacos por minuto 75 76 77 78 79 80 85 88 90 92
Frequência 5 5 5 5 5 5 5 5 5 5
MEDIANA
• A mediana de uma distribuição de frequências é definida como o valor ocupante da posição central da coleção ordenada de modo crescente ou decrescente dos dados amostrais.
• Desse modo, sua principal propriedade é dividir o conjunto das informações em dois subconjuntos iguais com o mesmo número de elementos: os valores que são menores ou iguais à mediana e os valores que são maiores ou iguais à mediana.
• Note que se um valor for extremamente deslocado, ou seja, muito afastado dos outros, a mediana não será influenciada por este ao contrário da média, pois por definição é uma medida estatística vinculada à posição ocupada e não à proximidade dos valores apresentados.
• Assim, se um valor for extremamente pequeno ou grande, não influenciará no cálculo da mediana.
MEDIANA
Para calcular a mediana dos dados numéricos de uma tabela de distribuição de frequências, ordenamos estes valores de modo crescente ou decrescente, repetindo-os de acordo com as suas respectivas frequências, e tomamos o valor que divide esta tabela em dois grupos iguais, isto é, com a mesma quantidade de elementos.
• De modo simples, se o número de elementos da amostra N for um número ímpar, ou seja, N=2n+1, tomamos o elemento de ordem n+1.
• Agora, no caso que este número de elementos é par, N=2n, tomamos a média aritmética dos termos de ordem n e n+1.
• Desse modo, a situação-problema tem 48 elementos que a compõem.
• Assim, tomamos os termos de ordem 24 e 25, respectivamente dados por 79 e 79, e calculamos sua média aritmética, obtendo assim o valor da mediana desta amostra como sendo igual a 79.
EXERCÍCIO RESOLVIDO
SOLUÇÃO: EXERCÍCIO RESOLVIDO
Inicialmente construímos uma tabela de distribição de frequências, respondendo assim o item (a):
Duração de uma lâmpada ( em dias)
6 3
4
(b) Agora, podemos então calcular o tempo médio de duração de uma lâmpada: (c) Finalmente, podemos estimar o número de lâmpadas necessárias para manter um ponto de luz durante um ano comercial:
EXERCÍCIO RESOLVIDO
2. O IBOPE pesquisou qual é o esporte preferido pelos moradores de uma certa cidade. Para isto, entrevistou 2.500 pessoas, obtendo o seguinte resultado:
Esporte preferido Número de pessoas Futebol
Voleibol
Natação
a) Qual é o esporte que apresenta maior frequência nesta tabela?
b) E qual é o esporte que apresenta menor frequência?
c) Qual o percentual da população prefere voleibol?
d) Você saberia dizer qual é o esporte da moda? Justifique sua opinião!
SOLUÇÃO: EXERCÍCIO RESOLVIDO
Esporte preferido Número de pessoas
Futebol 650 Voleibol 350 Natação 420 Tênis 280 Basquete 300 Boxe 220 Corrida 280
a) Note que o esporte que apresenta a maior popularidade nesta tabela é o futebol com a preferência de 650 pessoas.
b) Por outro lado, o esporte que apresenta a menor popularidade é o boxe, preferido por 220 pessoas.
c) O percentual da população que prefere o voleibol é
d) O esporte da moda é o futebol, pois como o próprio nome indica é a moda da tabela de frequências acima.
EXERCÍCIO RESOLVIDO
SOLUÇÃO: EXERCÍCIO RESOLVIDO
1200,00 1400,00 1050,00 1050,00 1500,00 1400,00 1350,00 1100,00 1300,00 1200,00 1300,00 1400,00
a) Da tabela ao lado contruímos a seguinte tabela de distribuição de frequências associada aos salários encontrados; Salário de cargo equivalente 1050,00 1100,00 1200,00 1300,00 1350,00 1400,00 1500,00 Frequência 2 1 2 2 1 3 1 Deste modo, temos que:
b) O salário médio destes funcionários é reais.
c) O salário modal dos funcionários é R$ 1400,00.
d) Sim, pois o salário médio e o salário modal encontrados na vizinhança são maiores do que o salário do funcionário.
EXERCÍCIO RESOLVIDO 4
4. No edifício em que moro foi feito um censo dos moradores e identificados os jovens com idade entre 15 e 20 anos conforme o seguinte gráfico:
a) Quantos jovens residem no edifício?
b) Calcule a média de idade dos garotos e das garotas, bem como a média de idade dos jovens;
c) Determine a idade modal das garotas, dos garotos e dos jovens do edifício;
d) Calcule a idade mediana dos garotos, das garotas e dos jovens.
SOLUÇÃO: EXERCÍCIO RESOLVIDO 4
a) É fácil ver que no edifício moram 53 garotos e 47 garotas, totalizando 100 jovens.
b) As médias de idades aproximadamente são: 19 anos é a média de idade dos garotos,18 é a média de idade das garotas e 18 é a média de idade dos jovens.
d) As idades medianas dos garotos, das garotas e dos jovens são todas 18 anos.
c) A idade das garotas é bimodal com valores 16 e 19 anos, dos garotos é modal com valor de 20 anos e dos jovens é trimodal com valores 16, 19 e 20 anos.
EXERCÍCIO DE FIXAÇÃO 1
1. Uma concessionária de veículos vendeu no primeiro semestre de um ano as quantidades de automóveis indicadas no quadro abaixo:
Mês Jan Fev Mar Abr Mai Jun
Qtd de carros vendidos 38 30 25 36 38 31
a) Qual foi o número total de carros vendidos no semestre?
b)Qual foi o número médio de carros vendidos por mês?
c) Quantos carros foram vendidos acima da média no mês de maio?
d) Tomando como referência os três primeiros meses, faça uma estimativa de quantos carros deveriam ter sido vendidos no primeiro semestre. e) Compare os resultados dos itens (a) e (d). Por que eles não são iguais? Justifique!
EXERCÍCIO DE
EXERCÍCIO DE FIXAÇÃO 3 E 4
3. (PUC-SP) A média aritmética de 100 números é igual a 40,19. Retirando-se um desses números, a média aritmética dos 99 números restantes passará a se 40,5. O número retirado equivale a:
a) 9,5 % d) 750%
b) 75% e) 950%
c) 95%
4. (UNICAMP-SP) A média aritmética das idades de um grupo de 120 pessoas é de 40 anos. Se a média aritmética das idades das mulheres é de 35 anos e a dos homens é de 50 anos, qual o números de pessoas de cada sexo, no grupo?
EXERCÍCIO DE FIXAÇÃO
5. (PUC-SP) O gráfico abaixo apresenta a distribuição de frequências das faixas salariais numa pequena empresa:
Com os dados disponíveis,
que
desses salários é, aproximadamente:
REFERÊNCIAS BIBLIOGRÁFICAS
[1] Toledo, G. L.& Ovalle, I. I. Estatística básica, 2a edição, São Paulo: Atlas, 1986.
[2] Bolfarine, H. & Bussab, W.O. Elementos de amostragem, Edgard Blucher, 1999.
[3] Moore, D. S. A estatísitica básica e sua prática, 2a edição, São Paulo: LTC, 2005.
[4] Bussab, W. O. & Morettin, P. A. Estatística básica, 4a edição, São Paulo: Atual, 1987.
[5] Larson, R. & Fraber, B. Estatística aplicada, tradução de Cyro C. de Patarra, São Paulo: Prentice Hall, 2004.
[6] Triola, M. F. Introdução à estatística, tradução de Alfredo A. de Farias, 7a edição, Rio de Janeiro: LTC, 1999.