UNIVERSIDADE NOVE DE JULHO - UNINOVE Departamento: CIÊNCIAS GERÊNCIAIS
Apostila de Estatística Aplicada 1ª VERSÃO
Elaboração: Prof. Paulo Sergio Pereira da Silva
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
2
APRESENTAÇÃO
Caro aluno,
Ao longo de nossa vida acadêmica, são grandes as novidades e os desafios que se colocam diante de nós. As relações entre professores e alunos são mediadas por linguagens e regras específicas, diferentes daquelas que aprendemos a decifrar e a empregar em nossa vida escolar e profissional. Esse universo desconhecido desperta, a um só tempo, curiosidade e temor. A final será que conseguiremos dominar todas essa novidades e sobreviver a eles?
Esse material foi elaborado com o intuito de lhe apresentar algumas dessas normas e linguagens e, assim, ajuda-lo a desvendar parte desse universo desconhecido. Espero, com as dicas que seguem oferecer-lhe algumas ferramentas úteis para o seu desenvolvimento profissional e a acadêmico. Não pretendo fazer com que você domine todo esse instrumental logo de saída, longe disso. Você só aprenderá tudo o que aqui está contido à medida que for empregando cada uma das ferramentas. No início lhe parecerão complexas, com o passar do tempo você aprenderá a decodificá-las e a utilizá-las corretamente, de modo que elas passarão a fazer parte tanto do seu vocabulário quanto de seu repertório de práticas.
O objetivo deste material é preparar o discente para a vida acadêmica, despertando-lhe o desejo de aprimorar seus conhecimentos, de conhecer, pesquisar e investigar os mais diferentes aspectos da realidade em que vive ou que venha a participar socialmente. Este material tem como objetivo principal mostrar, de forma clara, por meio de exemplos práticos, o conceito de estatística e suas aplicações, e utiliza para isso uma metodologia objetiva e de fácil compreensão. Vele salientar que este material faz parte de um conjunto de textos, baseados em livros, artigos de jornais e apostilas, que foram e continuam sendo aprimorados com o tempo, pelo autor. Este material serve como complemento para o aluno a fim de facilitar a sua compreensão, dessa forma, não substitui, em hipótese alguma, a pesquisa em livros específicos.
O autor,
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
3
INTRODUÇÃO A ESTATÍSTICA A Estatística é uma parte da matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões, em situações de incerteza, a partir de informações numéricas de uma amostra. População ou Universo: Conjunto de elementos (pessoas ou objetos) que interessam à pesquisa. Amostra: - Parte da população (universo) ou pequena parte de um todo (população). OBS.: Que seja fiel a população (amostra representativa). Ex.: Se o objetivo da pesquisa for verificar se houve aumento da aquisição de eletrodomésticos no ano de 2001 no Brasil, nas camadas populares, a amostra será composta de pessoas de baixa renda, preferencialmente de várias regiões do Brasil; de ambos os sexos, diversas faixas etárias, etc. Variáveis A cada fenômeno corresponde um número de resultados possíveis. Assim por exemplo: - para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino; - para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos números naturais: 0, 1, 2, 3, .... , n; - para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. Variável - Substitui um elemento de uma série que pode assumir n valores numéricos ou não numéricos (é, convencionalmente, o conjunto de resultados possíveis de um fenômeno). Por que estudar estatística ? Por ora, consideramos o seguinte: 1. O raciocínio é largamente utilizado no governo e na administração; assim, é possível que, no futuro, um empregador venha contratar ou promover o leitor por causa de seu conhecimento de estatística. 2. Os administradores necessitam do conhecimento da estatística para bem tomar suas decisões e para evitar serem iludidos por certas apresentações viciosas. 3. Cursos subseqüentes utilizam a análise estatística. 4. A maioria das revistas profissionais e outras contêm experiências freqüentes a estudos estatísticos. 5. A imprensa, tanto quanto muita experiência cotidiana, oferece amplas oportunidades para a interpretação estatística. Aplicações da estatística moderno ambiente administrativo e econômico global, dispõe-se de uma vasta quantidade de informação estatística. Os gerentes e tomadores de decisão de maior sucesso são aqueles capazes de entender a informação e usá-la eficazmente. A seguir, fornecemos exemplos que ilustram alguns dos usos da estatística em administração e em economia. No
Contabilidade Firmas públicas de contabilidade usam procedimentos de amostragem estatística quando estão realizando auditorias para seus clientes. Por exemplo, suponha que uma firma de contabilidade queira determinar se a quantidade de contas a receber mostrada em um balancete do cliente representa honestamente a quantidade real de contas a receber. A prática comum em tais situações é a equipe de auditores selecionar um subconjunto de contas, chamado amostra.
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
4
Finanças Os consultores financeiros utilizam uma série de informações estatística para guiar recomendações de investimentos. No caso das ações, os consultores revêem diversos dados financeiros incluindo relações preço/ganhos e rendimentos de dividendos. Comparando a informação para uma determinada ação com informações sobre a média do mercado de ações, um consultor financeiro pode concluir se uma ação individual está sendo sobre ou subavaliada. Por exemplo, o Barron’s ( 9 de novembro de 1998) reportou que a razão média de preço/ganhos para as 30 ações na Média Industrial Dow Jones foi de 22,0. A Phillip Moris apresentava uma razão preço/ganhos de 16,9. Neste caso, a informação estatística sobre as razões preço/ganhos mostrou que a Phillip Morris estava subvalorizada naquele momento. Essa e outras informações sobre a Phillip Morris poderiam auxiliar o consultor a recomendar a compra, a venda ou manter as ações. Produção Hoje, com a ênfase dada à qualidade, o controle da qualidade é uma importante aplicação da estatística à produção. Umas séries de cartas estatísticas de controle da qualidade são usadas para monitorar a saída de um processo de produção. Um gráfico de barras é especialmente usado para monitorar a saída média. Apropriadamente interpretado, um gráfico de barras pode auxiliar a determinar quando são necessários ajustes para corrigir o processo de produção. Economia Os economistas são freqüentemente solicitados a fornecer previsões sobre o futuro da economia ou de algum aspecto dela. Eles usam uma série de informações estatísticas ao fazer tais previsões. Por exemplo, na previsão de taxas de inflação, os economistas usam informação estatística de indicadores como o índice de preços do produtor, a taxa de desemprego e a utilização da capacidade de produção. Freqüentemente esses indicadores estatísticos são inseridos em modelos de previsão computadorizados que automaticamente calculam as taxas de inflação. OBS.: Tais exemplos fornecem uma introdução da amplitude das aplicações da estatística. TÉCNICAS DE LEVANTAMENTO ESTATÍSTICO: Distribuição de Freqüência Por meio de técnicas estatísticas, é possível estudar os conjuntos de dados e, a partir de uma amostra, tirar conclusões válidas para conjuntos maiores (população). Entre as várias técnicas adotadas em estatística, abordaremos a de uma variável, concentrando-nos na chamada estatística descritiva, que consiste em organizar os dados coletados em tabelas de freqüência e exibindo o número de percentagem de observações em cada classe, podendo ser a apresentado através de tabelas ou gráficos correspondentes. De maneira geral, as técnicas estatísticas são utilizadas em três etapas principais do trabalho de pesquisa:
a coleta de dados, incluindo o planejamento do trabalho e da pesquisa(questionário ou teste); a apresentação dos dados coletados(técnicas específicas); a análise dos dados coletados, com a formulação de conclusões e generalizações. Simultânea a segunda, pois durante a própria organização dos dados já é possível ir percebendo a tendência geral da pesquisa. Dados brutos Como primeiro resultado de uma pesquisa, obtêm-se dados brutos, um conjunto de números ainda sem nenhuma organização. Esse material é então ordenado de forma crescente ou decrescente, com a indicação da freqüência, dando origem ao que chamamos de rol.
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
5
Um pesquisador, por exemplo, quer saber que idades predominam entre as pessoas economicamente ativas de determinada cidade. Para isso, entrevistou 100 pessoas e obteve os seguintes dados brutos: Idades predominantes 28 30 37 30 31 30 33 30 33 29
27 33 31 27 31 28 27 39 31 24
31 33 30 32 30 33 27 27 31 33
33 29 30 24 30 28 30 27 30 30
30 32 26 30 27 36 33 31 28 33
33 27 29 27 30 29 30 31 27 27
27 34 29 31 27 32 33 36 32 30
31 37 34 30 27 27 33 28 30 34
34 30 29 32 21 24 23 29 30 36
26 29 26 29 34 27 28 30 29 32
O rol desses dados brutos é: IDADE(xi) FREQÜÊNCIA(fi) 21 1 23 1 24 3 26 3 27 16 28 6 29 10 30 21 31 10 32 6 33 12 34 5 36 3 37 2 39 1 Total(n) 100 xi: elementos da amostra (no caso, idade); fi : freqüência, repetições ou peso de cada valor da amostra. Tabulação de dados Continuando com a mesma pesquisa, depois de elaborar o rol é necessário determinar quantas faixas etárias terá a tabela de freqüência. O passo seguinte é subdividir os dados por classe ou categoria (no caso, a faixa etária) e determinar o número de indivíduos pertencentes a cada uma, resultando na freqüência de classe. k: número de classes que a tabela de classe deverá conter n: número de elementos da amostra Como diretriz geral, recomendamos usar entre cinco e vinte classes (k). Os conjuntos de dados com um número maior de observações usualmente exigem um número maior de classes. Conjuntos de dados com um número menor de observações podem em geral ser facilmente sintetizados com apenas cinco ou seis classe.
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
6
Então, se você tem uma amostra com 100 dados, pode organiza-los em uma tabela de distribuição de freqüência com k = n = 10 classes. Encontrando o valor de k , é preciso determinar o intervalo de classe, isto é, o tamanho que cada classe deverá ter. Chamaremos de h essa amplitude de classe, que será constante, isto é, todas as k classes deverão ter a mesma amplitude. Para calcular h, fazemos:
AT = Xmáx. - Xmín.
h = AT k
h : amplitude do intervalo Xmáx. : o maior valor de dados Xmín. : o menor valor de dados AT. : amplitude total, isto é, a diferença entre o maior e o menor valor de dados Em nosso exemplo temos: AT = Xmáx - Xmín. = 39 - 21 = 18 Logo, h = 18/10 = 1,8 Em seguida, o pesquisador determina os limites de cada classe: o limite superior (ls) e o limite inferior (li), aplicando um dos quatro conceitos de intervalo que já estudamos. Escolhe um ponto de partida, de acordo com os interesses da pesquisa. Pode decidir, por exemplo, que o limite inferior será 20. A partir dele, serão construídas as classes da tabela de freqüência, que deverá abranger todos os elementos do rol. Caso não ocorra a abrangência de todos os elementos do rol deveremos aumentar a amplitude(h) ou o número de classes (k), aquele que melhor convier. Assim, se k = 10 e h = 2, com a primeira classe iniciada por 20, temos a adição de h, a cada classe: K 1 2 3 4 5 6 7 8 9 10
Classes li 20 22 24 26 28 30 32 34 36 38
------| ------| -----| -----| -----| -----| -----| -----| -----| -----| ---------------------
Freqüência(fi) ls 22 24 26 28 30 32 34 36 38 40
1 4 3 22 31 16 17 3 2 1 100
Obs.: a primeira e última classe não pode ter freqüência igual a zero. Nota: É importante observar se os elementos estão incluídos ou excluídos. - O passo seguinte é escolher um número para representar cada classe, em geral o ponto médio (pm), ou seja, a média entre os valores dos limites de classe. pm = li + ls 2 Em seguida , é preciso encontrar: - Freqüência relativa (fr): Indica à proporção que cada classe representa em relação ao total (n) e é obtida dividindo-se cada uma das freqüências absolutas (fi) pelo tamanho (n):
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
7
fr =
fi n Obs.: A soma de sua coluna sempre deverá ser igual a 1. caso isso não ocorra, arredonda-se algum valor de modo a obter 1. - Freqüência percentual (fp): Indica a porcentagem de cada classe. Para obtê-la , multiplica-se fr por 100: fp = fr . 100 Obs.: a soma de sua coluna deverá ser igual a 100% . - Freqüência acumulada (fa): Corresponde à soma das freqüências absolutas(fi ) de sua classe, mais as anteriores caso haja: fa = fiat + faant Obs.: i = 1,2, ..., k O f acumulado da última classe deverá ser igual a n. Com base em todos os cálculos relacionados acima, podemos fazer uma nova tabela de freqüência, ainda para o exemplo das faixas etárias de pessoas ativas na cidade pesquisada. Suponhamos, a gora, que queiramos iniciar o primeiro limite inferior da primeira classe em 18. Teremos, então, de recalcular todas as freqüências absolutas. A nova tabela será: Classes K 1 2 3 4 5 6 7 8 9 10
li ls 20 ------| 22 22 ------| 24 24 -----| 26 26 -----| 28 28 -----| 30 30 -----| 32 32 -----| 34 34 -----| 36 36 -----| 38 38 -----| 40 -------------
Freqüência fr = fi/n (fi) 1 4 3 22 31 16 17 3 2 1 100
0,01 0,04 0,03 0,22 0,31 0,16 0,17 0,03 0,02 0,01 1
fp = fr . 100 (%) 1% 4% 3% 22% 31% 16% 17% 3% 2% 1% 100%
Pm = (li + ls)/2
21 23 25 27 29 31 33 35 37 39 --------
fa = fiat + faant
1 5 8 30 61 77 94 97 99 100 ------------
EXERCICIOS 1) O que você entende por o termo rol? 2) A tabela abaixo indica o número de um grupo de 1550 funcionários de determinadas faixas salariais de uma empresa. Complete as colunas em branco. Faixa salarial Número de Freqüência Freqüência acumulada pessoas (fi) percentual (fp) (fa) Até 3 salários mínimos 776 De 3 a 6 salários mínimos 387 De 6 a 9 salários mínimos 232 Acima de 9 salários mínimos 155 1550
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
8
3) Para o Curso de Administração uma classe de uma escola possui as seguintes notas: 36 40 54 31 32 34 43 49 50 56 40 42 44 33 54 55 56 59 65 67 50 68 51 54 61 44 39 66 60 36 44 49 a) maior nota; b) menor nota; c) amplitude total; d) tabela contendo: as notas, freqüência relativa, freqüência percentual e freqüência acumulada (sugestão: (K = 6 e h = 6,16 usar h = 7) exemplo: 31|------|37); e) as cincos melhores notas; f) as cinco piores notas; g) quantas notas estão acima de 75? h) quantas notas estão abaixo de 45? i) informe o percentual de notas entre 50 e 68 inclusive. Resposta 50% 4) Os dados da amostra abaixo representam as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial: 14 12 11 13 14 13 19 14 20 14 11 12 12 14 10 13 15 18 21 13 16 17 14 14 a) Elabore uma distribuição de freqüência começando a primeira classe com o intervalo :10|----|12 b) Faça a análise da penúltima classe da distribuição 5) O corpo administrativo de um consultório médico estudou o tempo de espera dos pacientes que chegavam ao consultório com uma solicitação de serviço de emergência. Os seguintes dados foram coletados no período de um mês (os tempos de espera estão em minutos): 2 5 10 12 4 4 5 17 11 8 9 8 12 21 6 8 7 13 18 3 a) Construa a distribuição de freqüência utilizando classes de 0|----|4, 5|----|9 etc. b) Que proporção de pacientes necessita de serviço de emergência enfrentam um tempo de espera de nove minutos ou menos? Resposta 60% 6) A MKT Image é uma empresa de consultoria em marketing e iniciou um trabalho de pesquisa para a TDI, que pretende lançar um novo produto no mercado brasileiro. Foram aplicadas algumas pesquisas de mercado para verificar o potencial de compra por parte da população. A tabela abaixo mostra os dados sobre uma amostra da população pesquisada, referente à renda familiar mensal (em salário mínimo): Salário Mínimo Número de pesquisados 0|-------5 734 5|-------10 526 10|-------15 205 15|-------20 140 20|-------25 60 TOTAL Considerando os dados acima, podemos afirmar que: a) 30% da amostra ganham 10 salários mínimos ou mais; b) Somente 44,08% da amostra ganham abaixo de 10 salários mínimos; c) Menos de 10% da amostra ganham 15 salários mínimos ou mais;
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
d) Mais de 75% da amostra ganham abaixo de 10 salários mínimos; e) Mais de 5% da amostra ganham 20 salários mínimos ou mais. Resposta: (d) - 75,67%
7) Complete a tabela abaixo: K l L 1 0|-------8 2 8|-------16 3 16|-------24 4 24|-------32 5 32|-------40 TOTAL
fi 4 10 14 9 3
fr
Pm ou X
8) Complete os dados que faltam na distribuição de freqüência: K l L fi fr Pm ou X 1 0|-------2 4 1 2 2|-------4 8 3 4|-------6 5 4 |------27 5 8|------15 6 |-------12 11 7 |-------14 10 TOTAL 77
fa
fa 12 45
77
9
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
10
GRÁFICOS Uma vez elaborada a tabela de freqüência, segue-se o desenho do gráfico, um recurso de visualização dos dados constantes na tabela. Os tipos de gráficos são: histograma; polígono de freqüência; ogiva de Galton; e setograma. Histograma: utilizado para representar as freqüências absolutas (fi) em relação à sua classe, é construído assim: 1. No eixo X (abscissas), marcamos, em escala, as classes dos dados. 2. No eixo Y (ordenadas), marcamos as freqüências de classe(fi). 3. Fazemos a correspondência entre cada intervalo no eixo dos X (classes) e um valor no eixo vertical(fi), formando um desenho que lembra um conjunto de colunas paralelas( retangulares) ou um conjunto de prédios. Polígono de freqüência: utilizado para indicar o ponto médio(p. m.) ou representante de classe com suas respectivas freqüências absolutas, é construído sobre o histograma. Para construí-lo, procedemos assim: 1. 2. 3. 4.
No eixo X (abscissas), colocamos o ponto médio de cada intervalo de classe. No eixo Y (ordenadas), permanecem as freqüências absolutas de classe (fi). Ligamos os pontos por segmentos de reta. Para completar o polígono, acrescentamos um ponto médio com freqüência zero em cada uma das extremidades da escala horizontal.
Setograma: Também conhecido como gráfico de pizza, é utilizado para representar os valores relativos (%). 1. Fazemos um círculo.
360. fi Total 3. No círculo, distribuímos os valores das freqüências percentuais.
2. Cada Setor/Fatia é regido pela fórmula: Setor
Ogiva de Galton: utilizado para representar as freqüências acumuladas de uma distribuição, é construída assim: 1. No eixo X (abscissas), colocamos as classes dos dados, como no histograma. 2. No eixo Y (ordenadas), escrevemos uma das freqüências acumuladas, marcando o ponto com os limites superiores (ls) de cada classe. Iniciamos com freqüência zero e com limite inferior da 1a classe. Veja um exemplo: Numa cidade foram anotadas as idades de 64 pessoas aposentadas. Os dados obtidos estão dispostos no quadro a seguir: 79 64 73 73 65 95 74
75 57 70 71 72 58 70
67 67 46 78 76 90 77
74 65 58 72 87 51 75
81 90 71 76 65 73 74
69 64 91 43 53 72 99
67 77 78 84 75 78 78
79 80 67 47 66 69 62
66 58 68 81 83 78 77
80
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
11
Pede-se: a) b) c) d)
O rol. O número de classes, a amplitude total (AT) e amplitude do intervalo de classes (h). A tabela completa, com o limite inferior da primeira classe começando em 43. Os seguintes gráficos: histograma, polígono das freqüências, ogiva de Galton e Setograma.
Resolução: a) Idade 43 46 47 51 53 57 58 62 64 65 66 67 68 69 70 71 72 73 74 75
Freqüência(fi) 1 1 1 1 1 1 3 1 2 3 2 4 1 2 2 2 3 3 3 3
Idade 76 77 78 79 80 81 83 84 87 90 91 95 99 TOTAL
Freqüência(fi) 2 3 5 2 2 2 1 1 1 2 1 1 1 64
b) Estimaremos que a distribuição deverá ter: K= 64 = 8 classes, mais utilizamos 9 classes para inserir todos os elementos da amostra. Amplitude Total: AT = 99 – 43 = 56 - Amplitude do intervalo de classes: h = 56/8 = 7. c) Idade dos aposentados l 43 50 57 64 71 78 85 92 99
L |----| 49 |----| 56 |----| 63 |----| 70 |----| 77 |----| 84 |----| 91 |----| 98 |----| 105 TOTAL
fi
Pm
fr
fp
fa
3 2 5 16 19 13 4 1 1 64
46 53 60 67 74 81 88 95 102 666
0,0468 0,0312 0,0781 0,25 0,2968 0,2031 0,0625 0,0156 0,0156 1,00
4,68% 3,12% 7,81% 25% 29,68% 20,31% 6,25% 1,56% 1,56% 100%
3 5 10 26 45 58 62 63 64
Estatística Aplicada
d)
-
Prof. Paulo Sergio P. da Silva
12
fi 19
Histograma
16 13
Polígono de freqüência
5 4 3 2 classes
1 43
49
56
63
70
Setograma: cada Setor/Fatia é regido pela fórmula: Setor 1ª classe: 43|--------| 49 >>
o
2ª classe: 50|--------| 56 >>
o
3ª classe: 57|--------| 63 >>
o
4ª classe: 64--------| 70 >>
o
5ª classe: 71|--------| 77 >>
o
6ª classe: 78|--------| 84 >>
o
7ª classe: 85|--------| 91 >>
o
8ª classe: 92|--------| 98 >>
o
9ª classe: 99||--------| 105 >>
77
84
360. fi n
setor = (360º . 3)/64 = 1080/64 = 16,87º setor = (360º . 2)/64 = 720/64 = 11,25º setor = (360º . 5)/64 = 1800/64 = 28,12º
setor = (360º . 16)/64 = 5760/64 = 90,14º setor = (360º . 19)/64 = 6840/64 = 106,87º setor = (360º . 13)/64 = 4680/64 = 73,12º setor = (360º . 4)/64 = 1440/64 = 22,5º setor = (360º . 1)/64 = 360/64 = 5, 62º o
setor = (360º . 1)/64 = 360/64 = 5, 62º
91
98
105
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
13
SETOGRAMA/PIZZA 1,56% 1,56% 6,25%
4,68%3,12% 7,81%
20,32%
25,01%
29,69%
fa Ogiva de Galton
64 63 62 58
45
26
10 5 3 início freqüência =
0
classes
43
49
56
63
70
77
84
91
98
105
há um salto
Interpretação: Podemos notar pelo histograma, que na faixa de 64 a 77 anos há um pico, o qual indica a existência de maior número de aposentados nessa faixa – setograma de maior fatia. Se o objetivo do pesquisador é saber qual a faixa etária com mais pessoas aposentadas na cidade, há indícios de que será a faixa de 64 a 77 anos.
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
14
EXERCÍCIOS 1) O faturamento de uma loja de brinquedos durante 40 semanas foi: 28 25 25 22 19
27 19 17 15 20
18 30 20 28 18
15 19 25 18 15
20 21 23 16 19
19 22 19 24 19
17 15 25 18 18
18 17 20 22 19
O gerente da loja deseja saber qual é a faixa do faturamento que se repete menos. Para isso determine: a) b) c) d)
As classes. As freqüências absolutas. As freqüências acumuladas. O histograma e a ogiva.
2) Numa fábrica foram tabulados os salários dos funcionários, resultando na tabela de distribuição de freqüência a seguir. A amostra foi de 380 funcionários: Classe de salários mensais 280 |------------ 320 320 |------------ 360 360 |------------ 400 400 |------------ 440 440 |------------ 480 480 |------------ 520 TOTAL
Número de funcionários 150 73 40 52 36 29 380
Pede-se : a) Complete o quadro acima, a partir do que foi estudado anteriormente. b) Elabore os quatro tipos de gráficos. 3) Dado a tabela, construir um gráfico de setores Quantidade de vendas, em uma empresa de informática Tipo de vendas Percentual Computadores 35 Softwares 23 Assistência técnica 15 Redes 14 Outro serviços 13 Total 100 4) O gráfico abaixo representa o faturamento líquido de uma microempresa ao longo do 1º semestre de um ano. Entende-se por faturamento líquido o valor recebido pela empresa já descontadas todas as despesas.
Em 1000 reais
Estatística Aplicada
-
FEV
MAI
Prof. Paulo Sergio P. da Silva
15
7 6 5 4 3 2 1 0 JAN
MAR
ABR
JUN
a) Indique o mês de maior faturamento líquido e o valor correspondente. b) Quando ocorreu maior queda no faturamento? c) Indique o mês de menor faturamento líquido e o valor correspondente. d) Segundo o gráfico, a tendência de faturamento, após o mês de junho, da microempresa?
5)(ENEM/2005) Moradores de três cidades, aqui chamadas de X, Y e Z, foram indagados quanto aos tipos de poluição que mais afligiam as suas áreas urbanas. Nos gráficos abaixo estão representados as porcentagens de reclamações sobre cada tipo de poluição ambiental.
Considerando a queixa principal dos cidadãos de cada cidade, a primeira medida de combate a poluição em cada uma delas seria, respectivamente: R. (b) X (A) (B) (C) (D) (E)
Manejamento de lixo Controle de despejo industrial Manejamento de lixo Controle emissão de gases Controle de despejo industrial
Y Esgotamento sanitário Manejamento de lixo Esgotamento sanitário Controle de despejo industrial Manejamento de lixo
Z Controle emissão de gases Esgotamento sanitário Controle de despejo industrial Esgotamento sanitário Controle emissão de gases
6) (ENEM/2005) A escolaridade dos jogadores de futebol nos grandes centros é maior do que se imagina, como mostra a pesquisa abaixo, dos quatro principais clubes de futebol do Rio de Janeiro.
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
16
De acordo com esses dados, o percentual dos jogadores dos quatro clubes que concluíram o Ensino Médio é de aproximadamente: R. (c) (A) 54%
(B) 48%
(C) 60%
(D) 14%
(E) 68%
7)(ENEM/2005) Este gráfico representa o resultado de uma pesquisa realizada com 1.000 famílias com filhos em idade escolar: R. (c)
Considere estas afirmativas referentes às famílias pesquisadas: I ) O pai participa da renda familiar em menos de 850 dessas famílias. II ) O pai e a mãe participam, juntos, da renda familiar em mais de 500 dessas famílias. Então, é CORRETO afirmar que (A) nenhuma das afirmativas é verdadeira. (B) apenas a afirmativa I é verdadeira. (C) apenas a afirmativa II é verdadeira. (D) ambas as afirmativas são verdadeiras.
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
17
MEDIDAS DE TENDÊNCIA CENTRAL OU MEDIDAS DE POSIÇÃO As médias, denominadas medidas de tendência central, são valores numéricos que representam o centro de um conjunto de dados ou uma seqüência numérica. Podem ser de vários tipos: média aritmética, média geométrica, mediana e moda. Média Aritmética Simples (dados não agrupados) É a medida utilizada com maior freqüência, por implicar um cálculo extremamente simples. Consiste em adicionar os elementos e dividir a soma pelo número (n) de elementos adicionados. Numa seqüência de n elementos, temos a média, representada por x (“x barra”): x1, x2, x3, ...xn.
x = x1 + x2 + x3 + ... + xn n Em notação somatório, a média é representada da seguinte forma: xi n Exemplo 1: Imaginemos que, numa pesquisa sobre atividades físicas com mulheres de 5 faixas etárias, o resultado de uma amostra tenha sido: Quantos dias por semana andam a pé? 16 a 20 anos 6 21 a 25 anos 5 26 a 29 anos 4 30 a 33 anos 2 34 a 37 anos 1
x =
Se, a partir da amostra, quisermos saber quantos dias por semana, em média as mulheres andam a pé, considerando como universo as mulheres de 16 a 37 anos, fazemos: x = 6 + 5 + 4 + 2 + 1 = 18 = 3,6 5 5 Então, em média, as mulheres de 16 a 37 anos andam a pé é 3,6 dias por semana, ou 4 dias, arredondando. Média Aritmética Ponderada Indicada por x p difere da média aritmética vista anteriormente por apresentar multiplicações(que representam freqüências, ponderações) indicando quantas vezes cada elemento se repete:
xp =
(x1 . f1) + (x2 . f2) + .... + (xk . fk) f1 + f2 + .... + fk
Exemplo 2: Calcular a média aritmética ponderada das notas da turma de Administração na disciplina matemática, usando a amostra de 30 alunos. Nota(xi) Número de repetições(fi) Xi . fi
1 1 1
2 6 12
3 5 15
5 2 10
8 7 56
9 3 27
10 6 60
Total 30 181
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
18
Note que nesta tabela de dados agrupados a soma de repetições é igual ao número total de elementos da amostra (n = 30). Aplicando a fórmula temos:
x p = 181 =
6,03
30 Média Aritmética para dados agrupados em classes Quando, numa distribuição por freqüência, os dados estão agrupados em classes, são considerados coincidentes com os pontos médios das classes às quais pertencem. Para o cálculo da média aritmética, usaremos os produtos dos pontos médios pelas freqüências de cada classe (pm . fi ). Exemplo 3: Seja a tabela que nos dá a altura (x) dos estudantes de uma classe de Ensino Fundamental: Altura x(cm) li ls 150 |---- 155 155 |---- 160 160 |---- 165 165 |---- 170 170 |---- 175 175 |---- 180 TOTAL
fi
Pm
6 9 16 5 3 1 40
152,5 157,5 162,5 167,5 172,5 177,5 ---
Pede-se: A partir da tabela, calcular a média aritmética. Solução: Completando a tabela, com a coluna Pm . fi, temos: Altura x(cm) 150 |---- 155 155 |---- 160 160 |---- 165 165 |---- 170 170 |---- 175 175 |---- 180 TOTAL
x = Pm . fi fi
= 6465
=
fi 6 9 16 5 3 1 40
Pm 152,5 157,5 162,5 167,5 172,5 177,5 --------
Pm . fi 915,0 1417,5 2600,0 837,5 517,5 177,5 6465,0
161,625
40
Mediana para dados não agrupados A mediana corresponde ao valor que ocupa a posição central numa seqüência de números e é representada por md. Na seqüência numérica x1,x2,...xk,...xn, o elemento xk é a md se o número de elementos que o antecedem for igual ao número de elementos que o sucedem.
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
19
Para obter a mediana, primeiro coloca a seqüência numérica em ordem crescente ou decrescente. Depois, verificamos se a amostra é par ou ímpar e adotamos um dos procedimentos a seguir. 10 caso. Se o número de elementos (n) for ímpar, a mediana corresponderá ao termo central da série. Exemplo 1: Calcular a mediana da seqüência 2, 4, 1, 5 e 6. Resolução: fazemos o ordenamento: 1, 2, 4, 5 e 6 Como o número de elementos é ímpar: Portanto, a mediana é: md = 4 20 caso. Se o número de elemento (n) for par, a mediana, nesse caso, corresponde a media aritmética dos dois valores centrais: Exemplo 2 : Encontrar a mediana da seqüência 82; 79; 70; 20; 33; 46. Resolução: fazemos Ordenação 20; 33; 46; 70; 79; 82 md = 46 + 70 = 58 2 OBS.: Geralmente o valor da mediana é bem próximo da média aritmética, quando os valores são uniformes. Mediana para dados agrupados I – Calcula-se a ordem n/2. Como a variável é contínua, não se preocupe se n é par ou ímpar. II – Pela fa identifica-se à classe que contém a mediana(classe mediana). III – Utiliza-se à fórmula:
Md
= li +
n 2 - faant
.h
fi em que:
li = limite inferior da classe mediana; n = tamanho da amostra ou número de elementos; faant = frequência acumulada anterior; h = amplitude da classe; fi = frequência absoluta da classe mediana.
Exemplo 3: Dada a distribuição amostral, calcular a mediana. K Classes fi fa li ls 1 35|----------45 5 5 2 45|----------55 12 17 3 55|----------65 18 35 a 29o posição encontra-se nesta classe 4 65|----------75 14 49 5 75|----------85 6 55 6 85|----------95 3 58 -----------------58 --- Resolução: I – n/2 = 58/2 = 29o (posição) II – identificar a classe mediana: procura-se a posição 29o através da coluna fa. III – fazer o cálculo da mediana md = 55 + (29-17) . 10 18
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
20
md = 55 + (12) . 10 18 md = 55+ 120 18 md = 55 + 6,66 md = 61,66 Moda para dados não agrupados A moda é o valor que apresenta maior freqüência no conjunto de números em questão, ou seja, que se repete mais vezes. É representado por mo. Uma seqüência de números pode não ter valor modal ou apresentar vários tipos de repetições, recebendo então várias denominações: unimodal, quando um único valor se repete; por exemplo: { 1, 2, 3, 2}: a moda é 2 bimodal, quando dois valores se repetem (com a mesma freqüência); por exemplo: { 3, 2, 5, 4, 8, 2, 4}: a moda é 2 e 4. multimodal, quando três ou mais valores se repetem (com a mesma freqüência). por exemplo: { 3, 6, 7, 6, 4, 5, 4, 3, 1}: a moda é 3, 4 e 6. Moda para dados agrupados I – Identifica-se a classe modal(aquela que possue maior frequência). II – encontrar os valores de 1 e 2, onde: 1 = fimodal – fianterior 2 = fimodal - fiposterior III – Aplica-se a fórmula: mo = li +
1 .h 1 + 2
Exemplo: Determine a moda para a distribuição a seguir: Classes 0|-------1 1|-------2 2|-------3 3|-------4 4|-------5 TOTAL Resolução: I – classe modal : 3a classe: 2 |---------3 II - 1 = 17 – 10 = 7 2 = 17 – 8 = 9 III – calculando a moda: mo = 2 +
fi 3 10 17 8 5 43
7 .1 7+9 mo = 2 + [(7/16) .1] mo = 2 + [0,43750 . 1] >>>>>> mo = 2, 43750 aproximadamente 2,44
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
21
EXERCÍCIOS 1) Calcule a média aritmética e a mediana dos elementos: 5, 3, 8,10,15. R. média = 8,2 e md = 8 2) Calcule a média aritmética da turma de 18 alunos na prova de estatística: R. média = 7,5 8,2 7,5 7,0 7,8 8,5 9,0
8,7 5,6 7,2 8,0 7,5 7,4
6,1 7,3 5,9 6,5 9,0 7,8
3) A distribuição de freqüência abaixo representa o número de carros que quatro revendedoras venderam durante 1 mês. Determine a média aritmética ponderada. R. x p = 4,75 número de carros vendidos por dia (Xi)
3
6
4
4
3
4
1
fi
5
4) Em 20 números, quatro são 2, três são 4, cinco é 1 e os restantes são 3. Ache: a) a tabela de freqüência
b) a média aritmética ponderada.R. x p = 2,45
5) Fornecemos a seguir uma distribuição de freqüência do tempo em dias gasto por uma firma de contabilidade para completar auditorias de fim de ano. A distribuição de freqüência dos tempos de auditoria está baseada em uma amostra de 20 clientes. Qual é o tempo médio, a mediana e a moda da amostra? R. média = 19; md = 18,75; mo = 17,85 DISTRIBIÇÃO DE FREQUÊNCIA DOS TEMPOS DE AUDITORIA Tempo de fi Pm Pm . fi fa auditoria (dias) 10 |------| 14 4 15 |------| 19 8 20 |------| 24 5 25 |------| 29 2 30 |------| 34 1 TOTAL 20 ------------6) Calcule a mediana: a) 35; 98; 71; 2 ; 65 e 8
b) 8,2; 8,7; 4,1; 2,7; 3,3; 2,8 e 1,2
R. md= 50
R. md = 3,3
7) Ache a moda (se houver) de cada amostra: a) 2; 3; 6; 4 e 3 b) 2; 3; 2; 4; e 3 R. mo = 3
R. mo = 2 e 3
8) Considerando a distribuição abaixo, calcule a média aritmética ponderada: R. Xp = 5,4 xi 3 fi 4
4 8
5 11
6 10
7 8
8 3
9) Imagine que a margem de lucro na venda de um produto é variável, mas que, ao longo de cinco meses, foram registrados os valores apresentados na tabela abaixo. Calcule a média. R. média = 40
Estatística Aplicada Classe 15|-----25 25|-----35 35|-----45 45|-----55 55|-----65 TOTAL
Pm 20 30 40 50 60
-
Prof. Paulo Sergio P. da Silva
22
freqüência 30 45 150 45 30
10) Os salários-hora de cinco funcionários de uma companhia são:R$75, R$90, R$83, R$142, $ 88. Determine: a) a média dos salários-hora; R. média = R$ 95,60 b) o salário-hora mediano. R. md = R$ 88,00 11) A MKT Image é uma empresa de consultoria em marketing e iniciou um trabalho de pesquisa para a TDI, que pretende lançar um novo produto no mercado brasileiro. Foram aplicadas algumas pesquisas de mercado para verificar o potencial de compra por parte da população. A tabela abaixo mostra os dados sobre uma amostra da população pesquisada, referente à renda familiar mensal (em salário mínimo): R. (a) Salário Mínimo 0|-------5 5|-------10 10|-------15 15|-------20 20|-------25 TOTAL
Número de pesquisados(fi) 734 526 205 140 60
Considerando os dados da tabela, podemos afirmar que: a) A média aritmética da amostra é um valor maior que 7 salários mínimos; b) O valor mediano está estimado entre 4 e 5 salários mínimos; c) A média aritmética da amostra está estimada entre 4 e 5 salários mínimos; d) O valor mediano da amostra é o um valor maior que 7 salários mínimos; e) O valor mediano é maior que a média aritmética. Considere o texto a seguir para responder as questões 12, 13 e 14: Suponha que você seja contratado pela MKT Image para desenvolver estratégias que visam ampliar a carteira de clientes, sua primeira reunião foi com os gerentes que reclamaram do número não suficiente de consultores para atender a atual carteira, ampliar seria a ação que poderia ocasionar a perda de atuais clientes em razão do não cumprimento dos prazos. Após a reunião você solicitou a sua secretária Srta. Rita um relatório contendo a carteira e o respectivo número de dias que foram utilizados para a realização dos trabalhos, após dois dias você recebe um e-mail: Segue abaixo, o relatório solicitado contendo o tempo (em dias), para completar consultorias. Esta tabela está baseada em uma amostra de 30 clientes de empresas de pequeno porte. Tempo de Consultoria 10|-------14 14|-------18 18|-------22 22|-------26 26|-------30 30|-------34 TOTAL
Número de clientes(fi) 4 10 6 5 3 2 30
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 23 12) Neste relatório você observou que o maior número de consultorias realizadas são completadas no período de 14 a 18 dias, conhecido como período modal. O valor exato da moda é: R. (e) a)38 dias
b)14,6 dias
c)16 dias
d)2,4 dias
e)16,4 dias
13) Outra análise realizada foi calcular a porcentagem de consultorias que levaram vinte e seis dias ou mais para serem concluídas, sendo o valor correspondente a: R. (d) a) 83,33% das consultorias são concluídas em vinte e seis dias ou mais; b) 33,33% das consultorias são concluídas em vinte e seis dias ou mais; c) 86,67% das consultorias são concluídas em vinte e seis dias ou mais; d) 16,67% das consultorias são concluídas em vinte e seis dias ou mais; e) 6,67% das consultorias são concluídas em vinte e seis dias ou mais. 14) Interprete (relate) a 4ª Classe da tabela. Resposta pessoal 15) Este gráfico descreve a freqüência das alturas dos recém-nascidos num mesmo dia, numa maternidade.
Baseado no gráfico é CORRETO afirmar que a altura modal e a altura média das crianças são respectivamente iguais a: R. (d) (A) 48cm e 59,90cm (B) 51cm e 47,80cm (C) 49cm e 51,20cm (D) 47cm e 49,10cm (E) 47cm e 50,10cm 16) Observe as alturas de 10 crianças nascidas num mesmo dia, numa maternidade. Criança Altura (cm) Mariana 52 Jorge 48 Paulo 51 Mário 47 Tarsila 47 Priscila 51 Silvana 53 Alberto 47 Vítor 47 Ricardo 48
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 24 Entre as alternativas abaixo a CORRETA em relação as alturas médias das meninas e dos meninos respectivamente é: R. (b) (A) 50,21cm e 46cm. (B) 50,75cm e 48cm. (C) 46cm e 50,28cm. (D) 50,75cm e 46cm. (E) 50,21cm e 50,75cm. 17) Dissertativa: Baseado no problema da questão anterior: Interprete o percentual que a diferença entre as alturas médias das meninas e dos meninos representa em relação à altura média dos meninos. ___________________________________________________________________________________ ___________________________________________________________________________________ ___________________________________________________________________________________ ___________________________________________________________________________________ 18) Os 40 alunos de uma turma fizeram uma prova de Estatística valendo 100 pontos. A nota média da turma foi de 70 pontos e apenas 15 dos alunos conseguiram a nota máxima. Seja M a nota média dos alunos que não obtiveram a nota máxima. Então, é CORRETO afirmar que o valor de M é : R. (d)
(A) 53
(B) 50
(C) 51
(D) 52
(E) 48
19) Durante um determinado mês de verão, os oito vendedores de uma firma de calefação central e arcondicionado venderam os seguintes números de unidades de ar-condicionado central: 8, 11, 5, 14, 8, 11, 6. Considerando este mês como uma população estatística de interesse, o número médio de unidades vendidas é: R. (e) (A)18unidades
(B)11unidades
(C)8unidades
(D)3unidades
(E)9unidades
20) Uma pesquisa da ONU estima que, já em 2008, pela primeira vez na história das civilizações, a maioria das pessoas viverá na zona urbana. O gráfico a seguir mostra o crescimento da população urbana desde 1950, quando essa população era de 700 milhões de pessoas, e apresenta uma previsão para 2030, baseada em crescimento linear no período de 2008 a 2030.
De acordo com o gráfico, a população urbana mundial em 2020 corresponderá em média, aproximadamente, a quantos bilhões de pessoas? R. 4,25 bilhões
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
25
SEPARATRIZES Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica de separar a série em duas partes que apresentam o mesmo número de valores. Vejamos, então alguns quantis e seus nomes específicos: o quartil, o decil e o percentil - são, juntamente com a mediana, conhecida pelo nome genérico de separatrizes. QUARTIL Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Precisamos, portanto de 3 quartis (Q1 , Q2 e Q3 ) para dividir a série em quatro partes iguais. 0%
25%
|
| Q1
50%
75%
100%
|
|
|
Q2
Q3
Obs: O quartil 2 ( Q2 ) sempre será igual à mediana da série. Quartis em dados não agrupados O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis. Na realidade serão calculadas " 3 medianas " em uma mesma série. Exemplos: 1) Calcule os quartis da série: {5, 2, 6, 9, 10, 13, 15} O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15} O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9 que será = Q2. Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais proporcionados pela mediana (quartil 2). Para o calculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2). Logo em {2, 5, 6} a mediana é = 5 . Ou seja: será o quartil 1 em {10, 13, 15 } a mediana é =13 . Ou seja: será o quartil 3 2) Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13} A série já está ordenada, então calcularemos o Quartil 2 = md = (5+6)/2 = 5,5 O quartil 1 será a mediana da série à esquerda de md : {1, 1, 2, 3, 5, 5}
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
26
Q1 = (2+3)/2 = 2,5 O quartil 3 será a mediana da série à direita de md : {6, 7, 9, 9, 10, 13} Q3 = (9+9)/2 = 9 Quartis em dados agrupados Determinação de Qi 10 passo: calcula-se (i . n) /4 20 passo: identifica-se a classe Qi pela Fa. 30 passo: aplica-se a fórmula: i .n Qi = li +
- faant
4
.h fi
Determinação de Q3: 10 passo: calcula-se (3 . n) /4 20 passo: identifica-se a classe Q3 pela Fa. 30 passo: aplica-se a fórmula: 3.n Qi = li +
- faant
4
. h fi
em que: i
= 1, 2, 3
li
= limite inferior da classe encontrada
h
= amplitude do intervalo
faant = freqüência acumulada anterior à da classe fi
= freqüência absoluta da classe encontrada
DECIL A definição dos decis obedece ao mesmo princípio dos quartis, com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretende calcular. Indicamos os decis: D1, D2, ... , D9. Deste modo precisamos de 9 decis para dividir uma série em 10 partes iguais. 0% |
10%
20%
30%
40%
50%
60%
70%
|
|
|
|
|
|
|
D1
D2
D3
D4
D5
D6
D7
80%
90%
100%
|
|
|
D8
D9
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
27
De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais. Assim sendo, o quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana. Neste caso também é semelhante as separatrizes anteriores . Ei-la: 10 passo: calcula-se (i . n) /10, em que i = 1, 2, 3, 4, 5, 6, 7, 8 e 9 20 passo: identifica-se a classe Di pela Fa. 30 passo: aplica-se a fórmula: i.n Di = li +
- faant
10
.h fi
PERCENTIL Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma série em 100 partes iguais. Indicamos: P1, P2, ... , P99. É evidente que P50 = Md ; P25 = Q1 e P75 = Q3. O cálculo de um centil segue a mesma técnica do cálculo da mediana, porém a fórmula será : 0% |
1%
2%
|
|
P1
3%.................... 50%....................97%
P2
98%
99%
|
|
|
|
|
P3
P50
P97
P98
P99
O cálculo de um percentil é dado por: 10 passo: calcula-se (i . n) /100 em que i = 1, 2, 3, 4, 5, 6, 7, 8............,98, 99. 20 passo: identifica-se a classe Pi pela Fa. 30 passo: aplica-se a fórmula: i.n Pi = li +
- faant
100
.h fi
100% |
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
EXEMPLOS: 1) Dada a distribuição, determinar os quartis (Q1 e Q3), a mediana e a moda. K 1 2 3 4 5 ∑
Classes 7|----------17 17|----------27 27|----------37 37|----------47 47|----------57
fi 6 15 20 10 5 56
pm 12 22 32 42 52 ---
fi . pm 72 330 640 420 260 1722
fa 6 21 41 51 56 ---
←Classe Q1 ←Classe Md ←Classe Q3
Resolução: 10 passo: n = 56 Q1=?
md= ?
n/4 = 56/4 = 140
Q3 = ?
n/2 = 56/2 = 280
3n/4 = (3 . 56) / 4 = 420
20 passo: Pela fa identifica-se a classe Q1, classe Md e classe Q3 30 passo: Para Q1 temos : li = 17, n = 56, faant = 6,
h = 10, fi = 15
Para Md temos: li = 27, n = 56, faant = 21, h= 10,
fi = 20
Para Q3 temos : li =37,
fi = 10
n = 56,
faant = 41, h= 10, 1 . 56
Q1 = 17 +
-6
4
.10 = 22,33
15 56 Md = 27 +
- 21
2
.10 = 30,5 20
3 . 56 Q3= 37 +
- 41
4
.10
= 38
10
x = fi . pm =
1 722
fi
56
mo = ? 1 = 20 – 15 = 5 2 = 20 – 10 = 10
= 30,75
28
Estatística Aplicada mo = 27 +
5 5 + 10
mo = 27 +
5 15
-
Prof. Paulo Sergio P. da Silva
29
.10
.10
mo = 27 + [0,33 .10] mo = 27 + 3,33 = 30,33 Diante desses resultados, pode-se afirmar que: 22,33 deixa 25% dos elementos; 30,5 deixa 50% dos elementos; 38 deixa 75% dos elementos. 2) Calcular o 40 decil e o 720 percentil da seguinte distribuição: K 1 2 3 4 ∑
Classes 4|-----------9 9|----------14 14|----------19 19|----------24
fi 8 12 17 3 40
fa 8 20 37 40 --------
←Classe D4 ←Classe P72
Resolução: Cálculo do D4 :
Cálculo do P72 :
10 passo: in/10 = (4 . 40)/10 = 160
in/100 = (72 . 40)/100 = 28,80
20 passo: Identifica-se a classe D4 e P72 pela fa Para D4: li = 9; faant = 8; n = 40; h = 5; fiD4 = 12 4 . 40 D4 = 9
+
-
8
10
.5
= 12,33
12
Para P72: li = 14; faant = 20; n = 40; h = 5; fiP72 = 17 72 . 40 P72= 14 +
100
-
20 . 5 = 16,59
17
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
30
Portanto, nesta distribuição o valor 12,33 divide a amostra em duas partes: uma com 40% dos elementos e a outra com 60% dos elementos. O valor 16,59 indica que 72% da distribuição estão abaixo dele 28% acima. EXERCÍCIOS 1) Imagine que a margem de lucro na venda de um produto é variável, mas que, ao longo de seis meses, foram registrados os valores apresentados na tabela abaixo. Pede-se: o sexto decil e o trigésimo percentil. R. D6 = 43 e P30 = 36,5 Classes 15|---------25 25|---------35 35|---------45 45|---------55 55|---------65 65|---------75 TOTAL
fi 30 45 150 45 30 25 325
fa
2) Calcule o 10quartil, o 30decil e o 900percentil da distribuição de freqüência a seguir: D3 = 27,486
R.
Q1 = 27,081;
P90 = 33,375
e
K 1 2 3 4 5 6 7
Classes 18-----------|21 21-----------|24 24-----------|27 27-----------|30 30-----------|33 33-----------|36 36-----------|39 Total
fi
fa
1 4 19 37 28 8 3 100
--------
3) A tabela a seguir contém rendimentos anuais dos funcionários administrativos de uma empresa (em reais). Observe – a e encontre: a) Q1; R. 6.825,00 b) D3; R. 7093,75 c)P35; R. 7296,87 K 1 2 3 4 5 6 7
Classes 5000--------|6000 6000--------|7000 7000--------|8000 8000--------|9000 9000-------|10000 10000-----|11000 11000-----|12000 Total
fi
fa
8 10 16 14 10 5 2 65
--------
4)Dada a distribuição de freqüência a seguir, pede-se: determinar o 1º e o 3º quartis. R. Q1 Q3 = R$ 873 K 1
CUSTOS (R$) 450|--------550
fi
fa 8
=
R$ 630
2 3 4 5 6 7
Estatística Aplicada 550|--------650 10 650|--------750 11 750|--------850 16 850|--------950 13 950|--------1050 5 1050|-------1150 1 Total 64
-
Prof. Paulo Sergio P. da Silva
5) Pra a distribuição do exercício anterior, determinar o 20º percentil. R. P20
31
= R$ 598
6) A pontuação nos testes de 15 empregados envolvidos em um curso de treinamento está disposta a seguir: 13 9 18 15 14 21 7 10 11 20 5 18 37 16 17. Obtenha: o primeiro, o segundo e terceiro quartil da pontuação dos testes. R. Q1 = 10; Q2 = 15 e Q3 = 18
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
32
MEDIDAS DE DISPERSÃO Desvio Médio Poder-se-ia, por exemplo, calcular a distância que separa cada dado Xi da média x e estabelecer a média de todos os valores. Tomando os valores absolutos. Obtém-se, assim, o desvio médio. Para dados não agrupados:
Para dados agrupados :
Dm= | Xi - x |
Dm = | Xi - x | . fi
n
n
OBS.: Para calcular o desvio médio em dados agrupados utiliza-se a fórmula que determina a média aritmética ponderada: Exemplo: Determine o desvio médio para o seguinte conjunto de números: 2, 4, 6, 8, 10 Solução: Determinamos a média:
x = 2 + 4 + 6 + 8 + 10 = 6 5
Determinamos as diferenças: | Xi - x | = |2-6| + |4-6| + |6-6| + |8-6| + |10-6| = |-4| + |-2| + |2| + |4| =12 Desvio médio Dm =
| Xi n
x | = 12 = 2,4 5
Variância da amostra Define-se a variância, e representa-se por S2, como sendo à medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um. Para calcular a variância dados não agrupados S2 = | Xi - x |2
Para calcular a variância dados agrupados S2 = | Xi - x |2 . fi
n - 1
n - 1
Exemplo: Calcule a variância da amostra: 2, 4, 6, 8, 10 Solução: Já vimos que a média é: x = (2 + 4 + 6 + 8 + 10 )/5 = 6
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
33
Eis os cálculos necessários:
S2 = | Xi - x |2
=
Xi
|Xi - 6 |
|Xi – 6 |2
2 4 6 8 10 30
|-4| |-2| |0 | |+2| |+4| 12
16 4 0 4 16 40
40
= 10
n - 1 5-1 Desvio Padrão Amostral Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, nada mais é que a raiz quadrada da variância e obtemos o desvio padrão: O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são:
o desvio padrão é sempre não negativo e será tanto maior, quanta mais variabilidade houver entre os dados. se s = 0, então não existe variabilidade, isto é, os dados são todos iguais. S =
s2
Calcule o desvio padrão da amostra do exemplo anterior Solução: S =
10
S = 3,162278 aproximadamente 3,2
Coeficiente de variação Trata-se de uma medida relativa de dispersão útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas e é expresso em porcentagens. É dado por: CV =
S
. 100
x Para o exemplo anterior: Solução:
CV = (3,2 /6) . 100
CV= 53,33%
Diz-se que a distribuição possui pequena variabilidade (dispersão) quando o coeficiente der até 10%; média dispersão quando estiver acima de 10% até 20%; e grande dispersão quando superar 20%. 2) Determinar o desvio médio (dm), a variância, o desvio padrão e o coeficiente de variação da distribuição amostral a seguir:
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 34 Solução: Primeiramente calculamos a média aritmética ponderada:
x = xi . fi
=
n X 3 4 6 7 9
fi 5 2 4 2 5 18
106
= 5,88 aproximadamente 5,9
18 Xi . fi 15 8 24 14 45 106
Desvio médio: dm = |dm| . fi
=
36,4
n =
= 2,02
99,78
=
18 – 1
n -1
s2
2
18
Variância: S2 = |Xi – x |2 . fi
Desvio Padrão: S =
S2 = |Xi – x |2 . fi |-2,9| = 8,41 . 5 = 42,05 |-1,9|2 = 3,61 . 2 = 7,22 |0,1|2 = 0,01 . 4 = 0,04 |1,1|2 = 1,21 . 2 = 2,42 |3,1|2 = 9,61 . 5 = 48,05 99,78
|dm| = | Xi – x | . fi 3 – 5,9 = |-2,9| . 5 = 14,5 4 – 5,9 = |-1,9| . 2 = 3,8 6 – 5,9 = |0,1| . 4 = 0,4 7 – 5,9 = |1,1| . 2 = 2,2 9 – 5,9 = |3,1| . 5 = 15,5 36,4
S=
Coeficiente de variação: CV =
5,87
S . 100
x
99,78
= 5,87
17 S = 2,43 =
2,43 . 100
= 243 = 41,18%
5,9
5,9
EXERCÍCIOS 1) Determine o desvio médio para o conjunto de valores: 1, 2, 3, 4, 5 2) Calcule a variância e o desvio padrão da amostra: 2, 5, 10, 5, 2
R. Dm = 1,2
R. S2 = 10,7 e S = 3,27
3) Calcular o desvio-médio, a variância, o desvio padrão e o coeficiente de variação da seguinte distribuição amostral: R. Dm = 1,2; S2 = 2,85; S = 1,69 e CV = 20,96% Xi 5 7 8 9 11
fi 2 3 5 4 2 16
4)Calcule a variância para os dados do Conjunto A: 4, 6, 4, 6, 5, 5.
R. S2 = 0,8
5) Os preços para a amostra de 6 modelos básicos de máquinas de café são apresentados a seguir (Consumer Reports 1995 Buying Guide). R. a) Dm = 9; b) S2 =138,4 c) S = 11,76 d) CV = 40,56%
Estatística Aplicada Modelo Preço($) Mr. Coffee PR12A 27 Krups 50 Proctor 42301 20 Black & Decker 901 22 Black & Decker 900 20 West Bend 35
-
Prof. Paulo Sergio P. da Silva
35
Determine: a) o desvio médio
b)a variância
c)o desvio padrão
d) o coeficiente de variação
6) Os dados da tabela abaixo representam a amostra para os dados de salários-inicias dos funcionários de uma determinada empresa. Salário Mensal(xi)(R$) 350,00 450,00 250,00 380,00 255,00
fi 2 4 3 1 2
Determine: a) a média R. a) média = 345,00
b) o desvio médio b) Dm = 77,5
c) S2 = 8059,09
c)a variância
d) o desvio padrão
d) S = 89,77
7) Dada a tabela abaixo: Xi fi 4 2 2 4 6 3 3 2 Total 11 CALCULAR: a) o desvio-médio R. 1,42 b) a variância R. 2,85 c) o desvio-padrão R. 1,68 d) o coeficiente de variação R. 46,28% 8) Para o conjunto de números {3, 5, 2, 4}, determinar: a) a média R. 3,5 b) o desvio-médio R. 1 c) a variância R. 1,66 d) o desvio-padrão R. 1,28 9) A altura média dos homens que trabalham em uma empresa é 1,80m, com desvio-padrão 1,40m e a altura média das mulheres é 1,60m com desvio-padrão 1,30m. Determine o coeficiente de variação para a altura dos homens e para altura das mulheres. R. CVh = 77,77% e CVm = 81,25%
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
36
PROBABILIDADE Os fenômenos estudados pela Estatística variam de resultados de uma observação para outra, dificultando assim a previsão de um resultado futuro. Por isso adota-se um modelo matemático probabilístico. EXPERIMENTO ALEATÓRIO Experimentos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Em uma afirmação do tipo: “é provável que meu time ganhe a partida de hoje” pode resultar: a) que o time perca; b) que o time ganhe; c) que ele empate. Como vimos, o resultado é imprevisível e depende do acaso. Fenômenos como esses são chamados fenômenos aleatórios ou experimentos aleatórios. ESPAÇO AMOSTRAL A cada experimento aleatório (E) correspondem em geral a vários resultados possíveis a que chamamos de Espaço Amostral (S). Exemplos: E = lançar um dado e observar o nº da face de cima S = {1, 2, 3, 4, 5, 6} E = lançar uma moeda e observar o resultado S = {cara, coroa} EVENTOS É qualquer subconjunto do espaço amostral S de um experimento aleatório. Exemplo: No lançamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, seja B o evento “obter um nº par na face superior” temos: B = {2, 4, 6} CÁLCULO DAS PROBABILIDADES Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, chamamos de probabilidade de um evento A o nº real P(A) tal que: P(A) = n(A) n(S) onde: n(A) = nº de elementos de A ; n(S) = nº de elementos de S.
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
37
Exemplos: Considerando o lançamento de um dado: - qual a probabilidade do evento A “obter um número par na face superior”. Temos: S = {1, 2, 3, 4, 5, 6}, logo n(S) = 6 A = {2, 4, 6}, logo n(A) = 3 3 1 Então: P(A) = 6 2 -
qual a probabilidade do evento B “obter um nº menor ou igual a 6 na face superior”
Temos: S = {1, 2, 3, 4, 5, 6}, n(S) = 6 B = {1, 2, 3, 4, 5, 6}, n(B) = 6 Então : P(B) = -
6 1 6
qual a probabilidade do evento C “obter um número 4 na face superior”
Temos: S = {1, 2, 3, 4, 5, 6}, n(S) = 6 C = {4}, n( C ) = 1 Então : P (C) = -
1 6
qual a probabilidade do evento D “obter um número maior que 6 na face superior”
Temos: S = {1, 2, 3, 4, 5, 6}, n(S) = 6 D = vazio, n(D) = 0
0 0 6 Pelos exemplos acima temos: a) A probabilidade do evento certo é igual a 1: P(S) = 1 b) A probabilidade do evento impossível é igual a zero: P(Ø) = 0 c) A probabilidade de um evento E qualquer é um nº real P(E) tal que: 0 P( E ) 1 Então: P(D) =
EVENTOS COMPLEMENTARES Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação: p+q=1 → q=1–p Assim, se a probabilidade de se realizar um evento é p = 1/5, a probabilidade de que ele não ocorra é: p+q=1 → q=1–1 =4 5 5 Sabemos que a probabilidade de tirar 4 no lançamento de um dado é p(4) = 1/6. Logo, a probabilidade de não tirar o 4 no lançamento de um dado é: q=1–1 =5 6 6
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
38
EVENTOS INDEPENDENTES Dizemos que dois eventos são independentes quando a realização ou a não realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa, ou seja, então a probabilidade da ocorrência de ambos é igual ao produto de suas probabilidades individuais, ou “marginais” : P = P1 . P2 Exemplos: 1) No lançamento de dois dados. A probabilidade de obtermos 1 no primeiro dado é: P1 = 1/6 A probabilidade de obtermos 5 no segundo dado é: P2 = 1/6 Logo, a probabilidade de obtermos simultaneamente, 1 no primeiro dado e 5 no segundo dado é: Resolução: P = 1/6 . 1/6
P = 1/36
2) Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas darem cara? Resolução: É razoável admitir que os resultados das duas moedas sejam independentes um do outro. Além disso, para moedas equilibradas, P(caras) = ½ . Logo, P(cara, e coroa) será: 1a jogada 2a jogada ambas ½ . ½ = ¼ 3) No caso de três moedas. Qual a probabilidade de três caras? Resolução: 1a jogada 2a jogada 3a jogada ½ . ½ . ½ =
ambas 1/8
4) Em 25% das vezes John chega em casa para jantar. Por outro lado, o jantar atrasa 10% das vezes. Se não há qualquer relacionamento entre os atrasos de John e os atrasos do jantar, qual a probabilidade de ocorrerem ambos os casos? Resolução: P(ambos atrasos) = P(John atrasado)P(jantar atrasado) P(ambos atrasos) = (0,25)(0,10) P(ambos atrasos) = 0,025 ou 2,5% EVENTOS MUTUAMENTE EXCLUSIVOS Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). De modo geral, podemos dizer que se dois eventos são mutuamente exclusivo, a probabilidade de que um ou outro se realize é igual a soma das probabilidades de ocorrência de que cada um deles se realize: P = P1 + P 2
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
39
EXEMPLOS: 1) No lançamento de um dado; a probabilidade de se tirar o 3 ou o 5 em uma jogada é: Resolução: p(3) = 1/6 p(5) = 1/6 logo p(3 ou 5) = 1/6 + 1/6 = 2/6 = 1/3 2) Numa empresa 30% dos funcionários são do primeiro turno, 35% do segundo, 20% do terceiro, e o restante do quarto turno. Um dos funcionários ganhou R$ 1.000,00 numa loteria. Determine as probabilidades: a) de o funcionário ser do quarto turno; b) de ser do primeiro turno; c) de não ser do primeiro turno. Resolução: (a) 10 20 30 40 30 + 35 + 20 = 85 15 P(quarto) = 15/100 = 0,15 . 100 = 15% (b) 10 = 30 P(primeiro = 30/100 P(primeiro) = 0,30 . 100 = 30% (c) 20 30 40 20 + 35 + 15 = 70 P(não ser do primeiro) = 70/100 = 0,7 . 100 = 70% E X E R C Í C I O S 1) Determine o complemento de cada um dos seguintes eventos: a) ganhar num jogo de beisebol b) ganhar num jogo de futebol c) obter dois ou três no lançamento de um dado 2) Relacione os resultados possíveis do lance de um só dado. Ache a probabilidade de cada resultado e adicione-as. R. 1 3) Joga-se um dado equilibrado; determine a probabilidade de obter: a) um seis R. 1/6 ou 16,66% b) cinco, seis ou sete R. 2/6 ou 33,33% c) um número par R. 3/6 ou 50% d) um número menor que quatro R. 3/6 ou 50% 4) Há 50 bolas numa urna, distribuídas como segue: COR NÚMERO AZUL 20 VERMELHA 15 LARANJA 10 VERDE 5 TOTAL 50
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 40 Misturam-se as bolas e escolhe-se uma. Determine a probabilidade de a bola escolhida ser: a) b) c) d) e) f) g)
verde R. 5/50 ou 10% azul R. 20/50 ou 40% azul ou verde R. 25/50 ou 50% não vermelha R. 35/50 ou 70% vermelha ou verde R. 20/50 ou 40% laranja R. 10/50 ou 20% não laranja R. 40/50 ou 80%
5) De um lote de 10 fusíveis, testa-se um. Determine P(defeituoso) se: a) 1 fusível é defeituoso R. 1/10 b) 2 fusíveis são defeituosos R. 2/10 c) 3 fusíveis são defeituosos R. 3/10 6)Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a)A probabilidade dessa peça ser defeituosa . R. 1/3 b)A probabilidade dessa peça não ser defeituosa. R. 2/3 7) Considere uma população de igual número de homens e mulheres, em que sejam daltônicos 5% dos homens e 0,25% das mulheres. Indique a probabilidade de que seja mulher uma pessoa daltônica selecionada ao acaso nessa população. R. d a)12,50%
b) 14,28%
c) 23,80%
d) 4,76%
e)25%
8) Determine a probabilidade de Alexandre, Hamilton e Adriano terem nascido no mesmo dia da semana. R. 1/7 ou 14,28% 9) Numa sala de aula de um curso noturno, a distribuição das idades dos alunos é dada pelo gráfico seguinte: no de alunos
5 4 3 2 1 16
17
18
19
20
21
idade dos alunos
Escolhido um aluno ao acaso, a probabilidade de sua idade ser no máximo 18 anos é: R. (c) a) 4/5 b) 2/5 c) 3/5 d) 9/20 e) 1/4 10) Uma firma realizou um concurso para selecionar alguns universitários que pretendem fazer estágio. A tabela apresenta as escolhas das carreiras dos estudantes inscritos, por sexo. SEXO Carreira masculino feminino Economia 8 6 Contabilidade 6 5 Administração 11 4
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 41 Um desses estudantes é escolhido ao acaso, e sabe-se que ele é do sexo masculino. A probabilidade de este estudante ter escolhido Contabilidade é de: R. (c) a) 6% b) 15% c) 24% d) 30% e) 19,05% 11)Baseado no problema da questão anterior, a probabilidade de este estudante ter escolhido Contabilidade ou Economia é de: R. (a) a) 56%
b) 32%
c) 24%
d) 80.95%
e) 19,05%
12) Com referência a tabela abaixo, qual a probabilidade de uma família aleatoriamente escolhida tenha renda familiar entre $ 8.000 e $ 12.999? R. (e) Tabela: Renda familiar anual de 500 famílias Categoria Níveis de renda No de Famílias 1 Menos do que $ 8.000 60 2 8.000 ------ 12.999 100 3 13.000 ------ 19.999 160 4 20.000 ------ 29.999 140 5 30.000 e mais 40 TOTAL -------------------------500 a) 0,18
b) 0,28
c) 0,12
d) 0,32
e) 0,20
13) (ENEM/2005 - modificada) As ex-alunas de uma turma que completou o curso de Ciências Contábeis há 10 anos se encontraram em uma reunião comemorativa. Várias delas haviam se casado e tido filhos. A distribuição das mulheres, de acordo com a quantidade de filhos, é mostrada no gráfico abaixo. Um prêmio foi sorteado pela instituição onde as mulheres concluíram o curso superior entre todos os filhos dessas ex-alunas. A probabilidade de que cada criança premiada tenha sido um(a) filho(a) único(a) é: R. (e)
Estatística Aplicada
(A) 1/3
(B) ¼
(C) 7/15
-
Prof. Paulo Sergio P. da Silva
(D) 7/23
42
(E) 7/25
MAIS EXERCICIOS.... 1) Determine a probabilidade de cada evento abaixo: a) Um nº par aparecer no lançamento de um dado. b) No lançamento de um dado, qual é a probabilidade de sair o nº 6 ou um nº ímpar? R. a) ½;
b) 2/3
2) Uma loja dispõe de 12 geladeiras do mesmo tipo, das quais 4 apresentam defeitos. Se um freguês vai comprar uma geladeira, qual a probabilidade de levar uma defeituosa? R. 1/3 3) Um lote é formado por 10 peças boas, 4 com defeitos e duas com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que: a) ela não tenha defeitos graves; R. 7/8 b) ela não tenha defeitos; R. 5/8 c) ela, ou seja, boa ou tenha defeitos graves. R. 3/4 4) Suponha que um gerente de um grande complexo de apartamentos forneça as seguintes estimativas de probabilidade sobre o número de vagas que haverá no próximo mês: Vagas
probabilidades
0 0,05 1 0,15 2 0,35 3 0,25 4 0,10 5 0,10 Forneça a probabilidade do evento. a) sem vagas R. 0,05 b) pelo menos quatro vagas R. 0,20 c) duas vagas ou menos R. 0,55 5) Determine a probabilidade de obter 3 ou menos pontos no lance de um dado. R. 1/2 6)Suponhamos uma urna com 10 bolas, 8 vermelhas e 2 verdes. Qual a probabilidade de escolher uma verde numa única extração? R. 1/5 7) Jim e Tim acham uma velha moeda. Um exame detido revela que a moeda foi alterada, de modo que uma face é mais provável que a outra. Jim decide verificar, e lança a moeda 40 vezes, obtendo cara 24 vezes. Em seguida, Tim lança a moeda 50 vezes, obtendo cara 28 vezes. a) Pode-se dizer que Jim ou Tim tenha obtido uma verdadeira experiência de freqüência relativa? Por quê?
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
43
b) Se o leitor tivesse de escolher um dos dois resultados, qual escolheria e por quê? 8) Um terço dos eleitores de certa comunidade é constituído de mulheres, e 40% dos eleitores votaram na última eleição presidencial. Supondo que esses dois eventos sejam independentes, determine a probabilidade de escolher aleatoriamente um eleitor da lista geral, que seja mulher e que tenha votado na última eleição presidencial. R. 13,33% 9) As falhas de diferentes máquinas são independentes umas das outras. Se há quatro máquinas, e se suas respectivas probabilidades de falha são 1%; 2%; 5% e 10% em determinado dia, calcule as probabilidades: a) de todas falharem em determinado dia R. 0,00010% b) de nenhuma máquina falhar
R. 82,95%
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
44
FATORIAL – DISTRIBUIÇÃO BINOMIAL Chama-se fatorial de um número natural n > 1 e se indica por n! ao produto dos n fatores decrescentes de n até 1. n! = n(n – 1) ( n – 2) ( n – 3) ......3 . 2 . 1 onde n! lê-se n fatorial
EXEMPLOS 1. Calcule: a) b) c) d)
5! = 5 . 4 . 3 . 2 . 1 = 120 4! = 4 . 3 . 2 . 1 = 24 3!2! = (3 . 2 . 1) . (2 . 1) = 12 5! = 5 . 4 . 3 . 2 . 1 = 60 2! 2.1 e) 8! = 8 . 7 . 6 . 5! = 336 5! 5! OBS.: Por definição: 0! = 1 e 1! = 1
Números Binomiais Chama-se número binomial de classe x do número n, onde n e x são números naturais e x ≤ n, a expressão: n x
n! = x!(n – x)!
o “n” é o numerador e “x” o denominador do número binomial.
EXEMPLOS 1.
8 5
=
8! = 5!(8 –5)!
8! = 5!3!
8 . 7 . 6 . 5! = 5! 3 . 2. 1
2.
9 1
=
9! = 9! = 1!(9 –1)! 1!8!
3.
3 3
=
3! = 3! = 3! 3!(3 –3)! 3!0! 3! . 1
4.
6 0
=
6! = 6! = 1 0!(6 –0)! 1 . 6!
9 . 8! = 9 1. 8!
= 1
56
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
45
Distribuição Binomial Vamos imaginar fenômenos cujos resultados só podem ser de dois tipos, um dos quais é considerado como sucesso e o outro insucesso. Este fenômeno pode ser repetido tantas vezes quanto se queira (n vezes), nas mesmas condições. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das sucessivas. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade de q (q =1- p) do insucesso, manter-se-ão constantes. Resolveremos problemas do tipo: determinar a probabilidade de se obter x sucessos em n tentativas. Nessas condições X é uma variável aleatória discreta que segue uma distribuição binomial. Fórmula: P(x) =
n x n x .p .q x
P(x) = é a probabilidade de que o evento se realize x vezes em n provas. n = nº de vezes que o experimento aleatório é repetido x = nº de sucessos em n tentativas p = é a probabilidade de que o evento se realize em uma só prova = sucesso. q = é a probabilidade de que o evento não se realize no decurso dessa prova = insucesso. n x
é o coeficiente binomial de n sobre x, igual a
n! x! (n x)!
Variância - S2 = n.p.q Desvio padrão – S =
s2
OBS: O nome binomial é devido à fórmula, pois representa o termo geral do desenvolvimento do binômio de Newton: Fórmula do Termo geral (p + q)n = n pxqn-x + n 0 1
p1qn-1 + n 2
p2qn-2 + n p3 q n-3 + ... + n pnq0 3 n
EXEMPLOS 1) Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabilidade de serem obtidas 3 caras nessas 5 provas. Resolução: n = 5 x = 3 p = 1/2 q = 1 - (1/2) = 1/2 P(x=3) = 5 . (½)3 . (1/2)5-3 3 P(x=3) =
5 3
. (1/8) . (1/4)
P(x=3) =
5 3 5 3
. (1/32)
P(x=3) =
=
5! . 0,03125 3!(5 –3)!
Estatística Aplicada P(x=3) =
5 3
=
-
Prof. Paulo Sergio P. da Silva
46
5 . 4 . 3! 3! 2!
P(x=3) =
5 = 5.4 3 2.1 P(x=3) = 10 . 0,03125
= 20 = 10 2
P(x=3) = 0,3125 . 100 = 31,25% 2) Uma empresa produz 10% de peças defeituosas. As peças são embaladas em caixas que contém 12 peças. Calcule a probabilidade de um cliente comprar uma caixa contendo: a) nenhuma peça defeituosa; b) uma peça defeituosa. Solução: 1. E: examinar uma peça
D P(D) = 0,1 N P(N) = 0,9 2. n = 12 repetições independentes de E. 3. Se convencionarmos D como sucesso, então estamos interessados no item a na ocorrencia de 0 sucesso. P(x =0) = 12 0
(0,1)0 (0,9)12 = 0,2824 ou 28,24%
No item b estamos interessados na ocorrência de 1 sucesso. P(x =1) = 12 1
(0,1)1 (0,9)11 = 12 (0,1 ) ( 0,3138106) = 0,37657 0u 37,66%
3) Um levantamento efetuado na carteira de uma agência bancária indicou que 20% dos títulos eram pagos com atraso. Se em determinado dia foram pagos 20 títulos da carteira, determine a probabilidade que: No máximo dois sejam pagos com atraso. Solução: No máximo dois sejam pagos com atraso. E: Sem Atraso: SA P(SA) = 0,8 Com Atraso: CA P(CA) = 0,2 n = 20 repetições independentes de E. considerando como sucesso CA, estamos interessados na ocorrência de 0,1 ou 2 sucessos. P[x < 2] = P[0] + P[1] + P[2] P[x < 2] = 20 (0,2)0 (0,8)20 + 20 (0,2)1 (0,8)19 + 20 (0,2)2 (0,8)18 0 1 2 P[x < 2] = 0,0115 + 20(0,2)(0,0144) + 190(0,0400)(0,01800) P[x < 2] = 0,01150 + 0,05760 + 0,13680 P[x < 2] = 0,2059 ou 20,59% OBS.: 20! = 190 2
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
47
EXERCICIOS 1) Calcule: a) 6!
b) 3! 4!
c) 5! + 2!
d)4! – 3!
e)3! + 5!
R. a) 720; b) 144; c)122; d) 18; e) 126;
2) Calcule: a) 9 2
b) 7 2
c)
3 1
R. a) 36; b) 21; c) 3
3) Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda. R. 0,3125 ou 31,25%
4) Considere um experimento binomial com dois ensaios e p = 0,4. a) b) c) d) e)
Calcule a probabilidade de um sucesso, f(1). R. 48% Calcule f(0). R. 36% Calcule f(2). R. 16% Encontre a probabilidade de pelo menos um sucesso. R. 64% Encontre a variância e o desvio padrão. R. 0,48 e 0,6928
5) Considerando as decisões de compra dos próximos três cliente que entram na loja de roupas “Leve Tudo”. Com base em experiências passadas, o gerente da loja “Leve Tudo”estima que a probabilidade de qualquer um dos clientes comprará é de 0,30.Calcular a probabilidade de que nenhum cliente faça uma compra; exatamente um cliente faz uma compra; exatamente dois clientes fazem uma compra e todos os três clientes fazem uma compra. R. f(0) = 0,343; f(1) = 0,441;
f(2) = 0,189;
f(3) = 0,027
6) Considerando o problema com 3 clientes da loja “Leve Tudo”, vemos que a variância e desviopadrão para o número de clientes que fazem uma compra são de? R. 0,63 e 0,79
7) Se considerarmos a estimativa de probabilidade que qualquer um dos clientes que entra na loja “Leve Tudo” seja de 0,30, a probabilidade de fazer exatamente 4 vendas a 10 clientes que entram na loja é ? R. f(4) = 0,2001 ou 20,01%
8) Para os próximos 1000 clientes que entram na loja “Leve Tudo”, a variância e o desvio–padrão para o número de clientes que fazem uma compra são de? R. 210 e 14,49
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
48
DISTRIBUIÇÃO NORMAL DE PROBABILIDADES
f(x)
x “x = s possui um máximo para z = 0, e neste caso sua ordenada 0,39” f(x)
x -s + s “f(x) tem dois pontos de inflexão cujas abscissas valem -s e + s”
Cálculo de Probabilidades A probabilidade de P[a < x < b] é a área da região sob a curva definida pelo intervalo ]a,b[. f(x)
x a b A determinação desta área usando-se o cálculo integral é bastante complicada. Para superar esta dificuldade, uma particular distribuição normal z com média =0 e s (z) =1 foi utilizada. Uma tabela contendo os valores positivos de z e a área compreendida sob a curva entre 0 e z foi construída. z:
f(z)
z 0 z Esta distribuição foi escolhida pelo fato de apresentar os parâmetros mais simples. Qualquer outra distribuição normal x com média e desvio-padrão s pode ser transformada, para efeito do cálculo de área, na distribuição normal padrão z, através da mudança de variável: Z=X–μ S
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
49
onde: μ= np (média) S=
s 2 (desvio padrão)
Propriedades da distribuição normal 1ª - A variável aleatória X pode assumir todo e qualquer valor real. 2ª - A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que recebe o nome de curva normal ou de Gauss. 3ª - A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real. 4ª - A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo. 5ª - Como a curva é simétrica em torno da média, a probabilidade de ocorrer valor maior que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%. Cada metade da curva representa 50% de probabilidade. Conhecendo-se a área especificada na tabela, qualquer outro tipo de área poderá ser calculada usando-se a simetria da curva. Uso de Tabela – distribuição z Exemplo 01: Calcule a probabilidade de a variável normal padrão z assumir valores entre 0 e 1. Solução: z:
f(z)
z 0 1 Note que a área entre zero e um valor positivo é exatamente a área fornecida pela tabela. - Entra-se na tabela na 1a coluna z vai até o 1 têm-se o correspondente na 2a coluna 0,00 O valor da área correspondente a z = 1,00 é 0,3413. Portanto, P(0<z<1) = 0,3413. Exemplo 02: Calcule a probabilidade de a variável normal padrão z assumir valores maiores que 1. Solução: z: f(z)
z 0 1 Observe que o valor tabelado na distribuição normal padrão é o valor da área entre 0 e 1.
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 50 No entanto, pela simetria da curva, a área à direita de zero é igual a 0,5. Portanto, P(z > 1) = 0,5 – P(0 < z < 1) P(z >1) = 0,5 – 0,3413 P(z >1) = 0,1587 Exemplo 03: Calcule a probabilidade de a variável normal padrão z assuma o valor 1. Solução: Como neste caso, o intervalo se reduz a um ponto, a área é zero. Assim, P(z = 1) = 0 De um modo geral, a probabilidade de a variável z assumir um único valor é sempre zero. Exemplo 04: Calcule a probabilidade de a variável normal padrão z assumir um valor menor que –1. Solução: z: f(z)
z -1 0 Pela simetria a área da esquerda –1 é igual à área da direita de 1. Assim, P(z < - 1) = P(z > 1) P(z < - 1) = 0,5 – 0,3413 P(z < - 1) = 0,1587
Exemplo 05: Deseja-se a probabilidade P( -2,55 < z < 1,2). Solução: z: f(z)
z -2,55
0
1,2
Entra-se na tabela, com o valor 1,2 na 1a coluna(z) e 0,00 na 1a linha, obtendo 0,3849. Lembrando a propriedade da simetria em relação a z = 0, entra-se com 2,5 na 1a coluna e 0,05 na 1a linha, obtendo 0,4946. Portanto, P(-2,55 < z < 1,2) = 0,3849 + 0,4946 P(-2,55 < z < 1,2) = 0,8795
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
51
Exemplo 06: Uma variável aleatória x normal apresenta média 20 e desvio-padrão 3. Calcule P(20< x< 23). Solução: x:
f(x)
x 20
23
Usando a mudança de variável: z= x – s Obtemos os valores de z correspondentes aos pontos 20 e 23: z = 20 – 20 = 0 3 z = 23 – 20 = 1,00 3 A área entre os pontos 20 e 23 na distribuição de x é a mesma área entre os pontos 0 e 1 na distribuição de z. desta forma , P(20< x< 23) = P(0 < z < 1,00). Este valor é obtido diretamente na tabela consultando-se o valor z = 1,00. Assim, P(20 < x <23) = 0,3413.
EXERCICIOS 1. Deseja-se a probabilidade de P( z 1,93). R. 2,68% 2. As alturas dos funcionários de determinada empresa são normalmente distribuídas com média 1,60m e desvio-padrão 0,30m. Encontre a probabilidade de um funcionário medir: a) b) c)
entre 1,50 e 1,80m; R. 37,47% mais de 1,75 m; R. 30,85% menos de 1,48m. R. 34,46%
3. A duração de 500 componentes eletrônicos tem média 800 dias e desvio-padrão 35 dias. Calcular a probabilidade de esse componente durar: a) b)
entre 700 e 900 dias; mais que 800 dias.
R. 99,56% R. 50%
4. O salário mensal dos operários industriais são distribuídos normalmente em torno de uma média de R$180,00 com desvio- padrão de R$ 25,00. Pede-se que encontre a probabilidade de um operário ter salário mensal situado entre R$ 150,00 e R$ 178,00. R. 41,68% 5. Determinada máquina enche latas baseada no peso bruto com média 1kg e desvio-padrão 45g. Determine a probabilidade de uma lata conter mais de 950g de peso líquido. R. 13,35%
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 52 6. Uma fábrica de pneumáticos fez um teste para medir o desgaste de seus pneus e verificou que ele obedecia a uma distribuição normal, de média 48.000 km e desvio-padrão 2.000 km. Calcular a probabilidade de um pneu escolhido ao acaso: a) b)
dure mais que 46.000 km; dure entre 45.000 e 50.000 km.
R. 15,87% R. 77,45%
7. A média dos diâmetros internos de uma amostra de 200 arruelas produzidas por uma certa máquina é 0,502 polegadas e o desvio padrão é 0,005 polegadas. A finalidade para a qual essas arruelas são fabricadas permite a tolerância máxima, para diâmetro, de 0,496 a 0,508 polegadas; se isso não se verificar, as arruelas serão consideradas defeituosas. Determinar a porcentagem de arruelas defeituosas produzidas pela máquina, admitindo-se que os diâmetros são distribuídos normalmente. R. 76,98% e 23,02%
8. Os salários dos bancários são distribuídos normalmente, em torno da média R$ 10.000,00, com desvio padrão de R$ 800,00. Calcule a probabilidade de um bancário ter o salário situado entre R$ 9.800,00 e R$ 10.400,00. R. 29,02%
Estatística Aplicada TABELA : Áreas para a Distribuição Normal Padronizada
Prof. Paulo Sergio P. da Silva
53
x 0 z Cada casa na tabela dá a proporção sob a curva inteira entre z = 0 e um valor positivo de z. As áreas para os valores de z negativos são obtidos por simetria. z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
0,00 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159
0,01 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2612 0,2910 0,3186
0,02 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212
0,03 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238
0,04 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2995 0,3264
0,05 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289
0,06 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315
0,07 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340
0,08 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2518 0,2823 0,3106 0,3365
0,09 0,0359 0,0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389
1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9
0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713
0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719
0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726
0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732
0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738
0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744
0,3354 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750
0,3357 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756
0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761
0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4606 0,4767
2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9
0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981
0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0.4975 0,4982
0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0.4976 0,4982
0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0.4977 0,4983
0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984
0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984
0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985
0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985
0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986
0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986
3,0 0,4986 4,0 0,49997
0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4990 0,4990
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
54
DISTRIBUIÇÃO DE POISSON Nesta distribuição consideramos uma variável aleatória discreta que é freqüentemente útil para estimar o número de ocorrências sobre um intervalo de tempo ou espaço específico. Por exemplo:- Número de defeitos por metro em determinado tecido. - Número de defeitos na impressão de certo livro. - Número de pessoas que chegam ao caixa de um supermercado no intervalo de tempo de 3 minutos. - Número de carros que passam por um pedágio no intervalo de 30 minutos, etc. P(x) =
e np (np) x e x x! x!
Onde: = np : representa o nº médio de eventos ocorrendo no intervalo considerado P(x) : é a probabilidade de ocorrência do evento desejado x = nº de ocorrências e = base do logaritmo natural (2,718281...) EXEMPLOS 1.Dez por cento das ferramentas produzidas por um certo processo de fabricação revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10 ferramentas escolhidas ao acaso, exatamente duas serem defeituosas. Solução: Probabilidade de uma ferramenta ser defeituosa : p = 0,1 = np = 10(0,1) = 1 e x = 2 P(2 feramentas defeituosas em 10) =
e- . x = e- . (1)2 = 0,367917587 . 1 = 0,1839 x! 2! 2 .1
2. Se a probabilidade de um indivíduo sofrer uma reação nociva, resultante da injeção de um determinado soro, é 0,001, determinar a probabilidade de, entre 2000 indivíduos: (a) exatamente 3 sofrerem aquela reação; (b) nenhum indivíduo sofrer aquela reação. Solução (a): = np = 2000(0,001) = 2 e x = 3 P(3 indivíduos sofrerem uma reação nociva) = P(3 indivíduos sofrerem uma reação nociva) = Solução (b): x = 0 P(nenhum sofrer aquela reação nociva) =
e- . x = e-2 . (2)3 = 0, 13536335 . 8 x! 3! 3.2.1 1,0829068 = 0,180 6
=
e- . x = e-2 . (2)0 = 0,13536335 . 1 = 0,1353 X! 0! 1
3. Suponha que estamos interessados no número de chegadas a uma caixa automática (tipo drive thru) de um banco durante um período de 15 minutos nas manhãs de fins de semana. Se pudermos
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 55 considerar que a probabilidade de um carro chegar é a mesma para quaisquer dois períodos de tempo de igual comprimento, e que a chegada ou não-chegada de um carro em qualquer período de tempo seja independente da chegada ou não-chegada do outro em qualquer período de tempo, a função de probabilidade de Poisson é aplicável. Suponha que essas hipóteses são satisfeitas e uma análise de dados históricos mostra que o número médio de carros que chegam no período de 15 minutos é 10; então a seguinte função de probabilidade se aplica. a) Qual a probabilidade se a administração queria saber cinco chegadas exatamente em 15 minutos? Solução: P(x = exatamente 5 chegadas em 15 minutos) = e- . x = e-10 . (10)5 = x! 5! P(x = exatamente 5 chegadas em 15 minutos) = 0,000045447 . 100.000 = 4,54447 5.4.3.2.1 120 P(x = exatamente 5 chegadas em 15 minutos) = 0,0378 b) Suponha que os dados histórico revelasse que o número médio de carros que chegam no período de 15 minutos é 3; qual a probabilidade de uma chegada nesse período? Solução: P(x = exatamente1 chegada em 15 minutos) = e- . x = e-3 . (3)1 = (2,718282)-3 . 3 x! 1! 1 P(x = exatamente 1 chegada em 15 minutos) = 0,0497871 . 3 = 0,149336 1 P(x = exatamente 1 chegada em 15 minutos) = 14,93% 4. O número médio de acidente mensais em um determinado cruzamento é três. Qual a probabilidade de que em um determinado mês ocorram quatro acidentes no cruzamento? Solução: P(x = 4) = e- . x = e-3 . (3)4 = 0,049802557 . 81 x! 4! 4.3.2.1 P(x = 4) = 4,034007117 24 P(x = 4) = 0,168 E XERCÍCIOS 1. Uma loja atende em média 2 clientes por hora. Calcular a probabilidade de em uma hora: a) atender 2 clientes R. 27,07% b) atender 3 clientes R. 18,04% 2. Suponha que 2% dos itens produzidos por uma fábrica sejam defeituosos. Encontre a probabilidade de existirem 3 defeituosos em uma amostra de 100. R . 18,04% 3. Certo posto de bombeiros recebe em média 3 chamadas por dia. Calcular a probabilidade de receber 4 chamadas num dia. R. 16,80% 4. Suponha que haja em média 2 suicídios por ano numa população de 50.000 hab. Em uma cidade de 100.000 hab, encontre a probabilidade de que em um dado ano tenha havido: a) 0 suicídio R. 1,83% b) 1 suicídio R. 7,32% c) 2 suicídios R. 14,65%
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 56 5. Sabendo-se que a probabilidade de um indivíduo acusar reação negativa à injeção de determinado soro é 0,001, determine a probabilidade de que, em 3000 indivíduos, exatamente dois acusem reação negativa. R.22,40% 6. Supondo que o nº de carros que chegam a uma fila de guichê de um pedágio possua distribuição de Poisson a uma taxa de 3 carros por minuto, determine a probabilidade de chegarem 4 carros nos próximos 2 minutos. R. 13,39% 7. Se 3% das lâmpadas elétricas fabricadas por uma companhia são defeituosas, determinar a probabilidade de, em uma amostra de 100 lâmpadas, serem defeituosas: a) nenhuma lâmpada; R. 4,98% b) uma lâmpada ser defeituosa; R. 14,94% c) três lâmpadas serem defeituosas. R. 22,41% 8. Entre as 14 e 16 horas, o número médio de chamadas telefônicas por minuto, atendidas pela mesa de ligações de uma companhia, é de 2,50. Determine a probabilidade de, durante um determinado minuto, haver: a) zero chamada; R. 8,21% b) uma chamada; R. 20,52% c) duas chamadas. R. 25,65%
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
57
CORRELAÇÃO
Diagrama de Dispersão Você provavelmente já ouviu dizer que o aumento do número de crimes está relacionado com o aumento da taxa de desemprego. Você também deve ter ouvido falar que os preços sobem quando a procura determinado produto aumenta. Estes exemplos mostram que, muitas vezes, o pesquisador procura uma relação entre duas variáveis. Até agora, analisamos distribuições de uma única variável, porém, a partir deste momento, vamos considerar as relações entre duas ou mais variáveis. Para isso as medidas de tendência central e variabilidades estudadas anteriormente já não são suficientes, teremos que usar uma nova medida chamada de Correlação que descobre e mede as relações, bem como outra chamada de Regressão que determina os parâmetros da função que descreve tais relações. É através do gráfico denominado diagrama de dispersão, que ele busca visualizar a relação entre as duas variáveis. As relações podem ser subdivididas em : ● Estatísticas : Altura X peso, Cor de pele X cor de olhos (Resultados de pouca precisão ou previsibilidade) . ● Funcionais : Perímetro, área, volume (Resultados obtidos através de fórmulas 100% previsíveis) Tomando uma amostra aleatória qualquer, relacionando duas grandezas, podemos dispor os resultados em forma de um gráfico ( Diagrama de Dispersão ) .
Peso ( yi ) ● ● ●
● ● ● ●
● ●
Idade ( xi ) Repare que os pontos estão dispersos, porém esta dispersão se dá em torno de uma reta que é chamada de Reta Imagem ou Reta de Correlação Linear. Peso ( yi ) ● ●
Reta Imagem
● ● ●
● ● ● Idade ( xi )
Dependendo do diagrama de dispersão, temos . . .
Estatística Aplicada Correlação Linear Positiva ● ● ● ● ● ● ●
Correlação Linear Negativa ● ● ● ● ● ● ● ●
-
Prof. Paulo Sergio P. da Silva
Correlação Não Linear ●● ● ● ● ● ● ● ● ●● ● ● ● ● ●
58
Sem Correlação ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
Coeficiente de Correlação de Pearson
r=
n. x
n. xi . yi xi . yi 2 i
xi . n. yi yi 2
2
2
Com n o n.º de observações.
Este coeficiente mede o grau de intensidade da correlação entre duas variáveis, bem como o sentido (Positivo ou Negativo ). Temos r [ -1, 1 ] daí se
r = 1 Correlação Perfeita e Positiva entre as variáveis. r = 0 Correlação Não Linear, ou Não há correlação. r = -1 Correlação Perfeita e Negativa entre as variáveis.
NOTA:
[ 0,6 ; 1 ] Intervalo que contém as melhores conclusões. Ao usarmos Pearson temos | r | [ 0,3 ; 0,6 [ Correlação Linear Fraca . [ 0 ; 0,3 [ Correlação Linear Muito fraca .
Dada uma amostra com n pares de valores Xi e Yi, para medir o grau de correlação entre elas, calcula-se o coeficiente de correlação de Pearson. Exemplo 01: Taxa de mortalidade infantil e taxa de analfabetismo no Brasil em 1997, segundo a região. Taxa de Taxa de Região mortalidade analfabetismo Xi .Yi Xi2 Yi2 infantil (Xi) (Yi) Norte 35,6 12,7 452,12 1267,36 161,29 Nordeste 59,0 29,4 1734,60 3481,00 864,36 Sudeste 25,2 8,6 216,72 635,04 73,96 Sul 22,5 8,3 186,75 506,25 68,89 Centro Oeste 25,4 12,4 314,96 645,16 153,76 167,7 71,4 2905,15 6534,81 1322,26
X 167,7 28123,29 Y 71,4 5097,96 2
2
2
2
Substituindo na fórmula, os somatórios pelos totais já calculados:
r
r
Estatística 167,7.71,4 2905,15 5 28123,29 5097,96 .1322,26 6534,81 5 5
-
Prof. Paulo Sergio P. da Silva
2905,15 2394,756
6534,81 5624,658. 1322,26 1019,592 510,394
r
Dessa forma, existe alta correlação positiva entre as variáveis. Isto significa que ocorrem mais mortes de menores nas regiões que existem maior número de analfabetos Pois, r = 0,9724
910,152 . 302,668 r
Aplicada
510,394 524,856
r 0,9724
OUTRO EXEMPLO: Tabela B Biologia Química ( xi ) ( yi ) 7 8 9 8 8 7 3 4 4 6 5 5 36 38
xi . yi
xi2
yi2
56 72 56 12 24 25 245
49 81 64 9 16 25 244
64 64 49 16 36 25 254
Portanto temos n = 6 correlações , logo . . . r=
6.245 36.38 [6.244 (36) ].[6.254 (38) ] 2
r 0,88
2
1470 1368 [1464 1296].[1524 1444]
Correlação Linear Forte e Positiva .
Exemplo 02: País EUA Japão Alemanha França Coréia do Sul Espanha Canadá Brasil Reino Unido Itália Fonte: Agência Auto Informe (1998)
soma
nº de carros
nº de nascimentos
(em milhões) (X)
(em milhões) (Y)
12,00 11,00 5,00 3,80 2,80 2,60 2,10 2,10 1,90 1,80
3,80 1,30 0,80 0,70 0,68 0,38 0,36 3,20 0,70 0,50
102 168.80
59
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 60 Alguns cuidados na interpretação da correlação
X
Veja o exemplo 2, apresentado também em diagrama de dispersão. Os países com maior número de nascimentos de crianças tem, em geral, maior número de veículos zero quilometro. Contudo o aumento da primeira variável não causa o aumento da outra; é o aumento da população que faz aumentar tanto o número de nascimentos como o número de veículos zero quilometro nos países.
Y
REGRESSÃO Ajustamento da Reta A análise de Regressão tem como resultado uma equação matemática que descreve o relacionamento entre duas variáveis, partindo de n observações das mesmas. Essas equações são usadas em situações em que se deseja: - estimar valores de uma variável com base em valores conhecidos de outra; - explicar valores de uma variável em termos de outra; - predizer valores futuros de uma variável. A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente. Assim supondo X a variável independente e Y a variável dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por: Y = aX + b Onde a e b são os parâmetros. Y : Variável Dependente ( Aquela sobre a qual vamos fazer a Estimativa ) X : Variável Independente Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada, embora não perfeita, como, por exemplo a tabela a seguir: Xi Yi
5 6
8 9
7 8
10 10
6 5
7 7
9 8
3 4
8 6
2 2
Cujo diagrama de dispersão é dado por: 12 10 8 6 4 2 0 0
5
10
15
Podemos concluir, pela forma do diagrama, que se trata de uma correlação retilínea, de modo a permitir o ajustamento de uma reta, imagem da função definida por:
Y = aX + b
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 61 Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das fórmulas: a
n. x . y x . y n x 2 x
2
e b y a .x
onde: n é o número de observações
x é a média dos valores x x
x
n y y é a média dos valores y y n
Nota: Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros, o resultado, na realidade, é uma estimativa da verdadeira equação de regressão. Sendo assim,
ˆ aX b escrevemos: Y ˆ é o valor Y estimado. Formemos então a tabela de valores, com n = 10 Onde Y Xi 5 8 7 10 6 7 9 3 8 2 65
Temos assim: a
10x 473 65x 65
10x 481 ( 65 ) com o:
2
Yi 6 9 8 10 5 7 8 4 6 2 65
Xi . yi 30 72 56 100 30 49 72 12 48 4 473
xi2 25 64 49 100 36 49 81 9 64 4 481
4.730 4.225 505 0 ,8632 4.810 4.225 585
65 65 6 ,5 e y 6 ,5 10 10 vem : b y a .x x
b 6 ,5 0 ,8632 x 6 ,5 6 ,5 5,6108 0 ,8892 donde: a 0 ,86 e b 0,89 logo : Yˆ 0,86X 0,89
Para traçarmos a reta no gráfico, basta determinar dois de seus pontos: ˆ =0,89 X=0 Y 12 ˆ =0,86 x 5 + 0,89 = 5,19 X=5 Y 10 8 Assim, temos:
y = 0,8631x + 0,89
6 4 2 0
0
5
10
15
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
62
OUTRO EXEMPLO
Tabela B Biologia Química ( xi ) ( yi ) 4 6 9 8 7 5 8 7 10 8 3 4 8 10 1 2 50 50
xi . yi
xi2
yi2
24 72 35 56 80 12 80 2 361
16 81 49 64 100 9 64 1 384
36 64 25 49 64 16 100 4 358
Portanto temos n = 8 correlações , logo . . . a=
8.361 50.50 2888 2500 a 0,68. 8.384 (50) 2 3072 2500 _
_
b= y-ax =
50 50 0,68. b 2,01. 8 8
Logo temos
Y = aX + b
Y = 0,68X + 2,01. Equação da Reta Imagem ou Reta Ajustada EXERCICIOS
1) Considere as variáveis (X,Y) onde as variáveis representam respectivamente Y : indica nota de uma prova de matemática X : Tempo de estudo para encarar essa prova (em horas) Tempo Nota
3,0 4,5
7,0 6,5
2,0 3,7
1,5 4,0
12,0 9,3
Ache o coeficiente de correlação e monte o diagrama de dispersão. R. 0,99;
fazer o diagrama
2) Forme o esquema de cálculo do coeficiente de correlação, para os valores das variáveis Xi e Yi: Xi 4 6 8 10 12 Yi 12 10 8 12 14 R. r = 0,42
3) Determine a equação da reta para ajustamento dos dados da tabela: Xi 2 4 6 8 10 12 14 Yi 30 25 22 18 15 11 10
Y = -1,69x + 32,22 4) Um grupo de pessoas faz uma avaliação de alguns objetos. Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a tabela: R.
Peso Real Peso Aparente
18 10
30 23
42 33
62 60
73 91
97 98
120 159
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 63 a) Verifique, pelo diagrama, se existe correlação retilínea. R. sim b) Em caso, afirmativo, calcule o coeficiente de correlação.R. r = 0,98 c) Escreva, em poucas linhas, as conclusões a que chegou sobre a relação entre essas variáveis.
5) Certa empresa, estudando a variação de demanda de seu produto em relação à variação de preço de venda, obteve a tabela: Preço (xi) Demanda (yi)
38 42 50 350 325 297
56 270
a) Determine o coeficiente de correlação. R.
59 256
63 246
70 238
80 223
95 215
110 208
r = -0,90
b) c)
Estabeleça a equação da reta ajustada. R. Y =-1,87x + 368,8 Estime Y para x = 60 e x = 120. R. 274,6 e 162,4
6) Dada a tabela a seguir ( xi ) 5 7 9 12 ( yi ) 8 9 10 11 a) Determine o coeficiente de correlação. R. r = 0,99
b) Estabeleça a equação da reta ajustada. R. Y = 0,43x + 5,95 7) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura: Temperatura ( °C ) Comprimento(m ) Determine
10 103
15 105
20 110
25 112
a) O coef. de correlação. R. 0,99
b) A reta ajustada a essa correlação. R. Y = 0,66x + 96
30 116
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
64
EXERCICIOS SUPLEMENTARES Média/Mediana e Moda OsOs dados 1) dados da tabela abaixo, referem-se aos salários de 50 funcionários da empresa X. Com base nesses dados determine: Salários(R$) Funcionários l L (fi) 100|---200 2 200|---300 15 300|---400 6 400|---500 7 500|---600 6 600|---700 2 700|---800 1 800|---900 2 900|---1000 3 1000|---1100 4 1100|---1200 2 TOTAL 50 a) A média salarial. R. R$ 514,00 b) A moda salarial. R. R$ 259,00 c) A mediana. R. R$ 428,57 d) A freqüência percentual dos funcionários que recebem salário inferior a R$ 600,00. R. 72% e) A porcentagem de funcionários que recebem salário abaixo de R$ 800,00. R. 78% f) A porcentagem de funcionários que recebem salário superior ou igual a R$ 500,00. R. 40% a g) A freqüência percentual da 4 classe. R. 14% h) A amplitude da amostra. R. R$ 1100,00 i) A amplitude da classe. R. R$ 100,00 j) O valor numérico entre a média salarial e a moda. R. R$ 255,00 a k) Interprete a 6 classe da tabela demonstrativa (tabela acima). Resposta livre
2) Cinco baldes contêm 4L de água cada um, três outros contêm 2L de água cada um, e, ainda dois contém 5L de água cada um. Se toda essa água fosse distribuída igualmente entre esses baldes, com quantos litros ficaria cada um? R. 3,6 litros
3) Numa empresa, dez operários têm salários de R$ 2000,00 mensais; doze têm salário de R$ 1.500,00 mensais e oito operários têm salário de R$ 1.400,00 mensais. Qual é o salário médio ponderado desses operários? R. R$ 1640,00
4) Entre sessenta números, vinte são iguais a 5, dez são iguais a 6, quinze são iguais a 8, dez são iguais a 12, e cinco são iguais a 16. Determine a média aritmética ponderada desses números. R. 8
5) As idades dos jogadores de um time de basquetebol são 18, 23, 19, 20 e 21 anos. Qual é a média de idade desses jogadores? R. 20,2 anos 6) O gráfico mostra a distribuição de uma amostra de garrafas de refrigerantes e seus respectivos volumes em mililitros.
Número
de
Número de garrafas garrafas (fi)
400
200
100 Volume(ml) 0
280
300
320
a) Quantas garrafas compõem essa amostra? R. 700 garrafas b) Qual a freqüência percentual da classe “300 ml”? R. 57,14% aproximadamente c) qual a freqüência percentual da classe “280 ml”? R. 14,28% aproximadamente d) qual a freqüência percentual da classe “320 ml”? R. 28,57% aproximadamente. e) qual a diferença percentual entre a classe “300 ml” e a classe “280 ml”? R. 42,86% f) qual é a classe modal? R. 300 7)Uma pessoa comprou 5 garrafas de suco de frutas, uma de cada tipo. A tabela mostra o preço de cada garrafa de suco. SUCOS PREÇO POR GARRAFA
MARACUJÁ R$ 5,70
LARANJA
CAJU
ABACAXI
UVA
R$ 3,50
R$ 2,30
R$ 3,20
?
Sabendo que nessa compra o preço médio de uma garrafa foi de R$ 3,80, pode-se concluir que o preço da garrafa de suco de uva é: R. (c) a) R$ 3,80 b) R$ 4,20 c) R$ 4,30 d) R$ 4,70 e) R$ 4,90
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
65
Correlação e Regressão ˆ = 0,108x – 0,93 1) Determine a equação de ajuste dos dados da tabela a seguir: R. Y 30 2
X Y
34 3
28 2
29 3
33 4
45 4
30 3
28 1
28 1
43 4
45 3
2) Para saber se a temperatura de armazenagem influi na potência do produto, 12 amostras foram guardadas a diferentes temperaturas. Depois de 20 dias, mediu-se a potência de cada produto. Os resultados foram: 30 39
Temperatura(X) Potencia(Y)
40 40
30 43
35 37
40 39
50 26
ˆ a) A equação estimativa do ajustamento. R. Y
Pede-se:
70 18
90 20
90 17
70 27
90 15
70 23
= - 0,405x + 52,5
b) Faça a estimativa para X(temperatura) = 20 e X(temperatura) = 95
R. 44,40 e 14,02
3) Numa loja, o gerente resolveu verificar qual é a tendência referente às vendas. Para isso, coletou uma amostra de 12 vendas com seus respectivos preços em reais: Vendas(X) Preços(Y)
30 200,00
25 150,00
32 210,00
20 110,00
15 90,00
18 105,00
25 180,00
30 210,00
18 110,00
23 140,00
25 170,00
32 230,00
ˆ = 8,10492x – 39, 1451 a)Determine a reta de estimação. R. Y
b)Se a loja vender 21 peças ou 35 peças, qual deverá ser o preço estimado?
R. R$ 131,06 e R$
244,53
c)Construir o gráfico de dispersão. 4) Uma estudante de marketing conduz um estudo para determinar se existe relação linear entre o peso de uma pessoa (em libras) e o consumo diário de água (em onças). Os dados estão dispostos na tabela a seguir. Organize os dados em mapa (gráfico) de dispersão e descreva o tipo de correlação. PESO(X) AGUA(Y)
102 50
119 32
124 82
141 64
142 54
154 21
201 86
220 39
R. ao construir o gráfico nota-se que não existe correlação linear
5) Um administrador de marketing conduz um estudo para determinar se existe uma relação linear entre o dinheiro gasto em propaganda e as vendas de uma companhia. Os dados estão dispostos na tabela à seguir: Gasto com propaganda (milhares de dólares), X 2,4 1,6 2,0 2,6 1,4 1,6 2,0 2,2 SOMA=
Vendas da empresa (milhares de dólares), Y 225 184 220 240 180 184 186 215
X.Y
X2
Y2
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
66
Pede-se : a) Construir o mapa de dispersão. b) Existe relação linear? R. Sim c) Calcule o coeficiente de correlação. R.
aproxi. 0,913
d) O que você pode concluir? Cálculo de Probabilidade 1) Se extrairmos uma só bola de uma urna com 321 bolas, qual a probabilidade de extrair qualquer delas? R. 0,3115% 2) Os arquivos de uma companhia imobiliária revelam que, num período de 16 dias, a freqüência de casas vendidas por dia foi: Número Número dias vendido 0 3 1 2 2 5 3 6 TOTAL 16 Se admitirmos que o passado é representativo do futuro (o que nem sempre é o caso), determine a probabilidade na tabela acima: R. P(0) = 18,75%; P(1) = 12,50%; P(2) = 31,25% e P(3) = 37,50%
3) Um carregamento de 10.000 caixas de lenços de papel chega a um depósito. Cada caixa traz a indicação “400 unidades”; mas na verificação de uma amostra de 300 caixas, constam-se 45 com menos de 400 unidades. Estime a probabilidade de qualquer caixa da remessa ter menos de 400 unidades. R. 15% 4) Uma pesquisa de tráfego levada a efeito das 5 às 6 horas da manhã num trecho de uma estrada federal revelou que, de 200 carros que pararam para uma verificação rotineira de segurança, 25 tinham pneus em más condições. Estime a probabilidade de um carro que pare naquele trecho ter os pneus bons. R. 87,5% 5) Os dados metereológicos de determinada localidade indicam que, nos últimos 100 anos, a temperatura máxima do primeiro dia de verão excedeu a 750F em 79 anos. Estime a probabilidade de que tal ocorra no primeiro dia de verão deste ano. R. 79% EVENTOS INDEPENDENTES: 6) Uma firma exploradora de petróleo perfura um poço quando acha que há pelo menos 25% de chance de encontrar petróleo. Ela perfura quatro poços. Dos quais atribui às probabilidades: 0,3; 0,4; 0,7 e 0,8. Determine: a) Determine a probabilidade de nenhum dos poços produzirem petróleo, com base nas estimativas da firma. R. 2,52% b) Qual a probabilidade de os quatro poços produzirem petróleo? R. 6,72%
Estatística Aplicada - Prof. Paulo Sergio P. da Silva 67 7) Mike tem dois velhos automóveis. Nas manhãs frias, há 20% de probabilidade de um deles não “pegar” e 30% de outro não “pegar”. Qual a probabilidade de nenhum pegar? R. 6% 8) Rone aguarda com ansiedade o resultado de dois exames que acaba de fazer. Ele estima em 0,80 a probabilidade de obter A em literatura Inglesa, e em 0,40 a probabilidade de obter A em Filosofia. Determine as seguintes probabilidades: a) grau A em ambos os exames. R. 32% b) nenhum A. R. 12% EVENTOS MUTUAMENTE EXCLUSIVOS: 8.1) As probabilidades de 0, 1, 2, 3, 4, 5, 6 ou sete acidentes num dia de semana entre 1 e 6 horas da manhã são respectivamente, 0,08, 0,15, 0,20, 0,25, 0,18, 0,07 e 0,01. Determine as seguintes probabilidades para um dia qualquer da semana naquele horário: a) menos de três acidentes. R. 43% b) três ou mais acidentes. R. 51% c) exatamente três acidentes. R. 25% d) nenhum acidente. R. 8% e) mais de quatro acidentes. R. 8% 8.2) Suponha que temos um espaço amostral S = {E1, E2, E3, E4, E5, E6}, onde E1, E2, .........., E6 denotam os pontos amostrais. As seguintes atribuições de probabilidades se aplicam: P(E1) = 0,05, P(E2 )= 0,20, P(E3) = 0,20, P(E4) = 0,25, P(E5) = 0,15, P(E6) = 0,10. seja: A = {E1, E4 } B = {E2, E4, E6 } C = {E2, E3, E5 } Encontre P(A) ou P(B). R. 85% b) Encontre a P(C ) ou P (A) R. 85% c) Encontre P(B) ou P(C) R. 110% a)
Fatorial 9) Se um torneio de basquetebol consiste de 36 times, de quantas maneiras podem ser conquistados os três primeiros lugares? R. 42.840 maneiras 10) Um cardápio oferece cinco tipos de carne ou peixe, quatro de salada, três de batatas e duas de vegetais. Quantos jantares são possíveis formar, com um tipo de cada um? R. 120 tipos 11) Calcule:
40 R. 780 38 12) De quantas maneiras podemos escolher um comitê de quatro pessoas dentre oito? R. 70 maneiras 13) Joga-se uma moeda sete vezes. De quantas maneiras podem ocorrer os seguintes resultados? a) cinco caras. R. 21 maneiras b) quatro caras. R. 35 maneiras c) todas caras. R. 1 maneira d) uma cara. R. 7 manerias 14) A Pizzaria Joe oferece as seguintes escolhas de pizza: presunto, cogumelo, pimentão, enchova e mussarela. De quantas maneiras podemos escolher dois tipos diferentes de pizza? R. 10 maneiras
Estatística Aplicada
-
Prof. Paulo Sergio P. da Silva
68
Distribuição Binomial 15) Um vendedor de automóveis novos constatou que 80% dos carros vendidos são devolvidos ao departamento mecânico para corrigir defeitos de fabricação, nos primeiros 25 dias após a venda. De 11 carros vendidos num período de 5 dias, qual é a probabilidade de que: a) todos voltem dentro de 25 dias para reparo. R. 8,59% b) só um não volte. R. 23,62% 16) Suponha que 8% dos cachorros-quentes vendidos num estádio de beisebol sejam pedidos sem mostarda. Se sete pessoas pedem cachorro-quente, determine a probabilidade de que: a) todos queiram mostarda. R. 0,000002097% b) apenas um não a queira. R. 0,0016882% c) determine a variância e o desvio padrão. R. 0,51520 e 0,7177 17) Sejam 0,10 a probabilidade de sucesso e 100 o número de observações. Determine à média e o desvio padrão da distribuição. R. 10 e 3 18) Os registros de uma pequena companhia indicam que 40% das faturas por ela emitidas são pagas após o vencimento. De 14 faturas expedidas, determine a probabilidade de: a) nenhuma ser paga com atraso. R. 0,00078 b) no máximo duas serem pagas com atraso. R. 3,99% c) ao menos uma ser paga com atraso. R. 3,91% Distribuição Normal (Z): 19) As vendas de gasolina num depósito de atacado acusam a média de 40.000 galões diários, com um desvio-padrão de 30.000 galões. Supondo adequada a distribuição normal, determine a probabilidade de serem vendidos mais de 42.000 galões de gasolina por dia. R. 47,61% 20) Um fornecedor de ferro alega que seu produto apresenta resistência à tensão aproximadamente normal com média de 50.000psi e desvio-padrão de 8.100psi. Supondo verdadeira a situação, que percentagem de mensuração dará resultado inferior a 49.550psi? R. 48,01% 21) Uma variável aleatória está distribuída normalmente com uma média de 50 e um desvio-padrão de 5. Qual é a probabilidade de a variável aleatória assumir um valor entre 40 e 60? R. 95,44% 22) O tempo médio que um assinante gasta lendo o jornal é de 49 minutos. Considere que o desviopadrão seja de 16 minutos e que os tempos sejam distribuídos normalmente. Qual é a probabilidade de que um assinante gaste mais do que 30 minutos lendo o jornal? R. 11,90% 23) O volume de comercialização na Bolsa de Valores de Nova York tem crescido nos últimos anos. Para as duas primeiras semanas de janeiro de 1998, o volume médio diário foi de 646 milhões de ações(Barron’s, janeiro de 1998). A distribuição de probabilidade do volume diário é aproximadamente normal com um desvio-padrão de cerca de 100 milhões de ações. a) Qual é a probabilidade de que o volume de comercialização será menor do que 400 milhões de ações? R. 0,69% b) Durante que porcentagem de tempo o volume de comercialização excedeu 500 milhões de ações? R. 7,21%
24) Suponha que o salário médio dos funcionários de uma empresa possa ser razoavelmente aproximado por uma distribuição normal com média de R$ 1.800,00 e desvio-padrão de R$ 700,00. Que percentagem dos funcionários terá salários superior a R$ 2.600,00? R. 12,71%