OUTRAS OBRAS
estatística BÁSICA
Pessoas que trabalham nas áreas de administração, negócios, gerenciamento, gestão de qualidade, precisam da Estatística como ferramenta auxiliar para a tomada de decisão. Estatística é, portanto, o meio para se chegar ao fim, não o fim em si mesmo. As informações devem ser apresentadas na forma de tabelas e gráficos. Os índices econômicos e as muitas taxas aparecem na mídia e precisam ser discutidos.
Os conceitos são demonstrados de maneira informal como uma tentativa de explicar a lógica sem demonstrações matemáticas, o que torna sua leitura muito mais fácil. E para incrementar a aprendizagem são apresentados 110 exemplos e 120 exercícios com respostas comentadas.
Estatística básica se propõe a auxiliar estudantes dos cursos de Matemática, Estatística, Economia, Gestão e Negócios, e também das áreas que eventualmente aplicam conhecimentos básicos de Estatística, como Relações Públicas, Ciências Sociais, Psicologia e Administração, além de profissionais que queiram adquirir conhecimento dos princípios da Estatística.
ISBN 13: 978-85-221-1103-9 ISBN 10: 85-221-1103-0
Para suas soluções de curso e aprendizado, visite www.cengage.com.br
9 788522 111039
BÁSICA
A P L I C AÇ Õ ES
BÁSICA
estatística
A Estatística, tida como aborrecida e sem sentido, começa a fazer sentido no momento em que se mergulha de vez no assunto. Isso porque, no âmbito profissional, é preciso julgar a qualidade de cada amostra, levantar as causas da variabilidade dos dados, medir o tamanho dos riscos. Veja o tempo despendido no estudo da Estatística como um investimento sólido para o futuro acadêmico e profissional – daí a importância desta obra.
estatística
PROBABILIDADE E ESTATÍSTICA PARA ENGENHARIA E CIÊNCIAS Jay L. Devore ESTATÍSTICA APLICADA À ADMINISTRAÇÃO E ECONOMIA – 2ª edição David R. Anderson, Dennis J. Sweeney e Thomas A. Williams INFERÊNCIA ESTATÍSTICA – Tradução da 2ª edição norte-americana George Casella e Roger L. Berger ESTATÍSTICA PARA ECONOMISTAS – 4ª edição revista e ampliada Rodolfo Hoffmann
Sonia Vieira
Estatística básica
Austrália : Brasil : Japão : Coreia : México : Cingapura : Espanha : Reino Unido : Estados Unidos
estatistica-miolo7.indd 3
16/07/2014 13:37:34
Sumário
Prefácio
ix
1. Apresentação de dados em tabelas
1
1.1. O que é variável e o que é dado? 1.2. Apuração de dados 1.3. Construção de tabelas 1.4. Tabelas de distribuição de frequências
1 4 5 7
1.4.1. Apresentação de dados qualitativos em tabela de distribuição de frequências 1.4.2. Apresentação de dados discretos em tabela de distribuição de frequências 1.4.3. Apresentação de dados contínuos em tabela de distribuição de frequências
7 9 10
Exercícios
14
2. Apresentação de dados em gráficos
17
2.1. Apresentação de dados qualitativos
17
2.1.1. Gráfico de barras 2.1.2. Gráfico de setores 2.1.3. Diagrama de Pareto
2.2. Apresentação de dados numéricos
17 22 24
25
2.2.1. Diagrama de linhas 2.2.2. Gráfico de pontos
25 27
2.2.3. Histograma 2.2.4. Diagrama de ramo e folhas
27 29
Exercícios
estatistica-miolo7.indd 5
32
22/02/2011 20:46:17
vi
E statística
básica
3. Medidas de tendência central
36
3.1. Símbolos matemáticos 3.2. Média da amostra
37 38
3.2.1. Média de dados apresentados em tabelas de distribuição de frequências
38
3.3. Mediana da amostra 42 3.4. Moda da amostra 44 Exercícios 45
4. A questão da variabilidade
49
4.1. Mínimo, máximo e amplitude 4.2. Quartil
50 52
4.2.1. Diagrama de caixa (Box plot)
4.3. Percentis 4.4. Desvio padrão
4.4.1. Variância 4.4.2. Desvio padrão 4.4.3. Uma fórmula prática para calcular a variância
55
57 58
58 60 61
Exercícios 62
5. Relação entre duas variáveis
66
5.1. Correlação
66
5.1.1. Diagrama de dispersão 5.1.2. Correlação espúria
67 72
5.2. Séries temporais
73
5.2.1. Gráfico de linha 5.2.2. Extrapolação
73 75
5.3. Regressão e correlação linear simples 5.3.1. Regressão linear simples 5.3.2. Correlação linear simples 5.3.3. Coeficiente de determinação
75
75 81 83
Exercícios 84
estatistica-miolo7.indd 6
22/02/2011 20:46:17
S umário
vii
6. Probabilidade
87
6.1. O que é probabilidade
88
6.1.1. Espaço amostral e evento 6.1.2. Definição clássica de probabilidade 6.1.3. Frequência relativa 6.1.4 Definição subjetiva de probabilidade
6.2 Algumas taxas importantes 6.2.1. Taxa de natalidade e taxa de mortalidade infantil 6.2.2. Taxa de mortalidade 6.2.3. Taxa de desemprego 6.2.4. Taxa de analfabetismo e taxa de evasão escolar
88 89 90 92
93
93 94 94 96
6.3. Índices 96 Exercícios 96
7. Números índices
99
7.1. Números índices 7.2. Índices relativos simples
99 101
7.2.1. Índice relativo de preço ou preço relativo 7.2.2. Índice relativo de quantidade
7.3. Índices gerais
101 103
105
7.3.1. Média aritmética de índices relativos simples
106
7.3.1.1 Média aritmética de preços relativos
106
7.3.1.2. Média aritmética das quantidades relativas
7.3.2 Índice agregativo simples
107
108
7.3.2.1. Índice agregativo simples de preços ou índice simples de preços agregados
108
7.3.2.2. Índice agregativo simples de quantidades ou índice simples
108
7.4. Algumas considerações 109 Exercícios 110
8. Mais sobre números índices
113
8.1. Cesta de mercadorias e família típica 113 8.2. Índice de custo de vida 116 8.3 Valores reais ou deflacionados 117 8.4. Principais índices de preços 121 8.5. Taxa de juros 123 Exercícios 125
estatistica-miolo7.indd 7
22/02/2011 20:46:17
viii
E statística
básica
9. Amostragem
129
9.1. O que é população e o que é amostra? 129 9.2. Como se obtém uma amostra? 130 9.3. Parâmetros e estatísticas 134 9.4. Com quantas unidades se compõe uma amostra? 135 9.5. A questão da representatividade 136 9.6.Os processos produtivos 138 9.7. As pesquisas de opinião 139 Exercícios 140
Respostas dos exercícios
143
Referências
175
estatistica-miolo7.indd 8
22/02/2011 20:46:17
Prefácio
A
Estatística trata da coleta, da organização e da interpretação de dados. Querem alguns que a Estatística seja entendida como ciência e como arte. Ciência porque usamos métodos científicos para planejar levantamentos de dados e para delinear e analisar experimentos. Arte porque precisamos ser artistas na forma de apresentar e arranjar dados buscando um visual agradável. Ciência e arte, ou melhor, apenas ciência, o fato é que você talvez esteja se perguntando: “É preciso estudar Estatística?”, “Estatística será útil no meu dia a dia?”. Pois aqui vão cinco razões pelas quais se deve debruçar sobre esse assunto. A primeira razão para o estudo da Estatística é adquirir capacidade para ler assuntos técnicos, a maioria dos quais contém algum tipo de estatística. Então, saber um pouco dessa matéria proporciona habilidade para entender e discutir os resultados apresentados. A segunda razão para estudá-la é a necessidade de ser um consumidor informado. É verdade que há quem use números para mentir, mas são mais comuns relatórios com erros de cálculo ou estatísticas inadequadas não porque o profissional que os apresentou quis mentir, mas por não ter conhecimento sobre o assunto. Sabendo um pouco de Estatística, o leitor tem condições de avaliar o que lhe é apresentado. A terceira razão para estudar Estatística é a de se tornar capaz para uma pesquisa mais elaborada. Sem o uso das ferramentas da Estatística é muito difícil tomar decisões apenas com base nos dados coletados. Por exemplo, imagine que se queira comparar o absenteísmo em vários departamentos de uma universidade. Será que existe diferença significativa entre eles? Há duas possibilidades: ou as diferenças entre os dados sobre absenteísmo nos diversos departamentos ocorreram por acaso, ou existe diferença real
estatistica-miolo7.indd 9
22/02/2011 20:46:17
x
E statística
básica
entre departamentos quando se trata de absenteísmo. Sem estatísticas não há como tomar uma decisão lógica entre essas possibilidades. A quarta razão para se estudar Estatística é a de desenvolver a capacidade de crítica e de análise. Para aprender Estatística é preciso aperfeiçoar o pensamento lógico e o raciocínio formal, o que, sem dúvida alguma, terá muita utilidade na sua vida profissional. A quinta razão para o estudo de Estatística é adquirir conhecimento sobre o trabalho dos estatísticos e saber quando é preciso consultar um profissional é essencial. A maioria de nós sabe o suficiente sobre o próprio carro para saber quando levá-lo à oficina mecânica, e aprendemos o suficiente para sermos capazes de conversar com um mecânico. Devemos nos portar da mesma forma quando precisamos de um estatístico. Se não há conhecimentos em estatística para análise de dados, não é prudente colocar em risco um projeto inteiro tentando realizar toda a análise por conta própria. Procure um estatístico e converse com ele. Estudar Estatística não é fácil, mas também não é difícil. É preciso concentração, disposição para fazer cálculos e exercícios, e a busca constante do entendimento dos resultados. Pois este livro foi feito para ajudar você nessa empreitada. Ficam aqui registrados os meus maiores agradecimentos à Martha Maria Mischan, que fez críticas ao texto original com a maestria de sempre, a Ronaldo Wada, pelas importantes sugestões, a João Paulo Quartucci, pela leitura dos capítulos 7 e 8, a Márcio Vieira Hoffmann, pela ajuda constante, e à Editora Cengage Learning, que confiou em meu trabalho. A autora
estatistica-miolo7.indd 10
22/02/2011 20:46:17
CAPÍTULO Apresentação de dados em tabelas
1
Q
uando alguém fala em Estatística você se lembra das pesquisas eleitorais, de dados sobre desemprego, dos muitos gols feitos pelo seu time de futebol nos últimos meses? Ou, para você, Estatística é, simplesmente, uma disciplina exigida em seu curso? Seja qual for o seu conceito, seria bom que este livro mostrasse que Estatística é uma ciência importante, com inúmeras aplicações em negócios, em assuntos do governo, em administração, em economia. E seria bom convencê-lo de que o tempo despendido no estudo da Estatística é um investimento sólido em seu futuro. Estatística é a ciência que fornece os princípios e a metodologia para coleta, organização, apresentação, resumo, análise e interpretação de dados.
1.1. O que é variável e o que é dado? Variável é uma condição ou característica dos elementos da população; a variável pode assumir valores diferentes (é variável) em diferentes elementos. Dados são os valores coletados da variável em estudo.
1
estatistica-miolo7.indd 1
22/02/2011 20:46:18
2
E statística
básica
Exemplo 1.1: Dados e variáveis São exemplos de variáveis: sexo, idade, escolaridade das pessoas. Qualquer informação obtida é um dado sobre uma pessoa. Então, se você souber que João Antônio da Silva é do sexo masculino, tem 19 anos e obteve nota dez no vestibular, terá dados sobre essa pessoa.
As variáveis são classificadas em dois tipos: • Qualitativas ou categorizadas. • Quantitativas ou numéricas. A variável é qualitativa ou categorizada quando se distribui em categorias, ou seja, em classes diferentes. É expressa por meio de palavras.
Você recebe informação sobre uma variável qualitativa quando pergunta, por exemplo: Para que time de futebol você torce? Você está fazendo estágio? A variável é quantitativa ou numérica quando resulta de um processo de contagem ou medição. É expressa por meio de números.
Você recebe informação sobre uma variável quantitativa quando pergunta, por exemplo: Quanto custou esse sorvete? Quantas páginas tem esse livro? Os dados qualitativos são tratados como palavras e os dados quantitativos são tratados como números. As variáveis qualitativas ou categorizadas são classificadas em dois tipos: • Nominal. • Ordinal. A variável é nominal quando as categorias podem ser indicadas em qualquer ordem.
Você recebe informação sobre uma variável nominal quando pergunta, por exemplo: Qual é o seu tipo de sangue?
estatistica-miolo7.indd 2
22/02/2011 20:46:18
A presentação
3
de dados em tabelas
A variável é ordinal quando os dados são distribuídos em categorias mutuamente exclusivas que têm ordenação natural.
Você recebe informação sobre uma variável ordinal quando pergunta, por exemplo: Você precisou estudar muito, mais ou menos, ou pouco para o concurso? Dados nominais podem ser relatados em qualquer ordem. Dados ordinais têm ordenação natural. As variáveis quantitativas ou numéricas são classificadas em dois tipos: • Discreta. • Contínua. A variável discreta assume valores finitos (por exemplo, apenas números inteiros) em determinado intervalo.
A coleta de uma informação relativa a uma variável discreta ocorre quando você pergunta, por exemplo: Quantos irmãos você tem? A variável contínua assume qualquer valor em determinado intervalo.
A informação sobre uma variável contínua é obtida quando você pergunta, por exemplo: Quanto tempo demorou a viagem? A classificação dos dados é a mesma das variáveis. Veja o esquema apresentado a seguir. Dados
Categorizados (Qualitativos)
Nominais
estatistica-miolo7.indd 3
Ordinais
Numéricos (Quantitativos)
Discretos
Contínuos
22/02/2011 20:46:18
4
E statística
básica
Exemplo 1.2: Classificação de dados Qualitativos Nominais: classificação das pessoas quanto ao sexo. Ordinais: classificação das pessoas quanto à aprendizagem em um curso. Quantitativos Discretos: levantamento do número de filhos por mulher. Contínuos: levantamento das áreas de lotes de terra à venda.
1.2. Apuração de dados As empresas acumulam grande quantidade de dados que mostram, por exemplo, quem comprou o quê e em que quantidade, quanto custou produzir cada unidade vendida, qual foi o lucro no mês e assim por diante. Essas informações – os dados brutos – são armazenadas em arquivo, porém precisam ser organizadas e preparadas para análise e divulgação. Essa fase do trabalho é a apuração. Os dados apurados são utilizados pela empresa para, por exemplo, estabelecer indicadores para o desempenho de vendedores, fazer a contabilidade, contratar ou dispensar funcionários etc. Apuração é a organização dos dados brutos, registrados de forma isolada nos relatórios, cadastros, fichas, questionários, em planilhas que os agrupam para a análise.
Exemplo 1.3: Apuração de dados O gestor de um supermercado quer saber que tipo de pessoa se candidata a uma vaga para operador de caixa. Faz, então, apuração dos dados coletados nas 27 fichas de inscrição para uma vaga aberta recentemente. Para isso, toma cada ficha de inscrição e organiza os dados como segue (sem os nomes).
estatistica-miolo7.indd 4
Nº da ficha
Sexo
Idade
Nível de escolaridade
1 2 3 4 5 6
F F F M F F
18 23 25 19 16 18
Fundamental Médio Fundamental Médio Médio Fundamental
Nº de empregos anteriores 1 0 2 2 1 0
22/02/2011 20:46:18
A presentação
de dados em tabelas
7
F
25
Fundamental
Não declarou
8
F
24
Médio
2
9
M
35
Médio
3
10
M
36
Fundamental
4
11
F
27
Fundamental
2
12
F
29
Médio
2
13
F
32
Fundamental
2
14
F
42
Médio
6
15
M
19
Fundamental
1
16
F
18
Médio
0
17
M
36
Fundamental
2
18
F
39
Superior
1
19
F
42
Fundamental
0
20
F
53
Médio
6
21
F
25
Médio
3
22
M
27
Fundamental
3
23
F
22
Médio
3
24
F
36
Fundamental
2
25
F
38
Fundamental
3
26
M
18
Fundamental
0
27
F
33
Superior
3
5
..
1.3. Construção de tabelas Dados corretamente coletados fornecem conhecimentos que não seriam obtidos por simples especulação. Mas os dados precisam ser apresentados. A melhor e mais organizada forma de apresentar dados é por meio de tabelas, construídas de acordo com as normas técnicas1.
Exemplo 1.4: Construção de tabela No Exemplo 1.3, imagine que o gestor quer ter informação sobre as idades dos homens que se candidataram à vaga para operador de caixa. Organiza, então, os dados na Tabela 1.1.
1
As normas do IBGE são excelentes. Veja em: VIEIRA, S. Elementos de Estatística. 4 ed. São Paulo: Atlas, 2003.
estatistica-miolo7.indd 5
22/02/2011 20:46:18
6
E statística
básica
Tabela 1.1: Idades, em anos completos, dos candidatos homens à vaga para operador de caixa Nº da ficha
Idade
4
19
9
35
10
36
15
19
17
36
22
27
26
18
...
Uma tabela deve ter: 1. Título 2. Corpo 3. Cabeçalho 4. Coluna indicadora O título explica o conteúdo da tabela. O corpo da tabela é composto pelos dados, organizados em linhas e colunas que se cruzam. Célula é a interseção de uma linha com uma coluna. Linha é uma série de células organizadas horizontalmente. Coluna é uma série de células organizadas verticalmente.
Exemplo 1.5: Título e corpo da tabela Veja a Tabela 1.1, do Exemplo 1.4. O título é: Idades, em anos completos, dos candidatos homens à vaga para operador de caixa. O corpo da Tabela 1.1 é formado pelas idades dos candidatos, que são os dados que a tabela deve exibir:
estatistica-miolo7.indd 6
22/02/2011 20:46:18
A presentação
de dados em tabelas
7
19 35 36 19 36 27 18 ...
As linhas e as colunas devem ser identificadas, isto é, deve estar explícito, na tabela, o que contém cada linha e cada coluna. O cabeçalho especifica o conteúdo das colunas. A coluna indicadora especifica o conteúdo das linhas.
Exemplo 1.6: Cabeçalho e coluna indicadora da tabela Veja a Tabela 1.1, do Exemplo 1.4. O cabeçalho indica o que a coluna contém: Nº da ficha
Idade
... A coluna indicadora é formada pelos números das fichas, que identificam de quem é a idade que está apresentada na tabela: 4 9 10 15 17 22 26 ..
1.4. Tabelas de distribuição de frequências 1.4.1. Apresentação de dados qualitativos em tabela de distribuição de frequências
estatistica-miolo7.indd 7
22/02/2011 20:46:18
8
E statística
básica
Dados qualitativos devem ser apresentados na tabela de distribuição de frequências. Lembre-se de que se os dados são qualitativos, cada unidade é classificada em determinada categoria. A tabela de distribuição de frequências apresenta a frequência de unidades em cada categoria, ou seja, quantas vezes você observou cada categoria da variável.
Exemplo 1.7: Distribuição de frequências para dados qualitativos No Exemplo 1.3, imagine que o gestor quer ter informação sobre o número de homens e o número de mulheres que se candidataram à vaga para operador de caixa. Organize, então, os dados na Tabela 1.2. Tabela 1.2: Distribuição dos inscritos para concorrer à vaga de operador de caixa do supermercado segundo o sexo Sexo Homens Mulheres Total
Frequência 7 20 27
... Nas tabelas de distribuição de frequências, é usual fornecer, além das frequências, as frequências relativas. Frequência relativa ou proporção de uma categoria é o quociente entre a frequência dessa categoria e o total.
Frequência relativa
=
Frequência Total
l
Exemplo 1.8: Cálculo das frequências relativas Reveja o Exemplo 1.7, depois observe: na Tabela 1.3 os sexos (primeira coluna), as frequências de pessoas de cada sexo (segunda coluna) e as frequências relativas (terceira coluna). A soma das frequências relativas é, obrigatoriamente, 1. Tabela 1.3: Distribuição dos inscritos para concorrer à vaga de operador de caixa do supermercado segundo o sexo Sexo
Frequência
Homens
7
Mulheres
20
Total
27
Frequência relativa 7 27 20 27
, 0,259 , 0,741 1
...
estatistica-miolo7.indd 8
22/02/2011 20:46:18
A presentação
de dados em tabelas
9
As frequências relativas são, em geral, apresentadas em porcentagens. Para isso, cada proporção calculada é multiplicada por 100. No exemplo da Tabela 1.2, a porcentagem de homens é 0,259 # 100 = 25,9 % Exemplo 1.9: Cálculo das porcentagens Reveja o Exemplo 1.8. As frequências relativas (terceira coluna) estão apresentadas na Tabela 1.4 na forma de porcentagens. A soma das porcentagens é, obrigatoriamente, 100. Tabela 1.4: Distribuição dos inscritos para concorrer à vaga de operador de caixa do supermercado segundo o sexo Sexo
Frequência
Porcentagem
Homens
7
25,9
Mulheres
20
74,1
Total
27
100,0
... Uma tabela de frequências resume os dados. Mostra quantas vezes ocorre cada valor da variável e a respectiva porcentagem.
1.4.2. Apresentação de dados discretos em tabela de distribuição de frequências Reveja o Exemplo 1.3, do gestor de supermercado que levantou dados para saber que tipo de pessoa se candidata a uma vaga para operador de caixa. O número de empregos que cada candidato teve é uma variável discreta que só assume valores inteiros. Se os dados são discretos, para organizar a tabela de distribuição de frequências: 1. Conte quantas vezes cada valor se repete. 2. Escreva os dados em ordem crescente. 3. Organize a tabela como já foi feito para dados qualitativos, mas colocando os valores numéricos, em ordem natural, no lugar das categorias.
Exemplo 1.10: Distribuição de frequências para dados qualitativos No Exemplo 1.3, imagine que o gestor quer ter informação sobre como varia o número de empregos anteriores dos candidatos à vaga para operador de caixa. Escreva, então, os dados como apresentado a seguir e faça a contagem. Depois organize a Tabela 1.5.
estatistica-miolo7.indd 9
22/02/2011 20:46:19
10
E statística
básica
1
0
2
2
1
0
2
3
4
2
2
2
6
1
0
2
1
0
6
3
3
3
2
3
0
3
Tabela 1.5: Distribuição dos inscritos para concorrer à vaga de operador de caixa do supermercado quanto ao número de empregos anteriores Nº de empregos anteriores
Frequência
0
5
1
4
2
8
3
6
4
1
5
0
6
2
Não declarado
1
Total
27
..
1.4.3. Apresentação de dados contínuos em tabela de distribuição de frequências Se os dados são contínuos, pense em construir uma tabela de distribuição de frequências, caso esteja trabalhando com grande quantidade de dados, por volta de 100 ou mais.2 Observe os dados da Tabela 1.6: é difícil dizer como os valores se distribuem. Por essa razão, dados contínuos – desde que em grande número – são apresentados em tabelas de distribuição de frequências.
Exemplo 1.11: Uma tabela com dados contínuos Uma agência da Caixa Econômica verificou os valores depositados em contas de poupança que aniversariavam no dia 1º de junho. Os valores, em reais, estão apresentados na Tabela 1.6.
2
Vinte ou 30 dados podem ser apresentados assim como foram coletados.
estatistica-miolo7.indd 10
22/02/2011 20:46:19
A presentação
de dados em tabelas
11
Tabela 1.6: Valores, em reais, depositados em contas de poupança que aniversariaram no dia 1º de junho de determinado ano 13.155,00
729,00
1.323,00
5.580,00
10.608,00
31.000,00
3.725,00
756,00
1.421,00
5.975,00
10.725,00
35.456,00
215,00
783,00
1.521,00
6.615,00
11.388,00
39.876,00
15.435,00
26.532,00
1.638,00
6.708,00
11.760,00
891,00
59.989,00
864,00
1.666,00
7.693,00
12.005,00
864,00
435,00
29.258,00
40.673,00
7.965,00
81,00
49.786,00
465,00
864,00
1.794,00
8.325,00
13.827,00
972,00
513,00
51.978,00
1.813,00
1.862,00
50.325,00
50.442,00
8.505,00
864,00
14.322,00
570,00
15.288,00
864,00
621,00
891,00
2.522,00
8.505,00
311,00
1.666,00
8.424,00
44.567,00
3.125,00
675,00
15.463,00
56.765,00
648,00
918,00
3.720,00
9.672,00
16.905,00
59.756,00
675,00
19.875,00
53.333,00
9.672,00
17.355,00
648,00
9.555,00
1.107,00
4.425,00
10.125,00
1.131,00
4.725,00
1.131,00
729,00
10.388,00
20.918,00
729,00
10.388,00
5.175,00
819,00
193,00
1.323,00
1.289,00
5.325,00
10.608,00
420,00
... Para construir uma tabela de distribuição de frequências com dados contínuos: 1. Localize o valor máximo e o valor mínimo do conjunto de dados. 2. Calcule a amplitude, que é a diferença entre o valor máximo e o valor mínimo. 3. Divida a amplitude dos dados pelo número de faixas que pretende organizar (no caso do Exemplo 1.11, as faixas são valores em reais). Essas faixas recebem, tecnicamente, o nome de classes. 4. O resultado da divisão é o intervalo de classe. O melhor é arredondar esse número para o valor próximo mais alto (um número redondo) para facilitar o trabalho. 5. Organize as classes, de maneira que a primeira contenha o menor valor observado. Observe os dados apresentados na Tabela 1.6. O menor valor é R$ 81,00 e o maior valor R$ 59.989,00. A amplitude dos dados é: 59.989,00 - 81,00 = 59.908,00 Vamos definir oito classes. Então calcule o intervalo que terá cada classe: 59.908,00 ' 8 = 7.488,50 Como colocado anteriormente, para facilitar os cálculos, é melhor arredondar esse valor. Então o intervalo de classe será de R$ 7.500,00 e a primeira classe será de R$ 0,00 a R$ 7.500,00 (esta classe contém o menor valor); depois, construa a segunda classe, que será de R$ 7.500,00 a R$ 7.500,00 + R$ 7.500,00 = R$15.000,00. Continue o
estatistica-miolo7.indd 11
22/02/2011 20:46:19
12
E statística
básica
procedimento, sempre somando, ao extremo superior que você calculou, o intervalo de classe, como mostra o esquema dado a seguir: 0,00 > 7.500,00 7.500,00 > 15.000,00 15.000,00 > 22.500,00 22.500,00 > 30.000,00 30.000,00 > 37.500,00 37.500,00 > 45.000,00 45.000,00 > 52.500,00 52.500,00 > 60.000,00 60.000,00 > 67.500,00 Na classe de R$ 7.500,00 até R$ 15.000,00 são colocadas as contas com valores que vão de R$ 7.501,00 até contas com valores com R$ 15.000,00; na classe de R$ 15.000,00 até R$ 22.500,00 são colocadas as contas com valores que vão de R$ 15.001,00 até contas com valores com R$ 22.500,00; e assim por diante. Assim, cada classe cobre um intervalo de R$ 7.500,00, facilitam o trabalho. Intervalos de classe iguais, embora possam ser usados intervalos diferentes.3 Denominam-se extremos de classe os limites dos intervalos de classe. Deve ficar claro, na tabela de distribuição de frequências, se os valores iguais aos extremos estão ou não incluídos na classe. Veja a notação usada no exemplo. A primeira classe é: 0,00 > 7500,00 Significa que o intervalo é fechado à direita, isto é, pertencem à classe os valores iguais ao extremo superior da classe (por exemplo, 7.500,00 na primeira classe). Também significa que o intervalo é aberto à esquerda, isto é, não pertencem à classe os valores iguais ao extremo inferior. Existem outras maneiras para indicar se os extremos de classe estão, ou não, incluídos em determinada classe. Aliás, a Fundação Instituto Brasileiro de Geografia e Estatística (IBGE) usa notação diferente. Para dados de idade, por exemplo, escreve-se: “De 0 até 4 anos”, “De 5 até 9 anos”, “De 10 até 14 anos” e assim por diante. A classe “De 0 até 4 anos” inclui desde indivíduos que acabaram de nascer até indivíduos que estão na véspera de completar 5 anos.
Dê preferência a intervalos iguais. Caso os intervalos de classe sejam diferentes, não se pode fazer o gráfico denominado histograma, como será visto no Capítulo 2. Consulte textos mais avançados. 3
estatistica-miolo7.indd 12
22/02/2011 20:46:19
A presentação
de dados em tabelas
13
Exemplo 1.12: Uma tabela de distribuição de frequências para dados contínuos Para dar uma ideia geral sobre os valores, em reais, depositados em contas de poupança que aniversariaram no dia 1º de junho de determinado ano, o pesquisador quer apresentar não os dados observados – mas o número de contas em cada faixa de valor. A Tabela 1.7 apresenta a distribuição de frequências. Tabela 1.7: Distribuição dos valores, em reais, depositados em contas de poupança que aniversariaram no dia 1º de junho de determinado ano Classe
Frequência 55
0,00 > 7.500,00
...
7.500,00 > 15.000,00
21
15.000,00 > 22.500,00
7
22.500,00 > 30.000,00
2
30.000,00 > 37.500,00
2
37.500,00 > 45.000,00
3
45.000,00 > 52.500,00
4
52.500,00 > 60.000,00
4
O número de classes deve ser escolhido pelo pesquisador, em função do que quer mostrar. Em geral, convém estabelecer de 5 a 20 classes. Se o número de classes for demasiado pequeno (por exemplo, 3), perde-se muita informação. Se o número de classes for grande (por exemplo, 30), têm-se pormenores desnecessários. O importante é saber que não existe um número “ideal” de classes para um conjunto de dados, embora existam até fórmulas para estabelecer quantas classes devem ser construídas. Os resultados obtidos por meio de fórmulas podem servir como referência – mas não devem ser entendidos como obrigatórios. Para usar uma dessas fórmulas, faça n indicar o número de dados. O número de classes será o inteiro próximo de k, obtido pela fórmula:
k= n Exemplo 1.13: Cálculo do número de classes Para entender como se obtém o número de classes por meio de fórmula, reveja a Tabela 1.6. Como n = 98, aplicando a fórmula dada, tem-se que: k = n = 98 = 9, 9 , 10 ou seja, poderiam ter sido organizadas 10 classes.
...
estatistica-miolo7.indd 13
22/02/2011 20:46:19
14
E statística
básica
Em uma distribuição de frequências, o extremo inferior da primeira classe, o extremo superior da última classe ou ambos podem não estar definidos. Ainda, os intervalos de classe podem ser diferentes.
Exemplo 1.14: Intervalos de classe diferentes e extremo superior não definido As notas de 15 alunos de um curso de especialização foram atribuídas pelo professor em números, mas devem ser fornecidas à secretaria na forma de conceito, da seguinte maneira: menor do que cinco, D (reprovado); de cinco, inclusive, a sete, exclusive, C; de sete, inclusive, a nove, exclusive, B; de nove, inclusive, a dez, inclusive, A. As notas atribuídas são as seguintes: 10; 6; 8; 9; 8; 7; 5; 9; 10; 8; 5; 7; 6; 3; 9. Vamos organizar a tabela de distribuição de frequências. Tabela 1.8: Distribuição das notas e respectivos conceitos obtidos pelos alunos Nota
Conceito
Frequência
Porcentual
Menor do que 5
Reprovado
1
7%
5=7
C
4
27%
7=9
B
5
33%
9 => 10
A
5
33%
Total
15
100%
...
Exercícios 1. Especifique o tipo das seguintes variáveis: a) peso de encomendas postadas em
correio; b) marcas de carros; c) resistência de materiais; d) quantidade anual de chuva em sua cidade; e) religião; f ) número de canções em uma peça musical; g) número de caixas de leite vendidas por dia em um supermercado; h) comprimento de terrenos.
2. Complete a tabela a seguir:
estatistica-miolo7.indd 14
22/02/2011 20:46:19
A presentação
de dados em tabelas
15
Tabela 1.9: Distribuição das notas de 200 alunos Nota do aluno
Frequência
De 9 a 10
Frequência relativa 0,08
De 8 a 8,9
36
De 6,5 a 7,9
90
De 5 a 6,4
30
Abaixo de 5
28
Total
200
1,0
3. Foi feita uma votação em um condomínio para eleger o síndico. Havia três candi-
datos. De posse dos resultados, a) determine o número de votos de cada pessoa; b) calcule os porcentuais; c) apresente os dados em uma tabela; d) algum dos candidatos obteve maioria absoluta (50% + 1)? A votação resultou em: Benetti, Alice, Alice, Clóvis, Alice, Benetti, Benetti, Benetti, Alice, Alice, Clóvis, Alice, Benetti, Benetti, Alice, Clóvis, Benetti, Benetti, Benetti, Alice.
4. São dados os tipos de sangue de 40 doadores que se apresentaram durante o mês em
um banco de sangue: B, A, O, A, A, A, B, O, B, A, A, AB, O, O, A, O, O, A, A, B, A, A, A, O, O, O, A, O, A, O, O, A, O, AB, O, O, A, AB, B, B. Coloque os dados em uma tabela de distribuição de frequências.
5. A avaliação final de 80 alunos que fizeram um curso de Estatística foi a seguinte: 25% receberam grau A; 70%, grau B e 5%, grau C. Quantos (frequência) alunos tiveram grau A?
6. Nos voos da ponte aérea Rio de Janeiro-São Paulo, o número de assentos desocu-
pados durante um mês foi agrupado nas seguintes classes: de zero até 4; de 5 até 9; de 10 até 14; de 15 até 19; 20 e mais. Com base nessa distribuição, é possível obter o número de voos em que: a) havia menos de 10 assentos desocupados? b) mais de 14 assentos desocupados? c) pelo menos cinco assentos desocupados? d) exatamente nove assentos desocupados?
7. Perguntou-se aos alunos de uma classe qual seria o animal de estimação que eles escolheriam. Os resultados foram: 19 gostariam de ter um cão, 13 um gato, 3 um papagaio, 2 um periquito, 2 uma tartaruga e um gostaria de ter um leão. Faça uma tabela de distribuição de frequências.
8. Na tabela 1.10 são dados os números de itens com defeitos ou não conformes produ-
zidos durante 25 dias, em uma linha de produção. Organize os dados em uma tabela de distribuição de frequências, mas não agrupe os dados.
estatistica-miolo7.indd 15
22/02/2011 20:46:19