Unidade I
ESTATÍSTICA APLICADA
Prof. Luiz Felix
O termo estatística Provém da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões. Foi utilizado em épocas remotas para determinar o valor dos impostos cobrados dos cidadãos e até mesmo para determinar a estratégia de uma nova batalha.
Definição Estatística é um conjunto de técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza. Exemplos de aplicações: caracterização de perfil sócio-econômico; análise de intenção de votos; levantamento de pessoas com nível universitário.
População e amostra População conjunto de todos os itens (pessoas, coisas, objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma característica. Amostra qualquer subconjunto não vazio de uma população.
Estatística descritiva Estatística descritiva é a parte da Estatística que tem por objetivo descrever os dados observados. Exemplo: Índice Nacional de Preço ao Consumidor (INPC), que envolve a sintetização dos aumentos dos produtos da cesta básica.
Estatística indutiva Estatística indutiva é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. O cálculo de probabilidade é que viabiliza a inferência estatística. Exemplo: análise do mercado financeiro visando explicar tendências das taxas de juros.
Principais fases do método estatístico Definição do problema Planejamento Coleta de dados Apuração dos dados Apresentação dos dados Análise e interpretação dos dados
Dados estatísticos Quando se trabalha com a observação, a mensuração, a análise e a interpretação de números, esses números nos conduzem a índices inflacionários, índices de desemprego, probabilidade de determinado candidato ganhar as eleições etc. Tais números serão chamados de dados estatísticos.
Dados brutos e rol Dados brutos uma sequência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo. Exemplo: idade dos meus professores: 49 63 49, 63, 34 34, 27 27. Rol uma sequência ordenada de dados brutos Exemplo: idade dos meus professores: 27, 34, 49, 63 ou 63, 49, 34, 27.
Variáveis Quantitativas Contínuas – assumem qualquer valor em um intervalo. Ex.: idade. Discretas – originam-se da contagem de itens. Ex.: quantidade de produtos produzidos por dia. Qualitativas Nominais – definem categorias. Ex.: separação por sexo. Por posto – dispõem os elementos em uma ordem de preferência. Ex.: primeiro, segundo...
Interatividade Qual das seguintes sĂŠries abaixo representa um rol? a) X: 1, 2, 3, 5, 4, 6 b) Y: 6, 5, 4, 7, 8, 9 c) Z: 1, 1 1, 1 3 3, 3 3, 5 d) K: 5, 1, 1, 3, 3 e) L: 2, 2, 7, 8, 9, 1
Notação por índices O símbolo xi (lê-se “x índice i”) irá representar qualquer um dos n valores assumidos pela variável x. (x1, x2, ..., xn). “n” é denominado índice e poderá assumir qualquer dos números entre 1, 2 3, 2, 3 4 4..., n. n NOTAÇÃO SIGMA (∑): A maioria dos processos estatísticos irá exigir o cálculo da soma de um conjunto de números. A letra maiúscula grega sigma (∑) é utilizada para representar essas somas.
Medidas de tendência central Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral, buscamos medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado conjunto de números. números As medidas mais usadas nesse sentido são as chamadas medidas de tendência central: média; mediana; moda.
Média aritmética
É um valor calculado para um grupo de dados, usado para descrevê-los. É o ponto de equilíbrio dos dados. x = ∑ xi n
xi : cada variável da amostra.
n: é o número total de observações.
Média aritmética – exemplo Calcule a média aritmética do conjunto de dados: xi = 3, 5, 8, 12, 7, 25 x = ∑ x = 3 + 5 + 8 + 12 + 7 + 25 = 60 = 10 n
6
6
Interpretação: O valor médio dos dados é 10,, ou seja, j , os valores deste conjunto j de dados concentram-se em torno do 10.
Média aritmética – exemplo Calcule a média aritmética do conjunto de dados: xi = 1, 1, 3, 5 x = ∑ x = 1 + 1 + 3 + 5 = 10 = 2,5 n
4
4
Interpretação: O valor médio dos dados é 2,5, , , ou seja, j , os valores deste conjunto j de dados concentram-se em torno do 2,5.
Média aritmética ponderada A cada valor xi deverá ser atribuído um peso wi . xp = ∑ xi . wi ∑ wi xi : cada variável da amostra. wi : cada peso da amostra.
Média aritmética ponderada – exemplo
Um aluno tirou as notas 7, 3, 6 e 5 em quatro avaliações que, respectivamente, tinham os pesos 2, 5, 1, 2. Calcule a média do aluno levando-se em conta os pesos das avaliações.
xp = ∑ xi . wi = 7.2 + 3.5 + 6.1 + 5.2 = 45 = 4,5 ∑ wi
2+5+1+2
10
Mediana
É um valor que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que estão à sua direita. É o ponto que ocupa a posição central em uma série.
Se o número de elementos do rol for ímpar, a mediana será o valor do meio.
Se o número de elementos do rol for par, a mediana será a média dos 2 valores do meio.
Podemos calcular a posição da mediana com a fórmula: posmed = (n + 1) 2
Mediana – exemplo Determinar a mediana xi = 2, 20, 12, 23, 20, 8, 12 Solução: Rol xi: 2, 8, 12, 12, 20, 20, 23 n = 7, logo: posmed = (7 + 1) = 8 = 4ª posição 2
2
A mediana é o elemento que ocupa a 4ª posição: mediana = 12
Mediana – exemplo Determinar a mediana xi = 7, 21, 13, 15, 10, 8, 9, 13 Solução: Rol xi: 7, 8, 9, 10, 13, 13, 15, 21 n = 8, logo: posmed = (8 + 1) = 9 = 4,5ª posição 2
2
Neste caso, deve-se tirar a média entre os 2 valores do meio para se obter a mediana mediana. md = 10 + 13 = 23 = 11,5 2
2
Moda
É o valor de maior frequência em um conjunto de dados.
Se o conjunto de dados possui: Uma moda unimodal Duas modas bimodal Três modas trimodal 4 ou mais modas polimodal Nenhuma moda amodal
Moda – exemplos Determinar a moda xi = 2, 8, 3, 5, 4, 5, 3, 5, 5, 1 Solução: Rol xi: 1, 2, 3, 3, 4, 5, 5, 5, 5, 8 moda = 5 unimodal Determinar a moda xi = 5, 4, 3, 3, 5, 4 Solução: Rol xi: 3, 3, 4, 4, 5, 5 não existe moda amodal
Interatividade Para o seguinte conjunto de dados xi = 5, 9, 7, 31, 21, 13, 13, 21, determinar a média aritmética simples, a mediana e a moda. a) Média = 15; mediana = 13; moda = 13 e 21 b) Média = 15; mediana = 26; moda = 13 e 21 c) Média = 14; mediana = 26; moda = 13 d) Média = 15; mediana = 13; moda = 21 e) Média = 14; mediana = 26; moda = 13 e 21
Medidas de dispersão Indicam o quanto os dados estão dispersos em torno da região central. Quanto maiores as medidas de dispersão, mais heterogêneos são os dados e, dados, e ao contrário, contrário quanto menores essas medidas, mais homogêneo o conjunto. Analisaremos as seguintes medidas de dispersão: amplitude lit d total; t t l desvio padrão; variância.
Medidas de dispersão Considere os seguintes conjuntos de valores das variáveis X, Y e Z: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5 5, 15 15, 50 50, 120 120, 160 Os 3 conjuntos apresentam a mesma média aritmética: 70. Notamos que o conjunto X é mais homogêneo que os conjuntos Y e Z.
Medidas de dispersão Quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto de dados, faz-se necessário dispor não apenas de informações relativas à média, mediana e moda. moda É preciso que se disponha de informações relativas à variabilidade (dispersão) dos números que compõem o referido conjunto de dados. Essas medidas de variabilidade ou dispersão indicam se os dados observados estão próximos ou separados uns dos outros.
Amplitude total A amplitude total, ou intervalo, de um determinado conjunto de dados é obtido pela diferença entre o maior e o menor valor nesse conjunto de números. Amplitude Total = Valor Máximo – Valor Mínimo Sendo xi: 7, 8, 9, 10, 13, 20 Amplitude Total = 20 – 7 = 13
Desvio médio A dispersão dos dados em relação à média de uma sequência pode ser avaliada através dos desvios de cada elemento da sequência em relação à média da sequência. DMédio = ∑ | xi x | n Em que n é o número de observações. Exemplo de | x | |3| = 3 | 3| = 3
Desvio médio – exemplo Para o conjunto de dados xi = 2, 8, 4, 6, calcule o desvio médio. Solução:
DMédio = ∑ | xi x | n
x = 2 + 8 + 4 + 6 = 20 = 5 4
4
DM = | 2 5 | + | 8 5 | + | 4 5 | + | 6 5 | 4 DM = | | 3| + | 3 | + | | 1| + | 1 | = 3 + 3 + 1 + 1 4 DM = 2
4
Variância e desvio padrão (população e amostra) POPULAÇÃO Variância: σ2 = ∑ (xi – x)2 n Desvio Padrão: σ = σ2 AMOSTRA Variância: S2 = ∑ (xi – x)2 n–1 Desvio Padrão: S = S2
Variância e desvio padrão (população) – exemplo Para a população xi = 4, 5, 8, 5, calcule a variância e o desvio padrão. Solução:
σ2 = ∑ (xi x)2
e
σ = σ2
n x = 4 + 5 + 8 + 5 = 22 = 5,5 55 4
4
σ2 = (4 5,5)2 + (5 5,5)2 + (8 5,5)2 + (55,5)2 4 σ2 = (1,5) ( 1 5)2 + ((0,5) 0 5)2 + (2 (2,5) 5)2 + ((0,5) 0 5)2 = 2 2,25 25 4
Desvio padrão: σ = σ2 = 2,25 = 1,5
Variância e desvio padrão (amostra) – exemplo
Para a amostra xi= 4, 5, 8, 5, calcule a variância e o desvio padrão.
Solução:
S2 = ∑ (xi x)2
e
S = S2
n–1 x = 4 + 5 + 8 + 5 = 22 = 5,5 55 4
4
S2 = (4 5,5)2 + (5 5,5)2 + (8 5,5)2 + (55,5)2 4–1 S2 = (1,5) ( 1 5)2 + (0,5) ( 0 5)2 + (2,5) (2 5)2 + (0,5) ( 0 5)2 = 9 = 3 3
Desvio padrão: S = S2 = 3 = 1,73
3
Interatividade Para a população xi = 1, 9, 3, 7, 5, calcule a variância e o desvio padrão. a) Variância = 7 e desvio padrão = 2,64 b) Variância = 8 e desvio padrão = 2,82 c) Variância = 9 e desvio padrão = 3 d) Variância = 10 e desvio padrão = 3,16 e) Variância = 11 e desvio padrão = 3,31
Distribuição de frequências A distribuição de frequências é o modo de tratamento de dados utilizado quando é grande a quantidade de dados brutos, e passamos a agrupar os dados estatísticos em subconjuntos com características semelhantes semelhantes. A distribuição de frequências é a organização de dados em classes ou intervalos, para determinar o número de observações ou a percentagem de observações de cada classe classe, chamada de frequência de classes.
Distribuição de frequências Classe: são intervalos que subdividem a amplitude total. Limites de classe: são os limites extremos de cada classe. Li é o menor valor das classes consideradas. Ls é o maior valor das classes consideradas. Amplitude de classe: é a diferença entre o limite Li e o Ls da classe e determina a amplitude das classes de uma distribuição de frequências. h = Ls – Li
Distribuição de frequências Nº de classes = 4
Li = 140
Amplitude da classe h = 10
Ls = 150
Alguns conceitos de uma distribuição de frequência Frequência relativa %: é o quociente entre a frequência absoluta da i-ésima classe com o somatório das frequências, multiplicando esse resultado por 100: fri% = fi
. 100
n Frequência acumulada: é o somatório da frequência absoluta da i-ésima classe com a frequência absoluta das classes anteriores.
Distribuição de frequências – exemplo A observação das notas de 30 alunos em uma prova mostrou os valores: 3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7; 7,4; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5; 5; 5 5,5; 5; 4 4,5; 5; 4; 7 7,5; 5; 6 6,5; 5; 5; 6; 6 6,5; 5; 6 6.
Distribuição de frequências – variável contínua Rol 2; 2,5; 3; 3,5; 4; 4; 4; 4,5; 4,5; 5; 5; 5; 5; 5,5; 5,5; 5,5; 6; 6; 6; 6,5; 6,5; 6,5; 7; 7,4; 7,5; 7,5; 8; 8,5; 9; 9,5 xi
fi
fri%
Fi
Fri%
2 |-- 4
4
13,33
4
13,33
4 |-- 6
12
40
16
53,33
6 |-| 8
10
33 34 33,34
26
86 67 86,67
8 |-- 10
4
13,33
30
100
∑
30
100
---
---
Distribuição de frequências – exemplo xi
fi
fri%
Fi
Fri%
2 |-- 4
4
13,33
4
13,33
4 |-- 6
12
40
16
53,33
6 ||-- 8
10
33,34
26
86,67
8 |-- 10
4
13,33
30
100
∑
30
100
---
---
Alunos com nota > = 4 e menor 6: 12 Alunos com nota menor que 6: 16 %Alunos com nota > = 4 e menor que 6: 40% %Alunos com nota < que 6: 53,33%
Interatividade A observação das notas de 30 alunos em uma prova mostrou os seguintes valores conforme mostrado na distribuição de frequências abaixo. Indique qual o percentual de alunos com nota menor que 8. a) 10%
Notas
fi
b) 33,34%
2 |-- 4
4
c) 26%
4 |-- 6
12
6 |-- 8
10
8 |-- 10
4
d) 86,67% e) 13,33%
ATÉ A PRÓXIMA!