Aceite para publicação em 28 de julho de 2017
publicado sob licença Creative Commons da Casa das Ciências
PROBABILIDADES E ESTATÍSTICA COM A TI-NSpire
Júlia, Roriz
Probabilidades e Estatística com a TI-NSpire
ÍNDICE
Introdução ………………………………………………………………………………………………………………………………………….... 3 PARTE I ......................................................................................................................................................... 4 ESTATÍSTICA .................................................................................................................................................. 4 FICHA Nº 1 – DADOS QUALITATIVOS - CONSTRUÇÃO DE UM GRÁFICO DE BARRAS E DE UM GRÁFICO CIRCULAR .................................................................................................................................................. 5 FICHA Nº 2 – DADOS QUANTITATIVOS DISCRETOS - CONSTRUÇÃO DE TABELAS DE FREQUENCIAS E DE UM GRÁFICO DE BARRAS ......................................................................................................................... 7 FICHA Nº 3 – MEDIDAS DE LOCALIZAÇÃO E DISPERSÃO DE UMA AMOSTRA DE DADOS ....................... 12 FICHA Nº 4 – PROPRIEDADES DA MÉDIA E DO DESVIO PADRÃO DE UMA AMOSTRA ........................... 16 FICHA Nº 5 – COMPARAÇÃO DAS CLASSIFICAÇÕES DE DUAS TURMAS ................................................. 18 FICHA Nº 6 – PERCENTIS ......................................................................................................................... 20 FICHA Nº 7 – DADOS AGRUPADOS EM CLASSES .................................................................................... 23 FICHA Nº 8 – PERCENTIS PARA DADOS AGRUPADOS ............................................................................. 26 FICHA Nº 9 – DADOS BIVARIADOS .......................................................................................................... 28 PARTE II ...................................................................................................................................................... 33 PROBABILIDADES ........................................................................................................................................ 33 FICHA Nº 1 – A DISTRIBUIÇÃO BINOMIAL .............................................................................................. 34 FICHA Nº 2 – A DISTRIBUIÇÃO NORMAL ................................................................................................ 36 FICHA Nº 3 – O TEOREMA DO LIMITE CENTRAL ..................................................................................... 40 FICHA Nº 4 – INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL ........................................... 44 FICHA Nº 5 – DETERMINAÇÃO DO TAMANHO DA AMOSTRA ................................................................ 48 FICHA Nº 6 – INTERVALO DE CONFIANÇA PARA A MÉDIA – AMOSTRAS PEQUENAS (n < 30) ............... 51 FICHA Nº 7 – INTERVALO DE CONFIANÇA PARA UMA PROPORÇÃO POPULACIONAL ........................... 54 FICHA Nº 8 – ALGUNS ITENS DE PROVAS ESCRITAS DE MACS................................................................ 57 Bibliografia e Webgrafia fundamental ................................................................................................... 58
2
Probabilidades e Estatística com a TI-NSpire
INTRODUÇÃO Este documento tem por objetivo apresentar conceitos probabilísticos e estatísticos a nível de ensino secundário, recorrendo á utilização de máquinas de calcular. É formado por duas partes, a parte I, Estatística e a parte II, Probabilidades. Cada uma destas partes é constituída por um conjunto de fichas de trabalho, em cada uma das quais são explorados conceito diferentes. Segue uma lógica de construção sequencial, partindo de conceitos e utilização de comandos da calculadora gráfica bastante básicos até conceitos e sequências de comandos mais avançados. Permite explorações diversificadas em função dos conhecimentos prévios de cada utilizador. Foi concebido para uma exploração essencialmente autónoma, tendo uma primeira versão sido já testada num curso de formação de professores. Este recurso poderá ser um elemento de consulta para alunos do ensino secundário de Matemática A, Matemática B, Matemática Aplicada às Ciências Sociais e Cursos Profissionais. Foi realizado tendo em conta o novo programa de Estatística de Matemática A e a última versão da calculadora gráfica, TI-NSpire, versão 4.4.0.#.
3
Probabilidades e Estatística com a TI-NSpire
PARTE I
ESTATÍSTICA
4
Probabilidades e EstatĂstica com a TI-NSpire
FICHA NÂş 1 â&#x20AC;&#x201C; DADOS QUALITATIVOS - CONSTRUĂ&#x2021;Ă&#x192;O DE UM GRĂ FICO DE BARRAS E DE UM GRĂ FICO CIRCULAR ExercĂcio: Os alunos do 10Âş ano de uma escola foram inquiridos sobre o seu tipo de mĂşsica preferida. Os resultados obtidos encontram-se resumidos na seguinte tabela de frequĂŞncias absolutas: Estilo musical đ?&#x2018;&#x203A;đ?&#x2018;&#x2013;
Rock 1
Hip-Hop 30
Techno 22
Reggae 25
Pop 5
Construa um gråfico de barras e um gråfico circular que represente esta distribuição de dados qualitativos.
Resolução: Abrir uma pĂĄgina â&#x20AC;&#x153;Adicionar Listas e Folha de CĂĄlculoâ&#x20AC;? No cabeçalho das listas escreva o nome de cada uma. Introduza as categorias da variĂĄvel na primeira lista (est_musical) e as frequĂŞncias na segunda (n_alunos). Desta forma, em cada coluna, define-se uma variĂĄvel e os dados introduzidos sĂŁo os valores que ela toma, podendo assim utilizar-se noutras aplicaçþes, como se verĂĄ a seguir.
Abrir uma pĂĄgina, â&#x20AC;&#x153;Dados e EstatĂsticaâ&#x20AC;? Adicione agora outra pĂĄgina ao documento, pĂĄgina 1.2.
5
Probabilidades e Estatística com a TI-NSpire
Para se transformar o último ecrã num gráfico de barras é necessário dar instruções à calculadora. No menu de contexto escolha 2: Adicionar variável X com lista de resumo.
Observe no último écran que, se passar o cursor por cada barra, visualiza a informação sobre as frequências absolutas e relativas correspondentes. O tipo de música preferida pelos alunos em causa é o hip-hop, isto é, a moda da distribuição é o hip-hop. Obtenha agora um gráfico circular como o que se apresenta a seguir.
6
Probabilidades e Estatística com a TI-NSpire
FICHA Nº 2 – DADOS QUANTITATIVOS DISCRETOS - CONSTRUÇÃO DE TABELAS DE FREQUENCIAS E DE UM GRÁFICO DE BARRAS
Exercício: Para conhecer os hábitos de leitura dos seus alunos, o professor de português inquiriu-os sobre o número de livros que leram durante o último ano. Os resultados obtidos são apresentados pela ordem em que foram recolhidos: 2 2 1 3 3
1 3 2 4 3
3 3 3 1 3
1 2 1 2 3
2 4 2 2 4
Construa tabelas de frequências absolutas, relativas e relativas acumuladas que resumam estes dados. Obtenha o gráfico de barras da distribuição de dados.
Resolução:
Abrir uma página de “Listas e Folha de Cálculo”
7
Probabilidades e EstatĂstica com a TI-NSpire
Coloque o cursor em cima do eixo das abcissas e escolha a opção 1, Forçar categórico X, visto que o número de livros Ê um número inteiro.
Com este grĂĄfico de pontos jĂĄ se pode construir facilmente uma tabela de frequĂŞncias absolutas. NÂş de livros lidos 1 2 3 4 Total
đ?&#x2018;&#x203A;đ?&#x2018;&#x2013; 5 8 9 3 25
Obtenha as correspondentes tabelas de frequĂŞncias relativas e relativas acumuladas. Com o cursor na segunda linha, escreva a fĂłrmula que nos dĂĄ a frequĂŞncia relativa:
8
Probabilidades e Estatística com a TI-NSpire
Ou na forma decimal, em “Modo de cálculo” escolha “Aproximado” (ou ainda Menu, Número, Converter para decimal):
Por consulta do catálogo, , obtém-se a função “cumulativeSum” e as frequências relativas acumuladas vão aparecer na coluna D:
9
Probabilidades e Estatística com a TI-NSpire
A percentagem de alunos que leu menos de 3 livros durante o último ano é de 52% e mais de 3 livros é de apenas 12%, aproximadamente.
Para construir um gráfico de barras que corresponda aos dados em estudo, após accionar a tecla “menu”, siga a sequência de ecrãs que se apresenta a seguir:
10
Probabilidades e Estatística com a TI-NSpire
É claro que não era o histograma que pretendíamos obter pois os dados não estão agrupados em classes. Mas, através da tecla de menu, poderemos manipular este último ecrã de forma a que ele tenha a configuração de um gráfico de barras.
Nota: O comprimento de cada barra é diretamente proporcional à frequência que lhe corresponde.
11
Probabilidades e Estatística com a TI-NSpire
A variável n_livros assume valores inteiros, pelo que:
FICHA Nº 3 – MEDIDAS DE LOCALIZAÇÃO E DISPERSÃO DE UMA AMOSTRA DE DADOS Exercício: Selecionaram-se aleatoriamente oito alunos do 10ºC, aos quais se perguntou as notas obtidas no último teste de matemática. As classificações foram as seguintes (escala de 0 a 20): 12
17
12
11
12
11
10
13
Calcule a média, moda, mediana, quartis e desvio padrão.
Resolução: Para encontrar as medidas estatísticas dos dados introduzidos, selecione uma célula (por exemplo, a “B1”) e utilize a tecla menu com a seguinte sequência de passos:
12
Probabilidades e EstatĂstica com a TI-NSpire
Se criarmos uma pĂĄgina de calculadora, 1.2, vĂŞ-se melhor:
ď&#x201A;ˇ
Repare no primeiro indicador numĂŠrico que resume a amostra considerada, a mĂŠdia, đ?&#x2018;ĽĚ&#x2026; =
.
â&#x2C6;&#x2018;đ?&#x2018;&#x203A;đ?&#x2018;&#x2013;=1 đ?&#x2018;Ľđ?&#x2018;&#x2013; đ?&#x2018;&#x203A;
Observe os valores da amostra e repare que o valor 17 ĂŠ um valor que se distancia do conjunto de dados, ĂŠ um outlier (valor extremo). O valor da mĂŠdia da amostra, đ?&#x2018;ĽĚ&#x2026; = 12.25, ĂŠ influenciado pelo valor 17. O centro de gravidade desta amostra ĂŠ o ponto da reta numĂŠrica de abcissa đ?&#x2018;ĽĚ&#x2026; = 12.25, que estĂĄ deslocado para a direita. Diz-se que a mĂŠdia ĂŠ uma medida de localização pouco resistente.
13
Probabilidades e EstatĂstica com a TI-NSpire
ď&#x201A;ˇ
O segundo indicador dĂĄ-nos o somatĂłrio dos đ?&#x2018;&#x203A; valores da amostra, â&#x2C6;&#x2018;đ?&#x2018;&#x203A;đ?&#x2018;&#x2013;=1 đ?&#x2018;Ľđ?&#x2018;&#x2013; = đ?&#x2018;&#x203A;đ?&#x2018;ĽĚ&#x2026;
ď&#x201A;ˇ
O terceiro indicador dĂĄ-nos a soma dos quadrados dos đ?&#x2018;&#x203A; valores da amostra, â&#x2C6;&#x2018;đ?&#x2018;&#x203A;đ?&#x2018;&#x2013;=1 đ?&#x2018;Ľđ?&#x2018;&#x2013;2
ď&#x201A;ˇ
O Ăşltimo indicador, đ?&#x2018;&#x2020;đ?&#x2018;&#x2020;đ?&#x2018;Ľ , representa a soma dos quadrados dos desvios dos valores da amostra em relação Ă mĂŠdia: đ?&#x2018;&#x203A;
đ?&#x2018;&#x203A;
đ?&#x2018;&#x2020;đ?&#x2018;&#x2020;đ?&#x2018;Ľ = â&#x2C6;&#x2018;(đ?&#x2018;Ľđ?&#x2018;&#x2013; â&#x2C6;&#x2019; đ?&#x2018;ĽĚ&#x2026; )2 = â&#x2C6;&#x2018; đ?&#x2018;Ľđ?&#x2018;&#x2013;2 â&#x2C6;&#x2019; đ?&#x2018;&#x203A;đ?&#x2018;ĽĚ&#x2026; 2 đ?&#x2018;&#x2013;=1
đ?&#x2018;&#x2013;=1
Dada uma amostra de dimensĂŁo đ?&#x2018;&#x203A;, đ?&#x2018;&#x2020;đ?&#x2018;&#x2020;đ?&#x2018;Ľ tem apenas đ?&#x2018;&#x203A; â&#x2C6;&#x2019; 1 graus de liberdade, pois a parcela restante fica determinada pelo facto de a soma dos desvios ser nula.
ď&#x201A;ˇ
indica-nos o desvio padrĂŁo amostral, đ?&#x2018; đ?&#x2018;Ľ = â&#x2C6;&#x161;
đ?&#x2018;&#x2020;đ?&#x2018;&#x2020;đ?&#x2018;Ľ
đ?&#x2018;&#x203A;â&#x2C6;&#x2019;1
Relacione o denominador da fração com o nĂşmero de graus de liberdade de đ?&#x2018;&#x2020;đ?&#x2018;&#x2020;đ?&#x2018;Ľ .
đ?&#x2018;&#x2020;đ?&#x2018;&#x2020;đ?&#x2018;Ľ
ď&#x201A;ˇ
indica-nos o desvio padrĂŁo populacional, đ?&#x2018; đ?&#x2018;Ľ = â&#x2C6;&#x161;
đ?&#x2018;&#x203A;
;
Falaremos deste indicador na segunda parte. ď&#x201A;ˇ
Os outros indicadores dĂŁo-nos: o o o
ď&#x201A;ˇ
os valores mĂnimo e mĂĄximo, 10 e 17, a mediana ou segundo quartil ou percentil 50, 12 (50% das classificaçþes sĂŁo inferiores a 12) e os quartis, ď&#x201A;§ Q1 ou percentil 25, 11 (25% das classificaçþes sĂŁo inferiores a 11 e 75% sĂŁo superiores a 11). ď&#x201A;§ Q3 ou percentil 75, 12.5 (75% das classificaçþes sĂŁo inferiores a 11 e 25% sĂŁo superiores a 11).
A determinação da moda Ê imediata por leitura direta dos dados, 12.
14
Probabilidades e EstatĂstica com a TI-NSpire
Construção da caixa dos bigodes (Box-Plot)
Para construir a caixa dos bigodes, utilize a tecla menu seguido de 1: Tipo de grĂĄfico e 2: Diagrama de extremos e quartis.
Nota: Na calculadora e incorrectamente, ĂŠ usado o mesmo nome para as duas representaçþes grĂĄficas, diagrama de extremos e quartis e caixa dos bigodes. Embora anĂĄlogas, sĂŁo diferentes. Para obter a primeira, temos de registar o valor mĂnimo e mĂĄximo da amostra, para alĂŠm da mediana e do primeiro e terceiro quartis. Para a segunda, alĂŠm da caixa cujo comprimento corresponde Ă amplitude interquartis, temos dois â&#x20AC;&#x153;bigodesâ&#x20AC;? correspondentes ao valor adjacente: - superior, maior valor da amostra que ĂŠ menor ou igual a đ?&#x2018;&#x201E;3 + 1.5 Ă&#x2014; (đ?&#x2018;&#x201E;3 - đ?&#x2018;&#x201E;1 ), e - inferior, menor valor da amostra que ĂŠ maior ou igual a đ?&#x2018;&#x201E;1 â&#x2C6;&#x2019; 1.5 Ă&#x2014; (đ?&#x2018;&#x201E;3 - đ?&#x2018;&#x201E;1 ). Diz-se que um valor ĂŠ um outlier quando nĂŁo pertence ao intervalo cujos extremos sĂŁo os dois valores adjacentes referidos. Vamos verificar que a amostra considerada tem um outlier, 17. De facto, đ?&#x2018;&#x201E;3 + 1.5 Ă&#x2014; (đ?&#x2018;&#x201E;3 - đ?&#x2018;&#x201E;1 ) = 12.5 + 1.5 Ă&#x2014; (12.5 â&#x2C6;&#x2019; 11) = 14.75 đ?&#x2018;&#x201E;1 â&#x2C6;&#x2019; 1.5 Ă&#x2014; (đ?&#x2018;&#x201E;3 - đ?&#x2018;&#x201E;1 ) = 11 â&#x2C6;&#x2019; 1.5 Ă&#x2014; (12.5 â&#x2C6;&#x2019; 11) = 8.75 O valor adjacente superior ĂŠ 13 â&#x2030;¤ 14.75 e o valor adjacente inferior ĂŠ 10 â&#x2030;Ľ 8.75. Assim, 17 ĂŠ um outlier. Ainda por observação do diagrama, pode afirmar-se que na parte central dos dados existe uma assimetria negativa, isto ĂŠ, os dados sĂŁo enviesados para a direita. A mĂŠdia ĂŠ superior Ă mediana (12,5 > 12). No caso de a mĂŠdia e a mediana serem iguais terĂamos um conjunto de dados simĂŠtricos. 15
Probabilidades e Estatística com a TI-NSpire
ATIVIDADE – Considerando agora as classificações do Bruno, que estão organizadas na seguinte tabela de frequências, determine as medidas de localização e dispersão já estudadas.
Xi 11 12 14 Total
fi 2 3 1 n=6
FICHA Nº 4 – PROPRIEDADES DA MÉDIA E DO DESVIO PADRÃO DE UMA AMOSTRA Exercício: Vinte alunos do 10.º ano da professora Rita obtiveram as classificações seguintes, numa escala de 0 a 100, no último teste de Matemática: 24
77
72
90
52
75
35
51
24
52
56
52
85
80
58
96
77
80
70
94
1.
Obtenha as medidas de localização e dispersão já estudadas para este conjunto de dados.
2.
A professora contava com notas melhores pois o teste era fácil. Obtenha as medidas de localização e dispersão para as classificações no caso de se adicionar 5 pontos a cada classificação. Compare com os resultados de 1.
3.
A professora pretende converter as notas dos testes numa escala de 0 a 200. Como deve fazer?
4.
Como a professora pretende a escala de 0 a 20, dividiu todos os dados por 10. Obtenha as medidas de localização e dispersão para as novas classificações em 3. e 4. e compare com as anteriores.
Resolução:
16
Probabilidades e Estatística com a TI-NSpire
Compare as páginas 1.2, 1.3, 1.4 e 1.5, consulte o seu manual e tire conclusões.
Vejamos ainda a seguinte propriedade da média:
A soma dos desvios dos valores observados em relação à média é nula. Obtenha na coluna B os desvios em relação à média - diferença entre os valores da variável “c_t” e a média.
17
Probabilidades e Estatística com a TI-NSpire
Descubra qual a medida de dispersão calculada nos dois écrans seguintes (o valor 21.5626 já foi encontrado antes para estes mesmos dados):
FICHA Nº 5 – COMPARAÇÃO DAS CLASSIFICAÇÕES DE DUAS TURMAS Exercício: Nos quadros que se seguem, são apresentadas as classificações no exame de matemática dos alunos das turmas A e B, respetivamente, da Escola Secundária Beta: 12 10 8 6 10
12 10 10 10 8
14 12 8 10 10
12 14 18 10 8
14 10 6 18 16
12 6 8 10
12 10 6 12
14 10 18 12
6 4 8 12
20 10 18 14
Diga qual das turmas tem a maior média das classificações. Determine a mediana e o desvio padrão das duas amostras. Indique, justificando, em que turma as classificações estão mais dispersas. Construa, no mesmo ecrã, os diagramas de extremos e quartis correspondentes a estes dados.
18
Probabilidades e Estatística com a TI-NSpire
Resolução:
Os dois últimos écrans respondem às três primeiras questões.
Siga agora as imagens seguintes para respondermos à última questão.
19
Probabilidades e Estatística com a TI-NSpire
No último ecrã podemos ver o diagrama de extremos e quartis correspondente aos dados relativos à turma A. Construamos o outro diagrama.
Repare que, embora as classificações médias das turmas sejam aproximadamente iguais a 11, o desvio padrão da turma A é inferior ao desvio padrão da turma B. Consultando ainda os diagramas de extremos e quartis vê-se que os dados estão mais dispersos na turma B do que na turma A.
FICHA Nº 6 – PERCENTIS Exercício: Os seguintes dados referem-se à duração, em minutos, do percurso casa-escola realizado por 32 alunos da Escola Secundária Beta (amostra aleatória):
12 62 20 5
21 65 37 32
16 35 29 19
36 44 18 18
11 41 7 6
17 12 8 13
9 49 22 23
7 45 15 44
Calcule o a mediana da amostra; o o percentil 15.
Determine, dos 30% dos percursos com maior duração, aquele que tem menor duração.
A que percentil pertence o percurso com 36 minutos.
20
Probabilidades e EstatĂstica com a TI-NSpire
Resolução:
Começa-se por ordenar os dados.
ď&#x201A;ˇ
Como
50Ă&#x2014;32 100
= 16 ĂŠ um nĂşmero inteiro entĂŁo đ?&#x2018;ˇđ?&#x;&#x201C;đ?&#x;&#x17D; =
đ?&#x2018;Ľ(16) +đ?&#x2018;Ľ(17) 2
=
19+20 2
= 19.5.
Repare-se que no Êcran acima estão os valores que ocupam as posiçþes 16 e 17, os valores 19 e 20.
Como
15Ă&#x2014;32 100
= 4.8 nĂŁo ĂŠ um nĂşmero inteiro entĂŁo đ?&#x2018;ˇđ?&#x;?đ?&#x;&#x201C; ĂŠ o valor de ordem [4.8] + 1 = 4 + 1 = 5.
Consulte o Êcran da pågina anterior e verifique que o valor que ocupa a 5ª posição Ê o 8.
21
Probabilidades e EstatĂstica com a TI-NSpire
Assim, đ?&#x2018;&#x192;15 = đ?&#x2018;Ľ(5) = 8, o que significa que pelo menos 15% dos tempos de duração do percurso casaescola sĂŁo inferiores ou iguais a 8 minutos.
ď&#x201A;ˇ
đ?&#x2018;&#x192;70 =?
Como
70Ă&#x2014;32 100
= 22.4 nĂŁo ĂŠ um nĂşmero inteiro entĂŁo đ?&#x2018;&#x192;70 ĂŠ o valor de ordem [22.4] + 1 = 22 + 1 = 23.
Assim, đ?&#x2018;&#x192;70 = đ?&#x2018;Ľ(23) = 35. Dos 30% percursos com maior duração, o de menor duração tem 35 minutos.
ď&#x201A;ˇ
Sabe-se que đ?&#x2018;Ľ(24) = 36 (verifique na lista t que o vigĂŠsimo quarto valor ĂŠ 36).
SerĂĄ que existe đ?&#x2018;&#x192;đ?&#x2018;&#x2DC; = đ?&#x2018;Ľ(24) ? Para tal, ĂŠ necessĂĄrio que 23 <
32đ?&#x2018;&#x2DC; 100
32đ?&#x2018;&#x2DC; 100
seja nĂŁo inteiro e [
32đ?&#x2018;&#x2DC; 100
] + 1 = 24, isto ĂŠ,
< 24 â&#x;ş 71.875 < đ?&#x2018;&#x2DC; < 75
O tempo de 36 minutos pode pertencer ao percentil 72, 73 ou 74.
22
Probabilidades e Estatística com a TI-NSpire
FICHA Nº 7 – DADOS AGRUPADOS EM CLASSES
Exercício: Apresenta-se no quadro seguinte o número de horas de sol registadas no mês de janeiro de 2012 em 50 estações meteorológicas: 83 71 155 173 186 1.
82 76 118 149 187
78 75 150 80 186
72 83 129 131 141
107 72 119 121 212
107 126 148 110 186
93 102 181 200 199
72 77 167 162 198
85 112 156 214 219
98 99 180 176 151
Agrupe os dados em classes de amplitude 20, considerando o extremo inferior da primeira classe igual a 70.
2.
Indique a classe modal.
3.
Construa a correspondente tabela de frequências absolutas simples e acumuladas.
Resolução:
1.
Os dois ecrãs seguintes indicam que estamos a criar um novo documento em cuja primeira página, Listas e Folha de Cálculo, introduzimos os dados (coluna A).
23
Probabilidades e Estatística com a TI-NSpire
Este histograma não obedece às condições do enunciado. Temos então de o configurar de acordo com o que é pedido.
24
Probabilidades e Estatística com a TI-NSpire
Nota: A área de cada retângulo (barra) é diretamente proporcional à frequência das respetivas classes. Assim, quando a amplitude das classes é constante, o valor da frequência corresponde à altura do retângulo.
2.
A classe modal é [70 , 90[.
3.
Explorando o ecrã com o cursor é fácil construirmos uma tabela de frequências absolutas e, a partir daí, abrir uma coluna para as frequências absolutas acumuladas.
Utilize a tecla
para inserir a variável da coluna B (n_est_meteorol).
25
Probabilidades e Estatística com a TI-NSpire
FICHA Nº 8 – PERCENTIS PARA DADOS AGRUPADOS Exercício: Para estudar os percentis do peso, em kg, de 35 crianças do sexo masculino com 20 meses de idade, elaborou-se a tabela de frequências seguinte: Peso (kg) [8, 10[ [10, 12[ [12, 14[ [14, 16[ [16, 18[
Determine os percentis 10 e 75.
Identifique o percentil a que pertence o dado 12.4
N.º de crianças 9 9 6 10 1
Resolução: Após a introdução dos dados obtém-se o histograma:
Com o cursor na variável do eixo Ox, neste caso, pesos, no menu contexto, faça “Adicionar variável X com lista de resumo”.
26
Probabilidades e EstatĂstica com a TI-NSpire
Nota informativa: O percentil de ordem k, đ?&#x2018;ˇđ?&#x2019;&#x152; , ĂŠ a abcissa do ponto do eixo Ox, para o qual a ĂĄrea do histograma Ă sua esquerda corresponde a đ?&#x2019;&#x152;% da ĂĄrea total do histograma. A ĂĄrea total do histograma ĂŠ: 2 Ă&#x2014; 9 + 2 Ă&#x2014; 9 + 2 Ă&#x2014; 6 + 2 Ă&#x2014; 10 + 2 Ă&#x2014; 1 = 35 Ă&#x2014; 2 = 70 Consulte os histogramas das figuras anteriores e: ď&#x201A;ˇ
Como
10Ă&#x2014;70 100
= 7 , a ĂĄrea 7 ĂŠ atingida no 1Âş retângulo, pelo que đ?&#x2018;&#x192;10 â&#x2C6;&#x2C6; [8,10[.
(đ?&#x2018;&#x192;10 â&#x2C6;&#x2019; 8) Ă&#x2014; 9 = 7 â&#x;ş đ?&#x2018;&#x192;10 â&#x2030;&#x2026; 8.778
Para calcular đ?&#x2018;&#x192;75 , temos
75Ă&#x2014;70 100
= 52.5 . A soma das åreas dos primeiros três retângulos Ê igual a
(9 + 9 + 6) Ă&#x2014; 2 = 48 , logo, đ?&#x2018;&#x192;75 â&#x2C6;&#x2C6; [14,16[. (đ?&#x2018;&#x192;75 â&#x2C6;&#x2019; 14) Ă&#x2014; 10 = 52.5 â&#x;ş đ?&#x2018;&#x192;75 â&#x2030;&#x2026; 14.45 Assim, pelo menos 75% dos pesos sĂŁo inferiores ou iguais a 14.45 kg ou, no mĂĄximo 25% dos pesos ĂŠ superior a 14. 45 kg.
ď&#x201A;ˇ
Para determinar o percentil correspondente ao peso de 12.4 kg, calcula-se a percentagem da ĂĄrea acumulada do histograma, Ă esquerda do ponto do eixo horizontal 12.4:
(9+9)Ă&#x2014;2+6Ă&#x2014;0.4 70
Ă&#x2014; 100 â&#x2030;&#x2026; 55 .
Logo o valor 12.4 pertence ao percentil 55.
27
Probabilidades e EstatĂstica com a TI-NSpire
FICHA NÂş 9 â&#x20AC;&#x201C; DADOS BIVARIADOS
ExercĂcio: No quadro seguinte estĂŁo registadas as classificaçþes (escala de 0 a 20) de 16 alunos de uma turma Ă s disciplinas de matemĂĄtica e fĂsica. MatemĂĄtica FĂsica ď&#x201A;ˇ ď&#x201A;ˇ ď&#x201A;ˇ ď&#x201A;ˇ ď&#x201A;ˇ
7 7
10 10
11 10
11 12
12 14
16 17
17 15
18 16
10 9
8 8
9 10
10 11
15 14
12 12
13 11
14 13
Calcule as mĂŠdias das classificaçþes de MatemĂĄtica e de FĂsica, destes alunos. Construa um diagrama de dispersĂŁo para estes dados e tire conclusĂľes sobre a intensidade da eventual correlação linear entre as duas variĂĄveis. Calcule o coeficiente de correlação linear. Obtenha a reta de regressĂŁo linear que melhor se ajusta a estes dados. Se um aluno obtiver 5 a MatemĂĄtica, qual o valor previsto da sua classificação a FĂsica?
Resolução:
Vamos considerar a variĂĄvel MatemĂĄtica como variĂĄvel explicativa (variĂĄvel independente đ?&#x2018;Ľ) e a variĂĄvel FĂsica como variĂĄvel resposta (variĂĄvel dependente đ?&#x2018;Ś). Depois de introduzir os dados, selecione as duas colunas e escolha no MENU as opçþes EstatĂstica, CĂĄlculos estatĂsticos e EstatĂsticas de duas variĂĄveis:
28
Probabilidades e Estatística com a TI-NSpire
Assim, as classificação médias de Matemática e Física são aproximadamente de 12 valores, valores aproximados por excesso para a primeira e por defeito para a segunda.
Para obter o diagrama de dispersão ou nuvem de pontos e a reta dos mínimos quadrados:
29
Probabilidades e EstatĂstica com a TI-NSpire ď&#x201A;ˇ
Verifique que o centro de gravidade (đ?&#x2018;ĽĚ&#x2026; , đ?&#x2018;ŚĚ&#x2026;) â&#x2030;&#x2026; (12,063 ; 11,813) pertence Ă reta dos mĂnimos quadrados (f1(12.0625)=11.8125, aproximação com 4 casas decimais).
Adicione agora outra pågina ao documento, e faça ENTER em Stat.results:
Por observação das figuras anteriores, podem tirar-se as seguintes conclusþes para os dados observados:
ď&#x201A;ˇ
O coeficiente de correlação linear ĂŠ r â&#x2030;&#x2026; 0,923.
Observando o diagrama de dispersĂŁo e o valor de r que ĂŠ prĂłximo de 1, podemos dizer que existe uma forte correlação linear entre as classificaçþes das duas disciplinas. Repare-se ainda que r ĂŠ positivo, pelo que que, em geral, Ă medida que as classificaçþes de MatemĂĄtica aumentam tambĂŠm aumentam as classificaçþes de FĂsica.
ď&#x201A;ˇ
O coeficiente de determinação ĂŠ đ?&#x2018;&#x; 2 â&#x2030;&#x2026; 0,853.
Este valor significa que, cerca de 85% da variação total das classificaçþes em FĂsica pode ser explicada pelas classificaçþes em MatemĂĄtica.
ď&#x201A;ˇ
A equação da reta de regressĂŁo linear ĂŠ: y ď&#x20AC;˝ 0,821ď&#x192;&#x2014; x ď&#x20AC;Ť 1,910 .
Pelo exposto, faz sentido prever o valor da variĂĄvel resposta (variĂĄvel dependente đ?&#x2018;Ś) em função da variĂĄvel explicativa (variĂĄvel independente đ?&#x2018;Ľ), atravĂŠs deste modelo linear, pelo que: ď&#x201A;ˇ
PrevĂŞ-se que um aluno com 5 a MatemĂĄtica venha a obter cerca de 6 valores a FĂsica (f1(5)â&#x2030;&#x2026; 6.015).
30
Probabilidades e Estatística com a TI-NSpire Nota Informativa 1 – Intervalo de previsão (com 95% de confiança) para os valores de Y. É muito importante poder determinar a margem de incerteza numa previsão. Um intervalo de previsão para os valores de Y, a partir de um dado valor de X, obtém-se à custa do chamado erro padrão da estimativa que se define em função do coeficiente de correlação e do desvio-padrão dos valores da variável Y. Assim, o erro padrão de estimativa do valor y, a partir do valor x , é dado pela expressão:
E sy 1 r 2 Desta forma, ao prever-se um valor de y com um erro padrão de E, podemos afirmar que o intervalo y 2 E ; y 2 E contém o verdadeiro valor de y, com um grau de confiança de 0.95. Por exemplo, em relação à questão anterior, estamos 95% seguros que um aluno com 5 a matemática, venha a obter uma classificação a física compreendida entre
6 2 2.86 1 0.85
e
6 2 2.86 1 0.85 , ou seja, entre 3,78 e 8,22. Nota Informativa 2 – Ainda relativamente ao exercício anterior, verifique que a soma dos desvios verticais de cada um dos pontos em relação à reta de equação y 0,821 x 1,910 é zero propriedade da reta dos mínimos quadrados. Na coluna C obtenha os resíduos - diferença entre os valores da variável “física” e os valores dados pela equação y 0,821 x 1,910 .
31
Probabilidades e Estatística com a TI-NSpire
Prova-se que a reta cuja soma dos quadrados dos desvios é mínima é a reta dos mínimos quadrados. Com o cursor em cima da reta, obtenha o seguinte écran:
Neste caso, a soma dos quadrados dos desvios é aproximadamente 18.030, valor mínimo, pois a reta que estamos a considerar é a reta dos mínimos quadrados. Na parte inferior do último écran encontra-se representado o gráfico dos resíduos.
Atividade: O Sr. Silva aquece a sua casa com gás natural. A quantidade de gás utilizada depende da temperatura exterior e o Sr. Silva pretende fazer um estudo dos gastos durante os 9 meses em que se observam menores temperaturas, para poder estabelecer uma previsão para os gastos em função da temperatura exterior. Na tabela junta estão registadas as temperaturas médias observadas em cada um dos meses (em graus Celsius) e o respetivo volume de gás despendido pelo Sr. Silva (em metros cúbicos). mês temperatura Volume de gás 1. 2. 3. 4. 5.
out 16,1 0,01
nov 12,4 0,10
dez 10,3 0,24
jan 8,9 0,26
fev 10,1 0,19
mar 12,8 0,09
abr 13,2 0,05
maio 15,9 0,03
jun 16,4 0,01
Qual deve ser a variável explicativa e a variável resposta? Represente os dados num referencial ortogonal e diga se é razoável a existência de uma relação linear entre estas duas variáveis. Calcule a média dos valores de cada uma das amostras representadas. Apresente os resultados com arredondamento às décimas. Determine a equação reduzida da reta dos mínimos quadrados. Determine qual o consumo esperado para um mês em que a temperatura média seja de 7℃ .
32
Probabilidades e EstatÃstica com a TI-NSpire
PARTE II
PROBABILIDADES
33
Probabilidades e EstatĂstica com a TI-NSpire
FICHA NÂş 1 â&#x20AC;&#x201C; A DISTRIBUIĂ&#x2021;Ă&#x192;O BINOMIAL Sabemos que se X ĂŠ uma variĂĄvel aleatĂłria com distribuição binomial de parâmetros đ?&#x2018;&#x203A;đ?&#x153;&#x2013;â&#x201E;&#x2022; e đ?&#x2018;? â&#x2C6;&#x2C6; ]0,1[ sĂŁo vĂĄlidas as afirmaçþes seguintes: ď&#x201A;ˇ ď&#x201A;ˇ
Os valores que a variĂĄvel pode assumir sĂŁo 0, 1, 2, â&#x20AC;Ś , n. A probabilidade de X assumir cada um desses valores obtĂŠm-se atravĂŠs da expressĂŁo
p( X ď&#x20AC;˝ k ) ď&#x20AC;˝ Ckn ď&#x192;&#x2014; p k ď&#x192;&#x2014; (1 ď&#x20AC; p) nď&#x20AC;k , para k ď&#x20AC;˝ 0, 1, ..., n ď&#x201A;ˇ
O valor mĂŠdio (valor esperado) da variĂĄvel ĂŠ dado por ď X ď&#x20AC;˝ n ď&#x192;&#x2014; p .
ď&#x201A;ˇ
O desvio-padrĂŁo da variĂĄvel ĂŠ dado pela expressĂŁo
ď ł X ď&#x20AC;˝ n ď&#x192;&#x2014; p ď&#x192;&#x2014; (1 ď&#x20AC; p) .
ExercĂcio: A probabilidade de nascer uma menina na maternidade da cidade Virtus ĂŠ de 0,51 (resultado obtido num estudo feito na maternidade no presente ano civil). Pretende-se estudar o nĂşmero de meninas que vĂŁo nascer nos prĂłximos 30 nascimentos. Determine a probabilidade de nascerem: 1. 2. 3. 4.
Exatamente cinco meninas. No måximo sete meninas. Pelo menos quatro meninas. Determine a distribuição de probabilidade da variåvel em estudo.
Resolução: A variĂĄvel aleatĂłria đ?&#x2018;&#x2039;:â&#x20AC;?nĂşmero de meninas que vĂŁo nascer nos prĂłximos trinta nascimentosâ&#x20AC;? ĂŠ uma variĂĄvel com distribuição binomial de parâmetros đ?&#x2018;&#x203A; = 30 e đ?&#x2018;? = 0.51. 1.
Pretende-se obter a probabilidade da variĂĄvel assumir o valor 5.
34
Probabilidades e EstatĂstica com a TI-NSpire
đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; = 5) â&#x2030;&#x2026; 0.000088 .
Para responder a 2 e 3:
đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; < 7) = đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; = 1) + đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; = 2) + â&#x2039;Ż + đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; = 6) â&#x2030;&#x2026; 0.001859 đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; â&#x2030;Ľ 4) = 1 â&#x2C6;&#x2019; đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; < 4) â&#x2030;&#x2026; 0.999997
Para resolver 4, vamos proceder do seguinte modo:
35
Probabilidades e EstatĂstica com a TI-NSpire
Nota: Como o modelo binomial ĂŠ um modelo discreto, o termo â&#x20AC;&#x153;função densidade de probabilidadeâ&#x20AC;?, que aparece na calculadora, deveria ser substituĂdo por â&#x20AC;&#x153;função de probabilidadeâ&#x20AC;?, jĂĄ que o primeiro se refere Ă lei de uma variĂĄvel contĂnua.
FICHA NÂş 2 â&#x20AC;&#x201C; A DISTRIBUIĂ&#x2021;Ă&#x192;O NORMAL Sabe-se que a função densidade de probabilidade de uma variĂĄvel aleatĂłria đ?&#x2018;&#x2039; com distribuição normal, de parâmetros đ?&#x153;&#x2021; e đ?&#x153;&#x17D;, ĂŠ dada pela expressĂŁo
f (X ) ď&#x20AC;˝
1
ď ł ď&#x192;&#x2014; 2ď °
ď&#x192;&#x2014;e
1 ď&#x20AC;¨ X ď&#x20AC; ď ď&#x20AC;Š2 ď&#x20AC; ď&#x192;&#x2014; 2 ď ł2
, ď ď&#x192;&#x17D; IR e ď ł ď&#x192;&#x17D; IR ď&#x20AC;Ť
Os parâmetros đ?&#x153;&#x2021; e đ?&#x153;&#x17D; representam respetivamente a mĂŠdia ou valor esperado e o desvio padrĂŁo da distribuição normal. A mĂŠdia đ?&#x153;&#x2021; localiza o centro da distribuição e o desvio padrĂŁo đ?&#x153;&#x17D; mede a variabilidade de đ?&#x2018;&#x2039; em torno da mĂŠdia. Existe uma infinidade de distribuiçþes normais, uma por cada valor que podem tomar đ?&#x153;&#x2021; e đ?&#x153;&#x17D;. A distribuição normal centrada e reduzida tem parâmetros 0 e 1. Neste caso, a variĂĄvel aleatĂłria đ?&#x2018;&#x2039;, ĂŠ transformada na variĂĄvel aleatĂłria reduzida đ?&#x2018;?,
đ?&#x2018;?=
đ?&#x2018;&#x2039;â&#x2C6;&#x2019;đ?&#x153;&#x2021; đ?&#x153;&#x17D; .
36
Probabilidades e EstatĂstica com a TI-NSpire
ExercĂcio: Sabe-se que o tempo de gravidez na mulher segue uma distribuição aproximadamente normal com mĂŠdia 268 dias e desvio-padrĂŁo 15 dias. Um marinheiro, de passagem pela sua terra natal, teve um dia de folga que o aproveitou para passar junto da mulher. Passados 308 dias, a mulher do marinheiro deu Ă luz uma menina. O marido, quando tomou conhecimento da notĂcia, nĂŁo quis acreditar que a filha fosse dele. 1. 2.
Determine a probabilidade de uma gravidez durar pelo menos 308 dias. Definindo como prematura uma criança que nasça com pelo menos 3 semanas antes do tempo, que percentagem de crianças nasce prematuramente?
Resolução: 1.
Seja X a variĂĄvel aleatĂłria que representa o tempo de gestação na mulher expresso em dias. Pretende-se calcular a probabilidade đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; â&#x2030;Ľ 308).
A probabilidade pedida ĂŠ igual aproximadamente a 0.00383 (muito baixa de factoâ&#x20AC;Ś). Se repetir os mesmos passos, mas agora numa folha de cĂĄlculo, e colocar o cursor na 2ÂŞ linha como ĂŠ indicado a seguir, obtĂŠm o grĂĄfico da função densidade de probabilidade. Este grĂĄfico, em forma de sino, ĂŠ simĂŠtrico em relação ao eixo đ?&#x2018;Ľ = đ?&#x153;&#x2021; e tem pontos de inflexĂŁo em đ?&#x2018;Ľ = đ?&#x153;&#x2021; Âą đ?&#x153;&#x17D; (curva de Gauss).
37
Probabilidades e EstatĂstica com a TI-NSpire
2.
Pretende-se calcular a probabilidade đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; â&#x2030;¤ 247)
Para isso,
Resposta: Cerca de 8,1% das crianças nascem prematuramente.
ExercĂcio: Numa loja, a venda semanal de um produto alimentar ĂŠ bem modelada por uma variĂĄvel aleatĂłria com distribuição normal de parâmetros đ?&#x153;&#x2021; = 60 kg e đ?&#x153;&#x17D; = 4. No inĂcio de uma determinada semana, a loja tem em stock 64 kg desse produto alimentar nĂŁo sendo possĂvel ao dono da loja, no decorrer dessa semana, aumentar o seu stock. 1. 2. 3.
Calcule đ?&#x2018;&#x192;(55 < đ?&#x2018;&#x2039; < 63) Determine a probabilidade de ocorrer uma rutura de stock. Qual deveria ser o stock no inĂcio da semana de modo a que fosse 0.01 a probabilidade de rutura?
38
Probabilidades e EstatĂstica com a TI-NSpire
Resolução: Seja X a variĂĄvel aleatĂłria definida por â&#x20AC;&#x153;quantidade, em kg, do produto alimentar vendido por semana na lojaâ&#x20AC;?.
1.
2.
Pretende-se calcular đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; > 64) .
A probabilidade de ocorrer rutura do stock ĂŠ 0.159.
3.
Pretende-se determinar um valor de đ?&#x2018;Ľ ao qual corresponde uma ĂĄrea Ă direita de 0.01, ou seja, pretende-se resolver a equação đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; > đ?&#x2018;Ľ) = 0.01.
39
Probabilidades e EstatĂstica com a TI-NSpire
Assim, o stock deveria ser de 69.3 kg para que a probabilidade de rutura fosse 0.01.
FICHA NÂş 3 â&#x20AC;&#x201C; DISTRIBUIĂ&#x2021;Ă&#x192;O DE AMOSTRAGEM DA MĂ&#x2030;DIA. TEOREMA DO LIMITE CENTRAL Vamos agora estudar a distribuição de amostragem da mĂŠdia da variĂĄvel aleatĂłria X = â&#x20AC;&#x153;nĂşmero de horas de sol registadas no mĂŞs de janeiro de 2012 em 50 estaçþes meteorolĂłgicasâ&#x20AC;?, sendo essa mĂŠdia tomada sobre um conjunto de m amostras. (Retomamos esta variĂĄvel, considerada anteriormente no exercĂcio da ficha nÂş7 da parte I, pĂĄg. 233).
1.
Obtenha 17 amostras aleatórias de dimensão 10, com reposição, da população em estudo. Para cada uma das amostras, calcule o número mÊdio de horas de sol.
2.
Considerando as 17 amostras da questão anterior, obtenha a distribuição de amostragem do número mÊdio de horas de sol. Compare os valores obtidos com a mÊdia e o desvio padrão populacionais da variåvel X em estudo.
Resolução:
1.
Comece por obter cada uma das amostras atravĂŠs da instrução â&#x20AC;&#x153;randSamp (var, 10)â&#x20AC;?.
A instrução randSamp (var, n) permite extrair amostras de dimensĂŁo n, com reposição, de uma população representada por var. Calcule a mĂŠdia, mean, xĚ&#x2026;đ?&#x2018;&#x2013; , de cada uma das amostras, em que i toma valores de 1 a 17 (coluna S).
40
Probabilidades e EstatĂstica com a TI-NSpire
Ě&#x2026; toma valores xĚ&#x2026;đ?&#x2018;&#x2013; : 133, 129, 139.3, â&#x20AC;Ś Por observação das â&#x20AC;&#x153;mediasâ&#x20AC;?, coluna S, a variĂĄvel aleatĂłria X A distribuição de amostragem da mĂŠdia ĂŠ o conjunto de todos os valores possĂveis para a mĂŠdia, obtidos a partir de m amostras de uma determinada dimensĂŁo n (neste caso, m = 17 e n = 10).
2.
Estamos em condiçþes de calcular o valor mÊdio, e o desvio padrão, da distribuição de amostragem da mÊdia.
Comparando a mĂŠdia e o desvio padrĂŁo da variĂĄvel X , respetivamente, đ?&#x153;&#x2021; =133.08 e đ?&#x153;&#x17D; =45.8549, com a mĂŠdia e o desvio padrĂŁo das mĂŠdias, variĂĄvel Ě&#x2026; X , respetivamente, đ?&#x153;&#x2021;đ?&#x2018;&#x2039;Ě&#x2026;= 132.919 e đ?&#x153;&#x17D;đ?&#x2018;&#x2039;Ě&#x2026;= 13.145, que se obtiveram consideradas sobre um conjunto de 17 amostras, verifica-se que a mĂŠdia das mĂŠdias estĂĄ prĂłxima da mĂŠdia da população e que o desvio padrĂŁo da mĂŠdia ĂŠ muito menor que o desvio padrĂŁo da variĂĄvel inicial.
41
Probabilidades e EstatĂstica com a TI-NSpire
No caso de considerarmos bastantes amostras, podemos mesmo verificar que o histograma das mĂŠdias estĂĄ centrado na mĂŠdia das mĂŠdias e que a sua forma se aproxima de uma curva de Gauss. Os valores da mĂŠdia das mĂŠdias e da mĂŠdia populacional serĂŁo ainda mais prĂłximos e o desvio padrĂŁo da mĂŠdia serĂĄ muito menor que o desvio padrĂŁo da variĂĄvel de partida.
Vamos extrair agora 2500 amostras (limite mĂĄximo permitido numa coluna da calculadora) e calcular a mĂŠdia de cada uma das amostras atravĂŠs da fĂłrmula =seq(mean(randsamp(n_horas_sol, 10)), x, 1, 2500) â&#x20AC;&#x201C; coluna T. Nos ĂŠcrans seguintes, repare nos valores obtidos para a mĂŠdia das mĂŠdias, 133.161, e desvio padrĂŁo das mĂŠdias, 14.077. Compare com os valores obtidos no caso em que consideramos apenas 17 amostras. Repare ainda no histograma das mĂŠdias cuja forma jĂĄ se aproxima de uma curva em sino.
E se aumentåssemos a dimensão das amostras aleatórias recolhidas da população em estudo?
Vamos extrair 2500 amostras, por exemplo, de dimensĂŁo 40. Observemos os resultados:
Relembremos a mĂŠdia e o desvio padrĂŁo da variĂĄvel X , respetivamente, đ?&#x153;&#x2021; =133.08 e đ?&#x153;&#x17D; =45.8549. O valor đ?&#x153;&#x2021;đ?&#x2018;&#x2039;Ě&#x2026;= 133.071 estĂĄ muito prĂłximo de đ?&#x153;&#x2021; e đ?&#x153;&#x17D;đ?&#x2018;&#x2039;Ě&#x2026;= 7.21 estĂĄ prĂłximo de
đ?&#x153;&#x17D; â&#x2C6;&#x161;đ?&#x2018;&#x203A;
=
45.8549 â&#x2C6;&#x161;40
â&#x2030;&#x2026; 7.25.
42
Probabilidades e EstatĂstica com a TI-NSpire
Nota informativa: ď&#x201A;ˇ ď&#x201A;ˇ
ď&#x201A;ˇ
Quanto maior o nĂşmero de amostras melhor ĂŠ a estimativa produzida. O tamanho da amostra necessĂĄrio para que a aproximação Ă distribuição normal seja adequada depende da forma da distribuição teĂłrica para a variĂĄvel em causa (ver histograma da pĂĄg. 24). A simetria ĂŠ um fator particularmente importante. O teorema do limite central estabelece a aproximação Ă lei normal, quando a dimensĂŁo da amostra aumenta. O valor mĂŠdio da mĂŠdia amostral ĂŠ igual ao valor mĂŠdio da população de onde foi recolhida đ?&#x153;&#x17D; a amostra e o seu desvio padrĂŁo ĂŠ igual a , para qualquer đ?&#x2019;?. â&#x2C6;&#x161;đ?&#x2018;&#x203A;
Em sĂntese: quando a dimensĂŁo da amostra ĂŠ suficientemente elevada (uma convenção
habitual ĂŠ đ?&#x2019;? â&#x2030;Ľ đ?&#x;&#x2018;đ?&#x;&#x17D; ), a distribuição de amostragem da mĂŠdia, X , ĂŠ bem aproximada por uma distribuição normal de parâmetros
ď łX
ď X ď&#x20AC;˝ ď e ď ł X ď&#x20AC;˝
ď ł , sendo ď , ď X , ď ł , n
e đ?&#x2019;?, a mĂŠdia populacional, o valor mĂŠdio da mĂŠdia amostral, o desvio-padrĂŁo
populacional, o desvio padrĂŁo da mĂŠdia amostral e a dimensĂŁo da amostra, respetivamente.
ExercĂcio: Um estudo feito junto de estudantes do 1Âş ano do ensino superior concluiu que, em mĂŠdia, um aluno estuda cerca de 7,1 horas por semana com um desvio-padrĂŁo de 5,32 horas. Considerando os 50 estudantes que frequentam o 1Âş ano de determinado curso, determine a probabilidade de que, em mĂŠdia, estudem mais do que 7,5 horas por semana.
Resolução: Pretende-se calcular
ď&#x20AC;¨
p X ď&#x20AC;ž 7,5
ď&#x20AC;Š , onde X representa â&#x20AC;&#x153;o nĂşmero mĂŠdio de horas que um aluno do 1Âşano
de determinado curso estuda por semanaâ&#x20AC;?. Ora, pelo teorema do limite central esta variĂĄvel tem uma distribuição aproximadamente normal de parâmetros
ď X ď&#x20AC;˝ 7.1 e ď ł X ď&#x20AC;˝
5,32 ď&#x20AC;˝ 0.75 . 50
A probabilidade pedida ĂŠ aproximadamente igual a 0.297.
43
Probabilidades e EstatĂstica com a TI-NSpire
FICHA NÂş 4 â&#x20AC;&#x201C; INTERVALO DE CONFIANĂ&#x2021;A PARA A MĂ&#x2030;DIA POPULACIONAL - AMOSTRAS GRANDES (nâ&#x2030;Ľ30) Ao usarmos amostras para calcularmos estimativas, pontuais ou intervalares, vamos sempre cometer um determinado erro, quer devido Ă escolha da amostra, quer ao tamanho da amostra recolhida, quer Ă variabilidade dos valores amostrais, traduzindo assim uma certa desconfiança relativamente ao verdadeiro valor do parâmetro populacional. Um intervalo de confiança ou estimativa intervalar ĂŠ um intervalo em relação ao qual temos uma certa confiança que contenha o valor do parâmetro que se pretende estimar. Essa confiança designa-se por grau ou nĂvel de confiança. Os graus de confiança mais usuais sĂŁo os de 90%, 95% e 99%.
Vamos exemplificar como se constrĂłi analiticamente um intervalo de confiança para a mĂŠdia, com um grau de confiança de 0.95. Considerando X , a variĂĄvel aleatĂłria que representa a mĂŠdia de m amostras de dimensĂŁo n (n â&#x2030;Ľ 30), vimos que, segundo o Teorema do Limite Central, a distribuição de amostragem da mĂŠdia ĂŠ bem
aproximada por uma distribuição normal de parâmetros ď
X
ď&#x20AC;˝ď e ď ł
X
ď&#x20AC;˝
ď ł n
.
Como o grau de confiança ĂŠ 0.95, sabemos que o valor crĂtico, zď Ą / 2 , ĂŠ 1.96, valor da distribuição normal central e reduzida ao qual corresponde uma ĂĄrea Ă direita de Îą/2, 0.025. Temos uma ĂĄrea de 1 â&#x2C6;&#x2019; đ?&#x203A;ź = 0.95, entre os valores
đ?&#x2018;&#x192; (â&#x2C6;&#x2019;1.96 <
đ?&#x2018;&#x192; (đ?&#x2018;&#x2039;Ě&#x2026; â&#x2C6;&#x2019; 1.96
đ?&#x153;&#x17D; â&#x2C6;&#x161;đ?&#x2018;&#x203A;
ď&#x20AC; zď Ą / 2 e zď Ą / 2 . EntĂŁo,
Ě&#x2026; â&#x2C6;&#x2019;đ?&#x153;&#x2021; đ?&#x2018;&#x2039; đ?&#x153;&#x17D; < 1.96) = 0.95 â&#x2C6;&#x161;đ?&#x2018;&#x203A;
< đ?&#x153;&#x2021; < đ?&#x2018;&#x2039;Ě&#x2026; + 1.96
đ?&#x153;&#x17D; â&#x2C6;&#x161;đ?&#x2018;&#x203A;
) = 0.95
Conclui-se assim que a probabilidade do intervalo
ď&#x192;š ď ł ď ł ď&#x192;Š ; X ď&#x20AC;Ť 1.96 ď&#x192;&#x2014; ď&#x192;ş X ď&#x20AC; 1.96 ď&#x192;&#x2014; ď&#x192;Ş n n ď&#x192;Ť ď&#x192;ť conter đ?&#x153;&#x2021; ĂŠ de 0.95. Significa que, no caso de se recolherem 100 amostras aleatĂłrias, calculando-se para cada uma delas este intervalo, 95 deles conteriam a verdadeira mĂŠdia đ?&#x153;&#x2021;.
Nota: Se o grau de confiança for de 0.90 ou de 0.99, os valores crĂticos sĂŁo de 1.645 e 2.576, respectivamente.
44
Probabilidades e EstatĂstica com a TI-NSpire
Um intervalo de confiança para o valor mÊdio
ď
de uma variĂĄvel X, admitindo que se conhece o
desvio padrĂŁo da variĂĄvel, com um grau de confiança 1 â&#x2C6;&#x2019; đ?&#x203A;ź, ĂŠ entĂŁo dado pela expressĂŁo:
ď ł ď ł ď&#x192;Š ď&#x192;š ; X ď&#x20AC;Ť zď Ą / 2 ď&#x192;&#x2014; ď&#x192;ş X ď&#x20AC; zď Ą / 2 ď&#x192;&#x2014; ď&#x192;Ş. n n ď&#x192;Ť ď&#x192;ť No caso de o desvio padrĂŁo populacional, đ??&#x2C6;, ser desconhecido, substitui-se por uma estimativa s, desvio padrĂŁo amostral.
Uma das grandes vantagens da estimação por intervalos Ê a possibilidade de se poder determinar, com uma certa confiança, o erro måximo cometido. Quando se utilizam os dados amostrais para estimar a mÊdia populacional,
ď
, a margem de erro, que
se representa por E, ĂŠ a diferença mĂĄxima, com grau de confiança 1 â&#x2C6;&#x2019; đ?&#x203A;ź , entre a mĂŠdia amostral observada,
X
, e a mĂŠdia populacional
ď
( 0 < 1 â&#x2C6;&#x2019; đ?&#x203A;ź < 1, os valores habituais sĂŁo 0.95, 0.98, 0.99).
Esta margem de erro calcula-se multiplicando o valor crĂtico pelo desvio-padrĂŁo das mĂŠdias amostrais, ou seja:
E ď&#x20AC;˝ zď Ą / 2 ď&#x192;&#x2014;
ď ł n
OBS. Sempre que a dimensĂŁo da amostra for maior ou igual a 30, podemos substituir đ??&#x2C6;, no caso de ser desconhecido, pelo desvio-padrĂŁo amostral đ?&#x2019;&#x201D;. Quando a dimensĂŁo da amostra ĂŠ inferior a 30, a variĂĄvel aleatĂłria definida na população tem de ser normalmente distribuĂda para podermos aplicar esta fĂłrmula da margem de erro. Caso nĂŁo se verifique este pressuposto veremos posteriormente uma fĂłrmula alternativa para a determinação da margem de erro.
As temperaturas do corpo humano ExercĂcio: A maioria das pessoas pensa que a temperatura mĂŠdia do corpo humano ĂŠ cerca de 37Âş. Com base na seguinte amostra de temperaturas medidas em 35 indivĂduos saudĂĄveis, 37,3 37,6 36,6 36,9 36,2 37,4
36,2 36,5 36,5 36,6 36,6 37,3
37 37,2 37,3 36,6 36,6 37,5
36,9 37,3 37,3 36,7 36,6 36,3
37 36,5 36,4 36,7 37,3 37,2
37,2 37,2 36,7 36,8 36,8
determine um intervalo, com grau de confiança a 0.95, para a temperatura mÊdia na população. Calcule a margem de erro para o grau de confiança indicado.
45
Probabilidades e Estatística com a TI-NSpire
Resolução:
Este último ecrã diz-nos que ]36.751 , 37.009[ é um intervalo de confiança para a temperatura média da população, com grau de confiança 0.95.
46
Probabilidades e Estatística com a TI-NSpire “ME” ≅ 0.129 representa a margem de erro pedida, isto é, para estimar a temperatura média do corpo humano, com base na média da amostra observada, estamos a cometer um erro que no máximo é de 0,129 ( com grau de confiança 0.95). OBS: Devemos ter cuidado na interpretação do conceito de intervalo de confiança. Quando chegamos, a partir da nossa amostra, ao intervalo ]36,751 ; 37,009[, isso não significa que a temperatura média do corpo humano, µ , tem uma probabilidade de 0,95 de estar entre os limites 36.751 e 37.009, uma vez que µ é uma constante e não uma variável aleatória. O parâmetro µ está, ou não, situado entre aqueles limites. O que podemos afirmar, com toda a certeza, é que se fosse possível recolher da população todas as amostras de dimensão 35 e, com cada uma delas, construir um intervalo com grau de confiança de 0.95, seria de esperar que em cada 100 desses intervalos apenas 5 não conteriam eventualmente o parâmetro µ.
Exercício: Em 1994, nos Estados Unidos, inquiriram-se 1055 casais nos termos seguintes: “Quantos parceiros sexuais teve a partir dos seus 18 anos?” Esta era uma de entre várias questões que constavam no questionário. O inquérito era anónimo e nenhum elemento do casal teve acesso às respostas do outro para não enviesar os resultados. Diferenciaram-se os resultados por sexo, tendo-se obtido, para os homens: x 10.2 e
s 10.1
e
para as mulheres: x 4.8
e
s 6.2 .
Face a estes resultados, construa dois intervalos de confiança a 95%, um para cada sexo, para o número médio de parceiros sexuais na população.
Resolução: Para os homens,
O último ecrã responde à questão no caso do sexo masculino. 47
Probabilidades e EstatĂstica com a TI-NSpire
Para as mulheres,
Naquela Êpoca e nos Estados Unidos, o número de parceiros sexuais de uma mulher, ao longo da vida, tendia a ser inferior ao de um homem. Deixamos para os psicólogos as interpretaçþes deste tipo de resultados. De resto, o erro måximo de estimativa Ê de 0.609 para os homens e de 0.374 para as mulheres, aproximadamente.
Mantendo a dimensĂŁo da amostra e aumentando o grau de confiança, aumenta tambĂŠm a amplitude do intervalo. Por exemplo, para um grau de confiança de 0.99, obterĂamos, com base nas mesmas amostras, para os homens, o intervalo ]9.399 , 11.001[ e, para as mulheres, o intervalo ]4.308 , 5.292[ .
FICHA NÂş 5 â&#x20AC;&#x201C; DETERMINAĂ&#x2021;Ă&#x192;O DO TAMANHO DA AMOSTRA Suponhamos que se pretendia estimar a altura mĂŠdia dos portugueses adultos do sexo masculino. HaverĂĄ alguma fĂłrmula que nos indique o nĂşmero de indivĂduos que deverĂamos selecionar de forma a que a diferença entre o valor estimado e o parâmetro em questĂŁo nĂŁo ultrapassasse um determinado valor? Este problema tem a sua importância porque, como sabemos, a recolha de amostras de dimensĂŁo muito elevada torna-se dispendiosa e demora muito tempo. Por outro lado, se o tamanho das amostras nĂŁo for suficientemente elevado, estas podem ser enviesadas, isto ĂŠ, pouco fiĂĄveis. Em muitas situaçþes ĂŠ possĂvel determinar a dimensĂŁo mĂnima da amostra para estimar determinado parâmetro de forma a que o erro cometido nĂŁo ultrapasse determinado valor. Se o parâmetro em causa for a mĂŠdia populacional, a expressĂŁo que nos permite determinar o tamanho da amostra em função da margem de erro ĂŠ dada pela expressĂŁo:
ď&#x192;Ś z ď&#x192;&#x2014;ď ł ď&#x192;ś n ď&#x20AC;˝ ď&#x192;§ ď Ą /2 ď&#x192;ˇ ď&#x192;¨ E ď&#x192;¸
2
, fixado đ?&#x203A;ź e supondo que
ď ł
ĂŠ
conhecido.
48
Probabilidades e Estatística com a TI-NSpire
OBS: Note que a dimensão da amostra não depende da dimensão da população, N. A dimensão da amostra depende da margem de erro que se pretende à partida, do desvio-padrão populacional e do grau de confiança fixado. Observe-se que só podemos aplicar esta fórmula se conhecermos o valor do desviopadrão populacional. Como este parâmetro é muitas vezes desconhecido, uma solução consiste em estimá-lo através do desvio-padrão amostral de uma amostra recolhida previamente, de forma aleatória, para o efeito.
Um teste de perceção espacial Exercício: A desorientação espacial dos pilotos, por não ser facilmente percetível, é um dos grandes riscos de segurança causador de desastres. Um psicólogo construiu um teste de perceção espacial para ser aplicado em pilotos e cujo objetivo consiste em estimar o valor médio atingido por eles ao nível da perceção do espaço. Quantos pilotos deve o psicólogo testar de forma a que a margem de erro não exceda os dois pontos, com um grau de confiança de 0.95? Nota: um estudo feito anteriormente pela mesma pessoa permitiu concluir que o desvio padrão é aproximadamente igual a 21. 2.
Resolução:
1 0,95 0,05 Agora, apenas é necessário saber o valor de
O valor crítico
z 0, 025
2
0,025
z 0, 025 .
é igual a 1,96.
49
Probabilidades e Estatística com a TI-NSpire
1,96 21,2 , ou seja, n 431,6 . Assim, o psicólogo deve obter 2 2
Fazendo os cálculos, resulta n
uma amostra com uma dimensão, no mínimo, igual a 432 indivíduos.
As pilhas KODAK AA Exercício: Com o objetivo de medir a duração das pilhas Kodak do tipo AA, calculou-se um intervalo, com grau de confiança de 0.95, para o tempo médio de vida (em minutos) de uma pilha daquele tipo. Obteve-se o intervalo ]430 ; 470[. Supondo que este intervalo foi construído com base numa amostra de dimensão 100, responda às seguintes questões: 1. 2. 3.
Quais os valores da média e do desvio padrão da amostra observada? Construa um intervalo de confiança a 99%. Imagine que face à mesma amostra, se teria obtido o intervalo ]432 ; 468[. Qual seria, nesse caso, o grau de confiança?
Resolução: 1.
A média da amostra é o ponto médio do intervalo fornecido: x
430 470 450 . 2
Para determinar o desvio-padrão basta resolver a equação,
450 1,96
2.
470 102,04 100
1 0,99 0,01 / 2 0,005 1 – 0,005 = 0,995 ; z 0,995
2,58 .
O intervalo com grau de confiança de 0.99 é então ]423.716 , 476.284[.
3.
A amplitude do intervalo obtém-se pela diferença entre o limite superior e o limite inferior, sendo então dada pela expressão:
2 z / 2
n
.
Esta expressão deve ser igualada a 468 – 432 = 36, donde resulta, z / 2
1,764 50
Probabilidades e Estatística com a TI-NSpire
Usemos a máquina para resolver a última equação:
Ora, z / 2 1,764
2
0,039 e, portanto, 1 0,92 .
Ou seja, para obtermos o intervalo ]432 , 468[ , o grau de confiança seria de 0.92.
OBS: a expressão dos extremos do intervalo de confiança para a média, que depende do grau de confiança, da dimensão da amostra e do desvio-padrão da população, permite afirmar que a sua amplitude aumenta:
Sempre que aumenta o grau de confiança; Sempre que diminui a dimensão da amostra; Sempre que aumenta a variabilidade da população,
mantendo fixos os restantes valores, em cada uma das opções anteriores. Portanto, perde-se precisão quando se pretende aumentar o grau de confiança de um intervalo de confiança.
FICHA Nº 6 – INTERVALO DE CONFIANÇA PARA A MÉDIA – AMOSTRAS PEQUENAS (n < 30) Quando as amostras têm dimensão inferior a 30, a variância amostral s2 poderá assumir valores substancialmente diferentes da variância populacional σ2. Como a variância populacional é geralmente desconhecida, ao utilizarmos s2 para a estimar estamos a introduzir outra fonte de erro o que deve ser evitado. Nestas condições, já não podemos afirmar que a variável aleatória
t
X S n
segue uma distribuição aproximadamente normal reduzida. Um investigador com o nome de W.S. Gosset e que usou o nome de Student como pseudónimo estudou a distribuição desta variável aleatória e descobriu que ela tem as seguintes propriedades, sempre que as amostras provêm de uma população com distribuição aproximadamente normal.
A distribuição de t embora não sendo normal, vai-se aproximando da normal à medida que o tamanho da amostra aumenta. Por exemplo, para n = 30, a aproximação é já bastante razoável. A distribuição t de Student é simétrica em relação ao ponto zero. A distribuição de t não depende de µ e σ.
51
Probabilidades e EstatĂstica com a TI-NSpire
Observação: A distribuição de t estĂĄ tabelada em função dos valores de đ?&#x2018;&#x203A; â&#x2C6;&#x2019; 1, valores estes designados por nĂşmero de graus de liberdade. Por exemplo, para uma amostra de dimensĂŁo 12, a distribuição t de Student tem 11 graus de liberdade (dimensĂŁo da amostra menos uma unidade). Ou seja, para manter o grau de confiança desejado, compensa-se a variabilidade adicional aumentando a amplitude do intervalo, jĂĄ que o valor crĂtico zď Ą / 2 ĂŠ inferior a tď Ą / 2 . Para valores pequenos de n, as caudas da distribuição t sĂŁo mais alongadas, pois a ĂĄrea entre o eixo das abcissas e estas curvas ĂŠ menor no caso da distribuição normal. Este facto acaba por provocar um aumento da amplitude dos intervalos de confiança. Desta forma, a distribuição normal reduzida pode ser usada no caso de grandes amostras enquanto que a distribuição t deve ser usada para as amostras pequenas. Na figura abaixo ĂŠ visĂvel um esboço grĂĄfico das funçþes densidade de ambas.
Para obter os intervalos de confiança para a mĂŠdia, o processo acaba por ser idĂŞntico. Na expressĂŁo da margem de erro substitui-se o valor crĂtico zď Ą / 2 por
tď Ą / 2 .
O intervalo de confiança para a mÊdia populacional com base numa amostra pequena Ê dado pela expressão
ď&#x192;š s s ď&#x192;Š ; X ď&#x20AC;Ť tď Ą / 2 ď&#x192;&#x2014; ď&#x192;ş X ď&#x20AC; tď Ą / 2 ď&#x192;&#x2014; ď&#x192;Ş. n nď&#x192;Ť ď&#x192;ť A margem de erro para o intervalo de confiança para a mĂŠdia ĂŠ dada por
E ď&#x20AC;˝ tď Ą / 2 ď&#x192;&#x2014;
s n
onde tď Ą / 2 ĂŠ lido na tabela da lei de Student com n-1 graus de liberdade.
52
Probabilidades e Estatística com a TI-NSpire
- A hipnose como alívio da dor Exercício: Um psicólogo recolheu uma amostra de 16 indivíduos de determinada população com o objetivo de avaliar as suas capacidades de resistência à dor sob o efeito da hipnose. Feitas as devidas observações foram registados os valores sensoriais seguintes:
8,8 8,4 8,7 6,3
6,6 7,0 11,3 8,7
8,4 9,0 8,1 6,2
6,5 10,3 5,2 7,9
Com base nestes valores, construa um intervalo de confiança a 95% para o valor sensorial médio na população.
Resolução:
53
Probabilidades e EstatĂstica com a TI-NSpire
ConclusĂŁo: A taxa sensorial mĂŠdia de um indivĂduo daquela população sob o efeito da hipnose varia ente 7.111 e 8.814, com um grau de confiança de 0.95.
FICHA NÂş 7 â&#x20AC;&#x201C; INTERVALO DE CONFIANĂ&#x2021;A PARA UMA PROPORĂ&#x2021;Ă&#x192;O POPULACIONAL A proporção populacional ĂŠ a frequĂŞncia relativa com que uma determinada caracterĂstica ou propriedade se verifica na população. Suponhamos que se recolhe uma amostra de dimensĂŁo n de uma população X, em que cada elemento tem ou nĂŁo determinada propriedade. Considere-se đ?&#x2019;&#x2018; a proporção de indivĂduos da população com essa propriedade e a dimensĂŁo da amostra Ě&#x201A; ĂŠ uma estimativa do parâmetro đ?&#x2018;?, a distribuição de amostragem da suficientemente grande (n â&#x2030;Ľ 30). Se đ?&#x2019;&#x2018; proporção đ?&#x2018;?Ě&#x201A; , obtida com base numa amostra recolhida ao acaso de dimensĂŁo n, pode ser aproximada por uma distribuição normal com valor mĂŠdio p e desvio padrĂŁo â&#x2C6;&#x161;
đ?&#x2018;? (1â&#x2C6;&#x2019;đ?&#x2018;?) đ?&#x2018;&#x203A;
. đ?&#x203A;ź
Sendo zď Ą / 2 , o valor crĂtico da normal reduzida correspondente a uma ĂĄrea Ă direita de , entĂŁo um 2 intervalo de confiança a (1 â&#x2C6;&#x2019; đ?&#x203A;ź) Ă&#x2014; 100% para a proporção obtĂŠm-se atravĂŠs da expressĂŁo:
ď&#x192;š pË&#x2020; ď&#x192;&#x2014; ď&#x20AC;¨1 ď&#x20AC; pË&#x2020; ď&#x20AC;Š pË&#x2020; ď&#x192;&#x2014; ď&#x20AC;¨1 ď&#x20AC; pË&#x2020; ď&#x20AC;Š ď&#x192;Š ; pË&#x2020; ď&#x20AC;Ť zď Ą / 2 ď&#x201A;´ ď&#x192;ş pË&#x2020; ď&#x20AC; zď Ą / 2 ď&#x201A;´ ď&#x192;Ş n n ď&#x192;ť ď&#x192;Ť Deduz-se, desta expressĂŁo, que a fĂłrmula da margem de erro ĂŠ dada por:
E ď&#x20AC;˝ zď Ą / 2 ď&#x201A;´
pË&#x2020; ď&#x192;&#x2014; ď&#x20AC;¨1 ď&#x20AC; pË&#x2020; ď&#x20AC;Š n
Novamente, para determinar a dimensĂŁo da amostra a utilizar na realização de determinados estudos em que se pretende estimar đ?&#x2018;? basta resolver a Ăşltima condição em ordem a đ?&#x2018;&#x203A;. Donde resulta: 2 ď&#x20AC;¨ zď Ą / 2 ď&#x20AC;Š ď&#x192;&#x2014; pË&#x2020; ď&#x192;&#x2014; ď&#x20AC;¨1 ď&#x20AC; pË&#x2020; ď&#x20AC;Š nď&#x20AC;˝
E2
Observação: Esta expressĂŁo depende do valor de p Ë&#x2020; . Contudo, se nĂŁo for possĂvel estimar previamente đ?&#x2018;?, podemos substituir a expressĂŁo p pelo seu valor mĂĄximo que ĂŠ igual a 0.25. Este valor Ë&#x2020; ď&#x192;&#x2014; ď&#x20AC;¨1 ď&#x20AC; p Ë&#x2020;ď&#x20AC;Š mĂĄximo ĂŠ atingido para p Ë&#x2020; =0.5. 54
Probabilidades e Estatística com a TI-NSpire
- Proporção de indivíduos a favor da legalização do aborto Exercício: Inquiriram-se 1950 pessoas de uma cidade nos seguintes termos: “Está de acordo, ou não, com a legalização do aborto?”. As respostas obtidas permitiram concluir que 1100 pessoas não concordaram com a legalização e 850 concordaram com a legalização do aborto. Face a estes valores, obtenha um intervalo com um grau de confiança de 0.95 para a percentagem de pessoas dessa cidade que responde que concorda com a legalização do aborto.
Resolução:
Conclusão: Podemos dizer, com um grau de confiança de 0.95, que ]0.414 , 0.458[ é um intervalo de confiança para a percentagem de pessoas daquela cidade que está de acordo com a legalização do aborto.
Observação: Se, por exemplo, aumentarmos o nível de confiança para 0.99 obteremos um intervalo de maior amplitude. Ou seja, ganha-se em confiança mas perde-se em precisão.
55
Probabilidades e Estatística com a TI-NSpire
As pastilhas M&M Exercício: Compraram-se 100 embalagens de pastilhas M&M para observar a frequência das suas cores. Observaram-se as seguintes frequências: Vermelho 21
Laranja 8
Amarelo 26
Castanho 33
Azul 5
Verde 7
Com base nestes dados, determine:
1. Um intervalo com um grau de confiança de 0.95 para a percentagem de pastilhas M&M de cor vermelha existentes nos mercados.
2. Com o mesmo grau de confiança, determine o número de pastilhas a observar para se poder estimar, com uma margem de erro de 3 pontos percentuais, a percentagem de pastilhas de cor azul existentes no mercado.
Resolução:
1.
A amostra tem dimensão n = 100.
Podemos afirmar, com um grau de confiança de 0.95, que ]0.130 , 0.290[ é um intervalo de confiança para a percentagem de pastilhas M&M de cor vermelha existentes no mercado.
2.
Podemos aproveitar esta amostra para termos uma informação sobre o valor da proporção amostral de pastilhas azuis. Assim, nesta amostra, a proporção de pastilhas azuis é igual a 0,05. Com esta informação, a expressão que nos permite determinar a dimensão da amostra a recolher para construir um intervalo de confiança para a proporção de pastilhas azuis, com o mesmo grau de confiança e com a margem de erro fixada, é:
n
1,962 0,05 0,95 202,75 (0,03) 2
Portanto, devemos recolher, no mínimo, 203 pastilhas M&M.
56
Probabilidades e Estatística com a TI-NSpire
FICHA Nº 8 – ALGUNS ITENS DE PROVAS ESCRITAS DE MACS 1.
Os alunos do 11º ano que, em 2012, frequentaram a disciplina de Matemática Aplicada às Ciências Sociais na escola da Maria pretendem fazer uma investigação sobre as classificações dos alunos do ensino secundário na língua estrangeira, com vista a estimar a classificação média de um aluno. Para calcularem quantos alunos devem ser observados, decidem que a amplitude do intervalo de confiança será, no máximo, de 2 valores e que este terá um nível de confiança de 95%. Dos dados recolhidos em anos anteriores, concluiu-se que o desvio padrão populacional é de 3 valores. Determine a dimensão mínima da amostra a utilizar pelos alunos do 11º ano que, em 2012, frequentaram a disciplina de Matemática Aplicada às Ciências Sociais na escola da Maria, considerando que a distribuição das notas em 2012 é aproximadamente normal e tem aquela variabilidade. (Item 5.2 da prova escrita de MACS de 2012 – 1ª fase).
2.
Considere a variável aleatória X, que representa “a massa, em quilogramas, de uma saca de cereais escolhida ao acaso de entre as que, por dia, são embaladas numa determinada fábrica». Suponha que a variável X segue, aproximadamente, uma distribuição normal de valor médio igual a 1000 quilogramas e desvio-padrão igual a 16 quilogramas. Escolhe-se, aleatoriamente, uma saca de cereais. Determine um valor aproximado para a probabilidade de a saca escolhida apresentar uma massa compreendida entre 968 quilogramas e 1016 quilogramas. Apresente o resultado na forma de percentagem, com arredondamento às centésimas. (Item 3 da prova escrita de MACS de 2012 – 2ª fase).
3.
Um entusiasta da maratona publicou no seu blogue um artigo intitulado «Nos últimos dez anos, o tempo médio de duração da maratona foi 3 horas e 15 minutos». A Eduarda duvidou da afirmação constante deste título. Recolheu, aleatoriamente, 300 tempos obtidos por atletas ao longo dos últimos dez anos e verificou que a média dos tempos era 3 horas e que o desvio padrão amostral era de 45 minutos. Por fim, construiu um intervalo de confiança a 99% para o valor médio do tempo de duração da maratona. Conclua, com base nos seus cálculos, se a Eduarda tinha razão em duvidar da informação dada pelo bloguista. Caso proceda a arredondamentos nos cálculos intermédios, conserve, no mínimo, três casas decimais. (Item 6.2 da prova escrita de MACS de 2016 – 2ª fase).
57
Probabilidades e Estatística com a TI-NSpire
Bibliografia e Webgrafia fundamental Bivar, António et al. (2014). Caderno de Apoio-Metas Curriculares para o Ensino SecundárioMatemática A. Ministério da Educação e Ciência. Costa, B. et al. (2013). Novo Espaço, 10º ano. Porto Editora. Ferreira, J. (1998). A Simulação Numérica Como Instrumento Na Aprendizagem de Conceitos e Princípios Probabilísticos Básicos. Lisboa. APM. Figueiredo, A. D. (2001). Novos Media e Nova Aprendizagem. In Novo Conhecimento, Nova Aprendizagem (pp. 71-81). Lisboa: Fundação Calouste Gulbenkian. Gomes, Luzia et al. (2011). Matemática A, 12º Ano. ASA Editora. Jonassen, D. H. (2007). Computadores Ferramentas Cognitivas – Desenvolver o pensamento crítico nas escolas. Porto Editora. NCTM (2007). Princípios e Normas para a Matemática Escolar. Lisboa: APM. Negra, Cristina et al. (2010). Manual de Matemática A, 10ºano. Santillhana Editora. Neves, M. Augusta et al. (2014). Matemática A, 10º Ano. Porto Editora. Roriz, Fernando et al. (2002). Conceitos de Estatística aplicada às Ciências Sociais, Humanas e de Gestão. Série Manuais. Instituto Superior da Maia. Simões, Manuela (2013). MACS 11. Areal Editores.
Recursos na Internet: Associação de Professores de Matemática (http://www.apm.pt) Becta (http://about.becta.org.uk/) DiasT3 - http://www.apm.pt/files/208293_Dias_T3_Zona_Centro_DadoseEstatistica_v12_12_2010_ Key Curriculum Press (http://www.keypress.com/) KidsKount - Freudenthal Institute (http://www.fi.uu.nl/rekenweb/) Manual da TI-NSPIRE - education.ti.com/guides Microsoft Math – http://www.microsoft.com/brasil/educacao/msmath/default.aspx#Overview) National Council of Teachers of Mathematics (http://standards.nctm.org/) National Library of Virtual Manipulatives – Utah State University http://nlvm.usu.edu/en/nav/vlibrary.html) TI SmarView – http://education.ti.com/educationportal/sites/US/productDetail/us_smartview.html) Wisweb - Freudenthal Institute (http://www.fi.uu.nl/wisweb/en/) Wolfram Research – (http://www.wolfram.com)
58
Probabilidades e Estatística com a TI-NSpire
Autores: Fernando Roriz, licenciado em Matemática pela Faculdade de Ciências da Universidade do Porto e mestre em Matemática / Educação pela Universidade Portucalense. Docente da Escola Secundária da Maia. Membro da Bolsa de Formadores do Centro de Formação Maia Trofa nas áreas domínios: Educação em Matemática, Tecnologias Educativas e Estatística Aplicada.
Júlia Ferreira, licenciada em Matemática pela Faculdade de Ciências da Universidade do Porto e mestre em Matemática / Educação pela Universidade Portucalense. Docente da Escola Secundária da Maia. Membro da Bolsa de Formadores do Centro de Formação Maia Trofa nas áreas domínios: Educação em Matemática, Tecnologias Educativas e Estatística Aplicada. Membro da Casa das Ciências.
59