2021 - Aula 9 - Teste de Hipótese 2 Amostras
2021 - Aula 9 - Teste de Hipótese 2 Amostras
2021 - Aula 9 - Teste de Hipótese 2 Amostras
1
Testar diferença entre médias
• Amostras grandes e pequenas
(independentes)
Objetivos Gerais
Testar diferença entre
proporções
Objetivos da Aula
Realizar um teste-z de duas amostras para
testar a diferença entre duas médias μ1 e μ2
usando amostras grandes e independentes
Comparar parâmetros de duas
populações
Métodos de amostragem
Teste de hipótese de
• Amostras independentes
duas amostras
• Amostra selecionada de uma população não
tem relação com a da segunda população
• Amostras dependentes (pareadas ou
combinadas)
• Cada elemento de uma amostra corresponde
à um membro da outra amostra
Amostras dependentes e independentes
Amostras dependentes e
independentes
Amostras dependentes
Amostras podem ser pareadas com respeito à cada indivíduo)
Exemplo: amostras
dependentes e independentes
Amostras independentes
Não é possível formar um par entre os membros das duas amostras; os
tamanhos das amostras são diferentes, e os dados representam pontuações
para diferentes indivíduos.
Testes de hipótese de duas
amostras independentes
1. Hipótese nula H0
• Uma hipótese estatística que geralmente declara que não há diferença
entre os parâmetros de duas populações.
• Sempre contém o símbolo , =, ou .
2. Hipótese alternativa Ha
• Uma hipótese estatística que é verdadeira quando H0 é falsa.
• Sempre contém o símbolo >, , ou <.
Testes de hipótese de duas
amostras com amostras independentes
Média: x − x = x − x = 1 − 2
1 2 1 2
Erro padrão: x − x = 12 22
x2 + x2 = +
1 2 1 2
n1 n2
• O teste estatístico é x1 − x2
• O teste estatístico padronizado é
Em palavras Em símbolos
Em palavras Em símbolos
H0: µ1 = µ2 z=
(x1 − x2) − (1 − 2)
H1: µ1 ≠ µ2 x −x
1 2
α = 0,05
Mulheres (1) Homens (2)
x1 = $2290 x2 = $2370
A American Automobile Association afirma que a média do custo diário para refeições e
acomodações para férias no Texas é menor do que para férias na Virgínia. A tabela à
esquerda mostra os resultados de uma pesquisa aleatória de turistas em cada Estado. As
duas amostras são independentes. Em α = 0.01, existe evidência suficiente para apoiar a
afirmação?
0,01
z
-2,33 0
-0,93
Teste-z de duas amostras para a
diferença entre médias
Em 1981, um estudo com 70 crianças selecionadas aleatoriamente (com menos de 3 anos
de idade) constatou que a média de tempo gasto em creche ou pré-escola por semana
era de 11,5 horas com um desvio padrão de 3,8 horas. Um estudo recente com 65
crianças selecionadas aleatoriamente constatou que a média de tempo gasto em creche
ou pré-escola por semana era de 20 horas e o desvio padrão de 6,7 horas. Em α=0,01,
teste a afirmação de que as crianças passam 9 horas por semana a mais na creche ou
pré-escola hoje do que em 1981.
H0: µ1 - µ2 = -9
H1: µ1 - µ2 ≠ -9
α=0,01
22
Teste-z de duas amostras para a diferença entre médias
Em 1981, um estudo com 70 crianças selecionadas aleatoriamente (com menos de 3 anos de idade) constatou
que a média de tempo gasto em creche ou pré-escola por semana era de 11,5 horas com um desvio padrão
de 3,8 horas. Um estudo recente com 65 crianças selecionadas aleatoriamente constatou que a média de
tempo gasto em creche ou pré-escola por semana era de 20 horas e o desvio padrão de 6,7 horas. Em
α=0,01, teste a afirmação de que as crianças passam 9 horas por semana a mais na creche ou pré-escola
hoje do que em 1981.
H0: μ1 - μ2 = -9
H1: μ1 - μ2≠ -9 0,005 0,005
Z
0 2,575
(x1 − x2) − (1 − 2)
-2,575
z=
x −x
1 2
23
Teste-z de duas amostras para a diferença entre médias
24
Teste-z de duas amostras para a
diferença entre médias
A diferença entre a média anual de salário dos estatísticos em São Paulo e Rio de Janeiro é
maior que $ 6.000? Para decidir você seleciona uma amostra aleatória de estatísticos de
cada estado. O resultado de cada pesquisa são mostrados abaixo. Em α=0,10 o que você
deve concluir?
25
Teste-z de duas amostras para a diferença entre médias
A diferença entre a média anual de salário dos estatísticos em São Paulo e Rio de Janeiro é
maior que $ 6.000? Para decidir você seleciona uma amostra aleatória de estatísticos de
cada estado. O resultado de cada pesquisa são mostrados abaixo. Em α=0,10 o que você
deve concluir?
0,1
t
0 1,285
26
Teste z de duas amostras para a diferença entre médias
27
Objetivos da Aula
𝑠12 𝑠22
𝜎𝑥lj 1 −𝑥lj 2 = +
𝑛1 𝑛2
Sim
Use o teste t com
Desvios padrão das s12 s22
Não x −x = +
populações são 1 2
n1 n2
conhecidos? g.l. = menor (n1 – 1) ou (n2 – 1).
Sim
Use o teste z.
Teste t de duas amostras para a diferença entre
médias (amostras pequenas e independentes)
Em palavras Em símbolos
Use a tabela
Teste t de duas amostras para a diferença entre
médias (amostras pequenas e independentes)
Em palavras Em símbolos
Um fabricante afirma que o alcance de chamada (em pés) do seu telefone sem fio 2,4
GHz é maior do que o do seu principal concorrente. Você realiza um estudo usando 14
telefones selecionados aleatoriamente deste fabricante e 16 telefones similares — do
concorrente — selecionados aleatoriamente. Os resultados são mostrados abaixo. Em α
= 0,05, você pode apoiar a afirmação do fabricante? Assuma que as populações são
normalmente distribuídas.
0,05
t
0 1,771
Teste Estatístico
𝑥lj 1 − 𝑥lj 2 − 𝜇1 − 𝜇2 𝑡=
1275−1250 − 0
= 1,76
𝑡= 𝜎𝑥lj 1 −𝑥lj 2
𝜎𝑥lj 1 −𝑥lj 2
d
-t0 μd t0
Símbolos usados para o teste t para μd
Símbolo Descrição
n O número de dados emparelhados
Símbolo Descrição
Em palavras Em símbolos
(d ) 2
(d − d ) 2 d −2
7. Encontre o teste estatístico padronizado. sd = = n
n −1 n −1
d − d
t=
sd n
Teste t para a diferença entre médias
(amostras dependentes)
Em palavras Em símbolos
8. Tome a decisão de rejeitar ou não rejeitar Se t está na região de rejeição,
a hipótese nula. rejeitar H0. Se não, falhar em rejeitar
H0.
9. Interprete a decisão no contexto da
afirmação original.
Teste t para a diferença entre médias
Um fabricante de tacos de golfe afirma que os golfistas podem diminuir seus placares
usando os tacos de golfe recém-projetados por ele. Oito jogadores de golfe são escolhidos
aleatoriamente e é pedido a cada um que forneça seu placar mais recente. Após usar os
novos tacos por um mês, é pedido novamente aos jogadores que forneçam seus placares
mais recentes. Os placares para cada um são mostrados na tabela. Assumindo que os
placares de golfe são distribuídos normalmente, existe evidência suficiente para apoiar a
afirmação do fabricante para α = 0.10?
Golfista 1 2 3 4 5 6 7 8
Placar (antigo) 89 84 96 82 74 92 85 91
Placar (novo) 83 83 92 84 76 91 80 91
H0: μ1 - μ2 = 0
H1: μ1 - μ2 > 0
Teste t para a diferença entre médias
0,10
t
0 1,415
Teste t para a diferença entre médias
d = (placar antigo) – (placar novo)
d 13
Antigo Novo d d2 d = = = 1.625
n 8
89 83 6 36
84 83 1 1
(d ) 2
96 92 4 16 d 2 −
sd = n
82 84 –2 4 n −1
74 76 –2 4
(13) 2
92 91 1 1 87 −
= 8
85 80 5 25 8 −1
91 91 0 0 3.0677
Σ = 13 Σ = 87
Teste t para a diferença entre médias
d = (placar antigo) – (placar novo)
• H0: μd ≤ 0 • Teste estatístico:
• Ha: μd > 0 d − d 1.625 − 0
t= 1.498
• = 0.10 sd n 3.0677 8
• g.l. = 8 – 1 = 7
• Região de rejeição: • Decisão: Rejeitar H0
Eleitor 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Índice 60 54 78 84 91 25 50 65 68 81 75 45 62 79 58 80
(ano 1)
Índice 56 48 70 60 85 40 40 55 80 75 78 50 50 85 53 60
(ano 2)
60
Objetivo
pq +
1 1
• Erro padrão: pˆ − pˆ =
1 2
n1 n2
x1 + x2
p= , where x1 = n1 pˆ1 and x2 = n2 pˆ 2
n1 + n2
Testes z de duas amostras para a diferença
entre proporções
( pˆ1 − pˆ 2) − ( p1 − p2)
z=
pq +
1 1
n1 n2
x1 + x2
p= and q = 1 − p
n1 + n2
Testes z de duas amostras para a diferença entre proporções
Em palavras Em símbolos
1. Expresse a afirmação. Identifique a hipótese nula e Expresse H0 e Ha.
alternativa.
2. Especifique o nível de significância. Identifique .
3. Determine o(s) valor(es) críticos(s).
Use a Tabela
4. Determine a(s) região(ões) de rejeição.
5. Encontre a estimativa ponderada de p1 e p2. x1 + x2
p=
n1 + n2
Testes z de duas amostras para a diferença entre proporções
Em palavras Em símbolos
0,05 0,05
Z
-1,645 0 1,645
Solução: testes z de duas amostras para a diferença entre proporções
x1 = n1 pˆ1 = 60 x2 = n2 pˆ 2 = 95
x1 + x2 60 + 95
p= = 0.3444
n1 + n2 200 + 250
q = 1 − p = 1 − 0.3444 = 0.6556
Note:
n1 p = 200(0.3444) 5 n1q = 200(0.6556) 5
n2 p = 250(0.3444) 5 n2q = 250(0.6556) 5
Solução: testes z de duas amostras para a diferença entre proporções
1 = Medicação 2 = Placebo
Solução: testes z de duas amostras para a
diferença entre proporções
0,01
z
-2,33 0
Solução: testes z de duas amostras
para a diferença entre proporções
x1 301 x2 357
pˆ1 = = = 0.064 pˆ 2 = = = 0.083
n1 4700 n2 4300
x1 + x2 301 + 357
p= = 0.0731
n1 + n2 4700 + 4300
q = 1 − p = 1 − 0.0731 = 0.9269
Note:
𝑛1 𝑝lj = 4700(0.0731) ≥ 10 𝑛1 𝑞lj = 4700(0.9269) ≥ 10
𝑛2 𝑝lj = 4300(0.0731) ≥ 10 𝑛2 𝑞lj = 4300(0.9269) ≥ 10
Solução: testes z de duas amostras
para a diferença entre proporções
s12
é chamada de distribuição F. F= 2
s2
Propriedades da distribuição F
g.l.N = 1 e g.l.D = 8
g.l.N = 8 e g.l.D = 26
g.l.N = 16 e g.l.D = 7
g.l.N = 3 e g.l.D = 11
F
1 2 3 4
Valores críticos para a distribuição F
Encontre o valor F crítico para um teste unicaudal à direita quando α = 0,05, g.l.N = 6 e g.l.D = 29
Solução:
•Quando realizar teste de hipótese bicaudal usando a distribuição F, só é
necessário encontrar o valor da cauda à direita.
•Usar a tabela ½α.
1 1
= (0.05) = 0.025
2 2
½α = 0,025, g.l.N = 4 e g.l.D = 8
2
s1
• Teste estatístico F= 2
s2
Em palavras Em símbolos
1. Identifique a afirmação.
Expresse H0 e Ha.
Expresse as hipóteses nula e
alternativa. Identifique .
2. Especifique o nível de
significância. g.l.N = n1 – 1
3. Identifique os graus de g.l.D = n2 – 1
liberdade.
4. Determine o valor crítico. Use a tabela
Em palavras Em símbolos
5. Determine a região de
rejeição. 𝑠12
𝐹= 2
𝑠2
6. Calcule o teste estatístico.
7. Tome a decisão de rejeitar Se F está na área de rejeição,
ou falhar em rejeitar a rejeite H0. Se não, não
hipótese nula. rejeite H0.
8. Interprete a decisão no
contexto da afirmação
original.
Exemplo: realizar teste F para duas amostras
0 1,56 1.96 F
Exemplo: realizar teste F para duas amostras
Você quer comprar ações em uma empresa e está decidindo entre duas ações diferentes.
Você sabe que o risco de uma ação pode ser associado ao desvio padrão dos preços no
seu fechamento diário. Você seleciona aleatoriamente amostras dos preços de um dia de
fechamento para cada ação e obtém os resultados abaixo. Com α = 0,05, você pode
concluir que uma das duas ações é um investimento mais arriscado que a outra?
Suponha que os preços de fechamento da ação sejam normalmente distribuídos.
Ações A Ações B
n2 = 30 n1 = 31
s2 = 3,5 s1 = 5,7
Solução: realizar teste F para duas amostras
0 2.092,65 F
Exercícios
Uma fábrica de embalagens para produtos químicos está estudando dois processos para
combater a corrosão de suas latas especiais. Para verificar o efeito dos tratamentos, foram
usadas amostras cujos resultados estão no quadro abaixo (em porcentagem de corrosão
eliminada). Qual a conclusão sobre os dois tratamentos? (considere α=5%)
97
Exercícios
98
Exercícios
Para investigar a influência da opção profissional sobre o salário inicial de recém-formados,
dois grupos de profissionais foram investigados: um de liberais em geral e outro de
formados em administração de empresas. Com os resultados abaixo, expressos em salários
mínimos, quais seriam suas conclusões? (considere α=5%)
99
100
Objetivos
• Interpretar a distribuição F e usar uma tabela F para
encontrar valores críticos.
• Fazer um teste F de duas amostras para comparar duas
variâncias.
Teste t de duas amostras
para a diferença entre médias