Nothing Special   »   [go: up one dir, main page]

2021 - Aula 9 - Teste de Hipótese 2 Amostras

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 102

Prof.

Regina Meyer Branski

Teste de hipótese para duas amostras

1
Testar diferença entre médias
• Amostras grandes e pequenas
(independentes)

Testar diferença entre médias


• Amostras dependentes

Objetivos Gerais
Testar diferença entre
proporções

Testar diferença entre


variâncias
Testar a diferença entre médias
(amostras grandes e independentes)
Determinar se duas amostras são dependentes
ou independentes

Objetivos da Aula
Realizar um teste-z de duas amostras para
testar a diferença entre duas médias μ1 e μ2
usando amostras grandes e independentes
Comparar parâmetros de duas
populações

Métodos de amostragem
Teste de hipótese de
• Amostras independentes
duas amostras
• Amostra selecionada de uma população não
tem relação com a da segunda população
• Amostras dependentes (pareadas ou
combinadas)
• Cada elemento de uma amostra corresponde
à um membro da outra amostra
Amostras dependentes e independentes
Amostras dependentes e
independentes

Amostra 1: Os batimentos cardíacos de 35


indivíduos em repouso antes de tomar café

Amostra 2: Os batimentos cardíacos dos


mesmos indivíduos depois de tomar duas
xícaras de café.
Amostras dependentes e independentes

Amostra 1: Os batimentos cardíacos de 35 indivíduos em repouso antes de


tomar café
Amostra 2: Os batimentos cardíacos dos mesmos indivíduos depois de tomar
duas xícaras de café.

Amostras dependentes
Amostras podem ser pareadas com respeito à cada indivíduo)
Exemplo: amostras
dependentes e independentes

Amostra 1: Pontuações de testes de 35 estudantes de estatística.


Amostra 2: Pontuações de testes de 42 estudantes de biologia que não
estudam estatística.
Exemplo: amostras
dependentes e independentes

Amostra 1: Pontuações de testes de 35 estudantes de estatística.


Amostra 2: Pontuações de testes de 42 estudantes de biologia que não estudam
estatística.

Amostras independentes
Não é possível formar um par entre os membros das duas amostras; os
tamanhos das amostras são diferentes, e os dados representam pontuações
para diferentes indivíduos.
Testes de hipótese de duas
amostras independentes
1. Hipótese nula H0
• Uma hipótese estatística que geralmente declara que não há diferença
entre os parâmetros de duas populações.
• Sempre contém o símbolo , =, ou .
2. Hipótese alternativa Ha
• Uma hipótese estatística que é verdadeira quando H0 é falsa.
• Sempre contém o símbolo >, , ou <.
Testes de hipótese de duas
amostras com amostras independentes

H0: μ1 = μ2 H0: μ1 ≤ μ2 H0: μ1 ≥ μ2


Ha: μ1 ≠ μ2 Ha: μ1 > μ2 Ha: μ1 < μ2

Independentemente de cada hipótese que usar, sempre presumirá que não


existe diferença entre a média populacional, ou μ1 = μ2.
Teste z de duas amostras para a
diferença entre médias

Três condições necessárias para um teste z para a diferença de duas médias


populacionais: μ1 e μ2.
1. As amostras são aleatoriamente selecionadas.
2. As amostras são independentes.
3. Cada amostra tem pelo menos 30, ou, então, as populações têm
distribuição normal com desvio padrão conhecido.
Teste z de duas amostras
para a diferença entre médias
Requisitos prenchidos, a distribuição das amostras para (a diferença das
médias amostrais) é uma distribuição normal com
x1 − x2

Média:  x − x =  x −  x = 1 − 2
1 2 1 2

Erro padrão:  x − x =  12  22
 x2 +  x2 = +
1 2 1 2
n1 n2

Distribuição amostral para:


x1 − x2
x1 − x2
−σ x − x
1 2
1 − 2 σ x −x
1 2
Teste z de duas amostras
para a diferença entre médias

• O teste estatístico é x1 − x2
• O teste estatístico padronizado é

• Para amostras grandes, pode usar s1 e s2 no lugar de 1 e 2.


• Para amostras não grandes, pode usar teste-z se as populações são
distribuídas normalmente e os desvios padrões populacionais são
conhecidos.
Usando um teste z de duas amostras para a diferença entre médias
(amostras grandes e independentes)

Em palavras Em símbolos

1. Expresse a afirmação matematicante. Identifique


Declare H0 e Ha.
as hipóteses nula e alternativa.
2. Especifique o nível de significância.
Identifique .
3. Faça a distribuição amostral.
4. Determine o(s) valor(es) crítico(s).
5. Determine a(s) região(ões) de rejeição.
Use a tabela.
Usando um teste z de duas amostras para a diferença entre médias
(amostras grandes e independentes)

Em palavras Em símbolos

6. Encontre o teste estatístico padronizado.


z=
( x1 − x2) − (1 − 2)
 x −x
7. Tome a decisão entre rejeitar ou falhar em 1 2

rejeitar a hipótese nula.


Se z está na região de rejeição,
8. Interprete a decisão no contexto da afirmação rejeite H0. Do contrário, falhe em
original. rejeitar H0.
Exemplo: teste-z de duas amostras para a
diferença entre médias
Uma organização de educação de consumidores afirma que há uma diferença entre a
média da dívida do cartão de crédito de homens e mulheres nos Estados Unidos. Os
resultados de uma pesquisa aleatória de 200 indivíduos de cada grupo são mostrados a
seguir. As duas amostras são independentes. Os resultados apoiam a afirmação da
organização? Use α = 0,05.

H0: µ1 = µ2 z=
(x1 − x2) − (1 − 2)
H1: µ1 ≠ µ2  x −x
1 2

α = 0,05
Mulheres (1) Homens (2)
x1 = $2290 x2 = $2370

0,025 0,025 s1 = $750 s2 = $800


Z n1 = 200 n2 = 200
-1.96 0 1.96
Exemplo: teste-z de duas amostras
para a diferença entre médias
• H0: μ1 = μ2
• Ha: μ1 ≠ μ2 • Teste estatístico:
•  = 0,05 (2290 − 2370) − 0
z= = −1.03
• n1= 200 n2 = 200 2 2
750 800
• Região de rejeição: +
200 200
• Decisão: Falhar em rejeitar H0
No nível de significância de 5%, não
0,025 0,025 há evidência suficiente para apoiar a
Z afirmação da organização de que
-1.96 0 1.96 existe uma diferença na dívida média
do cartão de crédito entre homens e
-1,03 mulheres.
Exemplo: teste-z de duas amostras para a diferença entre
médias

A American Automobile Association afirma que a média do custo diário para refeições e
acomodações para férias no Texas é menor do que para férias na Virgínia. A tabela à
esquerda mostra os resultados de uma pesquisa aleatória de turistas em cada Estado. As
duas amostras são independentes. Em α = 0.01, existe evidência suficiente para apoiar a
afirmação?

Texas (1) Virginia (2)


x1 = $248 x2 = $252
s1 = $15 s2 = $22
n1 = 50 n2 = 35
Exemplo: teste-z de duas amostras
para a diferença entre médias
H0: μ1 ≥ μ2
• Decisão: Falha em rejeitar H0
H1: μ1< μ2 (af)
No nível de significância de 1%,
não existe evidência suficiente
para apoiar a afirmação da
• Região de rejeição: American Automobile
Association.

0,01
z
-2,33 0

-0,93
Teste-z de duas amostras para a
diferença entre médias
Em 1981, um estudo com 70 crianças selecionadas aleatoriamente (com menos de 3 anos
de idade) constatou que a média de tempo gasto em creche ou pré-escola por semana
era de 11,5 horas com um desvio padrão de 3,8 horas. Um estudo recente com 65
crianças selecionadas aleatoriamente constatou que a média de tempo gasto em creche
ou pré-escola por semana era de 20 horas e o desvio padrão de 6,7 horas. Em α=0,01,
teste a afirmação de que as crianças passam 9 horas por semana a mais na creche ou
pré-escola hoje do que em 1981.

H0: µ1 - µ2 = -9
H1: µ1 - µ2 ≠ -9
α=0,01

22
Teste-z de duas amostras para a diferença entre médias

Em 1981, um estudo com 70 crianças selecionadas aleatoriamente (com menos de 3 anos de idade) constatou
que a média de tempo gasto em creche ou pré-escola por semana era de 11,5 horas com um desvio padrão
de 3,8 horas. Um estudo recente com 65 crianças selecionadas aleatoriamente constatou que a média de
tempo gasto em creche ou pré-escola por semana era de 20 horas e o desvio padrão de 6,7 horas. Em
α=0,01, teste a afirmação de que as crianças passam 9 horas por semana a mais na creche ou pré-escola
hoje do que em 1981.

H0: μ1 - μ2 = -9
H1: μ1 - μ2≠ -9 0,005 0,005
Z
0 2,575
(x1 − x2) − (1 − 2)
-2,575
z=
 x −x
1 2

23
Teste-z de duas amostras para a diferença entre médias

24
Teste-z de duas amostras para a
diferença entre médias
A diferença entre a média anual de salário dos estatísticos em São Paulo e Rio de Janeiro é
maior que $ 6.000? Para decidir você seleciona uma amostra aleatória de estatísticos de
cada estado. O resultado de cada pesquisa são mostrados abaixo. Em α=0,10 o que você
deve concluir?

São Paulo Rio de Janeiro


x1= $67.900 x2 = $64.000
S1 = $8.875 S2 = $9.175
n1 = 45 n2 = 42

25
Teste-z de duas amostras para a diferença entre médias
A diferença entre a média anual de salário dos estatísticos em São Paulo e Rio de Janeiro é
maior que $ 6.000? Para decidir você seleciona uma amostra aleatória de estatísticos de
cada estado. O resultado de cada pesquisa são mostrados abaixo. Em α=0,10 o que você
deve concluir?

0,1
t
0 1,285
26
Teste z de duas amostras para a diferença entre médias

27
Objetivos da Aula

Realizar um teste-z de duas


amostras para testar a
Determinar se duas
diferença entre duas
amostras são dependentes
médias μ1 e μ2 usando
ou independentes.
amostras grandes e
independentes.
Distribuição Normal ou de Gauss
Testar a diferença entre médias
(amostras pequenas e independentes)
Objetivos

Realizar um teste t de duas amostras para a diferença


entre duas médias populacionais μ1 e μ2 usando
amostras pequenas e independentes.
Teste t de duas amostras para a diferença entre médias

Se amostras de tamanho menor que 30 são tomadas de populações


normalmente distribuídas, um teste t pode ser usado para testar a diferença
entre as médias populacionais μ1 e μ2
Três condições são necessárias
1. As amostras precisam ser selecionadas aleatoriamente
2. As amostras precisam ser independentes
3. Cada população precisa ter uma distribuição normal
Teste t de duas amostras
para a diferença entre médias
𝑥lj 1 − 𝑥lj 2 − 𝜇1 − 𝜇2
𝑡=
𝜎𝑥lj 1 −𝑥lj 2

𝑠12 𝑠22
𝜎𝑥lj 1 −𝑥lj 2 = +
𝑛1 𝑛2

g.l. = menor (n1 – 1) ou (n2 – 1)


Normal ou distribuição t?
Ambas amostras têm
tamanho mínimo 30? Sim Use o teste z.
Não

Ambas populações são Você não pode usar o


normalmente distribuídas? Não teste z ou teste t.

Sim
Use o teste t com
Desvios padrão das s12 s22
Não  x −x = +
populações são 1 2
n1 n2
conhecidos? g.l. = menor (n1 – 1) ou (n2 – 1).
Sim

Use o teste z.
Teste t de duas amostras para a diferença entre
médias (amostras pequenas e independentes)

Em palavras Em símbolos

1. Expresse a afirmação matematicamente. Expresse H0 e Ha.


Identifique as hipóteses nula e alternativa.
2. Especifique o nível de significância.
Identifique .
3. Identifique os graus de liberdade e faça a
distribuição amostral. g.l. = menor
(n1 – 1) ou (n2 – 1).
4. Determine o(s) valor(es) crítico(s).

Use a tabela
Teste t de duas amostras para a diferença entre
médias (amostras pequenas e independentes)

Em palavras Em símbolos

5. Determine a(s) região(ões) de rejeição.


6. Encontre o teste estatístico t=
(x1 − x2) − (1 − 2)
padronizado.  x −x
1 2

7. Tome a decisão de rejeitar ou falhar


Se t está na região de
em rejeitar a hipótese nula.
rejeição, rejeite H0. Se
8. Interprete a decisão no contexto da não, não rejeitar H0.
afirmação original.
Teste t de duas amostras para a diferença
entre as médias
As distâncias de frenagem de 8 Volkswagen GTIs e 10 Ford Focus foram testadas enquanto
viajavam a 60 milhas por hora em pista seca. Os resultados são mostrados abaixo. Você
pode concluir que existe uma diferença na média da distância de frenagem dos dois tipos
de carro? Use α = 0,01. Assuma que as populações são distribuídas normalmente e as
variâncias da população não são iguais. (Adaptado de Consumer Reports)

GTI (1) Focus (2)


x1 = 134ft x2 = 143ft
s1 = 6.9 ft s2 = 2.6 ft
n1 = 8 n2 = 10
Teste t de duas amostras para a diferença
entre as médias

• H0: μ1 = μ2 • Teste estatístico:


• Ha: μ1 ≠ μ2
(134 − 143) − 0
•  = 0,01 t= = −3.496
2 2
6.9 2.6
• g.l. = 8 – 1 = 7 +
8 10
• Região de rejeição:
• Decisão: Falha em rejeitar H0
0,005 0,005
No nível de significância 1%, não há
t evidência suficiente para concluir
-3.499 0 3.499
que as médias das distâncias de
-3,496 frenagem dos carros são diferentes.
Teste t de duas amostras para a diferença
entre as médias

Um fabricante afirma que o alcance de chamada (em pés) do seu telefone sem fio 2,4
GHz é maior do que o do seu principal concorrente. Você realiza um estudo usando 14
telefones selecionados aleatoriamente deste fabricante e 16 telefones similares — do
concorrente — selecionados aleatoriamente. Os resultados são mostrados abaixo. Em α
= 0,05, você pode apoiar a afirmação do fabricante? Assuma que as populações são
normalmente distribuídas.

Fabricante (1) Concorrente (2)


x1 = 1275ft x2 = 1250ft
s1 = 45 pés s2 = 30 pés
n1 = 14 n2 = 16
Solução: teste t de duas amostras para a
diferença entre as médias

• H0: μ1 ≤ μ2 Teste estatístico


• Ha: μ1 > μ2
•  = 0,05
• g.l.= 14 – 1 = 13
• Região de rejeição:

0,05
t
0 1,771
Teste Estatístico
𝑥lj 1 − 𝑥lj 2 − 𝜇1 − 𝜇2 𝑡=
1275−1250 − 0
= 1,76
𝑡= 𝜎𝑥lj 1 −𝑥lj 2
𝜎𝑥lj 1 −𝑥lj 2

𝑠12 𝑠22 452 302


𝜎𝑥lj 1 −𝑥lj 2 = + 𝜎𝑥lj 1 −𝑥lj 2 = + = 14,17
𝑛1 𝑛2 14 16
• H0: μ1 ≤ μ2 • Teste estatístico:
• Ha: μ > μ
1 2
•  = 0,05
𝑡 = 1,76
• g.l. = 14 -1= 13
• Região de rejeição:
• Decisão: Falha em Rejeitar H0

No nível de significância 5%, não


0,05 há evidência suficiente para apoiar
a afirmação do fabricante de que o
t
0 1,771 seu telefone tem um alcance de
chamada maior do que o do
1,76 concorrente.
Objetivos Realizar um teste t de duas amostras para a
diferença entre duas médias populacionais μ1
e μ2 usando amostras pequenas e
independentes.
Testando a diferença entre as médias
(amostras dependentes)
Objetivos

Realizar um teste t para testar a média da diferença para uma


população de dados emparelhados.
Teste t para a diferença entre médias

• Para realizar um teste de hipótese de duas amostras, primeiro encontre a diferença


entre cada dado emparelhado
• d = x1 – x2 Diferença entre as entradas para dados emparelhados.

• O teste estatístico é a média d dessas diferenças.

d Média das diferenças entre entradas de


d= dados emparelhados nas amostras
n
dependentes.
Teste t para a diferença entre médias

Três condições são necessárias à realização do teste:


1. As amostras devem ser selecionadas aleatoriamente.
2. As amostras devem ser dependentes (emparelhadas).
3. Ambas as populações devem ser normalmente distribuídas.
Se esses requisitos são alcançados, então a distribuição amostral para d é aproximada
de uma distribuição t com n – 1 graus de liberdade, onde n é o número de dados
emparelhados.

d
-t0 μd t0
Símbolos usados para o teste t para μd

Símbolo Descrição
n O número de dados emparelhados

d A diferença entre entradas para dados


emparelhados, d = x1 – x2

d A média hipotética das diferenças de dados


emparelhados na população
Símbolos usados para o teste t para μd

Símbolo Descrição

𝑑ሜ A média das diferenças entre as entradas de dados


emparelhados nas amostras dependentes
∑𝑑
𝑑ሜ =
𝑛

sd O desvio padrão das diferenças entre as entradas de


dados emparelhados nas amostras dependentes
2
(Σ𝑑)
ሜ 2
Σ(𝑑 − 𝑑) Σ𝑑 2 − 𝑛
𝑠𝑑 = =
𝑛−1 𝑛−1
Teste t para a diferença entre médias
• O teste estatístico é: ∑𝑑
𝑑ሜ =
𝑛

• O teste estatístico padronizado é: 𝑑ሜ − 𝜇𝑑


𝑡= 𝑠
𝑑
𝑛
• Os graus de liberdade são: g.l. = n – 1
Teste t para a diferença entre médias (amostras
dependentes)

Em palavras Em símbolos

1. Expresse a afirmação matematicamente.


Identifique as hipóteses nula e alternativa. Expresse H0 e Ha.

2. Especifique o nível de significância.


3. Identifique os graus de liberdade e faça a Identifique .
distribuição amostral. g.l. = n – 1
4. Determine o(s) valor(es) crítico(s).
Use a tabela se n > 29 use a última
fileira (∞) .
Teste t para a diferença entre médias
(amostras dependentes)
Em palavras Em símbolos
5. Determine a(s) região(ões) de rejeição.
d
6. Calcule e Use a tabela. d =
d sd. n

(d ) 2

(d − d ) 2 d −2
7. Encontre o teste estatístico padronizado. sd = = n
n −1 n −1

d − d
t=
sd n
Teste t para a diferença entre médias
(amostras dependentes)
Em palavras Em símbolos
8. Tome a decisão de rejeitar ou não rejeitar Se t está na região de rejeição,
a hipótese nula. rejeitar H0. Se não, falhar em rejeitar
H0.
9. Interprete a decisão no contexto da
afirmação original.
Teste t para a diferença entre médias
Um fabricante de tacos de golfe afirma que os golfistas podem diminuir seus placares
usando os tacos de golfe recém-projetados por ele. Oito jogadores de golfe são escolhidos
aleatoriamente e é pedido a cada um que forneça seu placar mais recente. Após usar os
novos tacos por um mês, é pedido novamente aos jogadores que forneçam seus placares
mais recentes. Os placares para cada um são mostrados na tabela. Assumindo que os
placares de golfe são distribuídos normalmente, existe evidência suficiente para apoiar a
afirmação do fabricante para α = 0.10?
Golfista 1 2 3 4 5 6 7 8
Placar (antigo) 89 84 96 82 74 92 85 91
Placar (novo) 83 83 92 84 76 91 80 91

H0: μ1 - μ2 = 0

H1: μ1 - μ2 > 0
Teste t para a diferença entre médias

d = (placar antigo) – (placar novo)

• H0: μd ≤ 0 • Teste estatístico:


• Ha: μd > 0
•  = 0,10
• g.l. = 8 – 1 = 7
• Decisão:
• Região de rejeição:

0,10
t
0 1,415
Teste t para a diferença entre médias
d = (placar antigo) – (placar novo)
 d 13
Antigo Novo d d2 d = = = 1.625
n 8
89 83 6 36
84 83 1 1
(d ) 2
96 92 4 16 d 2 −
sd = n
82 84 –2 4 n −1
74 76 –2 4
(13) 2
92 91 1 1 87 −
= 8
85 80 5 25 8 −1
91 91 0 0  3.0677
Σ = 13 Σ = 87
Teste t para a diferença entre médias
d = (placar antigo) – (placar novo)
• H0: μd ≤ 0 • Teste estatístico:
• Ha: μd > 0 d − d 1.625 − 0
t=   1.498
•  = 0.10 sd n 3.0677 8
• g.l. = 8 – 1 = 7
• Região de rejeição: • Decisão: Rejeitar H0

No nível de significância de 10%, os


0.10 resultados deste teste indicam que
depois de os jogadores de golfe
t
0 1.415 usarem os novos tacos, seus
1.498 placares foram significativamente
menores.
Teste t para a diferença entre médias (dados emparelhados)

Um legislador estadual quer determinar se seu índice de desempenho (0-100) mudou do


ano passado para este. A tabela a seguir mostra o índice de desempenho do legislador
para 16 eleitores selecionados aleatoriamente para o ano passado e para este. Em α=0,01
há evidência suficiente para concluir que o desempenho do legislador mudou? Assuma
que os índices de desempenho são normalmente distribuídos.

Eleitor 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Índice 60 54 78 84 91 25 50 65 68 81 75 45 62 79 58 80
(ano 1)
Índice 56 48 70 60 85 40 40 55 80 75 78 50 50 85 53 60
(ano 2)

60
Objetivo

Realizar um teste t para testar a média da diferença para uma população de


dados emparelhados
Testando a diferença
entre proporções
Objetivos

Realizar um teste z para a diferença entre duas proporções populacionais


p1 e p2.
• Usado para testar a diferença entre duas
Testes z de proporções populacionais, p1 e p2.
duas amostras • Três condições são necessárias para conduzir o
teste:
para 1. As amostras devem ser selecionadas
proporções aleatoriamente.
2. As amostras devem ser independentes.
3. As amostras devem ser grandes o bastante
para usar uma distribuição amostral normal.
n1p1  5, n1q1  5, n2p2  5, e n2q2  5.
Testes z de duas amostras para a diferença
entre proporções
• Se essas condições são alcançadas, então a distribuição amostral para
é uma distribuição normal pˆ − pˆ
1 2
• Média:  pˆ − pˆ = p1 − p2
1 2

• Uma estimativa ponderada de p1 e p2 pode ser encontrada usando

pq  + 
1 1
• Erro padrão:  pˆ − pˆ =
1 2
 n1 n2 

x1 + x2
p= , where x1 = n1 pˆ1 and x2 = n2 pˆ 2
n1 + n2
Testes z de duas amostras para a diferença
entre proporções

( pˆ1 − pˆ 2) − ( p1 − p2)
z=
pq  + 
1 1
 n1 n2 

x1 + x2
p= and q = 1 − p
n1 + n2
Testes z de duas amostras para a diferença entre proporções

Em palavras Em símbolos
1. Expresse a afirmação. Identifique a hipótese nula e Expresse H0 e Ha.
alternativa.
2. Especifique o nível de significância. Identifique .
3. Determine o(s) valor(es) críticos(s).
Use a Tabela
4. Determine a(s) região(ões) de rejeição.
5. Encontre a estimativa ponderada de p1 e p2. x1 + x2
p=
n1 + n2
Testes z de duas amostras para a diferença entre proporções

Em palavras Em símbolos

6. Encontre o teste estatístico padronizado. ( pˆ1 − pˆ 2) − ( p1 − p2)


z=
 1 1
pq  + 
7. Tome a decisão de rejeitar ou falhar em rejeitar a  n1 n2 
hipótese nula.
Se z está na região de rejeição,
8. Interprete a decisão no contexto da afirmação rejeite H0. Se não, não rejeitar
original. H 0.
Exemplo: testes z de duas amostras para a diferença entre
proporções

Em um estudo de 200 mulheres adultas selecionadas aleatoriamente e 250


homens adultos, ambos usuários de Internet, 30% das mulheres e 38% dos
homens disseram que planejam comprar on-line ao menos uma vez durante
o mês seguinte. Em α = 0,10, teste a afirmação de que há uma diferença
entre a proporção de mulheres e a proporção de homens, usuários de
Internet, que planejam comprar on-line.

1 = mulheres 2 = homens ( pˆ1 − pˆ 2) − ( p1 − p2)


z=
pq  + 
1 1
H0: p1 = p2
H1: p1≠ p2 (af)  n1 n2 
n1= 200, n2= 250
x1 + x2
α = 0,10 p= , where x1 = n1 pˆ1 and x2 = n2 pˆ 2
n1 + n2
Solução: testes z de duas amostras para a
diferença entre proporções

• H0: p1 = p2 • Teste estatístico:


• Ha: p1 ≠ p2
•  = 0,10
• n1= 200 , n2 = 250
• Região de rejeição:
• Decisão:

0,05 0,05
Z
-1,645 0 1,645
Solução: testes z de duas amostras para a diferença entre proporções

x1 = n1 pˆ1 = 60 x2 = n2 pˆ 2 = 95

x1 + x2 60 + 95
p= =  0.3444
n1 + n2 200 + 250

q = 1 − p = 1 − 0.3444 = 0.6556

Note:
n1 p = 200(0.3444)  5 n1q = 200(0.6556)  5
n2 p = 250(0.3444)  5 n2q = 250(0.6556)  5
Solução: testes z de duas amostras para a diferença entre proporções

( pˆ1 − pˆ 2 ) − ( p1 − p2 ) ( 0.30 − 0.38) − ( 0 )


z= 
1 1  1 1 
pq   +  ( 0.3444 )  ( 0.6556 )   + 
 n1 n2   200 250 
 −1.77
Teste z de duas amostras para a diferença entre proporções

• H0: p1 = p2 • Teste estatístico:


• Ha: p1 ≠ p2 z = −1.77
•  = 0,10
• Decisão: Rejeitar H0
• n1= 200 , n2 = 250
Há evidência suficiente no nível de
• Região de rejeição:
significância 10% para concluir que existe
uma diferença entre a proporção de
0,05 0,05
mulheres e a proporção de homens,
usuários de Internet, que planejam
z
-1.645 0 1.645 comprar on-line.
-1,77
Teste z de duas amostras para a diferença entre proporções

Uma equipe de pesquisa médica conduziu um estudo para testar o efeito de um


medicamento na redução de colesterol. Ao final do estudo, os pesquisadores descobriram
que dos 4.700 sujeitos selecionados aleatoriamente que tomaram o medicamento, 301
morreram de doenças do coração. Dos 4.300 sujeitos selecionados aleatoriamente que
tomaram um placebo, 357 morreram de doenças do coração. Em α = 0,01, você pode
concluir que a taxa de mortalidade por doenças do coração é menor para aqueles que
tomaram a medicação do que para aqueles que tomaram o placebo? (Adaptado de New
England Journal of Medicine)

1 = Medicação 2 = Placebo
Solução: testes z de duas amostras para a
diferença entre proporções

• H0: p1 ≥ p2 • Teste estatístico:


• Ha: p1 < p2
•  = 0,01
• n1= 4700 , n2 = 4300
• Região de rejeição: • Decisão:

0,01
z
-2,33 0
Solução: testes z de duas amostras
para a diferença entre proporções
x1 301 x2 357
pˆ1 = = = 0.064 pˆ 2 = = = 0.083
n1 4700 n2 4300
x1 + x2 301 + 357
p= =  0.0731
n1 + n2 4700 + 4300

q = 1 − p = 1 − 0.0731 = 0.9269

Note:
𝑛1 𝑝lj = 4700(0.0731) ≥ 10 𝑛1 𝑞lj = 4700(0.9269) ≥ 10
𝑛2 𝑝lj = 4300(0.0731) ≥ 10 𝑛2 𝑞lj = 4300(0.9269) ≥ 10
Solução: testes z de duas amostras
para a diferença entre proporções

( pˆ1 − pˆ 2 ) − ( p1 − p2 ) ( 0.064 − 0.083) − ( 0 )


z= 
1 1   1 1 
pq   +  ( 0.0731)  ( 0.9269 )   + 
 n1 n2   4700 4300 
 −3.46
Solução: testes z de duas amostras
para a diferença entre proporções
• H0: p1 ≥ p2 • Teste estatístico:
• Ha: p1 < p2
z = −3.46
•  = 0,01
• n1= 4700 , n2 = 4300 • Decisão: Rejeitar H0
• Região de rejeição:
No nível de significância de 1%, há evidência
suficiente para concluir que a taxa de
mortalidade por doenças do coração é menor
0,01 para aqueles que tomaram a medicação do
que para aqueles que tomaram o placebo.
z
-2.33 0
-3,46
• Realizamos um teste z para a diferença entre
Objetivos duas proporções populacionais p1 e p2.
Comparando duas variâncias
Objetivos

• Interpretar a distribuição F e usar uma tabela F para encontrar valores


críticos.
• Fazer um teste F de duas amostras para comparar duas variâncias.
Distribuição F

• Sejam representantes das variâncias amostrais de duas populações


diferentes.
• Se ambas populações são normais e as variâncias populacionais são
iguais, então a distribuição amostral de

s12
é chamada de distribuição F. F= 2
s2
Propriedades da distribuição F

1. A distribuição F é uma família de curvas determinadas por dois tipos de


graus de liberdade:
• Os graus de liberdade correspondentes à variância no numerador, denotado
por g.l.N.
• Os graus de liberdade correspondentes à variância no denominador, denotado
por g.l.D.
2. As distribuições F são representadas graficamente de forma positiva.
3. Área total sob cada curva de uma distribuição F é igual a 1.
Propriedades da distribuição F

4. Valores F são sempre maiores ou iguais a zero.


5. Para todas as distribuições F, o valor médio de F é aproximadamente 1.

g.l.N = 1 e g.l.D = 8
g.l.N = 8 e g.l.D = 26
g.l.N = 16 e g.l.D = 7
g.l.N = 3 e g.l.D = 11

F
1 2 3 4
Valores críticos para a distribuição F

1. Especifique o nível de significância .


2. Determine os graus de liberdade para o numerador, g.l.N.
3. Determine os graus de liberdade para o denominador, g.l.D.
4. Use a tabela para encontrar o valor crítico. Se o teste de hipótese é:
a. Unicaudal, use a tabela  F.
b. Bicaudal, use a tabela ½ F.
Exemplo: encontrando valores F críticos

Encontre o valor F crítico para um teste unicaudal à direita quando α = 0,05, g.l.N = 6 e g.l.D = 29

O valor F0 crítico é = 2.43.


Encontre o valor F crítico para um teste bicaudal quando
α = 0,05, g.l.N = 4 e g.l.D = 8.

Solução:
•Quando realizar teste de hipótese bicaudal usando a distribuição F, só é
necessário encontrar o valor da cauda à direita.
•Usar a tabela ½α.

1 1
 = (0.05) = 0.025
2 2
½α = 0,025, g.l.N = 4 e g.l.D = 8

O valor F0 crítico é = 5.05.


Teste F de duas amostras para variâncias

Para usar o teste F de duas amostras para comparar duas variâncias


populacionais, as seguintes condições devem ser obedecidas:
1. As amostras devem ser aleatoriamente selecionadas.
2. As amostras devem ser independentes.
3. Cada população deve ter uma distribuição normal.
Teste F de duas amostras para variâncias

2
s1
• Teste estatístico F= 2
s2

s21 e s22 representam as variâncias das amostras com s21 ≥ s22

Os graus de liberdade do numerador é glN = n1 – 1 e do denominador glD = n2 – 1


Teste F de duas amostras para variâncias

Em palavras Em símbolos

1. Identifique a afirmação.
Expresse H0 e Ha.
Expresse as hipóteses nula e
alternativa. Identifique .
2. Especifique o nível de
significância. g.l.N = n1 – 1
3. Identifique os graus de g.l.D = n2 – 1
liberdade.
4. Determine o valor crítico. Use a tabela
Em palavras Em símbolos
5. Determine a região de
rejeição. 𝑠12
𝐹= 2
𝑠2
6. Calcule o teste estatístico.
7. Tome a decisão de rejeitar Se F está na área de rejeição,
ou falhar em rejeitar a rejeite H0. Se não, não
hipótese nula. rejeite H0.
8. Interprete a decisão no
contexto da afirmação
original.
Exemplo: realizar teste F para duas amostras

Um gerente de restaurante está fazendo um sistema que diminui a variância de


tempo que os clientes esperam antes de terem suas refeições servidas. Com o
antigo sistema, uma amostra aleatória de 10 clientes teve uma variância de 400.
Com o novo sistema, uma amostra aleatória de 21 clientes teve uma variância de
256. Com α = 0,10, há evidência suficiente para convencer o gerente a mudar para o
novo sistema? Suponha que ambas as populações sejam normalmente distribuídas.
Solução: realizar teste F para duas amostras

• H0: σ12 ≤ σ22 • Teste estatístico:


• Ha: σ12 > σ22 s12 400
• α = 0,10 F = 2 =  1.56
s2 256
• g.l.N= 9 g.l.D= 20
• Região de rejeição: • Decisão: Falha em rejeitar H0

Não há evidência o suficiente para convencer o


0,10 gerente a mudar para o novo sistema.

0 1,56 1.96 F
Exemplo: realizar teste F para duas amostras

Você quer comprar ações em uma empresa e está decidindo entre duas ações diferentes.
Você sabe que o risco de uma ação pode ser associado ao desvio padrão dos preços no
seu fechamento diário. Você seleciona aleatoriamente amostras dos preços de um dia de
fechamento para cada ação e obtém os resultados abaixo. Com α = 0,05, você pode
concluir que uma das duas ações é um investimento mais arriscado que a outra?
Suponha que os preços de fechamento da ação sejam normalmente distribuídos.

Ações A Ações B
n2 = 30 n1 = 31
s2 = 3,5 s1 = 5,7
Solução: realizar teste F para duas amostras

• H0: σ12 = σ22


• Ha: σ12 ≠ σ22 • Teste estatístico:
• ½α = 0,025 s12
F = 2 =
5.7 2
 2.65
2
• g.l.N= 30 g.l.D= 29 s2 3.5

• Região de rejeição: • Decisão: Rejeitar H0

Existe evidência o suficiente para apoiar a


0,025 afirmação de que uma das ações é um
investimento mais arriscado.

0 2.092,65 F
Exercícios
Uma fábrica de embalagens para produtos químicos está estudando dois processos para
combater a corrosão de suas latas especiais. Para verificar o efeito dos tratamentos, foram
usadas amostras cujos resultados estão no quadro abaixo (em porcentagem de corrosão
eliminada). Qual a conclusão sobre os dois tratamentos? (considere α=5%)

Método Amostra Média Desvio Padrão


A 15 48 10
B 12 52 15

97
Exercícios

98
Exercícios
Para investigar a influência da opção profissional sobre o salário inicial de recém-formados,
dois grupos de profissionais foram investigados: um de liberais em geral e outro de
formados em administração de empresas. Com os resultados abaixo, expressos em salários
mínimos, quais seriam suas conclusões? (considere α=5%)

Liberais 6,6 10,3 10,8 12,9 9,2 12,3 7


Administradores 8,1 9,8 8,7 10 10,2 8,2 8,7 10,1

99
100
Objetivos
• Interpretar a distribuição F e usar uma tabela F para
encontrar valores críticos.
• Fazer um teste F de duas amostras para comparar duas
variâncias.
Teste t de duas amostras
para a diferença entre médias

• Variâncias das populações são iguais


• Combinação de duas amostras para calcular uma
estimativa conjunta do desvio padrão
ˆ
ˆ =
(n1 − 1) s12 + (n2 − 1) s22
n +n −2
1 2

O erro padrão para a distribuição amostral de


x1 − x2é
1 1
 x −x = ˆ  +
1 2
n1 n2
g.l.= n1 + n2 – 2

Você também pode gostar