Probabilidade e Estatística para Engenheiros
Probabilidade e Estatística para Engenheiros
Probabilidade e Estatística para Engenheiros
DEPARTAMENTO DE ESTATÍSTICA
PROBABILIDADE E ESTATÍSTICA
PARA ENGENHEIROS :
IDÉIAS INICIAIS DE
AMOSTRAGEM
São Carlos - SP
Amostragem
2.1 - Introdução
Vamos agora considerar a situação em que deseja-se coletar
informações de indivíduos ou peças, de um universo já existente. Mesmo que
hajam variáveis independentes, vamos supor que os seus valores não sejam
pré-fixados e controlados, como no caso experimental.
Suponha que exista uma população de itens já fabricados, e
armazenados em almoxarifado; e que deseja-se obter informações sobre essa
produção.
Na maioria dos casos torna-se impossível observar toda a
população, por motivos financeiros, ou por limite de tempo, ou restrição na
locomoção para registro dos dados, etc., então trabalha-se com o que é
acessível, isto é, uma parte da população, chamada amostra. O ideal é que
esse subgrupo venha com a maioria das características da população, para que
possa representa-la..
Para a escolha dos elementos que farão parte da amostra, deve-se
usar regras bem objetivas, com critérios pré estabelecidos, que facilitem a
repetição da coleta pelo próprio pesquisador, ou por outro pesquisador que
queira repetir a experiência em outro momento ou lugar.
Essas regras começam pela forma como os dados são coletados,
ou seja, como as unidades amostrais são escolhidas para fazerem parte da
pesquisa. Elas podem ser:
EXEMPLO 2.1:
se desejarmos tirar uma amostra de 100 parafusos de uma caixa de
10000, evidentemente não é prático o uso de sorteio tendo como referência os
números sorteados em loteria federal, ou o uso de misturador automático de
jogos de bingo, pois seria muito trabalhosa, mas se procederá à retirada
simplesmente a esmo. Por outro lado para retirar uma amostra de concreto da
produção de uma usina de concreto, pode-se retirar uma pá de tempos em
tempos enquanto a betoneira faz a aleatorização.
Esquemáticamente:
EXEMPLO 2.2:
EXEMPLO 2.3:
Às vezes o material em um depósito é a amostra da fábrica, assim
como os clientes registrados em uma firma de crédito, possam ser uma amostra
dos clientes em potencial .
EXEMPLO 2.4:
OBSERVAÇÃO:
Embora não se consiga uma amostra que seja uma miniatura da
população, devemos fazer o possível para que a amostra seja a mais
representativa da população. Por isso devemos obtê-la com cuidado, e o ideal é:
a) aplicar a técnica de amostragem adequada;
b) o tamanho amostral, n, deve ser tão grande quanto possível. Quanto mais
próximo de N, mais informativa é a amostra (lembre-se que N pode ser ).
c) Ao planejarmos a coleta de uma amostra, deve-se levar em consideração, que
essa coleta deve ser de tal modo que outro pesquisador, em lugares
diferentes ou não, realizando o mesmo tipo de pesquisa, possa coletar uma
amostra, com características semelhantes, se adotarem o mesmo
procedimento de coleta, na mesma população.
EXEMPLO 2.5:
Suponha uma pesquisa em que se deseja saber o motivo pelo qual
o aluno de engenharia escolheu o seu curso. Uma amostra obtida em sala de
aula não é muito representativa, quando apresenta os seguintes fatos:
i) não são alunos recem-ingressos;
ii) existem alunos de outros cursos de graduação, ou pós-graduação, na
amostra;
iii) a amostra é constituída de alunos que se destacam dos demais, por exemplo,
alunos que passaram na segunda fase do vestibular;
Se por algum motivo não for possível obter uma amostra que
“REPRESENTE” a população, tendo os vícios da falta de aleatoridade, deve-se
tomar muito cuidado e talvez rever o conjunto definido como população, para que
não haja grandes erros de inferência. De preferência, não se faz inferência
nesse caso.
Deve-se evitar o VÍCIO AMOSTRAL, que vem da tendenciosidade
das informações. É quando existe uma tendência na seleção das unidades
amostrais, favorecendo uma dada característica particular.
EXEMPLO 2.7:
Para a pesquisa em que se estuda o peso de chapas de aço, se o
peso das chapas for feito em duas balanças, teremos duas coletas de dados com
n=5 como segue :
para a primeira balança temos as medidas: 62, 52, 66, 64, 68 , e
para a segunda balança temos as medidas: 56, 57, 56, 55, 56
pode-se dizer que o erro amostral é maior na primeira experiência, pois os dados
estão mais dispersos entre si, o que implica em distâncias maiores com relação
ao parâmetro populacional a ser estimado, embora não conheçamos esse
parâmetro.
EXEMPLO 2.8:
a) Lista dos funcionários de uma empresa.
b) Lista das chapas de aço produzidas por determinada prensa.
c) Arquivo dos registros das geladeiras produzidas.
d) Lista de firmas como compradores em potencial.
e) Fichário dos registros das caixas em estoque.
f) Planilha com os registros dos corpos de prova testados em determinado
laboratório.
EXEMPLO 2.9:
De uma listagem de 500 estabelecimentos industriais ou
comerciais, seleciona-se 50 estabelecimentos, numerando tais estabelecimentos
e utilizando um esquema de sorteio tipo misturador de jogo de bingo.
OBSERVAÇÃO:
As estatísticas a serem estudadas mais adiante serão adequadas
para a amostra aleatória simples com reposição; ou sem reposição no caso em
que a população pode ser considerada infinita.
Para os outros tipos de amostragem, as estatísticas são mais
elaboradas do que aquelas que iremos estudar nesta apostila. Caso o aluno
necessite futuramente de análise estatística para dados obtidos em amostragem
diferente da amostra aleatória simples com reposição, deverá recorrer a livros
específicos de amostragem ou a assessoria estatística.
OBSERVAÇÃO:
O problema que aparece na amostra aleatória simples sem
reposição, é quando N é finito. Nesse caso à cada retirada, existirá uma
alteração do tamanho populacional, que pode ser significante, alterando
consequentemente a probabilidade de escolha desses elementos. Por esse
motivo, no cálculo de algumas estatísticas, deve-se levar em conta a razão n/N
como um fator de correção, por se estar trabalhando com amostra sem
reposição. Como havíamos comentado, esse e os outros casos a seguir
envolvem modificações nos cálculos das estatísticas, o que será deixado para
um curso mais específico.
EXEMPLO 2.10:
Considere que uma fábrica encomenda um lote de certa matéria
prima, que chega em vasilhames transportadas por carretas. Os vasilhames
são colocados no pátio da fábrica em um total de 20.000 vasilhames. Ocorre
que a história sobre esse tipo de carregamento, tem mostrado que a matéria
prima nem sempre tem vindo uniformemente, dentro das especificações
requeridas. Para verificar se o lote deve ser aceito ou não, o engenheiro
responsável coleta uma amostra de 15 vasilhames, para que seus conteúdos
sejam analisados em laboratório. Então uma forma de escolher essa amostra
seria numerando os vasilhames existentes no pátio, de 00001 a 20000,
sorteando então 15 números entre os mesmos. Esse tipo de amostragem é
Aleatória Simples sem reposição.
OBSERVAÇÃO:
O MINITAB faz o sorteio com e sem reposição, o padrão é obter
amostra aleatória simples sem reposição, mas caso se queira obter uma amostra
aleatória simples com reposição, basta marcar com um “click” do mouse no lugar
apropriado, dentro da janela “Sample From Colum”
EXEMPLO 2.13:
Para obter o perfil dos candidatos a cargos de gerência de uma
industria, suponha que temos 500 candidatos, registrados segundo a ordem de
inscrição, que seria a população alvo. As pastas arquivadas com os registros
dos candidatos, seria o Sistema de Referência que substituiria a Listagem. Se a
amostra a ser analisada for de 20 candidatos, tem-se:
N=500 e n=20
daí, para obter a amostra de tamanho 20 sistematicamente, deve-se tomar as
500 pastas arquivadas e dividi-las em 20 grupos ou períodos de tamanho
500/20=25,
população
elemento 17o 42o 67o 92o ........ 492o
AMOSTRA
OBSERVAÇÃO:
Lembre-se que o cálculo das estatísticas a serem calculadas na
amostragem sistemática difere daquelas calculadas na amostragem aleatória
simples.
EXEMPLO 2.14:
POPULAÇÃO
NB
NA
NC
SUB-POPULAÇÃO
ND ou ESTRATO C
NA NB NC ND N
Em geral os elementos dentro do estrato são mais homogêneos, o
que implica no fato da variabilidade dentro de cada estrato ser menor que a
variabilidade entre os estratos (elementos mais heterogêneos entre estratos).
Para a obtenção de uma amostra estratificada, coleta-se uma sub-
amostra de cada estrato, pelo método de amostram aleatória simples.
OBSERVAÇÃO:
Note que, no fundo a amostragem estratificada tenta controlar uma
ou mais variáveis secundárias. Os estratos têm função semelhante aos blocos
na pesquisa experimental, sendo que os blocos eram os elementos sob controle
por certa variável secundária, aos quais seriam aplicados os diversos
tratamentos, enquanto os estratos são grupos existentes na população com a
mesma categoria da variável secundária.
EXEMPLO 2.15:
Suponha que uma grande industria de papel, constituída de 5
fábricas, deseja fazer uma pesquisa sobre a umidade e a diagramação em
função do tipo de árvore e tipo do papel, depois de certo tempo de estocagem.
Para tal deverá registrar: tipo de árvore, tempo de estocagem, umidade e
diagramação. Ocorre que a fábrica deverá também ser controlada, pois existe a
possibilidade de haver diferença de produção de fábrica para fábrica, e sendo
assim, uma amostra aleatória em apenas uma delas poderá trazer resultados
diferentes do total. Por esse motivo, as 5 fábricas deverão ser consideradas
estratos. Sendo um levantamento, porque o papel já se encontra em estoque,
esperando apenas ser apanhado na amostragem.
OBSERVAÇÃO:
A amostra estratificada é obtida pela seleção de sub-amostras,
supondo uma AAS de cada estrato da população. O conjunto de sub-amostras é
a amostra estratificada. Ela será proporcional quando as porcentagens dos
estratos são as mesma na população e na amostra.
Esquematicamente:
POPULAÇÃO
NB AAS de nB
NA
elementos
NC
AAS
ND
AAS
AAS AMOSTRA
EXEMPLO 2.16:
fábrica A B C D E
tamanho Ni 250.000 ut 380.000 ut 570.000 ut 466.000 ut 880.000 ut
N=2.546.000 ut
com a fábrica E tendo a maior produção, 880/2546= 34,56%.
Suponha que deseja-se obter uma amostra de 5000 ut. Para isso,
a fábrica E deverá fornecer 34,56x5000=1728 ut para a amostra. Essas 1728 ut
deverão vir para a amostra por sorteio, supondo que todas as peças do estoque
da fábrica têm a mesma chance, ou seja, obtém-se uma amostra aleatória
simples dentro de cada fábrica.
EXEMPLO 2.17:
Imagine que um fornecedor oferece um determinado componente
eletrônico, como tendo menor preço que o concorrente, e porcentagem de
defeito no primeiro uso de 3%, idêntico ao concorrente. Para verificar a
veracidade de tal afirmação, você faz uma pesquisa no almoxarifado dessa
fábrica. Ocorre que tais componentes são armazenados em caixas de 10
peças, e é impossível se sortear peças, uma vez que as mesmas sendo de
pequeno porte, não são numeradas uma a uma. Não existindo, portanto, um
sistema de referência com a lista das peças, e sim das caixas contendo 5 peças,
como coletar a amostra? Supondo que o tamanho amostral pretendido seja de
100 peças, bastariam 100/5=20 caixas para serem escolhidas. Assim, sorteia-
se uma amostra aleatória simples de 20 caixas, pesquisando-se em seguida o
conteúdo das mesmas.
OBSERVAÇÃO:
EXEMPLO 2.18:
Suponha uma pesquisa de mercado a ser efetuada em uma cidade
de 200.000 habitantes. O que ocorre em geral, em pesquisas desse tipo, é que
não é possível se ter acesso a um sistema de referência em que todos os
habitantes dessa cidade estejam listados. Mas no entanto, em muitas delas é
possível se ter acesso a uma lista das ruas, ou em outras, delas é possível se ter
acesso a um mapa cujos quarteirões sejam bem definidos, de modo que seja
possível numera-los e lista-los. Nesse caso, os quarteirões seriam os
conglomerados. Mas ainda existe a dificuldade de se entrevistar todos os
elementos de todas as residências dos quarteirões sorteados. Então o que se
faz, é um sorteio de 1 ou mais residências, dentro do quarteirão sorteado,
entrevistando-se finalmente, os moradores das residências sorteadas. Os
números de quarteirões e de residências a serem sorteadas, dependerão do
tamanho amostral, que deve ser fixado antecipadamente, digamos n. A partir de
então, deve-se ter uma idéia do tamanho dos conglomerados menores, as
c) como uma amostra grande traz quase toda informação da população. Quando
o comportamento da variável em estudo já é bem conhecido (ou
aproximadamente) por outras experiências, a atualização de uma amostra que
tenha sido sem o rigor técnico (aleatório, etc.) pode ser valorizada quando
usada em conjunto com as informações das outras pesquisas. Isso porque as
informações das outras pesquisas, no fundo tem a função de inflar a amostra.
Wh2 s 2
h
wh
o tamanho da amostra é calculado pela fórmula: n 1
,
V Wh s h 2 2
N
EXERCÍCIOS:
1. Escolha revistas científicas de sua área, e procure nas mesmas artigos que citem a
forma de coleta dos dados. Trata-se de amostragem? Qual a técnica de amostragem
utilizada? Note que em geral a coleta dos dados é citada dentro do tópico
“MATERIAL E MÉTODOS”.
2. Imagine que você se forma e é contratado por determinada industria fabricante de
eletrodomésticos para inicialmente fazer uma pesquisa de mercado para analisar a
possibilidade de fazer um lançamento de um certo produto. Imagine você se
incumbindo dessa pesquisa:
a) Trata-se de experimento ou levantamento?
b) Como você planejaria a coleta dos dados? Qual técnica você usaria? Porque não
usar as outras técnicas disponíveis? (comente a vantagem e a desvantagem de cada
uma das técnicas)
c) Qual seria a unidade da pesquisa? (amostral ou experimental)
d) Imagine o produto a ser lançado no mercado, e as variáveis a serem coletadas na
pesquisa. Quais seriam essas variáveis? Quais delas seriam qualitativas e quais
quantitativas?
e) Como seria possível aplicar a técnica de pesquisa piloto?
BIBLIOGRAFIA