베르누이 샘플링
Bernoulli sampling유한집단 표본추출 이론에서 베르누이 표본추출은 모집단의 각 원소가 표본의 일부가 되는지를 결정하는 독립적인 베르누이 재판을 받는 표본추출 과정이다.베르누이 표본 추출의 필수적 특성은 모든 모집단 요소가 표본에 포함될 확률이 동일하다는 것이다.[1]
따라서 베르누이 표본 추출은 포아송 표본 추출의 특별한 경우다.포아송 표본 추출에서 모집단의 각 원소는 표본에 포함될 확률이 다를 수 있다.베르누이 표본 추출에서는 모든 원소에 대해 확률이 동일하다.
모집단의 각 요소는 표본에 대해 별도로 고려되기 때문에 표본 크기는 고정되지 않고 오히려 이항 분포를 따른다.
예
가장 기본적인 베르누이 방법은 n개 항목의 모집단에서 표본을 추출하기 위해 n개의 랜덤 변수를 생성한다.모집단의 지정된 백분율 pct를 추출한다고 가정합시다.알고리즘은 다음과 같이 설명할 수 있다.[2]
세트의 각 항목에 대해 (R mod 100) > pct인 경우 음이 아닌 임의의 정수 R을 생성한다.
20%의 퍼센트는 일반적으로 확률 p=0.2로 표현된다.이 경우, 무작위 변동은 단위 간격에 생성된다.알고리즘을 실행한 후, 크기 k의 샘플이 선택될 것이다.어떤 사람은 p 약 을(를) 가질 것으로 예상할 수 있는데 이는 n이 커질수록 점점 더 가능성이 높아진다.실제로 이항 분포에 의해 k의 표본 크기를 얻을 확률을 계산할 수 있다.
왼쪽에는 과 p= 의 4개 값에 대해 이 함수가 표시된다 의 다른 값에 대한 을 비교하기 위해 압시사의 k k는[에서 장치 간격, w, w,함수의 값을 세로좌표로 곱하여 그래프 아래 영역이 동일한 값을 유지하도록 함수의 값을 역수로 곱한다. 즉, 해당 누적 분포 함수와 관련이 있다.값은 로그 척도로 표시된다.
오른쪽에서 95% 확률로 주어진 오차 한계를 충족하는 의 최소값.오류가 발생하면 의범위 내 집합을 다음과 같이 설명할 수 있다.
내에 끝날 확률은 이항 분포에 의해 다음과 같이 다시 주어진다.
( k, , )
에는 n 의 최저 값이 표시되며, 합계는 최소 0.95이다.= .0 및 = 의 경우 알고리즘은 모든 s에 대해 정확한 결과를 전달한다. p 사이의 는 이분법을 통해 얻는다.Note that, if is an integer percentage, , guarantees that . Values as high as can be required for such an exact match.
참고 항목
참조
- ^ Carl-Erik Sarndal, Bengt Swensson, Jan Wretman (1992). Model Assisted Survey Sampling. ISBN 9780387975283.
{{cite book}}
: CS1 maint: 작성자 매개변수 사용(링크) - ^ Voratas Kachitvichyanukul; Bruce W. Schmeise (1 February 1988). "Binomial Random Variate Generation". Communications of the ACM. 31 (2).