베르누이 샘플링

Bernoulli sampling

유한집단 표본추출 이론에서 베르누이 표본추출모집단의 각 원소가 표본의 일부가 되는지를 결정하는 독립적베르누이 재판을 받는 표본추출 과정이다.베르누이 표본 추출의 필수적 특성은 모든 모집단 요소가 표본에 포함될 확률이 동일하다는 것이다.[1]

따라서 베르누이 표본 추출은 포아송 표본 추출의 특별한 경우다.포아송 표본 추출에서 모집단의 각 원소는 표본에 포함될 확률이 다를 수 있다.베르누이 표본 추출에서는 모든 원소에 대해 확률이 동일하다.

모집단의 각 요소는 표본에 대해 별도로 고려되기 때문에 표본 크기는 고정되지 않고 오히려 이항 분포를 따른다.

가장 기본적인 베르누이 방법은 n개 항목의 모집단에서 표본을 추출하기 위해 n개의 랜덤 변수를 생성한다.모집단의 지정된 백분율 pct를 추출한다고 가정합시다.알고리즘은 다음과 같이 설명할 수 있다.[2]

세트의 각 항목에 대해 (R mod 100) > pct인 경우 음이 아닌 임의의 정수 R을 생성한다.
n의 네 값에 대한 f(k, n, 0.2) 스케일링.

20%의 퍼센트는 일반적으로 확률 p=0.2로 표현된다.이 경우, 무작위 변동은 단위 간격에 생성된다.알고리즘을 실행한 후, 크기 k의 샘플이 선택될 것이다.어떤 사람은 p 을(를) 가질 것으로 예상할 수 있는데 이는 n이 커질수록 점점 더 가능성이 높아진다.실제로 이항 분포에 의해 k의 표본 크기를 얻을 확률을 계산할 수 있다.

왼쪽에는 p= 의 4개 값에 대해 이 함수가 표시된다 의 다른 값에 대한 을 비교하기 위해 압시사의 k k[에서 장치 간격, w, w,함수의 값을 세로좌표로 곱하여 그래프 아래 영역이 동일한 값을 유지하도록 함수의 값을 역수로 곱한다. 즉, 해당 누적 분포 함수와 관련이 있다.값은 로그 척도로 표시된다.

사례의 95%에서 베르누이 표본 크기가 오차 범위 내에 있는 n의 값.

오른쪽에서 95% 확률로 주어진 오차 한계를 충족하는 의 최소값.오류가 발생하면 범위 내 집합을 다음과 같이 설명할 수 있다.

내에 끝날 확률은 이항 분포에 의해 다음과 같이 다시 주어진다.

( k, , )

에는 n 최저 값이 표시되며, 합계는 최소 0.95이다.= .0= 의 경우 알고리즘은 모든 s에 대해 정확한 결과를 전달한다. p 사이의 이분법을 통해 얻는다.Note that, if is an integer percentage, , guarantees that . Values as high as can be required for such an exact match.

참고 항목

참조

  1. ^ Carl-Erik Sarndal, Bengt Swensson, Jan Wretman (1992). Model Assisted Survey Sampling. ISBN 9780387975283.{{cite book}}: CS1 maint: 작성자 매개변수 사용(링크)
  2. ^ Voratas Kachitvichyanukul; Bruce W. Schmeise (1 February 1988). "Binomial Random Variate Generation". Communications of the ACM. 31 (2).

외부 링크