가중 산술 평균

Weighted arithmetic mean

가중 산술 평균은 일반 산술 평균(가장 일반적인 유형의 평균)과 유사하지만 각 데이터 지점이 최종 평균에 동일하게 기여하는 대신 일부 데이터 지점이 다른 데이터 지점보다 더 많이 기여합니다.가중평균의 개념은 기술 통계학에서 중요한 역할을 하며 수학의 여러 다른 영역에서도 보다 일반적인 형태로 발생한다.

모든 가중치가 같으면 가중 평균은 산술 평균과 동일합니다.가중평균은 일반적으로 산술평균과 유사한 방식으로 동작하지만 심슨의 역설에서 포착된 것과 같이 몇 가지 반직관적인 특성을 가지고 있습니다.

기본적인 예

다음과 같은 2개의 학교 수업(하나는 학생 20명, 1개는 학생 30명)과 각 반의 시험 성적:

오전반 = {62, 67, 71, 74, 76, 77, 78, 79, 79, 80, 80, 81, 82, 83, 84, 86, 89, 93, 98}

오후 클래스 = {81, 82, 83, 84, 85, 86, 87, 88, 89, 89, 89, 90, 90, 91, 92, 93, 93, 93, 94, 95, 96, 97, 98, 99}

오전 수업의 평균은 80이고 오후 수업의 평균은 90입니다.두 평균의 가중되지 않은 평균은 85입니다.그러나, 이것은 각 반의 학생 수(20 대 30)의 차이를 설명하지 않기 때문에, 85의 값은 (반과 무관한) 평균 학생 성적을 반영하지 않습니다.평균 학생 성적은 학급에 관계없이 모든 성적을 평균하여 얻을 수 있습니다(모든 성적을 합산하여 총 학생 수로 나눕니다).

또는 각 반의 학생 수에 따라 학급 수단에 가중치를 부여함으로써 이를 달성할 수 있다.클래스가 클수록 "가중치"가 높아집니다.

따라서 가중평균을 사용하면 각 학생의 점수를 몰라도 평균 학생 성적을 찾을 수 있습니다.각 반의 학급별 평균과 학생 수만 있으면 된다.

볼록 조합의 예

상대적인 가중치만 관련되므로 가중평균은 모두 1에 해당하는 계수를 사용하여 표현할 수 있습니다.이러한 선형 결합을 볼록 결합이라고 합니다.

위의 예에서는 다음과 같은 가중치를 얻을 수 있습니다.

그런 다음 다음과 같이 무게를 가합니다.

수학적 정의

형식적으로는 빈( x2, n가 아닌 유한 태플의 가중평균(x 1, x 2, …, n displaystyle 1}, },\에 대응하는 아닌 1, 2, n

다음과 같이 확장됩니다.

따라서 가중치가 높은 데이터 요소는 가중치가 낮은 요소보다 가중 평균에 더 많이 기여합니다.가중치는 음수일 수 없습니다.일부는 0일 수 있지만, 모두 0인 것은 아닙니다(0으로 나눌 수 없기 때문입니다).

공식은 가중치가 최대 1(즉, i i { _ w_{i}'=까지 합이 되도록 정규화될 때 단순화된다. 정규화된 가중치의 경우 가중 평균은 다음과 같다.

_

원래 가중치에 대해 다음과 같은 변환을 수행하면 가중치를 항상 정규화할 수 있습니다.

i { w { i } = sum { w { w _ { i } } { \ \ _ { j=}^{ n } { _ { j }}

일반 x {\1}{n \}{i}}}는 모든 데이터가 동일한 가중 평균의 특수한 경우이다.

데이터 요소가 독립적이고 이 2동일한 랜덤 변수일 경우 가중평균의 표준 인 "x _는 불확실성 전파를 통해 다음과 같이 표시될 수 있습니다.

분산 정의 가중치

x {\i}}이(가) 알려진 분산 {\ _인 서로 다른 확률 분포에서 잠재적으로 파생된 데이터 목록의 가중 평균에 대해 모두 동일한 평균을 가지며, 가중치에 대해 하나의 가능한 선택지가 분산 역수에 의해 주어진다.

이 경우 가중평균은 다음과 같습니다.

가중 평균(역평균 가중치)의 표준 오차는 다음과 같다.

0{ \ _ { i } \ { i } = \ displaystyle{ i= \ _ { }^{2} 으로 합니다.이는 이전 절의 일반 공식의 특수한 경우이다.

위의 방정식을 조합하여 다음을 얻을 수 있습니다.

이 선택의 중요성은 이 가중 평균이 확률 분포가 독립적이고 동일한 평균으로 정규 분포를 따른다는 가정 하에 확률 분포 평균의 최대우도 추정기라는 것입니다.

통계 속성

기대치

가중치 샘플 평균 \ style \ \ { )는 그 자체가 랜덤 변수입니다.기대값과 표준 편차는 다음과 같이 관측치의 기대값 및 표준 편차와 관련이 있습니다.단순화를 위해 정규화된 가중치(무게의 합계는 1)를 가정합니다.

관측치에 기대값이 있는 경우

가중 표본 평균에 대한 기대치가 있습니다.
특히 평균이 i μ \ _}=\인 경우 가중 표본 평균의 기대치는 이 값이 됩니다.

분산

단순 신분증 사건

가중치를 상수로 취급하고 상관 관계가 없는 랜덤 변수의 관측치 n개의 표본을 모두 동일한 분산과 기대(예: d 랜덤 변수의 경우)로 갖는 경우 가중 평균의 분산은 Kish의 설계 효과에 의한 분산의 곱으로 추정할 수 있습니다(증명 참조).

i ( - y ) n- { { _ { y }^{ } ={ _ { - { \ { }