정규 분포

연속 확률 분포의 하나

확률론통계학에서 정규 분포(正規 分布, 영어: normal distribution) 또는 가우스 분포(Gauß 分布, 영어: Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포는 수집된 자료의 분포를 근사하는 데에 자주 사용되며, 이것은 중심극한정리에 의하여 독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문이다.

정규 분포
확률 밀도 함수
붉은 색은 표준정규분포
붉은 색은 표준정규분포
누적 분포 함수
확률밀도함수의 색과 같은 색
확률밀도함수의 색과 같은 색
매개변수 평균
분산
지지집합
확률 밀도
누적 분포
기댓값
중앙값
최빈값
분산
비대칭도 0
첨도 0
엔트로피
적률생성함수
특성함수

정규분포는 2개의 매개 변수 평균 표준편차 에 대해 모양이 결정되고, 이때의 분포를 로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 표준 정규 분포(standard normal distribution)라고 한다.[1]

역사

편집

정규분포는 아브라암 드무아브르1733년 쓴 글에서 특정 이항 분포 이 클 때 그 분포의 근사치를 계산하는 것과 관련하여 처음 소개되었고 이 글은 그의 저서 《우연의 교의》(The Doctrine of Chances) 2판(1738년)에 다시 실렸다. 피에르시몽 라플라스는 그의 저서 《확률론의 해석이론》(Théorie analytique des probabilités)(1812년)에서 이 결과를 확장하였고 이는 오늘날 드무아브르-라플라스의 정리로 알려져있다.

라플라스는 실험 오차를 분석하면서 정규분포를 사용했다. 1805년에는 아드리앵마리 르장드르가 매우 중요한 방법인 최소제곱법을 도입했다. 카를 프리드리히 가우스는 이 방법을 1794년부터 사용해왔다고 주장했는데 1809년에는 실험 오차가 정규분포를 따른다는 가정하에 최소제곱법을 이론적으로 엄밀히 정당화했다.

성질

편집
 

위에서 첫 번째 적분은 홀함수의 적분으로 0이고 두 번째 적분은 가우스 적분으로 적분값이  로 잘 알려져 있다. 따라서 기댓값은  다.

  • 정규분포는 절대근사한다.
  • 정규분포는 평균과 표준편차가 주어져 있을 때 엔트로피를 최대화하는 분포이다.
  • 정규분포곡선은 좌우 대칭이며 하나의 꼭지를 가진다.
  • 정규분포는 중앙치에 사례 수가 모여있고, 양극단으로 갈수록 X축에 무한히 접근하지만 X축에 닿지는 않는다.[2]

표준 정규 분포

편집

정규 분포 밀도 함수에서  를 통해 X(원점수)를 Z(Z점수)로 정규화함으로써 평균이 0, 표준편차가 1인 표준정규분포를 얻을 수 있다.[1]

z-분포라고도 부른다. z-분포로 하는 검정(test)을 z검정(z-test)이라고 한다.

불확실성

편집

 에서 k값이 변화함에 따라 구해지는  값을 불확실성(uncertainty)이라고 한다. 예를 들어  를 90% 불확실성,  는 95% 불확실성,  은 99% 불확실성이다. 특히,  를 50% 불확실성이라고 하며, 확률오차(probable error)라고도 한다.[3] 이는 관측값이 전체 관측값의 50%에 있을 확률을 의미한다.[4]

같이 보기

편집

각주

편집
  1. 이재기 등. 2013, 83쪽.
  2. 김석우, 《기초통계학》, 학지사, 2007, p,83
  3. 최용기; 박기용 (2015). 《토목기사 과년도 시리즈 - 측량학》. 성안당. 2-32쪽. ISBN 9788931568080. 
  4. 이재기 등. 2013, 80, 87쪽.

참고 문헌

편집

외부 링크

편집