728x90

통계기초 2

[통계기초] 가설검정 1, 2종 오류

1종오류 Type 1이라고 부름 영가설이 맞았으나 기각해버린 경우 (대립가설 채택) 2종오류 Type 2라고 부름 영가설이 틀렸으나 채택해버린 경우 (대립가설 기각) 대립가설이 특정한 값 지정한 경우에만 확률 계산 가능 검정력 power 잘못된 영가설을 올바르게 기각하는 확률 참이 아닌 영가설을 기각하는 확률 1 - 2종오류 확률(β) 1종오류가 일어날 확률 유의수준(α, alpha) 보다 작은 확률에 존재 H0: p = 확률1 -- 표준화를 통해 유의수준 구한다. 2종오류가 일어날 확률 유의수준(β, Beta) 보다 작은 확률에 존재 H1: p = 확률2 -- 표준화를 통해 유의수준 구한다. 참고 책

[통계기초] 정보의 시각화. bar chart와 histogram

정보의 시각화 도수 frequency 각 그룹이 담고 있는 항목의 수 각 범주에 속하는 개체 수 범주 category 종류를 표시하는 변수 막대그래프와 히스토그램 차이 막대그래프 각각의 막대가 하나의 범주를 나타낸다. 막대그래프 사이에 공간이 있어도 없어도 상관없다. 왜? 범위가 아닌 항목(범주)로 정해져 있다. 히스토그램 그러나 히스토그램은 범위이다. 때문에 그래프 사이 간에 gap이없다. 히스토그램 전체 넓이는 전체 도수의 합과 같다. 히스토그램 범위 0 ~ 199 / 200 ~ 399 /... 그래프 상으로 붙어있지만 범위가 겹치지 않게 되어 있다. 누적도수 표와 그래프 누적도수 각 계급의 도수를 누적시킨 것 누적도수는 항상 0 부터 시작한다. 절대 음(-)방향으로 떨어지지 않는다. 누적이기 때문에..

728x90