728x90
위 영상을 보며 공부한 내용 기억해두고자 적어봅니다.
t검정은 데이터가 정규성을 따른다는 가정을 수반하기 때문에
실은 정규성 검정을 먼저 수행해야 한다. (빅분기 실기에선 필수적이지 않고, 문항의 지시를 따르면 된다고 함)
정규성은 샤피로 검정으로 확인한다.
데이터가 정규성을 만족하지 않을 땐,
단일 표본 t검정이 아닌, 윌콕스 부호순위 검정을 고려한다.
동일핸 개체의 실험 전과 후 차이값들의 평균으로 검정
주의할 점은 등분산을 가정한다는 것이다.
이분산일 경우 합동 표본 분산을 사용할 수 없기 때문이다.
정규성을 만족하지 않는 데이터가 하나라도 존재한다면,
독립 표본 t검정이 아닌 윌콕슨의 순위합 검정을 사용해야 한다.
등분산성은 바틀렛 검정을 활용한다.
정규성과 등분산성을 가정하는 것 주의
하나라도 정규성을 만족하지 못하면 비모수 검정을 활용해야 한다.(크루스칼-왈리스 검정) -> 출제 안하지 않을까.. 예상
F값이 커진다는 것은, 그룹간 변동이 커짐을 의미하므로, 그룹 간 평균이 적어도 하나는 같지 않을 확률이 더 높아지고
따라서 p-value는 작아지면서 귀무가설을 기각할 확률이 커진다.
728x90
'데이터사이언스 > 빅데이터분석기사 준비' 카테고리의 다른 글
[빅분기 실기] 시험 중 함수 사용법 확인하기 (__all__, help()) (0) | 2023.10.12 |
---|---|
연관 분석 척도 (지지도, 신뢰도, 향상도) (0) | 2023.09.15 |
사회연결망 분석(SNA) (0) | 2023.09.09 |
주성분분석 / 다차원축소법 / 선형판별분석 등 - 차원 축소 기법, 다변량데이터 탐색 (0) | 2023.09.09 |
시공간 데이터 시각화 (단계구분도, 카토그램, 버블플롯맵, 등치선도) (0) | 2023.09.09 |