범주형 자료 분석 (categorical data analysis) 방법 003 : 단일표본 T-검정, 대응표본 T-검정, 독립표본 T-검정
+ 이나스AI에는 인공지능 관련 다양한 강의가 있습니다.
- Object detection, Text To Speech, Reinforcement learning, OCR, Chatbot, Time series prediction,
- Meta learning, eXplainable AI, Transformer/BERT/GPT, Graph-based ML, etc
- 소스코드, 다이어그램 및 중간데이터에 기반하여 인공지능 알고리즘들의 작동원리와 구조를 이해하기 쉽고 정확하게 설명합니다.
+ 작업할 때 켜놓는 라이브 스트리밍 study with me 채널도 운영하고 있습니다.
1. T-검정
1-1. 개념
- T-검정은 독립변수 X가 범주형이고, 종속변수 Y가 수치형일 때, 두 집단의 평균을 비교하는 검정 방법이다.
- T-검정은 두 집단 간 평균을 비교하는 모수적 통계 방법이며, 표본이 정규성, 등분산성, 독립성 등을 만족할 때 사용해야한다.
2. 단일표본 T-검정 (one sample T-test)
- 모집단의 평균이 알려져 있는 경우, 표본 집단의 평균과 모집단의 평균이 같은지 검정한다.
- 연구자가 측정한 집단의 수는 1개이고, 연구자가 측정한 집단의 평균과 기존의 연구에서 제시된 평균 수치와 비교하는 방법이다.
- 검정통계량 t값은 아래와같이 산출한다.
$$$t= \dfrac{\bar{X}-\mu}{\dfrac{s}{\sqrt{n}}}$$$
3. 대응표본 T-검정 (paired sample T-test)
- 동일한 집단이 있을 때, 이 집단을 특정 처치 하고, 처지 전과 처치 후의 차이를 알아보는데 사용하는 검정이다.
- 표본이 하나, 독립변수가 1개일 때 사용되며, 대응표본 T-검정에 적합한 데이터는 아래와 같다.
ID | 다이어트약 복용 전 체중 |
---|---|
1 | 66 |
2 | 54 |
3 | 68 |
ID | 다이어트약 복용 후 체중 |
---|---|
1 | 64 |
2 | 51 |
3 | 69 |
- 검정통계량 t값은 아래와같이 구한다.
$$$t=\dfrac{\bar{d}-\mu}{\dfrac{s}{\sqrt{n}}}$$$
4. 독립표본 T-검정 (independent sample T-test)
- 표본 2개가 서로 다른 모집단에서 추출되었을 때, 사용할 수 있는 분석 방법이다.
- 독립된 두 집단의 평균 차이를 검정하는 방법이다.
- 표본이 2개, 독립변수가 1개일 때 사용된다.
- 표본이 정규성, 등분산성 가정을 만족해야한다.
- 독립표본 T-검정에서는 아래 방법으로 표본의 수에 따라 정상성을 증명한다.
1) 표본의 수가 10개 미만일때 : 정상성을 만족하지 못한다고 간주하고, 비모수적인 방법인 만-휘트니 검정을 사용한다.
2) 표본의 수가 10~30개 일때 : 샤피로 윌크 검정, 콜모고로프-스미르노프 검정 등의 방법으로 정상성을 증명한다.
3) 표본의 수가 30개 이상일때 : 중심극한정리를 통해서 정상성을 증명한다.
- 독립표본 T-검정에서 검정통계량 t값은 아래와 같이 산출한다.
$$$t = \dfrac{(\bar{X}_1-\bar{X}_2) - (\mu_1-\mu_2) }{\sqrt{ s_p^2 \left( \dfrac{1}{n_1} + \dfrac{1}{n_2} \right) }}$$$
+ 이나스AI에는 인공지능 관련 다양한 강의가 있습니다.
- Object detection, Text To Speech, Reinforcement learning, OCR, Chatbot, Time series prediction,
- Meta learning, eXplainable AI, Transformer/BERT/GPT, Graph-based ML, etc
- 소스코드, 다이어그램 및 중간데이터에 기반하여 인공지능 알고리즘들의 작동원리와 구조를 이해하기 쉽고 정확하게 설명합니다.
+ 작업할 때 켜놓는 라이브 스트리밍 study with me 채널도 운영하고 있습니다.
댓글
댓글 쓰기